一、单选题(本大题共10小题,每小题1分,总计10分)
1.某企业共有200台设备生产A产品,每台设备一天生产50件A产品,企业质检部门为了了解产品的质量,从200台中随机抽取10台,由这10台设备生产的500件产品构成样本,这样的抽样方法是( )。
A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样
2.某次考试学生成绩分布如下图所示,则最低成绩出现在( )
A.数学 B.物理 C.语文 D.英语
3.某企业员工工资直方图如图2所示,则能够较好地描述该数据集中趋势的统计量是( )。
A.众数 B.均值 C.方差 D.四分位差
4.某保险公司为了研究投保人的年龄构成情况,得到了四个数据的分布,分别是:①所有投保人的年龄分布、②所有投保人的保额分布、③随机抽取的30人的年龄分布、④多次抽样得到的样本平均年龄的分布,则四个分布中属于抽样分布的是
第 1 页 共 12 页
( )。
A.① B.② C.③ D.④
5.在估计总体均值时,下列各项中属于随机变化的是( )。 A.总体均值 B.置信区间
C.置信水平 D.样本均值分布
6.在一项消费者口味偏好的调查研究中,随机抽取了200名饮料的消费者,调查他们对两种主要的饮料品牌的口味满意度,零假设是消费者对两种饮料没有偏好。如果满意度使用10分制打分,得到饮料甲平均得分为7分,饮料乙平均得分为5分。检验p-值为0.001,研究人员做出拒绝零假设的结论,说明:( )。 A.研究结果犯错误的概率等于0.999 B.研究结果犯错误的概率不大于0.999 C.研究结果犯错误的概率等于0.001 D.研究结果犯错误的概率不大于0.001
7.某调查公司分析员根据调查资料得到某商品销售量与居民可支配收入间的回归方
????x,在对回归系数?的显著性检验中,使用的检验统计量为???程为:y101( )。
A.z B.t C.? D.F 8.某企业历年产品产量如下表所示:
2年份 1 2 3 4 5 6 7 8 9 10 11 产量 240 260 278 301 322 341 364 384 402 422 440 为了预测该企业产品产量的变动趋势,应建立的趋势模型为( )。
???b0?b1t B.y??bb C.y??K?bb D.yA.yt01t01?Kbtb10
9.K-均值聚类分析的基本原则是使( )。 A.类间差异尽量小,类内差异尽量大 B.类间差异尽量小,类内差异尽量小 C.类间差异尽量大,类内差异尽量小 D.类内差异与类间差异均尽量大
10.在因子分析中, 用来考察某个原始变量的信息能够被公共因子解释程度的是( )。
第 2 页 共 12 页
A.方差贡献率 B.变量共同度 C.因子载荷 D.因子得分
二、多选题(本大题共10小题,每小题2分,总计20分) 1.小王想购买一台计算机,主要考虑以下各项指标,其中属于定量变量的有( )。 A.品牌 B.CPU运转速度 C.内存大小 D.硬盘容量 E.产地
2.下列各项中,适合于展示定性数据的统计图有( )
A.茎叶图 B.条形图 C.雷达图 D.饼图 E.直方图
3.将一组数据标准化得到标准分数,下列关于标准分数的说法中正确的是( )。
A.标准分数的均值为0 B.标准分数的均值为1 C.标准分数的方差为0 D.标准分数的方差为1 E.标准分数表明各原始数据在数据中的相对位置
4.为了研究儿童的成长发育状况,随机抽取了36名儿童,测量他们的身高,测得身高x?120CM,标准差s?9,抽样标准误差?x?1.5,则下列各项中正确的是( )。
A.抽样标准误差是总体数据(XI)的标准差 B.抽样标准误差是样本数据(xi)的标准差
C.抽样标准误差是统计量(x)的标准差
D.抽样标准误差的大小受到总体方差和样本容量的影响
E.抽样标准误差是衡量样本统计量(x)与总体参数(?)的离差大小的尺度
5. 参数估计中,评价估计量优劣的标准有( )。
A.无偏性 B.一致性 C.独立性 D.有效性 E.显著性
6.某研究人员为了检验某种产品是否合格,随机抽取一些产品作为样本,计算得P值为0.02,若要求的显著性??0.05,则下列各项中正确的是( )。 A.检验结果应该是拒绝原假设 B.拒绝原假设可能会犯弃真错误 C.拒绝原假设可能会犯取伪错误
D.根据样本数据拒绝原假设犯错误的概率最大不超过0.05
第 3 页 共 12 页
E.根据样本数据拒绝原假设犯错误的概率最大不超过0.02
7.某研究员希望用最小平方法建立销售收入对广告投入费用的线性回归模型
y??0??1x??,并进行统计显著性检验,则下列各项中符合关于误差项?假定的
是( )。
A.E(?)?0 B.E(?)?1 C.对于给定的x值,?的方差?2相同 D.对于不同的x值,E(y)??0??1x E.对于不同的x值,?相互独立
8.某企业2006年第一季度到2008年第四季度各季度产量如下图所示:
观察企业各季度产量,可以判断下列各项中正确的有( )。 A.该企业产量受到趋势影响 B.该企业产量受到季节变动影响 C.该企业产量受到循环变动影响 D.该序列为平稳序列 E.该序列为非平稳序列
9.根据变量对所观察的样本进行分类,所得结果如图所示,
则该聚类为( )。
A.Q型聚类 B.R型聚类
第 4 页 共 12 页
C.快速聚类 D.K-均值聚类 E.分层聚类
10.可以将复杂数据简单化,降低数据维数,并能够保留原始数据大部分信息的统计方法有( )。
A.回归分析 B.相关分析 C.主成分分析 D.因子分析 E.方差分析
三、简答题(本大题共2小题,总计32分)
1.某社会学家为了调查某城市居民对政府公共服务的满意度,从年龄、职业、收入水平等方面分析不同居民的满意度。该城市有居民500万人,社会学家受项目经费所限,不可能全面调查,准备进行抽样调查,并据此推断全部居民对政府公共服务的满意度。为此,请求统计学家帮助。下面是社会学家向统计学家提出的一些问题,请你扮作统计学家的角色,结合所研究问题和上下文内容,解答社会学家的各项询问。(本题24分,每问3分)
……
【社会学家】像您刚才所说,我们需要进行概率抽样,为什么不能像我说的那样,在街头随机拦访访问一些人呢?
【统计学家】
【社会学家】按您说的,随机抽取一些居民作为样本,登记他们对政府公共服务的满意度,他们的满意度与全部居民的满意度是怎样的关系?
【统计学家】
【社会学家】我明白了,样本的平均满意度会接近全部居民的平均满意度,那我们怎么用样本的数据估计总体的平均满意度呢?
【统计学家】
第 5 页 共 12 页
【社会学家】等一下,您说到的置信水平是什么?它与您说的置信区间是什么关系?
【统计学家】
【社会学家】原来是这么回事,那我们调查多少居民比较好呢? 【统计学家】
【社会学家】还有一个问题想向您请教,隶属于市政府政策研究室的调查人员前不久公布了一个数据,宣称居民对政府公共服务的满意度为86分,我们能不能利用我们调查的结果验证一下他们的数据呢?
【统计学家】
【社会学家】那么根据您说到的小概率原理进行判断,结果在多大程度上是可靠的呢?
【统计学家】
【社会学家】您说的?、?和P值是什么关系? 【统计学家】
2. 十六个不同的零食所含卡路里数据如下图所示(单位:卡):
第 6 页 共 12 页
热量茎叶图
Frequency Stem & Leaf 1.00 11 . 2 2.00 11 . 88 5.00 12 . 33344 2.00 12 . 88 1.00 13 . 2 1.00 13 . 6 1.00 14 . 2 3.00 Extremes (>=164) Stem width: 10 Each leaf: 1 case(s)
(1)求出该组数据的众数和中位数(本题4分);
(2)说明均值、众数、中位数哪一个更具有代表性?说明理由(本题4分)。
四、计算分析题(本大题共3小题,共计38分)
1.一家电话公司制订出一个广告计划,以增加客户长途电话的通话时间。为了
解该计划的优点,公司对其进行小规模推广试验,他们从推广目标客户中随机抽取100位客户作为样本,并记录这100位客户在过去一个月长途电话的通话时间,然后
第 7 页 共 12 页
公司在接下来的一个月里,在给用户的声明中加上一份特殊的广告传单,然后再记下这些客户该月的通话时间,数据如下表所示(分钟)。
客户 1 2 3 …… 100 加入广告传单前 92 304 48 …… 217 加入广告传单后 129 249 214 …… 487 运用Excel对以上样本数据进行分析,分析结果如下: 描述统计结果 推广后 推广前
推广后-推广前均值差的检验结果
均值之差的95%置信区间 标准差 68.41 标准误 Lower 30.79 6.84 17.22 Upper 44.36 4.50 99 .000 t 自由度 双侧P值 均值 202.68 171.89 N 100 100 标准差 147.106 133.051 均值的标准误差 14.711 13.305 d 注:d为推广前后样本数据之差di的均值 试根据上述结果回答以下问题(本题共12分)
(1)公司对同一组客户测量他们前后的反应,这属于什么类型的样本?这样做的好处是什么?(4分)
(2)公司是否可以认为,给用户的声明中加上一份特殊的广告传单对于提高用户长途电话的通话时间是有帮助的?请写出对应的原假设、备择假设及其含义,并
第 8 页 共 12 页
给出检验结果及理由。(4分)
(3)给出广告传单推广后比推广前其用户长途电话的平均通话时间之差的95%的置信区间,并简要说明其含义。(4分)
2. 为了研究地理位置对商场销售额影响,研究者分别调查了商业街(9家)、
居民区(7家)、CBD(8家)和开发区(7家)共31家零售商,调查得人均月销售额数据如下表所示:
不同位置商场人均月销售额 单位:万元/人
地理位置 第 9 页 共 12 页
样本 编号 1 2 3 4 5 6 7 8 9 商业街 21 25 18 18 16 24 28 22 24 居民区 11 9 15 16 18 20 16 - - CBD 18 16 24 18 15 18 16 10 开发区 12 15 20 9 14 16 10 - - 利用Excel分析结果如下:
差异源 离差平方和 自由度 组间 组内 308.3344 401.8591 均方 F —— F (??0.05临界值) 0.00134 2.960351 —— —— P值 27 总计 710.1935 30 —— —— —— ——
要求:
(1)根据已知资料,填出上述表中空白格的数字(3分)
(2)写出上述分出方差分析的原假设和备择假设,并说明其含义(3分)
(3)说明分析结果,并说明理由(4分)
3.为了研究初中成绩与高中成绩的关系,随机抽查50名高一学生,登记其初三成绩与高一成绩,并利用SPSS统计软件进行一元线性回归分析,结果输出如下:
第 10 页 共 12 页
判定系数R(相关系数).795判定系数.632修正后判定系数.625估计标准误差7.22091 方差分析回归平方和残差平方和总计离差平方和4307.2062502.7946810.000自由度14849均方4307.20652.142F值82.606P值.000 回归系数回归系数常数项初三成绩B26.444.651标准误5.396.072t值4.9019.089P值.000.000
试根据以上结果回答以下问题:
(1)说明学生初三成绩与高一成绩之间的相关关系的形态;(3分)
(2)写出估计的回归方程并解释回归系数的实际含义;(5分)
第 11 页 共 12 页
(3)对上述拟合的回归方程进行评价。(8分)
第 12 页 共 12 页