? 中央财经大学2008-2009学年第二学期
《统计学》试题
注意事项:
1、考试中可以使用计算器。
2、本试卷共有五道大题,请不要漏答。
3、考试时间为110分钟,请注意合理分配考试时间。 4、答题中可能用到的部分公式已经附在试卷末尾供参考。
5、请将选择题的答案(用字母A、B、C、D、E)分别填在表1对应题号后的空格内。
表1 选择题答案表
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
一、单项选择题(选出最为恰当的一项。每题1分,共20分)。
1、以下关于参数和统计量的说法正确的是( d )。
A、总体参数是随机变量
B、样本统计量都是总体参数的无偏估计量
C、对一个总体参数进行估计时,统计量的表达式是唯一的 D、样本统计量是随机变量
2、2009年6月新浪网进行的一项网络调查中,把调查问卷刊登在网站上,然后由感兴趣的网民自行填写。在回答问题的人员中有47.5%的人认为高考会改变个人一生的命运。对于此项调查,以下说法正确的是( b )。 A、这是简单随机抽样 B、这是方便抽样 C、这是雪球抽样 D、这是全面调查
3、根据第2题中的调查,有媒体得出结论认为“全国居民中有47.5%的人认为高考会改变个人一生的命运”。这一结论( c )。 A、完全正确
B、不准确,因为没有给出置信区间
C、不准确,因为样本缺乏对目标总体的代表性
D、不准确,因为不知道调查的样本量,只有样本量足够大才可靠
4、一名研究人员希望用图形说明5月份以来我国每天新增甲型流感确诊病例数的变化趋势,你认为适合的图形是( c )。 A、饼图 B、箱线图 C、线图 D、茎叶图
5、在第4题中,如果要描述5月份以来我国每天新增甲型流感确诊病例数的统计分布情况,则最不适当的图形是( c )。 A、直方图 B、散点图
C、箱线图 D、茎叶图
6、和开放式问题相比,封闭式问题的特点是( b )。 A、问题的答案将会被严格保密 B、所有可能的答案都被列在问卷上 C、不属于目标总体的人员不得填写问卷 D、调查结果不利于计算机处理
7、在抽样调查中以下哪一项会造成非抽样误差?( d )。
A、数据录入错误 B、被调查者拒答 C、调查员编造数据 D、以上都对
8、在对总体均值进行区间估计时,有限总体校正系数的使用( c )。 A.增大了样本均值的标准误 B.不会影响样本均值的标准误 C.缩小了样本均值的标准误 D.缩小了样本标准差
9、调查了一个企业10名员工上个月的缺勤天数,有3人缺勤0天,2人缺勤2天,4人缺勤3天,1人缺勤4天。则缺勤天数的( b ) A.中位数为2 B 中位数为2.5 C 中位数为4 D 众数为4
10、2009年6月19日,国务院决定在境内股市实施国有股转持,股改新老划断后,凡在境内首发上市的公司须按首发时实际发行股份数的10%将部分国有股转社保基金持有。某媒体希望在短时间内了解社会公众对这项政策的态度,最恰当的数据搜集方式是( c )。
A.面访 B.深度访谈 C.计算机辅助电话调查 D.邮寄调查
11、对数据实行标准化之后得到的z分数 ( a )。 A.没有计量单位 B.服从正态分布 C.取值在0-1之间 D.取值在-1到1之间。
12、一个对称分布的峰度系数等于2.0,则该数据的统计分布( a )。 A、为尖峰分布 B、为扁平分布 C、为左偏分布 D、为右偏分布 13、在回归分析中可能存在异方差问题。异方差指的是( a )。 A、各个自变量的方差不相等
B、各个自变量的方差不等于因变量的方差 C、总体回归模型中随机误差项的方差不相等 D、各个因变量的方差不相等
14、关于回归方程修正后的判定系数,以下说法正确的是( c )。 A、进行修正的目的是为了消除多重共线性 B、目的是为了修正自变量个数对判定系数的影响 C、修正的判定系数取值在0-1之间。 D、以上都不对
15、下列指数中属于质量指数的有( a )。
A.消费者价格指数 B.总成本指数 C.GDP增长率 D. 销售额指数
16、我国的居民消费价格指数是采用( c )计算的。 A、拉氏价格指数公式 B、帕氏价格指数公式 C、固定加权指数公式 D、简单指数公式
17、在问卷设计中,以下哪个问题设计的最为合理?( c )。 A、国家认为H1N1病毒是可防可治的,你认为呢? B、你喜欢足球和篮球运动吗? C、你经常上网吗?
D、你上个月的总支出是多少?
18、一元线性回归方程的表达式为 =100+6.8x,判定系数等于0.81,则x与y之间的相关系数为( b )。
A、0.81 B、0.9 C、-0.9 D、0.9或者-0.9 19、帕氏价格指数的计算公式为( d )。 A、 B、 C、 D、
20、某商场2008年12月的商品销售额为100万元,该月的季节指数等于125%(乘法模型),在消除季节因素后该月的销售额为( a )。 A、80万元 B、100万元 C、125万元 D、以上都不对
二、多项选择题(至少有一个选项是正确,多选、少选均不得分。每题2分,共10分)。
21、在一次问卷调查中要求被调查者直接填写出个人的民族、婚姻状况、居住地的邮政编码、年龄和收入。以下说法正确的有( abcde )。 A、民族是定性变量 B、邮政编码是定量变量
C、年龄的计量尺度是定比尺度 D、婚姻状况的计量尺度是定类尺度 E、收入数据是定量数据
22、1000名在校学生分为30个自然班。从总共30个自然班中随机抽取4个班共96名学生,发现有32名学生近视。则以下说法正确的有:( bde )。
A、调查属于分层抽样 B、样本中近视的学生比例为1/3 C、每个班是一个抽样单位 D、每个学生是一个抽样单位 E、1000名学生的名单是抽样框
23、5个数1,3,8,9,10被分为两类:(1,3),(8,9,10)。则按照欧式距离计算:( )。
A、按照最短距离法两类之间的距离为5 B、按照最长距离法两类之间的距离为5 C、按照最短距离法两类之间的距离为9 D、按照最长距离法两类之间的距离为9 E、按照最短距离法两类之间的距离为7
24、用SPSS检验两个独立样本的均值是否相等,软件的部分输出结果如下,则(a d )。
Levene 检验 F Sig. .395 均值是否相等的t检验 t -2.013 -1.994 df 98 88.863 Sig.(双侧) .047 .049 假设方差相等 假设方差不相等 .731
A.如果a=0.05,则没有证据表明两个总体的方差不相等 B.如果a=0.05,则可以认为两个总体的方差不相等 C.如果a=0.05,则可以认为两个总体的均值相等 D.如果a=0.05,则可以认为两个总体的均值不相等
E.如果a=0.05,则可以认为两个总体的中位数不相等
25、对于包含长期趋势、不包含季节成分的时间序列进行预测,适合用( bd )。
A 单参数一次指数平滑 B 双参数指数平滑 C 三参数指数平滑 D 直接拟合趋势方程进行预测 E ARMA模型
三、简答题(每题5分,共10分)。
1、试比较分层抽样和配额抽样的组织方式和特点。 2、试述系统聚类方法的步骤。
四、计算分析题(共30分)。
1、(4分)在一次抽样调查中,采用不重复抽样方式,从500名毕业班的学生中按简单随机抽样方法抽选一部分学生推断总体中拟考研学生的比例。根据历史数据总体的比例估计为70%左右。已知最大允许误差为±5%,置信度为95%(Z0.025=1.96),计算必要样本容量。
2、(6分)某地区的现价社会消费总额和CPI数据如下表。
年份 2006 2007 2008 社会消费总额(万元) 1340 1450 1670 CPI - 105 110
(1)计算以2006年价格表示的2007和2008年社会消费总额(4分)。 (2)以2006年为基期,计算2007-2008年实际社会消费总额的年平均增长率(2分)。
3、(共8分)对一个零均值平稳时间序列 建立AR(2)模型。由SPSS可以得到参数估计如下。
(1)写出模型表达式(3分);xt=0.42xt-1+0.387xt-2+at (2)自回归参数是否显著非零(a=0.05)?为什么?(2分) (3)残差序列的自相关函数如下图所示,试判断该模型的适应性。(3分)
4、(共12分)在一次调查中调查了消费者对一种玩具熊6个方面的评价:COLOUR(颜色)、 SOFTNESS(柔软度)、STYLE(外观)、VALUE(价值)、ROBUST(耐用性)、SAFETY(安全性)。对数据进行因子分析的部分结果如下,因子分析中采用了主成分方法,因子系数矩阵采用方差最大旋转。根据结果回答下列问题:
(1)变量之间的相关系数表如下。根据表中的数据分析因子分析方法的适用性(2分)。
(2)因子分析中为什么要进行因子旋转?(3分)
(3)旋转后的因子载荷矩阵如下,分析各个因子的含义。用F1、F2表示两个因子,写出用公共因子表示的COLOUR变量的表达式。(4分)
(4)什么是因子得分?因子得分有何作用?(3分)
五、案例分析题(共30分)。
某项调查中随机收集了100名职工的相关数据,这些职工分别来自3家不同的公司。各变量的含义如下:
性别:0=女性,1=男性;公司:1=公司1 2=公司2 3=公司3;收入:上个月的收入(元);
支出:上个月的支出(元)。
1、(共5分)下表是对收入做描述统计的结果。
(1)根据表中的内容写出收入的均值、中位数,以及均值95%的置信区间(3分)
(2)分析数据分布的对称性。(2分)
收入
均值
统计量 2840.02 2540.96 3139.08 2838.71 2944.5 2271681.7 1507.21 -0.105 -1.215
标准误 150.721 0.241 0.478
均值95%的置下限 信区间 5% 修整均值 中位值 方差 标准差 偏度 峰度
上限
2、(5分)研究人员希望检验能否认为总体的平均收入大于2500元。SPSS软件t检验的结果如下表。写出检验中的原假设、备择假设和检验的结论(显著性水平a=0.05)。
单个样本检验 收入 统计量 2.256 df 99 Sig.(双侧) .026 均值差值 340.020 检验值 = 2500 均值差的 95% 置信区间 下限 40.96 上限 639.08
3、(10分)研究人员希望比较3家公司的平均收入是否相等。 (1)可以采用哪种统计方法?(2分) (2)这种分析中需要哪些假设条件?(3分)
(3)根据下面的结果分析数据是否满足其中的一个假设条件(2分);
(4)得出检验的结论,写出决策的依据。(显著性水平a=0.05)(3分)。
1 2 3 总数 N 24 36 40 100 均值 2746.63 2623.31 3091.10 2840.02 标准差 1704.981 1500.400 1385.110 1507.210
组间 组内 总数 平方和 4421735.096 2.205E8 2.249E8 df 2 97 99 均方 2210867.548 2272935.617 F .973 显著性 .382
4、(10分)研究人员估计了两个回归模型,相关结果如下。
(1)根据表中的数据比较两个模型的拟合效果,并对t检验的结果进行分析。(4分)
(2)在以上两个模型中,你会选择哪一个模型进行预测?为什么?(2分)
(3)写出你选定的回归方程,并分析回归系数的含义。(2分) (4)一名男性职工的上月收入为3000元,预测其上月的支出。(2分) 模型1:
模型 1 R .977a R方 .954 调整的R方 .953 估计标准误 206.712 预测变量: (常量), 性别, 收入。
非标准化系数 模型 1 (常量) 收入 性别 B 628.056 .619 31.062 标准 误差 47.157 .014 42.400 t 13.318 44.107 .733 Sig. .000 .000 .466 模型2:
模型 1 R .977a R方 .954 调整R方 .954 估计标准误 206.223 预测变量: (常量), 收入。
非标准化系数 模型 1 (常量) 收入 B 639.961 .621 标准 误差 44.164 .014 t 14.490 45.155 Sig. .000 .000
1 1