《统计学》习题集及答案
主编:杨群
I / 43
目 录
习题部分 ................................................................ 2
第1章 导论 .............................................................. 1 第2章 数据的搜集 ........................................................ 2 第3章 数据的整理与显示 .................................................. 3 第4章 数据的概括性度量 .................................................. 4 第5章 概率与概率分布 .................................................... 7 第6章 统计量及其抽样分布 ................................................ 8 第7章 参数估计 .......................................................... 9 第8章 假设检验 ......................................................... 11 第9章 分类数据分析 ..................................................... 12 第10章 方差分析 ........................................................ 14 第11章 一元线性回归 .................................................... 15 第12章 多元线性回归 .................................................... 17 第13章 时间序列分析和预测 .............................................. 20 第14章 指数 ............................................................ 23
答案部分 ............................................................... 28
第1章 导论 ............................................................. 28 第2章 数据的搜集 ....................................................... 28 第3章 数据的图表展示 ................................................... 28 第4章 数据的概括性度量 ................................................. 30 第5章 概率与概率分布 ................................................... 31 第6章 统计量及其抽样分布 ............................................... 31 第7章 参数估计 ......................................................... 32 第8章 假设检验 ......................................................... 32 第9章 分类数据分析 ..................................................... 33 第10章 方差分析 ........................................................ 34 第11章 一元线性回归 .................................................... 35 第12章 多元线性回归 .................................................... 37 第13章 时间序列分析和预测 .............................................. 38 第14章 指数 ............................................................ 39
II / 43
习题部分
第1章 导论
一、单项选择题
1.指出下面的数据哪一个属于分类数据( ) A.年龄 B.工资
C.汽车产量 D.购买商品的支付方式(现金、信用卡、支票) 2.指出下面的数据哪一个属于顺序数据( ) A.年龄 B.工资
C.汽车产量 D.员工对企业某项制度改革措施的态度(赞成、中立、反对)
3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是( )
A.2000个家庭 B.200万个家庭
C.2000个家庭的人均收入 D.200万个家庭的人均收入 4.了解居民的消费支出情况,则( )
A.居民的消费支出情况是总体 B.所有居民是总体 C.居民的消费支出情况是总体单位 D.所有居民是总体单位 5.统计学研究的基本特点是( ) A.从数量上认识总体单位的特征和规律 B.从数量上认识总体的特征和规律 C.从性质上认识总体单位的特征和规律 D.从性质上认识总体的特征和规律
6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是( ) A.分类变量 B.顺序变量 C.数值型变量 D.离散变量 7.要反映我国工业企业的整体业绩水平,总体单位是( ) A.我国每一家工业企业 B.我国所有工业企业 C.我国工业企业总数 D.我国工业企业的利润总额
8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( )
A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均消费额 D.1000个消费者的平均消费额
9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于( )
A.分类数据 B.顺序数据 C.截面数据 D.时间序列数据
10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于( ) A.访问调查 B.邮寄调查 C.个别深度访问 D.观察调查 二、多项选择题
1.欲了解某地高等学校科研情况( ) A.该地所有高等学校所有的科研项目是总体 B.该地所有的高等学校是总体
C.该地所有高等学校的每一科研项目是总体单位 D.该地每一所高等学校是总体单位 E.该地所有高等学校的所有科研人员是总体
2.下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据:
1 / 43
公司名称 Banc One CPC Intl. ?.?. Woolworth 在这个例子中( ) 销售额(百万美元) 利润额(百万美元) 行业代码 10272 9844 ?. ?. 8092 168.7 1427.0 580.0 87.0 ?..? 8 19 19 ?.?.. 48 Tyson Foods 6454 A.总体是500强公司,总体单位是表中所列的公司 B.总体是500强公司,总体单位是其中每一家公司 C.总体是500强公司,样本是表中所列的公司
D.总体是500强公司,样本是表中所列公司的销售额和利润额 E.总体是表中所有的公司,总体单位是表中每一家公司
3.一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过标准,就把整批货退回。这个问题中( ) A.样本是从所有木材批次中随机抽取的部分批次木材 B.样本是从每批木材中随机抽取的5块木材
C.总体单位是从所有木材批次中随机抽取的部分批次木材 D.总体单位是购买的每一块木材 E.总体是购买的全部木材
三、判断分析题(判断正误,并简要说明理由)
统计运用大量观察法必须对所有的总体单位进行观察。( ) 四、简答题
1.报纸上报道一项民意调查的结果说:“43%的美国人对总统的整体表现感到满意。”报道最后写到:“这份调查是根据电话访问1210位成人所得,访问对象遍布美国各地。”这个调查的总体是什么?总体单位是什么?样本是什么?
2.一个公司正致力于测试一种新的电视广告的效果。作为测试的一部分,广告在某市的当地新闻节目中下午6:30播出。两天以后,一市场调查公司进行了电话采访以获取记忆率信息(观众记得看过广告的百分比)和对广告的印象。这一研究的总体是什么?总体单位是什么?样本是什么?这种情况下为什么使用样本?简要解释原因。
3.简述标志与指标的区别连续。
第2章 数据的搜集
一、单项选择题
1.从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( )
A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样
2.为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是( ) A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样
3.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是( )
A.简单随机抽样 B.分层抽样 C.系统抽样 D.整群抽样 4.在一项调查中,调查单位和填报单位( ) A.无区别,是一致的 B.有区别,是不一致的 C.无区别,是人为确定的 D.有区别,但有时是一致的 5.对家用电器的平均寿命进行调查,应该采用( ) A.普查 B.重点调查 C.典型调查 D.抽样调查
2 / 43
二、多项选择题
1.下列属于原始数据的是( )
A.统计部门掌握的数据 B.说明总体单位特征的数据 C.说明总体特征的数据 D.还没有经过分组汇总的数据 E.直接向调查单位登记得到的数据 2.统计调查方案的内容包括有( )
A.确定调查目的 B.确定调查对象、调查单位和报告单位 C.确定调查项目和调查表 D.确定调查方法和调查时间 E.确定调查人员、经费等
3.重点调查的“重点”单位指( )
A.在国民经济中作用重要的单位 B.标志值在总体标志总量中所占比重比较大的单位 C.全部单位中的一小部分单位 D.在国民经济中地位显赫的单位 E.能反映总体基本情况的单位 三、简答题
1.抽样调查与重点调查、典型调查有哪些主要区别?
2.进行产品质量调查和市场占有率调查,你认为采用什么调查方法最合适?简要说明理由。 3.简述普查和抽样调查的特点。
第3章 数据的整理与显示
一、单项选择题
1.在累计次数分布中,某组的向下累计次数表明( ) A.大于该组上限的次数是多少 B.大于该组下限的次数是多少 C.小于该组上限的次数是多少 D.小于该组下限的次数是多少 2.数据筛选的主要目的是( )
A.发现数据的错误 B.对数据进行排序 C.找出所需要的某类数据 D.纠正数据中的错误 3.样本或总体中各不同类别数值之间的比值称为( ) A.频率 B.频数 C.比例 D.比率 4.将比例乘以100得到的数值称为( ) A.频率 B.频数 C.比例 D.比率 5.下面的哪一个图形最适合描述结构性问题( ) A.条形图 B.饼图 C.雷达图 D.直方图
6.下面的哪一个图形适合比较研究两个或多个总体或结构性问题( ) A.环形图 B.饼图 C.直方图 D.茎叶图
7.将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( ) A.单变量值分组 B.组距分组 C.等距分组 D.连续分组 8.下面的哪一个图形最适合描述大批量数据分布的图形( ) A.条形图 B.茎叶图 C.直方图 D.饼图
9.由一组数据的最大值、最小值.中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为( )
A.环形图 B.茎叶图 C.直方图 D.箱线图
10.10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据( )
A.茎叶图 B.散点图 C.条形图 D.饼图 二、多项选择题
1.下列属于定性变量的有( )
3 / 43
A.职业 B.居住区域 C.体重 D.身高 E.汽车产量 2.下面的数列属于( )
身高(厘米) 150-155 155-160 160-165 合计
人数 40 100 60 200
比重(%) 20 50 30 100
A.变量数列 B.品质数列 C.等距数列 D.异距数列 E.闭口数列 三、简答题
1.数值型数据的分组方法有哪些? 2.直方图与条形图有何区别? 3.茎叶图与直方图相比有什么优点? 4.简述数据的类型及各类型的功能特点? 四、应用题
1.下面是一个班50个学生的经济学考试成绩:
88 98 83 68 84
56 85 64 74 62
91 34 65 94 81
79 74 69 81 83
69 48 99 67 69
90 100 64 81 84
88 75 45 84 29
71 95 76 53 66
82 60 63 91 75
79 92 69 24 94
(1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表,绘制直方图。 (2)用茎叶图将原始数据表现出来。
2.下表中的数据为2001年全国研究生入学考试报考某专业的12名考生的5门课程的成绩。 考生编号 英语 政治
1
2
3
4
5
6
7
8
9
10 11 12
66 44 39 58 52 34 74 71 51 41 64 51 69 66 58 56 68 40 73 65 62 48 58 64
82 42 28 35 39 19
专业课1 54 25 20 36 21 4
专业课2 90 62 85 81 64 54 73 78 68 66 80 75 专业课3 81 56 45 62 70 63 76 86 65 21 74 73
对英语和政治两门课程做直方图。
第4章 数据的概括性度量
一、单项选择题
1.一组数据排序后处于25%和75%位置上的值称为( ) A.众数 B.中位数 C.四分位数 D.均值 2.如果一个数据的标准分数是–2,表明该数据( ) A.比平均数高出2个标准差 B.比平均数低2个标准差 C.等于2倍的平均数 D.等于2倍的标准差
3.经验法则表明,当一组数据对称分布时,在均值加减1个标准差的范围内大约有( ) A.68%的数据 B.95%的数据 C.99%的数据 D.100%的数据 4.离散系数的主要用途是( )
A.反映一组数据的离散程度 B.反映一组数据的平均水平 C.比较多组数据的离散程度 D.比较多组数据的平均水平 5.离散系数( )
4 / 43
A.只能消除一组数据的水平对标准差的影响 B.只能消除一组数据的计量单位对标准差的影响
C.可以同时消除数据的水平和计量单位对标准差的影响 D.可以准确反映一组数据的离散程度
6.峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值( ) A.等于0 B.大于0 C.小于0 D.等于1 7.如果峰态系数K>0,表明该组数据是( ) A.尖峰分布 B.扁平分布 C.左偏分布 D.右偏分布
8.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。在上面的描述中,众数是( )
A.1200 B.经济管理学院 C.200 D.理学院
9.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。描述该组数据的集中趋势宜采用( )
A.众数 B.中位数 C.四分位数 D.均值
10.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用( ) A.众数 B.中位数 C.四分位数 D.均值 11.对于分类数据,测度其离散程度使用的统计量主要是( ) A.众数 B.异众比率 C.标准差 D.均值
12.甲、乙两组工人的平均日产量分别为18件和15件。若甲、乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量( ) A.上升 B.下降 C.不变 D.可能上升,也可能下降 13.权数对平均数的影响作用取决于( )
A.各组标志值的大小 B.各组的次数多少 C.各组次数在总体单位总量中的比重 D.总体单位总量 14.当各个变量值的频数相等时,该变量的( )
A.众数不存在 B.众数等于均值 C.众数等于中位数 D.众数等于最大的数据值
15.有8名研究生的年龄分别为21,24,28,22,26,24,22,20岁,则他们的年龄中位数为( ) A.24 B.23 C.22 D.21
16.下列数列平均数都是50,在平均数附近散布程度最小的数列是( ) A.0 20 40 50 60 80 100 B.0 48 49 50 51 52 100 C.0 1 2 50 98 99 100 D.0 47 49 50 51 53 100
17.下列各项中,应采用加权算术平均法计算的有( ) A.已知计划完成百分比和实际产值,求平均计划完成百分比 B.已知计划完成百分比和计划产值,求平均计划完成百分比 C.已知各企业劳动生产率和各企业产值,求平均劳动生产率
D.已知生产同一产品的各企业产品单位成本和总成本,求平均单位成本
18.如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?( ) A.算术平均数 B.几何平均数 C.中位数 D.众数
19.假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用( )
A.算术平均数 B.几何平均数 C.众数 D.调和平均数
20.某组数据分布的偏度系数为正时,该数据的众数.中位数.均值的大小关系是( ) A.众数>中位数>均值 B.均值>中位数>众数 C.中位数>众数>均值 D.中位数>均值>众数
5 / 43
二、多项选择题
1.变量数列中,各组变量值与频数的关系是( ) A.各组变量值作用的大小由各组频数的多少反映 B.各组变量值作用的大小由各组变量值的大小反映 C.频数越大的变量值对总体一般水平的影响也越大 D.频数越大的变量值对总体一般水平的影响越小 E.频数越大,变量值也越大
2.应该用加权算术平均法计算平均数的有( ) A.已知各组职工工资水平和各组职工人数,求平均工资 B.已知各组职工工资水平和各组工资总额,求平均工资
C.已知各组计划完成百分数和各组计划产值,求平均计划完成百分数 D.已知各组计划完成百分数和各组实际产值,求平均计划完成百分数 E.已知各组职工的劳动生产率和各组职工人数,求平均劳动生产率 3.下列应该用几何平均法计算的有( )
A.生产同种产品的三个车间的平均合格率 B.平均发展速度 C.前后工序的三个车间的平均合格率 D.平均劳动生产率 E.以复利支付利息的年平均利率 4.下列说法哪些是正确的?( ) A.应该用均值来分析和描述地区间工资水平 B.宜用众数来描述流行的服装颜色
C.考试成绩中位数的含义是有一半考生的成绩超过此数 D.在数据组高度偏态时,宜用中位数而不是用众数来作为平均数 E.一般常用算术平均法来计算年平均增长率 三、填空题
1.某班的经济学成绩如下表所示: 43 77 84
55 77 86
56 78 87
56 79 88
59 80 88
60 81 89
67 82 90
69 83 90
73 83 95
75 83 97
该班经济学成绩的平均数为 (1) ,众数为(2) ,中位数为(3) ,上四分位数为(4) ,下四分位数为(5) ,四分位差为(6) ,离散系数为(7) 。从成绩分布上看,它属于(8) ,你觉得用(9) 描述它的集中趋势比较好,理由(10) 。
2.在某一城市所做的一项抽样调查中发现,在所抽取的1000个家庭中,人均月收入在200-300元的家庭占24%,人均月收入在300-400元的家庭占26%,在400-500元的家庭占29%,在500-600元的家庭占10%,在600-700元的家庭占7%,在700元以上的占4%。从此数据分布状况可以判断: (1)该城市收入数据分布形状属 (左偏还是右偏)。
(2)你觉得用均值、中位数、众数中的 ,来描述该城市人均收入状况较好。理由
是 。
(3)从收入分布的形状上判断,我们可以得出中位数和均值中 数值较大。上四分位数所在区间
为 ,下四分位数所在区间为 。 四、判断分析题(判断正误,并简要说明理由)
1.并非任意一个变量数列都可以计算其算术平均数、中位数和众数。( ) 2.某企业某年各季度销售额和利润资料如下:
季度 销售额(百万元) 利润率(%) 1 150 30 2 180 32 3 200 35 4 210 36 则该年各季度平均利润率为(30%+32%+35%+36%)/4=33.25%。( )
6 / 43
3.某企业计划劳动生产率比上年提高10%,实际只提高了5%,表明劳动生产率计划只完成了一半。( ) 4.若数据组的均值是450,则所有的观察值都在450周围。( ) 五、简答题
1.简述众数、中位数和均值特点及应用场合。
2.某公司下属两个企业生产同一种产品,其产量和成本资料如下: 甲企业 乙企业 合计 这是为什么?
3.一项民意测验询问了2050个成年人,“你对今天的生活状况满意程度如何?”回答分类为满意.不满意和说不清。
(1)这一调查的样本规模有多大? (2)回答的答案是属于品质型还是数量型?
(3)使用平均数或百分比作为对这一问题的数据的汇总,哪一个更有意义? (4)回答中,8%的人说他们对今天的生活状况不满意,作出这种回答的人是多少? 六、计算题
1.下表中的数据反映的是1992年到2001年我国职工工资和居民消费价格增长指数: 年份 职工工资增长指数(%) 居民消费价格指数(%)
1992 118.5 106.4
1993 124.8 114.7
1994 135.4 124.1
1995 121.7 117.1
1996 112.1 108.3
1997 103.6 102.8
1998 100.2 99.2
1999 106.2 98.6
2000 107.9 100.4
2001 111.0 100.7
基期 单位成本(元) 产量(吨) 600 700 660 1200 1800 300 报告期 单位成本(元) 产量(吨) 600 700 640 2400 1600 4000 试问:报告期与基期相比,该公司下属各企业单位成本都没有变化,但该公司总平均成本却下降了20元,
试根据上表数据比较我国1992年到2001年间职工工资平均增长指数与平均居民消费价格指数的大小。 2.下面是甲地区空气质量指数(0~50表示良好,50~100表示适中)的一组数据:28,42,58,48,45,55,60,49,50。
(1)计算全距、方差和标准差;
(2)已知同期观察到的乙地区空气质量指数的平均数为48.5,标准差为11.66,试对两地区的空气质量作出比较。
3.某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下: 净利润(元/头) –200 0 200 400 合计 原品种牛 频数 36 12 185 367 600 频率(%) 6 2 31 61 100 改良品种牛 频率(%) 1 2 57 40 100 (1)牧场主应该选择哪一种品种?为什么? (2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润有什么变化时,牧场主
会改变他在(1)中所做的选择?
第5章 概率与概率分布
一、单项选择题
1.根据概率的统计定义,可用以近似代替某一事件的概率的是( )。
7 / 43
A.大量重复试验中该随机事件出现的次数占试验总次数的比重 B.该随机事件包含的基本事件数占样本空间中基本事件总数的比重 C.大量重复随机试验中该随机事件出现的次数 D.专家估计该随机事件出现的可能性大小
2.下列事件中不属于严格意义上的随机事件的是( )。
A.从一大批合格率为90%的产品中任意抽出的一件产品是不合格品 B.从一大批合格率为90%的产品中任意抽出的20件产品都是不合格品 C.从一大批优质品率为15%的产品中任意抽出的20件产品都是优质品 D.从一大批合格率为100%的产品中任意抽出的一件产品是合格品 3.假设A、B为两个互斥事件,则下列关系中,不一定正确的是( )。 A.P(A+B)=P(A)+P(B) B.P(A)=1-P(B) C.P(AB)=0 D.P(A|B)=0
4.同时抛3枚质地均匀的硬币,巧合有2枚正面向上的概率为( )。 A.0.125 B.0.25 C.0.375 D.0.5
5.下列由中心极限定理得到的有关结论中,正确的是( )。 A.只有当总体服从正态分布时,样本均值才会趋于正态分布 B.只要样本容量n充分大,随机事件出现的频率就等于其概率 C.无论样本容量n如何,二项分布概率都可以用正态分布近似计算 D.不论总体服从何种分布,只要样本容量n充分大,样本均值趋于正态分布 二、多项选择题
1.下列关于随机变量的数学期望的表述中正确的是( )。 A.它又称为随机变量的均值
B.它表示该随机变量所有可能取值的平均水平 C.它度量的是随机变量的离中趋势 D.任一随机变量都存在一个有限的数学期望
E.它与加权算术平均数的不同之一是它以概率或分布密度为权数 2.下列关于几种概率分布之间的关系的陈述中,正确的有( ): A.二点分布(0-1分布)是二项分布的特例
B.当n很大而p又很小时,二项分布可用参数λ=np的泊松分布近似 C.当N很大而M / N很小是,超几何分布趋于二项分布
D.当n>30时,不管p大小,二项分布的概率都可用正态分布来近似计算 E.当n无限增大时,二项分布趋近于正态分布 三、判断分析题(判断正误,并简要说明理由) 1.频率的极限是概率。
2.若某种彩票中奖的概率为5?,那么随机购买1000注彩票将有5注中奖。 四、简答题
全概率公式与逆概率公式分别用于什么场合? 五、计算题
1.某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求:
(1)使用寿命在500小时以下的灯管占多大比例? (2)使用寿命在850-1450小时的灯管占多大比例? (3)以均值为中心,95%的灯管的使用寿命在什么范围内?
第6章 统计量及其抽样分布
一、单项选择
8 / 43
1.重复抽样的抽样误差( )
A.大于不重复抽样的抽样误差 B.小于不重复抽样的抽样误差 C.等于不重复抽样的抽样误差 D.不一定
2.在简单重复抽样下,若总体方差不变,要使抽样平均误差变为原来的一半,则样本单位数必须( ) A.扩大为原来的2倍 B.减少为原来的一半 C.扩大为原来的4倍 D.减少为原来的四分之一 3.在抽样之前对每一个单位先进行编号,然后使用随机数表抽取样本单位,这种方式是( ) A.等距抽样 B.分层抽样 C.简单随机抽样 D.整群抽样
4.一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做检验,这是( ) A.简单随机抽样 B.整群抽样 C.系统抽样(即机械抽样) D.分层抽样 5.有限总体修正系数可以省略的前提是( ) A.n/N<0.05 B.n/N>0.5 C.n/N>0.05 D.n/N<0.5 二、判断题
1.抽样推断是利用全体中的一部分进行推断,就不可能避免会出现误差( ) 2.抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的,唯一的.( ) 3.中心极限定理告诉我们:无论总体服从什么分布,抽样分布均服从正态分布( )
4. 抽样误差是由于抽样的偶然性因素而产生的误差,这种误差即可以避免,也可以控制其大小。( ) 三、计算题
1.某县欲统计今年小麦产量,调查了全县100个村子的小麦产量,测得全县每个村子小麦产量的平均值为1700(百斤),标准差为200(百斤)。若从全县的100个村子中按重复抽样的方法随机抽取10个村子,则由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?若采用的是不重复抽样的方法,那么由10个村子组成的样本平均产量的期望值是多少?平均产量的标准差又是多少?
2.某地有200家外贸企业,年平均出口额为90万美元,标准差为27万美元,随机抽取36家企业调查,问其年平均出口额在100万美元以上的概率是多大?
3.工厂在正常情况下产品次品率为8%,若产品批量较大,随机抽取100个产品进行检验,求次品率在7%-9%之间的概率。
第7章 参数估计
一、单项选择题
1.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A.样本容量为10 B.抽样误差为2 C.样本平均每袋重量是估计量 D.498是估计值
2.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都服从或近似服从趋近于( )
A.N(100,25) B.N(100,5/n) C.N(100/n,25) D.N(100,25/n)
3.在其他条件不变的情况下,要使置信区间的宽度缩小一半,样本量应增加( ) A.一半 B.一倍 C.三倍 D.四倍
4.在其他条件不变时,置信度(1–α)越大,则区间估计的( )
A.误差范围越大 B.精确度越高 C.置信区间越小 D.可靠程度越低 5.其他条件相同时,要使抽样误差减少1/4,样本量必须增加( ) A.1/4 B.4倍 C.7/9 D.3倍
6.在整群抽样中,影响抽样平均误差的一个重要因素是( ) A.总方差 B.群内方差 C.群间方差 D.各群方差平均数
7.在等比例分层抽样中,为了缩小抽样误差,在对总体进行分层时,应使( )尽可能小 A.总体层数 B.层内方差 C.层间方差 D.总体方差
9 / 43
8.一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( ) A.简单随机抽样 B.分层抽样 C.等距抽样 D.整群抽样
9.为了解某地区职工的劳动强度和收入状况,并对该地区各行业职工的劳动强度和收入情况进行对比分析,有关部门需要进行一次抽样调查,应该采用( )
A.分层抽样 B.简单随机抽样 C.等距抽样 D.整群抽样
10.某企业最近几批产品的优质品率分别为88%,85%,91%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,优质频率应选( ) A.85% B.87.7% C.88% D.90% 二、多项选择题
1.影响抽样误差大小的因素有( )
A.总体各单位标志值的差异程度 B.调查人员的素质 C.样本各单位标志值的差异程度 D.抽样组织方式 E.样本容量
2.某批产品共计有4000件,为了了解这批产品的质量,从中随机抽取200件进行质量检验,发现其中有30件不合格。根据抽样结果进行推断,下列说法正确的有( )
A.样本容量为200 B. 样本容量为30 C.总体合格率是一个估计量 D.样本合格率是一个统计量 E.合格率的抽样平均误差为2.52%
3.用样本成数来推断总体成数时,至少要满足下列哪些条件才能认为样本成数近似于正态分布( ) A.np≤5 B.np≥5 C.n(1–p)≥5 D.p≥1% E.n≥30 三、填空题
对某大学学生进行消费支出调查,采用抽样的方法获取资料。请列出五种常见的抽样方法:(1) 、方法比较合适,理由是(7) 。 四、简答题
1.分层抽样与整群抽样有何异同?它们分别适合于什么场合? 2.解释抽样推断的含义。 五、计算题
1.某糖果厂用自动包装机装糖,每包重量服从正态分布,某日开工后随机抽查10包的重量如下:494,495,503,506,492,493,498,507,502,490(单位:克)。对该日所生产的糖果,给定置信度为95%,试求: (1)平均每包重量的置信区间,若总体标准差为5克; (2)平均每包重量的置信区间,若总体标准差未知。
(已知:t0.025(9)?2.2622,t0.025(10)?2.2281,t0.05(9)?1.8331,t0.05(10)?1.8125, Z0.025?1.96,
(2) 、(3) 、(4) 、(5) ,当对全校学生的名单不好获得时,你认为(6)
Z0.05?1.645)
2.某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。该公司希望有90%的信心使所估计的比例只有2个百分点左右的误差。为了节约调查费用,样本将尽可能小,试问样本量应该为多大? (已知:Z0.025?1.96,Z0.05?1.645)
3.为调查某单位每个家庭每天观看电视的平均时间是多长,从该单位随机抽取了16户,得样本均值为6.75小时,样本标准差为2.25小时。
(1)试对家庭每天平均看电视时间进行区间估计。
(2)若已知该市每个家庭看电视时间的标准差为2.5小时,此时若再进行区间估计,并且将边际误差控制
在(1)的水平,问此时需要调查多少户才能满足要求?(α=0.05) (已知:Z0.025?1.96,Z0.05?1.645)
10 / 43
第8章 假设检验
一、单项选择题
1.按设计标准,某自动食品包装及所包装食品的平均每袋重量应为500克。若要检验该机实际运行状况是否符合设计标准,应该采用( )。 A.左侧检验 B.右侧检验
C.双侧检验 D.左侧检验或右侧检验
2.假设检验中,如果原假设为真,而根据样本所得到的检验结论是否定原假设的,则可认为( )。 A.抽样是不科学的 B.检验结论是正确的 C.犯了第一类错误 D.犯了第二类错误
3.当样本统计量的观察值未落入原假设的拒绝域时,表示( )。 A.可以放心地接受原假设 B.没有充足的理由否定与原假设 C.没有充足的理由否定备择假设 D.备择假设是错误的
4.进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( )。 A.都减少 B.都增大
C.都不变 D.一个增大一个减小 5.关于检验统计量,下列说法中错误的是( )。 A.检验统计量是样本的函数 B.检验统计量包含未知总体参数
C.在原假设成立的前提下,检验统计量的分布是明确可知的 D.检验同一总体参数可以用多个不同的检验统计量 二、多项选择题
1.关于原假设的建立,下列叙述中正确的有( )。 A.若不希望否定某一命题,就将此命题作为原假设 B.尽量使后果严重的错误成为第二类错误
C.质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”
D.若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设 E.可以随时根据检验结果改换原假设,以期达到决策者希望的结论 2.在假设检验中,α与β的关系是( )。 A.α和β绝对不可能同时减少 B.只能控制α,不能控制β
C.在其它条件不变的情况下,增大α,必然会减少β D.在其它条件不变的情况下,增大α,必然会增大β E.增大样本容量可以同时减少α和β 三、判断分析题(判断正误,并简要说明理由)
1.对某一总体均值进行假设检验,H0:?=100,H1:?≠100。检验结论是:在1%的显著性水平下,应拒绝H0。据此可认为:总体均值的真实值与100有很大差异。
2.有个研究者猜测,某贫困地区失学儿童中男孩数不足女孩数的1/3。为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。那么原假设可以为:H0:P≤1/3。 四、简答题
采用某种新生产方法需要追加一定的投资。但若根据实验数据,通过假设检验判定该新生产方法能够降低产品成本,则这种新方法将正式投入使用。
(1)如果目前生产方法的平均成本是350元,试建立合适的原假设和备择假设。 (2)对你所提出的上述假设,发生第一、二类错误分别会导致怎样的后果? 五、计算题
1.某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。从过去的资料知σ是0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。假设产品重量服从正态分布。
11 / 43
(1)建立适当的原假设和备择假设。
(2)在α=0.05时,该检验的决策准则是什么? (3)如果x=12.25克,你将采取什么行动? (4)如果x=11.95克,你将采取什么行动?
第9章 分类数据分析
一、单选题
1.四格表的周边合计不变时,如果实际频数有变化,则理论频数( )。 A.增大 B.减小 C.不变 D.不确定 2.下列哪项检验不适用?2检验( )
A.两样本均数的比较 B.两样本率的比较 C.多个样本构成比的比较 D.拟合优度检验 3.?2值的取值范围为( )
A.??2? B.0??2??? C.?2?1 D.????2?0 4.以下关于?2检验的自由度的说法,正确的是: A.拟合优度检验时,??n?2(n为观察频数的个数) B.对一个3?4表进行检验时,??11 C.对四格表检验时,?=4
22D.若?0.05(?)??0.05(?),则???
5.用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?
A.不能确定 B.甲、乙法一样 C.甲法优于乙法 D.乙法优于甲法 6.列联分析是利用列联表研究( )。 A.两个或多个属性(定性变量)间的关系 B.两个数值型变量间的关系
C.一个分类型变量和一个数值型变量间的关系 D.不受变量类型的约束
7.在列联分析中,?分布的自由度为( )。
A.行数 B.行数与列数的乘积 C.列数 D.行数减1与列数减1的乘积 8.在某地生育意愿调查中,被调查者年龄与生育意愿的交叉列联表如下表:
某地被调查者年龄与生育意愿的交叉列联表
生育意愿 1孩及以下
2孩 3孩及以上 合计
29岁以下
77 129 6 212
30-39岁 40-49岁 50岁及以上 78 288 12 378
37 206 8 251
3 14 1 18
合计 195 637 27 859
2现根据上表回答(1)-(9)问题。
(1)请问,这个列联表的最右端一列称为( )。
A.列边缘频数 B.行边缘频数 C.条件频数 D.总频数 (2)根据这个列联表计算的意愿生育二孩的行百分比依次为( )。 A.25%.44%.29%和2% B.20%.45%.32%和2% C.23%.74%和3% D.21%.76%和3%
(3)根据这个列联表计算的30-39岁被调查者的列百分比依次为( )。 A.25%.44%.29%和2% B.20%.45%.32%和2%
12 / 43
C.23%.74%和3% D.21%.76%和3%
(4)根据这个列联表计算的各年龄段二孩的期望频数为( )。 A.157.280.186和13 B.212.378.251和18 C.195.637和27 D.48.86.57和4 (5)根据这个表计算的?统计量为( )。
A.33.157 B.31.716 C.23.812 D.32.101
(6)如果要检验各年龄段被调查者的生育意愿是否相同,提出的原假设为( )。 A.各年龄段生育意愿的频数相同 B.各年龄段生育意愿的比例相同
C.各年龄段生育意愿的频数依次为195.637.27 D.各年龄段生育意愿的频数依次为212.378.251.18 (7)根据这个列联表,?2分布的自由度为( )。 A.6 B.3 C.2 D.12
(8)给定显著性水平??0.05,检验各年龄段被调查者的生育意愿比例是否相同,得出的结论为( )。 A.拒绝原假设 B.可以拒绝也可以不拒绝原假设 C.不拒绝原假设 D.无法判断 (9)V相关系数是( )。
A.0.1359 B.0.1177 C.0.1389 D.0.1367 9.?相关系数是描述( )列联表分类变量之间相关程度的统计量。 A.2×2 B.3×3 C.2×3 D.各分类变量的等级不受限制 10.?相关系数的取值范围( )。
A.[0,1] B.[-1,1] C.[0,1) D.任何值 11.列联相关系数的取值范围为( )。
A.[0,1] B.[-1,1] C.[0,1) D.任何值 12.当列联表中的两个变量相互独立时,计算的列相关系数为( )。 A.1 B.0 C.大于1 D.小于0 二、简答题
1.简述?2检验的基本思想。
2.R?C表?2检验的适用条件及当条件不满足时可以考虑的处理方法是什么? 3.在列联分析过程中,应注意的问题有哪些? 4.方差分析和列联表分析的应用有哪些差异? 三、计算题
1.某人试图确定一颗骰子是否公平,他投掷了100次,结果如表8-6所示:
投掷骰子频数分布情况
频数
试确定该骰子是否公平。
2.一家超市出售4种价格水平的水果,认为顾客购买从最低价到最高价水果的概率依次是0.15,0.3,0.5,0.05。1000个样本中购买各种水果的频数为120,320,500和60。这组样本与期望比例一致吗?(??0.05) 3.某位老师的全校公选课各个年级的学生都有,现对该课进行评议,随机抽取了150名学生,对此课的态度如下表所示:
关于某课程的评议结果 单位:人
认可 不认可
13 / 43
一年级 26 14
二年级 35 21
三年级 14 14
四年级 18 8
合计 93 57
1 21
2 15
3 13
4 17
5 19
6 15
2合计 40 56 28 26 150
(1)在??0.01的显著水平下对学生态度是否与所在年级有关进行检验。 (2)计算?相关系数.C相关系数和V相关系数。
第10章 方差分析
一、单项选择题
1.在方差分析中,( )反映的是样本数据与其组平均值的差异 A.总离差 B.组间误差 C.抽样误差 D.组内误差 2.SSE?kni??(xi?1j?1kniij?xi)2 是( )
A.组内平方和 B.组间平方和 C.总离差平方和 D.因素B的离差平方和 3.SST???(xi?1j?1ij?xi)2是( )
A.组内平方和 B.组间平方和 C.总离差平方和 D.总方差 4.单因素方差分析中,计算F统计量,其分子与分母的自由度各为( ) A.r,n B.r-n,n-r C.r-1.n-r D.n-r,r-1 二、多项选择题
1.应用方差分析的前提条件是( )
A.各个总体报从正态分布 B.各个总体均值相等 C.各个总体具有相同的方差 D.各个总体均值不等 E.各个总体相互独立 2.若检验统计量F= 近似等于1,说明( )
A.组间方差中不包含系统因素的影响 B.组内方差中不包含系统因素的影响 C.组间方差中包含系统因素的影响 D.方差分析中应拒绝原假设 E.方差分析中应接受原假设
3.对于单因素方差分析的组内误差,下面哪种说法是对的?( ) A.其自由度为r-1 B.反映的是随机因素的影响 C.反映的是随机因素和系统因素的影响 D.组内误差一定小于组间误差 E.其自由度为n-r
4.为研究溶液温度对液体植物的影响,将水温控制在三个水平上,则称这种方差分析是( ) A.单因素方差分析 B.双因素方差分析 C.三因素方差分析 D.单因素三水平方差分析 E.双因素三水平方差分析 三、填空题
1.方差分析的目的是检验因变量y与自变量x是否 ,而实现这个目的的手段是通过 的比较。 2.总变差平方和、组间变差平方和、组内变差平方和三者之间的关系是 。 3.方差分析中的因变量是 ,自变量可以是 ,也可以是 。 4.方差分析是通过对组间均值变异的分析研究判断多个 是否相等的一种统计方法。
5.在试验设计中,把要考虑的那些可以控制的条件称为 ,把因素变化的多个等级状态称为 。 6.在单因子方差分析中,计算F统计量的分子是 方差,分母是 方差。 7.在单因子方差分析中,分子的自由度是 ,分母的自由度是 。 四、计算题
1.有三台机器生产规格相同的铝合金薄板,为检验三台机器生产薄板的厚度是否相同,随机从每台机器生产的薄板中各抽取了5个样品,测得结果如下: 机器1:0.236,0.238,0.248,0.245,0.243 机器2:0.257,0.253,0.255,0.254,0.261 机器3:0.258,0.264,0.259,0.267,0.262 问:三台机器生产薄板的厚度是否有显著差异?
14 / 43
2.养鸡场要检验四种饲料配方对小鸡增重是否相同,用每一种饲料分别喂养了6只同一品种同时孵出的小鸡,共饲养了8周,每只鸡增重数据如下:(克) 配方 :370,420,450,490,500,450 配方 :490,380,400,390,500,410 配方 :330,340,400,380,470,360 配方 :410,480,400,420,380,410 问:四种不同配方的饲料对小鸡增重是否相同?
3.今有某种型号的电池三批,它们分别为一厂、二厂、三厂 三个工厂所生产的。为评比其质量,各随机抽取5只电池为样品,经试验测得其寿命(小时)如下: 一厂 :40,48,38,42,45 二厂 :26,34,30,28,32 三厂 :39,40,43,50,50
试在显著性水平 下检验电池的平均寿命有无显著的差异。
4.一个年级有三个小班,他们进行了一次数学考试。现从各个班级随机抽取了一些学生,记录其成绩如下: 1班:73,89,82,43,80,73,66,60,45,93,36,77
2班:88,78,48,91,51,85,74,56,77,31,78,62,76,96,80 3班:68,79,56,91,71,71,87,41,59,68,53,79,15
若各班学生成绩服从正态分布,且方差相等,试在显著性水平 下检验各班级的平均分数有无显著差异?
第11章 一元线性回归
一、单项选择题
1.下面的关系中不是相关关系的是( ) A.身高与体重之间的关系 B.工资水平与工龄之间的关系
C.农作物的单位面积产量与降雨量之间的关系 D.圆的面积与半径之间的关系
2.具有相关关系的两个变量的特点是( )
A.一个变量的取值不能由另一个变量唯一确定 B.一个变量的取值由另一个变量唯一确定
C.一个变量的取值增大时另一个变量的取值也一定增大 D.一个变量的取值增大时另一个变量的取值肯定变小 3.下面的假定中,哪个属于相关分析中的假定( ) A.两个变量之间是非线性关系 B.两个变量都是随机变量
C.自变量是随机变量,因变量不是随机变量 D.一个变量的数值增大,另一个变量的数值也应增大
4.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称这两个变量之间为( ) A.完全相关关系 B.正线性相关关系 C.非线性相关关系 D.负线性相关关系 5.根据你的判断,下面的相关系数取值哪一个是错误的( ) A.–0.86 B.0.78 C.1.25 D.0
6.设产品产量与产品单位成本之间的线性相关关系为–0.87,这说明二者之间存在着( ) A.高度相关 B.中度相关 C.低相关 D.极弱相关
7.在回归分析中,描述因变量y如何依赖于自变量x和误差项ε的方程称为( ) A.回归方程 B.回归模型 C.估计回归方程 D.经验回归方程 8.在回归模型y=?0??1x??中,ε反映的是( ) A.由于x的变化引起的y的线性变化部分 B.由于y的变化引起的x的线性变化部分
15 / 43
C.除x和y的线性关系之外的随机因素对y的影响 D.由于x和y的线性关系对y的影响
9.如果两个变量之间存在负相关关系,下列回归方程中哪个肯定有误( )
?=25–0.75x B.y?= –120+ 0.86x C.y?=200–2.5x D.y?= –34–0.74x A.y10.说明回归方程拟合优度的统计量是( )
A.相关系数 B.回归系数 C.判定系数 D.估计标准误差
11.判定系数R是说明回归方程拟合度的一个统计量,它的计算公式为( ) A.
2
SSRSSRSSESST B. C. D. SSTSSESSTSSR2
12.已知回归平方和SSR=4854,残差平方和SSE=146,则判定系数R=( ) A.97.08% B.2.92% C.3.01% D.33.25%
13.一个由100名年龄在30~60岁的男子组成的样本,测得其身高与体重的相关系数r=0.45,则下列陈述中不正确的是( )
A.较高的男子趋于较重 B.身高与体重存在低度正相关 C.体重较重的男子趋于较高 D.45%的较高的男子趋于较重 14.下列回归方程中哪个肯定有误( )
?=15–0.48x,r=0.65 B.y?= –15 - 1.35x,r=-0.81 A.y?=-25+0.85x,r=0.42 D.y?=120–3.56x,r=-0.96 C.y15.若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R为( ) A.0.8 B.0.89 C.0.64 D.0.40 16.对具有因果关系的现象进行回归分析时( )
A.只能将原因作为自变量 B.只能将结果作为自变量 C.二者均可作为自变量 D.没有必要区分自变量 二、多项选择题
1.下列现象不具有相关关系的有( )
A.人口自然增长率与农业贷款 B.存款期限与存款利率 C.降雨量与农作物产量 D.存款利率与利息收入 E.单位产品成本与劳动生产率
2.一个由500人组成的成人样本资料,表明其收入水平与受教育程度之间的相关系数r为0.6314,这说明( )
A.二者之间具有高度的正线性相关关系 B.二者之间只有63.14%的正线性相关关系 C.63.14%的高收入者具有较高的受教育程度 D.63.14%的较高受教育程度者有较高的收入 E.通常来说受教育程度较高者有较高的收入 三、判断分析题(判断正误,并简要说明理由)
1.一项研究显示,医院的大小(用病床数x反映)和病人住院天数的中位数y之间是正相关,这说明二者之间有一种必然的联系。( )
2.应用回归方程进行预测,适宜于内插预测而不适宜于外推预测。( ) 四、简答题
1.解释相关关系的含义,说明相关关系的特点。 2.简述狭义的相关分析与回归分析的不同。 五、计算题
1.研究结果表明受教育时间与个人的薪金之间呈正相关关系。研究人员搜集了不同行业在职人员的有关受教育年数和年薪的数据,如下: 受教育年数 x 8
16 / 43
年薪(万元) y 3.00 受教育年数 x 7 年薪(万元) y 3.12 2
6 3 5 9 3 2.00 0.34 1.64 4.30 0.51 10 13 4 4 11 6.40 8.54 1.21 0.94 4.64 (1)做散点图,并说明变量之间的关系; (2)估计回归方程的参数;
(3)当受教育年数为15年时,试对其年薪进行置信区间和预测区间估计(α=0.05) (已知:t0.025(11)?2.201,t0.025(10)?2.2281,t0.05(11)?1.7959,t0.05(10)?1.8125)
2.一国的货币供应量与该国的GDP之间应保持一定的比例关系,否则就会引起通货膨胀。为研究某国家的一段时间内通货膨胀状况,研究人员搜集了该国家的货币供应量和同期GDP的历史数据,如下表: 单位:亿元
年份 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
货币供应量 2.203 2.276 2.454 2.866 2.992 3.592 4.021 4.326 4.392 4.804 5.288 5.348
该国GDP 6.053 6.659 8.270 8.981 11.342 11.931 12.763 12.834 14.717 15.577 15.689 15.715
(1)试以货币供应量为因变量y,该国家的GDP为自变量x,建立回归模型;
(2)若该国家的GDP达到16.0,那么货币供应量的置信区间和预测区间如何,取α=0.05。
第12章 多元线性回归
一、单项选择题
1.在由n?30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为( D )
A. 0.8603 B. 0.8389 C. 0.8655 D.0.8327 2.下列样本模型中,哪一个模型通常是无效的(B) A.
Ci(消费)=500+0.8Ii(收入)
dIPQiB. (商品需求)=10+0.8i(收入)+0.9i(价格) sPQiC. (商品供给)=20+0.75i(价格) 0.60.4YLKiiiD. (产出量)=0.65(劳动)(资本)
3.用一组有30个观测值的样本估计模型作t检验,则A.
yt?b0?b1x1t?b2x2t?ut后,在0.05的显著性水平上对b1的显著性
b1显著地不等于零的条件是其统计量t大于等于( C )
t0.05(30) B. t0.025(28) C. t0.025(27) D. F0.025(1,28)
lnyt?lnb0?b1lnxt?ut中,b1的实际含义是( B ) A.x关于y的弹性 B. y关于x的弹性
4.模型
17 / 43
C. x关于y的边际倾向 D. y关于x的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型yt?b0?b1x1t?b2x2t?......?bkxkt?ut 中,检验H0:bt?0(i?0,1,2,...k)时,所用的统计量
服从( C )
A.t(n-k+1) B.t(n-k-2) C.t(n-k-1) D.t(n-k+2) 7. 调整的判定系数 A.R?2 与多重判定系数 之间有如下关系( D )
n?1n?1R2 B. R2?1?R2
n?k?1n?k?1n?1n?12(1?R2) D. R2?1?(1?R2) C. R?1?n?k?1n?k?18.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。
A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 D.A、B、C 都不对
9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n≥k+1 B n B 如果模型的R 较低,我们可以认为此模型的质量较差 C 如果某一参数不能通过显著性检验,我们应该剔除该解释变量 D 如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量 0111.半对数模型中,参数?1的含义是( C )。 A.X的绝对量变化,引起Y的绝对量变化 B.Y关于X的边际变化 C.X的相对变化,引起Y的期望值绝对量变化 D.Y关于X的弹性 0112.半对数模型中,参数?1的含义是( A )。 A.X的绝对量发生一定变动时,引起因变量Y的相对变化率 B.Y关于X的弹性 C.X的相对变化,引起Y的期望值绝对量变化 D.Y关于X的边际变化 0113.双对数模型中,参数?1的含义是( D )。 A.X的相对变化,引起Y的期望值绝对量变化 B.Y关于X的边际变化 C.X的绝对量发生一定变动时,引起因变量Y的相对变化率 D.Y关于X的弹性 二、多项选择题 1.将非线性回归模型转换为线性回归模型,常用的数学处理方法有( ABC ) A.直接置换法 B.对数变换法 C.级数展开法 D.广义最小二乘法 E.加权最小二乘法 22Y????lnX??lnY????X??lnY????lnX??2.在模型 lnYi?ln?0??1lnXi??i中( ABCD ) A. Y与X是非线性的 B. Y与?1是非线性的 C. lnY与?1是线性的 D. lnY与lnX是线性的 E. Y与lnX是线性的 3.对模型 18 / 43 yt?b0?b1x1t?b2x2t?ut进行总体显著性检验,如果检验结果总体线性关系显著,则有 ( BCD ) b1?b2?0 B. b1?0,b2?0 C. b1?0,b2?0 b?0,b2?0 E. b1?b2?0 D. 1A. 4. 剩余变差是指( ACDE ) A.随机因素影响所引起的被解释变量的变差 B.解释变量变动所引起的被解释变量的变差 C.被解释变量的变差中,回归方程不能做出解释的部分 D.被解释变量的总变差与回归平方和之差 E.被解释变量的实际值与回归值的离差平方和 5.回归变差(或回归平方和)是指( BCD ) A. 被解释变量的实际值与平均值的离差平方和 B. 被解释变量的回归值与平均值的离差平方和 C. 被解释变量的总变差与剩余变差之差 D. 解释变量变动所引起的被解释变量的变差 E. 随机因素影响所引起的被解释变量的变差 6.设k为回归模型中的参数个数(包括截距项),则总体线性回归模型进行显著性检验时所用的F统计量可表示为()。 ??Y)2(n?k)?(YiA. ?ei2(k?1)??Y)2(k?1)?(Yi2?e(n?k) i B. (1?R2)(n?k)R2(k?1)22(1?R)(n?k)R(k?1) C. D.R2(n?k)2E.(1?R)(k?1) 7.在多元线性回归分析中,修正的可决系数R与可决系数R之间( )。 A.R 011t22tt,请叙述模型的古典假定。 1.给定二元回归模型:t2.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度? 22222222y?b?bx?bx?u3.修正的决定系数R及其作用。 4.常见的非线性回归模型有几种情况? 5.观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。 ①yt?b0?b1xt3?ut ②yt?b0?b1logxt?ut ③ logyt?b0?b1logxt?ut ④yt?b0/(b1xt)?ut 6. 观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。 ①yt?b0?b1logxt?ut ②yt?b0?b1(b2xt)?ut ③ yt?b0/(b1xt)?ut ④yt?1?b0(1?xt1)?ut 四、计算和分析题 1.根据某地1961—1999年共39年的总产出Y、劳动投入L和资本投入K的年度数据,运用普通最小二乘法估计得出了下列回归方程: (0.237) (0.083) (0.048) ,DW=0.858 式下括号中的数字为相应估计量的标准误。 (1)解释回归系数的经济含义; (2)系数的符号符合你的预期吗?为什么? 2.某计量经济学家曾用1921~1941年与1945~1950年(1942~1944年战争期间略去)美国国内消费C和工资收入W、非工资-非农业收入P、农业收入A的时间序列资料,利用普通最小二乘法估计得出了以下回归方程: 19 / 43 b2??8.133?1.059YW?0.452P?0.121A (8.92)(0.17)(0.66)(1.09)R2?0.95F?107.37 式下括号中的数字为相应参数估计量的标准误。试对该模型进行评析,指出其中存在的问题。 3.计算下面三个自由度调整后的决定系数。这里,R为决定系数,n为样本数目,k为解释变量个数。 (1)R?0.75???????n??????????k?2 (2)R?0.35???????n??????????k?3 (3)R?0.95???????n???????????k?5 011t22tt,试在下列条件下: 4.设有模型t①b1?b2?1 ②b1?b2。分别求出b1,b2的最小二乘估计量。 2222y?b?bx?bx?u5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程: ??125.0?15.0X1?1.0X2?1.5X3 R?0.75 方程A:Y2??123.0?14.0X1?5.5X2?3.7X4 R?0.73 方程B:Y其中:Y——某天慢跑者的人数 X1——该天降雨的英寸数 X2——该天日照的小时数 X3——该天的最高温度(按华氏温度) X4——第二天需交学期论文的班级数 请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么? (2)为什么用相同的数据去估计相同变量的系数得到不同的符号? 6.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差): 2??10.6?28.4X?12.7X?0.61X?5.9X Yi1i2i3i4i(2.6) (6.3) (0.61) (5.9) R?0.63 n?35 要求:(1)试判定每项结果对应着哪一个变量? (2)对你的判定结论做出说 2第13章 时间序列分析和预测 一、单项选择题 1.作为动态数列中的指标是( )。 A.相对指标 B.平均指标 C.总量指标 D.三者均可 2.下面哪一种动态数列中的指标数值直接相加具有现实意义( )。 A.相对数动态数列 B.平均数动态数列 C.时期数列 D.时点数列 3.某地区国内生产总值2007年比2002年增长30%,则该地区在这一时期国内生产总值的年平均发展速度的计算应当是( )。 A. B. C. D. 4.将某地区2001—2007年的新增加人口数量按年排列的动态数列属于( )。 A.相对数动态数列 B.平均数动态数列 C.时期数列 D.时点数列 5.某地区糖产量2003年为8.3万吨,2004年比2003年减产0.6万吨,2005年比2003年减产1.3万吨,2006年产量为8万吨,2007年比2006年增产0.8万吨,则2003-2007年该地区糖产量的平均增长量为( )。 A.7.96万吨 B.9.95万吨 C.0.1万吨 D.0.125万吨 6.某地区1998年至2002年的GDP年平均增长速度为6%,2002年至2007年的GDP年平均增长速度为7%,则该地区1998年至2007年GDP的年平均增长速度为( )。 A. 20 / 43 B. C. D. 7.某现象发展变化的速度平均来说是负增长的,则其增长量是( )。 A.年年减少 B.年年增加 C.一年比一年少 D.不能确定 8.某厂五年中每年的销售额增长速度都为15%,则各年的销售额增长量将( )。 A.每年相等 B.一年比一年多 C.一年比一年少 D.不能确定 9.某企业产品成本连年下降,已知从2000—2007年降低了60%,则平均每年的降低率为( )。 A. B. C. D. 10.如果现象的发展不受季节因素的影响,所计算的各季节比率应( )。 A.等于 0 B.小于100% C.等于 100% D.大于100% 11.按季平均法测定季节比率时,各季度的季节比率之和应等于( )。 A.100% B.400% C.120% D.1200% 12.某企业2007年9月—12月月末职工人数资料如下: 日期 月末人数(人) 9月30日 10月31日 11月30日 12月31日 1400 1510 1460 1420 该企业第四季度的平均职工人数为( )。 A.1448人 B.1460人 C.1463人 D.1500人 13.定基增长速度与环比增长速度之间的关系是( )。 A.定基增长速度等于各环比增长速度的连乘积 B.定基增长速度等于各环比增长速度之和 C.各环比增长速度加1后的连乘积等于定基增长速度加1 D.各环比增长速度加1后的连乘积等于定基增长速度 14.已知某地区2005年粮食产量比1995年增长了1倍,比2000年增长了0.5倍,那么2000年粮食产量比1995年增长了( )。 A.0.33倍 B.0.5倍 C.0.75倍 D.2倍 15.已知一个数列的环比增长速度分别为4%.6%.9%,该数列的定基增长速度为( )。 A.4%×6%×9% B.104%×106%×109% C.4%×6%×9%)+1 D.104%×106%×109%)-1 16.某种产品产量2005年比2004年增长了10%,2006年比2004年增长了15%,2006年与2005年相比增长了( )。 A.15%÷10% B.115%÷110% C.110%×115%- 1 D.115%÷110%-1 17.某地区农民家庭的年平均收入2005年为1500元,2006年增长了8%,那么2006年与2005年相比之下,每增长一个百分点增加的收入额为( )。 A.7元 B.8元 C.15元 D.40元 18.按水平法计算的平均发展速度推算的( )。 A.各期水平之和等于各期实际水平之和 B.最后一期的水平等于最后一期实际水平 C.各期增长量等于实际逐期增长量 D.各期定基发展速度等于实际各期定基发展速度 19.不同年份的产品单位成本(元)配合的直线趋势方程为 =85-2.5t,b= -2.5表示( )。 A.时间每增加1年单位成本平均增加2.5元 B.时间每增加1年单位成本增加总额为2.5元 C.时间每增加1年单位成本平均下降2.5元 D.单位成本每下降1元平均需要2.5年时间 20.根据各年的月份资料计算的季节指数其平均数为( )。 A.100% B.1200% C.120% D.400% 21.根据各年的季度资料计算的季节指数之和等于( )。 A.100% B.120% C.400% D.1200% 22.根据各年的季度资料计算的各季季节指数分别为:一季度100%.二季度110%.三季度70%.四季度120%。指出哪一季度受季节因素影响较大( )。 21 / 43 A.一季度 B.二季度 C.三季度 D.四季度 二、多项选择题 1.下列各指标构成的时间数列中属于时期数列的是( )。 A.职工人数 B.商品库存量 C.商品销售额 D.工资总额 E.出生人口数 2.在下列动态指标中,一般可以取负值的是( )。 A.发展速度 B.平均发展速度 C.增长量 D.增长速度 E.平均增长速度 3.下列等式中正确的有( )。 A.增长速度=发展速度-1 B.环比发展速度=环比增长速度-1 C.定基发展速度=定基增长速度+1 D.平均发展速度=平均增长速度-1 E.平均增长速度=平均发展速度-1 4.指出下面的数列哪些属于时点数列( )。 A.某种股票周一至周五各天的收盘价 B.某工厂各月份的利润额 C.某地区2000—2005年年末固定资产净值 D.某商店各月末的商品库存额 E.某企业2000—2006年年末固定资产净值 5.环比发展速度与定基发展速度之间的数量关系是( )。 A.观察期内各环比发展速度之和等于总的定基发展速度 B.观察期内各环比发展速度的连乘积等于总的定基发展速度 C.两个相邻的定基发展速度用后者除以前者等于相应的环比发展速度 D.两个相邻的定基发展速度的连乘积等于相应的环比发展速度 E.观察其内各环比发展速度之比等于总的定基发展速度 ?t=a+bt中,b表示( )。 6.在直线趋势方程yA.趋势线在Y轴上的截距 B.当t=0时的趋势值 C.趋势线的斜率 D.时间变动一个单位时观察值的平均变动量 E.观察值变动一个单位时t的平均变动量 7.根据各年的月份数据计算的季节指数( )。 A.其平均数为100% B.其平均数为1200% C.其总和为100% D.其总和为1200% E.其平均数为100%,总和为400% 三、判断题 1.如果某一时间数列的发展水平共有n项,则用几何平均法计算其平均发展速度应开n次方。( ) 2.对于同一时间数列资料,按水平法和累计法计算的平均发展速度总是一致的。( ) 3.当时间数列的观察值出现零或负数时,不宜计算速度指标。( ) 4.环比增长速度的乘积等于定基增长速度。( ) 5.时间数列中各指标值不能直接相加。( ) 6.总体的同质性是计算平均数和平均速度都应遵守的原则之一。( ) 7.年距增减水平是反映本期发展水平较上期发展水平的增减绝对量。( ) 8.把某大学历年招生的增加人数按时间先后顺序排列,形成的时间数列属于时点数列。( ) 9.若各期的增长量相等,则各期的增长速度也相等。( ) 10.某企业产品产值同去年相比增加了4倍,即翻了两翻。( ) 11.如果季节比率等于1或季节变差等于0,说明没有季节变动。( ) 12.时间数列的指标数值只有用绝对数表示。( ) 13.一个时间数列,如中间年份的递增速度大于最末年份的递增速度,则按方程法计算的平均发展速度大于按几何平均法计算的平均发展速度。( ) 14.根据最小平方法建立直线方程后,可以精确地外推任意一年的趋势值。( ) 四、计算题 1.用下面的资料计算全年商品流通费用率(商品流通费用率=商品流通费用总额/商品纯销售额)。 22 / 43 商店某年各月商品流通费用率 商品流通费用率(%) 商品流通费用额(百元) 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 3.50 2.99 2.95 2.98 4.58 3.81 3.02 4.00 3.75 3.27 3.95 4.58 9.86 8.78 8.50 9.91 11.05 12.00 11.84 10.96 11.58 7.86 8.05 10.00 2.用下面的资料计算我国2003年至2007年间定期储蓄存款占全国储蓄存款总额的平均比重。 我国居民定期储蓄存款年底余额 定期储蓄存款占全国储蓄存款总额的% 定期储蓄存款(亿元) 16838.7 23778.2 30873.4 36226.7 41791.6 44955.1 78.25 80.16 80.15 78.28 78.25 75.40 2002年底 2003年底 2004年底 2005年底 2006年底 2007年底 3.将一笔钱存入银行,存期10年,以复利计息。10年的年利率分别是:第1至第2年为5%,第3年至第 5年为8%,第6至第8年为10%,第9至第10年为12%。求平均年利率。 4.用某建筑施工队各季工作量资料绘制动态折线图。然后用按季平均法编制季节模型。根据所编的季节模 型,把季节变动的规律用动态折线画在同一图上。最后预测2008年各季工作量(预测2008年平均水平时要用一次指数平滑法,用2003年平均水平作初始值,平滑常数取0.1)。 某建筑施工队2003年~2007年各季工作量 单位:百元 2003年 2004年 2005年 2006年 2007年 一季 710 690 750 650 720 二季 780 780 810 800 790 三季 800 820 870 820 840 四季 700 660 620 630 670 第14章 指数 一、单项选择题 1.广义上的指数是指( )。 A.价格变动的相对数 B.物量变动的相对数 C.社会经济现象数量变动的相对数 D.简单现象总体数量变动的相对数 2.统计指数按指数化指标反映的对象范围可分为( )。 A.定基指数和环比指数 B.数量指标指数和质量指标指数 C.个体指数和总指数 D.综合指数和平均数指数 3.统计指数按指数化指标的性质不同,可分为( )。 A.总指数和个体指数 B.数量指标指数和质量指标指数 C.平均数指数和平均指标指数 D.综合指数和平均数指数 4.统计指数划分为个体指数和总指数的依据是( )。 A.反映的对象范围不同 B.指标性质不同 C.采用的基期不同 D.编制指数的方法不同 5.数量指标指数和质量指标指数的划分依据是( )。 A.指数化指标的性质不同 B.所反映的对象范围不同 C.所比较的现象特征不同 D.编制指数的方法不同 6.编制总指数的两种形式是 ( )。 A.数量指标指数和质量指标指数 B.综合指数和平均数指数 23 / 43 C.算术平均数指数和调和平均数指数 D.定基指数和环比指数 7.编制数量指标指数时,同度量因素一般使用( )。 A.报告期的数量指标 B.基数的数量指标 C.报告期的质量指标 D.基期的质量指标 8.编制质量指标指数时,同度量因素一般使用( )。 A.报告期的数量指标 B.基数的数量指标 C.报告期的质量指标 D.基期的质量指标 9.综合指数是( )。 A.用非全面资料编制的指数 B.平均数指数的变形应用 C.总指数的基本形式 D.编制总指数的唯一方法 10.当数量指标的加权算术平均数指数采用特定权数时,计算结果与综合指数相同,其特定权数是( )。 A.q1p1 B.A.q1p1 B. 12.在由三个指数所组成的指数体系中,两个因素指数的同度量因素通常 ( )。 A.都固定在基期 B.都固定在报告期 C.一个固定在基期,一个固定在报告期 D.采用基期和报告期交叉 13.某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长 ( )。 A.3% B.10% C.7.1% D.107.1% 14.某市2004年社会商业零售额为12000万元,2007年增至15600万元,这四年物价上涨了4%,则商业零售量指 数为( )。 A.130% B.104% C.80% D.125% 15.某造纸厂2007年的产量比2006年增长了13.6%,总成本增长了12.9%,则该厂2007年产品单位成本( )。 A.减少0.62% B.减少5.15% C.增加12.9% D.增加1.75% 16.已知某工厂生产三种产品,在掌握其基期.报告期生产费用和个体产量指数时,编制三种产品的产量总指数应采 用( )。 A.加权调和平均数指数 B.加权算术平均数指数 C.数量指标综合指数 D.固定加权算术平均数指数 17.假设具有两工厂计算期和基期某产品的单位成本和产量资料,计算总平均成本的变动,应采用( )。 A.综合指数 B.可变构成指数 C.算术平均数指数 D.调和平均数指数 18.某市居民以相同的人民币在物价上涨后少购商品15%,则物价指数为( )。 A.17.6% B.85% C.115% D.117.6% 19.某商店报告期与基期相比,商品销售额增长6.5%,商品销售量增长6.5%,则商品价格( )。 A.增长13% B.增长6.5% C.增长1% D.不增不减 20.单位产品成本报告期比基期下降6%,产量增长6%,则生产总费用( )。 A.增加 B.减少 C.没有变化 D.无法判断 21.某公司三个企业生产同一种产品,由于各企业成本降低使公司平均成本降低15%,由于各种产品产量的比重变 化使公司平均成本提高10%,则该公司平均成本报告期比基期降低( )。 A .5.0% B .6.5% C.22.7% D.33.3% 22.某商店2007年1月份微波炉的销售价格是350元,6月份的价格是342元,指数为97.71%,该指数是( )。 A.综合指数 B.平均指数 C.总指数 D.个体指数 二、多项选择题 1.下列属于质量指标指数的有 ( ) A.商品零售量指数 B.商品零售额指数 C.商品零售价格指数 D.职工劳动生产率指数 E.产品单位成本指数 2.下列属于数量指标指数的有 ( ) A.工业产值指数 B.劳动生产率指数 q0p1 C.q1p0 D.q0p0 11.当质量指标的加权算术平均数指数采用特定权数时,计算结果与综合指数相同,其特定权数是( )。 q0p1 C.q1p0 D.q0p0 24 / 43 C.职工人数指数 D.产品产量指数 E.产品单位成本指数 3.编制综合指数的原则是 ( ) A.质量指标指数以报告期的数量指标作为同度量因素 B.质量指标指数以基期的数量指标作为同度量因素 C.数量指标指数以基期的数量指标作为同度量 D.数量指标指数以基期质量指标作为同度因素 E.数量指标指数以固定时期质量指标作为同度因素 4.下面哪些指数式是综合指数 ( ) A. ?q?q1p00p0 B. ?qpqp?k1111 ?qpqp C.?1110?qq D.?00p0p0 ?qp??qpq?qE.?111110 5.对某商店某时期商品销售额变动情况分析,其指数体系包括 ( ) A.销售量指数 B.销售价格指数 C.总平均价格指数 D.销售额指数 E.个体指数 6.进行平均指标变动的因素分析应编制的指数有 ( ) A.算术平均数指数 B.调和平均数指数 C.可变构成指数 D.固定构成指数 E.结构影响指数 7.若p表示商品价格,q表示商品销售量,则公式A.综合反映销售额变动的绝对额 B.综合反映价格变动和销售量变动的绝对额 C.综合反映多种商品价格变动而增减的销售额 D.综合反映由于价格变动而使消费者增减的货币支出额 E.综合反映多种商品销售量变动的绝对额 三、填空题 ?pq??pq表示的意义是( ) 11011.某乡粮食总产量增长了15% ,粮食的播种面积减少了4% ,则粮食亩产指数为 。 2.某省2013年与2012年相比,用同样多的人民币只能购买原有商品的95% ,则物价指数为 。 3.将同度量因素固定在基期的指数称为 氏指数。 4.实际应用中,计算价格综合指数要选数量指标为权数,并将其固定在 期。 5.结构影响指数的计算公式为 。 四、判析题 1.统计指数的本质是对简单相对数的平均。(T ) 2.在编制综合指数时,虽然将同度量因素加以固定,但是,同度量因素仍起权数作用。(T ) 3.在编制总指数时经常采用非全面统计资料仅仅是为了节约人力、物力和财力。(错 ) 4.拉氏数量指数并不是编制数量指标综合指数的惟一公式。(T ) 5.在平均指标变动因素分析中,可变构成指数是专门用以反映总体构成变化影响的指数。(错 ) 6.在由3个指数构成的指数体系中,两个因素指数的同度量因素指标时期是不同的。(T ) 7.价格降低后,同样多的人民币可多购商品15%,则价格指数应为85%。(错 ) 8.固定权数的平均数指数公式在使用时,数量指标指数和质量指标指数有不同的公式。( ) 9.说明现象总的规模和水平变动情况的统计指数是数量指数。( ) 五、简答题 1.平均指数的基本含义和计算形式是什么? 2.平均指数和综合指数计算结论相同的条件是什么? 六、计算题 1.某厂三种产品的产量情况如下:试分析出厂价格和产量的变动对总产值的影响 产品 计量 出厂价格(元) 单位 基期 报告期 产量 基期 报告期 25 / 43 A B C 件 个 公斤 8 10 6 8.5 11 5 13500 15000 11000 10200 4000 4800 2.某企业产品总成本和产量资料如下:试计算总成本指数.产量指数及产品单位成本总指数 3.某集团公司销售的三种商品的销售额及价格提高幅度资料如下: 商品种类 单位 甲 乙 丙 试求价格总指数和销售额总指数。 4.某集团公司销售的三种商品的销售额及价格降低百分比资料如下: 商品 计量单位 甲 乙 丙 试求价格总指数和销售量总指数。 5.某企业生产某产品的总成本和产量资料如下: 产品种类 产量 基期 报告期 1000 2000 1500 2800 基期总成本(万元) 件 台 套 销售额(万元) 上月 4 20 18 本月 5 18 21 价格降低% 3 2 1 条 件 块 商品销售额(万元) 基期 10 15 20 报告期 11 13 22 价格提高% 2 5 0 产品名称 A B C 总成本(万元) 基期 50 30 10 报告期 60 45 12 产量增加(+)或减少(-)% +10 +20 -1 A B 50 80 试求产量总指数以及由于产量增长而增加的总成本绝对值。 6.某地区对两种商品的收购量和收购额资料如下 商品 A B 试求收购量总指数和收购价格总指数。 7.某公司下属三个厂生产某种产品的情况如下: 一厂 二厂 单位产品成本(元) 产量(吨) 上月 960 1010 本月 952 1015 上月 本月 4650 4930 3000 3200 收购额(万元) 基期 200 50 收购量 报告期 基期 报告期 220 70 1000 400 1050 800 26 / 43 三厂 1120 1080 1650 2000 根据上表资料计算可变组成指数.固定组成指数和结构影响指数,并分析单位成本水平和产量结构变动对总成本的影响。 27 / 43 答案部分 第1章 导论 一、单选: 1.D 2.D 3.C 4.B 5.B 6.C 7.A 8.C 9.C 10.D。 二、多选: BD BC BDE。 三、判断:×,统计运用大量观察法的目的是消除个别事物的差异,显现想象总体的数量特征。只要部分单位对总体有代表性,只要对足够多的总体单位进行观察,也能达到这个目的。 四、简答: 1.答:总体是电视台覆盖范围内的所有成年观众;总体单位是电视台覆盖范围内的每一位成年观众;样本是受到电话采访的所有成年观众。 2.答:总体是所有在6:30看到广告的观众;总体单位是每一位在6:30看到广告的观众;样本是受到电话采访的观众。 3.答:(1)区别: 指标 说明总体综合数量特征的 ①说明的对象不同 标志 说明各单位特征的 指标 只能用数值表示(无论是数量指标,还是质量指标) ②可量性不同 标志 数量标志可用数表示,品质标志不可用数来表示,只能用文字描述。 (2)联系: ①许多统计指标的数值是由总体单位的数量标志汇总而来的;标志是指标的基础,统计指标的数值是总体单位标志值的汇总。 ②在一定条件下,指标与标志存在着变换关系。如果原来的总体变成总体单位时,则相应的指标也就转化成了标志。 第2章 数据的搜集 一、单选:1.A 2.D 3.C 4.D 5.D 二、多选:1.BDE 2.ABCDE 3.BCE 三、简答: 1.答:选取调查单位的方式不同;调查的目的和作用不同;对代表性误差的处理不同。 2.答:抽样调查,理由略。 3.答:(1)普查:周期性;数据准确;规定统一时间;范围比较窄等; (2)抽样调查:经济性;时效性强;适应面广;准确性高等等。 第3章 数据的图表展示 一、单选:1.B 2.C 3.D 4.B 5.B 6.A 7.B 8.C 9.D 10.B。 二、多选:1.AB 2.ACE 三、 简答: 1.答:主要有单变量值分组,这种分组方法通常只适合于离散变量,且在变量值较少的情况下使用;在连续变量或变量值较多的情况下,通常采用组距分组,它是将全部变量值依次划分成若干个区间, 并将这一区间的变量作为一组。 2.答: (1)条形图用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数多少, 矩形高度表示每一组的频数或频率,宽度表示各组组距,宽度和高度均有意义。 (2)直方图的各矩形通常是连续排列;条形图则是分开排列。 (3)条形图主要用于分类数据;直方图主要用于数值型数据。 3.答:茎叶图是由“茎”“叶”两部分组成.反映原始数据分布的图形,其图形是由数字组成。通过茎叶图,可以看数据的分布形状及数据的离散状况,与直方图相比,茎叶图既能给出数据的分布状况,又能给出一个原始数据,即保留了原始数据的信息,而直方图不能给出原始数值。 28 / 43 4.答: 数据类型 1.定类数据 2.序序数据 特 征 分类 分类 排序 分类 排序 有基本测量单位 0和负值均有意义 分类 排序 有基本测量单位 有绝对零点,而无负值 运算功能 计数 计数 排序 计数 排序 能加减,不能乘除 计数 排序 能加减乘除 举 例 产业分类,性别 企业等级 3.定距数据 年份,摄氏温度 4.定比数据 四、应用: 1.解:(1) 组距 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100 100 合计 141210商品销售额,绝对温度 频数 2 1 2 2 13 8 12 9 1 50 百分比(%) 4.00 2.00 4.00 4.00 26.00 16.00 24.00 18.00 2.00 1 131298累积百分比(%) 4.00 6.00 10.00 14.00 40.00 56.00 80.00 98.00 100.00 频8数64220122100~10000000~3~4~5~6~7~820304050607080按分数分组 (2) 茎 2 3 4 5 6 7 29 / 43 叶 4 9 4 5 8 3 6 90~9100 频数 2 1 2 2 8 占总数的比重 4.00% 2.00% 4.00% 4.00% 26.00% 16.00% 0 2 3 4 4 5 6 7 8 9 9 9 9 13 1 4 4 5 5 6 9 9 8 9 10 1 1 1 2 3 3 4 4 4 5 8 8 0 1 1 2 4 4 5 8 9 0 12 9 1 50 24.00% 18.00% 2.00% 1.00 合计 第4章 数据的概括性度量 一、单选: 1.C 2.B 3.A 4.C 5.C 6.A 7.A 8.B 9.A 10.B 11.B 12.B,13.C 14.A 15.B 16.B 17.B 18.D 19.C 20.B 二、多选:1.AC 2.ACE 3.BCE 4.ABCD 三、填空: 1. (1)77 (2)83 (3)80.5 (4)68.5 (5)87.25 (6)18.75 (7)0.173。 (8)左偏,(9)中位数,(10)是顺序数据又明显左偏 2.(1)右偏; (2)中位数,数据分布明显右偏,频数较多的几个组家庭百分比相差不大; (3)均值,300~400,400~500。 四、判断: 1.√,任意一个变量数列都可以计算算术平均数和中位数,但众数的计算和应用则是又条件的,对于呈均匀分布.U形分布或J形分布的数列,众数就不存在或没有意义,此外对于总体单位数不多的情况,众数也缺乏代表性。 150?0.3?180?0.32?200?0.35?210?0.36248.2==33.54%。 150?180?200?210740100%?55% 3.×,劳动生产率计划完成程度为==95.45%。 100%?100% 2.×,应为 4.√,均值是一组数列的集中趋势,所有的观察值以450为中心,有的比它大,有的比它小。 五、简答: 1.答:众数是一组数据中出现最多的变量值,是位置代表值,不受极端值的影响,适合于作为分类数据的集中趋势测度值;中位数是一组数据经过排序后,处于中间位置的变量值,是位置代表值,不受极端值的影响,适合于作为顺序数据的集中趋势测度值;均值是一组数据相加后除以数据个数而得到的结果,利用了全部数据信息,主要适用于数值型数据,当数据呈对称分布或接近对称分布时,应选择均值作为集中趋势代表值,但易受极端值的影响,对于偏态分布数据,考虑选择众数或中位数等位置代表值。 2.答:虽然两个组平均数即两个企业的平均成本不变,但由于两个企业产量占公司总产量的比重(权数) 发生了变化,所以总平均数就会变化。由于单位成本较低的甲企业的产量所占比重上升而单位成本较高的乙企业产量比重相应相应下降,这种变化必然导致总平均数下降。 3.答:(1)2050;(2)品质型;(3)百分比;(4)164。 六、计算: 1.解:根据几何平均数公式计算职工工资平均增长指数W和平均消费价格指数C为: W=101.185?1.248?......?1.11=1.137 C=101.064?1.147?......?1.007=1.069 可以看出W>C,因此1992年到2001年间职工工资平均增长速度快于居民消费价格的平均增长速度。 2.解:(1)R=32;x=48.333;σ=82.444;σ=9.0799; 2 (2)Vσ甲=0.188,Vσ乙=0.24。可见两地区空气质量指数的平均水平很接近,甲地区微微优于乙地 区;而从标准差或标准差系数来看,甲地区空气质量状况更稳定。总的来说,甲地区空气质量状况较好。 3.解:(1)x原品种=294元 x改良品种=272元; 原品种牛的利润总额=294×600=176400元; 30 / 43 改良品种牛的利润总额=272×750=204000元; 所以应该选择改良品种牛。 若改良品种牛的平均利润少于235.2(176400÷750)元时,牧场主会选择原品种牛。 第5章 概率与概率分布 一、单选:1.A 2.D 3.B 4.C 5.D 二、多选:1.ABE 2.ABCE 三、判断: 1.×。当观察次数n很大时,随机事件发生的频率的稳定值就是概率,频率可作为概率的近似值。但是并不能认为概率就是频率的极限。因为当n很大时,频率稳定地在概率附近摆到,二者出现显著偏差的可能性极小,但并不意味着二者的偏差肯定越来越小。 2.×。中奖的概率为5?,意味着在试验次数非常多的情况下,平均每1000注彩票大约有5注会中奖。并不意味着每1000注彩票必然有5注中奖。 四、简答: 全概率公式:某一事件B的发生有各种可能的原因Ai(i=1,2,?,n),每一Ai都可能导致B发生,求B发生的概率。 逆概率公式:在事件B已发生的条件下,寻找导致A发生的每个原因Ai的概率。 五、计算: 1.(1)P{X<500}=Φ( 500?1050)=Φ(-2.75) 200=1-Φ(2.75)=1-0.99702=0.00298 (2)P{850≤X≤1450}=Φ( 1450?1050850?1050)- Φ() 200200=Φ(2)- Φ(-1)=0.97725-0.15865=0.8186 (3)由标准正态函数分布表可知,P{|Z|≤1.96}=0.95,即有: P{|Z|=| X?1050|≤1.96}= P{|X-1050|≤392}=0.95 200所以95%的灯管的使用寿命在均值左右392小时(658~1442小时)的范围内。 第6章 统计量及其抽样分布 一、单选:1.A 2.C 3.C 4.B 5.A 二、判断:1.√ 2.× 3.× 4.× 三、1.重复抽样:?x???1700(公斤);?x??n?200?63.25 10不重复抽样:?x???1700(公斤);?x?2.x~N(?,?nN?n200100?10??60.30 N?110100?1?n),即x~(90,27), 36p(x?100)?p(3.解:p~N(?,x?90100?90?)?1?p(z?2.2)?1?0.986097?0.013903 4.54.58%(1?8%)),即p~N(0.08,0.027) n1000.07?0.080.09?0.08p(7%?p?9%)?p(?p?)0.0270.027?p(?0.37?p?0.37)?2(p?0.37)?1?2?0.644309?1?0.2886 )即p~N(8%,31 / 43 ?(1??) 第7章 参数估计 一、单选:1.B 2.D 3.C 4.A 5.C 6.C 7.B 8.D 9.A 10.A 二、多选:1.ADE 2.ADE 3.BCE 三、填空:(1)简单随机抽样,(2)分层抽样,(3)整群抽样,(4)系统抽样,(5)多阶段抽样;(6)分层 抽样,(7)不用调查单位的名单,以院系为单位,而且各院系的消费差异也大,不宜用整群抽样。 四、简答: 1.答:都要事先按某一标志对总体进行划分的随机抽样。不同在于:分层抽样的划分标志与调查标志有关,而整群抽样不是;分层抽样在层内随机抽取一部分,而整群抽样对一部分群做全面调查。分层抽样用于层间差异大而层内差异小,以及为了满足分层次管理决策时;而整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时。 2.答:简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这 时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。 五、计算: 1.解:n=10,小样本 (1)方差已知,由x±zα/2 (2)方差未知,由x±tα/2 ?nsn得,(494.9,501.1) 得,(493.63,502.37) 22z?(1?p)1.6448?0.5?0.5/2?p? 2.解:n===1691 220.02?x 3.解:(1)x±tα/2 sn=6.75±2.131× 2.25 (2)边际误差E= tα/2 sn=2.131× 162.2516=(5.55,7.95) =1.2 22z?1.962?2.52/2?? n===17 22E1.2 第8章 假设检验 一、单选:1.C 2.C 3.B 4.A 5.B 二、多选:1.CD 2.CE 三、判断: 1.×。“拒绝原假设”只能说明统计上可判定总体均值不等于100,但并不能说明它与100之间的差距大。 2.×。要检验的总体参数应该是一个比重,因此应该将男孩和女孩的人数的比率转换为失学儿童中女孩所占的比例P(或男孩所占的比例P*)所以原假设为:H0:P=3/4(或P≤3/4);H1:P>3/4。 也可以是:H0:P*=1/4(或P≥1/4);H1:P*<1/4。 四、简答: (1)H0:x≥350;H1:x<350。 (2)针对上述假设,犯第一类错误时,表明新方法不能降低生产成本,但误认为其成本较低而被投入使用,所以此决策错误会增加成本。犯第二类错误时,表明新方法确能降低生产成本,但误认为其成本不低而未被投入使用,所以此决策错误将失去较低成本的机会。 五、计算: 1.(1)H0:μ=120;H1:μ≠12。 (2)检验统计量:Z= 32 / 43 x??0 ?/n 。在α=0.05时,临界值zα/2=1.96,故拒绝域为|z|>1.96。 (3) 当x=12.25克时,Z= x??0 ?/n x??0 = 12.25?120.6/2511.95?120.6/25=2.08。 由于|z|=2.08>1.96,拒绝H0:μ=120;应该对生产线停产检查。 (4) 当x=11.95克时,Z= ?/n ==-0.42。 由于|z|=-0.42<1.96,不能拒绝H0:μ=120;不应该对生产线停产检查。 第9章 分类数据分析 一、单选:1.C 2.A 3.B 4.D 5.A 6.A 7.D 8.(1)B (2)B (3)D (4)A (5)A (6)B (7)A (8)A (9)C 9.A 10.A 11.C 12.B 二、简答: 1.答:在?2检验的理论公式?2???A?T?T2中,A为实际频数,T为理论频数。根据检验假设H0:π1 =π2,若H0 成立,则四个格子的实际频数A与理论频数T相差不应很大,即?2统计量不应很大。若?2值很大,即相对应的P值很小,比如P≤a,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。 2.答:R?C表?2检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。 3.答: (1)条件百分表的方向。通常情况下,变量在列联表中的位置是任意的,但如果变量X与Y之间存在因果关系,则令X为自变量,通常放在列的位置,Y为因变量,通常放在行的位置。条件百分表也多按照变量的方向计算。 (2)?分布的期望频数准则。在对?分布进行独立性检验时,要求样本容量必须足够大,特别是每个单位中的期望频数不能过小,必须注意两个准则: 准则一:如果只有两个单元,每个单元的期望频数必须是5或5以上; 2f?e准则二:对于两个以上的单元,如果20%的单元期望频数小于5,则不能应用检验。这可以采用合并一 22些单元的方式解决。 4.(1)方差分析是通过检验各样本总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。涉及两个类型的变量,分类型的自变量和数值型因变量。它通过对数据误差来源的分析以判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。这种误差一方面来源于组内误差,主要是不同水平(或处理)内的样本随机性所造成的;另一方面来源于组间误差,主要体现为不同水平之间的数据误差,这可能是由于抽样本身随机误差形成的,也可能是不同水平间的系统性因素造成的系统误差。 (2)列联分析是利用列联表来分析变量之间关系的一种统计方法,主要是借助于?统计量对列联表中变量间的相关性进行检验,仅仅涉及到分类型变量以及相关的频数分布。主要是借助于真实频数和期望频数之间的差异情况来计算?统计量,与给定显著性水平下的?临界值比较,以判断各类型的分布之间是否存在差异性。 三、计算: 1.解:根据题意提出假设, 222H0:各数字出现的比例是一致的 H1:各数字出现的比例是不一致的 33 / 43 计算?2统计量, f0 21 15 13 17 19 15 fe 100/6 100/6 100/6 100/6 100/6 100/6 (f0?fe)21.127 0.167 0.807 0.007 0.327 0.167 fe ?2 2.602 (f0?fe)2=2.602 ???fe22给定显著性水平??0.05,查自由度为5的?2分布表,得临界值?0.05(5)?11.071。 另一方法,就是利用Excel中的函数=CHIDIST(?2,自由度)计算p-值为0.7614。 2由于?2??0.05(5)?11.071或p-值大于显著性水平,故不拒绝原假设,说明各数字出现的比例是一致的,这 也就说明此骰子是公平的,所出现的频数差异是由于投掷的随机性造成的。 2.根据题意提出假设, H0:样本与期望比例一致(或,0.15,0.3,0.5,0.05是消费者的购买概率) H1:样本与期望比例不一致(或,0.15,0.3,0.5,0.05不是消费者的购买概率) 计算?2统计量, f0 120 320 500 60 2fe 150 300 500 50 (f0?fe)26 1.333 0 2 fe ?2 9.333 (f0?fe)2=9.333 ???fe2给定显著性水平??0.05,查自由度为3的?2分布表,得临界值?0另一方法,就是利用Excel.05(3)?7.815。 中的函数=CHIDIST(?,自由度)计算p-值为0.025。 2由于?2??0.05(3)?7.815或p-值小于显著性水平,故拒绝原假设,说明样本与期望分布不一致。 23.(1)根据题意提出假设, H0:学生态度与所在年级无关,即各年级的态度比例一致; H1:学生态度与所在年级有关,即各年级的态度比例不一致 计算?统计量,??2.447。 2给定显著性水平??0.05,查自由度为3的?2分布表,得临界值?0.05(3)?7.815。 22另一方法,就是利用Excel中的函数=CHIDIST(?,自由度)计算p-值为0.4850 第10章 方差分析 2一、单选:1.D 2.A 3.C 4.C 二、多选:1.ACE 2.ABD 3.BE 4.AD 三、填空: 1.独立、方差 34 / 43 2.总变差平方和=组间变差平方和+组内变差平方和。 3.数量型变量,品质型变量,数量型变量。 4.正态总体均值 5.因子,水平或处理。 6.组间、组内 7.m-1, n-m。 四、计算题 1.解: 根据计算结果列出方差分析表 方差来源 组间 组内 总和 2.解: 根据计算结果列出方差分析表 方差来源 组间 组内 总和 离差平方和 14245.83 43950 58195.83 自由度 3 20 23 均方差 4748.61 2197.5 F值 2.16 离差平方和 0.001053 0.000192 0.001245 自由度 2 12 14 均方差 0.00052661 0.00016 F值 32.92 因为 (2,12)=3.89<32.92,故拒绝 ,认为各台机器生产的薄板厚度有显著差异。 因为 (3,20)=3.10>2.16,故接受 ,即四种配方的饲料对小鸡的增重没有显著的差异。 3.解:各总值均值间有显著差异。 4.解:差异不显著。 第11章 一元线性回归 一、单选: 1.D 2.A 3.B 4.A 5.C 6.A 7.B 8.C 9.B 10.C 11.A 12.A 13.B 14.A 15.C 16.A 二、多选: 1.ABD 2.AE。 三、判断: 1.×。这种正相关是因为二者同时受到疾病的严重程度的影响所致。 2.√。因为用最小平方法在现有资料范围内配合的最佳方程,推到资料范围外,就不一定是最佳方程。 四、简答: 1.答:变量之间存在的不确定的数量关系为相关关系,可能还会有其他很多较小因素影响;特点是一个变量 的取值不能由另一个变量唯一确定。 2.答:变量性质不同,相关分析不必区分自变量和因变量,而回归分析必须区分;作用不同,相关分析用于 测度现象之间有无相关关系、关系方向、形态及密切程度,而回归分析是要揭示变量之间的数量变化规律。 五、计算: 1.解:(1) 10年5薪002468受教育年数35 / 43 101214 (2)建立线性回归方程y??0??1x,根据最小二乘法得: ?1?????n?xiyi??xi?yin?x?(?xi)2i2?;?0??y?ni??1??xn?i 由此可得?1=0.732,?0=-2.01,则回归方程是y=-2.01+0.732x (3)当受教育年数为15年时,其年薪的点估计值为: ??y=-2.01+0.732×15=8.97(万元) 估计标准误差: Sy= ?(y?i2?yi)n?2?= SSE=MSE=0.538=0.733 n?2 置信区间为:y?t?/2Sy(x0?x)21 ?nn?(xi?x)2i?121(15?6.917) =8.97±2.228×0.733× ?12120.9167 =8.97±1.290 预测区间为:y?t?/2Sy?(x0?x)21 1??nn?(xi?x)2i?121(15?6.917) =8.97±2.228×0.733×1? ?12120.9167 =8.97±2.081 ????x,根据最小二乘法得: ??? 2.解:(1)建立线性回归方程y011??n?xiyi??xi?yi???22?1nx?(x)??ii? ? ?yi??xi?????1??0?nn? 由此可得?0=0.0093,?1=0.316,则回归方程是y=0.0093+0.316x (3)当GDP达到16时,其货币供应量的点估计值为: ????y=0.0093+0.316×16=5.065亿元 估计标准误差: Sy= ?(y?i2?yi)n?2?= SSE=MSE=0.09294=0.305 n?2 置信区间为:y?t?/2Sy(x0?x)21 ?nn?(xi?x)2i?1 36 / 43 21(16?11.711) =5.065±2.228×0.305× ?12135.21863 =5.065±0.318亿元 预测区间为:y?t?/2Sy?(x0?x)21 1??nn?(xi?x)2i?121(16?11.711) =5.065±2.228×0.305×1? ?12135.21863 =5.065±0.750亿元 第12章 多元线性回归 一、单选:1.D 2.B 3.C 4.B 5.C 6.C 7.D 8.C 9.C 10.D 11.C 12.A 13.D 二、多选:1.ABC 2.ABCD 3.BCD 4.ACDE 5.BCD 6.BC 7.AD 三、简答: 1.答:(1)随机误差项的期望为零,即E(ut)?0。(2)不同的随机误差项之间相互独立,即(3)随机误差项的方差与t无关,为一个常数,即cov(ut,us)?E[(ut?E(ut))(us?E(us)]?E(utus)?0。 (4)随机误差项与解释变量不相关,即cov(xjt,ut)?0??(j?1,2,...,k)。通常var(ut)??2。即同方差假设。 假定xjt为非随机变量,这个假设自动成立。(5)随机误差项ut为服从正态分布的随机变量,即ut2N(0,?2)。 (6)解释变量之间不存在多重共线性,即假定各解释变量之间不存在线性关系,即不存在多重共线性。 2. 答:因为人们发现随着模型中解释变量的增多,多重决定系数R的值往往会变大,从而增加了模型的解释功能。这样就使得人们认为要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等。为此用修正的决定系数来估计模型对样本观测值的拟合优度。 3. 答:R2e/n?k?1?,其作用有:(1)用自由度调整后,可以消除拟合优度评价中解释变量?1??(y?y)/n?12t2t多少对决定系数计算的影响;(2)对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较。 4. 答:常见的非线性回归模型主要有: (1) 对数模型lnyt?b0?b1lnxt?ut (2) 半对数模型yt?b0?b1lnxt?ut或lnyt?b0?b1xt?ut 111?u或?b0?b1?u xyx(4) 多项式模型y?b0?b1x?b2x2?...?bkxk?u KK?b0b1t(5) 成长曲线模型包括逻辑成长曲线模型yt?和Gompertz成长曲线模型yt?e 1?b0e?b1t(3) 倒数模型y?b0?b15. 答:①系数呈线性,变量非线性;②系数呈线性,变量非呈线性;③系数和变量均为非线性;④系数和变量均为非线性。 6. 答:①系数呈线性,变量非呈线性;②系数非线性,变量呈线性③系数和变量均为非线性;④系数和变量均为非线性。 四、计算: 1. 解答:(1)这是一个对数化以后表现为线性关系的模型,lnL的系数为1.451意味着资本投入K保持不变时劳动—产出弹性为1.451 ;lnK的系数为0.384意味着劳动投入L保持不变时资本—产出弹性为0.384. (2)系数符号符合预期,作为弹性,都是正值。 2. 解答:该消费模型的判定系数R?0.95,F统计量的值F?107.37,均很高,表明模型的整体拟合程度很高。 计算各回归系数估计量的t统计量值得:t0?8.133?8.92?0.91,t1?1.059?0.17?6.10 37 / 43 2t2?0.452?0.66?0.69,t3?0.121?1.09?0.11。除t1外,其余T值均很小。工资收入W的系数t检验 值虽然显著,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为1.059意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。另外,尽管从理论上讲,非工资—非农业收入与农业收入也是消费行为的重要解释变量,但二者各自的t检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。 3. 解答: (1)R?1?(2)R?1?22n?18?1(1?R2)?1??(1?0.75)?0.65 n?k?18?2?19?1?(1?0.35)??0.04 9?3?131?12?(1?0.95)?0.94 (3)R?1?31?5?14. 解答:当b1?b2?1时,模型变为yt?x2t?b0?b1(x1t?x2t)?ut,可作为一元回归模型来对待 b1?n?(x1t?x2t)(yt?x2t)??(x1t?x2t)?(yt?x2t)n?(x1t?x2t)?(?(x1t?x2t))22 当b1?b2时,模型变为yt?b0?b1(x1t?x2t)?ut,同样可作为一元回归模型来对待 b1?n?(x1t?x2t)yt??(x1t?x2t)?ytn?(x1t?x2t)?(?(x1t?x2t))22 5. 解答:(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。 (2)出现不同符号的原因很可能是由于X2与X3高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。 6. 解答:(1)x1i是盒饭价格,x2i是气温,x3i是学校当日的学生数量,x4i是附近餐厅的盒饭价格。 (2)在四个解释变量中,附近餐厅的盒饭价格同校园内食堂每天卖出的盒饭数量应该是负相关关系,其符号应该为负,应为x4i;学校当日的学生数量每变化一个单位,盒饭相应的变化数量不会是28.4或者12.7,应该是小于1的,应为x3i;至于其余两个变量,从一般经验来看,被解释变量对价格的反应会比对气温的反应更灵敏一些,所以x1i是盒饭价格,x2i是气温。 第13章 时间序列分析和预测 一、单选:1.D 2.C 3.C 4.C 5.D 6.D 7.D 8.B 9.C 10.C 11.B 12.B 13.C 14.A 15.D 16.D 17.C 18.B 19.C 20.A 21.C 22.C 二、多选:1.CDE 2.CDE 3.ACE 4.ACDE 5.BC 6.CD 7.AD 三、判断: 1.× 2.× 3.√ 4.× 5.× 6.√ 7.× 8.× 9.× 10.× 11.√ 12.× 13.× 14.× 四、计算: 1. 解:商品流通费用率(c)=商品流通费用总额(a)/商品纯销售额(b) c商品流通费用率(%) a商品流通费用额(百元) b商品纯销售额(百元) 1月 3.50 9.86 281.71 7月 3.02 11.84 392.05 2月 2.99 8.78 293.65 8月 4.00 10.96 274.00 3月 2.95 8.50 288.14 9月 3.75 11.58 308.8 4月 2.98 9.91 332.55 10月 3.27 7.86 240.37 5月 4.58 11.05 241.27 11月 3.95 8.05 203.80 6月 3.81 12.00 314.96 12月 4.58 10.00 218.34 c商品流通费用率(%) a商品流通费用额(百元) b商品纯销售额(百元) 38 / 43 ∑a=120.39 ∑b=3389.64,c2.解: c定期储蓄存款占全国储蓄存款总额的% a 定期储蓄存款 (亿元) ??a?120.39=3.55% ?b3389.6402年底 78.25 16838.7 21519.1 03年底 80.16 23778.2 29663.4 04年底 80.15 30873.4 38519.5 05年底 78.28 36226.7 46278.4 06年底 78.25 41791.6 53407.8 07年底 75.40 44955.1 59622.1 b全国储蓄存款总额(亿元) 16838.744955.1?23778.2?30873.4?36226.7?41791.6?163655.822a56?1c?===78.47% 208439.721519.159622.1b?29663.4?38519.5?46278.4?53407.8?5226?13.解:10(1?5%)?(1?8%)?(1?10%)?(1?12%)-1=1.0877-1=8.77% 4.解: 2003年 2004年 2005年 2006年 2007年 平均 季节比率(%) 704 94.43 792 106.24 830 111.33 656 87.99 一季 二季 三季 四季 平均 747.5 737.5 762.5 725.0 755.0 745.5 100.00 2332 年份 2003年 2004年 2005年 2006年 2007年 2008年 平均季度工作量 747.5 737.5 762.5 725.0 755.0 —— 指数平滑预测值(初始值747.5,α=0.1) ———— 0.1*747.5+0.9*747.5=747.5 0.1*737.5+0.9*747.5=746.5 0.1*762.5+0.9*746.5=748.1 0.1*725.0+0.9*748.1=745.8 0.1*755.0+0.9*745.8=746.7 2008年1季度 746.7*94.43%=705.1(百元) 2008年2季度 746.7*106.24%=793.3(百元) 2008年3季度 746.7*111.33%=831.3(百元) 2008年4季度 746.7*87.99%=657.0(百元) 第14章 指数 一、单选 1.C 2.C 3.B 4.A 5.A 6.B 7.D 8.A 9.C 10.D 11.A 12.C 13.C 14.D 15.A 16.B 17.B 18.D 19.D 20.B 21.B 22.D 二、多选 1.CDE 2.ACD 3.AD 4.AC 5.ABD 6.CDE 7.CD 三、填空 xf?f?1.119.79%;2.105.26%;3.拉氏;4.报告;5.k??xf?f010010 四、判断 39 / 43 1.√ 2.√ 3.× 4.√ 5.× 6.√ 7.× 8.√ 9.× 五、简答 1.平均指数的基本含义和计算形式是什么? 答案:平均指数是从个体指数出发来编制总指数的,即先计算出各种产品或商品的数量指标或质量指标的个体指数, 然后进行加权平均计算,来测定现象的总变动程度。 平均指数的计算形式为算术平均数指数和调和平均数指数。 2.平均指数和综合指数计算结论相同的条件是什么? 答案:当数量指标的算术平均数指数,在采用基期总值为权数的特定情况下,与一般综合指数的计算结论相同;当 质量指标的调和平均数指数,在采用报告期总值为权数的特定情况下,与一般综合指数的计算结论相同。 六、计算 1. ?pq????????263700?108.97%pq242000总产值指数=? ?pq??pq?263700?242000?21700元 ?pq????????250800?103.65%pq242000产量指数=? ?pq??pq?250800?242000?8800元 ?pq????????263700?105.14%pq250800出厂价格指数=? ?pq??pq?263700?250800?12900元 1100110001000100110111012. 总成本指数??qp?60?45?12?130%?qp50?30?12 Kqp1.1?50?1.2?30?0.9?10?产量总指数???112.11%qp50?30?10? 11000000单位成本总指数=总成本指数÷产量总指数=130%÷112.11%=115.96% 3. 价格总指数??qpqp?k1111?11?13?22?101.861322??10250% 销售额总指数?4. ?qp?qp10111110?11?13?22?102.22?15?20 qp?价格总指数?qp?k?5?18?21?98.37Q821??97??% 销售量总指数=销售额总指数÷销售价格总指数 ?qpqp销售量总指数=?1010?98.37%?5?18?21?98.37%?106.5%4?20?18 5. 40 / 43 15002800?50??80Kq0p01000?2000产量总指数???143.85%qp50?80?00由于产量变动而增加的总成本绝对数: ?kq0p0??q0p0?187?130?57(万元) 1050800?20??50Kq0p01000?400??124% 6.收购量总指数?200?50?q0p0收购价格总指数 =收购额总指数÷收购量总指数 ?qp?qp1110?220?70?124%?116%?124%?93.55 0?5011 x?7.可变组成指数= ?xf/?f101f/?f110????????1490.761490.76??147.98% 10204800/101301007.3815101360/101301490.76??148.41% 9342000/93001004.521007.38?100.2804.52 1490.76—1400.52=486.24 元 xf/?f?固定组成指数= ?xf/?f1100???????? 1490.76—1007.38=483.38元 ?xx结构影响指数=?010f0/?f0f/?f1???????? 1007.38—1004.52=2.86元 41 / 43