统计学习题及参考答案
第一章 绪 论
一、 单项选择题
1、在整个统计工作过程中处于基础地位的是( )
A、统计学 B、统计数据搜集 C、统计分析 D、统计数据的整理 2、统计学的核心内容是( )
A、统计数据的搜集 B、统计数据的整理 C、统计数据的发布 D、统计数据的分析
3、某班三名学生期末统计学考试成绩分别为78分、84分和95分,这三个数字是( )
A、指标 B、标志 C、变量 D、变量值 4、某管理局有20个下属企业,若要调查这20个企业全部职工的工资收入情况,则统计总体为( )
A、20个企业 B、20个企业的每个职工
C、20个企业的全部职工 D、20个企业每个职工的工资 5、现代统计学的主要内容是( )
A、描述统计 B、理论统计 C、应用统计 D、推断统计 6、( )是整个统计学的基础。
A、理论统计 B、描述统计 C、推断统计 D、应用统计
二、多项选择题
1、统计学( )
A、主要特征是研究数据 B、研究具体的实际现象的数量规律 C、研究方法为演绎与归纳相结合 D、研究抽象的数量规律 E、研究有具体实物或计量单位的数据 2、数学( )
A、为统计理论和统计方法的发展提供数学基础 B、研究具体的数量规律 C、研究抽象的数量规律 D、研究方法为纯粹的演绎 E、研究没有量纲或单位的抽象的数 三、填空题
1、_________和_________是统计方法的两个组成部分。 2、统计过程的起点是_________,终点是探索出客观现象内在的______________。 3、统计数据的分析是通过___________和___________的方法探索数据内在规律的过程。 四、联系实际举例说明,为什么统计方法能够通过对数据的分析找出其内在的规律性?(要求举三个例子且不与教科书上的例子雷同)
第二章 统计数据的搜集与整理
1
一、单项选择题
1、某种产品单位成本计划比基期下降3%,实际比基期下降了3.5%,则单位成本计划完成相对数为( ) A、116.7% B、100.5% C、85.7% D、99.5% 2、计算结构相对数时,总体各部分数值与总体数值对比求得的比重之和( )
A、小于100% B、大于100% C、等于100 %: D、小于或大于100% 3、将全班学生划分为“男生”和“女生”,这里采用的数据计量尺度位( ) A、定比尺度 B、定距尺度 C、定类尺度 D、定序尺度
4、将全班学生期末统计学考试成绩划分为优、良、中、及格、不及格,这里采用的数据计量尺度为( )
A、定类尺度 B、定距尺度 C、定序尺度 D、定比尺度 5、昆明市的温度为260C与景洪市的温度310C相差50C,这里采用的数据计量尺度位( )
A、定距尺度 B、定类尺度 C、定比尺度 D、定序尺度
6、张三的月收入为1500元,李四的月收入为3000元,可以得出李四的月收入是张三的两倍,这里采用的数据计量尺度位( )
A、定序尺度 B、定比尺度 C、定距尺度 D、定类尺度
7、一次性调查是指( )
A、只作过一次的调查 B、调查一次,以后不再调查 C、间隔一定时间进行一次调查 D、只隔一年就进行一次的调查
8、在统计调查中,调查单位和填报单位之间( )
A、无区别 B、是毫无关系的两个概念
C、不可能是一致的 D、有时一致,有时不一致
9、下列中,属于品质标志的是( )
A、工人年龄 B、工人性别 C、工人体重 D、工人工资
10、商业企业的职工人数、商品销售额是( )
A、连续变量 B、前者是连续变量,后者是离散变量 C、前者是离散变量,后者是连续变量 D、离散变量 11、对昆明市所有百货商店的工作人员进行普查,调查对象是( ) A、昆明市所有百货商店 B、昆明市所有百货商店的全体工作人员 C、昆明市的一个百货商店 D、昆明市所有百货商店的每一位工作人员
2
12、在全国人口普查中,调查单位是( )
A、全国人口 B、每一个人 C、每个人的性别 D、每个人的年龄
13、对某城市工业企业的设备进行普查,填报单位为( )
A、全部设备 B、每台设备 C、每个工业企业 D、全部工业企业 14、某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是( )
A.普查 B、典型调查 C、抽样调查 D、重点调查
15、人口普查规定统一的标准时间是为了( )
A、避免登记的重复和遗漏 B、确定调查的范围 C、确定调查的单位 D、登记的方便 16、( )是对事物最基本的测度。
A、定序尺度 B、定比尺度 C、定类尺度 D、定距尺度
17、下列中,最粗略、计量层次最低的计量尺度是( )
A、定类尺度 B、定序尺度 C、定比尺度 D、定距尺度
18、下列中,计量结果只能进行加减运算的计量尺度是( )
A、定距尺度 B、定比尺度 C、定类尺度 D、定序尺度
二、多项选择题
1、某企业职工工资情况如下: 按月工资分组(元) 职工人数(人) 660——680 150 680——700 250 700——820 200 合 计 600 表中( ) A、变量是150、250、200 B、变量是660、680、700、820
C、工资是变量 D、变量有3个 E、组中值有3个 2、下列各项中,属于统计指标的是( )
A、某地区2004年GDP1000亿元 B、某工人月工资850元 C、某地
区2004年货物运输量2000万吨 D、某地区明年小麦预计产量21万吨 E、某地区去年人口自然增长率7?
3、抽样调查与重点调查的主要区别是( )
A、抽选调查单位的多少不同 B、抽选调查单位的方式方法不同 C、取得资料的方法不同 D、在对调查资料的使用时所发挥的作用不同 E、原始资料的来源不同
4、某地区进行工业企业的现状调查,则每一个工业企业是( )
A、调查对象 B、统计总体 C、调查单位 D、调查项目 E、填报单位
3
5、搜集统计数据的具体方法主要有( )
A、访问调查 B、邮寄调查 C、电话调查 D、座谈会 E、个别深度访问
6、某地区对集市贸易个体户的偷税漏税情况进行调查,1月5日抽选5%样本,5月1日抽选10%样本检查,这种调查是( )
A、非全面调查 B、一次性调查 C、定期调查 D、不定期调查 D、经常性调查
7、为了研究全国乡镇工业企业的发展情况,国家决定对全国乡镇工业企业进行普查,则每一个乡镇工业企业是( )
A、调查总体 B、调查单位 C、报告单位
D、调查对象 E、既是调查单位又是报告单位 8、在某一组距数列中( ) A、组数的确定应以能够显示数据的分布特征和规律为目的 B、组距大小与组数的多少成正比 C、组距大小与组数的多少成反比 D、组距宜取5或10的倍数 E、第一组的下限应低于最小变量值;最后一组的上限应高于最大变量值 三、 填空题
1、数量型统计数据通常有两种基本的形式,即__________和___________。 2、统计的原始数据都有一定的计量单位。绝对数的计量单位有__________、___________和_____________三种。
3、数字变量根据其取值的不同,可以分为___________和_____________。 4、离散变量只能取_________个值,而且其取值都以________断开,可以一一列举。
5、连续变量可以取________个值,其取值是___________的,不能一一列举。 6、从使用者的角度看,统计数据主要来源于两种渠道:一是来源于________________,二是来源于___________________。
7、根据对比的数量不同,相对数可分为_________和__________两种基本形式。 8、访问调查又称__________,它是调查者与被调查者之间通过________________而得到所需资料的调查方法。
9、在市场调查中,基本上都是采用_______调查方式,调查对象是确定_______框的基本依据。
10、调查表是用来登记调查数据的一种表格,一般由________、________和______________三部分组成。
11、调查时间包括_________________和___________________。
12、数据整理通常包括数据的________、____________、_______等几个方面的内容,它是__________之前的必要步骤。
13、数据的预处理是______________的先前步骤,内容包括数据的______与______、______等。
14、对于通过直接调查取得的原始数据应主要从_________和________两个方面去审核。
15、审核数据准确性的方法主要有____________和_____________。
16、对于其它渠道取得的第二手数据,除了对其_________和________进行审核外,还应着重审核数据的__________和___________。
4
17、按数量标志分组的方法主要有___________和_____________。 18、频数密度=_____________÷_________________。 19、闭口组组中值=(______+_______)÷2
20、直方图是用__________和__________来表示频数分布的图形
四、判断题
1、调查单位可以是调查对象的全部单位,也可以是调查对象的部分单位。( )
2、人口普查的调查单位是每一个人。( )
3、调查项目是调查的具体内容,它可以是调查单位的数量特征,也可以是调查单位的某种属性或品质特征。( )
4、消费者购买某种产品的动机的调查,常用“座谈会”调查方法。( ) 5、搜集与研究课题有密切关系的少数人员的倾向和意见,常用个别深度访问。( )
6、品质标志实际上就是定类尺度和定序尺度。( ) 7、数量标志实际上就是定距尺度和定比尺度。( ) 8、组距可以根据全部数据的最大值和最小值及所分的组数来确定。( ) 9、组数越多,数据分布越集中,组数越少,数据分布就越分散。( ) 10、组距分组时,为了解决“不重”问题,习惯上规定“上组限不在内”。( ) 11、若一个班的统计学考试成绩的最高分为99分,最低分为2分,则在组距分组时宜采用“××以下”和“××以上”这样的开口组。( ) 12、用组中值作为一组数据的代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧称对称分布。( )
13、从变量值小的一方向变量值大的一方累加频数,称为向下累计。( ) 14、从变量值大的一方向变量值小的一方累加频数,称为向上累计。( ) 15、人和动物的死亡率分布近似服从正态分布。( ) 16、经济学中的供给曲线呈现为正J型分布。( )
五、简答题
1、普查作为一种特殊的调查方式具有哪些特点? 2、组距分组需要经过哪几个步骤?
六、计算分析题 1、某行业管理局40个企业1999年的产品销售收入统计数据如下(单位:万元): 152 124 129 116 100 103 92 95 127 104 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120
136 117 108 97 88 123 115 119 138 112 146 113 126 要求:
① 对上面的数据资料进行适当的分组,编制频数分布表,并绘制频数分布的直方图和折线图。
② 根据频数分布表计算累计频数和累计频率。
③ 如果按企业成绩规定:销售收入在125万元以上为“先进企业”;115~125
5
万元为“良好企业”;105~115万元为“一般企业”;105万元以下为“落后企业”。试按先进企业、良好企业、一般企业和落后企业进行分组。 2、某车间按工人日产量分组资料如下: 日产量(件) 工人人数 (人) 50——60 6 60——70 12 70——80 18 80——90 10 90——100 7 合 计 53 要求:根据上表指出:①上表变量数列属于哪一种变量数列;②上表中的变量、变量值、上限、下限、次数(频数);③计算各组组距、组中值、频率。
3、某商店有职工20人,月工资额(单位:元)分别如下: 550 550 640 640 660 660 680 680 700 700 720 720 740 740 690 690 698 698 590 590
要求:利用分组法,将上述20人的工资分成三个组,并说明该商店职工工资的分布特征。
4、请用“√”或“×”完成下表(其中“√”说明具有某种数学特征,“×”说明不具有某种数学特征)。 计量尺定类尺度 定序尺度 定距尺度 定比尺度 度 数学特征 分类( = ,≠ ) 排序( < ,> ) 间距( + ,-) 比值( × ,÷) 5、某地区人口统计资料如下表,请计算此表中空白处的数字,并填入表中。 按年龄人口数组组中频 率 向上累积 向下累积 分 组(人) 距 值 (%) 频数频率(%) 频数频率(%) (周岁) (人) (人) 0—4 192 5 —17 459 18—24 264 25—34 429 35—44 393 45—64 467 65及以 318 上 合 计
6
*6、兹有下列调查:A、为了了解钢材积压情况,上级机关向单位颁发一次性调查表要求填报。B、一批商品运到商业仓库,在这批商品中选出10件进行仔细检查,以判断和记录其质量。C、某乡在春播期间每隔5天向上级主管部门提交播种进度报告。D、为了了解科技人员分配、使用状况,有关部门向各单位布置调查表,要求填报。E、对大中型基本建设项目投资效果进行调查。F、选取部分企业进行调查,以了解扩大企业自主权试点后的成果及问题。 要求:(1)指出上述各项调查按组织方式分类各属于哪种调查?(2)指出上述各项调查按登记事物的连续性分类各属于哪种调查?(3)指出上述各项调查按调查对象的范围分类各属于哪种调查?(4)指出各项调查按收集资料的方法分类各属于哪种调查?
第三章 数据分布特征的描述
一、单项选择题 1、经验表明,当数据分布近似于正态分布时,则有95%的数据位于区间( ) A、X?? B、X?2? C、X?3? D、X?4? 2、实际中应用最广泛的离散程度测度值是( )
A、极差和平均差 B、平均差和四分位差 C、方差和标准差 D、异众比率和四分位差
3、集中趋势的测度值中,最主要的是( )
A、众数 B、中位数 C、均值 D、几何平均数
4、有10个数据,它们对数据6的离差分别为:-3,-2,-2,-2,0,0,4,4,5,5。由此可知这10个数据的( )
A、均值为0 B、均值为1 B、均值为6 C、均值为6.9
5、某生产小组由36名工人,每人生产的产量数量相同,其中有14人生产每件产品耗时8分钟;16人生产每件产品耗时10分钟;6人生产每件产品耗时5分钟,计算该生产小组生产每件产品的平均耗时应采用( )
A、简单算术均值 B、简单调和算术均值 C、加权算术均值 D.、加权调和均值
6、某敬老院里有9位百岁老人的岁数分别为101、102、103、104、108、102、105、110、102 ,据此计算的结果是( )
A、均值=中位数=众数 B、均值>中位数>众数 C、众数>中位数>均值 D、中位数>均值>中数 7、几何均值主要适合于( )
A、具有等差关系的数列 B、变量值为偶数的数列 C、变量值的连乘积等于总比率或总速度的数列 D、变量值之和等于总比率或总速度的数列 8、加权算术均值不但受变量值大小的影响,也受变量之出现的次数多少的影响,因此下列情况中对均值不发生影响的是( ) A、 变量值出现次数相等时 B、变量值较小、次数较多时 C、变量值较大、次数较少时 D、变量值较大、次数较多时
7
9、一组数据的均值为350,众数为200,则( )
A、中位数为275,数据呈右偏分布 B、中位数为275,数据呈左偏分布
C、中位数为300,数据呈左偏分布 D、中位数为300,数据呈右偏分布
10、一组数据的均值为5,中位数为3,则( )
A、数据呈右偏分布 B、数据呈对称分布 C、数据呈左偏分布 D、数据呈正态分布
11、经验表明,当数据分布近似于正态分布时,则变量值落在区间X??的概率为( ) A、95% B、68% C、99.86% D、95.45% 12、当众数(Mo)中位数(Me)和均值(X)三者的关系表现为:Mo=Me=X,则( )
A、数据有极小值 B、数具有极大值 C、数据是对称分布
D、数据是左偏分布 E、数据右偏分布
13、在单项式数列中,假定标志值所对应的权数都缩小1/10,则算术平均数( )
A、不变 B、无法判断 C、缩小1/100 D、扩大10倍
14、若单项式数列的所有标志值都减少一倍,而权数都增加一倍,则其算术平均数( )
A、增加一倍 B、减少一倍 C、不变 D、无法判断
15、各变量值与其算术平均数的离差之和( )
A、等于各变量值之和的平均数 B、等于最大值 C、等于零 D、等于最小值
16、各变量值与其算术平均数的离差平方之和( )
A、等于各变量值之和的平均数 B、等于最大值 C、等于零 D、等于最小值
二、多项选择题
1、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:X<Me<Mo,则( )
A、数据是左偏分布 B、数据是右偏分布 C、数据是对称分布
D、数据存在极小值 E、数据存在极大值
2、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:Mo<Me<X,则( )
A、数据是右偏分布 B、数据是对称分布 C、数据是左偏分布
8
D、数据有极大值 E、数据有极小值 3、 数据分布的两个重要特征是( )
A、正态分布 B、集中趋势 C、t分布 D、?2分布 E、
离散程度
4、利用组距分组数据计算众数时,有一些基本假定,即( )
A、假定数据分布具有明显的离中趋势 B、既定数据分布具有明显的集中趋势
C、假定众数组的频数在该组内是正态分布 D、假定众数组的频数在该组内是均匀分布
E、假定众数组的频数在该组内是二项分布 5、众数( )
A、是一组数据分布的最高峰点所对应的数值 B、可以不存在 C、也可以有多个 D、是位置代表值 E、不受数据中极端值的影响。
6、极差( ) A、是描述数据离散程度的最简单测度值 B、不易受极端值影响 C、易受极端值影响 D、不能反映出中间数据的分散状况 E、不能准确描述出数据的分散程度
7、一组数据为17、19、22、24、25、28、34、35、36、37、38。则( ) A、该组数据的中位数为28 B、该组数据的第一个四分位数为22 C、该组数据的众数为38 D、该组数据无众数 E、该组数据的第三个四分位数为36
8、下列标志变异指标中,与变量值计量单位相同的变异指标有( ) A、全距 B、平均差 C、标准差 D、标准差系数 E、平均差系数
9、下列标志变异指标中,用无名数表示的有( )
A、全距 B、平均差 C、标准差 D、标准差系数 E、平均差系数
10、比较两个单位的资料发现,甲的标准差大于乙的标准差,甲的平均数小于乙的平均数,由此可推断( )
A、甲单位标准差系数大 B、乙单位标准差系数大 C、甲单位平均数代表性大
D、乙单位平均数代表性大 E、无法判断两单位平均数代表性大 11、已知100个零售企业的分组资料如下:
销售利润率(%) 10 15 企业数 60 40 销售额(万元) 800 200 这100个企业的平均销售利润率正确计算公式是 ( ) A、
10%?60?15%?40 B、10%×60%+15%×40% C、
60?40 9
10%?80%+15%?20% D、
10%?15%?800?15%?200 E、 2800?200三、填空题
1、中位数将全部数据分为两部分,一部分数据_____________,另一部分数据则________________。
2、根据未分组数据计算中位数时,若数据个数N为奇数时,则中位数Me=_____________;若数据个数为N为偶数时,则中位数Me=________________。 3、几何平均数是适用于特殊数据的一种平均数,它主要用于计算___________的平均;在实际应用中,几何平均数主要用于计算社会经济现象的___________________。
4、均值的主要缺点是易受数据___________的影响,对于_________的数据,均值的代表性较差。
5、均值的变形主要有_______________和_______________。前者主要用于__________________的数据,后者主要用于计算____________的平均数。 6、方差是__________与其均值___________的平均数。
7、极差也称_______,它是一组数据的___________和_________之差。
8、众数是一组数据中____________的变量值,从分布的角度看,它是具有明显_______________的数值。
四、 判断题
1、在均值加减3个标准差的范围内几乎包含了全部数据。( )
2、样本方差与总体方差在计算上的区别是:总体方差是通体数据个数或总频数减1去除离差平方和,而样本方差则是用样本数据个数或总频数去除离差平方和。( )
3、从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的结果。( )
4、由于中位数是一个位置代表值,其数值的大小受极大值和极小值的影响,因此中位数据有稳健性的特点。( ) 5、中位数与各数据的距离最长。( ) 6、?i?1NXi?Me?min(最小) ( )
7、从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均。( ) 8、几何平均数的对数是各变量值对数的算术平均。( ) 9、根据Mo、Me和X之间的关系,若已知Me=4.5,X=5,则可以推算出Mo=3.5。 ( )
10、对于具有偏态分布的数据,均值的代表性要好于中位数。( )
11、当数据分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。( ) 五、 简答题
1、权数的实质内容是什么?
10
2、数据集中趋势的测度值与离中趋势的测度值各有哪些? 3、试比较众数、中位数和均值三者的特点及应用场合。 4、什么是离散系数?为何要计算离散系数? 5、均值具有哪些重要的数学性质? 6、离散特征数在统计分析中的作用? 7、实际中几何平均数应用于哪些场合?
六、计算分析题 1、根据要求计算:
(1)已知X?500,V=0.3 , 求方差σ2。
(2)已知X?5.5 ∑X2=385, N=10 , 求离散系数V?。 (3)已知σ=20 ,X?60 ,求各数据值对50的方差。 (4)已知X?350 ,V=0.4 ,求各数据值对400的标准差。
(5)已知?X?810,?X2?65770,N=10,求标准差?和离散系数V?。 (6)已知:σ=100,X2?2600,求离散系数V?
(7)已知:样本方差S2n-1=16,∑(X-X)2=784,求样本容量n。
2、某车间生产三批产品的废品率分别为1%、2%、1.5%,三批产品的产量占全部产量的比重分别为25%、35%、40%,试计算该车间三批产品的平均废品率。
3、某产品精加工车间加工零件5000件,其中合格品4500件,不合格品500件。 要求:计算是非标志的平均数、方差、标准差及离散系数。
4、有两个教学班进行《统计学》期中测验,甲班有45个学生,平均成绩为78分,标准差为8分;乙班有50个学生,平均成绩为72分,标准差额为10分。要求计算两个教学班总的平均成绩和标准差。
5、某厂长想研究星期一的产量是否低于其他几天,连续观察六个星期,所得星期一日产量(单位:吨)为:100 150 170 210 150 120 同期非星期一的产量整理后的资料如下表: 日产量(吨) 天数(天) 100——150 8 150——200 10 200——250 4 250以上 2 合 计 24 根据资料:(1)计算6个星期一产量的均值和中位数;(2)计算非星期一产量的均值、中位数、众数;(3)分别计算星期一和非星期一产量的标准差;(4)比较
11
2
______星期一和非星期一产量的离散程度哪一个大一些?(5)计算非星期一产量数据分布的偏态系数和峰度系数。
6、甲工厂工人的工资的离差的绝对值之和是乙工厂工人工资离差绝对值之和的3倍,即:?x甲?x甲?3?x乙?x乙;而乙工厂工人工资的平均差却是加工厂工人工资平均差的3倍,即:A.D乙?2A.D甲,求:通过计算判断上述情况在什么情况下可能会发生?
7、从某地区抽取120家企业按利润额进行分组,结果如下: 按利润额分组(万元) 企业数(个) 200—300 19 300—400 30 400—500 42 500—600 18 600以上 11 合 计 120 要求:(1)计算120家企业利润的众数、中位数、和均值。 (3)计算分布的偏态系数和峰度系数,并作简要分析说明。
8、抽取10名成年人和10名幼儿进行身高(厘米)调查,结果如下: 成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 要求:(1)若要比较成年组和幼儿组的身高差异,应采用什么样的指标测度值?为什么?(文字回答即可)
(2)试通过计算,比较分析哪一组的身高差异大?
9、甲、乙两个企业生产三种产品的有关资料如下: 产品名称 单位成本 总成本(元) (元) 甲企业 乙企业 A 15 2100 3255 B 20 3000 1500 C 30 1500 1500 试比较哪个企业的总平均成本高,并分析其原因。
10、甲、乙两单位各抽取了若干工人进行生产情况调查,测得有关资料如下: 日产量(件/人) 甲单位工人数(人) 乙单位总产量(件) 2 4 12 3 8 24 5 6 20 合 计 18 56 试通过计算分析:(1)哪个单位工人的平均日产量水平高?
12
(2)哪个单位工人的日产量水平均衡?
11、已知某地区农民家庭按年人均收入分组的资料如表所示: 按人均收入分组(元) 家庭户数占总户数比重(%) 100以下 2.3 100—200 13.7 200—300 19.7 300—400 15.2 400—500 15.1 500—600 20.0 600以上 14.0 合 计 100.0 要求:(1)计算该地区平均每户家庭人均年收入的中位数、均值及标准差。 (2)根据计算结果回答,该地区平均每户家庭人均年收入与其平均数相比,平均相差多少元?(即是问标准差)
12、在某城市抽取100户家庭所做的一项抽样调查结果如下: 按月收入分组(元) 家庭户数占总户数比重(%) 300—400 24 400—500 27 500—600 28 600—700 10 700—800 7 800以上 4 你认为要分析该城市家庭的人均收入情况,用均值、众数和中位数哪一个测度值更好?试说明理由。(提示:用中位数。因为收入分布为右偏,且频数较多的几个组的家庭百分比相差不大,众数不十分明显。)
13、某厂两个主要生产车间工人某月奖金资料如下: 工人按奖金额分组 工人数(人) (元) 甲车间 乙车间 20以下 4 1 20—30 8 6 30—40 50 30 40—50 16 55 50以上 2 8 要求:(1)计算甲车间的众数、中位数和均值。根据计算结果描述众数、中位数及均值的关系,并据此判断甲车间数据分布的形态。
(2)通过计算判断哪个车间工人平均奖金额的代表性强?
14、某县两个乡在不同地块的粮食产量资料如下: 甲乡 乙乡 13
地块编号 平均亩产 粮食产量 平均亩产 播种面积 (公斤/亩) (公斤) (公斤/亩) (亩) 1 100 2500 100 125 2 150 15000 150 50 3 400 50000 400 75 试比较哪个乡的平均亩产高?并进一步分析原因。(提示:从两个乡产量水平不同的地块所占比重差异来分析)
15、某企业某种产品须经过4个车间的流水作业才能完成,如果第一车间的产品合格率为90%,第二车间的产品合格率为97%,第三车间的产品合格率为95%,第四车间的产品合格率为98%,求平均合格率。
16、某种产品的生产须经过10道工序的流水作业才能完成,有2道工序的合格率都为90%,有3道工序的合格率都为92%,有4道工序的合格率都为94%,有1道工序的合格率为98%,试计算平均合格率。
17、某班共有60名学生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分;女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题:
(1)如果该班的男女学生各占一半,全班考试成绩的平均数是多少?标准差又是多少?
(2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是多少?
(3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是多少?
(1) 比较(1)、(2)和(3)的平均考试成绩有何变化,并解释其变化的原因。
(2) 比较(2)和(3)的标准差有何变化,并解释其原因。 (6)如果该班的男女学生各占一半,全班学生中考试成绩在64.5分~90.5分的人数大概有多少?
18、某企业购进四批不同规格的原材料,每批价格及采购金额如下表所示,求这四批材料的总平均价格。 批次 价格(元/公斤) 采购金额(元) 第一批 35 10000 第二批 40 20000 第三批 45 15000 第四批 50 5000 合 计 — 50000 (提示:总平均价格?采购总金额)
采购总数量
19、已知某公司下属三个工厂的实际产值及计划完成程度资料如下: 工厂 计划完成程度(%) 实际产值(万
14
甲 95 乙 105 丙 115 合计 — 试求:三个工厂的平均计划完成程度。 (提示:计划完成程度?元) 99.75 210.00 339.25 649 实际产值平均实际产值?100%;平均计划完成程度??100%计划产值平均计划产值?实际产值?3?100%??实际产值?100%)??计划产值?3?计划产值
第四章 概率与概率分布
一、单项选择题
1、随机事件A,B互斥,且P(A)?0.36,P(B)?0.24,那么
P(AB)?()
A、0.36 B、0.24 C、0.60 D、0 2、随机事件A,B相互独立,且已知P(A)?0.50,P(B)?0.30,那么P(A?B)?( )
A、0.65 B、0.50 C、0.30 D、0.80 3、事件A,B,C都不发生的概率为0.125,那么A,B,C至少一个发生的概率为( )
A、0.250 B、0.875 C、0.375 D、无法计算 4、设随机变量X ~B (10,0.40),那么最可能“成功”的次数为( ) A、0 B、10 C、4 D、4.4 5、某种电子元件的使用寿命X 服从参数为?的指数分布,且EX =0.001,那么??( )
A、0.001 B、1000 C、0.000001 D、1000000 6、随机变量X~N (0,1),以?(x)表示其分布函数,那么?(0)?( ) A、0 B、0.40 C、0.64 D、0.50
二、多项选择题
1、概率的三公理是指( )
A、P(A)≤0 B、P(A)≥0 C、P(?)?0 D、P(?)?0 E、P(A1?A2??)?P(A1)?P(A2)??(其中Ai,i?1,2?两两互斥)
15
2、事件A,B互斥,且P(A)?0.30,P(B)?0.50,那么( ) A、P(A?B)?0.80 B、A?B C、P(AB)?0 D、P(AB)?1 E、P(AB)?0.20
3、事件A,B相互独立,且P(A)?0.30,P(B)?0.50,那么( ) A、P(AB)?0.15 B、P(AB)?0.35 C、P(A?B)?0.65 D、P(A/B)?0.50 E、P(AB)?0.35
4、随机变量X服从参数为??3的Poisson 分布,那么( ) A、EX =3 B、DX =3 C、EX = DX =3
30?3D、最可能值为3和2 E、P(X?0)?e?e?3?0.0498
0!5、随机变量X~N(5,16),那么以下结论正确的有( ) A、EX = 5 B、F(?x)?F(x) C、P(X?5)?P(X?5)?0.5000 D、F(10)??(1.25) E、P(?7?X?17)?0.9973 6、随机变量X~N(?,?2),那么( )
A、分布曲线关于x??对称 B、曲线中心位置为x?? C、概率密度函数在x??处取最大值 D、P(X??)?0
E、X 在一个给定区间取值的概率随?减小而增大
7、随机变量的数学期望EX的意义为( )
A、表示变量取值的分散程度 B、概率分布的重心 C、变量取值的集中趋势
D、是变量算术平均数的稳定中心 E、接近变量最有可能取的值 8、关于二项分布,以下说法正确的有( )
A、产生自n重贝努里实验 B、实验方式改为重复实验后,超几何分布蜕化为二项分布
C、变量的最有可能取值为[(n+1)p] D、n很大,p很小时,可以用泊松分布近似
E、是描述缺陷数或稀有事件数的合适分布
三、填空题
1、A 表示产品外观合格,B 表示产品内在质量合格。那么,A+B 表示_____________________________________,
16
AB 表示___________________________________________________。
2、射手甲、乙单独以及同时击中目标的概率依次为:0.64,0.76和0.6,目标被击中的概率为_________________________________________________。
3、街头随机抽取一个人,是中国人的概率为0.98,是非云南中国人的概率为0.25,那么此人是云南人的概率为__________________________________________________。
4、在校园中任抽一名同学,他喜欢足球的概率为0.75,在喜欢篮球的条件下他喜欢足球的概率为0.20,他同时喜欢篮球与足球的概率为____________________________________。 5、随机变量X~B(n,p),且已知EX?15,DX?6,______________________________________________________
其概率分布为
期最可能取值为_________________________________________。
6、一个离散随机变量X的数学期望与方差的数值相等,那么这个随机变量的分布是______________, 如
果
P(X?4)?P(X?5),那么P(X?2)=__________________________,EX
=_________________________________,最可能取值为_____________________________________________。 7、随机变量X~N(0,1),?(x)为其分布函数,那么?(0)?, ?(?x)?_______________P(|X|?h)?__________________
____________
,
。?(2)?0.97725,P(X?2)?__________
,
P(X??2)=____________,
如果P(X?h)?0.9973,那么h =____________________________.
8、随机变量X~N(2, 4),那么变量Z =________________________-服从标准正态分布。
P(X?2)=
P(Z?_____________),P(X?6)=___________,P(1?X?5)=________,
P(X?4)=_________________.。
如果已知P(X?x)?0.9545,那么x =____________________。
,那么参数?=9、随机变量X 服从参数为?的指数分别,且已知标准差??0.0001—————
,数学期望EX?__________
,概率密度为f(x)?________________________________
,
P(X?20000)?_____________。
10、随机变量X在区间[4,12]上服从均匀分布,则
P(X?6)?____,P(5?X?7)?______,
17
如果P(c?x?d)?0.40(4?c?d?12),且4?c?2,d?2?12,那么
P(c?2?X?d?2)=___________,EX=_________,DX?______,且几何中心与________________重
合。
四、判断题
1、事件A发生的概率为0.85,事件B发生的概率为0.75,则事件A发生的可能性大于事件B发生的可能性,在一次实验中一定是事件A发生而事件B不发生。 ( )
2、随机事件的概率,从统计定义的角度可以理解为随机事件频率的稳定值。 ( ) 3、同一事件的主客观概率不相等时,只能根据客观概率判断事件发生的可能性。 ( )
4、事件和的概率等事件的概率之和 ( )
5、事件差的概率等于事件概率之差。 ( )
6、事件乘积的概率等于事件概率之积。 ( )
7、必然事件的概率为1,故而概率为1的事件是必然事件。 ( )
8、概率为零的事件才有可能是不可能事件。 ( )
9、正态分布的重要性表现在许多分布的极限分布是正态分布,很多分布出自正态分布( )
10、正态分布在数学期望值附近的概率分布密集程度最高。 ( )
11、指数分布的参数等于数学期望的倒数,一般做失效率理解。 ( )
12、均匀分布的变量在区间[a,b]内某一小区间取值的概率与[a,b]的长度成反比。( ) 13、计算连续随机变量取值于某区间的概率时,可以不计区别区间端点是否在内。( )
14、数学期望是个分布的重心,接近于变量的最有可能取值。 ( )
15、贝努里大数定理表明,实验次数足够大时频率作为概率的估计值,出现很大偏差的可能性很小。 ( )
16、独立同分布大数定律,为以样本平均数估计总体平均数提供了理论依据。 ( )
17、独立同分布大数定律,为多次测定值的算术平均数作为真实值的估计,提供 了理论依据( ) 五、问答题
1、随机事件的概率及其性质。
18
2、随机变量及其在统计学的地位。
3、正态分布及其在统计学中的重要性。 4、贝努里实验与二项分布。
六、计算分析题
1、从一批产品中任抽20件产品,结果有4件次品,问“这批产品的次品率为5%”的说法可以相信吗?
2、甲、乙、丙三个企业生产同一种零件,其市场占有率依次为:30%,60%和10%,零件的一等品比重分别为:70%,90%与50%,现从市场上任意购买(不问品牌)一个零件。问:(1)这件零件是一等品的概率;(2)是非一等品的概率;(3)如果买得的零件是一等品,是哪家企业生产的可能性最大?
3、保险公司开发一种新的保险产品,拟向每个保户收取保费20元/人,如果保护在保险期内发生赔付责任事故,保险公司赔付的标准为20000元/人。经调查愿意购买该产品的保户人数为50000人,每位保户在保险期内发生责任事故的概率为0.1?。问:(1)期内发生责任事故的保户数大于2户的概率是多少?(2)公司因为此项业务而亏损的概率是多少?
4、在总体N(80,202)中,(1)抽取一个容量为100的样本,求样本平均数与总体平均数之差的绝对值大于3的概率;(2)如果样本平均数与总体平均数之差的绝对值小于0.2的概率为95.45%,那么样本容量为多少?
第五章 抽样与抽样估计
一、单项选择题
1、实际工作中,小样本是指( )
A、样本容量大于30的样本 B、样本容量小于30的样本 C、样本容量等于30的样本 D、样本容量小于等于30的样本 2、从5个字母中随机抽取2个字母作为样本,采用重复抽样,考虑顺序,则可能的样本个数为( )
A、10个 B、20个 C、25个 D、30个
3、当总体方差未知,且样本容量小于30时,进行正态总体均值的区间估计应采用的临界值为( )
A、F值 B、Z值 C、t值 D、x2值
4、当总体方差已知,无论样本容量n的大小如何,进行正态总体均值的区间估计应采用的临界值为( )
A、F值 B、Z值 C、t值 D、x2值
5、在总体内部情况复杂、且各单位之间差异程度大、单位数又多的情况下,宜采用( )
19
A、等距抽样 B、整群抽样 C、简单随机抽样 D、类型抽样
6、根据重复抽样的资料,甲单位工人工资方差为25,乙单位为100,乙单位抽的人数比甲单位多3倍,则抽样平均误差( )
A、甲单位较大 B、甲单位较大 C、无法判断 D、甲、乙单位相同
7、某学校在全校学生中随机重复抽取100人调查身高,计算出抽样平均误差为5cm。如果改用不重复抽样方法,在其他条件不变时,其抽样平均误差将会( )
A、大于5cm B、小于5cm C、等于5cm D、不确定 8、纯随机重复抽样条件下,样本容量扩大为原来的9倍,其它条件不变,则( ) A、抽样允许误差不变 B、抽样允许误差缩小为原来的九分之一 C、抽样允许误差缩小为原来的三分之一 D、抽样允许误差增大为原来的九倍 二、多项选择题
1、影响抽样平均误差的因素主要有( )
A、总体方差或标准差 B、样本容量 C、抽样方法 D、抽样组织方式 E、抽样的对象
2、下列说法中错误的有( )
A、抽样误差是不可避免的 B、抽样误差是可以避免的 C、抽样误差可以计算但不能加以控制机 D、抽样误差是由于抽样的随机性而产生的样本估计量与总体参数之间的代表性误差 E、抽样误差是指登记性误差
3、评价估计量的优劣常用下列三个标准( )
A、一致性 B、有效性 C、合理性 D、代表性 E、无偏性
4、抽样推断过程包括相互联系的三项内容( )
A、随机抽样 B、统计估计 C、假设检验 D、抽样精度 E、置信度
5、下列说法正确的有( )
A、总体参数是唯一的、确定的,但又是未知的 B、总体参数是随机变量 C、样本统计量是随机变量 D、样本统计量是唯一的、确定的 E、样本所包含的总体单位个数称为样本容量 6、概率抽样最基本的组织方式有( )
A、简单随机抽样 B、分层抽样 C、等距抽样 D、整群抽样 E、配额抽样
7、抽样估计中的抽样误差( )
A、无法避免 B、可以控制 C、只能在估计结束才能知道 D、可以计算
E、不可控制
8、抽样平均误差是指( ) A、所有可能样本的样本指标与总体指标的平均离差 B、所有可能样本的样本指标对总体指标的标准差 C、已抽出样本的标准差 D、等价于
20
极限误差
E、已抽出样本的平均差 三、填空题
1、概率抽样也叫随机抽样,是指按照 原则抽取样本。
2、在其他条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量扩大为原来的 倍。
3、当n趋近于无穷大时,卡方分布趋近于 分布。
四、判断题
1、抽样估计中所谓的抽样误差,是指系统误差。( ) 2、编制抽样框,是实施抽样的基础。( )
3、F分布不以正态分布为其极限分布,它总是一个正偏态分布。( ) 4、若总体平均数和方差有限,当样本容量n充分大时,无论总体分布形式如何,样本平均数近似服从t分布。( ) 5、根据中心极限定理,当n趋近于无穷大时,二项分布趋近于正态分布。( ) 6、在其他条件不变的情况下,扩大抽样极限误差会降低估计的置信度。( ) 7、抽样平均误差越小,则样本对总体的代表性越小。( )
8、在其他条件相同的情况下,不重复抽样的抽样误差总是大于重复抽样的抽样误差。( )
9、总体方差是影响抽样数目的因素之一。在其他条件不变的情况下,总体单位的差异程度大,则应少抽,反之可以多抽一些。( ) 10、重复抽样所产生的样本是彼此独立的。( )
11、总体参数的数值是客观存在的确定的,但又是未知的,需要用样本资料去估计。( )
12、样本统计量不含未知参数,它是随样本不同而不同的随机变量。( ) 13、全面调查也可产生代表性误差。( )
14、在其他条件不变的情况下,提高估计精度会提高估计的置信度。( ) 15、样本方差S
?2n?11=
n?1?(xi?1ni( ) ?x)2是总体方差的无偏估计量。
16、估计量?是参数?的无偏估计,可以保证它对参数?的估计没有系统偏差。( )
17、样本比例是总体比例的无偏估计。( ) 18、登记性误差是抽样调查所特有的。( ) 19、抽样推断是归纳推断法中的一种。( ) 20、参数估计和假设检验是抽样推断的两个组成部分。( ) 五、简答题
1、什么是抽样框?抽样框有哪三种主要形式?
2、什么是抽样平均误差、抽样方差、抽样极限误差?它们之间有何关系? 3、必要抽样数目受哪些因素影响?
4、什么叫估计量?评价估计量优劣的标准有哪三项? 5、点估计常用的方法有哪两种?其基本思想是什么?
21
六、计算分析题
1、某电池的寿命(单位:分钟)的95%置信区间是430<μ<470。假设这个结果是根据一个样本容量为100的样本得出的。试问:
(1) 样本的均值是多少
(2) 样本的标准误差是多少
(3) 如果置信区间419<μ<481是从相同样本数据得出的,置信度是多
少(置信度为68.27% 90% 95% 95.45% 99.73%时,正态分布概率值分别是(1 1.645 1.96 2 3)
2、调查公司想要估计全日制的大学生每周花在看电视上的时间(单位:小时)平均有多少小时。当极限误差为0.25小时时,计算估计均值所需要的样本容量。(假设想要达到的置信度为95%。标准差估计为1.87小时。) 3、一个样本中包含75台若干年前购买的电视机。这些电视机的置换时间为12.2年,标准差为1.1年。试对那一时期所有电视机的平均置换时间构建一个95%的置信区间。怎样才能减小这一区间。
4、一个样本容量为400的随机样本取自均值μ和标准差σ均未知。已算出
?x?2280,?x2?38532。求μ的95%的置信区间。
5、当你选购一种商品时,考虑得最多的是什么?是价格还是商品的质量?某市场调查公司调查了2000名成年人,结果又64%的人说他们主要根据价格做出购买决策。
(1) 试对根据价格做出购买决策的成年人的真正百分率构造95.45%的置信区
间。
(2) 对此区间做出解释
(3) 如果将置信度从95.45%降到90%,(1)中的置信区间将会发生什么变化。
6、一个研究者想要估计年龄在12-18岁之间、在学校使用计算机的学生比例。如果他想要99.73%的把握程度相信极限误差为5%,必须要对多少名随机选择的学生进行调查?
(1) 假设我们将先前的一项研究中得出的百分比82%作为p的估计值 (2) 假设我们事先没有信息可以提供p的可能值
7、某厂对当年生产的产品进行质量检查,从50000件产品中随机抽取200件产品,发现其中有15件不合格,试应用恰当的方法在95.45%(Z=2)的概率保证下,对全部不合格产品作可能范围估计。
8、某进出口公司出口一种名茶。按规定这种茶叶每包重量应不低于150克,现用不重复抽样的方法抽取1%进行检验,其结果如下
每包重量(克) 包数(包) 22
148—149 149—150 150—151 151—152 合计 要求: 10 20 50 20 100 ①试以0.9973的概率(Z=3)估计这批茶叶平均平均每包的重量范围。
以便确定是否达到规定要求。
②以95%的把握程度估计这批茶叶包装合格率的范围
9、某地区粮食播种面积共8000亩。随机抽取100亩进行调查,结果平均亩产量为580公斤,亩产量的标准差为40公斤,试以99.73%的置信度(Z=3)估计该地区粮食平均亩产量的可能范围和粮食总产量的可能范围。
10、一个容量为n=16的随机样本来自总体均值和方差未知的正态分布总体。如果样本有均值x?27.9和标准差s=3.23,则总体均值的95%的置信区间是多少?在重复研究中,n多大时,才能使得总体的允许误差为1.25?这个样本容量数,对于95%的置信区间要求的允许误差为1.25能达到吗? 11、一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸广告的家庭占多大比例。为了估计这个比例,首先要确定抽多少个家庭做调查。该公司希望以90%的置信水平对这个比例作出估计,并使估计值处在真正比例附近0.04范围内。在一个由15个家庭组成的样本中,有35%的响应者指出他们家中有某个人看过这种广告,试问应取多大的样本?
12、设已知某果园某种果树单株产量按正态分布。随机抽取6株计算其年产量(单位:kg)为:221.2 190.4 201.9 205 256.1 236
试以95%的置信水平,估计全部果树的平均年产量的置信区间。 13、某灯泡厂为了使生产的螺丝口和卡口灯泡的比例能很好地适应用户需要,从全市所有电灯中随机抽出1500盏灯作为样本。查得其中螺丝口灯头占15%,试以95%的置信度系数求卡口灯头的真正百分比的置信区间。
第六章 假设检验
一、单项选择题
1、假设检验的基本思想是( )
A、带有概率性质的反证法 B、小概率事件的出现是合理的
C、对总体均值的检验 D、对总体方差的检验 2、假设检验的显著性水平?的一般取值为( )
23
A、大于0.10 B、大于0.01 C、小于0.80 D、不超过0.10 3、样本容量不变,犯第一类错误的概率减小,则犯第二类错误的概率( ) A、增大 B、减小 C、不变 D、变化不定 4、正态总体方差未知,且样本容量小于30,检验总体均值的统计量应取( ) A、Z?x??0Sn~N(0,1) B、Z?2x??0?n~N(0,1)
C、??2(n?1)S?02~?(n?1) D、t?2x??0Sn~t(n?1)
5、假设检验中的P值的意义为( ) A、拒绝原假设的最小显著性水平 B、拒绝原假设的最大显著性水平 C、接受原假设的最小显著性水平 D、接受原假设的最大显著性水平
二、多项选择题
1、实际推断原理的要件是( )
A、实验的次数 B、实验的次数以一次为限 C、事件发生的概率很小
D、事件不发生是主观的认定 E、事件不发生是客观事实
2、关于假设检验的显著性水平?,以下说法正确的是( )
A、原假设H0为真却被拒绝的概率 B、原假设H0不真被拒绝的概率
C、?改变检验的结论必随之改变 D、?减小,拒绝原假设的概率减小
E、?减小,犯采伪的错误必随之增大
3、关于假设检验中第一、第二类错误的概率?,?,以下的说法正确的是( )
A、同时减小?,?的方法是增大样本容量 B、????1 C、拒真的代价大,取较小的?而容忍较大的? D、(1??)成为检验功效
E、采伪的代价大,取较大的?以求较小的?
4、以下属于参数假设的有( )
A、H0:??100 B、H0:X~N(10,25) C、H0:??1 D、总体X ,Y 有相同的分布 E、总体X ,Y 相互独立
24
25、对于假设H0:??5,H0:??5的检验,以下说法正确的有( ) A、这是一个单侧检验 B、这是右侧检验 C、这是左侧检验
D、这是双侧检验 E、检验统计量的数值大于上侧位临界值时拒绝原假设
6、关于假设检验中的P 值,以下说法正确的是( ) A、P为拒绝原假设的最小显著性水平 B、接受原假设的最大显著性水平
C、如果??P,在显著性水平?下拒绝原假设 D、P 值越小拒绝原假设的理由越充分
E、如果?≤P ,则在显著性水平?下接收原假设
三、填空题
1、某一假设检验为左侧检验,其原假设是H0:??10,则备择假设为
_________________________________
。
2、原假设拒绝域和接受域的分界点坐标值,称为_______________________________________________。 3、假设检验的四种情况是:____________________________、_______________________、__________________________和___________________。
4、双侧检验的拒绝域位于统计量分布曲线的____________________________,右侧检验的拒绝域位于___________________________________,左侧检验的拒绝域位于统计量分布曲线的_________________________________。 5、“接受原假设”的含义是_______________________________________________________________________。
6、如果我们希望提高“拒绝原设”的说服力,那么应该_________________________________?的数值。 7、双侧检验的P值等于_____________________________________________________________________________________________________。
8、如果改变显著性水平?,假设检验的结论_________________________________________,因此假设检验又称为__________________________________________________。
四、判断题
1、假设检验一定有犯错误的风险。 ( )
2、假设检验的结论具有100%的准确率。 ( )
3、显著性水平?=0.10,表示拒绝原假设的概率为10%。 ( )
4、?减小?必然增大,故而假设检验中的犯第一、第二类错误互为逆事件。
( )
5、建立假设时遵行的原则是“不轻易拒绝原假设”。 ( )
6、改变假设检验的显著性水平,检验的结论有可能改变。
25
( )
7、在假设检验中,减小一类错误的概率势必以另一类错误的概率增加为代价,除非扩大样本容量。 ( )
8、假设检验控制错误的方法是,先固定?,然后选择(1??)最小的检验方法。
( )
9、要提高“拒绝原假设”的说服力,应增大显著性水平?的数值。 ( )
10、“拒绝原假设”和“接受原假设”具有相同的可靠程度。 ( )
11、在显著性水平?=0.05之下,接受原假设等价于统计量的数值落入置信度为0.95的置信区间。 ( )
12、假设检验中的P值越大,拒绝原假设的理由越充分。 ( )
五、简答题
1、假设检验的思想及步骤 2、假设检验中的错误
3、假设检验的显著性水平 4、假设检验的局限性
5、误用Z 统计量检验替代T 统计量的后果
六、计算分析题
1、已知某种零件的尺寸服从正态分布N(23.02,1.52),现从这一批零件中任抽七件进行测量,测得尺寸数据(单位:mm)如下:
21.00 22.04 22.32 24.01 24.68 25.02 21.63 能否认为这批零件的平均尺寸仍为23.02mm(??0.05)。
2、假设英语四级考试中学生成绩服从正态分布。现随机抽取25名学生的考试成绩,算得平均分为67分,标准差为10分。在显著性水平??0.01下,可否认为全体学生的平均考试成绩为72分?
3、某市统计局调查了30个集市上的鸡蛋价格,测得平均价格为6.50元/千克,已知以往的鸡蛋价格一般为5.80元/千克。假定该市的鸡蛋售价服从正态分布
N(?,0.64),假定方差不变,能否认为当前鸡蛋的平均价格高于以往?(??0.01)。
4、从一批保险丝种抽取8根,测得其熔化时间X(单位:毫秒),得如下数据: 50 48 50 53 51 55 52 51
设X 服从正态分布,质量标准为?=35。问这批产品是否合格(??0.05)?
2 26
5、某市声称人口普查的差错率为0.52?,为了检验该结果是否可靠,随机抽查了了2000人,结果发现漏登2人,问可否认为原来的差错率正确(??0.05)?
第七章 方差分析
一、单项选择题
1、方差分析是对多个正态总体( )这一假设进行检验。
A、方差相等 B、方差相异 C、均值相等 D、均值不等
2、方差分析使用的统计量F( )
A、是正态分布 B、是正偏态的 C、是负偏态的 D、取值小于零 3、设单因素方差分析中误差项离差平方和为125.00,水平项离差平方和为375,那么总离差平方和为( )
A、250 B、125.00 C、375.00 D、500 4、因素A 共4个水平,每个水平下重复5次实验,数据的平方和为1250,数据
总和为150,A、125 B、-125 C、无法计算 D、1400
5、在单因素方差分析中,已知总离差平方和的自由度为24,水平项离差平方和的自由度为7,那么误差项离差平方和的自由度为( )
A、17 B、24 C、7 D、31 6、在一个双因素方差分析中,FA =2.300,FB =4.55相应的P- value依次为0.11和0.0018,
那么结论是( )
A、A的作用显著,B的作用不显著 B、A的作用不显著,B的作用显著
C、A的作用不显著,B的作用不显著 D、A的作用显著,B的作用显著
7、已知SST?1440,SSA?700,SSB?560,fT?30,fA?6,fB?8,那么
FA=( )
A、1440 B、700 C、116.67 D、10.37 8、如果MSA?12.25,fA?4,MSB?8.00,fB?5,MSE?2.25,fE?16,那么
SST( )
A、无法计算 B、22.5 C、25 D、125
二、多项选择题
1、方差分析假定的内容有( )
27
A、数据来自正态总体 B、数据来自二项总体 C、各总体相互独立
D、各总体不相关 E、各总体方差相等
2、一个单因素方差分析中,因素的水平为5,每个水平下的样本容量是6,SST =120,SSA=75
那么以下正确的是( ) A、n=30 B、dfA = 4 C、MSE=1.8 D、dfT =29 E、F=10.42 3、在一个单因素方差分析问题中,因素的水平为4,每个水平下的样本容量是5,那么下列说法正确的是( )
A、检验的原假设为H0:?1??2??3??4 B、检验的临界值为F?(4,5) C、检验的原假设为H0:?1??2??3??4??5 D、检验的临界值为F?(3,16) E、检验的统计量为F?SSA3 SSE164、一个因素A有6水平,因素B有4水平的双因素方差分析中,以下正确的有( )
A、数据共24个 B、误差平方和的自由度为15 C、SSA的自由度为6
D、SST的自由度为3 E、SST=SSA+SSB+SSE
5、一个因素A有7水平,因素B有8水平的双因素方差分析中,SST=225,SSA=78,SSB=140以下正确的有( )
A、SSE=2 B、SSE=7 C、FA?78 D、MSE=0.1667 E、因素A的作用显著
三、填空题
1、方差分析的英文缩写为:_____________________________________________________。
2、方差分析认为数据间的差异来自:__________________________和_________________________________________________ 。
3、单因素方差分析中,A共6个水平,SSA=___________________________;自由度df=______________________________。
4、单因素方差分析问题中,F= 12.24,P-value=0.00566,表示拒绝原假设的概率为____________。
5、因素A设4水平,因素B设6水平的双因素方差分析中,SSE的自由度为____________________。
6、某一双因素方差分析的计算结果为:F A =3.2101,FB=4.2254,P-value依次为0.1213,0.01023,那么结论应为_________________________________________________________________________________。
四、判断题
1、水平间的方差只包含有系统性因素。 ( )
2、F分布的第一自由度越小,它右偏态的程度越大。 ( )
28
3、方差分析,将总离差平方和分解为水平项离差平方和与误差项平方和,同时
也将总的自由度分解为各个平方和的自由度之和。 ( )
4、单因素方差分析的检验统计量为 F?SSASSE
( )
5、方差分析输出结果总的P-value越大,越应该拒绝原假设。 ( )
6、方差分析每个水平下设置的样本容量都必须相等。 ( )
7、双因素方差分析的两个因素间不会产生交互作用。 ( )
8、因素A共6个水平,因素B共5个水平,那么随机误差项的自由度为20 ( )
9、如果方差分析的结论是拒绝原假设的话,意味着所有水平之间存在着显著差异。 ( )
10、如果统计量F =12.25 ,而F crit为3.054,那么因素的作用不显著。 ( )
五、简答题
1、方差分析的原理 2、方差分析的原假设及其被拒绝的意义。
3、双因素方差分析中SSA 、SSB、SSE与SST的内容及关系 4、方差分析的步骤
六、计算分析题
1、设有五种治疗荨麻疹的药,为了比较它们的治疗效果,将30个病人随机分为5组,每组6人进行试验,结果如下: 药物A A1 A2 A3 A4 A5 治 6 4 6 7 9 愈 8 6 4 4 4 总和 T=169 天 7 6 4 6 5 数 7 3 5 6 7 总评均 x?5.63 xij 10 5 3 3 7 8 6 2 5 6 和Ti 46 30 24 31 38 平均xi 平方和 7.675.004.005.176.33 362 158 106 171 256 1053 试检验五种药物的疗效有无显著差异(??0.01)
2、对四种小麦进行产量(单位:kg/小区)的对比实验,假设各小区地力相同,在同样的管理条件下,得如下数据:
29
品种 序号 1 2 3 4 5 A1 A2 A3 A4 32.3 33.3 30.8 29.3 34.0 33.0 34.3 26.0 34.3 36.3 32.3 29.8 35.0 36.9 36.5 分析不同小麦品种小区产量有无显著差异(??0.01)。
3、某种商品不同的装潢,在五个地区销售,资料如下: 地区(因素 装潢(因素A) B) A1 A2 A3 B1 41 45 34 B2 53 51 44 B3 54 48 46 B4 55 43 45 B5 43 39 51 检验商品的不同装潢和在不同地区销量之间是否有显著差异(??0.05)
第八章 相关与回归分析
一、单项选题题
1、当自变量X减少时,因变量Y随之增加,则X和Y之间存在着( ) A、线性相关关系 B、非线性相关关系 C、正相关关系 D、负相关关系
2、下列属于函数关系的有( )
A、身高与体重之间 B、广告费用支出与商品销售额之间 C、圆面积与半径之间 D、施肥量与粮食产量之间 3、下列相关程度最高的是( )
A、r=0.89 B、r=-0.93 C、r=0.928 D、r=0.8
30
4、两变量x与y的相关系数为0.8,则其回归直线的判定系数为( ) A、0.80 B、0.90 C、0.64 D、0.50 5、在线性回归模型中,随机误差项被假定服从( )
A、二项分布 B、t分布 C、指数分布 D、正态分布
6、物价上涨,销售量下降,则物价与销售量之间的相关属于( ) A、无相关 B、负相关 C、正相关 D、无法判断 7、相关分析中所涉及的两个变量( )
A、必须确定哪个是自变量、哪个是因变量 B、都不能为随机变量 C、都可以是随机变量 D、不是对等关系 8、单位产品成本y(元)对产量x(千件)的回归方程为:yt?100?0.2xt,其中“—0.2”的含义是( )
A、产量每增加1件,单位成本下降0.2元 B、产量每增加1件,单位成本下降20%
C、产量每增加1000件,单位成本下降20% D、产量每增加1000件,单位成本平均下降0.2元 E、产量每增加1000件,单位成本平均下降20% 二、多项选择题
1、下列说法正确的有( )
A、相关分析和回归分析是研究现象之间相关关系的两种基本方法 B、相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况 C、回归分析可以不必确定变量中哪个是自变量,哪个是因变量 D、相关分析必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量 E、相关分析中所涉及的变量可以都是随机变量,而回归分析中因变量是随机的,自变量是非随机的 2、判定现象之间有无相关关系的方法有( )
A、计算回归系数 B、编制相关表 C、绘制相关图 D、计算相关系数 E、计算中位数
3、相关关系按相关的形式可分为( )
A、正相关 B、负相关 C、线性相关 D、非线性相关 E、复
31
?相关
4、在直线回归方程yt=?1+?2Xt中,回归系数?2的数值( )
A、表明两变量之间的平衡关系 B、其正、负号表明两变量之间的相关方向 C、表明两变量之间的密切程度 D、表明两变量之间的变动比例 E、在数学上称为斜率
5、下列那些项目属于现象完全相关( )
A、r=0 B、r= —1 C、r= +1 D、y的数量变化完全由X的数量变化所确定 E、r=0.98
6、在回归分析中,要求所涉及的两个变量x和y( )
A、必须确定哪个是自变量、哪个是因变量 B、不是对等关系 C、是对等关系
D、一般来说因变量是随机的,自变量是非随机变量 E、y对x的回归方程与x对y的回归方程是一回事 7、下列有相关关系的是( )
A、居民家庭的收入与支出 B、广告费用与商品销售额 C、产量与单位产品成本 D、 学生学习的时间与学习成绩 E、学生的身高与学习成绩
8、可决系数r2=86.49%时,意味着( )
A、自变量与因变量之间的相关关系密切 B、因变量的总变差中,有80%可
通过回归直线来解释 C、因变量的总变差中,有20%可由回归直线来解释 D、相关系数绝对值一定是0.93 E、相关系数绝对值一定是0.8649 三、填空题
1、相关系数r的取值范围为 。 2、可决系数的取值范围为 。
3、客观现象之间的数量联系存在着两种不同的类型:一种是 关系;另一种是 关系。
4、已知r=0.90,x=20,y=40,又知?y是?x的3倍,则Y对X的回归直线方程
???? 32
为 。
5、若已知?(x?x)2是?(y?y)2的2倍,?(x?x)(y?y)是?(y?y)2的1.2倍,则相关系数r等于 。 四、判断题
1、当自变量X按一定的数量变化时,因变量Y也相应随之等量变化,则X和Y之间存在着线性相关关系。( )
2、可决系数是判断回归模型拟合优度优劣最常用的数量指标,但不是最佳指标。( )
3、样本相关系数是总体相关系数的一致估计量。( )
4、若有线性回归方程Y(元)=34.5+7.8X(元),则表明当X增加一元时,Y增加7.8元。( )
5、若有线性回归方程Y(元)=160-52.5X(件),则表明当X增加一件时,Y平均减少52.5元。( )
6、可决系数越大,则模型对样本的拟合程度越差。( ) 7、可决系数r2=0时,SSE=SSR。( ) 8、数学上可以证明,S2e?=
2tn?2是?2的无偏估计。( )
9、回归估计标准误S越小,表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较差。( )
10、r=0时,表明两个变量之间不存在任何形式的相关关系。( ) 11、对于简单线性回归模型,相关系数r的平方等于可决系数。( ) 12、变量间的相关关系也就是函数关系。( )
13、逻辑上没有关系,但却在数值上相互依存的相关关系称为“伪相关”。( ) 14、最小二乘法估计的样本回归直线yt=?1+?( )
15、所有样本观测点全部在最小二乘法估计的样本回归直线yt=?1+?( )
16、最小二乘法适用的前提是Y与X之间的关系确为Y=a+bX。( )
33
??????2Xt一定通过点(X,Y)。
2Xt上。
17、对于可划为线性模型的非线性回归问题,一般先划为线性模型,然后再用最小二乘法估计参数。( )
18、一元线性回归方程的回归系数?2的符号与相关系数的符号完全一致。正号表示正相关,负号表示负相关。( )
19、Y倚X的回归方程与X倚Y的回归方程是一回事。( )
20、r=0时,只是表明两变量之间不存在线性相关关系,有可能存在非线性相关关系。( )
21、相关分析中,所涉及的两个变量都可以是随机变量。( ) 22、相关系数是在所有情况下,用来说明两个变量相关关系密切程度的统计分析指标。( )
23、两个变量中不论假定哪个变量为自变量X,哪个变量为因变量Y,都只能计算出一个相关系数。( )
五、简答题
1、试举例说明什么是相关关系?什么是函数关系? 2、试述回归分析中误差项的标准假定。
3、什么是单相关、复相关和偏相关?什么是线性相关和非线性相关?请各举一个你熟悉的例子说明。
4、相关分析与回归分析之间的联系与区别? 六、计算分析题
1、某商店想了解职工工龄长短与月工资的关系,调查了10名售货员的工龄和月工资情况。设工龄为X(年),月工资为Y(元)。经计算,已得到以下结果: ?x=70,
22=640, =532 ,yxy???=42816, ?xy=4754
?要求:(1)计算相关系数r;(2)拟合以月工资为因变量的直线回归方程,并指出其回归系数的意义;(3)计算判定系数,并评价拟合优度。
2、设销售收入X为自变量,销售成本Y为因变量。现根据某百货公司10个月的有关资料计算出以下数据:(单位:万元)
34
?(Xtt-X)2=4250, X=6.5, ?(Yt-Y)2=2620, Y=5.5,
t(X?(Y-Y)
-X)=3300
要求;(1)计算简单相关系数,拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释;(2)计算可决系数和回归估计标准误差;(3)对?2进行显著性水平为5%的显著性检验。
3、从某大学统计系的学生中随机抽取16人,对数学和统计学的考试成绩(单位:分)进行调查,结果如下: 学生编号 1 2 3 4 5 6 7 8 数学成绩 统计学成绩 学生编号 81 90 91 74 70 73 85 60 72 90 96 68 82 78 81 71 9 10 11 12 13 14 15 16 数学成绩 统计学成绩 83 81 77 60 66 84 70 54 78 94 68 66 58 87 82 46 要求:(1)根据上表数据绘制散点图,判断数学考试成绩与统计学考试成绩之间的关系形态;(2)计算数学考试成绩与统计学考试成绩之间的简单相关系数;(3)对相关系数的显著性进行检验(取?=0.05),并说明数学考试成绩与统计学考试成绩之间的关系密切程度;(4)拟合统计学考试成绩对数学考试成绩的回归直线;(5)对回归方程的线性关系和回归系数进行显著性检验(取?=0.05);(6)确定数学考试成绩为80分时,统计学考试成绩置信度为95%的预测区间。
4、某企业生产某种产品的产量和单位成本资料如下:
月 份 产量(千件) X 单位成本(元/件) Y
1 4 73 2 6 72 35
3 8 71 4 7 72 5 8 70 6 9 69 要求:(1)计算简单相关系数;(2)确定单位成本对产量的一元线性回归模型,并指出其回归系数的意义;(3)对该模型拟合优度进行评价;(4)分别对回归系数?2及回归方程进行显著性水平为5%的显著性检验;(5)计算估计标准误差,并以95%的置信度求产量为10000件时单位成本的预测区间。
5、随机抽取某地12个居民家庭为样本,调查得到有关人均收入与食品支出的资料如下:
单位:元
编号 1 2 3 4 5 6 7 8 9 10 11 12 家庭人均生活费收入 82 93 105 130 144 150 160 180 200 270 300 400 人均食品支出 75 85 92 105 120 120 130 145 156 200 200 220 要求:(1)分析判断人均生活费收入与人均食品支出之间是否存在相关关系?其相关程度如何?
(2)检验其相关系数(?=0.05);
(3)拟合适当的回归模型,并对该模型的拟合优度作出评价。
6、在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格与需求量进行观察,得到如下一组数据: 价格x (元)
10 6 8 9 36
12 11 9 10 12 7 需求量y(吨) 60 72 70 56 55 57 57 53 54 70 要求:(1)计算价格与需求量之间的简单相关系数;
(2)拟合需求量对价格的回归直线,并解释回归系数的实际意义; (3)计算判定系数r2和估计标准误S,分析回归直线的拟合程度;
(4)对回归方程的线性关系和回归系数进行显著性检验(取?=0.05),并对结果作简要分析。
7、某农业科学院研究院在土质、面积、种子完全相同的条件下。测得8块试验田种植的小麦产量Y(千克)与化肥施用量X(千克)的数据如下表:
小麦产量Y(千克) 266 化肥施用量X(千克) 15 340 18 356 21 372 24 389 27 404 30 420 33 435 36 要求:(1)建立小麦产量Y对化肥施用量X的直线回归方程; (2)求方差?2的无偏估计(即求S2); (3)检验回归效果是否显著(取?=0.05) (4)求X=40千克时,小麦产量Y的预测区间。
8、从某项n=20的资料中已经求得: x=124.00(m2); y=67.80(千元); Lxx=?(x?x)2=2080; Lyy=?(y?y)2=71.20; Lxy=?(x?x)(y?y)=296.00 要求:(1)计算相关系数r;(2)估计回归系数?1、?2; (3)计算估计标准误差。
9、已知两个变量,即亩产量(y)和施肥量(x)。假定两变量间存在线性关系,并已知:n=10,x=27, y=380, ?xy=985.5, ?x=101.2,?y=12995,
2??22?(y?y)
t?2=33897,t?=t0.10=1.86
22要求:(1)建立亩产量对施肥量的线性方程,并说明回归系数的含义;
37
(2)计算估计标准误S,并说明其含义;
(3)计算相关系数r及判定系数r2,并说明其含义;
(4)当施肥量Xf=35时,试以90%的置信度预测亩产量的区间。
10、下面是7个地区2000年的人均GDP和人均消费水平的统计数据:
地 区 北京 辽宁 上海 江西 河南 贵州 陕西 人均GDP(元) 22460 11226 34547 4851 5444 2662 4549 人均消费水平(元) 7326 4490 11546 2396 2208 1608 2035 要求:(1)以人均GDP做自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态;
(2)计算两个变量之间的线性相关关系,说明两个变量之间的关系强度; (3)利用最小二乘法求人均消费水平对人均GDP的线性回归方程,并解释回归系数的实际意义;
(4)计算判定系数,并解释其意义;
(5)检验回归方程线性关系的显著性(?=0.05);
(6)如果某地区的人均GDP为5000元,预测其人均消费水平(点预测); (7)求人均GDP为5000元时,人均消费水平在95%置信水平下的预测区间。 *11、某农场通过试验取得早稻收获量与春季降雨和春季温度的如下数据: 收获量(公斤/公顷)y 降雨量(mm)x1 温度(℃)x2 1500 2300 3000 4500 4800 5000 5500 25 6 33 8 45 10 105 13 110 14 115 16 120 17 要求:确定早稻收获量对春季降雨和春季温度的二元线性回归方程,并解释回归系数的实际含义。
38
第九章 时间序列分析
一、单项选择题 1、我国1996年—2002年按年排列的人均国内生产总值时间数列属于( ) A、绝对数时点数列 B、绝对数时期数列 C、相对数时间数列 D、平均数时间数列 2、1998年为基期。已知1999年、2000年、2002年的环比发展速度分别为110%、120%和108%;又知2002年的定基发展速度为160%,则2001年的环比发展速度为( )
A、112.23% B、12.23% C、112.66% D、12.66% 3、由相对数或平均数时间数列计算序时平均数c,若分子与分母都是连续时点数列,则其计算公式为( ) A、c=
?a/n B、
nc=
?b/n C、
c=
?an/
?bn=
?a/?b
D、c=
?a/
?b
4、某商店1998年—2002年“年末商品库存额时间数列”属于( )
A、时期数列 B、时点数列 C、相对数时间数列 D、平均数时间数列
5、直线趋势方程yt= a+bt中的b的含义为( )
A、截距项 B、趋势值 C、t变动一个单位时y的变动量 D、t变动一个单位时y的平均变动量
6、原始资料平均法计算季节指数时,计算各年同期(月或季)的平均数,其目的是消除各年同一季度(月份)数据上的( )
A、季节变动 B、循环变动 C、长期趋势 D、不规则变动 7、某地区GDP1995—1998年4年间平均每年递增10%,1999年—2002年4年间平均每年递增8%,则该地区8年来GDP共增长了( )
A、99.19% B、90% C、9% D、108%
8、如果5年的产量分别是20、15、22、25、27、31,那么其平均增长量是( ) A、31/5 B、11/5 C、11/6 D、31/6 9、对时间序列配合趋势线时,若观察值的一次差(逐期增长量)大体相同,可配合( )
39
?A、抛物线 B、指数曲线 C、直线 D、Logistic曲线 10、对时间序列配合趋势线时,当现象的长期趋势大体上按相同的增长速度递增或递减变化时,可以配合( )
A、抛物线 B、指数曲线 C、直线 D、Logistic曲线 11、对时间序列配合趋势线时,若每期的二级增长量(各期增长量的逐期增长量)基本相等,可配合
A、抛物线 B、指数曲线 C、直线 D、Logistic曲线
12、线性趋势的特点是其变化率或趋势线的斜率( )
A、基本保持不变 B、衡等于1 C、衡等于0 D、波动较大
二、多项选择题
1、在实际工作中测定循环变动的常用方法主要有( )
A、最小二乘法 B、剩余法 C、平衡法 D、指数法 E、直接法 2、计算平均发展速度通常采用的两种方法是( )
A、最小二乘法 B、移动平均法 C、几何平均法 D、方程式法
E、算术平均法
3、时间序列的构成要素有( )
A、循环变动 B、季节变动 C、不规则变动 D、长期趋势 E、平衡变动
4、平均发展速度是( ) A、各期环比发展速度的序时平均数 B、各期环比发展速度的算术平均数 C、各环比发展速度的代表值 D、各期环比增长速度的几何平均数 E、以上均对
5、已知一个时间数列的累计增长量,及总发展速度,则可求得( ) A、平均发展速度 B、平均增长速度 C、最初水平 D、最末水平 E、中间水平
6、已知各期环比发展速度和最末水平,可以计算( )
A、平均发展速度 B、平均增长速度 C、定基发展速度 D、累计增长量 E、逐期增长量
7、下列表述正确的有( )
A、环比增长速度的连乘积等于定基增长速度 B、增长速度加上100%即是发展速度 C、定基增长速度加1等于定基发展速度 D、相邻的两个定基发展速度之商,等于相应时期的环比发展速度 E、逐期增长量的序时平均数就是平均增长量
8、时间序列的水平分析指标有( )
A、发展水平 B、平均发展水平 C、增减量 D、平均增减量 E、发展速度
9、时间序列的速度分析指标有( )
A、发展速度 B、平均发展速度 C、增减速度 D、平均增减速度 E、增
40
减量
10、平均发展水平( ) A、是对不同时间上的发展速度求平均数 B、是对不同时间上的发展水平求平均数
C、也称为序时平均数 D、只能由绝对数时间数列来计算 E、也可由相对数或平均数书时间数列来计算
三、填空题
1、已知连续4年产值环比增长速度分别为5.6%、3.8%、7.2%、6.4%,则定基增长速度为 %;平均发展速度为 %。
2、保证数列中各项指标具有充分的 性,是编制时间数列的基本原则。 3、定基发展速度等于相应时期各个环比发展速度的 。
4、任何一个时间序列都具有两个基本要素:一时所属的 ;二是在不同时间上的统计 。
5、时间序列的长期趋势可分为线性趋势和非线性趋势。当时间序列的长期趋势近似地呈现为直线而发展,每期的增减数量大致 时,称为时间数列具有线性趋势。线性趋势的特点是其变化率或趋势线的斜率基本 。
四、判断题
1、累计增长量等于相应时期各个逐期增长量之差。( ) 2、各个环比发展速度的代数和等于相应时期的定基发展速度。( ) 3、n个环比增长速度分别加1后的连乘积开n次方,结果再减去100%,可得到平均增长速度。( )
4、发展速度等于增长量与基期水平相比。( )
5、序时平均数所平均的是现象在同一时间上的数量差异,说明现象在某一段时间内发展的一般水平。( )
6、通常把逐日排列的时点数据视为间断时点数列。( ) 7、计算连续时点数列的序时平均数可用简单算术平均法。( ) 8、几何平均法计算平均发展速度的基础是各期环比发展速度。( ) 9、循环变动是指现象在一段相当长的时期内所表现的沿着某一方向的持续发展变化。( )
10、移动平均法修匀时间数列时,平均的时距项数N越大,对数列的修匀作用越强,但并非N越大越好。( ) 11、移动平均法适用于分析时间序列的长期趋势,但不适合对现象未来的发展趋势进行预测。( )
12、原始资料平均法计算的季节指数等于各年同期(月或季)的平均数除以全部数据的总平均数。( )
13、现象发展的总速度等于各期环比发展速度之和。( )
14、用几何平均法(水平法)计算平均发展速度的特点是着眼于各期水平的累计之和。( ) 15、用方程式法(累计法)计算平均发展速度的特点是着眼于期末水平。( ) 16、各项指标相加没有实际意义的时间数列是时期数列。( ) 17、各环比增长速度的连乘积等于定基增长速度。( )
18、实际工作中计算年距发展速度,其目的在于测定数列的循环波动特征。
41
( )
19、平均增长速度等于环比增长速度连乘积的n次方根。( )
20、对一个时间数列作3项移动平均,则所形成的新的时间数列首位将各减少3项。( ) 21、当数列有多个趋势方程可供选择时,取其中估计的平方误差最小的方程为宜。( )
22、若季节指数是按月平均计算的,则12个月的季节指数之和应等于1200%。( )
五、简答题
1、时间数列的概念及编制时间数列应遵循的原则?
2、计算平均发展速度的几何平均法和方程式法各有什么特点? 3、试述时期数列与时点数列的区别。
4、怎样由环比增减速度求得定基增减速度?
六、计算分析题
1、两企业有关产值(单位:万元)资料如下: 年 份 甲 乙 1999 30 25 2000 35 26 2001 38 32 2002 40 38 假如两企业今后均按各自的平均发展速度发展,问几年后乙企业的产值正好与甲企业的相同?
2、已知某地GDP资料如下表: 年 份 1997 1998 1999 2000 2001 2002 环比增长速度(%) — 4 6.3 定基增长速度(%) — 5.4 18.2 35.4 要求:(1)计算并填出表中空缺数字;(2)计算该地区GDP的年平均增长速度。 3、某地区社会总产值1993—1996年每年递增15%,1997—1999年每年递增12%,2000—2003年每年递增9%。计算1993—2003年:(1)社会总产值共增长了百分之几?(2)年平均增长速度是多少?
4、某公司拥有A、B两个企业,2001年产值均为200万元,其余资料如下: 时 间 2001年 2002年 A企业产值环比发展速度(%) 130 110 B企业产值环比发展速度(%) 110 130 试比较2001年及2002年整个公司产值环比发展速度的高低。
5、某地区1999年下半年各月的社会劳动者人数和国内生产总值资料如下表: 月 份 7 8 9 10 11 12
42
国内生产总值(亿元) 300 310 315 325 340 360 月初社会劳动者人数(万人) 1680 1800 1760 1860 1920 2060 又知1999年末社会劳动者人数为2100万人。要求: (1)编制下半年各月劳动生产率的时间数列;
(2)计算下半年以国内生产总值计算的月平均劳动生产率; (3)计算下半年的劳动生产率。
6、某零售商店今年上半年的零售额、库存额和流通费用额资料如下,又已知今年7月初库存额为11万元。
单位:万元 月份 1 2 3 4 5 6 零售总额(万元) 32 34 33 41 30 46 月初库存额(万14 15 12 16 10 13 元) 2.9 3.1 2.7 3.4 3.2 3.0 流通费用额(万元) 要求:试计算今年上半年的月平均商品流转次数和月平均商品流通费用率。 (提示:商品流转次数=零售总额÷平均库存额;商品流通费用率=流通费用额÷零售总额)
7、某地区1999—2003年某种产品的产量资料如下: 年份 产品产量(百吨) 1999 20 2000 22 2001 24 2002 27 2003 30 要求:先判断该地区的产品产量发展趋势接近何种函数形式,然后用最小二乘法加以拟合,并预测2006年这种产品可能达到的产量。
8、某地1998年GDP为50亿元。计划到2002年间年平均递增6%。1999—2002年实际资料如下: 时 间 1999年 2000年 2001年 2002年 环比增长速度(%) 6 4 8 5 问;(1)2002年与1998年相比,GDP共增长了百分之几?(2)1998—2002年间,年平均增长速度是否达到计划规定的要求?
9、已知某企业某商品最近几年各季度的销售量如表所示(单位:万件): 第一季度 第二季度 第三季度 第四季度 1996年 13 18 5 8 1997年 14 18 6 10 1998年 16 22 8 12 1999年 19 25 15 17
43
要求:用原始资料平均法求季节比率。
10、设2000年年末,我国人口为12.9亿人,为争取到2020年年末把我国人口控制在15亿人之内。 要求:(1)试计算我国人口年平均增长率将是多少?
(2)若2001年起,人口年平均增长率控制在7?以内,试计算2020年年末我国人口将达多少?
11、某城市制定城市社会发展规划,该市人均绿化面积要在2000年的人均4平方米的基础上十年后翻一番。试问; (1) 若在2010年达到翻一番的目标,每年的平均发展速度是多少? (2) 若在2008年就达到翻一番的目标,每年的平均增长速度是多少? (3) 若2001年和2002年的平均发展速度都为110%,那么后8年应该以怎样的平均发展速度发展才能实现翻一番的目标?
※12、某商业银行1999~2003年的投资额资料如下: 年份 2000 2001 2002 2003 2004 投资额(亿元) 320 332 340 356 380 通过建立指数曲线趋势方程,预测2005年该商业银行的投资额。
第十章 统计指数
(一)单选题
1、如果销售额增加10%,零售物价指数下降5%,则销售量( )
A、增加5% B、增加10% C、增加15.79% D、无法判断
2、综合指数是依据以下方式来编制的
A、先对比,后平均 B、先综合,后对比 C、先除后乘 D、先加后除
3、平均指数是依据以下方式来编制的
A、先对比,后平均 B、先综合,后对比 C、先除后乘 D、先加后除
4、通常在指数体系的完整框架中,质量指标指数是以( )计算的。 A、拉氏公式 B、帕氏公式 C、马-埃公式 D、费雪公式
5、通常在指数体系的完整框架中,数量指标指数是以( )计算的。 A、拉氏公式 B、帕氏公式 C、马-埃公式 D、费雪公式
6、某商店销售多种商品,报告期与基期相比销售额未变,但销售量增长了15%,则销售价格指数为( )
A、115% B、100% C、85% D、86.96%
44
7、编制平均指数的基本问题之一是( )
A、指数化指标的选择问题 B、合理加权问题 C、同度量因素的固定问题 D、以上答案均错
8、用于比较不同地区或国家各种商品价格综合差异程度的指数是( ) A、个体价格指数 B、时间价格指数 C、空间价格指数 D、平均价格指数
9、我国的消费者价格指数(CPI)是采用( )来编制的。
A、固定加权算术平均的形式 B、固定加权调和平均的形式 C、固定加权几何平均的形式 D、简单算术平均的形式
10、采用标准比值法编制综合评价指数时,个体指数的计算方法为( ) A、参评指标标准值比相应指标报告期值 B、参评指标报告期值比相应指标基期值
C、参评指标计划值比相应指标标准值 D、参评指标实际值比相应指标标准值
11、P表示商品价格,q表示商品销售量,则?p1q1??p0q1的意义是综合反映多种商品的( )
A、销售量变动的绝对额 B、价格变动的绝对额 C、因价格变动额增减的销售额 D、因销售量变动额增减的销售额
12、以个体指数为基础计算总指数的指数形式是( )
A、综合指数 B、平均指数 C、可变构成指数 D、固定构成指数
13、某商品价格发生变化,现在的100元只值原来的90元,则价格指数为( ) A、10.00% B、90.00% C、110.00% D、111.11% 14、某企业职工工资总额,今年比去年减少2%,而平均工资上升5%,则职工人数减少( ) A、3.0% B、10.0% C、75.0% D、6.7% 二、多项选择题
1、以下属于时间指数的是( ) A、股票价格指数 B、计划完成情况指数 C、零售物价指数 D、地区间的价格比较指数 E、工业生产指数 2、以下属于质量指标指数的是( )
A、股价指数 B、物价指数 C、成本指数 D、产量指数 E、销售量指数
3、以下属于数量指标指数的是( )
A、工业生产指数 B、商品销售额指数 C、总产值指数 D、产量指数 E、销售量指数 4、个体指数( )
A、是反映个别现象或个别项目数量变动的指数 B、采用先综合、后对比的方式编制 C、采用先对比、后综合的方式编制 D、也有质量指标指数和数量指标指数之分 E、是总指数的重要形式之一 5、同度量因素的作用有( )
45
A、“同度量”的作用 B、“平衡”的作用 C、对指数化指标“加权”的作用 D、“平均”的作用 E、以上均对
6、某商店报告期全部商品的销售量指数为120%,这个指数是( ) A、个体指数 B、总指数 C、数量指标指数 D、质量指标指数 E、平均数指数
7、可变构成指数的意义及公式( )
A、可变构成指数反映了各组的变量水平及总体结构两个因素的影响 B、可变构成指数仅反映总体结构的影响 C、可变构成指数的计算公式为: x假定?x0f1?x0f0?? f?1?f0x0
D、可变构成指数的计算公式为: x1?x1f1?x0f0?? f?1?f0x0
E、可变构成指数的计算公式为: x1?x1f1?x0f1?? ?f1?f1x假定8、固定构成指数的意义及公式( )
A、固定构成指数反映了各组的变量水平的影响 B、固定构成指数反映了总体结构的影响 C、固定构成指数的计算公式为: x假定?x0f1?x0f0?? ?f1?f0x0
D、固定构成指数的计算公式为: x1?x1f1?x0f0?? ?f1?f0x0
e、固定构成指数的计算公式为: x1?x1f1?x0f1?? f?1?f1x假定9、结构影响指数的意义及公式( )
A、结构影响指数反映了各组的变量水平的影响 B、结构影响指数反映了总体结构的影响 C、结构影响指数的计算公式为: x假定?x0f1?x0f0?? ?f1?f0x0
xfxfxD、结构影响指数的计算公式为: 1??11??00?f1?f0x0
x1?x1f1?x0f1E、结构影响指数的计算公式为: ???f1?f1x假定
10、加权总指数的编制方式有( )
A、先综合、后对比 B、先加后减 C、先减后加 D、先对比、后平均 E、先除后乘 11、总指数的计算形式有( )
A、综合指数 B、销售量指数 C、销售价格指数 D、平均指数 E、产量指数 三、填空题
46
1、在我国,工业生产指数是通过计算各种工业产品的 产值来加以编制的。 2、价格下降后,同样多的人民币可以多购买12%的商品,则物价指数为 %。 3、采用标准比值法编制综合评价指数时,个体指数可以围绕着 %上下取值,最小值通常不能 于零。
4、功效系数的取值范围为 ;而改进的功效系数一般在 到 分之间取值。
5、统计指数按指数化指标的性质可分为 指数和 指数。
四、判断题
1、指数作为一种对比性的统计指标具有相对数的形式,通常表现为百分数。( )
2、指数分析中,将那种个别现象的数量不能直接加总或不能简单对比的总体称为复杂现象总体。( )
3、加权总指数的核心问题是“权数”问题。( ) 4、拉氏数量指标指数采用报告期质量指标作为同度量因素。( ) 5、帕氏价格指数采用基期数量指标作为同度量因素。( )
6、在现实经济生活中,依据同样一些现象的资料计算的帕氏指数一般大于拉氏指数。( )
7、编制综合指数的基本问题是“同度量”的问题,解决这一问题的方法就是编制加权综合指数。( )
8、在指数编制的实践中,平均指数仍然是一种相对独立的总指数编制方法,而不仅仅是综合指数的变形。( )
9、用指数体系作两因素分析时,同度量因素必须都是同一时期的。 ( )
10、总指数编制的基本问题是综合与对比的问题。( ) 11、特殊情况下,根据同样资料计算的帕氏指数有可能大于拉氏指数。( ) 12、当个体指数与总指数之间存在一一对应关系时,基期加权的算术平均数指数可视为拉氏指数的变形。( )
13、已知基期总值指标及个体指数时,可使用加权算术平均指数编制总指数。( ) 14、加权综合指数的计算通常需要掌握全面的资料,而加权平均指数则既可以依据全面的资料来编制,也可以依据非全面资料来编制。从这个意义上来说,加权平均指数在实际中应用得更为广泛。( ) 15、在制定了产量计划的条件下,产品成本指数的编制应该采用计划规定的产量水平作为同度量因素。( )
16、消费者价格指数可用于测定通货膨胀的状况。( ) 17、综合反映结构和水平两个因素共同变化所引起的总平均数变动的指数是固定构成指数。( )
18、结构变动影响指数单纯反映总体结构变化对总平均数的影响。( )
五、简答题
1、试述指数的概念、作用和种类。 2、何为指数体系?它有何作用?
47
3、工业生产指数和消费者价格指数的含义? 4、拉氏指数和帕氏指数各有什么特点? 六、计算分析题
1、某商店三种商品的销售情况如下: 商品 计量 销售量 销售价格(元/台、吨、名称 单位 件) 基期 报告期 基期 报告期 甲 万台 2 3 10 12 乙 万吨 5 5 8 7 丙 万件 4 6 2 4 要求:(1)计算三种商品的销售量个体指数和销售价格个体指数; (2)用拉氏公式编制三种商品的销售量总指数和销售价格总指数; (3)再用帕氏公式编制三种商品的销售量总指数和销售价格总指数; (4)比较(1)、(2)两种公式编制出来的销售量总指数和销售价格总指数的差异。
2、某车间两种产品的生产情况如下: 产品 计量 单位成本(元/件、台) 产量 名称 单位 基期 报告期 基期 报告期 A 万件 10 12 3 5 B 万台 3 6 2 6 要求:建立适当的指数体系(V=Lq·Pp),从相对数和绝对数两方面对总成本的变动进行因素分析。
3、某商店2000年的销售额为200万元,比上年增长了10%。2000年销售量总的增长了5%。 要求:(1)求商品销售价格总指数; (2)从相对数和绝对数两方面分析销售量和销售价格两因素变动对销售额的影响。
4、某企业生产三种不同的产品,有关的产量、成本和销售价格资料如下: 产品 计量 产量 单位成本出厂价格种类 单位 (元) (元) 基期 报告期 报告期 报告期 A 件 270 340 50 65 B 台 32 35 800 1000 C 吨 190 150 330 400 要求:(1)以单位成本为同度量因素,编制帕氏产量指数; (2)以出厂价格为同度量因素,编制帕氏产量指数; (3)比较说明两种产量指数具有何种不同的经济分析意义。
5、某企业生产三种产品的有关资料如下: 产品名称 总生产费用(万元) 报告期产量比基期增长% 基期 报告期
48
A 45.4 53.6 14.0 B 30.0 33.8 13.5 C 55.2 58.5 8.6 要求:(1)计算三种产品的生产费用总指数; (2)计算以基期生产费用为权数的产量总指数; (3)根据(1)(2)推算单位成本总指数; (4)根据(1)(2)(3)分析产量和单位成本变动对总生产费用的影响。(参考:贾俊平《统计学》,中国人民大学出版社)
6、某城市三个市场上同一种商品的销售资料如下: 市场 销售价格(元/公斤) 销售量(公斤) 基期 报告期 基期 报告期 A市场 2.50 3.00 740 560 B市场 2.40 2.80 670 710 C市场 2.20 2.40 550 820 合 计 — — 1960 2090 要求:(1)编制该商品总平均价格的可变构成指数、固定构成指数和结构变动影响指数; (2)建立指数体系,从相对数和绝对数两方面对总平均成本的变动进行因素分析; (3)进一步综合分析销售价格变动和销售量结构变动对该种商品销售总额的影响。
7、生产同种产品的甲、乙、丙三个工厂有关资料如下: 工厂 劳动生产率(万元/人) 工人数(人) 基期 报告期 基期 报告期 甲 2 3 100 100 乙 4 6 150 190 丙 3 4 80 90 试问:(1)由于各厂劳动生产率及总体人数结构两个因素变动而使总平均劳动生产率提高了百分之几?因此而增加的总产值为多少? (2)由于各厂劳动生产率水平变动而使总平均劳动生产率提高了百分之几?因此而增加的总产值为多少? (3)又由于工人人数结构变动而使总平均劳动生产率提高了百分之几?因此而增加的总产值为多少?
8、某地区粮食作物的生产情况如下: 粮食 播种面积(亩) 亩产(百公斤/亩) 作物 2002年 2003年 2002年 2003年 水稻 5 4 4 5 小麦 7 9 3 4 要求:分别计算粮食总平均亩产的可变构成指数、固定构成指数和结构变动影响指数,从相对数和绝对数两方面对总平均亩产的变动进行因素分析。
9、已知某地区2002年的农副产品收购总额为360亿元,2003年比上年的收购总额增长12%,农副产品收购价格总指数为105%。试考虑,2003年与2002年相比:(1)农民因交售农副产品共增加多少收入?(即是问农副产品收购总额增加
49
了多少);(2)农副产品收购量增加了百分之几?农民因此增加了多少收入?(3)由于农副产品收购价格提高5%,农民又增加了多少收入?(4)验证以上三方面的分析结论能否保持协调一致。
10、已知某市商品零售资料如下表: 指数(%) 固定权数(%) 1、食品类 51.5 (1) 粮食 101.8 20 (2) 副食品 102.4 50 (3) 烟酒茶 101.2 16 (4) 其他食品 108.2 14 2、衣着类 99.5 23 3、日用品类 101.5 12.7 4、文化用品类 102.4 4.8 5、医药类 102.6 4.0 6、燃料 100.4 4.0 要求:计算该市的食品类指数和零售物价总指数。
11、推算指数:
(1)价格上涨后,同样多的人民币只能购买基期商品的80%,求物价指数。 (2)假设某造纸厂2002年比2001年的产量增长了13.6%,生产费用增长了12.9%,问该厂2002年的产品成本比2001年降低了多少?
(3)报告期粮食总产量增长12%,粮食播种面积增加9%,则粮食作物单位面积产量增加了多少?
(4)某厂2003年职工的工资水平提高了3.2%,职工人数增加了2%,则该厂工资总额如何变动?
50