统计学知识点
第一章 绪论
第二章 统计调查 第三章 统计整理
1、统计整理:概念、意义、方法、内容
2、统计分组:意义、种类、分组标志、分组方法(品质标志、数量标志、单项式与组距式、组限、组中值)
3、统计分布:概念、构成要素、类型、频数和频率、次数分布特征、 4、变量分布数列的编制 5、统计表
第四章 综合指标
1、总量指标:概念、种类、作用
2、相对指标:概念、种类与计算(结构相对指标、比例相对指标、比较相对指标、强度相对指标、计划完成相对指标)
3、平均指标:概念、计算(简单算术与加权算术、简单调和与加权调和、简单几何与加权几何、中位数、众数)
4、变异指标:概念、种类和计算(全距、平均差、标准差、变异系数 第五章 抽样调查
1、抽样调查:概念、特点
2、抽样的基本概念:全及总体和样本总体、全及指标和抽样指标、样本容量和样本个数、重复抽样和不重复抽样、
3、抽样误差:抽样平均误差、抽样极限误差 4、抽样估计方法:区间估计
5、抽样组织形式:样本容量的计算 第六章 相关与回归 1、相关的概念及种类
2、相关系数计算
3、回归分析的概念和特点
4、简单线性回归方程的建立和求解 5、判定系数和标准误差 6、利用回归方程进行预测 第七章 时间数列
1、动态数列:概念、种类、编制原则 2、平均发展水平(序时平均数) 3、增长量和平均增长量
4、发展速度(定基发展速度与环比发展速度) 5、增长速度(定基增长速度和环比增长速度) 6、平均发展速度和平均增长速度 7、动态数列的四个构成因素
8、直线长期趋势的测定方法(移动平均法、最小平方法) 9、季节指数的基本测定方法。 第八章 指数
1、指数的概念与分类
2、综合指数的概念和特点
1
3、综合指数的计算(拉斯贝尔指标指数、派许指标指数)
4、平均指数概念(加权算术平均指数、加权调和平均数指数) 5、平均指数计算
6、平均指标指数的概念 7、平均指标指数的计算 8、指标体系与因素分析 9、指数的应用
题型包括:填空题、是非题、单项选择题、多项选择题、计算题、简答题
第三章 统计整理
1、统计整理:概念、意义、方法、内容、 简答题:
1. 为什么进行资料的整理?
答案:通过统计调查所取得的总体各单位的资料是零星的,分散的,只能说明总体单位的情况,而不能反映总体特征。统计整理对调查资料进行科学加工,使之系统化,成为说明总体特征的综合资料,实现了由反映总体单位特征的标志向反映总体综合数量特征的统计指标的转化,是从对社会经济现象个体量的观察到对社会经济现象总体量的认识的连接点,是人们对社会经济现象从感性认识到理性认识的过渡阶段。统计整理在整个统计工作中发挥着承上启下的作用。
2、统计分组:意义、种类、分组标志、分组方法(品质标志、数量标志、单项式与组距式、组限、组中值) 填空题:
1、统计分组的关键在于 的选择。 答案:(分组标志)
2、统计分组按分组标志的多少有两种形式: 和 。 答案:(简单分组、复合分组)
3、组距式分组根据其分组的组距是否相等可分为 分组和 分组。 答案:(等距分组、异距分组)
4、在组距数列中,表示各组界限的变量值称为 ,各组上限与下限之间的中点数值称为 。
答案:(组限、组中值) 是非题:
1. 按数量标志分组所形成的变量数列就是次数分布数列。( ) 答案:√
2. 按品质标志分组的结果形成变量数列。( ) 答案:×
3. 组中值的假定性是指假定各单位变量在本范围内均匀分布。( ) 答案:√
4. 异距分组中,为消除组距不等对次数实际分布的影响,一般需计算次数密度。( ) 答案:√
5. 所谓“上限不在内原则”是对连续变量分组采用重叠组限时,习惯上规定一般只包括本组下限变量值的单位,而当单位的变量值恰恰为组的上限时,不包括在本组。( ) 答案:√
2
6. 组距实际上是各组变量值的变动范围,计算组距的通用公式是:“组距=本组上限-前组上限”。( ) 答案:×
7、统计分组的关键问题是确定组距和组数。( ) 答案:×
8、按数量标志分组的目的,就是要区分各组在数量上的差别。( ) 答案:×
单项选择题
1.统计分组的关键在于( )。
A. 确定分组标志 B. 确定组数 C. 确定组距 D. 确定分组界限 答案:A
2.将统计总体按某一标志分组的结果表现为( )。
A. 组内同质性,组间差异性 B. 组内差异性,组间差异性 C. 组内差异性,组间同质性 D. 组内同质性,组间同质性 答案:A
3. 以一个企业的工人为总体,研究任务是分析该企业工人的文化素质,则分组标志应选择( )。
A. 工人的技术等级 B. 工人的文化程度 C. 工人的日产量 D. 工人的出勤天数 答案:B
4.工业企业按经济类型分组和工业企业按职工人数分组,两个统计分组是( )。 A. 按数量标志分组 B. 按品质标志分组 C. 前者按数量标志分组,后者按品质标志分组 D. 前者按品质标志分组,后者按数量标志分组 答案:D
5.等距数列中,组距的大小与组数的多少成( )。
A. 正比 B. 等比 C. 反比 D. 不成比例 答案:C
6、企业按资产总额分组( )。
A.只能使用单项式分组 B.只能使用组距式分组 C.可以单项式分组,也可以用组距式分组 D.无法分组 答案:C
7、划分连续变量的组限时,相邻的组限必须( )。 A.重叠 B.相近 C.不等 答案:A 多项选择题
1. 统计分组同时具备两个方面的含义( )。
A. 对个体来讲,是“分” B. 对总体来讲,是“合” C. 对个体来讲,是“合” D. 对总体来讲,是“分” E. 无法确定“分”和“合” 答案:C、D
2. 统计分组的作用在于( )。
A. 区分事物的本质 B. 反映总体的内部结构C. 研究现象之间的依存关系 D. 反映总体的基本情况 E. 说明总体单位的数量特征 答案:A、B、C
3. 统计分组后 ( )。
3
A. 各组之间出现了显著差异 B. 同一组内保持着相同的性质 C. 各组之间性质相同 D. 有的可反映总体的内部结构 E. 有的可反映现象之间的依存关系 答案:A、B、D、E
4. 现将某班40名学生的统计学成绩分别列入60分以下、60-70、70-80、80-90、90分以上5个组中,这种分组是( )。
A. 形成变量数列 B. 形成组距数列 C. 形成品质数列 D. 按质量标志分组 E. 按数量标志分组 答案:A、B、E
5. 下列按数量标志分组的有( )。
A. 教师按聘任职务分组 B. 学生按所学专业分组
C. 职工按工资级别分组 D. 人口按民族分组 E. 商业企业按销售额分组 答案:C、E
6、统计分组是( )
A.在统计总体内进行的一种
B.在统计总体内进行的一种定量分类 C.将同一总体区分为不同性质的组
D.把总体划分为一个个性质不同的、范围更小的总体 E.将不同的总体划分为性质不同的组 答案:A、C、D
7、统计分组的作用是( )
A.划分社会经济类型 B.说明总体的基本情况 C.研究同质总体的结构 D.说明总体单位的特征 E.分析被研究现象总体诸标志之间的联系和依存关系 答案:A、C、E
8、在组距数列中,组中值是( )
A.上限和下限之间的中点数值
B.用来代表各组标志值的平均水平 C.在开放式分组中无法确定
D.在开放式分组中,可以参照相邻组的组距来确定 E.就是组平均数 答案:A、B、D 简答题
1、什么是统计分组?统计分组的作用有哪些?
答案:根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。
区分社会经济现象的类型、研究总体内部结构及其变化、探讨现象之间的依存关系 2、如何理解选择分组标志和划分各组界限是统计分组的关键问题?
答案:统计分组的关键是选择分组标志和划分各组界限。因此,统计分组的方法就是指分组标志的选择和各组界限的划分方法。分组标志是分组的标准或依据。因此,分组标志选择得恰当与否,直接关系到能否正确反映总体内部的性质特征。所以在实际工作中应根据统计研究的目的与任务正确选择分组标志。
划分各组界限,就是要在分组标志的变异范围内,划定各相邻组间的性质界限或数量界限。
划分各组界限,应当依据统计研究的目的和要求,确定总体在已选定的分组标志下有多少种性质不同的具体表现,再研究确定各组之间的具体界限。
4
3、统计分布:概念、构成要素、类型、频数和频率、次数分布特征、 填空题: 1、各种不同性质的社会经济现象的次数分布主要有四种类型: 、 、 和 。 答案:(钟形分布、U形分布、正J型曲线、反J型曲线)
2、次数分配是由 和 两个要素构成的。表示各组单位数的次数又称为 ,各组次数与总次数之比称为 。 答案:(变量、次数、频数、频率) 单项选择题
1. 在次数分布中,比率是指( )。
A. 各组分布次数比率之比 B. 各组分布次数与总次数之比 C. 各组分布次数相互之比 D. 各组比率相互之比 答案:B
2. 次数分配数列是指( )。
A. 各组组别依次排成的数列 B. 各组次数依次排成的数列
C. 各组组别与次数依次排列而成的数列 D. 各组频率依次排成的数列 答案:C
3. 下面属于变量分配数列的资料有( )。
A. 大学生按专业分配 B. 电站按发电能力分配
C. 商业企业按类型分配 D. 企业按国民经济类型分配 答案:B
4. 一定条件下,人的身高与体重的分布服从( )。
A. 钟型分布 B. U型分布 C. 正J型分布 D. 反J型分布 答案:C
5. 要准确地反映异距数列的实际分布情况,必须计算( )。 A. 次数 B. 次数密度 C. 频率 D. 累计频率 答案:B
6、次数分配数列是( )。
A.按数量标志分组形成的数列 B.按品质标志分组形成的数列 C.按统计指标分组所形成的数列
D.按数量标志和品质标志分组所形成的数列 答案:D
7、次数分布的类型主要决定于( )。
A.统计总体所处的条件 B.社会经济现象本身的性质 C.分组标志的选择 答案:B 多项选择题
1. 次数分布的主要类型有( )。
A. 钟形分布 B. U形分布 C. J形分布 D. S形分布 E. 十形分布答案:ABC
2、在次数分配数列中( )
A.总次数一定,频数和频率成反比 B.各组的频数之和等于100
C.各组频率大于0,频率之和等于1
D.频数越小,则该组的标志值所起的作用越小
5
E.频率又称为次数 答案:CD
4、变量分布数列的编制 计算题
1、1.对50只灯泡的耐用时数进行测试,所的数据如下(单位:小时)
886 928 999 946 950 864 1050 927 949 852 1027 928 978 816 1000 918 1040 854 1100 900 866 905 954 890 1006 926 900 999 886 1120 893 900 800 938 864 919 863 981 916 818 946 926 895 967 921 978 821 924 651 850 要求:
(1) 根据上述资料编制频数分布数列 (2) 编制向上和向下累计频数数列
(3) 根据编制的频数分布数列绘制直方图
(4) 根据直方图说明灯泡耐用时数的分布属于哪一种类型?
答案:(1)频数分布数列 n=5,i=93.8=100 耐用时间 800以下 800—900 900—1000 1000—1100 1100—1200 合 计 (2)直方图 灯泡个数 1 16 26 5 2 50 比重% 2 32 52 10 4 100 向上累计 次数 1 17 43 48 50 — 比重 2 34 86 96 100 — 向下累计 次数 50 49 33 7 2 — 比重 100 98 66 14 4 — 个数302520151050800以下800—900900—10001000—11001100—1200时间
6
耐用时间呈现钟型分布或正态分布。
2、某车间有30个工人看管机器数量的资料如下:
5 4 2 4 3 4 3 4 4 5 4 3 4 2 6 4 4 2 5 3 4 5 3 2 4 3 6 3 5 4 以上资料编制变量分配数列。 答案:
看管机器台数(台) 工人人数(人) 频率(%) 2 4 10.33 3 7 20.33 4 12 40.00 5 5 10.67 6 2 6.67 合计 30 100.00 说明:对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,用单项式分组。
3、某班40名学生统计学考试成绩分别为:
68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81
学校规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90分为良,90─100分为优。要求:
(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。 (2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。 答案:
(1) 成 绩 学生人数(人) 频率(%) 3 60分以下 7.5 6 60-70 15.0 15 70-80 37.5 12 80-90 30.00 4 90-100 10.00 合 计 40 100.00
(2)分组标志为“成绩”,其类型为“数量标志”;
分组方法为:变量分组中的组距式分组,而且是开口式分组;
本班学生的考试成绩的分布呈两头小,中间大的“正态分布”的形态。
简答题
1、离散型变量和连续型变量有何不同?什么情况下可以编制单项式数列, 什么情况下可以编制组距式数列? 答案: 7
变量按其数值是否连续可分为连续性变量和离散性变量。连续性变量的数值是连续不断的,任意两个变量值之间可以做无数种分割,如工业总产值、商品销售额、身高、体重等,既可用小数表示,也可用整数表示;离散变量的取值可以按一定次序一一列举,如工厂数、工人数、机器台数等,变量值通常用整数表示。
对离散变量,如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组,均可采用单项式分组。
离散变量如果变量值的变动幅度很大,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。 也就是说,离散变量根据情况既可用单项式分组,也可用组距式分组。在组距式分组中,相邻组既可以有确定的上下限,也可将相邻组的组限重叠。
连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。 5、统计表 填空题:
1.从形式上看,统计表主要由 、 、 和 四部分组成;从内容上看,统计表由 和 两部分组成。
答案:(总标题、横行标题、纵栏标题、指标;主词、宾词)
8
第四章 综合指标
1、总量指标:概念、种类、作用 填空题: 是非题
单项选择题 多项选择题 计算题 简答题
2、相对指标:概念、种类与计算(结构相对指标、比例相对指标、比较相对指标、强度相对指标、计划完成相对指标) 单项选择题
1.1990年,我国人均粮食产量393.10公斤,人均棉花产量3.97公斤,人均国民生产总值为1558元,它们是( )
A结构相对指标 B比较相对指标 C比例相对指标 D强度相对指标 答案: D
2.2001年我国国内生产总值为95533亿元,这是( )
A时期指标 B时点指标 C总量指标 D平均指标 答案: C
3.下列指标中属于时点指标的是( )
A国内生产总值 B流通费用率 C人均利税额 D商店总数 答案: D
4.下列指标属于比例相对指标的是( )
A工人出勤率 B农轻重的比例关系 C每百元产值利税额 D净产值占总产值的比重 答案: B
5.下列指标属于总量指标的是( )
A人均粮食产量 B资金利税率 C产品合格率 D学生人数 答案: D
6.将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( )
A动态相对指标 B结构相对指标 C比例相对指标 D比较相对指标 答案: D 7.一个企业产品销售收入计划增长8%,实际增长20%,则计划超额完成程度为( )
A12% B150% C111.11% D11.11% 答案: D
8.时点指标的数值( )
A与其时间间隔长短无关 B通常连续登记 C时间间隔越长,指标数值越大 D具有可加性 答案: A
9.某产品单位成本计划1997年比1996年降低10%,实际降低15%,则计划完成程度为( )
A150% B94.4% C104.5% D66.7%
9
答案: B
10.总体各部分指标数值与总体数值计算求得的结构相对数之和( )
A大于100% B小于100% C等于100% D无法确定 答案: C 多项选择题
1.下列指标属于动态相对指标的有( )
A1981年到1990年我国人口平均增长1.48% B1990年国民生产总值为1980年的236.3%
C1990年国民生产总值中,第一、二、三产业分别占28.4%、44.3%、27.3% D1990年国民收入为1952年的2364.2%
E1990年国民收入使用额中积累和消费分别占34.1%和65.9% 答案: ABD
2.下列指标属于总量指标的有( )
A国内生产总值 B人均利税总额 C利税总额 D职工人数 E固定资产原值 答案: ACDE
3.下列指标中,属于强度相对指标的有( )
A人均国内生产总值 B人口密度 C人均钢产量 D每千人拥有的商业网点数 E人均粮食产量 答案: ABCDE
4.常用的相对指标有( )
A动态相对指标 B结构相对指标 C强度相对指标 D比较与比例相对指标 E计划完成程度相对指标 答案: ABCDE
5.相对指标数值的表现形式有( )
A比例数 B无名数 C结构数 D抽样数 E复名数 答案: BE 计算题
1.某集团所属的三家公司2001年工业产值计划和实际资料如表1所示:
表1 单位:万元 2001 2000年2001年 公司 实际 比2000计 划 实 际 计划完名称 年 产值 比重(%) 产值 比重(%) 成(%) 产值 增长(%) A 97 9.3 B 31 111 C 370 402 –0.8 合计 1900 1500.0 试填入上表所缺的数字,要求写出计算过程。 答案:1.
10
公司 名称 A B C 合计 计 划 产值 比重(%) 941 589 370 1900 49.5 31 19.5 100 2001 2000年实际 实 际 计划完产值 比重(%) 成(%) 产值 912.8 653.8 402 1968.6 46.4 33.2 20.4 100.0 97 111 108.6 103.6 835.1 259.7 405.2 1500.0 2001年 比2000年 增长(%) 9.3 151.8 –0.8 31.2 2.某制冷机公司计划在未来的五年内累计生产压缩机12000台,其中,最后一年产量达到3000台,实际完成情况如下表所示:
单位:台 第四年 第五年 第一第二第三时间 年 年 年 一季 二季 三季 四季 一季 二季 三季 四季 产量 2000 2300 2600 650 650 700 750 750 800 800 850 试求:(1)该公司五年累计完成计划程度? (2)该公司提前多少时间完成累计产量计划?
(3)该公司提前多少时间达到最后一年计划产量? 答案:解:(1)五年累计计划完成107.08%; (2)提前一季度完成累计产量计划;
(3)提前半年达到最后一年计划产量。 3.现有甲、乙两国钢产量和人口资料如表:
表 甲 国 乙 国 2000年 2001年 2000年 2001年 钢产量(万吨) 3000 3300 5000 5250 年平均人口数(万人) 6000 6000 7143 7192 试通过计算动态相对指标、强度相对指标和比较相对指标来简单分析甲、乙两国钢产量的发展情况。 答案: 比较相对指标甲国 乙国 (甲:乙) 20002001发展速20002001发展速20002001年 年 度(%) 年 年 度(%) 年 年 钢产量 62.853000 3300 110 5000 5250 105 60% (万吨) % 年平均人口数6000 (万人) 人均钢产量(吨/人) 6000 100 7143 7192 100.69 0.5 0.55 110 0.7 0.73 104.28
11
简答题
3、平均指标:概念、计算(简单算术与加权算术、简单调和与加权调和、简单几何与加权几何、中位数、众数) 是非题
1.计算平均指标的同质性原则是指社会经济现象的各个单位在被平均的标志上具有同类性。( ) 答案:×
2.权数对算术平均数的影响作用大小取决于权数本身绝对值的大小。( ) 答案:×
3.当各组的单位数相等时,各组单位数与总体单位数的比重也相等,所以权数的作用也就没用了。( ) 答案:×
4.利用组中值计算算术平均数是假定各组内的标志值是均匀分布的,计算结果是准确的。( ) 答案:×
5.调和平均数是根据标志值的倒数计算的,所以又称为倒数平均数。( ) 答案:√
6.几何平均数是计算平均比率和平均速度最适用的一种方法。( ) 答案:√
7.众数是总体中出现次数最多的变量值,因而,在总体中众数必定存在,而且是唯一的。( ) 答案:×
8.众数只适用于变量数列不适用于品质数列。( ) 答案: ×
9.当中位数组相邻两组的次数相等时,中位数就是中位数组的组中值。( )答案:× 10.若一个分配数列的算术平均数大于众数,则偏度系数为正数,表明这组分布的峰部偏向右边,且偏度系数越大表明右偏程度越大。( ) 答案:×
11.上四分位数与下四分位数之差称为四分位差。( ) 答案:× 12.在钟型分布只存在适度或轻微偏斜的情形下,中位数与算术平均数的距离,大约只是中位数与众数距离的一半。( ) 答案:× 13.当分布对称时,它的所有偶数中心距均为零,所以可以考虑用偶数中心距来判定分布是否对称。( ) 答案: × 单项选择题
1.平均指标反映( )。
A. 总体分布的集中趋势 B. 总体分布的离散趋势 C. 总体分布的大概趋势 D. 总体分布的一般趋势 答案: A
2.平均指标是说明( )。
A. 各类总体某一数量标志在一定历史条件下的一般水平 B. 社会经济现象在一定历史条件下的一般水平
12
C. 同质总体内某一数量标志在一定历史条件下的一般水平 D. 大量社会经济现象在一定历史条件下的一般水平 答案: C
3.计算平均指标最常用的方法和最基本的形式:( )
A.中位数 B. 众数 C. 调和平均数 D. 算术平均数 答案: D
4.算术平均数的基本计算公式( )。 A. 总体部分总量与总体单位数之比 B. 总体标志总量与另一总体总量之比 C. 总体标志总量与总体单位数之比 D. 总体标志总量与权数系数总量之比 答案: C
5.加权算术平均数中的权数为( )。
A. 标志值 B. 权数之和 C. 单位数比重 D. 标志值的标志总量 答案: C
6.权数对算术平均数的影响作用决定于( )。
A. 权数的标志值 B. 权数的绝对值 C. 权数的相对值 D. 权数的平均值 答案: C
7.加权算术平均数的大小( )。
A. 主要受各组标志值大小的影响,而与各组次数的多少无关 B. 主要受各组次数大小的影响,而与各组标志值的多少无关 C. 既受各组标志值大小的影响,又受各组次数多少的影响 D. 既与各组标志值的大小无关,也与各组次数的多少无关 答案: C
8.在变量数列中,若标志值较小的组权数较大时,计算出来的平均数( )。 A. 接近于标志值小的一方 B. 接近于标志值大的一方 C. 接近于平均水平的标志值 D. 不受权数的影响 答案: A
9.假如各个标志值都增加5个单位,那么算术平均数会:( )。 A. 增加到5倍 B. 增加5个单位 C. 不变 D. 不能预期平均数的变化 答案: B
10.各标志值与平均数离差之和( )。
A. 等于各变量平均数离差之和 B. 等于各变量离差之和的平均数 C. 等于零 D. 为最大值 答案: C
11.当计算一个时期到另一个时期的销售额的年平均增长速度时,应采用哪种平均数?( )
A. 众数 B. 中位数 C. 算术平均数 D. 几何平均数 答案: D
12.对比不同地区的粮食生产水平,应该采用的指标是( )。
A. 人均粮食产量 B. 单位粮食产量 C. 粮食总产量 D. 平均单位粮食产量 答案: A
13.众数是( )。
A. 出现次数最少的次数 B. 出现次数最少的标志值 C. 出现次数最多的标志值 D. 出现次数最多的频数
13
答案: C
14.由组距数列确定众数时,如果众数组的相邻两组的次数相等,则( )。A. 众数在众数组内靠近上限 B. 众数在众数组内靠近下限 C. 众数组的组中值就是众数 D. 众数为零 答案: C
15.某地区8月份一等鸭梨每公斤1.8元,二等鸭梨每公斤1.5元,10月份鸭梨销售价格没变,但一等鸭梨销售量增加8%,二等鸭梨销售量增加10%,10月份鸭梨的平均销售价格是( )。
A. 不变 B. 提高 C. 下降 D. 无法确定 答案: C
16.当x?Me?M0时,其总体分布的状况为( )。
A. 钟型分布 B. 对称的钟型分布 C. 对称的U形分布 D. U形分布 答案: B 多项选择题
1.平均指标是( )。
A. 一个综合指标 B. 根据变量数列计算的C. 根据时间数列计算的 D. 在同质总体内计算的 E. 不在同质总体内计算的 答案: ABD
2.平均指标具有同类现象在不同空间上对比的作用,其理由是( )。
A. 它反映了不同总体的单位数的差异程度 B. 它反映了总体单位数量差异C. 它消除了总体单位数多少的影响 D. 平均值表示一个代表值 E. 平均值表示将性质不同的现象抽象化 答案: CD
3.算术平均数的基本公式是( )。
A. 分子分母同属于一个总体 B. 分子分母的计量单位相同 C. 分母是分子的承担者 D. 分母附属于分子 E. 分子分母均是数量指标 答案: ACE
4.加权算术平均数的大小不仅受各标志值大小的影响,也受各组次数多少的影响,因此( )。
A. 当较大的标志值出现次数较多时,平均数接近标志值大的一方 B. 当较小的标志值出现次数较少时,平均数接近标志值小的一方 C. 当较大的标志值出现次数较少时,平均数接近标志值大的一方 D. 当较小的标志值出现次数较多时,平均数接近标志值小的一方 E. 当不同标志值出现的次数相同时,对平均值的大小没有影响 答案: ADE
5.简单算术平均数之所以简单,是因为( )。
A. 所计算的资料未分组 B. 所计算的资料已分组 C. 各组次数均为1 D. 各变量值的次数分布不同 E. 各变量值的频率不相同 答案: AC
6.当( )时, 加权算术平均数等于简单算术平均数。
A. 各组标志值不相等 B. 各组次数均相等 C. 各组次数不相等 D. 各组次数均为1 E. 各组标志值均相同
14
答案: BD
7.计算加权算术平均数,在选定权数时,应具备的条件是( )。 A. 权数与标志值相乘能够构成标志总量 B. 权数必须是总体单位数 C. 权数必须表现为标志值的直接承担者 D. 权数必须是单位数比重 E. 权数与标志值相乘具有经济意义 答案: ABCDE
8.运用调和平均数计算算术平均数时,应具备的条件是( )。 A. 掌握总体标志变量和相应的标志总量 B. 掌握总体标志总量和总体单位数资料 C. 缺少算术平均数基本形式的分母资料 D. 掌握变量为相对数和相应的标志总量 E. 掌握变量为平均数和相应组的标志总量 答案: ACD
9.现有两种蔬菜,一种每元买4斤,一种每元买5斤,求各买1斤和各买1元的平均价格( )。
A. 各买1斤的总体是2斤蔬菜 B. 各买1元的总体是2元钱 C. 各买1斤的总体是0.45元 D. 各买1元的总体是9斤蔬菜 E. 各买1斤和各买1元的总体是该种蔬菜 答案: ADE
10.下列哪些现象应该利用算术平均数计算( )。 A. 已知工资总额及工人人数求平均工资 B. 已知各期环比发展速度求平均发展速度
C. 已知实际产量和计划完成百分比求平均计划完成百分比 D. 已知各产品等级及各级产品产量求平均等级 E. 已知产品产量及各产品的单位成本求平均成本 答案: ADE
11.不受极端值影响的平均指标有( )。
A. 算术平均数 B. 调和平均数 C. 几何平均数 D. 众数 E. 中位数 答案: DE
12.中位数( )。
A. 是居于数列中间位置的那个数 B. 是根据各个变量值计算的 C. 不受极端变量值的影响 D. 不受极端变量值位置的影响 E. 在组距数列中不受开口组的影响 答案: ACDE 13.假定市场上某种商品最多的成交价格为每公斤4.60元,则每公斤4.60元( )。 A. 可用来代表这种商品的一般价格水平 B. 是平均指标值 C. 是中位数 D. 是众数 E. 是调和平均数 答案: ABD
14.众数( )。
A. 是居于按顺序排列的分组数列中间位置的变量值 B. 是出现次数最多的变量值 C. 是根据各个变量值计算的 D. 不受极端变量值的影响 E. 在组距数列中不受开口组的影响 答案: BDE
15
15.在左偏态分布中( )。
A. 中位数大于算术平均数 B. 中位数大于众数 C. 众数大于算术平均数 D. 众数小于算术平均数 E. 算术平均数小于众数,也小于中位数 答案: ACE
16.如果在分配数列中,有一个标志值为零,则不能计算( )。
A. 加权算术平均数 B. 加权调和平均数 C. 简单调和平均数 D. 简单几何平均数 E. 加权几何平均数 答案: BCDE
17.平均指标( )。
A. 是质量指标 B. 是数量指标 C. 能反映总体分布的集中趋势 D. 能反映总体单位的一般水平 E. 是一个综合性指标 答案: ACDE
18.平均指标的应用原则( )。
A.现象总体的同质性 B. 现象总体的可比性
C.用组平均数补充说明总平均数 D.用分配数列补充说明总平均数 E.用标志变异指标补充说明总平均数 答案: ACDE
19.同质总体的标志变异指标可以( )。
A. 衡量平均数的代表性的大小 B. 反映生产过程的均衡性 C. 表明经济过程的节奏性 D. 说明单位标志值分布的离中趋势 E. 测定集中趋势指标的代表性 答案: ABCDE
计算题
1.某工厂生产班组有12名工人,每个工人日产产品件数为:17、15、18、16、17、16、14、17、16、15、18、16,计算该生产班组工人的平均日产量。 答案:16.25
2.某公司本月购进材料四批,每批价格及采购金额如下: 价格 采购金额(元) 第一批 35 10000 第二批 40 20000 第三批 45 15000 第四批 50 5000 合计 — 50000 计算这四批材料的平均价格。 答案:
?xf=41.02 ?f
3.银行对某笔投资的年利率按复利计算,25年利率分配如下表:试计算其平均年利率。 16
答案:xG??ff1f2年限 第1年 第2年到第5年 第6年到第13年 第14年到第23年 第24年到第25年 合计 利率(%) 3 5 8 10 15 ____ 年数 1 4 8 10 2 25 x1?x2?x3?xn??ff3fnfix?i=8.64% i?1n4.根据某市500户居民家计调查的结果,得到下列资料: 恩格尔系数(%) 居民户数 20以下 6 20—30 38 30—40 107 40—50 137 50—60 114 60—70 74 70以上 24 合计 500 计算该市恩格尔系数的众数和中位数及算术平均数,并进行比较。 答案:MO=45.66 Me=47.22 x=47.66
5.根据下表的数据,计算50名工人日加工零件数的中位数。
某企业50名工人加工零件均值计算表
按零件数分组 频数f 105~110 3 110~115 5 115~120 8 120~125 14 125~130 10 130~135 6 135~140 4 合 计 50
答案:解:
17
某企业50名工人加工零件中位数计算表 按零件数分组频数(人) 向上累计向下累计(个) (人) (人) 105~110 3 3 50 110~115 5 8 47 115~120 8 16 42 120~125 14 30 34 125~130 10 40 20 130~135 6 46 10 135~140 4 50 4
中位数的位置 = 50/2 = 25,即中位数在120~125这一组,L = 120,Sm–1 = 16,U=125,Sm+1 =20,fm = 14,d = 5,根据中位数公式得:
50?16Me?120?2?5?123.21(件)
1450?202?5?123.21(件) 或Me?125?146.假定有A、B两家公司员工的月工资资料如表5–4的前三列。试分别计算其平均工资。
表5–4 两公司员工工资情况表 工资总额m(元) 员工人数月工资x f=m/x(人) (元) A公司 B公司 A公司 B公司 800 48000 40000 60 50 1000 70000 40000 70 40 1600 32000 40000 20 25 合计 150000 120000 150 115 答案:A公司的平均工资,得到: mi?i?133HA?mi?i?1xi?150000/150?1000(元)3?48000?70000?32000480007000032000
??80010001600对于B公司,固然也可以采用加权调和平均数公式来计算其平均工资:
HB??mi?xi?1i?13mii?40000?40000?40000
400004000040000??80010001600 ?120000 ?1043.48(元)1157.设有某行业150个企业的有关产值和利润资料如表。试分别计算一季度与二季度的平均产值利润率。 18
某行业产值和利润情况表 产值利润一 季 度 二 季 度 率(%) 企业数实际产值企业数实际利润(个) (万元) (个) (万元) 5-10 30 5700 50 710 10-20 70 20500 80 3514 20-30 50 22500 20 2250 合 计 150 48700 150 6474 答案:第一季度的平均产值利润率,应该采用实际产值加权,进行算术平均,即有:
一季度平均??xf?0.075?5700?0.15?20500?0.25?22500产值利润率?f5700?20500?22500?9127.5?18.74H700
而计算第二季度的平均产值利润率,则应该采用实际利润加权,进行调和平均,即有:
二季度平均?m710?3514?2250??71035142250产值利润率m???x0.0750.150.25 6474??15.45A893.38.某工商银行某项投资年利率是按复利计算的。20年的利率分配如表,计算20年的平均年利率。
投资年利率分组表 年限 年利率(%) 本利率(%)xi 年数(个)fi 第1年 5 105 1 第2年至第4年 8 108 3 第5年至第15年 15 115 11 第16年至第20年 18 118 5 合 计 — — 20 答案:按公式计算20年的平均年利率:
xG?201.051?1.083?1.1511?1.185?114.14%
即20年的平均年利率为114.14%-1=14.14%
4、变异指标:概念、种类和计算(全距、平均差、标准差、变异系数 填空题: 是非题
1.标志变异指标既反映了总体各单位标志值的共性,又反映了它们之间的差异性。( ) 答案:×
2.全距不受中间标志值的影响。( ) 答案: √
3.对于同一数列,同时计算平均差和标准差,二者一定相等。( ) 答案:× 19
4.平均差所平均的是离差本身,而标准差所平均的是离差的平方。( ) 答案:√
5.对任何两个性质相同的变量数列,比较其平均数的代表性,都可以采用标准差指标。( ) 答案:×
6.变量值越大,标准差越大;反之,变量值越小,标准差越小。( ) 答案:×
7.方差也叫均方差。( ) 答案: × 8.如果两个数列的变异系数相同,则说明两个平均数对各自数列的代表性相同。( ) 答案:√
9.甲、乙两组工人生产同一种产品,甲组工人平均日产量为60件,标准差为7.2件,乙组工人平均日产量为55件,标准差为6.6件,故工人平均日产量的代表性乙组比甲组大。( ) 答案:×
10.已知变量数列的平均数是100,标准差系数是0.2,则方差等于20。( ) 答案:× 单项选择题
1.标志变异指标表明( )。
A. 标志值的分配 B. 总体各单位之间的差异程度
C. 总体各单位标志值的差异抽象化 D. 反映总体各单位标志值的变动范围 答案: B
2.标志变异指标与平均数代表性之间存在( )。
A. 正比关系 B. 反比关系 C. 恒等关系 D. 倒数关系 答案: B
3.标志变异指标中最易受极端值影响的是( )。
A. 全距 B. 标准差 C. 平均差 D. 离散系数 答案: A
4.平均差与标准差的主要区别是( )。 A. 说明意义不同 B. 计算条件不同 C. 计算结果不同 D. 数学处理方法不同 答案: D
5.用标准差比较分析两个同类总体平均指标的代表性,其基本的前提条件是( )。 A. 两个总体的标准差应相等 B. 两个总体的平均数应相等 C. 两个总体的单位数应相等 D. 两个总体的离差之和应相等 答案: B
6.标志变异指标中最常用的有( )。
A.全距 B. 标准差 C. 平均差 D. 标准差系数 答案: B
7.为了比较两个不同总体标志的变异程度,必须利用( )
A.全距 B. 标准差 C. 平均差 D. 标准差系数 答案: D
8.两个总体的平均数不等,但标准差相等,则( )。 A. 平均数小,代表性大 B. 平均数大,代表性大 C. 两个平均数的代表性相同 D. 无法判断 答案: B
20
9.在一个次数分布中,x?90,??10,如果在总体中再加上80,70,60这三个标志值,则重新计算的标准差会( )。
A. 变小 B. 变大 C. 不变 D. 无法判断 答案: B
10.在甲乙两个变量数列中,若σ甲<σ乙,则两个变量数列平均水平的代表性程度相比较( )。
A. 两个数列的平均数的代表性相同 B. 甲数列平均数的代表性大于乙数列 C. 甲数列平均数的代表性小于乙数列 D. 不能确定哪个数列的代表性好 答案: D
多项选择题
1.通过标志变异指标可以反映( )。
A. 分配数列中各标志值的集中趋势 B. 分配数列中各标志值的变动范围 C. 分配数列中各标志值的离散程度 D. 总体各单位标志值的离异程度 E. 总体各单位标志值的分布特征 答案: BCD
2.标准差和平均差的共同点是( )。 A. 受极端值的影响均较大
B. 均以算术平均数为中心来测定各变量值的离散程度 C. 对正负离差综合平均的方法相同 D. 都考虑到各变量值与平均数的离差
E. 在反映总体的标志变异程度方面都有比全距准确 答案: ABDE
3.两个变量数列的标准差相等,则说明两个变量数列( )。 A. 各标志值与其算术平均数离差平方的平均数相等
B. 各标志值平方的平均数与其算术平均数的平方之差相等 C. 各标志值平方的平均数与其算术平均数的平方之和相等 D. 平均水平相等 E. 标志变异程度相等 答案: AB
4.当( )时,可以利用标准差系数比较两个总体的平均数代表性大小。 A. 两个平均数相等 B. 两个平均数不等
C. 两个平均数反映的现象不同 D. 两个平均数的计量单位相同 E. 两个平均数的计量单位不同 答案: BCE
5.变异系数( )。
A. 是反映标志变动度的相对指标 B. 是有名数 C. 其数值越大,说明平均数的代表性越大 D. 可以用来比较不同总体同一变量的差异 E. 可以用来比较同一总体同一变量的差异 F. 答案: AD
6.下列标志变异指标中,用无名数表示的有( )。 A. 全距 B. 平均差 C. 标准差 D. 平均差系数 E. 标准差系数 答案: DE
7.与平均数的计量单位一致的标志变异指标有( ) A. 全距 B. 平均差 C. 标准差
21
D. 平均差系数 E. 标准差系数 答案: ABC
8.能直接在不同总体间进行比较的标志变异指标有( )。 A. 全距 B. 平均差 C. 标准差 D. 平均差系数 E. 标准差系数 答案: DE
答案: 4. 5. 6. 7. 8.
计算题
1. 某企业工人按年工资分组资料如下:
按年工资分组(元) 工 人 数(人) 600—700 10 700—800 15 800—900 35 900—1000 12 1000—1100 8 合计 80
计算工人工资的平均数、全距、平均差、标准差、平均差系数、标准差系数。 答案:x=841.25 R=500 A.D=82.03 ?=110.94 VA.D=9.75% V?=13.19% 2.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下: 成年组:166 169 172 177 180 170 172 174 168 173 幼儿组: 68 69 68 70 71 73 72 73 74 75 比较分析哪一组的身高差异大?
答案:成年组:x=172 ?=4.202 V?=2.44%
幼儿组:x=71.3 ?=2.497 V?=3.5% 幼儿差异大
3.现有两个生产班组的工人日产量资料如下:
甲 班 组 乙 班 组 日产量(件) 人数(人) 日产量(件) 人数(人) 5 3 8 6 7 5 12 7 9 6 14 3 10 4 15 3 13 2 16 1 合 计 20 合 计 20
分别计算两个班组工人的平均日产量并说明哪个班组的平均数代表性大,为什么? 答案:甲班组:x=8.5 ?=2.22 V?=26.12%
22
乙班组:x=11.75 ?=2.74 V?=23.32%
甲组差异大
4. 两种不同水稻品种在4块田地上试种,其产量如下:
甲品种 乙品种 面积(公顷) 产量(公斤) 面积(公顷) 产量(公斤) 1.3 585 1.2 600 1.0 505 0.9 378 0.8 420 1.3 715 1.5 690 1.4 525 假定生产条件相同,确定两个品种的单位面积产量,并比较哪个品种具有较大的稳定性。
答案:甲品种:x=478.26 ?=29.51 V?=6.17%
乙品种:x=462.08 ?=70.71 V?=15.30%
甲品种稳定
5.试根据平均数及标准差的性质,回答下列问题:
(1)已知标志值的平均数为2600,标准差系数为30%,其方差为多少?
(2)已知总体标志值的平均数13,各标志值平方的平均数为174,标准差系数是多少? (3)方差为25,各标志值的平方的平均数为250,平均数为多少? 答案:(1)?2=608400
(2)V?=17.20%
(3)x=15
6.某商业企业9月份各天的销售额数据如下(单位:万元)
207 206 247 202 188 260 190 186 215 228 242 211 231 251 224 217 230 241 208 234 218 253 223 213 272 199 219 245 (1)计算该企业日销售额的均值和中位数; (2)计算该资料的上四分位数和下四分位数; (3)计算日销售额的极差、四分位差和标准差。 答案:(1)x=223.43 Me=221.50
(2)Q3=241 Q1=208
(3) R=86 Q.D=16.5 ?=21.43
7.甲、乙两厂生产同种电子元件,抽查其耐用时间的分组资料如下:
抽查元件数量(只) 耐用时间(小时) 甲厂 乙厂 1000以下 4 3 1000—1200 30 11 1200—1400 11 31 1400以上 5 5 合计 50 50 (1) 计算并比较哪个厂电子元件平均耐用时间长?
23
(2) 计算并比较哪个厂电子元件耐用时间差异较大?
(3) 分别计算两个厂电子元件耐用时间的众数和中位数,并判断两厂电子元件耐
用时间的分布属于何种分布? 答案:(1)甲厂 x=1168 乙厂 x=1252
(2)甲厂?=152.89 V?=13.09% ;乙厂 ?=141.76 V?=11.32% 甲厂的差异较大 (3) 甲厂 MO=1115.6 Me=1140, 右偏; 乙厂 MO=1286.96 Me=1270, 左偏
8.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15名工人,让他们分别用三种方法组装。15名工人分别用三种方法在相同的时间内组装的产品数量(单位:个)见下表:
方法A 方法B 方法C 164 129 125 167 130 126 168 129 126 165 130 127 170 131 126 165 130 128 164 129 127 168 127 126 164 128 127 162 128 127 163 127 125 166 128 126 167 128 116 166 125 126 165 132 125 (1)你准备采用什么方法来评价组装方法的优劣? (2)如果让你选择一种方法,你会做出怎样的选择?试说明理由。 答案:方法A:x=165.6 ?=2.13 V?=1.29%
方法B:x=128.73 ?=1.75 V?=1.36% 方法C:x=125.53 ?=2.77 V?=2.21%
方法A最好
9.在某地区抽取的120家企业按利润额进行分组,结果见下表:
24
按利润额分组/万元
200—300 300—400 400—500 500—600 600以上 合计
1)计算120家企业利润额的均值和标准差; 2) 计算分布的偏态系数和峰态系数。 答案:(1)x=426.67 ?=116.48
(2)?=0.20 ?=-2.46
10.下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。
1)你认为应该用什么样的统计测度值来反映投资的风险?
2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票? 3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?
企业数/个 19 30 42 18 11 120
答案:(1) 变异指标
(2)商业类股票 第五章 抽样调查
1、抽样调查:概念、特点 是非题
1. 随机抽样就是随意抽样。( ) 答案: × 单项选择题
1. 抽样调查的主要目的在于( )。
A. 计算和控制误差 B. 了解总体单位情况C. 用样本来推断总体 D. 对调查单位作深入的研究 答案: C
2. 抽样调查所必须遵循的基本原则是( )。
A. 随意原则 B. 可比性原则 C. 准确性原则 D. 随机原则 答案: D
25
3. 下列属于抽样调查的事项有( )。
A. 为了测定车间的工时损失,对车间的每三班工人中的第一班工人进行调查 B. 为了解某大学生食堂卫生状况,对该校的一个食堂进行了调查 C. 对某城市居民1%的家庭调查,以便研究该城市居民的消费水平
D. 对某公司三个分厂中的第一个分厂进行调查,以便研究该工厂的能源利用效果 答案: C 多项选择题
1. 抽样调查是( )。
A. 搜集资料的方法 B. 推断方法 C. 全面调查方法 D. 典型调查方法 E. 非全面调查方法 答案: ABE
2. 抽样调查的特点是( )。
A. 以部分推为全体 B. 按随机原则抽取单位 C. 抽样调查的目的在于推断有关总体指标 D. 抽样调查的目的在于推断有关总体指标 E. 抽样调查的目的在于了解总体的基本情况 答案: ABC
3. 抽样调查可用于( )。
A. 有破坏性的调查和推断 B. 较大规模总体或无限总体的调查和推断
C. 调查效果的提高 D. 检查和补充全面调查资料 E. 产品的质量检验和控制 答案: ABCDE
2、抽样的基本概念:全及总体和样本总体、全及指标和抽样指标、样本容量和样本个数、重复抽样和不重复抽样、 是非题
1. 一个全及总体可能抽取很多个样本总体。( ) 答案:√ 单项选择题
1. 通常所说的大样本是指样本容量( )。
A. 小于10 B. 不大于10 C. 小于30 D. 不小于30 答案:D 多项选择题
1. 从总体中可以抽选一系列样本,所以( )。
A. 总体指标是随机变量 B. 样本指标是随机变量 C. 抽样指标是样本变量的函数 D. 总体指标是唯一确定的 E. 抽样指标是唯一确定的 答案: BCD
2.抽样的基本组织形式有( )。
A. 纯随机抽样 B. 机械抽样 C. 分层抽样D. 整群抽样 E. 阶段抽样 答案: ABCDE
3、抽样误差:抽样平均误差、抽样极限误差 是非题
1. 抽样误差产生的原因是抽样调查时违反了随机原则。( ) 答案:×
2. 抽样平均误差就是总体指标的标准差。( ) 答案:×
3. 极限误差就是最大的抽样误差,因此,总体指标必然落在样本指标和极限误差共同构成的区间之内。( )
26
答案:×
4. 计算抽样平均误差,当缺少总体方差资料时,可以用样本方差来代替。( )答案:√
5. 抽样平均误差、总体标准差和样本容量的关系可用公式表达,因此在统计实践中,为了降低抽样平均误差,可缩小总体标准差或增大样本容量来达到。( )答案:× 6. 重复抽样误差一定大于不重复抽样误差。( ) 答案:√
7. 整群抽样为了降低抽样平均误差,在总体分群时注意增大群内方差缩小群间方差。( ) 答案:√
8. 当全及总体单位数很大时,重复抽样和不重复抽样计算的抽样平均误差相差无几。( ) 答案: √
单项选择题
1. 能够事先加以计算和控制的误差是( )。
A. 抽样误差 B. 登记误差 C. 代表性误差 D. 系统性误差 答案: A
2.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。抽样平均误差( )。
A. 第一工厂大 B. 第二个工厂大 C. 两工厂一样大 D. 无法做出结论 答案: B
3. 抽样平均误差是指抽样平均数(或抽样成数)的( )。 A. 平均数 B. 平均差 C. 标准差 D. 标准差系数 答案: C
4.在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( )。
A. 两者相等 B. 两者不等 C. 前者小于后者 D. 前者大于后者。 答案: C
5. 反映抽样指标与总体指标之间抽样的可能范围的指标是( )。
A. 抽样平均误差 B. 抽样误差系数C. 概率度 D. 抽样极限误差。 答案: D
6.在下列情况下,计算不重复抽样的抽样平均误差可以采用重复抽样公式( )。 A. 总体单位数很多 B. 抽样单位数很少 C. 抽样单位数对总体单位数的比重很小; D. 抽样单位数对总体单位数的比重较大。 答案: C
7.在进行纯随机重复抽样时,为使抽样平均误差减少25%,则抽样单位数应( )。 A. 增加25% B. 增加78%C. 增加1.78% D. 减少25% 答案: B
8.在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的( )。
A. 1.03倍 B. 1.05倍 C. 0.97倍 D. 95%倍 答案: A
9. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是( )。 A. 抽样单位数为20 B. 抽样单位数为40
27
C. 抽样单位数为90 D. 抽样单位数为100 答案: D
10. 抽样调查中( )。
A. 既有登记性误差,也有代表性误差 B. 只有登记性误差,没有代表性误差; C. 没有登记性误差,只有代表性误差 D. 上述两种误差都没有。 答案: A
11.对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%。概率为0.9545,优等生比重的极限抽样误差为( )。
A. 4.0% B. 4.13% C. 9.18% D. 8.26% 答案: D
12. 极限抽样误差△和抽样平均误差的数值之间的关系为( )。
A. 极限误差可以大于或小于抽样平均误差 B. 极限误差一定大于抽样平均误差 C. 极限误差一定小于抽样平均误差 D. 极限误差一定等于抽样平均误差 答案: A 多项选择题
1. 抽样误差是( )。
A. 抽样估计值与未知的总体真值之差 B. 抽样过程中的偶然因素引起的 C. 抽样过程中的随机因素引起的 D. 指调查中产生的系统性误差 E. 偶然的代表性误差 答案: ABCE
2. 抽样推断中的抽样误差( )。
A. 抽样估计值与总体参数值之差 B. 不可避免的 C. 可以事先计算出来 D. 可以加以控制的 E. 可以用改进调查方法的办法消除的 答案: ABCD
3. 影响抽样误差的因素有( )。
A. 抽样方法 B. 样本中各单位标志的差异程度
C. 全及总体各单位标志的差异程度 D. 抽样调查的组织形式 E. 样本容量 答案: ACDE
4. 抽样平均误差是( )。
A. 反映样本指标与总体指标的平均误差程度 B. 样本指标的标准差 C. 样本指标的平均差 D. 计算抽样极限误差的衡量尺度 E. 样本指标的平均数 答案: ABD
5.在其它条件不变的情况下,抽样极限误差的大小和可靠性的关系是( )。 A. 允许误差范围愈小,可靠性愈大 B. 允许误差范围愈小,可靠性愈小 C. 允许误差范围愈大,可靠性愈大 D. 成正比关系 E. 成反比关系 答案: BCD
6. 在一定的误差范围要求下( )。
A. 概率度大,要求可靠性低,抽样数目相应要多 B. 概率度大,要求可靠性高,抽样数目相应要多 C. 概率度小,要求可靠性低,抽样数目相应要少 D. 概率度小,要求可靠性高,抽样数目相应要少 E. 概率度小,要求可靠性低,抽样数目相应要多 答案: BC
7. 在抽样调查中应用的抽样误差指标有( )。
A. 抽样实际误差 B. 抽样平均误差 C. 抽样误差算术平均数
28
D. 抽样极限误差 E. 抽样误差的概率度 答案: BD
8. 计算抽样平均误差时若缺乏全及总体标准差或全及总体成数,可用下述资料代替( )。
A. 过去抽样调查所得的有关资料 B. 试验性调查所得的有关资料
C. 重点调查所得的有关资料 D. 样本资料 E. 过去全面调查所得的有关资料 答案: ABDE
9. 抽样时要遵守随机原则,是因为( )。 A. 这样可以保证样本和总体有相似的结构
B. 只有这样才能计算和控制抽样估计的精确度和可靠性 C. 只有这样才能计算登记性误差和抽样平均误差 D. 只有这样才能计算出抽样误差 E. 这样可以防止一些工作上的失误 答案: AB 计算题
1.某地区为了解职工家庭的收入情况,从本地区3000户家庭中,按不重复抽样的方法抽取300户职工家庭进行调查,调查结果如表1:
表1 某地区职工家庭收入情况调查资料 每户月收入(元) 收入调查户数(户) 400以下 40 400~600 80 600~800 120 800~1000 50 1000以上 10 合 计 300 (1)若用这300户家庭的月收入资料推算该地区3000户家庭月收入情况,则抽样平均误差为多少?
(2)若又从抽样资料知,月平均收入在800元以上的户数的比重为20%,故月收入在800元以上成数抽样平均误差为多少? 答案:1.?x?40400300(1?)?11.0(元) 3003000?p??p(1?p)n(1?)nN0.2?0.81?300()?2.19003000
简答题
4、抽样估计方法:区间估计 单项选择题
1. 在进行抽样估计时,常用的概率度t的取值( )。 A. t<1 B. 1≤t≤3 C. t=2 D. t>3 答案: C
29
2.某地订奶居民户均牛奶消费量为120公斤,抽样平均误差为2公斤。据此可算得户均牛奶消费量在114-126公斤之间的概率为( )。
A. 0.9545 B. 0.9973 C. 0.683 D. 0.900 答案: B
3.根据抽样调查的资料,某企业生产定额平均完成百分比为165%,抽样平均误差为1%。概率0.9545时,可据以确定生产定额平均完成百分比为( )。
A. 不大于167% B. 不小于163%和不大于167% C. 不小于167% D. 不大于163%和不小于167% 答案: B
计算题
1.假设某班期末统计学考试成绩服从正态分布,平均成绩为70分,标准差为12分,要求计算:(1)随机抽取1人,该同学成绩在82分以上的概率;(2)随机抽取9人,其平均成绩在82分以上的概率。 答案:(1)15.86%, (2)0.135%
2.某手表厂在某段时间内生产100万个某种零件,用纯随机抽样方式不重复抽取1000个零件进行检验,测得废品为20件。如以99.73%概率保证,试对该厂这种零件的废品率作区间估计。
答案: (0.68%,3.32%)
3.从麦当劳餐厅连续三个星期抽查49位顾客,以调查顾客的平均消费额,得样本平均消费额为25.5元。要求:
(1)假如总体的标准差为10.5元,那么抽样平均误差是多少?
(2)在0.95的概率保证下,抽样极限误差是多少?极限误差说明什么问题? (3)总体平均消费额95%的信赖区间是多少?
答案: (1)抽样平均误差为1.5元,(2)极限误差为2.94元;(3)估计区间(22.56,28.44) 4.随机抽取某市400家庭作为样本,调查结果80户家庭有1台以上的摄像机试确定一个以99.73%的概率保证估计的该市有一台以上摄像机家庭的比率区间(F(t)=99.73% t=3)。
答案:(14%,26%)
5.从仓库中随机取100盒火柴,检验结果,平均每盒火柴99支,样本标准差为3支。 (1)计算可靠程度为99.73%时,该仓库平均每盒火柴支数的区间。 (2)如果极限误差减少到原来的1/2,对可靠程度的要求不变,问需要抽查多少盒火柴。 答案: (98,100),400
6.采用简单随机抽样的方法,从2000件产品中抽查200件,其中合格品190件,要求: (1) 计算合格品率及其抽样平均误差。
(2) 以95.45%概率保证程度,对合格品率和合格品数量进行区间估计。 (3) 如果合格品率的极限误差为2.31%,则其概率保证程度是多少? 答案:(1)合格品率为95%,抽样平均误差为1.54%,
(2)合格率估计:(91.92%,98.08%) 合格品数估计:(1838,1962) (3)概率保证程度为86.64%
7.某进出口公司出口一种名茶,为检查其每包规格的质量,抽取样本100包,检验结果如下:
30
每包重量(克) 包数(包) 148-149 10 149-150 20 150-151 50 151-152 20 合计 100 按规定这种茶叶每包规格重量应不低于150克。 试以99.73%的概率保证程度(t=3): (1) 确定每包平均重量的极限误差;
(2) 估计这批茶叶每包重量的范围,确定是否达到规格要求。
答案:极限误差为0.26, 重量估计区间:(150.04,150.56),达到要求
8.某电子产品使用寿命在3000小时以下为次品,现在用简单随机抽样方法,从5000个产品中抽取100个对其使用寿命进行测试。其结果如下:
电子产品使用寿命表 使用寿命(小时) 产品个数 3000以下 2 3000—4000 30 4000—5000 50 5000以上 18 合计 100 根据以上资料,要求: (1) 按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。 (2) 按重复抽样和不重复抽样计算该产品次吕率的抽样平均误差。
(3) 以68.27%的概率保证程度,对该产品的平均使用寿命和次品率进行区间估计。 答案: (1)重复抽样73.1,不重复抽样72.4
(2) 重复抽样1.4%,不重复抽样1.39%
(3)按重复抽样计算,平均使用寿命4266.9,4413.1 次品率为0.6%,3.4%
9.对一批成品按不重复简单随机抽样方式抽选200件,其中废品8件。又知道抽样是成品总量的4%。当概率为95.45%时,可否认为这一批产品的废品率不超过5%。 答案:估计区间为1.28%,6.72, 不能认为
10.从5000名学生中抽查200名测得平均身高为1.65m抽样平均误差为0.05m,试以95%的把握程度推算全部学生平均身高的可能范围。若200名学生中女生数为50名,试以95%的概率,抽样成数平均误差为0.03,估计全部学生数中女生的比重的区间。 答案:平均身高估计区间1.55,1.75, 女生比重估计区间:19.12%.30.88%
11.某公司欲将某种产品推向某国市场,为此先进行抽样调查,了解该产品在该国家的家庭拥有情况,问应抽多少家庭调查才能以98%的概率保证估计误差不超过5% (t=2.33) 答案:543
31
12.某地有储户4万户,采用不重复随机抽样从中抽出9%户调查资料如表。 存款(千元) 户 数 其中工人户 400 900 360 500 1800 720 600 900 180 试在95.45%的概率保证条件下,估计: (1)4万户储户平均存款的可能范围
(2)4万户储户中工人户比重的可能范围(结果留两位小数) 答案:(1)497.8,502.2 (2)33.4%,36.6%
13.某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下: 1 考60以下2 、 70-80 80-90 90- 90-100 试成绩 60-70 3、 学生4、 10 5、 6、 7、 8、 8 人数 20 22 40 试以95。45%的可靠性估计该校学生英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围。 答案:解:(1)该校学生英语考试的平均成绩的范围:
σ=
△x = tμx=2×1.1377=2.2754
该校学生考试的平均成绩的区间范围是: x - △x≤X≤ x+△x
76.6-2.2754≤X≤76.6+2.2754 74.32≤X≤78.89
(2)该校学生成绩在80分以上的学生所占的比重的范围
△p=tμp=2×0.04996=0.09992 80分以上学生所占的比重的范围: P=p±△p=0.48±0.09992
0.3801≤P≤0.5799
32
在95.45%概率保证程度下,该校学生成绩在80分以上的学生所占的比重的范围在38.01%—57.99%之间。
14.某土畜进出口公司出口一种名茶,抽样检验结果如表所示。
表
每包重量x(克) 包数f(包) 148–149 10 149-150 20 150-151 50 151-152 20 Σ 100 又知这种茶叶每包规格重量不低于150克,试以99.73%的概率:(1)确定每包重量的极限误差;(2)估计这批茶叶的重量范围,确定是否达到规格重量要求。 答案:4.答由表资料计算得:
S2 X=150.3克,S=0.76,?x??0.087(克)n2n=100>50 F(t)=0.9973 t=3 所以,?X=t?X=3×0.087=0.26(克)
这批茶叶的平均重量为150.3±0.26克,因此,可以认为这批茶叶达到了规格重量要求。
15.对一批成品按不重复随机抽样方法抽选200件,其中废品8件,又知道抽样单位数是成品总量的1/20,当概率为0.9545时,可否认为这批产品的废品率不超过5%? 答案:根据样本资料得:
P=n1n?8?4%200?p=P(1-P)n(1-)=0.0135 nN?p?t?p?2?0.0135=0.027所以,这批产品的废品率
16.某汽车制造厂为了测定某种型号汽车轮胎的使用寿命,随机抽取16只作为样本进行寿命测试,计算出轮胎平均寿命为43000公里,标准差为4120公里,试以95%的置信度推断该厂这批汽车轮胎的平均使用寿命。
答案:由于n=16<30,这属于小样本,需要利用t分布进行估计,查t分布表知:t=2.131
S2?x==1063.8
n?1?x=t??x=2.131?1063.8=2266.96,即在95%的置信度下,可推断这批汽车轮胎平均
33
寿命为X??X公里之间,即40733.04-45266.96公里。
简答题
5、抽样组织形式:样本容量的计算 单项选择题
1. 在抽样推断中,样本的容量( )。
A. 越多越好 B. 越少越好 C. 由统一的抽样比例决定 D. 取决于抽样推断可靠性的要求 答案: D
2. 在抽样设计中,最好的方案是( )。
A. 抽样误差最小的方案B. 调查单位最少的方案C. 调查费用最省的方案 D. 在一定误差要求下费用最小的方案 答案: D
3.在重复的简单随机抽样中,当概率保证程度(置信度)从68.27%提高到95.45% (其它条件不变),必要的样本容量将会( )。
A. 增加一倍 B. 增加两倍 C. 增加三倍 D. 减少一半 答案: C 多项选择题
1. 影响样本容量大小的因素是( )。
A. 抽样的组织形式 B. 样本的抽取方法 C. 总体标准差大小 D. 抽样估计的可靠程度 E. 允许误差的大小 答案: ABCDE 计算题
1.电子元件厂日产10000只元件,经多次一般测试得知一等品率为92%,现拟采用随机抽样方式进行抽检,如果求误差范围在2%之内,可靠程度为95.45%,问需抽取多少电子元件? 答案:686
2.从仓库中随机取100盒火柴,检验结果,平均每盒火柴99支,样本标准差为3支。 (1)计算可靠程度为99.73%时,该仓库平均每盒火柴支数的区间。 (2)如果极限误差减少到原来的1/2,对可靠程度的要求不变,问需要抽查多少盒火柴。 答案:(98,100),400
3.从某年级学生中按简单随机抽样方式抽取40名学生,对公共理论课的考试成绩进行检查,得知其平均分数为78.75分,样本标准差为12.13分,试以95.45%的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生?
答案:解:n=40 x=78.56 σ=12.13 t=2 (1)
=
△x = tμx=2×1.92=3.84
全年级学生考试成绩的区间范围是: x - △x≤X≤ x+△x 78.56-3.84≤X≤78.56+3.84
34
74.91≤X≤82.59
(2)将误差缩小一半,应抽取的学生数为:
(人)
35
简答题
第六章 相关与回归分析
1相关的概念及种类 1、填空题
1.现象之间的相关关系按相关的程度分为 、 和 ;按相关的形式分为 和 ;按影响因素的多少分为 和 。
答案:完全相关、不完全相关 、不相关、直线相关、曲线相关、单相关、复相关
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量 ,这种相关称为正相关;当一个现象的数 量由小变大,另一个现象的数量 ,这种相关称为负相关。
答案:也由小变大、由大变小
3._________是指现象之间存在着非严的、不确定的依存关系。 答案: 相关关系
4.相关关系按相关形式的不同,分为_________和_________。 答案:线性相关,非线性相关
5.相关关系按相关方向的不同,分为_________和_________。 答案: 正相关,负相关
6.相关关系按相关程度的高低,分为_________和_________。 答案:完全相关,不完全相关,不相关 2、单项选择题
1.确定现象之间是否存在相关关系,首先要对现象进行( )。
A定性分析 B定量分析 C数值分析 D定性与定量分析 答案:A
2.相关关系与函数关系之间的联系体现在( )。
A 相关关系普遍存在,函数关系是相关关系的特例 B 函数关系普遍存在,相关关系是函数关系的特例 C 相关关系与函数关系是两种完全独立的现象 D 相关关系与函数关系没有区别 答案:A
3、多项选择题
1.下列现象中属于相关关系的有( )
A 压力与压强 B 现代化水平与劳动生产率 C 圆的半径与圆的面积 D 身高与体重 E 机械化程度与农业人口
答案:BDE
2.销售额与流通费用率,在一定条件下存在相关关系,这种相关关系属于( ) A 正相关 B 单相关 C 负相关 D 复相关 E 完全相关
答案:B C
3.广义相关分析的主要内容有( )
A 确定现象之间有无相关关系 B 确定现象之间相关关系的密切程度 C 确定相关关系的数学模型 D 利用建立的模型进行预测 答案: ABCD
4.相关关系与函数关系各有不同的特点,主要体现在( )。
36
A 函数关系是一种不严格的相互依存关系 B函数关系可以用一个数学表达式精确表达 C函数关系中各现象均为确定型现象
D相关关系时现象之间具有随机因素影响的依存关系
E相关关系中现象之间仍然可以通过大量观察法来寻求其变化规律 答案: B D E
5、下列现象属于相关关系的是( )。
A 家庭收入与支出的关系 B 圆的半径与圆的面积的关系 C产品产量与单位成本的关系
D施肥量与粮食单位面积产量的关系 E机械化程度与农业人口的关系
答案: ABCDE
6、下述关系中属于正相关的是( )。 A 工业产品产量与单位成木之间的关系
B 商业企业的劳动效率与流通费用之间的关系 C单位产品成本与原材料消耗之间的关系
D工业企业的劳动效率与生产单位产品的消耗时间之间的关系
E在合理限度内,农业生产中施肥量与平均单位面积产量之间的关系 答案: C E
4、判断题(请在下面对应的题号后面写上对或错)
1.正相关是指两个变量之间的变化方向都是止升的趋势,而负相关是指两个变
量之间的变化方向都是下降的趋势。( ) 答案:×
2.负相关是指两个量之间的变化方向相反,即一个呈下降(上升)而另一个呈
上升(下降)趋势。( ) 答案:√
3.函数关系是一种完全的相关关系。( )
答案:√ 5、简答题
1、相关关系主要特征是什么?
答案:某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的和严格依存的,在这种关系中,对于某项标志的每一个数值,可以有另外标志的若干个数值与之相适应,在这些数值之间表现出一定的波动性,但又总是围绕着它们的平均数并遵循一定的规律而变动。
2、什么叫负相关?
答案:有些现象的相互关系表现为,当自变量x的值增加时,因变量y的值随之而有减少的趋势,这种情形就是负相关。
2、相关系数
1、基本概念(名词解释)
相关系数
答案:相关系数是一个绝对值在0与1之间的系数,其值大小反映两变量间相关的密切程度。 2、填空题
1.相关系数的取值范围是 。
37
答案:—1≤r≤1;
2.完全相关即是 关系,其相关系数为 。 答案:函数、,r?1
3.相关系数,用于反映 条件下,两变量相关关系的密切程度和方向的统计指标。
答案:直线相关;
4.直线相关系数等于零,说明两变量之间 ;直线相关系数等1,说明两变量之间 ;直线相关系数等于—1,说明两变量之间 。 答案:无线性相关、完全正相关、完全负相关 3、单项选择题
1.现象之间相互依存关系的程度越高,则相关系数值( ) A 越接近于∞ B 越接近于-1 C 越接近于1 D 越接近于-1或1 答案: D
2.相关系数r=0,说明两个变量之间( ) A 相关程度很低 B 不存在任何相关关系 C 完全负相关 D 不存在直线相关关系 答案: D
3.相关系数的取值范围是( )。
A -1
4.当相关系数r=O时,说明( )。
A 现象之间完全无关 B 现象之间相关程度较小
C 现象之间完全相关 D 现象之间无直线相关 答案: D
5.下列现象中,相关密切程度高的是( )。
A 商品销售量与商品销售额之间的相关系数为0.90 B 商品销售额与商业利润率之间的相关系数为0.60 C 商品销售额与流通费用率之间的相关系数为-0.85 D 商业利润率与流通费用率之间的相关系数为-0.95 答案: D
4、多项选择题
1、 直线相关分析的特点表现为( )。 A 两个变量之间的地位是对等关系 B 只能算出一个相关系数 C 相关系数有正负号
D 相关的两个变量必须都是随机变量 E 不反映任何自变量和因变量的关系
答案: ABCDE
2、 变量之间的不完全相关可以表现为( )。
A 零相关 B 正相关 C 负相关 D曲线相关 E相关系数为1 答案: ABCD
5、判断题(请在下面对应的题号后面写上对或错)
1.当相关系数r=0时,变量之间不存在任何相关关系。( )
答案:×
38
2. 相关系数的数值越大,说明相关程度越高;同理,相关系数的数值越小,说
明相关程度越低。( ) 答案:√ 6、计算题
1.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下: 企业编号 生产性固定资产价值(万工业总产值(万元) 元) 1 318 524 2 910 1019 3 200 638 4 409 815 5 415 913 6 502 928 7 314 605 8 1210 1516 9 1022 1219 10 1225 1624 合计 6525 9801
答案: nxy?x?yr?
nx2?(x)2?ny2?(y)2
r=0.9478
2.已知10家商店平均每人月销售额和利润额的资料,如下表所示: 商店 平均每人月销售利润额 额/(万元) (万元) X2 Y2 X*Y (X) (Y) 1 6 12 36 144 72 2 5 10 25 100 50 3 8 13 64 169 104 4 1 3 1 9 3 5 4 8 16 64 32 6 7 16 49 256 112 7 6 12 36 144 72 8 3 6.5 9 42.25 19.5 9 3 6 9 36 18 10 7 17 49 289 119 要求:计算平均每人月销售额和利润额之间的简单相关系数。 答案:平均每人月销售额和利润额之间的简单相关系数
nxy?x?yr?
nx2?(x)2?ny2?(y)2 ==(10*601.5-50*103.5)/[(10*294-50*50)(10*1253.25-103.5*103.5)]0.5==0.94
3.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关,
??????????????
39
现对给定时期内的价格与需求量进行观察,得到下表所示的一组数据。
编号 价格x(元) 需求量y(吨) xx yy xy 1 10 60 100 3600 600 2 6 72 36 5184 432 3 8 70 64 4900 560 4 9 56 81 3136 504 5 12 55 144 3025 660 6 11 57 121 3249 627 7 9 57 81 3249 513 8 10 53 100 2809 530 9 12 54 144 2916 648 10 7 70 49 4900 490 合计 94 604 920 36968 5564 要求:计算价格与需求量之间的线性相关系数。
答案:价格与需求量之间的线性相关系数
nxy?x?yr?
nx2?(x)2?ny2?(y)2
==(10*5564—94*604./[(10*920-94*94.(10*36968-604*604.]0.5
0.50.5
== (55640-56776)/(364*4864.==-1136/(1770496)==--1136/1330.6==--0.85375≈-0.85
3、回归分析的概念和特点 1、单项选择题
1.当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( )。
A 函数关系 B相关关系 C回归关系 D随机关系
答案: A
2、多项选择题
1.在直线相关和回归分析中( ) A据同一资料,相关系数只能计算一个 B据同一资料,相关系数可以计算两个 C据同一资料,回归方程只能配合一个
D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个 E回归方程和相关系数均与自变量和因变量的确定无关
答案: A D
3、判断题(请在下面对应的题号后面写上对或错)
1、 已知两变量直线回归方程为:^Y=-45.25+1.61x,则可断定这两个变量之间
一定存在正相关关系。 ( ) 答案: √
2.回归分析和相关分析一样,所分析的两个变量郡一定是随机变量。( )
答案: ×
4、简单线性回归方程的建立和求解
???????
40
1、填空题
1.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的_________,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为_________。 答案:密切程度、回归分析
2.回归方程y=a+bx中的参数a是_________,b是_________ 。在统计中估计待定参数的常用方法是 。
答案: y轴上截距、回归系数、最小二乘法
3. _________分析要确定哪个是自变量哪个是因变量,在这点上它与_________不同。
答案: 回归分析、相关分析
4.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过_________化成_________来解决。 答案:变量变换、线性关系
5.用来说明回归方程代表性大小的统计分析指标是_________。 答案:估计标准误差
6、最小平方法的中心思想,是通过数学方程,配合一条较为理想的趋势线,这条趋势线必须满足两个条件:一是_________;二是____________。
答案: 原数列的观测值与方程估计值的离差平方和最小,原数列的观测值与方程估计值的离差总和为零 2、单项选择题
1.已知变量x与y之间存在着负相关,指出下列回归方程中哪一个肯定是错误的( )
A. y=–10-0.8x B. y=100-1.5x C. y=–150+0.9x D.y=25-0.7x 答案: C
2.当所有观察值y都落在回归直线y=a+bx上,则x与y之间的相关系数( ) A. r=1 B. –1 3.在回归方程y=a+bx中,回归系数b表示( ) A. 当x=0时y的期望值 B. x变动一个单位时y的变动总额 C. y变动一个单位时x的平均变动量 D. x变动一个单位时y的平均变动量 答案:D 4、 回归方程 ^Y=a+bx 中的回归系数 b 说明自变量变动一个单位时,因变量( )。 A 变动b个单位 B 平均变动b个单位 C 变动a+b个单位 D 变动1/b个单位 答案: D 3、多项选择题 1.确定直线回归方程必须满足的条件是( ) A 现象间确实存在数量上的相互依存关系 ??????41 B 相关系数r必须等于1 C 相关现象必须均属于随机现象 D 现象间存在着较密切的直线相关关系 E 相关数列的项数必须足够多 答案: ACDE 2.在回归分析中,确定直线回归方程的两个变量必须是( ) A一个自变量,一个因变量 B 均为随机变量 C对等关系 D一个是随机变量,一个是可控变量 E不对等关系 答案: ADE 3.一回归方程Y=12.84-0.14X,则下列说法中正确的是( )。 A 自变量增长一个单位,因变量减少0.14个单位 B 自变量增长一个单位,因变量平均减少0.14个单位 C 自变量和因变量之间成正相关关系 D 自变量和因变量之间成负相关关系 答案: B D 4、 直线回归分析的特点表现为( )。 A两个变量之间的地位不是对等关系 B自变量是给定的非随机变量,因变量是随机变量 C利用一个回归方程,两个变量之间可以互相推 D直线回归方程中的回归系数有正负号 E可以求出两个回归方程 答案: ABCD 4、判断题(请在下面对应的题号后面写上对或错) 1.如果直线回归方程Y=-27.4+3.2X,则说明变量X和变量Y之间存在负相关关系。( ) 答案:(×) 5、计算题 1.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下: 企业编号 生产性固定资产价值(万工业总产值(万元) 元) 1 318 524 2 910 1019 3 200 638 4 409 815 5 415 913 6 502 928 7 314 605 8 1210 1516 9 1022 1219 10 1225 1624 合计 6525 9801 建立直线回归方程; 答案: y=395.567+0.8958x 42 2.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关,现对给定时期内的价格与需求量进行观察,得到下表所示的一组数据。 价格需求量(元) (吨) x x y y x y x y 10 60 100 3600 600 6 72 36 5184 432 8 70 64 4900 560 9 56 81 3136 504 12 55 144 3025 660 11 57 121 3249 627 9 57 81 3249 513 10 53 100 2809 530 12 54 144 2916 648 7 70 49 4900 490 拟合商品需求量对价格的回归直线方程。 答案:拟合需求量对价格的回归直线方程。 b ==-3.12088 , a==89.73626, y==89.74-3.12x 3.已知10家商店平均每人月销售额和利润额的资料,如下表所示: 商店 平均每人月销售利润额 22额/(万元) (万元) X Y X*Y (X) (Y) 1 6 12 36 144 72 2 5 10 25 100 50 3 8 13 64 169 104 4 1 3 1 9 3 5 4 8 16 64 32 6 7 16 49 256 112 7 6 12 36 144 72 8 3 6.5 9 42.25 19.5 9 3 6 9 36 18 10 7 17 49 289 119 要求:拟合利润额对平均每人月销售额的回归直线方程。 答案:拟合利润额对平均每人月销售额的回归直线方程。 b ==1.9091, a==0.8045, y==0.8045+1.9091x 4.在其他条件不变的情况下,商品的销售利润(y)与该商品的销售额(x)有关,现对某公司所属8个企业的产品销售资料进行观察,得到下表所示的一组数据。 企业编号 1 2 3 4 产品销售额(万元)x 170 220 390 430 销售利润(万元)y 8.1 12.5 18 22 xx 28900 48400 152100 184900 yy 65.61 156.25 324 484 xy 1377 2750 7020 9460 43 5 6 7 8 合计 480 650 950 1000 4290 26.5 40 64 69 260.1 230400 422500 902500 1000000 2969700 702.25 1600 4096 4761 12189.11 12720 26000 60800 69000 189127 要求:确定利润额对产品销售额的直线回归方程。 答案:确定利润额对产品销售额的直线回归方程。、 ?n?xy??x?y ?b?22?n?x?(?x) ?y?x ?a??b?y?bx?nn ? b ==(8*189127-4290*260.1./(8*2969700-4290*4290)=0.074 a==260.1/8-4290/8*0.074=32.51-39.68==-7.17 y==-7.17+0.074x ) 5.某企业上半年产品产量与单位成本资料如下: 月 份 产 量(千件) 单位成本(元) ?1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68 要求:1)计算相关系数,说明两个变量相关的密切程度。 2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 答案: 月 份 产量(千件) 单位成本 x y2 xy n 1 2 3 4 5 6 合 x (元)y 2 73 4 5329 146 3 72 9 5184 216 4 71 16 5041 284 3 73 9 5329 219 4 69 16 4761 276 5 68 25 4624 340 计 21 426 79 30268 1481 2 1)计算相关系数 ??? ?n?x?(?x)??n?y?(?y)?2222n?xy??x?y 6?1481?21?426??0.9091 ?6?79?21??6?30268?426?44 ???0.9091说明产量和单位成本之间存在高度负相关。 2)配合回归方程 y=a+bx b?n?xy??x?yn?x?(?x)22 =-1.82 a?y?bx=77.37 回归方程为:y=77.37-1.82x 5、判定系数和标准误差 1、基本概念(名词解释) 1、估计标准误差 答案:实际观察值与回归估计值离差平方和的均方根。 2、填空题 1、估计标准误差越小,则根据直线回归方程计算的估计值就越__________。 答案:精确 3、单项选择题 1、回归估计的估计标准误差的计量单位与( )。 A 自变量相同 B 因变量相同 C 自变量及因变量相同 D 相关系数相同 答案: B 2、以下错误的概念是:在抽样调查中,抽样误差( )。 A 因变量的数列 B 因变量的总变差 C 因变量的回归变差 D 因变量的剩余变差 答案: D 4、多项选择题 1.下列对判定系数表述正确的是( )。 A判定系数是测定回归模型拟合优度的一个重要指标 B判定系数是残差平方和与总离差平方和之比 C判定系数是回归离差平方和与总离差平方和之比 D判定系数的值总是在-1—+1之间 E判定系数越接近于1,拟合优度就越好 答案: ACE 2.估计标准误差是反映( )。 A回归方程代表性的指标 B自变量离散程度的指标 C因变量数列离散程度的指标 D因变量估计值可靠程度的指标 E自变量可靠程度的大小 答案: AD 5、判断题(请在下面对应的题号后面写上对或错) 1、在其他条件不变的情况下,相关系数越大,估计标准误差就越大;反之,估计标准误差就越小。可见估计标准误差的大小与相关系数的大小是一致的。( ) 答案:× 6、计算题 45 1.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下: . 企业编号 1 2 3 4 5 6 7 8 9 10 合计 生产性固定资产价值(万元) 318 910 200 409 415 502 314 1210 1022 1225 6525 工业总产值(万元) 524 1019 638 815 913 928 605 1516 1219 1624 9801 1)建立直线回归方程; 2)计算估计标准误差; 答案: 1) y=395.567+0.8958x 2)Syx=126.764 2.检查5位同学统计学的学习时间与成绩分数如下表: 每周学习时数 学习成绩 4 40 6 60 7 50 10 70 13 90 要求:1)由此计算出学习时数与学习成绩之间的相关系数; 2)建 立直线回归方程; 3)计算估计标准误差。 答案: 1)0.9558 2)y=20.4+5.2x 3)Syx=6.532 3. 在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关,现对给定时期内的价格与需求量进行观察,得到下表所示的一组数据。 价格(元) x 10 6 8 9 12 11 9 10 12 7 需求量(吨) y 60 72 70 56 55 57 57 53 54 70 x x 100 36 64 81 144 121 81 100 144 49 y y 3600 5184 4900 3136 3025 3249 3249 2809 2916 4900 x y 600 432 560 504 660 627 513 530 648 490 46 1)拟合商品需求量对价格的回归直线方程。 2)根据拟合的回归直线方程,计算估计标准误差Sy。 答案: 1) 拟合需求量对价格的回归直线方程。 b ==-3.12088 , a==89.73626, y==89.74-3.12x 2)根据拟合的回归直线方程,计算估计标准误差Sy。 ?)2(y?yy2?ay?bxy Se?? n?2n?20.5Sy==[131.87/( 10-2 )]==[131.87/8] 0.5==4.06 4.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关,现对给定时期内的价格与需求量进行观察,得到下表所示的一组数据。 ????编号 1 2 3 4 5 6 7 8 9 10 合计 价格(元) 10 6 8 9 12 11 9 10 12 7 94 x需求量y(吨) 60 72 70 56 55 57 57 53 54 70 604 xx 100 36 64 81 144 121 81 100 144 49 920 yy 3600 5184 4900 3136 3025 3249 3249 2809 2916 4900 36968 xy 600 432 560 504 660 627 513 530 648 490 5564 要求: 1)拟合需求量对价格的回归直线。 2)根据拟合的回归直线方程,计算估计标准误差Sy。 答案: 1)拟合需求量对价格的回归直线方程。 ?n?xy??x?yb? 22??n?x?(?x) ?y?xb ==?(10*5564—94*604./(10*920-94*94.==(55640-56776)/364 a??b?y?bx??-3n=--1136/364=.12 na==60.4—(-3.12*9.4)==60.4+29.33=89.73 y==89.73-3.12x 2)根据拟合的回归直线方程,计算估计标准误差Sy。 ?)2(y?yy2?ay?bxy Se??n?2n?2 Sy==[(36968—89.73*604+3.12*5564)/( 10-2 )]0.5==[130.76/8] 0.5==[16.345] 0.5 =4.05(由于小数点处理的导致的误差,这个结果也可能是4.06) 5.根据某部门8个企业 产品销售额和销售利润的资料得出以下计算结果: ????? 47 ?xy=189127 x =2969700 x=4290 y22=12189.11 y=260.1 要求:1)计算产品销售额与利润额的相关关系; 2)建立以利润额为因变量的直线回归方程并说明回归系数的经济意义; 3)计算估计标准误差。 答案:1)计算相关系数 ???n?x?(?x)??n?y?(?y)?2222n?xy??x?y=0.9934 2)配合回归方程 y=a+bx b?n?xy??x?yn?x?(?x)22 =0.742 a?y?bx=-7.2773 回归方程为:y=-7.2772+0.742x 3)估计标准误: sy??y2?a?y?b?xy=2.8493 n?2 6、用回归方程进行预测 1、计算题 1.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下: 企业编号 元) 1 2 3 4 5 6 7 8 9 10 合计 318 910 200 409 415 502 314 1210 1022 1225 6525 524 1019 638 815 913 928 605 1516 1219 1624 9801 生产性固定资产价值(万工业总产值(万元) 1)建立直线回归方程; 2)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。 答案: 1) ?n?xy??x?y b?22?? n?x?(?x)??a ?y?b?x?y?bx?n? ny=395.567+0.8958x ; 2 ) 1380.947 ? 48 2.某地高校教育经费(x)与高校学生人数(y)连续6年的统计资料如下: 教育经费(万元)x 316 343 373 393 418 455 在校学生数(万人)y 11 16 18 20 22 25 要求:建立回归直线方程,估计教育经费为500万元的在校学生数; 答案: ?n?xy??x?y b?22?n?x?(?x)? ?y?x ?a??b?y?bx?y=-17n.0955xn,29.83 ?.92+0 3.在其他条件不变的情况下,商品的销售利润(y)与该商品的销售额(x)有关,现对某公司所属8个企业的产品销售资料进行观察,得到下表所示的一组数据。 ?企业编号 1 2 3 4 5 6 7 8 合计 产品销售额(万元)x 170 220 390 430 480 650 950 1000 4290 销售利润(万元)y 8.1 12.5 18 22 26.5 40 64 69 260.1 xx 28900 48400 152100 184900 230400 422500 902500 1000000 2969700 yy 65.61 156.25 324 484 702.25 1600 4096 4761 12189.11 xy 1377 2750 7020 9460 12720 26000 60800 69000 189127 要求:1)确定利润额对产品销售额的直线回归方程。 2)确定产品销售额为1400万元时利润额的估计值。 答案: 1)确定利润额对产品销售额的直线回归方程。 ?n?xy??x?yb?22 ??n?x?(?x) ?y?x?a?b ==(8*189127-4290*260?b?y?bx.1./(8*2969700-4290*4290)=0.074 ?n1/8-4290/8*0n?a==260..074=32.51-39.68==-7.17 y==-7.17+0.074x 2)确定产品销售额为1400万元时利润额的估计值。 y== --7.17+0.074x=--7.17+0.074*1400= --7.17+103.87=96.70 ? 49 第七章 动态数列分析 1、动态数列:概念、种类、编制原则 1、基本概念(名词解释) 1.时间数列 答案:也称为时间序列或动态序列,是将反映某社会经济现象的指标数值按时间的顺序排列起来所形成的一种统计数列。 2.时期数列 答案:指由时期指标构成的数列,即数列中每一指标值都是反映某现象在一段时间内发展过程的总量。 3.时点数列 答案:指由时点指标构成的数列,即数列中的每一指标值反映的是现象在某一时刻上的总量。 2、填空题 1.从形式上看,时间序列有两个组成要素:一是 ,二是 。 答案:时间顺序、发展水平 2.在一个时间序列中,最早出现的数值称为 ,最晚出现的数值称为 。 答案:最初水平、最末水平 3.时间序列可以分为 时间序列、 时间序列和 时间序列三种。其中 是最基本的序列。 答案:绝对数、相对数、平均数、绝对数 4.绝对数时间序列可以分为 和 两种,其中,序列中不同时间的 数值相加有实际意义的是 序列,不同时间的数值相加没有实际意义的是 序列。 答案:时期序列、时点序列、时期、时点 3、单项选择题 1.某地区2000-2006年排列的每年年终人口数动态数列是( ) A.绝对数动态数列 B.绝对数时点数列 C.相对数动态数列 D.平均数动态数列 答案: B; 2.时间数列中,每个指标数值可以相加的是 ( )。 A.相对数时间数列 B.平均数时间数列 C.时期数列 D.时点数列 答案:C; 3.最基本的时间数列是( )。 A.时点数列 B.时期数列 C.绝对数时间数列 D.相对数时间数列 答案:C; 4.编制动态数列的基本原则是要使动态数列中各项指标数值具有( ) A.可加性 B.可比性 C.一致性 D.同质性 答案:B 5.从形式上看,构成时间数列的两个基本要素是( )。 A.主词和宾词 B.变量和次数 C.时间和次数 D.现象所属时间及其指标数值。 答案:D 4、多项选择题 50