统计学 安徽财经大学2012.02
1
学习指导书
第一章 绪论
学习目的和要求:
通过本章的学习,要求了解统计学产生与发展的历史;明确统计与统计学的涵义、统计学的研究对象、特征、统计学的学科性质及研究方法等一些基本问题;重点理解统计学中的几个基本概念。
难点释疑:
掌握以下基本概念:统计总体与总体单位,标志与指标、统计指标体系。要掌握这些重要概念的联系与区别、特点、表现形式及其基本分类等。
练习题:
(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内) 1.“统计”一词的基本含义是( )。
①统计调查、统计整理、统计分析 ②统计设计、统计分组、统计计算 ③统计方法、统计分析、统计预测 ④统计科学、统计工作、统计资料 2.要了解某市国有工业企业生产设备情况,则统计总体是( )。 ①该市国有全部工业企业 ②该市国有每一个工业企业 ③该市国有某一台设备 ④该市国有工业企业全部生产设备
3.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为( )。
①200个公司的全部职工 ②200个公司
③200个公司职工的全部工资 ④200个公司每个职工的工资 4.构成统计总体的个别事物称为( )。
①调查单位 ②总体单位 ③调查对象 ④填报单位 5.构成统计总体的那些个体(总体单位)必须至少在某一方面具有( )。 ①差异性 ②同质性 ③相关性 ④可加性 6.调查某大学2000名学生学习情况,则总体单位是( )。
①2000名学生 ②2000名学生的学习成绩 ③每一名学生 ④每一名学生的学习成绩 7.要了解某市职工收入状况,其总体单位是( )。
①该市所有职工 ②该市每名职工 ③该市所有职工的收入 ④该市每名职工的收入 8.某城市进行工业企业未安装设备普查,总体单位是( )。
①该市工业企业全部未安装设备 ②该市工业企业每一台未安装设备 ③该市每个工业企业的未安装设备
④该市每一个工业企业
9.下列总体中,属于无限总体的是( )。
①全国的人口总数 ②水塘中所养的鱼
2
③城市年流动人口数 ④工业中连续大量生产的产品产量 10.总体与总体单位不是固定不变的,是指( )。
①随着客观情况的变化发展,各个总体所包含的总体单位数也在变动 ②随着人们对客观认识的不同,对总体与总体单位的认识也是有差异的 ③随着统计研究目的与任务的不同,总体和总体单位可以变换位置 ④客观上存在的不同总体和总体单位之间,总是存在着差异 11.标志是指( )。
①总体单位的特征或属性的名称 ②总体单位数量特征 ③标志名称之后所表现的属性或数值 ④总体单位所具有的特征 12.一个统计总体( )。
①只能有一个标志 ②只能有一个指标 ③可以有多个标志 ④可以有多个指标 13.构成统计总体的总体单位( )。
①只能有一个标志 ②只能有一个指标 ③可以有多个标志 ④可以有多个指标 14.下列属于品质标志的是( )。
①工人年龄 ②工人性别 ③工人体重 ④工人工资 15.像家庭出身、企业所有制形式这样的概念,可用作( )。 ①数量指标 ②质量指标 ③品质标志 ④数量标志 16.标志与指标的区别之一是( )。
①标志是说明总体特征的,指标说明总体单位的特征 ②指标是说明总体特征的,标志是说明总体单位的特征 ③指标是说明有限总体特征的,标志是说明无限总体特征的 ④指标是说明无限总体特征的,标志是说明有限总体特征的 17.连续变量是指( )。
①整数变量 ②数量标志
③其数值在整数之间可以有有限个数值 ④其数值在整数之间可以有无限个数值 18.下列变量中,属于连续变量的是( )。
①大中型企业个数 ②大中型企业的职工人数 ③大中型企业的利润额 ④大中型企业拥有的设备台数
19.随机从某个农贸市场抽取15个摊位,检查这些摊主照章纳税情况。其中( )。 ①.摊位数量和纳税额都是离散变量 ②摊位数量和纳税额都是连续变量 ③摊位数量是离散变量,纳税额是连续变量 ④摊位数量是连续变量,纳税额是离散变量 20.工业企业的设备台数、产品产值是( )。
3
①连续变量 ②离散变量 ③前者是连续变量 ④前者是离散变量
21.某工人月工资为2000元,工资是( )。
①品质标志 ②数量标志 ③变量值 ④指标 22.统计学的基本方法包括有( )。
①调查方法、整理方法、分析方法 ②调查方法、汇总方法、预测方法 ③相对数法、平均数法、指数法 ④大量观察法、分组法、综合指标法 23.统计最基本的职能是( )。
①信息职能 ②咨询职能 ③反映职能 ④监督职能
(二)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”) 1.统计学与统计工作的研究对象是一致的。 ( ) 2.总体的同质性是指总体中的各个单位在所有标志上都相同。 ( )
3.总体的差异性是指总体单位必须具有一个或若干个可变的品质标志或数量标志。 4.数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。( ) 5.品质标志和质量指标一般不能用数值表示。 ( ) 6.所有的统计指标和可变的数量标志都是变量。 ( ) 7.社会经济现象都是有限总体。 ( ) 8.全国人口普查的总体单位是户。 ( ) 9.所有总体单位与总体之间都存在相互转换关系。 ( ) 10.统计所研究的对象必须是可度量的现象。 ( ) 11.统计指标是客观事实的具体反映,不具有抽象性。 ( ) 12.品质标志不能转变为统计指标数值。 ( ) 13.三位工人的工资不同,因此存在三个变量。 ( ) 14.商品的价格在标志分类上属于数量标志。 ( ) 15.要了解一个企业的产品生产情况,总体单位是每一件产品。 ( ) 16.大量观察法要求对社会经济现象的全部单位进行调查。 ( ) 17.总体单位是标志的承担者,标志是依附于总体单位的。 ( ) 18.变异是统计存在的前提,没有变异就没有统计。 ( )
19.统计学是一门研究现象总体数量特征的方法论科学,所以它不关心、也不考虑个别现象
的数量特征。 ( ) 20.统计学是从质与量的对立统一中研究客观现象总体数量特征的。 ( ) (三)填空题
1.凡是客观存在的,具有 的许多个别事物构成的整体,称为 。
4
2.按总体单位数量是否可以计数(或总体单位数的有限性)进行区分,总体有___________总体和_____________总体。
3.统计总体的基本特征可概括为 、 、 。
4.为了了解国有企业职工的年龄构成进行的统计调查,其统计总体是____________,总体单位是________________。
5.总体的 实际上是指总体各单位至少在一个标志上其具体表现是相同的。 6.标志是说明 特征的,而指标是说明 特征的。 7.标志按其表现形式不同,有______________标志和_____________标志。 8.工人的年龄,工厂设备的价值,属于 标志,而工人的性别,设备的种 类是 标志。
9.我们研究居民户的生活水平时,全部居民户便构成____________,而每户居民则是_______________。
10.一般来说,统计指标的数值是从总体单位的 汇总而来的。 11.统计指标体系是________________的指标所构成的__________。
12.在全市的工业普查中,机器台数是____________指标,工业总产值发展速度是__________指标,每个工业企业是总体单位,所有工业企业是总体。
13.随着研究目的的不同,如果原先的统计总体变成总体单位,则对应的 变成 。
14.统计指标反映的是 的数量特征,数量标志反映的是 的数量特征。 15.变量是指可变的_________________和__________ _。
16.按变量值的连续性分,可把变量分为____________变量和___________变量。 17.按变量的性质分有_______ ___变量和______ ______变量。
18.工厂的设备台数、工厂的人数属于__________变量,而人的身高、体重属于__________变量。
19.一个完整的统计工作过程应包括 、 和 。 20.统计工作的职能包括: 、 、 。其中以 为主。 (四)简答题
1.什么是统计,一般有几种理解? 2.为什么说有变异才有统计?
3.什么是标志和指标?两者有何区别与联系?
5
4.统计学的研究对象是什么?研究对象有哪些特点?
参考答案:
(一)单项选择题
1.④ 2.④ 3.① 4.② 5.② 6.③ 7.② 8.② 9.④ 10.③ 11.① 12.④ 13.③ 14.② 15.③ 16.② 17.④ 18.③ 19.③ 20. ④ 21.② 22.④ 23.①
(二)判断题
1.√ 2.× 3.√ 4.× 5.× 6.√ 7.× 8.× 9.× 10.√ 11.√ 12.× 13.× 14.√ 15.√ 16.× 17.√ 18.√ 19.× 20.√
(三)填空题
1.共同特征、总体 2.有限、无限 3.同质性、大量性、差异性
4.国有企业全体职工、国有企业每一职工 5.同质性 6.总体单位、总体 7.不变、可变 8.数量、品质 9.总体、总体单位 10.标志值 11.一系列有联系、整体 12.数量、质量 13.指标、数量标志 14.总体、总体单位 15.数量标志、指标 16.连续型、离散型 17.确定性、随机性 18.离散型、连续型
19.统计调查、统计整理、统计分析 20.信息职能、咨询职能、监督职能、提供信息 (四)简答题
1.所谓统计,是人们认识客观现象总体数量特征、数量关系和数量变动规律的一种调查研究方法。这种方法是对现象总体数量方面进行收集、整理和分析研究的总称,是人们认识客观世界的一种最有效的工具。
不同的场合,统计通常有三种涵义,即统计工作、统计资料和统计学,其中统计资料是统计工作的成果,统计学是统计工作的经验总结与理论概括。
2.统计研究大量客观现象的数量方面,如果总体各单位的标志和指标没有差异(变异),其具体表现都一样,那么只要调查个别便可知全体,这样就用不着统计了。有变异才有统计,变异是统计的前提。
3.标志说明总体单位具有的特征和属性,指标说明总体的综合数量特征的。
区别:(1)标志是说明总体单位(个体)特征的;而指标是说明总体特征的。(2)标志中的数量标志是可以用数值表示,品质标志不能用数值表示;而所有的指标都是用数值表示的,不存在不能用数值表示的指标。(3)标志中的数量标志不一定经过汇总,可以直接取得;指标多是由数量标志值汇总得来的。(4)标志一般不具备时间、地点等条件;而作为一个完整的统计指标,一定要有时间、地点、范围。
联系:(1)一般来说,指标的数值是由标志值汇总而来的;(2)标志和指标存在着一定
6
的变换关系。
4.统计学的研究对象是客观现象总体的数量方面,通过这些数量方面反映客观现象规律性的表现。(1)数量性:从数量上认识事物的性质和规律,是统计研究的基本特点;统计研究的不是抽象的数量,而是有特定内容的具体数量。统计是在质的规定性下研究与所研究现象内容性质密切联系的具体数量。(2)总体性:统计是以现象总体的数量特征作为自己的研究对象。统计要对总体中各单位普遍存在的事实进行大量观察和综合分析,得出反映现象总体的数量特征。(3)变异性:总体各单位的标志特征由于复杂的随机因素而有不同的表现,它是统计研究的前提。
第二章 统计数据的搜集、整理与显示
学习目的和要求:
通过本章的学习,了解各种统计调查方式的特点和适用场合,正确地采用调查方式和方法组织搜集准确、及时的统计资料;熟练掌握数据的整理与图示方法;能够对数值型数据编制频数分布表,并选择适当的图形进行展示、解释。
难点释疑:
(一)几个基本概念及其相互联系。一是调查对象、调查单位、填报单位的含义及其联系,可以联系总体和总体单位的概念来把握;二是五种调查方式之间的关系,五种调查方式各有利弊,在实际中应结合运用。
(二)问卷调查表的设计,问卷调查表的关键在于表的结构设计及指标的设计,要想做出高质量的问卷调查表,一是要不断的知识积累,二是要不断的实践。
(三)不能把统计整理简单地理解为就是统计资料的汇总,统计整理比统计汇总包括的范围要广泛的多,除了包括原始资料的整理外,还包括次级统计资料的整理。
(四)统计分组是统计整理的核心。统计分组的中心问题是选择分组标志和划分各组的界限。分组标志的选择一定要坚持目的性、本质性和具体性原则。还要明确简单分组不一定分的组就少,客观对象就简单;复合分组也不一定分的组就多,客观对象就复杂。
(五)掌握分布数列的编制方法关键是要确定好组数和组距,组数和组距的确定必须能够全面、准确反映客观事物的分布特征。
练习题:
(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内) 1.统计调查的基本要求是( )。
①准确性、及时性、完整性 ②准确性、整体性、及时性 ③全面性、及时性、完整性 ④全面性、准确性、完整性 2.在统计调查中,填报单位是( )。
7
①调查项目的承担者 ②构成调查对象的每一个单位 ③负责向上报告调查内容的单位 ④构成统计总体的每一个单位 3.在统计调查中,调查单位和填报单位之间( )。 ①是一致的 ②是无区别的
③是无关联的两个概念 ④一般是有区别的,但有时也一致 4.某地区对小学学生情况进行普查,则每所小学是( )。 ①调查对象 ②调查单位 ③填报单位 ④调查项目 5.对百货商店工作人员进行普查,调查对象是( )。
①各百货商店 ②各百货商店的全体工作人员 ③一个百货商店 ④每位工作人员 6.对某停车场上的汽车进行一次性登记,调查单位是( )。 ①全部汽车 ②每辆汽车 ③一个停车场 ④所有停车场 7.对国有工业企业设备进行普查时,每个国有工业企业是( )。 ①调查单位 ②填报单位
③既是调查单位又是填报单位 ④既不是调查单位又不是填报单位 8.对工业企业生产设备进行普查,调查单位是( )。 ①所有工业企业 ②工业企业的所有生产设备 ③每个工业企业 ④工业企业的每台生产设备 9.在统计调查阶段,对有限总体( )。
①只能进行全面调查 ②只能进行非全面调查 ③既能进行全面调查,也能进行非全面调查 ④以上答案都对 10.统计调查按调查对象包括的范围不同,可分为( )。
①定期调查和不定期调查 ②经常性调查和一次性调查 ③统计报表和专门调查 ④全面调查和非全面调查 11.经常性调查与一次性调查的划分( )。
①是以调查组织规模大小来划分的 ②是以最后取得的资料是否全面来划分的 ③是以调查对象所包括的单位是否完全划分的 ④是以调查登记的时间是否连续来划分的 12.统计报表大多属于( )。
①一次性全面调查 ②经常性全面调查 ③经常性非全面调查 ④一次性非全面调查 13.为了了解某商业企业的期末库存量,调查人员亲自盘点库存,这种方法是( )。
8
①大量观察法 ②采访法 ③直接观察法 ④报告法 14.问卷法属于( )。
①直接观察法 ②询问法 ③报告法 ④一次性调查 15.区别重点调查和典型调查的标志是( )。
①调查单位数目不同 ②搜集资料方法不同 ③确定调查单位标准不同 ④确定调查单位目的不同 16.重点调查的重点单位是指( )。
①标志值很大的单位 ②这些单位的单位总量占总体全部单位总量的绝大比重 ③这些单位的标志总量占总体标志总量的绝大比重 ④经济发展战略中的重点部门
17.某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的 基本情况,则这种调查方式是( )。
①普查 ②典型调查 ③抽样调查 ④重点调查
18.有意识地选择三个农村点调查农民收入情况,这种调查方式属于( )。 ①重点调查 ②普查 ③抽样调查 ④典型调查
19.某地区为了解轻纺工业生产情况,要进行一次典型调查,在选择调查单位时,应选择( )。
①生产情况较差的企业 ②生产情况中等的企业 ③生产情况较好的企业 ④差、中、好各类企业
20.调查几个主要铁路枢纽, 就可以了解我国铁路货运量的基本情况,这种调查方式属于( )。
①典型调查 ②重点调查 ③普查 ④抽样调查
21.为了了解全国钢铁企业生产的基本情况,可对首钢、宝钢、武钢、鞍钢等几个大型钢铁企业进行调查,这种调查方式是( )。
①非全面调查 ②典型调查 ③重点调查 ④抽样调查 22.目前我国进行的职工家庭收支调查是( )。
①普查 ②重点调查 ③全面调查 ④抽样调查
23.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。
①统计报表 ②重点调查 ③全面调查 ④抽样调查
24.在我国,获得预计农产量全面资料最有效、最可行的调查方式是( )。
9
①统计报表 ②重点调查 ③典型调查 ④抽样调查
25.某工业企业系统内欲进行工业企业生产设备状况普查,要求在1月1日至20日全部调查完毕,这一时间规定是( )。
①调查期限 ②调查时间 ③登记时间 ④标准时间 26.人口普查规定统一的标准时间是为了( )。
①避免登记的重复和遗漏 ②具体确定调查单位 ③确定调查对象的范围 ④为了统一调查时间、一齐行动
27.我国第五次人口普查,是为了了解在2000年11月1日零时人口的状况,某地区要求将调查单位资料于11月20日前登记完毕,普查的标准时间是( )。 ①2000年11月20日零时 ②2000年11月19日24时 ③2000年11月1日24时 ④2000年10月30日24时
28.假设人中普查的标准时点为7月1日零点,7月2日调查员在各家调查时,得知 王××家6月30日出生一小孩,李家7月1日出生一小孩,则这两个小孩如何登记?( )。 ①两家小孩均应登记 ②王家的小孩应予登记,李家小孩不应登记 ③两家小孩均不予登记 ④王家小孩不应登记,李家小孩应予登记 29.非全面调查中最完善、最有计量科学根据的调查方式是( )。 ①重点调查 ②典型调查 ③抽样调查 ④非全面统计报表 30.统计分组的关键在于( )。
①确定组距和组数 ②确定全距和组数 ③确定分组标志和划分各组界限 ④确定组距和组中值 31.将统计总体按某一标志分组的结果表现为( )。
①组内同质性,组间差异性 ②组内差异性,组间差异性 ③组内差异性,组间同质性 ④组内同质性,组间同质性
32.在区分事物性质的分组中,划分经济类型具有重要意义,通过这种分组,可以研究各经济类型的( ) 。
①品质特征 ②数量特征 ③规模大小 ④依存关系 33.区分简单分组和复合分组的根据是( )。
①分组对象的复杂程度 ②采用分组标志的多少不同 ③分组的数目多少不同 ④研究的总体变化如何
34.以一个企业的工人为总体,研究任务是分析该企业工人的文化素质,则分组标志应选择( ) 。
10
①工人的技术等级 ②工人的文化程度 ③工人的日产量 ④工人的出勤天数 35.次数分配数列是指( ) 。
①各组组别依次排成的数列 ②各组次数依次排成的数列 ③各组组别与次数依次排列而成的数列 ④各组频率依次排成的数列 36.变量数列中各组频率的总和应该( )。
①小于1 ②等于1 ③大于1 ④不等于1 37.划分连续型变量的组限时,相邻两组的组限必须( )。 ①不等 ②重叠 ③间断 ④没有严格要求 38.划分离散型变量的组限时,相邻两组的组限( )。
①不等 ②重叠 ③间断 ④没有严格要求
39.有12名工人分别看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、4,按以上资料编制变量数列,应采用( )。
①单项式分组 ②等距分组 ③不等距分组 ④以上几种分组均可 40.一般情况下,按年龄分组的人口死亡率表现为( )。 ①钟形分布 ②正J布 ③U分布 ④对称分布
41.在分组时,若有某单位的变量值正好等于相邻组的上下限时,一般应将其归在( )。 ①上限所在组 ②下限所在组 ③任意一组均可 ④另设新组
42.工业企业按经济类型分组和工业企业按职工人数分组,两个统计分组是( )。 ①按数量标志分组 ②按品质标志分组 ③前者按数量标志分组,后者按品质标志分组 ④前者按品质标志分组,后者按数量标志分组
43.某企业职工按工资水平分为4组:500元以下;500—600元;600—700元;700元以上。第一组和第四组的组中值分别是( )。
①450元和750元 ②500元和700元 ③400元和800元 ④500元和750元 44.某连续变量数列,其末组为开口组,下限为500,又知其邻组组中值为480,则末组组中值为( )。
①520 ②510 ③500 ④490 45.等距数列中,组距的大小与组数的多少成( )。 ①正比 ②等比 ③反比 ④ 不成比例 46.要准确地反映异距数列次数的实际分布情况,必须计算( )。 ①次数 ②次数密度 ③频率 ④ 累计频率
11
47.在组距数列中,向下累计到某组的次数是100,这表示总体单位中( )。 ①大于该组下限的累计次数是100 ②小于该组下限的累计次数是100 ③大于该组上限的累计次数是100 ④小于该组上限的累计次数是100 58.把统计表分为简单表和分组表的依据是( )。
①分组标志的选定 ②分组数目多少 ③根据主词的分组情况不同 ④总体是否相同(二)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”) 1.统计调查的任务是搜集总体的原始资料。 ( ) 2.统计调查方案的首要问题是确定调查任务与目的,其核心是调查表。 ( )
3.在统计调查方案中,调查时间是指调查资料所属的时间,调查期限是指调查工作的期限。 4.调查单位是调查项目的承担者。 ( )
5.确定调查对象和调查单位,是为了回答向谁调查,由谁来具体提供统计资料的问题。 6.统计调查中,调查单位和填报单位在任何情况下都不可能一致。 ( )
7.普查可以得到全面、详细的资料,但需花费大量的人力、物力和财力及时间。因此,在统计调查中不宜频繁组织普查。 ( ) 8.普查是专门组织的一次性全面调查,所以其调查结果不可能存在误差。( )
9.在工业企业生产设备状况的普查中,调查单位是工业企业的每台生产设备,报告单位是每个工业企业。 ( ) 10.我国第五次人口普查规定以2000年11月1日零时为标准时点,是为了保证登记工作在同一时刻进行。 ( ) 11.抽样调查不可避免地会产生代表性误差,还有可能产生登记性误差,所以它的误差要比全面调查的误差大。 ( )
12.重点调查的结果,不仅可以反映总体的基本情况,而且还能用于说明总体的全貌。 13.重点调查的重点单位是这些单位在全部总体中虽然数目不多,但就调查的标志值来说却在总量中占很大的比重。 ( )
14.能够对统计总体进行分组,是由统计总体中的各个单位所具有的“同质性”特点决定的。 15.按数量标志分组,各组的变量值能准确地反映客观现象性质上的区别。( ) 16.统计分组的关键问题是确定分组标志和划分各组界限。 ( ) 17.按品质标志分组的结果形成变量数列。 ( )
18.离散型变量可以做单项式或组距式分组,而连续型变量只能做组距式分组,组限表示方法只能是重叠的。 ( )
19.异距分组中,为消除组距不等对次数实际分布的影响,一般需计算次数密度。
12
20.进行组距分组时,当标志值刚好等于相邻两组上下限数值时,一般把此值归并列为下限的那一组。 ( ) 21.组中值的假定性是指假定各单位标志值在本组范围内均匀分布。 ( ) 22.组中值可以近似地表示各组变量值的平均水平。 ( ) 23.登记性误差,在全面调查和非全面调查中都会产生。 ( ) 24.由于离散型变量不能用小数表示,因此只能以单项数列来表现资料。( )
25.按一个标志分组的就是简单分组,按两个或两个以上标志分组的就是复合分组。 (三)填空题
1.按调查对象包括的范围不同,统计调查可分为 和 ;按组织方式不同,
可分为 和 ;按登记时间的连续性划分,可分为 和 ;按搜集资料的方法不同,可分为 、 、 和 。
2.统计分组是根据统计研究需要,将统计总体按照 区分若干个组成部分的一种 。
3.统计分组的关键在于 和 。 4.变量数列是由 和 两部分构成的。
5.一个完整的统计调查方案,应包括的主要内容有 、 、 、 和 。
6.按品质标志分组形成的次数分布数列叫 分布数列;按数量标志分组形成的分布数列叫 数列。
7.统计表从形式上看由 、 、 和 等四部分组成。 8.对同一总体选择二个或二个以上的标志分别进行 分组,就形成平行分组体系。 9.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为 和 。
10.对连续大量生产的某种小件产品进行质量检验,最合适的调查方式方法是 。 (四)简答题
1.完整的统计调查方案包括哪些内容?
2.重点调查、典型调查、抽样调查有什么相同点和不同点? 3.为什么说抽样调查是所有非全面调查中最科学的调查方式? 4.统计分组的作用是什么?如何选择分组标志? (五)计算应用题
13
1.某班40名学生统计学考试成绩分别为:
66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81
学校规定:60分以下为不及格,60—70为及格,70—80分为中,80—90分为良,90—100分为优。
要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表; (2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。 2.某企业某班组工人日产量资料如下:
日产量分组(件) 50-60 60-70 70-80 80-90 90-100 合计 工人数(人) 6 12 18 10 7 53 根据上表指出:(1)该数列属于哪种类型的变量数列? (2)上表中的变量、变量值、上限、下限、次数; (3)计算组距、组中值、频率。
3.某百货公司连续40天的商品销售额如下(单位:万元):
41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35
要求:根据数据分组,编制频数分布表,并绘制直方图和折线图。
参考答案:
(一)单项选择题
1.① 2.③ 3.④ 4.③ 5.② 6.② 7.② 8.④ 9.③ 10.④ 11.④ 12.② 13.③ 14.② 15.③ 16.③ 17.④ 18.④ 19.④ 20.② 21.③ 22.④ 23.④ 24.④ 25.① 26.① 27.④ 28.② 29.③ 30.③ 31.① 32.④ 33.② 34.② 35.③ 36.② 37.② 38.④ 39.① 40.③ 41.② 42.④ 43.① 44.① 45.③ 46.② 47.① 48.③
(二)判断题
1.× 2.√ 3.√ 4.√ 5.√ 6.× 7.√ 8.× 9.√ 10.× 11.× 12.× 13.√ 14.× 15.√ 16.√ 17.× 18.√ 19.√ 20.√ 21.√ 22.√ 23.√ 24.× 25.×
(三)填空题
14
1.全面调查、非全面调查、专门调查、统计报表、经常性调查、一次性调查、采访法、直接
观察法、报告法、实验法 2.一定的标志、统计方法 3.选择分组标志、划分各组界限 4.变量值、频数 5.确定调查目的、确定调查对象和调查单位、确定调查项目和调查表、确定调查时间和调查期限、制定调查的组织实施计划 6.属性、变量 7.总标题、横行标题、纵栏标题、指标数 8.简单 9.1000、950 10.抽样调查
(四)简答题
1.统计调查方案的内容包括:(1)确定调查目的和任务;(2)确定调查对象和调查单位;(3)确定调查项目和调查表;(4)确定调查时间和调查方式;(5)制定调查的组织实施计划。
2.相同点:三种调查都是专门组织的非全面调查,都是从总体中抽出一部分单位进行调查。
不同点:(1)三种调查从总体中抽取调查单位的方法不同。重点调查是抽取一部分重点单位进行调查,对重点单位的选择不带有主观性;典型调查在确定调查单位时,是有意识抽选出的具有典型意义的单位;而抽样调查是按随机原则抽选调查单位,是排除人们主观意识的。(2)调查的目的不同。重点调查是为了解总体基本情况,典型调查主要是了解与总体数字相关的生动具体情况 。重点调查和典型调查,不能用被抽出的那部分单位所计算出的数据去推算总体的有关数据,而抽样调查的目的是用样本指标推断总体的数量特征。
3.抽样调查是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查方法。同其他非全面调查方法比较,抽样调查具有以下特点:第一,按照随机的原则抽选调查单位,排除个人主观意图的影响;第二,根据部分调查的实际资料对调查对象总体的数量特征作出具有一定可靠程度的估计;第三,抽样调查中的抽样误差虽是不可避免的,但事先是可以计算并加以控制的,保证抽样推断结果达到预期的可靠程度。
4.统计分组的作用:
统计分组可将复杂的现象科学分类,区分现象的不同类型,研究其不同的数量特征;分析总体的内部结构,揭示现象和事物发展的规律和趋势;分析各种现象间的依存关系,加深对事物的认识。
选择分组标志,(1)根据统计研究的目的;(2)适应被研究对象特征;(3)考虑历史资料的可比性。 (五)计算应用题
1.解:(1)“学生考试成绩”为连续变量,需采组距式分组,同时学生考试成绩分布较均
15
匀,故可用等距式分组来编制变量分配数列。
考试成绩 60分以下 60—70 70—80 80—90 90—100 合计 学生人数(人) 3 6 15 12 4 40 比率(%) 7.5 15.0 37.5 30.0 10.0 100.0 (2)分组标志为考试成绩,属于数量标志,简单分组;从分配数列中可看出,该班同
学不及格人数和优秀生的人数都较少,分别为7.5%和10%。大部分同学成绩集中在70—90分之间,说明该班同学成绩总体良好。
考试成绩一般用正整数表示时,可视为离散变量也可用单项式分组,但本班学生成绩波动幅度大,单项式分组只能反映成绩分布的一般情况,而组距分组分配数列可以明显看出成绩分布比较集中的趋势,便于对学生成绩分布规律性的掌握。 2. 解:(1)该数列是等距式变量数列
(2)变量是日产量,变量值是50-100,下限是50、60、70、80、90,上限是60、70、80、90、100,次数是6、12、18、10、7;
(3)组距是10,组中值分别是55、65、75、85、95,频率分别是11.32%、22.64%、33.96%、18.87%、13.21%。
3.解: 某百货公司连续40天的商品销售额频数分布表
销售额 频数 频率 累计频数 累计频率 组中值 (万元) (天) (%) 以下 以上 以下 以上 (万元) 25—30 4 10 4 40 10 100 27.5 30—35 6 15 10 36 25 90 32.5 35—40 15 37.5 25 30 62.5 75 37.5 40—45 9 22.5 34 15 85 37.5 42.5 45—50 6 15 40 6 100 15 47.5 合 计 40 100.0 — — — — —
16 14 12 10 8 6 4 2
25 30 35 40 45 50
16
第三章 总量指标与相对指标
学习目的和要求:
通过本章的学习,正确理解总量指标与相对指标的概念、意义、作用,明确其种类、区别及其计算,并能运用总量指标、相对指标对社会经济现象进行综合分析。
难点释疑:
时期指标和时点指标的关系是本章重点、难点,如果对此不能很好的理解,以后学习时间序列的序时平均数时会遇到更大的困难。可以从三个方面来区分它们:一是时期指标可以相加,以反映更长时期的总量,而时点指标各指标值不能相加,或相加没有实际意义;二是时期指标数值大小和时期长短有直接关系,如年GDP肯定要大于月GDP,而时点指标指标数值与时间间隔长短没有直接关系,如年末职工人数不一定大于某一个月的职工人数;三是时期指标是通过连续计数的方式取得的,以反映现象在一定时期内的发展总量,而时点指标是通过间断取值的方法取得的,以反映现象在某一瞬间的状态。
练习题:
(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)
1.总量指标按其反映时间状况不同,可以分为( )。 ①总体总量和标志总量 ②总体总量和时期指标 ③标志总量和时期指标 ④时点指标和时期指标 2.总量指标按其反映内容的不同,可以分为( )。 ①时点指标和时期指标 ②时期指标和标志总量 ③总体单位总量和总体标志总量 ④总体总量和时点指标
3.某企业某月产品销售额为20万元,月末库存商品为30万元,这两个总量指标是( )。 ①时期指标 ②时点指标
③前者为时期指标,后者为时点指标 ④前者为时点指标,后者为时期指标 4.下列属于总量指标的是( )。
①出勤率 ②合格率 ③人均产粮 ④工人人数 5.在相对指标中,主要用有名数表示的指标是( )。
①结构相对指标 ②强度相对指标 ③比较相对指标 ④动态相对指标 6.按人口平均计算的钢产量是( )。
①算术平均数 ②比例相对数 ③比较相对数 ④强度相对数
7.第五次人口普查结果,我国每10万人中具有大学程度的为3611人。该数字资料为( )。 ①绝对数 ②比较相对数 ③强度相对数 ④结构相对数
8.某地区有40个工业企业,职工人数为8万人,工业总产值为4.5亿元,在研究工业企业
17
职工分布和劳动生产率的情况时( )。
①40个企业既是标志总量又是总体单位总量 ②8万人既是标志总量又是总体单位总量 ③4.5亿元既是标志总量又是总体单位总量 ④每个企业的产值既是标志总量又是总体单位总量 9.产品合格率,设备利用率这两个相对数是( )。
①结构相对数 ②强度相对数 ③比例相对数 ④比较相对数
10.我国第五次人口普查结果,我国男女之间的对比关系为1.063:1,这个指标是( )。 ①比较相对数 ②比例相对数 ③强度相对数 ④结构相对数 11.某月份甲工厂的工人出勤率属于( )。
①结构相对数 ②强度相对数 ③比例相对数 ④计划完成相对数 12.某厂的劳动生产率计划比去年提高5%,执行结果提高8%,则劳动生产率计划执行提高程度为( )。
①8%-5%=3% ②5%+8%=13%
1085%?100%?2.86% ?100%??2.78%③ ④
1058.某厂劳动生产率计划比上年提高8%,实际仅提高4%,则其计划完成百分数为( )。 ①4% ②50% ③96.30% ④103.85%
14.某厂某产品的单位产品成本计划规定比去年降低5%,实际降低了7%,则其计划完成百分数为( )。
①97.9% ②140.0% ③102.2% ④71.4% 15.在5年计划中,用水平法检查计划完成程度适用于( )。 ①规定计划期初应达到的水平 ②规定计划期末应达到的水平 ③规定5年累计应达到的水平 ④规定计划期内某一时期应达到的水平 16.用累计法检查五年计划的执行情况适用于( )。
①规定计划期初应达到的水平 ②规定计划期内某一时期应达到的水平 ③规定计划期末应达到的水平 ④规定五年累计应达到的水平
17.某种产品按五年计划规定,最后一年产量应达到450万吨,计划执行情况如下(万吨):
第三年 时 间 第一年 第二年 上半年 下半年 一季度 第四年 二季度 三季度 四季度 一季度 第五年 二季度 三季度 四季度 产量 300 320 170 190 100 100 110 120 120 120 130 130 该产品( )五年计划任务。
18
①提前一年完成 ②提前9个月完成 ③提前半年完成 ④按计划要求完成
(二)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”)
1.同一总体时期指标的大小,必然与时期的长短成正比;时点指标数值的大小,必然与时点间的间隔成反比。 ( ) 2.工人人数是时期指标,国民生产总值是时点指标。 ( )
3.总体单位总量和总体标志总量并不是固定不变的,而是随着统计研究目的不同而变化。 4.旅客运输量按人次计量,是一种双重单位。 ( ) 5.比较相对指标是将不同空间条件下同类指标数值进行对比的结果。 ( )
6.强度相对指标的数值是用复名数表示的,因此都可以计算它的正指标和逆指标。 7.某厂劳动生产率计划在去年的基础上提高8%,计划执行结果仅提高了4%,劳动生产率计划仅完成了一半。 ( ) 8.计划完成相对数的数值大于100%,就说明完成并超额完成了计划。 ( )
(三)填空题
1.总量指标是计算______ 和______ 的基础。总量指标按反映现象总体的内容不同可分为______ 和______ ;按其反映的时间状况不同可分为______ 和______ 。
2.总量指标的计量单位有______ 、______ 和______ 三种形式。 3.总量指标的数值随着 的大小而增减。只有对 才能计算总量指标。 4.考察每一职工的平均收入时,职工人数是 总量指标,当研究目的是通过每一企业平均职工人数来观察企业规模时,职工人数为 总量指标。
5.相对指标数值有______ 和______ 两种形式。______ 是一种抽象化的数值,多以______ 、______ 、______ 、______ 或______ 表示。
6.积累额与消费额的比例为1/3,则积累额占国民经济收入使用额的25%,前者为______ 相对指标,后者为______ 相对指标。
7.强度相对指标的分子、分母一般可以互换,因而有___ ____和___ ____之分。 8.强度相对指标数值的大小,如果与现象的发展程度或密度成正比,称之为 ,反之称为 。
9.长期计划执行结果的检查方法有两种,一种是__ _____,另一种是______ _。如计划指标是按计划期末应达到水平下达的,应采用 计算;如计划指标是按全期累计完成量下达的,则采用 计算。
10.计算和应用计划完成程度相对指标时,当计划任务是按最低限额规定时,则计划完成百分数以______100%为好,当计划任务是按最高限额规定时,则计划完成百分数以______100%为好。
19
(四)简答题
1.什么叫总量指标?计算总量指标有什么重要意义? 2.时期指标和时点指标有什么区别与联系? 3.什么是相对指标?相对指标的作用有哪些?
4.在分析长期计划执行情况时,水平法和累计法有什么区别?
(五)计算应用题
1.某企业今年计划产值比去年增长5%,实际计划完成108%,问今年产值比去年增长多少? 2.我国2001年高校招生及在校生资料如下:
单位:万人
学校 普通高校 成人高等学校 招生人数 268 196 比上年增招人数 48 40 在校生人数 719 456 要求:(1)分别计算各类高校招生人数的动态相对数; (2)计算普通高校与成人高校招生人数比;
(3)计算成人高校在校生数量占所有高校在校生数量的比重。 3.某省2009年和2010年进出口贸易总额资料如下:
时间 2009年 2010年 出口总额(亿元) 2492 2662 进口总额(亿元) 2251 2436 要求:(1)分别计算2009年、2010年的进出口贸易差额; (2)计算2010年进出口总额比例相对数及出口总额增长速度; (3)分析进出口贸易状况。
4.根据下列资料,计算强度相对数的正指标和逆指标,并根据正指标数值分析该地区医疗卫生设施的变动情况。
指 标 医院数量(个) 地区人口总数(万人) 2000年 40 84.4 2010年 56 126.5 5.某地区2010年计划国民生产总值为120亿元,实际实现132亿元,年平均人口600万,2010年国民生产总值的第一、二、三产业情况如下表:
国民生产总值 第一产业 第二产业 第三产业 计划数(亿元) 120 10 65 45 实际数(亿元) 132 12 73 47 又知该地区2009年国民生产总值为122亿元,乙地区2010年实现国民生产总值150亿元,利用上述资料,计算所有可能的相对指标。
20
6.某产品按五年计划规定,最后一年产量应达到54万吨,计划完成情况如下:
第一年 40 第二年 43 第三年 上半年 20 下半年 24 一季 度 11 第四年 二季 度 11 三季 度 12 四季 度 13 一季 度 13 第五年 二季 度 14 三季 度 14 四季 度 15 产量 试问该产品提前多长时间完成五年计划? 7.某工厂2010年上半年进货计划执行情况如下: 材料 生铁 钢材 水泥 单位 吨 吨 吨 全年进货计划 2000 1000 500 第一季度进货 计划 500 250 100 实际 500 300 80 第二季度进货 计划 600 350 200 实际 618 300 180 (1)各季度进货计划完成程度; (2)上半年进货计划完成情况; (3)上半年累计计划进度执行情况。
参考答案:
(一)单项选择题
1.④ 2.③ 3.③ 4.④ 5.② 6.④ 7.④ 8.② 9.① 10.② 11.② 12.④ 13.③ 14.① 15.② 16.④ 17.②
(二)判断题
1.× 2.× 3.√ 4.× 5.√ 6.× 7.× 8.×
(三)填空题
1.相对指标、平均指标、总体单位总量、总体标志总量、时期指标、时点指标 2.实物单位、价值单位、劳动单位 3.总体范围、有限总体
4.总体单位、总体标志 5.有名数、无名数、无名数、系数、倍数、成数、百分数、千分数 6.比例、结构 7.正指标、逆指标 8.正指标、逆指标 9.水平法、累计法、水平法、累计法 10.大于、小于
(四)简答题
1.总量指标是反映现象总体规模或水平的统计指标。 计算总量指标的意义是:
(1)总量指标是认识客观现象总体数量特征的起点; (2)总量指标是实行社会管理的依据之一; (3)总量指标是计算相对指标和平均指标的基础。
21
2.时期指标和时点指标都是反映现象发展总量的综合指标。二者的区别是:
(1)时期指标的数值是连续登记的,而时点指标的数值是在某个时间点上间断计数取
得的;
(2)时期指标的数值具有累加性,说明较长时期内现象发展总量,时点指标的数值累加一般无意义;
(3)一般同一总体时期指标值的大小与时间长短成正比,时点指标数值的大小与时点的间隔长短无直接联系。
3.相对指标把两个具体数值抽象化,使人们对现象之间所存在的固有联系有较为深刻的认识,这种对比分析方法是统计分析的基本方法。
相对指标的主要作用是:(1)反映总体深层次的数量特征;(2)可以使一些不能直接对比的现象总量找到对比的基础;(3)是进行计划管理和考核经济活动成果的重要指标之一。
4.在检查长期计划(通常为五年)的完成情况时,由于计划指标的规定有两种情况,所以考核其计划执行情况也有两种不同的方法:水平法和累计法。(1)含义不同。水平法是以计划期末实际达到的水平与计划期末规定达到的水平之比来计算计划完成程度;而累计法是以计划期实际累计完成数与计划期规定的累计数之比来确定计划的完成情况。(2)应用场合不同。水平法适用于检查计划指标是按计划期期末应达到的水平制定的长期计划;累计法适用于检查计划指标是按整个计划期累计应达到的水平制定的长期计划。(3)计算提前完成计划的时间有不同的方法。采用水平法检查长期计划完成情况时,只要计划期内有连续一期(如一年)的时间实际完成的水平达到了计划末期(如末年)水平,此时就算完成计划,所余时间为提前完成计划的时间;采用累计法时,只要从计划期开始至某一时期止,累计完成的实际数达到了计划规定的累计数就算完成计划,所余时间即是提前完成计划的时间。
(五)计算应用题
1.解:已知:
今年计划数?105%;
去年实际数今年实际数?108%;
去年计划数今年实际数所以:=105%×108%=113.4%;
去年计划数今年产值比去年增长13.4%。 2.解:
学 校 普通高校 成人高等学校 招生人数动态相对数(%) 117.91 120.41 占在校生总数的比重(%) 61.19 38.8l 普通高校招生人数/成人高等学校招生人数:1.37∶1。
22
3.解:2000年进出口贸易差额=2492-2251,即顺差241亿元; 2001年进出口贸易差额=2662-2436,即顺差226亿元; 2001年进出口比例=2436/2662=91.51∶100; 2001年出口总额增长率=
2662?1=6.82%。 24924.解:2000年每万人拥有医院数=40/84.4=0.4739; 2000年每个医院服务人数=84.4/40=2.11(万人); 2009年每万人拥有医院数=56/126.5=0.4427; 2009年每个医院服务人数=126.5/56=2.26(万人)。
5.解:(1)计划完成程度相对指标:全部110%,第一产业120%,第二产业112.3%,第三产业104.3%;
(2)结构相对指标:第一产业9.1%,第二产业55.3%,第三产业35.6%; (3)比例相对指标:第一产业:第二产业:第三产业为1∶6.08∶3.92; (4)比较相对指标:
2009年甲地区GNP?88%;
2009年乙地区GNP(5)动态相对指标:甲地区发展速度(GNP)=108.2%; (6)强度相对指标:甲地区人均国民生产总值=2200元/人。
6.解:用水平法计算第五年计划完成程度为103.7%,从第四年第四季度累计到第五年第三季度共一年时间,产量达到五年计划末期54万吨水平(13+13+14+14=54),故该产品提前一个季度完成计划。 7.解:列表计算如下:
一季度进货计划完成(%) 二季度进货计划完成(%) 上半年进货计划完成(%) 上半年累计计划执行速度 生铁 100 103 101.6 55.9 钢材 120 85.7 100 60 水泥 80 90 86.7 52
第四章 数据分布特征的测度
学习目的和要求:
通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。
难点释疑:
(一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均
23
数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。
(二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。
(三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。
(四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。标准差是实际中应用最广泛的离散程度测度值。
(五)标准差系数的应用。为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。它是标志变异的相对指标。它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。
练习题:
(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)
1.平均指标反映了( )。
①总体变量值分布的集中趋势 ②总体分布的离散特征 ③总体单位的集中趋势 ④总体变动趋势 2.加权算术平均数的大小( )。
①受各组标志值的影响最大 ②受各组次数的影响最大
③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响
3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。 ①接近于变量值大的一方 ②接近于变量值小的一方 ③不受权数的影响 ④无法判断 4.权数对于平均数的影响作用取决于( )。
①总体单位总量 ②各组的次数多少
③各组标志值的大小 ④各组次数在总体单位总量中的比重
5.由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( )。
①各组的次数必须相等 ②各组标志值必须相等
24
③各组标志值在本组内呈均匀分布 ④各组必须是封闭组
6.如果次数分布中,各个标志值扩大为原来的2倍,各组次数都减小为原来的1/2,则算术平均数( )。 ①增加到原来的
11 ②稳定不变 ③减少到原来的 ④扩大为原来的2倍 227.已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销 售额基本相同的情况下,计算平均价格可采取的平均数形式是( )。
①简单算术平均数 ②加权算术平均数 ③简单调和平均数 ④加权调和平均数 8.凡是变量值的连乘积等于总比率或总速度的现象,要计算其平均比率或平均速度都可以采用( )。
①算术平均法 ②调和平均法 ③几何平均法 ④中位数法 9.四分位差排除了数列两端各( )单位标志值的影响。 ①10% ②15% ③25% ④ 35% 10.如果一组变量值中有一项为零,则不能计算( )。 ①算术平均数 ②调和平均数 ③众数 ④中位数
11.在掌握了各组单位成本和各组产量资料时,计算平均单位成本所使用的方法应是( )。 ①算术平均数 ②调和平均数 ③几何平均数 ④中位数 12.各变量值与算术平均数离差平方的和为( )。 ①0 ②1 ③最小 ④最大 13.出现次数最多的那个标志值是( )。
①众数 ②中位数 ③算术平均数 ④几何平均数 14.各总体单位的标志值都不相同时( )。
①众数不存在 ②众数就是最小的变量值 ③众数是最大的变量值 ④众数是出现次数最多的变量值 15.由组距数列确定众数时,如果众数组的相邻两组的次数相等,则( )。 ①众数在众数组内靠近上限 ②众数在众数组内靠近下限 ③众数组的组中值就是众数 ④众数为零 16.当各个变量值的频数相等时,该变量的( )。
①众数不存在 ②众数等于均值 ③众数等于中位数 ④众数等于最大的变量值 17.如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?( ) ①算术平均数 ②几何平均数 ③中位数 ④众数 18.一组数据排序后处于25%和75%位置上的值称为( )。 ①众数 ②中位数 ③四分位数 ④均值
25
19.四分位数实际上是一种( )。
①算术平均数 ②几何平均数 ③位置平均数 ④数值平均数 20.当数据组高度偏态时,哪一种平均数更具有代表性? ( ) ①算术平均数 ②中位数 ③众数 ④几何平均数
21.假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用( )。
①算术平均数 ②几何平均数 ③众数 ④调和平均数
22.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用( )。
①众数 ②中位数 ③四分位数 ④算术平均数 23.在标准正态分布条件下,有( )。
①?=Me=Mo ②Mo>Me>? ③Me>?>Mo ④?>Me>Mo 24.若某总体次数分布呈轻微左偏分布,则有( )成立。
①?> Me>Mo ②? ①左偏分布 ②右偏分布 ③对称分布 ④J形分布 26.下列变异指标中,消除了量纲影响的是( )。 ①全距 ②平均差 ③标准差 ④离散系数 27.标准差系数抽象了( )。 ①总体指标数值大小的影响 ②总体次数多少的影响 ③标志变异程度的影响 ④平均水平高低对离散分析的影响 28.下列标志变异指标中,最易受极端值影响的是( )。 ①全距 ②平均差 ③标准差 ④离散系数 29.可直接用标准差评价两数列差异程度大小的条件是:两数列的平均数( )。 ①相差较大 ②相差较小 ③不等 ④相等 30.若两组数列的计量单位不同,在比较两数列的离散程度大小时,应采用( )。 ①全距 ②平均差 ③标准差 ④标准差系数 31.甲班学生平均成绩80分,标准差8.8分,乙班学生平均成绩70分,标准差8.4分,因此( )。 26 ①甲班学生平均成绩代表性好一些 ②乙班学生平均成绩代表性好一些 ③无法比较哪个班学生平均成绩代表性好 ④两个班学生平均成绩代表性一样 32.两个总体的平均数不等,但标准差相等,则( )。 ①平均数小,代表性大 ②平均数大,代表性大 ③两个平均数代表性相同 ④不能判断哪个平均数代表性大 33.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成数方差为( )。 ①25% ②30% ③40% ④50% 34.是非标志的成数方差最大值为( ) ①1 ②0.5 ③0.25 ④0 35.下列分布中,集中度最大的是( )。 ① ② ③ ④ 36.下列分布中,离中度最大的是( )。 ① ② ③ ④ 37.某企业有甲、乙两个生产车间,已知2009年甲、乙两车间工人的月平均工资分别为1820元和1900元,又知2010年甲车间工人数占全厂工人总数比重上升,乙车间的下降。若2010年两车间工人工资水平不变,则全厂工人平均工资将( )。 ①提高 ②下降 ③不变 ④升降不定 (二)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”) 1.权数对算术平均数的影响作用取决于权数本身绝对值的大小。 ( ) 2.算术平均数的大小,只受总体各单位标志值大小的影响。 ( ) 3.在特定条件下,加权算术平均数可以等于简单算术平均数。 ( ) 4.在资料已分组形成变量数列的条件下,计算算术平均数或调和平均数时,应采用简单式;反之,采用加权式。 ( ) 27 5.未知计算平均数的基本公式中的分子资料时,应采用加权算术平均数方法计算。 6.根据组距式数列计算得到的算术平均数只能是一个近似值。 ( ) 7.当各标志值的连乘积等于总比率或总速度时,宜采用几何平均法计算平均数。 8.当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,应采用倒数平均数来计算平均比率。 ( ) 9.中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响。 10.分位数都属于数值平均数。 ( ) 11.众数是总体中出现最多的次数。 ( ) 12.如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在。( ) 13.投资者连续三年股票投资收益率为4%、2%和5%,则该投资者三年内平均收益率为3.66%。 ( ) 14.总体中各标志值之间的差异程度越大,标准差系数就越小。 ( ) 15.在一个总体中,算术平均数、中位数和众数始终是相等的。 ( ) 16.若已知甲数列的标准差小于乙数列,则可断言:甲数列算术平均数的代表性好于乙数列。 17.变量数列的分布呈右偏分布时,算术平均数的值最小。 ( ) 18.是非标志的标准差是总体中两个成数的几何平均数。 ( ) 19.若A、B、C三个公司的利润计划完成程度分别为95%、100%和105%,则这三个公司平均的利润计划完成程度应为100%。 ( ) 20.在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全部的离差之和一定等于0。 ( ) (三)填空题 1.平均指标就是在 内,将各单位 ,用以反映总体在一定时间、地点条件下的一般水平。 2.统计中的变量数列是以 为中心而上下波动,所以平均数反映了总体分布的 。 3.根据组距数列计算算术平均数时,假定各组内的标志值是 分布的,并以 代表变量值计算平均数。 4.利用组中值计算算术平均数是假定各组内的标志值 分布,计算结果只是一个 值。 5.加权术平均数受两个因素的影响,一个是 ,一个是 。 6.权数对算术平均数的影响作用,不决定于权数 的大小,而决定于 28 的比重大小。 7.权数在算术平均数的计算方法中有两种表现形式,即 和 ,其中 是权数的实质。 8.在计算加权算术平均数时,必须慎重选择权数,务必使各组的 和 的乘积等于各组的 。 9.加权算术平均数的大小接近于 的这一组的标志值。 10.几何平均数又称 ,当各项变量值的连乘积等于 或 时,都可以适用几何平均数计算平均比率或平均速度。 11.算术平均数、调和平均数、几何平均数又称为 平均数;众数、中位数又算称为 __ 平均数。其中 平均数不受极端数值的影响。 12.某日某农贸市场最普遍的成交价格,这在统计上称做 。 13.由组距数列求众数时,如众数组相邻两组的次数相同,则 即为众数。 14.某总体呈轻微偏态分布,已知其算术平均数等于94,中位数等于96,则众数等于 ,该总体为 分布。 15.平均指标说明变量数列中变量值的 ,而标志变异指标则说明变量的 。 16.标志变异指标的大小与平均数代表性的大小成 关系。 17.是非标志的平均数为 ,标准差为 。 18.某种产品的合格率为95%,废品率为5%,则该种产品的平均合格率为 ,其标准差是 。 19.某企业职工按工资额分组,最高组为140-150元,最低组为50-60元,其全距为 。 20.变异指标是衡量 的尺度,它与 成 关系。 21.已知平均数?=120元,标准差系数V=30%,则标准差?= 。 22.全距是标志值的 与 之差。在组距分组资料中,可以用 和 之差来近似地表示全距。 23.标准差系数是 与 之比,其计算公式 。 24.现象的 是计算或应用平均数的原则。 25.成数方差的最大值,是当P值趋近于 。 (四)简答题 1.对统计数据的分布特征,主要从哪几个方面进行描述? 2.平均指标与强度相对指标的区别是什么? 29 3.平均指标的计算原则是什么?有何作用? 4.简述变异指标的概念和作用。 5.为什么要研究标志变异指标? 6.什么是标志变动度?测定它的方法有几种? (五)计算应用题 1.某研究所职工月工资资料如下: 按月工资分组(元) 6000—7000 7000—8000 8000—9000 9000以上 职工人数(人) 20 45 35 10 试用次数权数和比重权数分别计算该所职工的平均工资。 2.某企业工人按日产量分组如下: 单位:件 工人按日产量分组 20以下 20—30 30—40 40—50 50—60 60以上 合计 工人数(人) 七月份 30 78 108 90 42 12 360 八月份 18 30 72 120 90 30 3600 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 3.以下数据给出的是道森供应公司和J.C克拉克批发公司两家公司交付定货天数的数据。 道森供应公司交货天数:11 10 9 10 11 11 10 11 10 10 克拉克批发公司交货天数:8 10 13 7 10 11 10 7 15 12 哪一家供应公司交货时间更稳定、更可靠。用数据支持你的结论。 4.某职员每天可以有两种方法去上班:公共交通和小汽车。每种方法所需要的样本时间记录如下(单位:分钟) 公共交通:28 29 32 37 33 25 29 32 41 34 小汽车: 29 31 33 32 34 30 31 32 35 33 应该选用那一种方法更合适?请解释。 5.设甲、乙两单位职工的工资资料如下: 30 甲单位 月工资(元) 职工人数(人) 600以下 2 600-700 700-800 800-900 900-1000 1000-1100 合计 4 10 7 6 4 30 乙单位 月工资(元) 职工人数(人) 600以下 1 600-700 700-800 800-900 900-1000 1000-1100 合计 2 4 12 6 5 30 比较哪个单位的职工工资差异程度小。 6.2010年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下: 甲市场成交额 品种 甲 乙 丙 合计 价格(元/斤) 1.2 1.4 1.5 — (万元) 1.2 2.8 1.5 5.5 乙市场成交量 (万斤) 2 1 1 4 哪一个市场农产品的平均价格高?并说明原因。 7.某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计算三道生产工序的平均合格率。 8.已知某企业有如下资料: 按计划完成百分比分组(%) 80—90 90—100 100—110 110—120 计算该企业平均计划完成程度。 实际产值(万元) 986 1057 1860 1846 9.已知某公司职工的月工资收入为965元的人数最多,其中,位于全公司职工月工资收入中间位置职工的月工资收入为932元,试根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入变量数列属于何种偏态? 31 10.某地区居民某年医疗费支出的众数为300元,算术平均数为250元。 要求: (1)计算中位数近似值; (2)说明该地居民医疗费支出额分布的态势; (3)若该地区居民医疗费支出额小于400元的占人数的一半,众数仍为300元,试估计算术平均数,并说明其分布态势。 11.对成年组和幼儿组共500人身高资料分组,分组资料列表如下: 成年组 按身高分组(cm) 150—155 155—160 160—165 165—170 170以上 合计 要求: 幼儿组 按身高分组(cm) 70—75 75—80 80—85 85—90 90以上 合计 人数(人) 20 80 40 30 30 200 人数(人) 30 120 90 40 20 300 (1)分别计算成年组和幼儿组身高的平均数、标准差和标准差系数。 (2)说明成年组和幼儿组平均身高的代表性哪个大?为什么? 12.对某车间甲、乙两工人当日产品中各取10件产品进行质量检查,得如下资料: 按零件的长度分组(mm) 9.6以下 9.6—9.8 9.8—10.0 10.0—10.2 10.2—10.4 合计 甲工人零件(件) 1 2 3 3 1 10 已知经过计算乙工人生产零件的平均长度为9.96mm,标准差为0.254mm。试比较甲、乙两工人谁生产的零件质量较稳定。 13.两种水稻分别在五块田地上试种,其产量如表: 32 地块标号 1 2 3 4 5 合计 甲品种 地块面积(亩) 1.2 1.1 1.0 0.9 0.8 5.0 产量(斤) 1200 1045 1100 810 840 4995 1.5 1.3 1.3 1.0 0.9 6.0 乙品种 地块面积(亩) 产量(斤) 1680 1300 1170 1208 630 5988 假定各地块两个品种的生产条件相同,试计算这两个品种的平均收获率,进而确定哪一品种具有较大的稳定性和推广价值。 14.一批苹果自山东某地运往上海口岸,随机抽出200箱检验,其中有4箱不符合质量要求,试问是非标志的平均数和标准差各是多少? 15.某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表。 使用时间 (小时) 900以下 900—950 950—1000 1000—1050 抽样检查电灯泡数(个) 2 4 11 71 使用时间 (小时) 1050—1100 1100—1150 1150—1200 1200以上 合计 抽样检查电灯泡数(个) 84 18 7 3 200 按照质量规定,电灯泡使用寿命在1000小时以上者为合格品,试计算平均合格率、标准差及标准差系数。 16.某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。 17.某市场上某种蔬菜早市每斤0.25元,中午每斤0.2元,晚市每斤0.1元,现在早、中、晚各买一元,求平均价格。 18.某地区20个商店某年第四季度资料: 商品销售计划完成程度分组(%) 80—90 90—100 100—110 110—120 商店数目 3 4 8 5 实际商品销售额 (万元) 45.9 68.4 34.4 94.3 流通费用率 (%) 14.8 13.2 12.0 11.0 试计算该地区20个商店平均完成销售计划指标以及总的流通费用率(提示:流通费用率=流通费用额/实际销售额)。 19.(课堂作业)甲、乙两厂生产同种电子元件,经抽查,甲厂该种电子元件的平均耐用时 33 间为116.8小时,标准差为15.3小时,乙厂该电子元件耐用时间的分组资料如下: 耐用时间(小时) 100以下 100—120 120—140 140以上 合计 (1)计算并比较哪个厂电子元件平均耐用时间长? (2)比较哪个厂电子元件耐用时间差异较大? 20.(课堂作业)某工厂生产一批零件共10万件,为了解这批产品的质量,采取抽样的方法抽取1000件进行检验,其结果如下: 使 用 寿 命 700以下 700—800 800—900 900—1000 1000—1200 1200以上 合 计 标准差及标准差系数。 零 件 数 (件) 10 60 230 450 190 60 1000 抽查元件数量(只) 3 11 31 5 50 根据质量标准,使用寿命800小时及以上者为合格品。试计算这批零件的平均合格率、参考答案: (一)单项选择题 1.① 2.④ 3.② 4.④ 5.③ 6.④ 7.④ 8.③ 9.③ 10.② 11.① 12.③ 13.① 14.④ 15.③ 16.① 17.④ 18.③ 19.③ 20.② 21.③ 22.① 23.① 24.② 25.① 26.④ 27.④ 28.① 29.④ 30.④ 31.① 32.② 33.① 34.③ 35.④ 36.③ 37.② (二)判断题 1.× 2.× 3.√ 4.× 5.√ 6.√ 7.√ 8.× 9.× 10.× 11.× 12.√ 13.× 14.× 15.× 16.× 17.× 18.√ 19.× 20.√ (三)填空题 1.同质总体、数量差异抽象化 2.算术平均数、集中趋势 3.均匀、组中值 4.均匀、近似 5.变量值、权数 6.本身数值、各权数占总体单位数 7.绝对数权数、相对数权数、相对数权数 8.变量值、次数、标志总量 9.权数大 10.对数平均数、总比率、总速度 11.数值、位置、位置 12.众数 13.众数组的组中值 14.100、左偏 15.集中趋势、离中趋势 16.反比 34 17. P、P?1?P? 18. 95%、95%?5%=21.79% 19.100元 20.平均数、平均数代表性大小、反比 21.36元 22.最大值、最小值、最大组上限、最小组下限 23.标准差、平均数、V???X?100% 24.同质性 25.0.5 (四)简答题 1.统计数据的分布特征,从集中趋势、离散程度、偏度和峰度三个方面进行描述。平均指标旨在反映总体的一般水平或分布的集中趋势;变异指标是用来刻画总体分布的变异状况或离散程度的指标;偏度和峰度描述数据分布的形状。 2.(1)概念不同。强度相对数是两个有联系而性质不同的总体对比而形成的相对数指标。算术平均数是反映同质总体单位标志值一般水平的指标。(2)主要作用不同。强度相对数反映两不同总体现象形成的密度、强度。算术平均数反映同一现象在同一总体中的一般水平。(3)计算公式及内容不同。算术平均数分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一 一对应的关系,而强度相对数是两个总体现象之比,分子分母没有一 一对应关系。 3.平均指标的计算原则是:(1)现象的同质性;(2)要用组平均数补充总平均数;(3)要用分配数列补充说明平均数;(4)注意一般和个别相结合,把平均数和典型事例结合起来。 平均指标的作用:(1)可以消除因总体范围不同而带来的总体数量变异,从而使不同的总体具有可比性;(2)同一总体在不同时间上的平均数可以说明该现象总体的发展变化趋势;(3)利用平均指标可以分析现象之间的依存关系;(4)平均数是统计推断的一个重要参数。 4.变异指标是反映现象总体中各单位标志值变异程度的指标。以平均指标为基础,结合运用变异指标是统计分析的一个重要方法。变异指标的作用有:反映现象总体各单位变量分布的离中趋势;说明平均指标的代表性程度;测定现象变动的均匀性或稳定性程度。 5.总体的分布特征主要有两方面,一是变量值的集中趋势,一是变量值的离中趋势。平均指标是将变量值的数量差异抽象化,以反映现象的一般水平,即变量值的集中趋势;但总体内部各单位之间的差异毕竟是客观存在的,它们构成了总体分布的另一方面的重要特征。标志变异指标能反映变量值的差异程度,即变量值的离中趋势。在统计分析中,变异指标与平均指标是相互补充的,二者结合起来反映总体分布的特征。 6.标志变动度是反映现象总体中各单位标志值变异程度的指标,是测定平均数代表性最重要的方法。常用的测定标志变动度的方法主要有三种:全距法、平均差法、标准差法。 35 (五)计算应用题 1.解: 工资各组组中值X 6500 7500 8500 9500 合计 职工人数f 20 45 35 10 110 所占比重f?f Xf 130000 337500 297500 95000 860000 0.18 0.41 0.32 0.09 1.00 次数权数:该局平均工资??比重权数: 该局平均工资?????2.解: ??f?f?860000?7818(元) 110f?f=6500×0.18+7500×0.41+8500×0.32+9500×0.09=7818(元) 7月份 8月份 工人数比重(%) 工人按日产量分组(日) 20以下 20-30 30-40 40-50 50-60 60以上 合计 组中值工人数(件) (人)X f 15 25 35 45 55 65 — 30 78 108 90 42 12 360 比重(%)f/?f 8.33 21.67 30.00 25.00 11.67 3.33 100.00 ?f (人)f 18 30 72 120 90 30 360 f/?f 5.00 8.33 30.00 33.34 25.00 8.33 100.00 ?f 450 1950 3780 4050 2310 780 13320 270 750 2520 5400 4950 1950 15840 7月份平均每人日产量为:????f?f?13320?37(件) 3608月份平均每人日产量为:????f?f?15840?44(件) 360根据计算结果得知,8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。 3.解: 36 道森供应公司 平均 标准误差 中值 模式 标准偏差 样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 10.3 0.213437 10 10 0.674949 0.455556 -0.28299 -0.43364 2 9 11 103 10 克拉克批发公司 平均 标准误差 中值 模式 标准偏差 样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 10.3 0.817177 10 10 2.58414 6.677778 -0.35087 0.359289 8 7 15 103 10 从数据计算结果看,平均交货天数都为10.3天,但标准差不同,道森供应公司标准差为0.6749,克拉克批发公司标准差为2.584,由于平均数相同,因此可以认为道森供应公司交货时间更稳定、更可靠。从全距看,结论相同。 4.解: 公共交通上班平均时间=32 , 小汽车上班平均时间=32,公共交通上班时间标准差=4.64 小汽车上班时间标准差=1.93, 应选小汽车。小汽车上班时间变异程度小。 5.解: ?甲???f?f?2705026000?819.70(元); ??866.67(元) ?乙3330?甲=138.14(元); ?乙=124.05(元) V甲=138.14124.05?16.85%; V乙=?14.31% 819.70866.67? V甲?V乙,所以乙单位职工工资差异程度小。 6.解: 37 成交额单位:万元,成交量单位:万斤 品 种 甲 乙 丙 合计 甲 市 场 价格(元/成交量斤) 成交额(m) (m/x) 1.2 1.2 1 1.4 1.5 ── 2.8 1.5 5.5 2 1 4 乙市场成交量 成交量成交额(f) (xf) 2 2.4 1 1 4 1.4 1.5 5.3 甲市场平均价格 ?h??m?5.5?1.375(元) m4???5.3?1.325(元) 4?f?乙市场平均价格???f说明:两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。甲市场销售价格较高的乙产品量最多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。这就是权数在平均数形成中所起的权衡轻重的作用,如果将两个市场的各级成交量占总成交量的比重计算出来,则更能看出权数的作用。 7.解:由于各道工序合格率的连乘积等于总合格率,所以三道工序的平均合格率: ??n?1??2?????n?n???30.9574?0.9378?0.9723?30.8702?0.9547?95.47%8.解:列表计算如下: _ 按计划完成百分比分组(%) 80—90 90—100 100—110 110—120 合计 平均计划完成程度为: 组中值(%) 实际产值(万元) 计划产值(万元) X 85 95 105 115 —— m 986 1057 1860 1846 5749 5749?101.77% 5649m/X 1160.00 1112.63 1771.43 1605.22 5649.28 ?H??mm??? 38 9.解:月平均工资为:??__3Me?M03?932?965??915.50(元) 22该公司职工月工资收入变量数列属于左偏态。 10.解:(1)Me≈266.67 (2)?<Me<Mo,负偏态(左偏) (3)?≈450,?>Me>Mo,正偏态(右偏) 11.解:(1)成人组: 年龄 人数 组中值 总身高 离差 离差 平方 ??? __离差平 方加权 (厘米) (人) (厘米) (厘米) — 150—155 155—160 160—165 165—170 170以上 合 计 ?f????f__f ? 152.5 157.5 162.5 167.5 172.5 — ?f (???) 2(???)f 230 120 90 40 20 300 4575 18900 14625 6700 3450 48250 -8.33 -3.33 1.67 6.67 11.67 — ??69.39 11.09 2.79 44.49 136.19 — 22081.7 1330.8 251.1 1779.6 2723.8 8167 8167?5.22( )300?48250/300?160.83( )?(???)?ff? V????__?100%?3.25% 39 幼儿组: 年龄 人数 组中值 总身高 离差 离差 平方 2离差平 方加权 2(厘米) (人) (厘米) (厘米) — __?f f ? ??? 70—75 75—80 80—85 85—90 90以上 合 计 ?f????f__(???) (???)f 85.56 18.06 0.56 33.06 1711.25 1445 22.5 991.88 20 80 40 30 30 200 72.5 77.5 82.5 87.5 92.5 — 1450 6200 3300 2625 2775 16350 ??-9.25 -4.25 0.75 5.75 10.75 115.56 3466.88 — — 7637.51 ?16350/200?81.75( )?(???)?f__2f?7637.51?6.18( )200 V????__?100%?7.56%(2)成年组平均身高与幼年组平均身高相比,其平均数的代表性大些,因为其标准差系数小。 12.解:x甲??xf?f??99.2?9.92(mm) ,?甲?10?(x?x)2??f0.516?0.227(mm) 10∴V?甲??甲x甲0.227?0.254?2.29%, V?乙?n乙?2.55% 9.92x乙9.96∵Vσ甲 13.解:(1)平均亩产: ?甲?999斤?乙?998 (2)标准差:?甲=68.91斤 ?乙=162.71斤 (3)标准差系数:V甲=6.9% V乙=16.3% 可见,甲品种平均收获量高于乙品种,标准差系数甲品种又比乙品种小,说明甲品种收获率具有较大稳定性,有推广价值。 14.解: p=0.02, ?= pq= 0.02?0.98=4.64 40 15.解: 平均合格率p?71?84?18?7?3=91.5% 200标准差 ?p?P(1?P)≈ 0.28, 标准差系数V??pp≈0.31 16.解: 己知N?400件,N1?380件,N0?20件, NN138020??95﹪,q?0??5﹪, N400N400所以有:?p?P?0.95则P? ?p?Pq?0.95?(1?0.95)?0.218 17.解: 平均价格H= n1x1x218.解: 按商店销售计划完成程度分组(%) 80-90 90-100 100-110 110-120 合计 20个商店平均销售计划完成: 商店数目(个) ?1????1?xn3111=0.158(元) ??0.250.20.1组中值(%) 实际商品计划商品销售额 销售额 (万元) (万元) ⑶ 45.9 68.4 34.4 94.3 243.0 ⑷=⑶∶⑵ 54.0 72.0 32.8 82.0 240.8 流通费用率(%) 流通费用额(万元) ⑹=⑸×⑶ 6.79 9.03 4.13 10.37 30.32 ⑴ 3 4 8 5 20 ⑵ 85 95 105 115 — ⑸ 14.8 13.2 12.0 11.0 12.48 ???m?243=100.91% m240.8??30.32=12.48% 24320个商店总的流通费用率: ?f????f19.(略) 20.(略) ?41 第五章 抽样推断 学习目的和要求: 通过本章的学习, 明确抽样调查的概念、特点、作用;理解抽样误差的影响因素;掌握简单随机抽样方式下抽样平均误差的计算方法、抽样估计方法与样本容量确定的方法;理解类型抽样、等距抽样、整群抽样的含义、特点与适用场合。 难点释疑: (一)要区分样本可能数目与必要抽样数目。样本可能数目是指从总体N中抽取一个样本容量为n的子样最多有多少种抽法,一般用M表示。而必要抽样数目则是为了使抽样误差控制在一定的范围内,至少应抽取多少个单位作样本,是样本容量(n)的另一种表现形式。 (二)大数定律、正态分布理论、中心极限定理都是假定从N中抽取一个样本容量为n的子样,把所有的样本都抽到(有M种抽法)之后进行验证的,在实际工作中不可能办到。只能用样本的相应指标去推测总体的相应指标。这些理论只是为了验证抽样推断的科学性。 (三)在实际工作中往往是以重复抽样的方法确定必要抽样数目,以不重复抽样的方法来抽取调查单位,进行计算估计,而又用重复抽样的误差公式来计算误差,一方面是计算公式简单,另一方面,这样计算的误差比实际存在的误差大,便于提高抽样推断的可靠性。 (四)在抽样调查中总体的方差是未知的,一般都用样本的方差来代替。对于抽样成数来说,当p=0.5时,抽样成数的方差取极大值0.25。 (五)由于类型抽样对于各组来讲属于全面调查,对于每组内部来说属于抽样调查。所以,类型抽样的抽样误差仅与组内方差有关,与组间方差无关。与类型抽样正好相反,整群抽样对于组与组之间来讲属于抽样调查,对于中选群内部来讲属于全面调查,因此,整群抽样与组内方差无关与组间方差有关。 (六)必须澄清几个模糊认识。简单随机抽样最符合随机抽样的原则,但是其误差不一定比其它调查方式小,在具体组织时也有困难;坚持随机原则照样存在着代表性误差;抽样误差最小的方案不一定是最好的调查方案,必须和一定的调查费用联系起来;多阶段抽样的阶段分得越多误差不一定就越小。 练习题: (一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内) 1.在抽样推断中,必须遵循( )抽取样本。 ①随意原则 ②随机原则 ③可比原则 ④对等原则 2.抽样调查的主要目的在于( )。 ①计算和控制抽样误差 ②了解全及总体单位的情况 42 ③用样本来推断总体 ④对调查单位作深入的研究 3.抽样误差是指( )。 ①计算过程中产生的误差 ②调查中产生的登记性误差 ③调查中产生的系统性误差 ④随机性的代表性误差 4.在抽样调查中( )。 ①既有登记误差,也有代表性误差 ②既无登记误差,也无代表性误差 ③只有登记误差,没有代表性误差 ④没有登记误差,只有代表性误差 5.在抽样调查中,无法避免的误差是( )。 ①登记误差 ②系统性误差 ③计算误差 ④抽样误差 6.能够事先加以计算和控制的误差是( )。 ①抽样误差 ②登记误差 ③系统性误差 ④测量误差 7.抽样平均误差反映了样本指标与总体指标之间的( )。 ①可能误差范围 ②平均误差程度 ③实际误差 ④实际误差的绝对值 8.抽样平均误差的实质是( )。 ①总体标准差 ②全部样本指标的平均差 ③全部样本指标的标准差 ④全部样本指标的标志变异系数 9.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( )。 ①前者小于后者 ②前者大于后者 ③两者相等 ④无法确定哪一个大 10.在其他条件保持不变的情况下,抽样平均误差( )。 ①随着抽样数目的增加而加大 ②随着抽样数目的增加而减小 ③随着抽样数目的减少而减小 ④不会随抽样数目的改变而变动 11.允许误差反映了样本指标与总体指标之间的( )。 ①抽样误差的平均数 ②抽样误差的标准差 ③抽样误差的可靠程度 ④抽样误差的可能范围 12.极限误差与抽样平均误差数值之间的关系为( )。 ①前者一定小于后者 ②前者一定大于后者 ③前者一定等于后者 ④前者既可以大于后者,也可以小于后者 13.所谓小样本一般是指样本单位数( )。 ①30个以下 ②30个以上 ③100个以下 ④100个以上 14.样本指标和总体指标( )。 ①前者是个确定值,后者是个随机变量 ②前者是个随机变量,后者是个确定值 43 ③两者均是确定值 ④两者均是随机变量 15.在区间估计中,有三个基本要素,它们是( )。 ①概率度,抽样平均误差、抽样数目 ②概率度、点估计值、误差范围 ③点估计值、抽样平均误差、概率度 ④误差范围、抽样平均误差、总体单位数 16.区间估计表明的是一个( )。 ①绝对可靠的范围 ②可能的范围 ③绝对不可靠的范围 ④不可能的范围 17.置信区间的大小表达了区间估计的( )。 ①可靠性 ②准确性 ③显著性 ④及时性 18.抽样推断中的概率保证程度表达了区间估计的( )。 ①显著性 ②准确性 ③可靠性 ④规律性 19.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的( )。 ①2倍 ②3倍 ③4倍 ④5倍 20.假定10亿人口大国和100万人口小国的居民年龄的变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄的抽样平均误( )。 ①两者相等 ②前者比后者大 ③前者比后者小 ④不能确定 21.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的抽样极限误差为( )。 ①4% ②4.13% ③9.18% ④8.26% 22.对某单位职工的文化程度进行抽样调查,得知其中80%的人是高中毕业,抽样平均误差为2%。当概率为95.45%时,该单位职工中具有高中文化程度的比重( )。 ①等于78% ②大于84% ③在76%与84%之间 ④小于76% 23.对进口的一批服装取25件作抽样检验,发现有一件不合格。概率为0.9545时计算服装不合格率的抽样误差为7.3%。要使抽样误差减少一半,必须抽( )件服装做检验。 ①50 ②100 ③625 ④25 24.一般情况下,总体平均数的无偏、有效、一致的估计量是( )。 ①样本算术平均数 ②样本中位数 ③样本众数 ④不存在 25.对标志变异程度较大的总体进行抽样调查时,宜采用( )。 ①纯随机抽样 ②等距抽样 ③类型抽样 ④整群抽样 26.某企业连续性生产,为检查产品质量,在24小时中每隔30分钟抽出一分钟的产品进行全部检查,这种抽查方式是( )。 44 ①整群抽样 ②简单随机抽样 ③类型抽样 ④等距抽样 27.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做( )。 ①分层抽样 ②简单随机抽样 ③等距抽样 ④整群抽样 28.按地理区域划片所进行的区域抽样,其抽样方法属于( )。 ①简单随机抽样 ②等距抽样 ③类型抽样 ④整群抽样 29.参数估计的置信度为1-α的置信区间表示( )。 ①以1-α的可能性包含了未知总体参数真值的区间 ②以α的可能性包含了未知总体参数真值的区间 ③总体参数取值的变动范围 ④抽样误差的最大可能范围 30.在抽样设计中,最好的方案是( )。 ①抽样误差最小的方案 ②调查单位最少的方案 ③调查费用最省的方案 ④在一定误差要求下费用最少的方案 (二)填空题 1.抽样调查是按照 从总体中抽取一部分单位进行观测,并根据这部分单位的资料推断 的一种方法。 2.抽样调查的组织方式主要有 、等距抽样、 和整群抽样等四种。 3.在抽样推断中,按照随机原则从总体中抽取出来的那一部分单位叫做 。 4.简单随机抽样在抽取样本单位时有 和 两种不同的抽样方法。 5.对被研究标志变动较大的总体进行抽样推断时,宜采用 组织方式调查。 6.置信区间的大小表达了区间估计的 。 7.总体指标与抽样指标相比较,前者是一个确定值,后者是 。 8. 是抽样调查中不可避免的误差。 9.抽样推断中的概率保证程度表达了区间估计的 。 10.抽样平均误差是全部样本指标的 。 11.在抽样调查中,使总体的每个单位都有相同的被抽中可能性的原则,称为________ 。 12.总体指标的区间估计必须具备 、误差范围和 三个基本要素。 13.简单重复抽样情况下,如果其他条件保持不变,仅将误差范围缩小一半,则抽样单位数目必须 ;若将误差范围扩大一倍,则抽样单位数为原来的 。 14. 反映了样本指标与总体指标之间的抽样误差的可能范围。 15. 反映了样本指标与总体指标之间的平均误差程度。 16.参数估计有两种形式:一是 ,二是 。 45 17.点估计是直接用 估计总体指标的推断方法。点估计不考虑 及 。 18.区间估计是在一定的 下,用以 值为中心的一个区间范围估计总体指标数值的推断方法。 (三)简答题 1.什么是随机性原则?在抽样调查中为什么要坚持随机性原则? 2.什么是抽样推断?抽样推断有哪几个方面的特点? 3.什么是抽样误差?影响抽样误差的因素有哪些? 4.抽样估计的优良标准是什么? 5.影响必要样本容量的因素有哪些? (四)计算应用题 1.某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表。 使用时间 (小时) 900以下 900-950 950-1000 1000-1050 抽样检查电灯泡数(个) 2 4 11 71 使用时间 (小时) 1050-1100 1100-1150 1150-1200 1200以上 合计 抽样检查电灯泡数(个) 84 18 7 3 200 按照质量规定,电灯泡使用寿命在1000小时以上者为合格品,按以上资料计算抽样平均误差。 2.某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下: 考试成绩 学生人数 60以下 10 60-70 20 70-80 22 80-90 40 90-100 8 试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围。 3.某乡2009年播种小麦2000亩,随机抽样调查其中100亩,测得亩产量为450斤,标准差为50斤。现要求用100亩的情况推断2000亩的情况,试计算: (1)抽样平均亩产量的抽样平均误差; (2)概率为0.9973的条件下,平均亩产量的可能范围; (3)概率为0.9973的条件下,2000亩小麦总产量的可能范围。 4.从某年级学生中按简单随机抽样方式抽取40名学生,对公共理论课的考试成绩进行检查,得知其平均分数为78.75分,样本标准差为12.13分,试以95.45%的概率保证程度推 46 断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生? 5.某电子元件厂日产10000只,经多次一般测试一等品率为92%,现拟采用随机抽样方式进行抽检,如要求误差范围在2%之内,可靠程度95.45%,试求需要抽取多少只电子元件? 6.对某型号电子元件10000支进行耐用性能检查,根据以往抽样测定,求得耐用时数的标准差为51.91小时,合格率的标准差为28.62%,试计算: (1)概率保证程度为68.27%,元件平均耐用时数的误差范围不超过9小时,在重复抽样的条件下,要抽取多少元件做检查? (2)概率保证程度为99.73%,合格率的极限误差不超过5%,在重复抽样条件下,要抽取多少元件检查? (3)在不重复抽样条件下,要同时满足⑴、⑵的要求,需要抽多少元件检查? 7.对一批成品按不重复随机抽样方法抽选200件,其中废品8件,又知道抽样单位数是成品总量的1/20,当概率为0.9545时,可否认为这批产品的废品率不超过5%? 8.某日化工厂用机械大量连续包装洗衣粉,要求每袋按一公斤包装,为保证质量,生产过程中每隔8小时检验一小时产品,共检验20次,算出平均重量为1.005公斤,抽样总体各群间方差平均数0.002公斤。计算: (1)抽样平均误差; (2)要求概率99.73%,使产品的重量不低于1±0.03公斤为标准,问上述检验的产品能否合格? 9.某公司新推出一种营养型豆奶,为做好促销工作随机地抽取顾客作为样本,并问他们是否喜欢此豆奶,如果要使置信度为95%,抽样误差不超过0.05,则在下列情况下,你建议样本的容量为多大? a)假如初步估计,约有60%的顾客喜欢此豆奶; b)假如没有任何资料可用来估计大约有多少比率的顾客会喜欢此豆奶。 10.某单位按简单随机重复抽样方式抽取40名职工,对其业务情况进行考核,考核成绩资料如下: 68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87 要求:(1)根据上述资料按成绩分成以下几组:60分以下,60-70分,70-80分,80-90分,90-100分,并根据分组整理成变量分配数列; (2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围; 47 (3)若其它条件不变,将允许误差范围缩小一半,应抽取多少名职工? 11.(课堂作业)某外贸公司出口一种小包装名茶,规定每包重量不得低于150克,现采用纯随机不重复抽样抽取其中1%进行检查,其结果如下表: 按重量分组(克/包) 148-149 149-150 150-151 151-152 ∑ 要求: (1)以99.73%的概率估计该批茶叶平均每包重量的可能范围,并确定所估平均重量是否达到了规定要求; (2)以相同概率保证程度估计该批茶叶包装合格率的可能范围。 12.(课堂作业)某药厂为了检验瓶装药片的数量,从成品库随机抽检100瓶,结果平均每瓶101.5片,标准差为3片。试以F(t)=99.73%的把握程度推断成品库中该种药片平均每瓶数量的置信区间,如果允许误差减少到原来的一半,其他条件不变,问需要抽取多少瓶进行检验? 抽查包数(包) 10 20 50 20 100 参考答案: (一)单项选择题 1.② 2.③ 3.④ 4.① 5.④ 6.① 7.② 8.③ 9.② 10.② 11.④ 12.④ 13.① 14.② 15.② 16.② 17.② 18.③ 19.③ 20.③ 21.④ 22.③ 23.② 24.① 25.③ 26.④ 27.③ 28.④ 29.① 30.④ (二)判断题 1.√ 2.× 3.√ 4.√ 5.× 6.√ 7.× 8.× 9.× 10.√ 11.× 12.× 13.√ 14.× 15.√ 16.√ 17.× 18.× 19.× 20.× (三)填空题 1.随即原则、总体数量特征 2.简单随机抽样、分层抽样 3.样本 4.重复抽样、不重复抽样 5.类型抽样 6.准确性 7.随机变量 8.抽样误差 9.可靠性 10.标准差 11.同等可能性原则 12.点估计值、概率保证程度 13.增加4倍、四分之一 14.极限误差 15.抽样平均误差 16.点估计、区间估计 17.样本指标、抽样误差、可靠程度 18.概率保证、点估计 48 (四)简答题 1.随机原则是指,在抽样过程中,样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会的原则,随机原则是随机抽样所必须遵循的基本原则。 在统计抽样调查中,必须坚持随机原则。这是因为:(1)坚持随机原则,才能保证抽样的科学性,是建立在概率论的理论基础之上的。(2)坚持随机原则,才能保证所抽样本的分布类似于总体的分布,才能保证样本对总体的代表性。(3)坚持随机原则,才能够排除主观因素等非随机因素对抽样调查的影响,保证抽样调查的科学性。 2.抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。抽样推断具有以下特点: (1)抽样推断是由部分推算整体的一种认识方法; (2)它是建立在随机取样的基础上; (3)它是运用概率估计的方法; (4)它的误差可以事先计算并加以控制。 3.抽样误差是指由于随机抽样的偶然性因素使样本各单位的结构不足以代表总体各单位的结构,而引起的抽样指标和全及指标之间的绝对离差。抽样误差的影响因素: (1)总体各单位标志值的差异程度;(2)样本的单位数; (3)抽样的方法; (4)抽样调查的组织形式 。 4.抽样估计的优良标准有三条:即一致性、有效性、无偏性。 一致性就是用样本指标估计总体参数要求当样本的单位数充分大时,抽样指标也充分地靠近总体参数;有效性是指用抽样指标估计总体参数要求作为优良估计量的方差应该比其它估计量的方差小;无偏性是指用抽样指标估计总体参数要求抽样指标的平均数等于被估计的总体参数。 5.主要因素有:总体的变异程度、允许抽样误差、置信度。 在其它条件相同的情况下,具有较大方差(即变异程度大)的总体需要较大容量的样本,具有较小方差的总体可以选择较小容量的样本; 如果要求的精确度高,即最大允许抽样误差小,那么样本容量就要大些;如果要求估计的精确度不高,即最大允许抽样误差大,则样本容量就可以小些; 在其他条件不变的情况下,如果要求估计的结果具有较高的可信程度,即较高的置信度,则需要较大的样本容量;反之,则可相应减少样本容量。 (五)计算应用题 49 1.解:电灯泡平均使用寿命: x?1057小时 电灯泡合格率:p?91.5% 电灯泡平均使用时间标准差: S?53.65小时 电灯泡使用时间抽样平均误差: 重复抽样:?x?不重复抽样: ?2?S53.63?????3.7922(小时) nnn200?x??2n(1?)?nNS2n(1?)?nN(53.63)2200?(1?)??3.7541 (小时) 20010000灯泡合格率的抽样平均误差: 重复抽样:?p?P(1?P)?np(1?p)0.915?0.085???1.972% n2000.915?0.085200(1?)??1.952 20010000不重复抽样:?p?2.解:(1) P(1?P)n(1?)?nNxf?x??f7660??76.6 ??100??(x?x)?f2f?12944?11.377 100?x??n11.377?1.1377 △x =t100?x=2×1.1377=2.2754 该校学生考试的平均成绩的区间范围是: x-△x≤?≤x+△x , 76.6-2.2754≤?≤76.6+2.2754 74.32≤?≤78.89 (2) p?n148??48% ?p?n100p(1?p)?n0.48(1?0.48)?0.04996 100△p=t?p=2×0.04996=0.09992 80分以上学生所占的比重的范围: ??P??P=0.48±0.09992 0.3801≤P≤0.5799 在95.45%概率保证程度下,该校学生成绩在80分以上的学生所占的比重的范围在38.01%—57.99%之间。 50