经济统计学教学团队 二0一0年十一月
第一章 统计学的对象和方法
第一部分 习题
一、单项选择题
1.社会经济统计是( )的有力工具。
A.解决问题 B.克服困难 C.进行交流 D.认识社会
2.在社会经济统计学的形成过程中,首先使用“统计学”这一术语的是( )。 A.政治算术学派 B.国势学派 C.数理统计学派 D.社会经济统计学派 3.在统计学的形成和发展过程中,首先将古典概率论引入社会经济现象研究的学者是( )。 A.阿道夫·凯特勒 B.威廉·配第 C.约翰·格朗特 D.海尔曼·康令 4.社会经济统计学是一门( )。
A.自然科学 B.新兴科学 C.方法论科学 D.实质性科学 5.在确定统计总体时必须注意( )。
A. 构成总体的单位,必须是同质的 B.构成总体的单位,必须是不同的 C.构成总体的单位,不能有差异 D.构成总体的单位,必须是不相干的单位 6.社会经济统计的研究对象是( )。
A.抽象的数量关系 B.社会经济现象的规律性
C.社会经济现象的数量特征和数量关系 D.社会经济统计认识过程的规律和方法 7.某城市工业企业未安装设备普查,总体单位是( )。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业 8.标志是指( )。
A.总体单位的特征和属性的名称 B.总体单位数量特征 C.标志名称之后所表现的属性或数值 D.总体单位所具有的特征 9.一个统计总体( )。
A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 10.统计指标按其反映总体现象内容的特征不同可分为( )。 A.客观指标和主观指标 B.数量指标和质量指标 C.时期指标和时点指标 D.实体指标和行为指标 11.对某市高等学校科研所进行调查,统计总体是( )。 A.某市所有的高等学校 B.某一高等学校科研所 C.某一高等学校 D. 某市所有高等学校科研所
12.要了解某市国有工业企业设备情况,则统计总体是( )。
A.该市全部国有工业企业 B.该市每一个国有工业企业
C.该市国有工业企业的全部设备 D.该市国有工业企业的每一台设备 13.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为( )。
A.200个公司的全部职工 B.200个公司 C.200个公司职工的全部工资 D.200个公司每个职工的工资
14. 指出下列哪个是数量标志( )
A.月工资 B.学历 C.健康状况 D.性别 15.某企业职工人数为1200人,这里的“职工人数1200人”是( )。 A.标志 B.变量 C.指标 D.标志值 16.某班四名学生统计学考试成绩分别为70分、80分、86分和95分,这四个数字是( )。 A.标志 B.标志值 C.指标 D.变量 17.工业企业的职工人数、职工工资是( )。
A.连续型变量 B.离散型变量 C.前者是连续型变量,后者是离散型变量 D.前者是离散型变量,后者是连续型变量
18.标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此( )。 A.标志值有两大类:品质标志值和数量标志值 B.品质标志才有标志值 C.数量标志才有标志值
D.品质标志和数量标志都具有标志值
19.指标是说明总体特征的,标志是说明总体单位特征的,所以( )。 A.标志和指标之间的关系是固定不变的 B.标志和指标之间的关系是可以变化的 C.标志和指标都是可以用数值表示的 D.只有指标才可以用数值表示 20下列哪个是质量指标( )。
A.工资总额 B.平均工资 C.国民收入 D.粮食总产量
二、多项选择题
1.下列哪些是社会经济统计的理论和方法论基本( )。 A.马克思主义哲学 B.马克思主义政治经济学 C.数学 D.概率论 E.科学社会主义 2.统计的基本方法包括( )。
A.大量观察法 B.综合分析法 C.统计分组法 D.归纳推断法 E.指标体系法
3.统计总体的基本特征表现在( )。
A.客观性 B.数量性 C.大量性 D.同质性 E.差异性 4.要了解某地区全部成年人口的就业情况,那么( )。 A.全部成年人是研究的总体 B.成年人口总数是统计指标 C.成年人口就业率是统计标志 D.“职业”是每个人的特征,“职业”是数量指标 E.某人职业是“教师”,这里的“教师”是标志表现 5.国家统计系统的功能或统计的职能是( )。 A.信息职能 B.咨询职能
C.监督职能 D.决策职能 E.协调职能 6.下列统计指标中,属于质量指标的有( )。 A.工资总额 B.单位产品成本
C.出勤人数 D.人口密度 E.合格品率
7.对某市工业生产进行调查,得到以下资料,其中的统计指标是( )。 A.某企业为亏损企业 B.实际产值为1.1亿元
C.职工人数为10万人 D.某企业资金利税率为30% E.机器台数为750台
8.设某地区五家全民所有制企业的工业总产值分别为25万元、22万元、40万元、33万元和65万元,则( )。
A.“全民所有制”是企业的品质标志 B.“工业总产值”是企业的数量标志 C.“工业总产值”是个变量 D.“工业总产值”是企业的统计指标 E.25、22、40、33和65这几个数字是变量值
9.某商场800名职工的每个人的工资资料中( )。 A.职工工资总额是统计指标 B.800名职工是总体单位 C.有800个标志值 D.职工工资是统计标志 E.该商场工资总额等于800人乘以其平均工资 10.在全国人口普查当中( )。
A.每个人是总体单位 B.男性是品质标志 C.年龄是数量标志 D.人口平均寿命是数量标志 E.全国人口数是数量总体
三、填空题
1、通过点数取得具体数值的统计变量称为( )变量。 2、连续变量一般是通过( )取得的。
3、反映现象之间数量对比关系的统计指标叫做( )指标。 4、统计研究对象的特点可以概括为( )性、( )性和( )性。
5、统计的认识过程可以看成是从( )认识到( )认识再到( )认识的过程。 6、统计总体的基本特征是( )、( )和( )。
四、简答题
1.品质标志和数量标志有什么区别?
2.什么是统计指标?统计指标和标志有什么区别和联系? 3.如何理解统计指标的特点? 4.变量如何分类?
5.怎样区分变量与变量值?
第二部分 习题参考答案
一、单项选择题
1.D 2.B 3.A 4.C 5.A 6.C 7.B 8.A 9.D 10.D
11.D 12.C 13.A 14.A 15.C 16.B 17.D 18.C 19.B 20.B
二、多项选择题
1.AB 2.ABCD 3.CDE 4.ABE 5.ABC 6.BDE 7.BCE 8.BCE 9.ACDE 10.AC
三、填空题
1. 离散 2. 连续不断的登记 3.质量
4. 数量 总体 社会 5. 定性 定量 定性 6. 同质 大量 差异
四、简答题
1.品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表现;数量标志表明总体单位数量方面的特征,其标志表现可以用数值表示,即标志值。 2.统计指标是反映社会经济现象总体综合数量特征的科学概念或范畴。统计指标反映现象总体的数量特征;一个完整的统计指标应该由总体范围、时间、地点、指标数值和数值单位等内容构成。统计指标和统计标志是一对既有明显区别又有密切联系的概念。 二者的主要区别是:
指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。
标志和指标的主要联系表现在:指标值往往由数量标志值汇总而来;在一定条件下,数量标志和指标存在着变换关系。
统计指标和统计标志是一对既有明显区别又有密切联系的概念。 3.统计指标的特点: (1)数量性(可量性)。一方面,指标所概括的社会经济现象可以用数量来度量;另一方面,指标可以用数学方法来进行加工处理。
(2)综合性。第一,指标反映的是总体的综合数量特征,其数值是通过综合的手段得到的,或是大量单位数的总计,或是大量标志值的综合;第二,指标反映的是抽象掉个别事物间差异后得到的事物的一般数量特征。
(3)具体性。指标反映的是社会经济现象在一定时间、一定地点、一定条件下的具体的数量特征和数量关系,有具体的社会经济内容,而不是抽象的数字。
4.变量按变量值的分布状况分为连续型变量和离散型变量。连续型变量取值可带小数点,一般用测量或计算的方法取得,如工资、身高;离散型变量取值一般只能取整数,一般用计
数的方法取得,如工人数、机器数。
变量按性质的不同分为确定性变量和随机变量。确定性变量的取值具有趋势性;这种趋势是由某种决定性因素影响作用的结果,如一国的国内生产总值。随机变量的变动没有一个确定的方向,原因是由于影响因素较多,没有一个起决定性作用的因素,如零件的直径。 5.可变的数量标志和指标叫变量。如年龄,工龄,工资,产量,销售额等都是变量。 变量的具体取值叫变量值,年龄为17,18,19岁。 这里“年龄”为变量,17、18、19、20岁为变量值。
第二章 统计调查
第一部分 习题
一、单项选择题
1.下列属于经常性调查的是()。
A每十年进行一次的人口普查 B对某品牌的手机市场占有率的调查 C对某企业的库存的盘点 D商业企业按月报送的销售额 2.下列属于全面调查的是( )。
A对一批产品质量进行抽测 B对工业设备的普查 C抽选一部分单位对已有资料进行复查
D调查几大彩电厂商,借此了解全国彩电的生产情况。
3.普查是一种专项调查,是对调查对象的( )进行观察登记。 A全部单位 B一部分单位 C选择典型单位 D一部分重点单位。 4.统计调查分为一次性调查和经常性调查,是根据( )。
A是否定期进行 B组织方式不同C是否调查全部单位D时间是否连续。 5.统计报表是( )。
A全面调查B非全面调查 C全面或非全面调查 D一次性调查。 6.工业企业未安装设备普查,调查单位是()。
A工业企业全部未安装设备 B工业企业每一台未安装设备 C每个工业企业的未安装设备 D每一个工业
7.某市工业企业2004年生产经营成果年报呈报时间规定在2005年1月31日,则调查 期限为( )。
A一日 B一个月 C一年 D一年零一个月 8.调查时间的含义是( )。
A调查资料所属的时间 B进行调查的时间 C调查工作期限 D调查资料报送的时间 9.下列调查属于重点调查的是()。
A对全国几大石油企业进行调查,并借此理解全国石油生产的基本情况。 B对商业企业的库存情况进行普查。 C对一批产品进行抽测。 D抽选一部分单位对已有的资料进行复查。 10.重点调查中重点单位是指( )。 A标志总量在总体中占有很大比重的单位 B具有典型意义或代表性的单位 C那些具有反映事物属性差异的品质标志的单位 D能用以推算总体标志总量的单位
11.下列调查中,调查单位与填报单位一致的是( )。
A企业设备调查 B人口普查 C农村耕地调查 D工业企业现状调查 12.非全面调查中最完善最有科学根据的调查方式是( )。 A非全面统计报表 B重点调查 C典型调查 D抽样调查 13.调查项目的直接承担者是( )。
A调查对象 B调查单位 C填报单位 D填报对象 14.统计调查方案的核心部分是( )。 A调查项目B调查对象C调查单位D调查表 15.重点调查的重点单位是指( )。
A这些单位的单位总量占总体单位总量的比重很大
B标志值很大 C这些单位的标志总量占总体标志总量的比重很大 D在社会中的重点单位或部门
16.在全面调查中不会出现的误差是( )。
A登记性误差B代表性误差 C测量误差 D计算误差
二、多项选择题
1.人口普查属于( )。
A全面调查 B非全面调查 C一次性调查 D经常性调查 E专项调查 2.在工业设备普查中( )。
A工业企业是调查对象 B工业企业的全部设备是调查对象
C每台设备是填报单位 D每台设备是调查单位 E每个工业企业是填报单位 3.对灯管的寿命进行检验要求采取( )。
A全面调查 B非全面调查 C重点调查 D典型调查 E抽样调查 4.统计调查的组织形式有( )。
A统计报表 B重点调查 C专题调查 D专项调查 E抽样调查 5.非全面统计调查的有( )。
A统计报表 B抽样调查 C全国经济普查 D典型调查 E重点调查 6.下列属于统计调查收集统计资料的方法有( )。
A大量观察法 B统计描述法 C直接观察法 D报告法 E采访法 7.代表性误差可能产生于( )。
A普查中 B重点调查中 C抽样调查中 D典型调查中 E全面统计报表中 8.调查表从形式上看可分为( )。
A日报表 B月报表 C一览表 D单一表 E年报表 9.调查表从内容上看可分为( )。
A表头 B表体 C一览表 D单一表 E月报表 10第五次人口普查中( )。
A每一个人是一个调查单位 B每一户是一个调查对象 C填报单位是每户家庭 D每一个人是一个填报单位 E全国所有人口是调查对象 11 .我国统计调查的方法有( )。 A.统计报表 B.普查
C.抽样调查 D.重点调查 E.典型调
三、填空题
1、统计调查就是搜集( )的活动过程,它是统计整理和统计分析的( )。 2、统计调查按搜集资料的组织方式不同可分为( )和( );按调查对象包括的单位多少不同可分为( )和( );按调查单位在时间上登记连续性不同可分为( )和( )。 3、调查时间是( ),调查期限是( )。 4、调查表一般分为( )和( )。
5、普查是一种( )组织的( )全面调查。
6、重点调查是在调查对象中选择一部分( )进行调查的一种( )调查。
四、简答题
1.什么是统计调查?它在整个统计研究过程中占有什么地位? 2.统计调查从不同角度可以划分哪些种类?
3.为什么要设计统计调查方案,一个完整的统计调查方案应该包括哪些内容? 4.调查对象调查单位和填报单位有什么关系?试举例说明。 5.什么是重点调查,它适用于什么场合? 6.为什么要将各种调查方式结合运用?
7.典型调查、重点调查和抽样调查有何异同点?
8统计调查误差有哪几种?应如何防止或尽量减少调查误差?
第二部分 习题参考答案
一、单项选择题
1.D 2.B 3.A 4.D 5.C 6.B 7.B 8.A 9.A 10.A 11.D 12.D 13.B 14.D 15.C 16.B
二、多项选择题
A.ACE 2.BDE 3.BE 4.AD 5.BDE
6.CDE 7.BCD 8.CD 9.AB 10.ACE 11. ABCDE
三、填空题
1.统计资料 基础 2.统计报表 专门调查 3.调查资料的所属时间 进行调查工作的时限
4.单一表 一览表 5.专门 一次性 6.重点 非全面
四、简答题
1.所谓统计调查,就是搜集统计资料,即根据一定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的统计资料的工作过程。
统计调查在统计中的地位:统计调查在统计工作的整个过程中,是基础环节,担负着提供基础资料的任务,所有的统计计算和统计研究,都是在原始资料搜集的基础上建立起来的。统计调查是统计工作的基础,是统计整理,统计分析的前提。 2.统计调查可以依据不同的划分标准,从不同角度进行分类。(1)按调查对象包括的范围不同,可以分为全面调查和非全面调查。(2)按时间是否连续,可分为经常性调查和一次性调查。(3)按组织方式的不同,可以分为统计报表和专项调查。(4)按搜集资料的方法不同,可分为直接观察法、采访法、报告法、问卷调查法和卫星遥感法。
3.统计调查是一种复杂而又要求细致的工作,一个规模大的调查,涉及到的人员广、项目多,耗资也大,如果没有完整的计划、严密的组织是不能完成的,因此,在统计调查之前,要设计出科学的调查方案。从而可以顺利完成调查工作,取得准确、及时、完整的调查资料。一个完整的统计调查方案应该包括如下内容:(1)确定调查目的(2)确定调查对象和调查单位。(3)确定调查项目与调查表。(4)确定调查时间和调查期限,调查时间指调查资料所属的时间。调查期限是进行调查工作的时限。(5)制定调查工作的组织实施计划。 4.调查单位和填报单位区别:(1)概念上,调查单位,是调查对象中所需要调查的具体单位,是调查项目的直接承担者,它可能是全部总体单位,也可能是总体单位的一部分。填报单位,是负责向上报告调查内容的企业、事业单位或个人等。(2)确定调查单位,就是在调查过程中,明确登记谁的具体标志,即明确调查标志的直接承担者。确定填报单位,就是明确由谁负责提交统计资料。联系:在调查中,调查单位和填报单位有时一致有时也不一致。例如,在工业企业普查中,二者是一致的,都是每个工业企业;而在全国工业企业设备普查中,调查单位是工业企业的每台设备,而报告单位是每个工业企业。
5.重点调查是指在调查对象中,只选一部分重点单位进行的一种非全面调查。来反映被研究现象的基本情况和基本趋势。 适用场合:重点调查的调查任务是为了掌握总体的基本情况,而且调查对象中确实存在重点单位,它们能比较集中地从数量上反映总体的基本情况。
6.任何一种统计调查方法都有优越性和局限性,从而具有各自的应用条件和适用场合。同时,整个社会经济是由多方面、多部门组成的,各种情况十分复杂,要搜集社会经济现象中各种统计资料,只用一种统计调查方法是很难完成的,也不能较好地反映社会经济现象的真实情况。因此,在统计实践工作中,必须根据具体的调查目的和调查对象的特点及性质结合运用不同的调查方式方法。
7.重点调查、典型调查和抽样调查的区别与联系。这三者都属于专项组织的非全面调查,它们各自的特点、意义、适用场合都不相同。它们的区别概括为(1)调查单位的选取方法
不同;(2)研究目的不同;(3)适用的场合不同;(4)推断总体的可靠程度不同。
8.统计调查误差是指统计调查得到的结果与客观实际数量之间存在的差别。根据误差产生的原因不同,统计误差可以分为登记误差和代表性误差。其中代表性误差也有两种情况,一种是系统性误差,另一种是随机性误差,又叫抽样误差。
为了取得准确的统计资料,必须采取各种措施,防止可能发生的登记误差,把它缩小到最低限度。
(1)要正确制定统计调查方案。详细说明调查项目和计算方法,选择合理的调查方法。 (2)要切实抓好调查方案的执行工作。才能防止或尽量减少调查误差。
第三章 统计整理
第一部分 习题
一、单项选择题
1.统计整理的主要对象是( )。
A.次级资料 B.原始资料 C.分析资料 D.技术参数资料
2.统计分组是根据统计研究的目的和任务,按照一个或几个分组标志( )。 A.将总体分成性质相同的若干部分 B.将总体分成性质不同的若干部分 C.将总体划分成数量相同的若干部分 D.将总体划分成数量不同的若干部分 3.统计分组的关键在于( )。
A.确定组中值 B.确定组距
C.确定组数 D.选择分组标志和划分各组界限 4.变量数列是( )。
A.按数量标志分组的数列 B.按品质标志分组的数列 C.按数量标志或品质标志分组的数列 D.按数量指标分组的数列 5、某同学统计学考试成绩为80分,应将其计入( )。
A.成绩为80分以下人数中 B.成绩为70~80分的人数中 C.成绩为80~90分的人数中 D.根据具体情况来具体确定
6.在编制组距数列时,当资料中存在少数特大和特小的变量值时,宜采用( )形式处理。
A.开口组 B .等距 C.闭口组 D.不等距 7.组距、组限和组中值之间的关系是( )。
A.组距=(上限-下限)÷2 B.组中值=(上限+下限)÷2 C.组中值=(上限-下限)÷2 D.组限=组中值÷2
8.某连续变量,其末组为开口组,下限为500,又知其邻组的组中值为480,则其末组的组中值为( )。
A.490 B.500 C.510 D.520 9.次数分布中的次数是指( )。
A.划分各组的数量标志 B.分组的组数 C.分布在各组的单位数 D.标志变异个数
10.等距数列和异距数列是组距数列的两种形式,其中等距数列是指( )。 A.各组次数相等的数列 B.各组次数不相等的数列 C.各组组距相等的数列 D.各组组距不相等的数列
11.对总体进行分组时,采用等距数列还是异距数列,决定于( )。 A.次数的多少 B.变量的大小
C.组数的多少 D.现象的性质和研究的目的
12.某村企业职工最高工资为426元,最低工资为270元,椐此分为六个组,形成闭口式等距数列,则组距应为( )。
A.71 B.26 C.156 D.132 13.简单分组与复合分组的区别是( )。
A.分组对象的复杂程度不同 B.分组数目的多少不同 C.采用分组标志的多少不同 D.研究目的和对象不同 14.对某班学生进行以下分组,这是( )。 分 组 人 数(人) 按性别分组 男 30 女 20 按年龄分组 20岁以下 38 20岁以上 12 A.简单分组 B.平行分组体系 C.复合分组体系 D.以上都不对 15.统计表中的宾词指的是( )。
A.总体的名称 B.统计表的横行标题 C.统计表的纵栏标题 D.指标名称和数值 16.主词按时间顺序排列的统计表称为( )。
A.简单表 B.分组表 C.复合表 D.调查表
二、多项选择题
1.统计整理的必要性在于( )。 A.原始资料分散、零碎、不系统 B.原始资料可能存在质量问题
C.原始资料难以描述总体的数量特征 D.次级资料不能满足统计分析的需要 E.具有承上起下的作用
2. 正确的统计分组应做到( )。
A.组间有差异 B.各组应等距 C.组内属同质 D.组限不应重叠 E、不应出现开口组 3.统计分组的作用有( )。
A.反映总体的规模 B.说明总体单位的特征 C.区分社会经济现象的不同类型 D.研究总体的内部结构 E.分析现象间的依存关系
4.属于按品质标志分组的有( )。
A.职工按工龄分组 B.学生按健康状况分组 C.企业按经济类型分组 D.企业按职工人数分组 E.人口按居住地分组
5.统计表从构成形式上看,一般包括( )。
A.总标题 B.横行标题 C.纵栏标题 D.数字资料 E.调查单位
6.指出下表表示的数列的属于什么类型( )。 按劳动生产率分组(件/人) 职工人数(人) 120—130 130—140 140—150 150—180 12 18 37 13 合 计 80 A.品质数列 B.变量数列 C.组距数列 D.等距数列 E.异距数列
三、填空题
1、统计整理是统计工作的( ),是( )的继续,是( )的前提和条件,在整个统计工作过程中起( )作用。 2、统计分组同时具有两方面的含义:对总体而言是( ),即将总体区分为性质( )的若干部分;对总体单位而言是( ),即将性质相同的总体单位合在一起。
3、统计分组的关键在于( )和划分各组的界限。
4、分布数列的两个构成要素是( )和( )。 5、组距数列按个组组距是否相等分为( )和( )。
四、简答题
1.统计资料整理的主要内容有哪些?
2.什么是统计分组?统计分组的作用有哪些? 3.如何正确选择分组标志?
4.在编制变量数列时,何时应采用组距式分组,何时采用单项式分组? 5.在等距数列中,组距和组数具有什么关系?如何计算组中值? 6.在采用组距式分组时,确定各组组限应考虑哪些方面?
五、计算题
1.有20个工人日生产零件数(单位:个)如下:
2、2、5、3、4、3、4、4、4、4、3、2、5、3、3、4、3、3、3、4。 试根据上述资料编制分布数列。
2.已知一车间16个工人的资料如下: 工人编号 性别 工龄(年) 文化程度 技术等级 01 9 4 男 高中 02 4 3 男 大专 03 2 2 男 本科 04 6 4 女 大专 05 1 1 男 本科 06 8 3 男 高中 07 3 2 女 大专 08 2 1 女 高中 09 5 4 男 大专 10 5 2 女 高中 11 7 4 男 大专 12 6 3 男 大专 13 3 3 女 大专 14 6 3 女 大专 15 4 4 男 本科 16 5 3 男 高中 要求:(1)按性别和文化程度分别编制品质数列;(2)按技术等级编制单项式数列;(3)按工龄编制组距为3的等距数列。
3.某生产车间50名工人日加工零件数(单位:个)如下:
116 107 110 112 137
121 131 118 134 114
124 125 123 127 120
129 117 126 123 128
139 122 133 119 124
106 133 134 113 115
117 126 127 120 138
130 122 123 123 128
122 118 118 127 124
125 108 112 135 121
要求:(1)根据上述资料编制组距为5的分布数列;(2)将上述编制的分布数列绘制直方图、次数分布折线图;(3)计算各组向上累计次数、向下累计次数,并绘制向上累计折线图、向下累计折线图。
第二部分 习题参考答案
一、单项选择题
1.B 2.B 3.D 4.A 5.C 6.A 7.B 8.D 9.C 10.C 11.D 12.B 13.C 14.B 15.D 16.A
二、多项选择题
1.ABCDE 2.AC 3.CDE 4.BCE 5.ABCD 6.BCE
三、填空题
1. 中间环节 统计调查 统计分析 承前启后 2. 分 不同 合 3. 选择分组标志 4. 组别 频数 5. 等距 异距
四、简答题
1.统计资料整理的主要内容有:(1)制定统计整理方案。(2)对统计资料进行审核。在汇总前,要对各项原始资料进行审核,检查资料准确性、全面性和及时性,对发现的问题进行必要的订正和补充。(3)对统计资料进行分组和汇总。将全部调查资料,按照分组要求进行分组汇总,计算各组的单位数和合计总数,并计算各组指标及综合指标。(4)编制统计图表。(5)进行统计资料汇编,系统地积累历史资料,以备需要时查用
2.统计分组,是指根据统计研究的目的,按照一定的标志将总体划分为若干个性质不同的部分的一种统计方法。统计分组同时具有两个方面的含义:对总体而言是“分”,即将整体划分为性质相异的若干部分;对总体单位而言是“合”,即将性质相同的总体单位合并到同一组。
统计分组的作用主要有:(1)区分社会经济现象的类型。(2)研究总体的内部结构及其变化。(3)探讨现象之间的依存关系。
3.分组标志,就是划分总体单位为性质不同的组的标准或依据。任何事物都有许多标志,但如何在特定的研究目的下选择合适的分组标志对于达到统计研究目的至关重要。一般来说,必须遵循以下的基本原则:第一,根据研究的目的与任务,选择分组标志。第二,要选择能够反映现象本质特征的标志。第三,考虑现象所处的历史条件及经济条件,选择分组标志。
4.如果按连续性变量分组,一般只能编制组距式数列。对于按离散变量分组则要根据其变量值个数的多少以及变动幅度的大小来确定,如果变量值个数较少以及变动幅度较小时,可编制单项式数列;如果变量值个数较多以及变动幅度较大时,应编制组距式数列。
5.等距数列由于各组组距相等,因此,组距=全距÷组数。组中值来反映各组实际变量值的一般水平,即取各组变量变化的中间值。
组中值=(上限+下限)÷2
实际中,对于开口组的组中值,一般是用相邻组的组距作为开口组的组距,因而其组中值的计算公式为:
组中值=下限+邻组组距/2 (缺上限) =上限-邻组组距/2 (缺下限)
6.确定组限应从以下几个方面考虑:①组限最好采用整数表示,一般为10或100等数的整数倍。②应使最小组的下限低于或等于最小变量值,最大组的上限高于或等于最大变量值,当变量值中有极小值或极大值时,就需用开口组表示,所谓开口组,就是缺上限或缺下限的组,通常用“××以上”或“××以下”表示。③对于连续性变量,相邻两组的组限应重叠,并习惯上按照“归下不归上”的原则处理,也就是说与上限值相同的变量值,不在本组内,而应归入下一组。对于离散变量,相邻两组的上、下限必须间断。但是,在实际工作中,为了保证不重复不遗漏总体单位,对于离散型变量也常常采用连续型变量的组限表示方法。
五、计算题
1.本题的变量属于变量值变动不大的离散型变量,故采用单项式分组,结果见下表:
日生产零件(个) 工人人数(人) 2 3 4 5 3 8 7 2 20 合 计 2.(1)按性别和文化程度分别编制品质数列分别见下表: 按性别分 工人人数(人) 男 女 合 计 按文化程度分 高中 大专 本科 10 6 16 工人人数(人) 5 8 3 16 合 计 (2)按技术等级编制的单项式数列见下表: 技术等级 工人人数(人) 1 2 3 4 合 计 (3)按工龄编制的组距数列见下表: 工龄(年) 1~3 4~6 7~9 合 计 3.(1)编制分布数列 2 3 6 5 16 工人人数(人) 5 8 3 16 第1步求全距,R?max(xi)?min(xi)?139?106?33;第2步求组数,组数=全距/组距=33/5?7,所以将上述资料分为以下7组:105~110;110~115;115~120;120~125;125~130;130~135;135~140。第3步计算各组单位数,结果见下表: 按零件数分组(个) 频数(人) 频率(%) 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合 计
3 5 8 14 10 6 4 50 100 6 10 16 28 20 12 8 (2)根据上表绘成的直方图、折线图如下:
% 频
数15 30 (人)
12 24
9 18 6 12
3 6
0 105 110 115 120 125 130 135 140 日加工零件数(个)
直方图 % 频
数15 30 (人)
12 24 9 18 6 12 3 6 0 折线图
105 110 115 120 125 130 135 140 日加工零件数(个)
(3)向上累计次数、向下累计次数列于下表: 按零件数分组(个) 向上累计 频数(人) 向下累计 频数(人) 105~110 110~115 115~120 120~125 125~130 130~135 135~140 3 8 16 30 40 46 50 50 47 42 34 20 10 4 根据上表绘制的向上累计折线图、向下累计折线图如下:
日加工零件数(个)
日加工零件数(个)
第四章 综合指标分析方法
第一部分 习题
一、单项选择题
1.如果所有标志值的频数都减少为原来的1/10,而标志值仍然不变、那么算术平均数( )。
A.不变 B.扩大到10倍 C.减少为原来的1/10 D.不能预测其变化
2.甲:2003年底安徽省总人口4680万人;乙:2003年安徽省人口出生人数为715万人,则( )。
A.甲是时期指标,乙是时期指标 B.甲是时点指标,乙是时期指标 C.甲是时期指标,乙是时点指标 D.甲是时点指标,乙是时点指标
3.调查2003级统计系62名同学学习成绩,获得部分信息,其中属于总体单位总量指标的是( )。
A.班级学生人数62人 B.全班“回归分析”平均成绩为75.6分 C.全班“高等数学”成绩总和为4340分 D.全班同学的学习成绩
4.某地区有100个工业企业,职工人数为10万人,工业总产值为10.5亿元,在研究工业企业职工分布和劳动生产率的情况时( )。
A.100个企业既是总体标志总量,又是总体单位总量 B.10万人既是总体标志总量,又是总体单位总量 C.10.5亿元既是总体标志总量,又是总体单位总量
D.每个企业的产值既是总体标志总量,又是总体单位总量
5.某企业2004年计划规定某种产品单位成本降低8%,实际降低5%,则该企业本年产品单位成本计划完成程度为( )。
A.103.26% B.3.26% C.62.5% D.22% 6.计算平均指标的前提条件是总体单位的( )。
A.大量性 B.具体性 C.同质性 D.数量性
7.甲企业职工平均工资高于乙企业,而两企业职工工资的标准差又正好相等,那么( )。 A.甲企业职工平均工资代表性大 B.两个企业职工平均工资的代表性一样大 C.乙企业职工平均工资代表性大 D.无法评价哪个企业职工平均工资代表性大小 8.简单算术平均数可以看作是加权算术平均数的特例( )。 A.变量值项数少 B.无须加权计算
C.各变量值权数都不相等 D.各变量值权数都相等.又都为1 9.加权算术平均数的大小,( )。
A.仅受变量值大小影响 B.仅受各组次数影响 C.受变量位及次数两者共同影响 D.不受变量值及次数影响
10.在变量数列中,标志值较小的组,但权数较大时,计算出来的平均数( )。 A.接近于标志值小的一方 B.接近于标志值大的一方 C.接近于平均水平的标志值 D.不受权数的影响 11.几何平均数主要适用于计算( )。
A.具有等差关系的数列 B.变量值的连乘积等于总比率或总速度的数列 C.变量值为偶数项的数列 D.变量值的连乘积等于变量值之和的数列 12.某储蓄所9月末的储蓄存款余额是8月末的105%,这个指标是( )。 A.动态相对指标 B.比较相对指标
C.比例相对指标 D.计划完成程度相对指标
13.某年某市机械工业公司所属三个企业计划规定的产值分别为400万元、600万元、500万元。执行结果,计划完成程度分别为108%、106%、108%,则该公司三个企业平均计划完
成程度为( )。
A.3108%?106%?108%?107.33%
106%?1?108%?2B.1?2?107.33% 400?600?500400?107.19%?600?500C.10868%
108%?400?106%?600?108%?500D.400?600?500?107.2%
14.某保险公司有职工250名,除以250,这是( )。
A.对250个标志求平均 B.对250个变量求平均 C.对250个指标求平均 D.对250个标志值求平均 15.某地区2004年底有1000万人口,零售商店数有5万个,则商业网点密度指标为( )A.5个/千人 B.0.2千人/个 C.200个/人 D.0.2个/千人 16.平均差(A.D)的取值范围是( )。
A.A.D=0 B.A.D≤O C.A.D≥0 D.0≤A.D≤l 17.用无名数表示的标志变异指标是( )。 A.全距 B.平均差 C.标准差 D.标准差系数 18.是非标志的标准差是( )。 A.
p(1?p) B.p(1?p) C.1?p D.1?p
19.标志变异指标与平均数的代表性之间存在着( )。 A.正比关系 B.反比关系 C.恒等关系 D.倒数关系
20.标志变异指标中,计算方法简单的是( )。 A.平均差 B.标准差 C.全距 D.标准差系数
二、多项选择题
1.相对指标中,属于同类现象对比的是( )。
A.比例相对指标 B.计划完成程度相对指标 C.比较相对指标 D.结构相对指标 E.强度相对指标
2.下列指标中,属于时期指标的是( )。
A.年末职工人数 B.资金利润率 C.产品产量 D.人均国内生产总值 E.销售收入 3.下列指标中,属于时点指标的是( )。
A.年末职工人数 B.年内新增职工人数 C.货币供应量 D.固定资产投资额 E.固定资产余额 4.下列各种陈述( )是正确的。
A.权数越大,对应组的标志值在计算平均数中起的作用越大
B.当各标志值出现的次数相同时,加权算术平均数等于简单算术平均数 C.标志变异指标的数值越大,平均数的代表性就越好
D.当总体内的次数呈对称钟形分布时,算术平均数、众数和中位数三者相等
。 E.如果两个数列的全距相同,它们的离散程度也就相同 5.下列指标中,属于强度相对指标的是( )。 A.资产负债率 B.平均年龄 C.产品合格率 D.资金利润率 E.人均国内生产总值 6.调和平均数的计算公式有( )。
n?xf1x???f x B.A.
?m H??xmx??x n D.C.
H??i?xG?iE.
f
7.在各种平均指标中,不受极端数值影响的平均指标是( )。 A.算术平均数 B.调和平均数 C.几何平均数 D.中位数 E.众数
8.计算加权算术平均数,在选择权数时应具备的条件是( )。 A.权数与标志值相乘能够构成标志总量 B.权数必须表现为标志值的直接承担者 C.权数必须是总体单位数
D.权数与标志值相乘具有经济意义 E.权数必须是单位数比重
9.下列情况应该采取调和平均数的是( )。
A.已知各企业的计划任务数和计划完成程度,计算平均计划完成程度 B.已知各企业的实际完成数和计划完成程度,计算平均计划完成程度 C.已知各商品的销售单价和销售额,计算商品的平均销售单价 D.已知各商品的销售单价和销售数量,计算商品的平均销售单价
E.已知分组的粮食单位产量和各组粮食总量,计算总的平均粮食单位产量 10.下列总体标志变动度的指标中,是无名数的有( )。
A.方差 B.全距 D.平均差系数 C.标准差 E.标准差系数
三、填空题
1、实物指标表明现象总体的( )总量;价值指标表明现象总体的( )总量。 2、总量指标的计量单位有( )单位、( )单位和( )单位。 3、指标数值能够直接相加的总量指标是( );指标数值不能够直接相加的总量指标是( )。
4、计算和运用相对指标时必须注意分子与分母的( )。
5、按说明总体总量的内容不同,总量指标可分为( )和( )。 6、相对指标采用( )和( )两种表现形式。 7、平均指标可以反映现象总体中各变量值分布的( )。 8、简单算术平均数是( )条件下的加权算术平均数。
9、用组中值计算平均数是假定各组内标志值是( )分布的,因此所计算出的平均数只是一个( )。
10、在计算加权算术平均数时,必须保证所选用的权数与标志值乘积的总和具有经济意义,并使其等于各组的( )。
11、平均指标按确定和计算方法不同,可以有不同的分类,其中根据总体各单位的变量值计算得到的平均数,称为( ),而根据变量值在分布数列中的位置确定的,称为( )。 12、由相对数或平均数计算平均数时,如果掌握了基本公式的分母资料,应采用( );如果掌握了基本公式的分子资料,应采用( )。
fi13、反映总体各单位标志值变异程度的指标称为( )。 14、各变量值与其算术平均数离差之和等于( );各变量值与其算术平均数离差平方之和为( )。
15、计算和应用平均数指标时,必须注意现象总体应具有( )。
四、简答题
1.试述总量指标的概念和种类? 2.试述时期指标和时点指标的特点? 3.相对指标有几种?其作用如何? 4.强度相对数与比较相对数、比例相对数有什么区别?强度相对数又与平均数有什么不同? 5.在分析长期计划执行情况时,水平法和累计法有什么区别?
6.算术平均数与调和平均数的关系如何?什么情况下要计算调和平均数? 7.简述算术平均数、调和平均数、几何平均数、众数及中位数之间的关系? 8.全距、平均差、标准差及标准差变异系数各有什么特点? 9.为什么相对指标要与总量指标结合起来应用?
五、计算题
1.某三个企业近两年来增加值完成情况统计资料下表所示: 企业 甲 乙 丙 上年完本年 成增加计划 实际 值 增加值 比重% 增加值 比重% 1300 800 1450 1500 1000 1450 1550 本年为上计划完成% 年的% 100 95 合计 要求:计算并填写空格中的数字 2.下表是某公司所属三个商场的有关资料: 2000年销售额(万元) 商 场 计划金额 实际 金额 550 1100 比重(%) (3) 2000年 计划完成(%) (4) 120 流通费用(万元) (5) 99.0 流通费用率(%) (6) 9 10 (甲) (1) (2) 甲 乙 丙 500 750 1250 合计 请填写上表中的空格,并指出上述各指标的类型。(流通费用率=流通费用/销售额) 3.某厂400名工人的工资见下表: 按月工资分组 工人数 600以下 600-800 800-1000 1000-1200 1200以上 60 100 140 60 40 合计 400 试根据上述资料计算该厂工人的平均工资和标准差。 4.某厂三个车间一季度生产情况如下:第一车间实际产量为200件,完成计划95%;第二车间实际产量280件,完成计划100%;第三车间实际产量650件,完成计划105%,请问这三个车间产品产量的平均计划完成程度是多少?
5.某产品五年计划规定,最后一年产量应达到45万吨,计划执行情况如下表所示:时间 产量 第 一 年 30 第 二 年 30 第三年 上半年 17 下半年 19 一 季 10 第四年 二 季 10 三 季 11 四 季 12 一 季 12 第五年 二 季 13 三 四 季 季 15 16 试根据上述资料计算计划完成程度,及提前完成计划的时间。 6.已知某商贸公司下属20个企业的分组资料如下表所示: 按销售额计划完成程企业个数(个) 实际销售额(万元) 销售利润度(%)分组 率(%) 100以下 100-110 110-120 3 12 5 590 4300 1728 12 18 22 - 合计 20 6618 请计算公司销售额平均计划完成程度及公司的平均销售利润率? 7.某车间120人日生产产品478件,具体情况如下表所示: 1 2 3 4 5 6 日产量(件)x 人数(个)f 5 12 20 38 25 10 7 8 8 2 (1)总量指标是( )。 A.某车间日生产产品总数 B.日生产产品数为4的工人数 C.日产3件的工人数占总工人数的25% D.每个工人平均日产量 (2)日产量的中位数是( )。
A.4 B. 4.5 C.5 D.8 (3)日产量的众数是( )。
A.4 B.4.5 C.5 D.8 (4)该车间工人日产量全距是( )。
A.4.5 B.4.5 C.8 D.7 (5)该车间工人日产量的平均差是( )。
A.4 B.478/120 C.2
1?4.15?5?2?4.15?12???8?4.15?2120D.
(6)该车间工人日产量的方差与标准差是( )。
A.4,2 B.4.5,2.1 C.2,1.14
?140.5?1.17120
???(x?x)2fD.,
(7)该车间工人日产量的平均差系数是( )。
?f?2(x?x)???f2f1.17244.5A.4.15 B.4.15 C.4.15 D.4.5
8.某公司所属6个企业,按生产某产品平均单位成本高低分组,其各组产量占该公司总产量的比重资料如下表所示: 按平均单元成本分组(元/件) 企业数 各组产量占总产量比重(%) 10~12 12~14 14~18 合 计 试计算该公司所属企业的平均单位成本。
1 2 3 6 22 40 38 100 9.某企业工人各级别的工资额及相对应的工资总额资料如下表所示:工资额(元) 460 520 600 700 850 合 计 工资总额(元) 23007800 10800 70001700 29600 试计算工人平均工资。
10.某地区抽样调查职工家庭收入资料如下表所示,计算职工家庭平均每人月收入(算术平均数),并用下限公式计算中位数和众数。 按平均月收入分组(元) 职工户数 100—200 200—300 300—400 400—500 500—600 600—700 700—800 800—900 6 10 20 30 40 240 60 20 合计 426 11.某种蔬菜早、午、晚的价格及购买金额资料如下表所示: 时 间 价格(元/斤) 0.25 0.20 0.10 — 购买金额(元) 5 6 7 18 早午晚 合 计 试计算该种蔬菜的平均购买价格。 12.甲、乙两单位职工人数及日产量资料如下表所示: 甲单位 日产量(件)x 145 155 170 职工人数(人)f 4 8 15 乙单位 职工人数(人)f 5 10 24 日产量(件)x 140 160 175 185 195 215 20 7 3 187 197 220 15 2 1 合计 57 合计 57 试比较哪一个单位的平均日产量更具有代表性。 13.某工厂生产一批零件共10万件,为了解这批产品的质量,采取不重复抽样的方法抽取1000件进行检查,其结果如下表所示,根据质量标准,使用寿命800小时及以上者为合格品。计算平均合格率、标准差及标准差系数。 使用寿命(小时) 700以下 700—800 800—900 900—1000 1000—1200 1200以上 零件数(件) 10 60 230 450 190 60 合计 1000 14.有两个班学生的统计学考试成绩如下表所示,请分别计算两个班的平均成绩,并说明哪个班的平均成绩更具有代表性? 成绩 学生数 一班 50以下 50~60 60~70 70~80 80~90 90以上 1 3 6 12 8 2 二班 2 3 6 9 12 3 合计 32 35 15. A、B两个组的学生考分资料如下表所示: 学生考分(分) 学生序号 A组 甲 乙 丙 丁 戊 合 计 65 70 75 80 85 375 B组 68 70 76 80 81 375 试问A、B两组哪那一组学生的平均考分更有代表性(用平均差和标准差计算)?
第二部分 习题参考答案
一、单项选择题
1.A 2.B 3.A 4.B 5.A 6.C 7.A 8.D 9.C 10.A
11.B 12.A 13.D 14.D 15.A 16.C 17.D 18.A 19.B 20.C
二、多项选择题
1.ABCD 2.CE 3.ACE 4.ABD 5.ADE 6.AD 7.DE 8.AD 9.BCE 10.DE
三、填空题
1、实物总量 价值总量 2、实物 货币 劳动 3、时期指标 时点指标 4、可比性
5、总体标志总量 总体单位总量 6、无名数 有名数 7、集中趋势 8、权数相等 9、均匀 近似值 10、标志总量
11、位置平均数 12、加权算术平均法 加权调和平均法 13、标志变异指标 14、0 最小值 15、同质性
四、简答题
1.总量指标,是反映社会经济现象发展的总规模、总水平的综合性指标。 总量指标按其反映的总体内容不同,分为总体单位总量和总体标志总量。总体单位总量是总体单位数的合计数,是用来反映总体规模大小的总量指标;总体标志总量是指反映总体中各单位标志值总和的总量指标。
总量指标按其反映的时间状况不同,分为时期指标和点指标。时期指标,是指反映社会经济现象在某一时段内发展变化结果的总量指标;时点指标,是指反映社会经济现象在某一时刻所处水平的总量指标。 2.时期指标的特点有:(1)不同的时期指标数值具有可加性;(2)时期指标数值大小与时期长短有直接关系;(3)时期指标数值是连续登记、累计的结果。
时点指标的特点有:(1)不同时点的指标数值不具有可加性;(2)时点指标的数值的大小与其时间间隔长短无关;(3)时点指标数值是非连续调查、非连续登记的结果。
3.相对指标又称统计相对数。它是两个有联系的现象数值的比率,常用的相对指标有结构相对指标、比较相对指标、比例相对指标、强度相对指标、动态相对指标和计划完成程度相对指标等六种,用以反映现象的发展程度、结构、强度、普遍程度或比例关系。
4.强度相对数是两个性质不同、而有联系的指标对比,说明一个现象在另一个现象中发展的强度、密度或普遍程度。比较相对数是同类指标在不同单位(国家、部门、地区、…、农村、个人等等)之间的对比,反映它们之间的差距和发展的不平衡程度。比例相对数是总体中各组之间的数量对比,它反映现象总体各组之间的关系,分析现象之间是否协调一致,平衡比例是否相互适应等。
强度相对数有用双重单位的有名数表示,也可以用百分数的无名数形式表现。比较相对数则为无名数,只能用倍数、百分数等表示。而比例相对数的表现形式除了倍数、百分数外,还表现为基数抽象化为l、10、100、1000时,被比较的数值是多少。
强度相对数和平均数在计算式上比较相似,都是两个总量指标的比值。但是,平均数是同一总体各单位标志值的平均,因而表现为总体内标志总量与单位总量的对比,如劳动生产率为产品产量与工人人数之比,单位产品成本为产品总成本与产品产量之比,平均工资为工资总额与工人数之比等。而强度相对数用作对比的两个总量指标,来自不同总体。如人口密度为人口总数与土地面积之比,“平均每人钢铁产量”则是钢铁产量与人口数之比,等等。可见,它们之间的区分还是明显的。
5.累计法是按各年完成任务的总和下达计划任务,即
计划完成程度?计划全期累计实际完成数计划全期累计计划数 计划末期实际达到的水平计划规定末期应达到的水平
水平法是按计划期末应达到的水平下达计划任务,即
计划完成程度?当计划指标是按计划期内各年的总和规定任务时,即计划全期累计完成的水平,就要求按累计法计算;当计划指标是以计划期末(最末年)应达到的水平下达时,则用水平法来检查。 6.它们都是反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的
总体标志总量一般水平,其计算公式都总体单位总量。在实际工作中,是根据掌握资料的情况来选
?择是用算术平均数还是用调和平均数。其原则是:“缺分子,用算术;缺分母,用调和。”具体就是:由相对数或平均数计算平均数时,如果缺乏基本公式中的分子资料,掌握的权数资料是基本公式的分母,且权数资料与变量值x相乘后的经济含义与基本公式的分子相吻合,则应采用加权算术平均数的方法计算;如果缺乏基本公式中的分母资料,掌握的权数资料是基本公式的分子,且权数资料与变量值x相除后的经济含义与基本公式的分母相吻合,则应采用加权调和平均数的方法计算。
7.联系:算术平均数、调和平均数、几何平均数、众数、中位数都是平均指标,是用来反映社会经济现象总体各单位某一数量标志在一定时问、地点条件下所达到的一般水平的统计指标。它都能把总体各单位标志值的差异抽象化、能代表总体各单位标志值的一般水平。 区别:前三种平均数是根据总体所有标志值计算的,称为数值平均数;后两种平均数是根据标志值所处的位置来确定的,称为位置平均数。
8.全距是测定标志变异程度的最简单的指标,它是标志的最大值和最小值之差,反映总体标志值的变动范围。全距仅取决于两个极端数值,不能全面反映总体各单位标志值变异的程度,也不能拿来评价平均指标的代表性。
平均差是各单位标志值对其算术平均数的离差绝对值的算术平均数,反映的是各标志值对其平均数的平均差异程度。它能全面准确地反映一组数据的离散状况,但由于是以离差的绝对值来表示总离差,这给计算带来了不便,同时平均差在数学性质上也不是最优的,因而实际中应用较少。
标准差是总体中各单位标志值与算术平均数的离差平方的算术平均数的平方根,又称为均方差。它能全面准确地反映一组数据的离散状况,还有无偏性、有效性等数学特性,因此它是测定标志变动程度的最主要的指标。
标准差系数是以相对数形式表示的变异指标。它是由标准差与平均数对比得到的。当所对比的两个数列的水平高低不同时,就不能采用全距、平均差或标准差进行对比分析,因为它们都是绝对指标,其数值的大小不仅受各单位标志值差异程度的影响,而且受到总体单位标志值本身水平高低的影响;为了对比分析不同水平的变量数列之间标志值的变异程度,就必须消除数列水平高低的影响,这时就要计算标准差系数。
9.总量指标能够反映现象发展的总规模和总水平,但却不易看清现象发展的程度和差别;相对指标反映了现象之间的数量对比关系和差异程度,但却将现象的具体规模和水平抽象化,从而掩盖了现象间总量上的差别。只用总量指标不易说明现象差别的程度,只用相对指标又无法反映出这种差别的实际意义。因此,必须将相对指标与总量指标结合起来使用,才能达到对客观事物全面正确的认识。 四、计算题
1.计算结果如下表所示: 上年完成企业 增加值 甲 乙 本年 计划 36.31 实际 36.25 增加值 比重% 增加值 比重% 24.20 1000.00 25.00 本年为上年的% 计划完成% 96.67 111.54 125.00 丙 1631.58 39.49 38.75 96.82 106.90 112.68 合计 3550.00 4131.58 100.00 4000.00 100.00 2.计算结果如下表所示: 2000年销售额(万元) 商 场 计划金额 实际 金额 比重(%) (3) 21.57 35.29 43.14 900 计划完成(%) (4) 110 88 2000年 流通费用 (万元) (5) 49.5 110 流通费用率(%) (6) 11.00 (甲) (1) (2) 甲 乙 丙 合计 2500 2550 100.00 102 258.5 10.14 其中(1)、(2)、(5)为总量指标;(3)为结构相对指标;(4)为计划完成程度相对指标;(6)为强度相对指标。
3.计算过程所需数据计算结果如下表所示: 按月工资xf 组中值x 工人数f x2f x2 分组 600以下 600-800 800-1000 1000-1200 1200以上 合计 500 700 900 1100 1300 — 60 100 140 60 40 400 30000 70000 126000 66000 52000 344000 250000 490000 810000 1210000 1690000 4450000 15000000 49000000 113400000 72600000 67600000 317600000 xf344000?x???860f400?所以工人的平均工资
?xf?(?xf)?317600000?860??400?f?f工人的工资标准差
m200?280?650?H???101.84%m200280650?x0.95?1?1.05222?233.24
4.平均计划完成程度
5.(1)第五年末完成水平为56万吨,则计划完成程度=56/45×100%=124.44%
(2)从表中第四年的二季度起,至第五年的第一季度止的连续一年中,达到了计划所规定的水平,即:10+11+12+12 = 45万吨,则该产品提前三个季度完成了五年计划。
6.根据相对指标或平均指标权数选取的两个原则,计算销售额平均计划完成程度时不能选取企业个数作为权数,而应选取实际销售额/每组销售额完成程度作为权数,是属于“缺分母”的情况,故计算销售额平均计划完成程度时,应采用加权调和平均数;而计算公司的销售利润率时,不能选取企业个数作为权数,而应选销售利润率作为权数,是属于“缺分子”的情况,故计算公司的平均销售利润率应采取加权平均数,计算的结果如下表所示: 按销售额计划完成企业个实际销售销售利润计划销售额 组中值 销售利润(万元) 程度(%)分组 数(个) 额(万元) 率(%) (万元) (1) 100以下 100-110 110-120 合计 (2) 95 105 115 — (3) 3 12 5 20 (4) 590 4300 1728 6618 (5) 12 18 22 - (6)=(4)(7)=(4)×(5) /(2)*100 /100 621.05 4095.24 1502.61 6218.90 70.80 774.00 380.16 1224.96 实际销售总额计划销售总额 所以销售额平均计划完成程度
590?4300?17286618??100%??100%?106.42Y0430017286218.90??0.951.051.15
销售利润总额x?实际销售额总额 公司的平均销售利润率
H??12%?590?18%?4300?22%?17281224.96??100%?18.51Y0?4300?17286618
7.(1)AB (2)A (3)A (4)D (5)D (6)D (7)A
8.该公司所属企业的平均单位成本计算过程如下表所示: 按平均单元成本分组 组中值 各组产量占总产量比重(%) 企业数 (元/件) x f /∑f 10~12 12~14 14~18 合 计 平均单位成本:1 2 3 6 11 13 16 — 22 40 38 100 x??xf?f?11?0.22?13?0.4?16?0.38?13.7(元/件)9.该企业工人平均工资计算过程所需下表所示: 工资额工资总额(元) (元) m=x f x 460 520 600 700 850 合 计
工人数(人) f=m/x 23007800 10800 70001700 5 1518 10 2 50 29600 ?各组工人数(f)?各组工资总额(xf)各组工资额(x)
平均工资为:H?m1?m2???mn2300?7800?10800?7000?1700?m1m2mn230078001080070001700????????x1x2xn4605206007008502300?7800?10800?7000?1700?29600?592(元/人)50
向上累计 向下累计 6 16 36 66 106 346 406 426 — 426 420 410 390 360 320 80 20 — 5?15?18?10?210.计算过程所需数据计算结果如下表所示: 按平均月收入分组(元) 组中值 100—200 200—300 300—400 400—500 500—600 600—700 700—800 800—900 合计 150 250 350 450 550 650 750 850 — 职工户数f xf 6 10 20 30 40 240 60 20 426 ?900 2500 7000 13500 22000 156000 45000 17000 263900 xf?x??f所以平均每人月收入
?263900?619.5426(元)根据上表数据可以判定,众数组
在平均月收入是600-700组,由下限公式,有
fn?fn?1M0?L??d (fn?fn?1)?(fn?fn?1)
240?40?600??100 (240?40)?(240?60)
?600?200?100?652.6200?180(元)
由上限公式,有
fn?fn?1?d (fn?fn?1)?(fn?fn?1)
240?60?700??100 (240?40)?(240?60) 180?700??100?652.6 200?180(元)
根据上表数据可以判定,向上累计和向下累计的中位数组在平均月收入是600-700组,由下限公式,有
?f?Sm?12?L?dMeM0?U?fm426?1062?600??100?644.6240(元)
由上限公式,有
?f?Sm?12Me?U-?d fm
426?802?700??100?644.6240(元)
11.解:该种蔬菜平均购买价格计算过程所需资料见下表所示: 时 间 价格(元/斤) m=x f 0.25 0.20 0.10 — 蔬菜平均购买价格(x)?蔬菜平均购买价格为:5?6?75?6?718???0.15(元/人)m56712020?30?70???x0.250.20.1
12.计算过程所需数据计算结果如下表所示: 甲单位 乙单位 购买金额(元) m=x f 5 6 7 8 蔬菜购买金额(xf)蔬菜购买量(f)
购买量(斤) f=m/x 20 30 70 120 早午晚 合 计 H??m?日产量职工人数(件)日产量职工人数 2x甲 fx(人)f乙 x乙f乙(x? x乙)2f乙 (人)甲 x甲f甲 (x甲? x甲)f甲 (件)乙 乙 145 155 170 185 195 215 合计 所以 4 8 15 20 7 3 57 580 1240 2550 3700 1365 645 10080 4096 3873 735 1280 2268 4332 16583 140 160 175 187 197 220 合计 5 10 24 15 2 1 57 700 1600 4200 2805 394 220 9919 5780 1960 24 2535 1058 2116 13473 x甲?x乙?xf?fxf???f甲甲甲??10080?176.8579919?174.057(件)
乙乙乙(件)
?甲???x甲?x甲?2f甲?f?甲16583?17.657(件)
?乙?V?甲???x?甲x甲?乙?x乙乙?2f?f?13473?15.457(件)
17.6?0.10176.8,
x乙V因为,?乙V?乙??乙?15.4?0.09174.0
?V?甲,所以,乙单位的平均日产量更具有代表性。
使用寿命(小时) 700以下 700—800 800—900 900—1000 1000—1200 1200以上 组中值 650 750 850 950 1100 1300 零件数(件) 10 60 230 450 190 60 13.计算过程所需数据计算结果如下表所示: — 合计 1000 因为使用寿命大于800的为合格品,故合格品的单位数为230+450+190+60=930 所以平均合格率合格品的标准差
p=230?450?190?60=0.931000
?=p(1?p)=0.93?(1?0.93=0.2551
?0.2551===27.43%V?0.93x合格品的标准差系数
14.计算过程所需数据计算结果如下表所示: 一班 成绩组人数(人)成绩组人数(人)二班 x中值甲 45 55 65 75 85 95 合计 所以 f甲 1 3 6 12 8 2 32 x甲f甲 (x甲? x甲)2f甲中值x乙 45 165 390 900 680 190 2370 844.48 1089.85 492.5 10.6 957.47 876.97 4271.87 45 55 65 75 85 95 — f乙 2 3 6 9 12 3 35 x乙f乙 (x乙? x乙)2f乙 90 165 390 675 1020 285 2625 1800 1200 600 0 1200 1200 6000 x甲??xf?f甲甲甲?2370?74.0632(分)
x乙??xf?f??x乙乙乙?2625?7535(分)
?甲?甲?x甲?2f甲?f?甲4271.87?11.5532(分) 6000?13.0935(分)
?乙?V?甲???x?甲?乙?x乙乙?2f??f11.55?0.1560x甲74.06 ?15.4V?乙?乙??0.09x乙174.0
V?V?甲,所以,甲单位的平均日产量更具有代表性。
因为,?乙15.(1)平均差计算过程所需资料如下表所示: 考分(分) 学生 平均数离差 离差绝对值 xA?xA序号 xA xB xA?xA 甲 乙 丙 丁 戊 合 计 65 70 75 80 85 375 68 70 76 80 81 375 -10 -5 0 5 10 — 10 5 0 5 10 30 平均数离差 离差绝对值 xB?xB -7 -5 1 5 6 — xB?xB7 5 1 5 6 24 ?xA?xBMDA??xA?xAn30??6(分/人)5MDB?x?x??fBBf?24?4.(分8/人)5 示
:
∵ MDA>MDB,所以,B组学生平均考分比A组学生平均考分更有代表性。 (2)标准差计算过程所需资料如下表学生 序号 甲 乙 丙 丁 戊 合 计 考分(分) 平均数离差 离差平方平均数离差 所
离差平方xA 65 70 75 80 85 375 xB 68 70 76 80 81 375 xA?xA -10 -5 0 5 10 — (xA?xA) 2xB?xB -7 -5 1 5 6 — (xB?xB)2 49 25 1 25 36 136 100 25 0 25 100 250 ?xA?xB?75(分/人)?A??(x?(xA?xA)2n?xB)2?250?7.07(分/人)5136?5.2(分/人)5
?B?Bn?∵σA>σB,所以,B组学生平均考分比A组学生平均考分更有代表性。
第五章 抽样推断分析方法
第一部分 习题
一、单项选择题 1.抽样调查是( )
A.资料的搜集方法 B.推断方法 C.资料的搜集方法和推断方法 D.全面调查 2.抽样调查的目的在于( )
A.了解抽样总体的全面情况 B.用样本指标推断全及总体指标 C.了解全及总体的全面情况 D.用全及总体指标推断样本指标 3.抽样调查与典型调查的主要区别是( )
A.所研究的总体不同 B.调查对象不同
C.调查对象的代表性不同 D.调查单位的选取方式不同 4.抽样应遵循的原则是( )
A.随机原则 B.准确性原则 C.系统原则 D.及时性原则 5.下列指标中为随机变量的是( )
A.抽样误差 B.抽样平均误差 C.允许误差 D.样本容量 6.下列指标中为非随机变量的是( )
A.样本均值 B.样本方差 C.样本成数 D.样本容量 7、样本是指( )
A.任何一个总体 B.任何一个被抽中的调查单位
C.抽样单元 D.由被抽中的调查单位所形成的总体 8.抽样框是指( )
A.总体 B.样本
C.由总体单位组成的名单或地图 D.全部抽样单位组成的名单或地图 9.抽样误差是指( )
A.在调查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差
C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 10.抽样极限误差是( )
A.随机误差 B.一定可靠程度下抽样误差的最大绝对值 C.最小抽样误差 D.最大抽样误差的绝对值
11.在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比( A.前者一定大于后者 B.前者一定小于后者
C.两者相等 D.前者可能大于、也可能小于后者 12.估计误差的可靠性和准确度( ) A.是一致的 B.是矛盾的 C.成正比 D.成反比 13.抽样推断的精确度和极限误差的关系是( )
A.前者高说明后者小 B.前者高说明后者大 C.前者变化而后者不变 D.两者没有关系 14.点估计的优良标准是( )
A.无偏性、数量性、一致性 B.无偏性、有效性、数量性 C.有效性、一致性、无偏性 D.及时性、有效性、无偏性
15.在简单随机重复抽样下,欲使抽样平均误差缩小为原来的1/3,则样本容量应(A.增加8倍 B.增加9倍
)) C.增加1.25倍 D.增加2.25倍
16.在简单随机重复抽样下,当误差范围Δ扩大一倍,则抽样单位数( ) A.只需原来的1/2 B.只需原来的1/4 C.只需原来的1倍 D.只需原来的2倍
17.在500个抽样产品中,有95%的一级品,则在简单随机重复抽样下一级品率的抽样平均误差为( )
A.0.9747% B.0.9545% C.0.9973% D.0.6827%
18.若有多个成数资料可供参考时,确定样本容量或计算抽样平均误差应该使用( ) A.数值最大的那个成数 B.数值最小的那个成数
C.0.5 D.数值最接近或等于0.5的那个成数
19.当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是( )
A.最小的n值 B.最大的n值
C.中间的n值 D.第一个计算出来的n值 20.反映样本指标与总体指标之间的平均误差程度的指标是( )
A.平均数离差 B.概率度 C.抽样平均误差 D.抽样极限误差 21.假设检验的基本思想可以用( )来解释。
A.中心极限定理 B.置信区间 C.小概率事件原理 D.正态分布的性质
2?N(?,?),欲检验H0:???0,且?2已知,则该假设下的拒绝域为( )22.设。
Z?Z1??/2Z?Z1??/2A.Z??Z1?? B.Z??Z1?? C. D.
22
23.设?N(?,?),欲检验H0:???0,且?未知,则该假设下的拒绝域为( )。 t?t?t?t?/2A.t??t? B.t??t? C. D. 24.下列情况适用t统计量的是( )。 A.样本为大样本,且总体方差已知 B.样本为小样本,且总体方差已知 C.样本为小样本,且总体方差未知 D.样本为大样本,且总体方差未知
25.在假设检验中,原假设为H0,备择假设为H1,则称( )为犯第二类错误。 A.H0为真,接受H1B.H0为真,拒绝H1C.H0为假,接受H0D.H0为假,拒绝H0 26.在假设检验中,概率?表示( )。
P拒绝H0H0为真P接受H1H1为真P接受H0H1为真P接受H0H0为真?A.?B.C.D. 27.生产某种产品,要求其抗压能力?在500以上,如果对此进行假设检验,则原假设为( )。
A.H0:??500 B.H0:??500 C. H0:??500 D. H0:??500 28.在假设检验中,显著性水平?是( )。
A.原假设为真时被拒绝的概率 B.原假设为真时被接受的概率 C.原假设为假时被拒绝的概率 D.原假设为真时被接受的概率
29、如果现在进行左侧检验,检验概率p值表示当原假设成立时,样本可能的结果( )实际观测结果的概率。
A.不高于 B.不低于 C.等于 D.不等于
30.如果现在进行右检验,得到的检验概率的p值为0.052,在显著性水平??0.05情况下( )。
A.接受H0:???0B.接受H1:???0C.接受H1:???0D.上述结论不正确 31.设样本?1,?2???????9来自N(?.0.04),在显著性水平??0.05条件下,对于假设检验
H0:??0.5H0:??0.5,若总体均值的真实值为??0.65,则此时的取伪概率为( )。
A.?(0.605)B.?(?0.605)C.?(1.65)D.?(?1.65)
2N(250.25),现对生产工艺进行改进,从对25个生产小32.某种产品的每小时的产量服从
组检验发现产量提高了20件,对于假设检验H0:??250的概率正好为显著性水平??0.05,则c0为( )。
H0:??250,如果有p(??c0)A.259.8 B.279.8 C.278.25 D.258.25
33.现对某种电子管的寿命是否超过1300小时进行检验,随机抽取100件进行检验,得到均值为1345小时,已知??300小时,经过计算有p(??1345)?0.062,则对于假设为H0:??1300H0:??1300有( )成立。
A.若??0.05,则接受H0 B.若??0.05,则接受H1 C.若??0.1,则接受H0 D.若??0.1,则拒绝H1
34.如果假设的形式为H0:???0,H1:???0,当随机抽取一个样本,得到样本均值为x??0,则( )。 A.肯定接受原假设 B.有可能接受原假设 C.有1??的可能接受原假设 D.有可能拒绝原假设
222235.设?1N(?1,?1),?2N(?2,?2),且?1,?2已知,欲检验H0:?1??2,则该假设下的拒绝域为( )。
A.Z?Z1?? B.Z??Z1?? C.Z??Z1?? D.Z?Z1??
36.在一次假设检验中,当显著性水平为??0.01时,原假设被拒绝,那么在显著性水平??0.05时,则有( )。
A.一定会被拒绝 B.一定不会被拒绝 C.需要重新检验 D.有可能拒绝原假设 37.如果假设的形式为H0:???0,H1:???0,当随机抽取一个样本时,其样本均值x??0,则( )。
A.肯定接受原假设,但有可能犯第一类错误 B.有可能接受原假设,但有可能犯第一类错误 C.有可能接受原假设,但有可能犯第二类错误 D.肯定接受原假设,但有可能犯第二类错误
38.在一次假设检验中,开始的假设形式为双侧检验,若现改为单侧检验,则会有( )发生。
A.检验的结果由接受原假设改变为拒绝原假设 B.检验的结果由拒绝原假设改为接受原假设 C.检验的结果没有发生变化 D.以上情况均有可能发生
39.现在的大学生拥有电脑的比例高达0.20,但有人认为这个比例还要高,为此随机从某大学中随机抽取100人,发现有30人拥有电脑,现检验这种说法是否正确,取显著性水平为??0.05,则( )。
A.假设形式为H0:p?0.2,H1:p?0.2,可能犯第一类错误 B.假设形式为H0:p?0.2,H1:p?0.2,可能犯第二类错误 C.假设形式为H0:p?0.2,H1:p?0.2,可能犯第一类错误
D.假设形式为H0:p?0.2,H1:p?0.2,可能犯第二类错误
40.一项减肥计划声称,在计划实施的一周内,参加者体重至少会减轻7斤,随机抽取40位参加此项计划者的样本,结果显示,样本均值平均减少6斤,标准差为3.2斤,则原假设和备择假设是( ),取显著性水平为??0.05。
A.H0:??7,H1:??7 B.H0:??7,H1:??7 C.H0:??6,H1:??6 D.H0:??6,H1:??6
41. 影响分类抽样平均误差大小的主要变异因素是( ) A.类内方差 B.类间方差 C.总体方差 D.样本方差
42、影响整群抽样平均误差大小的主要变异因素是( ) A.群内方差 B.群间方差 C.总体方差 D.样本方差
二、多项选择题
1.非全面调查可以是( )
A.定期调查 B.不定期调查 C.抽样调查 D.重点调查 E.典型调查
2.与全面调查相比,抽样调查的优点有( ) A.速度快 B.费用省
C.能够控制抽样估计的误差 D.适用范围广 E.无调查误差
3.抽样推断适用于( )
A.具有破坏性的场合 B.用于时效性要求强的场合 C.对于大规模总体和无限总体的场合进行调查 D.用于对全面调查的结果进行核查和修正
E.不必要进行全面调查,但又需要知道总体的全面情况时 4.同其它统计调查比,抽样推断的特点是( ) A.了解总体的基本情况 B.以部分推断总体 C.比重点调查更节省人、财、物力 D.可以控制抽样误差 E.按随机原则抽样
5.目标总体与被抽样总体相比( )
A.前者是所要认识的对象 B.后者是抽样所依据的总体 C.两者所包含的单位数有时相等,有时不等 D.两者所包含的单位数相等
E.两者是不同的概念,所包含的单位数不等 6.重复抽样和不重复抽样相比( )
A.都是随机抽样 B.二者的可能样本数目不同 C.二者都能使总体中每个单位被抽中的机会相等 D.总体中每个单位被抽中的机会不全相等
E.总体中的每个单位进入同一样本的可能次数不等 7. 抽样估计的优良标准主要有( )
A.无偏性 B.一致性 C.可靠性 D.有效性 E.及时性 8.样本平均数的( )
A.分布在大样本下服从或近似服从正态分布
B.平均数是总体平均数 C.方差是总体方差
D.平均数是随机变量 E.分布与总体的分布形式相同 9.影响抽样平均误差的主要因素有( ) A.总体的变异程度 B.样本容量 C.抽样方法 D.抽样组织形式 E.估计的可靠性和准确度的要求
10.计算抽样平均误差时,若缺少总体方差和总体成数,可用的资料有( ) A.过去抽样调查得到的相应资料 B.小规模调查得到的资料 C.样本资料 D.过去全面调查得到的资料 E.重点调查得到的资料
11.在假设检验中,总体参数为( )。
A.是未知的 B.是已知的 C.是假设的 D.是确定的 E.是不确定的 12.第一类错误水平?和第二类错误水平?的关系是( )。 A.?和?同时增加,样本容量不变 B.?和?同时减少,样本容量增大 C.?增加?减少,样本容量不变 D.?和?同时减少,样本容量减少
E.?和?同时增加,样本容量减少 13.下面判断正确的有( )。
A.若显著性水平为0.43,则原假设是可信的
B.若观察到的显著性水平为0.04,则此结果为统计显著 C.一个高度显著的结果不可能是由于偶然的缘故
D.若显著性水平为0.01的0.43,则原假设看上去是不可信的
E.若观察到的显著性水平为0.01,那么100次中仅有1次的机会原假设为真。 14.确定检验统计量,需要考虑的因素有( )。 A.进行检验的是大样本还是小样本 B.显著性水平是大还是小 C.是双侧检验还是单侧检验 D.总体方差是已知还是未知
E.有时还要考虑两个总体的方差是否相等
15.假设检验中涉及两类错误,第一类错误发生的概率为?,第二类错误发生的概率为?,下面说法正确的有( )。
A.第一类错误也称弃真错误,第二类错误也称取伪错误 B.第二类错误也称弃真错误,第一类错误也称取伪错误 C.在一定样本容量下,减少?会引起?增大
D.奈曼.皮迩逊原则是在控制?的条件下,尽可能降低? E.在一定的样本容量下,减小?不会引起?增大
16.下面关于检验概率p值的叙述不正确的有( )。
A.在H0:???0H1:?0情况下,p值表示当H0为真时,样本可能结果不低于实际观测结果的概率
B.在H0:???0H1:?0情况下,p值表示当H0为真时,样本可能结果不高于实际观测结果的概率
C.在H0:???0H1:?>?0情况下,p值表示当H0为真时,样本可能结果不低于实际观测结果的概率
D.在H0:???0H1:?>?0情况下,p值表示当H0为真时,样本可能结果不高于实际观测结果的概率
E.p??,接受H0,p??接受H1
17.下面叙述正确的是( )。
A.若p=0.011,则结论是统计显著,但不是高度显著 B.一个检验的p值是H0为真的概率
C.若一个结果是统计显著的,则他有0.05的机会应归因于偶然性,0.95的机会是实际存在的
D.在其他情况相等,p=0.98是比p=0.02对原假设更加有力的证据 E.p??接受H0
18.在假设检验中,显著性水平?表示( )。 A.
P?接受H0H0为假? B.
P?拒绝H0H0为真?
P拒绝H1H1为真C. D.取伪概率 E.弃真概率 19.下列关于假设检验的叙述正确的有( )。 A.假设检验实质上是对原假设进行检验 B.假设检验实质上是对备择假设进行检验
C.当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误
D.假设检验并不是根据样本结果简单地或者直接地判断原假设和备择假设哪一个更有可能正确
E.当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确。 20.选择一个合适的检验统计量是假设检验中一个重要的环节,其中“合适”的理解为( )。 A.选择的检验统计量应该与原假设有关 B.选择的检验统计量与备择假设有关
C.在原假设为真时,所选择的检验统计量的抽样分布是已知的 D.在备择假设为真时,所选的检验统计量的抽样分布是已知的 E.所选的检验统计量的抽样分布已知,但不含有未知参数 21. 类型抽样的优点是( )
A.只适合对各类分别进行估计 B.只适合对总体进行估计 C.既可以对各类分别进行估计,也可以对总体进行估计 D.估计的效果较好,在实践中广泛应用 E.可使总体的方差减少
22. 整群抽样中的群与分类抽样中的类相比( ) A.两者相同 B.两者不同
C.两者的划分原则正好相反 D.要求群内差异大 E.要求类内差异大
三、填空题
1、抽样推断就是根据( )的信息去研究总体的特征。
2、抽样推断包括( )和( )两个方面,统计推断又进一步分为( )和( )两种形式。
3、样本单位选取方法可分为( )和( )。
4、对于简单随机抽样,总体中的每个单位被抽中的概率为( )。 5、所有可能样本的抽样误差的平均数称( )。 6、有限总体不重复抽样的修正系数是( )。
7、在其它条件一定的情况下,抽样推断的准确度越大,其可靠性就越( )。 8、区间估计的要素是( )、( )和( )。
9、区间估计时,既要考虑极限误差的大小,即估计的准确度问题,又要考虑估计的( )问题。 10、对于简单随机重复抽样来说,欲使抽样平均误差缩小2/3,则样本容量应增加( )倍。
11、对于简单随机抽样,当总体单位数较大时,若抽样比例为64%,则不重复抽样的抽样平均误差比重复抽样的抽样平均误差大约减少( )。
12、若极限误差为3倍的抽样平均误差,则总体指标落在置信区间之外的可能性为( )。
四、简答题
1.什么是抽样推断?抽样推断有哪几方面的特点?
2.什么是抽样误差?影响抽样误差大小的主要因素有哪些? 3.什么是极限误差?它与概率度有何关系?
??4.抽样平均误差和抽样极限误差有何关系? 5.影响必要样本容量的因素主要有哪些?
6.何为小概率事件原理,它是如何应用于参数的假设检验? 7.假设检验中的两类错误是什么,它们的关系是什么? 8.简述假设检验的一般步骤有哪些?
五、计算题
1.以简单随机抽样方法调查了某地的家庭人数,抽样比例为8%,样本容量为80户。经计算得:样本户均人数为3.2人,样本户均人数的标准差为0.148人,试就下列两种情况分别估计该地的户均人数和总人数:
(1)若给定可靠度为95.45%;(2)若给定极限误差为0.296
2.某商店对新购进的一批商品实行简单随机抽样检查,抽样后经计算得:该商品的合格率为98.8%,抽样平均误差为0.02%,试在如下条件下分别估计该批商品的合格率: (1)若给定可靠度为68.27%;(2)若给定极限误差为2%
3.某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下: 1 60以下 2、 70-80 80-90 90- 考试 60-70 90-100 成绩 3、 4、 5、 6、 7、 8、 学生 10 20 22 40 8 人数 试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围。 4.从某年级学生中按简单随机抽样方式抽取40名学生,对公共理论课的考试成绩进行检查,得知其平均分数为78.75分,样本标准差为12.13分,试以95.45%的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生? 5.为研究某市居民家庭收入状况,按1%比例从该市的所有住户中随机抽取515户进行调查,结果为:户均收入为8235元,每户收入的标准差为935元。要求:
(1)以99.73%的置信度估计该市的户均收入;(2)如果允许误差减少到原来的0.5,其它条件不变,则需要抽取多少户?
2N(800,40),现随机抽取30个样品,测得样本均值为788小6.假定某种灯泡的寿命服从
时,试以0.04的显著性水平检验 ??800小时是否成立。
7.为了降低贷款风险,银行内部规定,要求平均每项贷款额不能超过120万元,现对过去的贷款规模做检验是否超过120万元,抽取了144个项目,测得样本均值为128.1,样本标准差为45万元,试以0.01的显著性水平检验贷款平均水平是否超过120万元。
2
8.已知某种木材的抗压力服从正态分布,这种木材的标准抗压力不小于470kg/cm,现对某木材厂的10个木材进行检验,得到的数据如下:
482,493,457,471,510,446,435,418,394,469
(1)若已知标准差为36,试以0.05的显著性水平来检验该批木材是否达标。 (2)若标准差是未知的,试以0.05的显著性水平来检验该批木材是否达标。
9.某品牌香烟的尼古丁的含量服从正态分布,且??3.5mg,现检验8支该品牌的香烟,测得平均含有的尼古丁为4.2mg,样本标准差为1.4mg,试在0.01的显著性水平下检验?是否超过3.5mg。
第二部分 习题参考答案
一、单项选择题
1.B 2.B 3.D 4.A 5.A 6.D 7.D 8.C 9.B 10.B 11.A 12.B 13.A 14.C 15.A 16.B 17.A 18.D 19.B 20.C 21.C 22.C 23.A 24.C 25.C 26.D 27.B 28.A 29.A 30.D 31.B 32.D 33.A 34.A 35.D 36.A 37.D 38.D 39.A 40.B 41.A 42.B
二、多项选择题
1.ABCDE 2.ABCD 3.ABCDE 4.BDE 5.ABC 6.ABDE 7.ABD 8.AB 9.ABCDE 10.ABCD 11.ACD 12.BCE 13.ABD 14.ADE 15.ACD 16.ADE 17.ADE 18.BE 19.ACDE 20.ACE 21.CD 22.BCD
三、填空题
1样本,2抽样技术、统计推断、统计估计、假设检验,3重复抽样、不重复抽样,
N?n4为1/N ,5抽样平均误差,6N?1,7小,
8点估计值,极限误差,概率保证程度,9可靠性, 10增加8倍,11减少40%,12为0.27%。
四、简答题
1.抽样推断是在抽样调查的基础上,利用样本资料计算样本指标,并根据此推算总体相应数量特征的一种统计分析方法。这种估计和判断要运用一定的数理统计的原理和方法,以保证对总体的认识具有一定的可靠程度。抽样推断的特点重要有: (1)抽样推断是由部分资料推算总体数量特征的一种认识方法。 (2)抽样推断是建立在随机抽样的基础上。 (3)抽样推断运用概率统计的方法。
(4)抽样推断的误差可以事先加以计算并加以控制。
2.抽样误差是由于随机抽样的偶然性因素作用使得样本结构不足以代表总体,而引起抽样指标和全及指标之间的绝对离差。它的产生可能是由于违反随机抽样的原则而产生的,也可能是由于虽然坚持随机抽样原则但由于样本不足而产生的系统性误差。影响抽样误差大小的因素主要有:
(1)总体各单位标志值的差异程度; (2)样本单位数的大小; (3)抽样方法的不同;
(4)抽样调查的组织形式不同。
3.抽样极限误差是指可以允许样本指标与总体指标之间的最大的误差范围,它等于样本指标可以允许变动的上限或下限与总体指标之差的绝对值。而概率保证程度是在区间估计时总体指标以多大的可能落入到一个区间中。一般来说,在其他条件不变的情况下,概率保证程度越高,那么抽样极限误差就越大,反之亦然,两者呈正向关系。
4.抽样平均误差是反映各个抽样指标与总体指标之间抽样误差的一般水平指标,它与抽样的方法与组织形式有关。而抽样极限误差是指可以允许样本指标与总体指标之间的最大的误差范围。它们都是反映抽样指标与总体指标之间的差异程度,因而具有一定的关系。在其它因素不变的情况下,一般来说,两者呈正相关,即抽样平均误差越大,则抽样极限误差也越大,反之亦然。
5.影响必要样本容量的因素主要有以下几个因素
(1)样本容量的大小受到抽样极限误差的影响,两者具有反向的关系; (2)样本容量的大小受到总体标准差的影响,两者具有正向的关系;
(3)样本容量的大小还受到概率保证程度即概率度的影响,两者具有正向关系;
(4)样本容量的大小还受到抽样的方式和组织形式的影响,一般来说,放回的重复抽样的样本容量在同等条件下要大于无放回的非重复抽样的样本容量。
6.小概率事件原理是指概率很小的事件在一次实验中几乎是不可能发生的,在参数的假设检验中,就是利用小概率事件原理来进行检验的。在假设检验中,通过事先承认原假设成立而构造一个小概率事件,然后通过一次抽样得到样本资料,利用样本资料计算相关的统计量的值,再与临界值进行比较,从而验证小概率事件有没有发生。
7.假设检验中常会发生两类错误,第一类是弃真错误,就是原假设0是正确的,而实际在检验时,由于观察到小概率事件而加以否定,发生这种情况的概率就是显著性水平?;第二类错误是取伪错误,就是原假设
HH0是错误的,而实际在检验时,由于没有观察到小概
率事件而加以肯定,发生这种情况的概率是?。在假设检验中,一般是在控制犯第一类错误的前提下,尽可能降低犯第二类错误的水平。对于样本不变的情况下,这犯两类错误的水平呈反向关系,即降低某类错误必然会增大犯另一类错误的概率。
8.不同的参数假设检验涉及到的统计量有所不同,拒绝域也不同,但主要步骤基本相同,例如就正态总体的均值检验为例,设总体方差是?已知的,主要步骤如下:
(1)根据研究的目的和具体的题目,提出正确的假设形式,包括原假设和备择假设,这里要注意使用双边检验和单边检验的区别。
(2)根据题目已知的条件,选择一个合适的检验统计量,这里要注意是大样本还是小样本,是否已知某些参数,在两个总体下的方差是否知道以及不知道时是否相等等情况。
(3)在选定统计量的基础上,构造一个小概率事件,这里要注意的是,小概率事件要使用原假设成立时的结果。
(4)以样本得到的资料代入统计量中,得到的统计量在原假设成立时的值。 (5)对于给定的显著性水平和自由度,查适当的分布表,得到临界值。 (6)检验小概率事件有没有发生,并给出检验的结果。
五、计算题
1.根据题目已知f?0.08,n?80,x?3.2,??0.148 (1)若给定可靠度为95%,则有
20.1481?0.08?0.031n80?x?[3.2?0.03,3.2?0.03]?x?[3.17,3.23]t?1.96??x?t?x?t?1.96??X?[3.17?1000,3.23?1000]?X?[3170,3230](2)若给定极限误差为0.296,则有
?1?f2.根据题目已知
(1)若给定可靠度为68.27%,则有
x?[3.2?0.296,3.2?0.296]?x?[2.904,3.496]?X?[2.904?1000,3.496?1000]?X?[2904,3496]
p?0.998,?p?0.002t?1.0??p?t?p?1.0?0.0002?0.0002?p?[0.988?0.0002,0.988?0.0002]?p?[0.9878,0.9882]
(2)若给定极限误差为0.02,则有
p?[0.988?0.02,0.988?0.02]?p?[0.968,1]
3.(1)该校学生英语考试的平均成绩的范围:
σ=
11.377?1.1377n100
?x?t?x?2?1.1377?2.2754
?x???该校学生考试的平均成绩的区间范围是:
xx
76.6-2.2754≤X≤76.6+2.2754
x???X?x?? 74.32≤X≤78.89
(2)该校学生成绩在80分以上的学生所占的比重的范围
△p=tμp=2×0.04996=0.09992
80分以上学生所占的比重的范围:P=p±△p=0.48±0.09992,即0.3801≤P≤0.5799 在95.45%概率保证程度下,该校学生成绩在80分以上的学生所占的比重的范围在38.01%—57.99%之间。
4.n=40 x=78.56 σ=12.13 t=2
n(1)
全年级学生考试成绩的区间范围是:
?x???12.13?1.92??t?x?2?1.92?3.84 40 xx??x?X?x??x ,即78.56-3.84≤X≤78.56+3.84,得到74.91≤X≤82.59。
(2)将误差缩小一半,应抽取的学生数为:
t2?222?12.132n???160(?x/2)2(3.84/2)2(人)
5.根据题目已知f?0.01,n?515,x?8235,??935 (1)若给定可靠度为99.73%,则有
9351?0.01?122.98n515?x?[8235?122.98,8235?122.98]?x?[8112.02,8357.98] t?3??x?t?x?t?3?(2)如果允许误差减少到原来的0.5,其它条件不变,则需要抽取
?1?ft2?232?9352n?2??2080.92?2081?x(122.98?0.5)2户
6.建立假设为
H0:??800,H1:??800,检验统计量的值为:
z?查得临界值为
(788?800)30?1.64340
z1?0.04/2?2.054,从而有z?z1?0.04/2,从而小概率事件没有发生,所以接受
原假设,即在0.04的显著性水平下??800小时成立。 7.建立假设为
H0:??120,H1:??120,检验统计量的值为:
(128.1?120)144?2.16t(143)?2.34,从而有t?t0.01(143),从45,查得临界值为0.01而小概率事件没有发生,所以接受原假设,即在0.01的显著性水平下??120万元成立。 t?8.(1)建立假设为
H0:??470,H1:??470,检验统计量的值为:
(457.5?470)10??1.098?z??1.645,从而有z??z1?0.05,36,查得临界值为1?0.052
从而小概率事件没有发生,所以接受原假设,即在0.05的显著性水平下接受??470kg/cm。 z?(2)建立假设为
H0:??470,H1:??470,检验统计量的值为:
t?(457.5?470)10??1.122?t(10?1)??1.833,从而有35.22,查得临界值为0.05t?t0.05(9),从而小概率事件没有发生,所以接受原假设,即在0.05的显著性水平下
??470kg/cm2成立。
9.建立假设为
H0:??3.5,H1:??3.5,检验统计量的值为:
(4.2?3.5)8?1.414t(8?1)?2.988,从而有t?t0.01(7),从而小1.4,查得临界值为0.01概率事件没有发生,所以接受原假设,即在0.01的显著性水平下??3.5mg成立。 t?
第六章 相关与回归分析方法
第一部分 习题
一、单项选择题
1.单位产品成本与其产量的相关;单位产品成本与单位产品原材料消耗量的相关 ( )。 A.前者是正相关,后者是负相关 B.前者是负相关,后者是正相关 C.两者都是正相关 D.两者都是负相关 2.样本相关系数r的取值范围( )。
A.-∞<r<+∞ B.-1≤r≤1 C. -l<r<1 D. 0≤r≤1
01上,则x与y之间的相关系数( )。 3.当所有观测值都落在回归直线
A.r=0 B.r=1 C.r=-1 D.|r|=1 4.相关分析与回归分析,在是否需要确定自变量和因变量的问题上( )。 A.前者无需确定,后者需要确定 B.前者需要确定,后者无需确定 C.两者均需确定 D.两者都无需确定
5.直线相关系数的绝对值接近1时,说明两变量相关关系的密切程度是( )。 A.完全相关 B.微弱相关 C.无线性相关 D.高度相关 6.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )。
A.增加70元 B.减少70元 C.增加80元 D.减少80元 7.下面的几个式子中,错误的是( )。
A. y= -40-1.6x r=0.89 B. y= -5-3.8x r=-0.94 C. y=36-2.4x r=-0.96 D. y= -36+3.8x r=0.98 8.下列关系中,属于正相关关系的有( )。
A.合理限度内,施肥量和平均单产量之间的关系 B.产品产量与单位产品成本之间的关系 C.商品的流通费用与销售利润之间的关系 D.流通费用率与商品销售量之间的关系 9.直线相关分析与直线回归分析的联系表现为( )。
A.相关分析是回归分析的基础 B.回归分析是相关分析的基础 C.相关分析是回归分析的深入 D.相关分析与回归分析互为条件 10.进行相关分析,要求相关的两个变量( )。
A.都是随机的 B.都不是随机的 C.一个是随机的,一个不是随机的 D.随机或不随机都可以 11.相关关系的主要特征是( )。
A.某一现象的标志与另外的标志之间存在着确定的依存关系
B.某一现象的标志与另外的标志之间存在着一定的关系,但它们不是确定的关系 C.某一现象的标志与另外的标志之间存在着严重的依存关系 D.某一现象的标志与另外的标志之间存在着函数关系 12.相关分析是研究( )。
A.变量之间的数量关系 B.变量之间的变动关系 C.变量之间相互关系的密切程度 D.变量之间的因果关系 13.现象之间相互依存关系的程度越低,则相关系数( )。
A.越接近于0 B.越接近于-1 C.越接近于1 D.越接近于0.5
01中,若114.在回归直线,则x与y之间的相关系数( )。
A. r=0 B. r=1 C. 0<r<1 D. —l<r<0 15.当相关系数r=0时,表明( )。
A.现象之间完全无关 B.相关程度较小 C.现象之间完全相关 D.无直线相关关系
y????xy????x??02??10,?y?8,?xy??7,n?100x16.已知x与y两变量间存在线性相关关系,且,则x与
y之间存在着( )。
A.较密切的正相关 B.较低度的正相关 C.较密切的负相关 D.低度负相关 17.计算估计标准误差的依据是( )。
A.因变量的数列 B.因变量的总变差 C.因变量的回归变差 D.因变量的剩余变差 18.两个变量间的相关关系称为( )。
A.单相关 B.复相关 C.无相关 D.负相关 19.从变量之间相关的方向看,可分为( )。 A.正相关与负相关 B.直线相关和曲线相关 C.单相关与复相关 D.完全相关和无相关
20.从变量之间相关的表现形式看,可分为( )。 A.正相关与负相关 B.直线相关和曲线相关 C.单相关与复相关 D.完全相关和无相关
21.物价上涨,销售量下降,则物价与销售量之间属( )。 A.无相关 B.负相关 C.正相关 D.无法判断 22.估计标准误差是反映( )。
A.平均数代表性的指标 B.相关关系的指标
C.回归直线的代表性指标 D.序时平均数代表性指标
23.回归直线和相关系数的符号是一致的,其符号均可用来判断现象是( )。 A.正相关还是负相关 B.线性相关还是非线性相关 D.单相关还是复相关 C.完全相关还是不完全相关
24.某校经济管理类的学生学习《统计学》的时间x与考试成绩y之间建立线性回归方程
y??0??1x。经计算,方程为y=20-0.8x,该方程参数的计算( )。
A.
?0值是明显不对的 B. ?1值是明显不对的 ??C.0值和1值都是不对的 D.0值和1值都是正确的
25.在回归分析中,自变量同因变量地位不同,在变量x与y中,y依x回归同x依y回归是( )。
A.同一个问题 B.有联系但意义不同的问题
C.一般情况下是相同的问题 D.是否相同,视两相关变量的具体内容而定
二、多项选择题
1.下列现象中属于相关关系的有( )。
A.压力与压强 B.现代化水平与劳动生产率
C.圆的半径与圆的面积 D.身高与体重 E.机械化程度与农业人口 2.相关关系与函数关系各有不同特点,主要体现在( )。 A.相关关系是一种不严格的互相依存关系 B.函数关系可以用一个数学表达式精确表达 C.函数关系中各现象均为确定性现象
D.相关关系是现象之间具有随机因素影响的依存关系
E.相关关系中现象之间仍可以通过大量观察法来寻求其变化规律
3.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于( )。 A.正相关 B.单相关 C.负相关 D.复相关 E.完全相关 4.在直线相关和回归分析中( )。 A.据同一资料,相关系数只能计算一个 B.据同一资料,相关系数可以计算两个 C.据同一资料,回归方程只能配合一个
D.据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个 E.回归方程和相关系数均与自变量和因变量的确定无关 5.相关系数r的数值( )。
??A.可为正值 B.可为负值 C.可大于1 D.可等于-1 E.可等于1 6.相关系数r=0.9,这表明现象之间存在着( )。
A.高度相关关系 B.低度相关关系 C.低度负相关关系 D.高度正相关关系 E.低度正相关关系 7.拟合直线回归方程是为了( )。
A.确定两个变量之间的变动关系 B.用因变量推算自变量 C.用自变量推算因变量 D.两个变量相互推算 E.确定两个变量间的相关程度
8.在直线回归分析中,确定直线回归方程的两个变量必须是( )。 A.一个自变量,一个因变量 B.均为随机变量 C.对等关系 D.一个是随机变量,一个是可控制变量 E.不对等关系 9.直线相关分析的特点有( )。
A.两个变量是对等关系 B.只能算出一个相关系数 C.相关系数有正负号,表示正相关或负相关 D.相关的两个变量必须都是随机的 E.回归方程有两个
10.从变量之间相互关系的表现形式看,相关关系可分为( )。
A.正相关 B.负相关 C.直线相关 D.曲线相关 E.不相关和完全相关 11.直线相关分析与直线回归分析的区别在于( )。
A.相关的两个变量都是随机的,而回归分析中自变量是给定的数值,因变量是随机的 B.回归分析中的两个变量都是随机的,而相关中的自变量是给定的数值,因变量是随机的 C.相关系数有正负号,而回归系数只能取正值
D.相关的两个变量是对等关系,而回归分析中的两个变量不是对等关系 E.相关分析中根据两个变量只能计算出一个相关系数,而回归分析中根据两个变量只能配合一个回归方程
12.确定直线回归方程必须满足的条件是( )。
A.现象之间存在着直接因果关系 B.现象之间存在着较密切的直线相关关系 C.相关系数必须等于1 D.两变量必须均属于随机变量 E.相关数列的项数必须有相应的数量 13.下列哪些关系是相关关系( )。 A.圆的半径长度和周长的关系 B.农作物收获和施肥量的关系 C.商品销售额和利润率的关系 D.产品产量与单位成品成本的关系 E.家庭收入多少与消费支出增长的关系
01中的1称为回归系数,回归系数的作用是( )。 14.直线回归方程
A.可确定两变量之间因果的数量关系 B.可确定两变量的相关方向 C.可确定两变量相关的密切程度
D.可确定因变量的实际值与估计值的变异程度
E.可确定当自变量增加一个单位时,因变量的平均增加量 15.相关系数与回归系数( )。
A.回归系数大于零则相关系数大于零 B.回归系数小于零则相关系数小于零 C.回归系数大于零则相关系数小于零 D.回归系数小于零则相关系数大于零 E.回归系数等于零相关系数等于零
三、填空题
1、按变量的多少可将相关关系分为( )和( )两种;按变量之间的相关的表现形态可分为( )和( )两种;按相关关系的程度不同可分为( )、( )和( )三种;而简单相关按相关的方向不同分为( )和( )
y????x?两种。
2、一般地,当相关系数的绝对值为1时,相关关系就转化为( )。 3、相关系数r的符号反映相关关系的( ),其绝对值的大小反映两变量线性相关的( )。
4、相关系数r=0表明两个变量( )。
5、样本容量较大时,样本相关系数r越大,表示总体的相关程度( )。 6、相关系数的取植范围是( );判定系数的取植范围是( )。 7、估计回归方程的参数时,常用的方法是( ),其基本要求是( )。 8、当回归系数大于零时,相关系数( )零。
9、在线性总体回归模型中,变量i的取值可以分割为两部分:一部分是( ),另一部分是( )。
10、回归分析和相关分析的联系表现在:相关分析是回归分析的( ),回归分析是相关分析的( )。
11、总离差可分解为两部分,一部分是可以被解释的( ),另一部分则是不能被解释的( )。
12、反映样本回归线对总体回归线拟合好坏的指标是( )。
四、简答题
1.什么是相关关系?相关关系有什么特点,如何度量? 2.简述相关关系的种类。
3.相关分析的主要内容包括哪些?
4.试给出测定变量相关关系的常用方法。 5.简述积矩相关系数检验的步骤。
6.简述相关分析与回归分析的区别与联系。 7.什么是估计标准误差? 有什么作用?
8.以一元线性回归方程为例,简述回归系数显著性检验的主要步骤。 9.简述非线性线性化的常用方法。
10.一元线性回归中两变量的样本相关系数、回归系数斜率项的估计值和回归模型的判定系数的关系如何?
五、计算题
1. 某地1993年-2004年人均收入和耐用消费品销售额资料如下: 年份 人均收入X(万元) 耐用消费品销售额Y(万元) 1993 3.0 80 1994 3.2 82 1995 3.4 85 1996 3.5 90 1997 3.8 100 1998 4.0 120 1999 4.5 140 2000 5.2 145 2001 5.3 160 2002 5.5 180 2003 5.7 208 2004 5.9 219 要求: (1)根据以上简单相关表的资料,绘制相关散点图,并判别相关关系的表现形式和方向。 (2)试以耐用消费品销售额为因变量、人均收入为自变量做回归分析(包括相关的检验)。 2.某地区31年中的个人储蓄及个人收入资料如下表所示:
Y
储蓄 收入 储蓄 收入 储蓄 收入 264 8777 898 16730 2017 27430 105 9210 950 17663 2105 29560 90 9954 779 18575 1600 28150 131 10508 819 19535 2250 32100 122 10979 1222 21163 2420 32500 107 11912 1702 22880 2570 35250 406 12747 1578 24127 1720 33500 503 13499 1654 25604 1900 36000 431 14269 1400 26500 2100 36200 588 15522 1829 27670 2300 38200 898 16730 2200 28300 4333 46733
利用给定的资料,建立一元线性回归模型,进行回归分析。 3. 某企业上半年成品产量与单位成本资料如下:
月份 1 2 3 4
产量(千件)
32 28 39 42
单位成本(元/件)
73 72 71 66
要求:
(1)计算成品产量与单位成本的相关系数,并说明相关方向和相关程度。 (2)建立回归直线方程(以单位成本为因变量),指出产量每增加1千件时单位成本平均下降多少?
(3)计算估计标准误差。
(4)假定产量为50千件时,估计单位成本的取值区间?(只考虑估计标准误差)
4.考察2003年度中国各地区可支配收入(income)和消费性支出(expend)之间的关系,数据如下: 单位:元
地 区 消费性支出 可支配收入 地 区 消费性支出 可支配收入 北 京 11123.84 13882.62 四 川 5759.21 7041.87 天 津 7867.53 10312.91 贵 州 4948.98 6569.23 河 北 5439.77 7239.06 云 南 6023.56 7643.57 山 西 5105.38 7005.03 西 藏 8045.34 8765.45 内蒙古 5419.14 7012.90 陕 西 5666.54 6806.35 辽 宁 6077.92 7240.58 湖 北 5963.25 7321.98 吉 林 5492.10 7005.17 湖 南 6082.62 7674.20 黑龙江 5015.19 6678.90 广 东 9636.27 12380.43 上 海 11040.34 14867.49 广 西 5763.50 7785.04 江 苏 6708.58 9262.46 海 南 5502.43 7259.25 浙 江 9712.89 13179.53 重 庆 7118.06 8093.67 安 徽 5064.34 6778.03 甘 肃 5298.91 6657.24 福 建 7356.26 9999.54 青 海 5400.24 6745.32 江 西 4914.55 6901.42 宁 夏 5330.34 6530.48 山 东 6069.35 8399.91 新 疆 5540.61 7173.54 河 南 4941.60 6926.12
摘自《中国统计年鉴2004》
(1)以可支配收入为自变量,消费性支出为因变量,试用最小二乘法确定回归方程,并就各地区可支配收入计算消费性支出的估计量;
(2)对方程的拟合情况进行诊断;解释各参数经济意义。(显著性水平取0.05) 4.以下是2003年全国城镇居民平均每年全部可支配收入和食品支出,分析两者之间的关系,建立半对数线形模型,作出残差图。 (单位:元)
地 区 食品支出 可支配收入 地区 可支配收入 食品支出 北 京 3522.69 13882.62 四 川 2240.65 7041.87 天 津 2963.85 10312.91 贵 州 1968.22 6569.23 河 北 1912.42 7239.06 云 南 2506.62 7643.57 山 西 1712.13 7005.03 西 藏 3542.89 8765.45 内蒙古 1705.56 7012.90 陕 西 1960.29 6806.35 辽 宁 2394.98 7240.58 湖 北 2279.64 7321.98 吉 林 1957.92 7005.17 湖 南 2179.40 7674.20 黑龙江 1783.95 6678.90 广 东 3583.72 12380.43 上 海 4102.65 14867.49 广 西 2305.98 7785.04 江 苏 2566.89 9262.46 海 南 2463.03 7259.25 浙 江 3558.41 13179.53 重 庆 2702.34 8093.67 安 徽 2238.91 6778.03 甘 肃 6657.24 1908.10 福 建 3104.80 9999.54 青 海 6745.32 1986.54 江 西 1979.83 6901.42 宁 夏 6530.48 1919.42 山 东 2051.30 8399.91 新 疆 7173.54 1987.42 河 南 1662.30 6926.12
(摘自《中国统计年鉴2004》)
6.某企业某种产品产量与单位成本资料如下: 月 份 1 2 产量(千件) 单位成本(元/件) 2 73 3 72 3 4 71 4 3 73 5 4 69 6 5 68 要求: (1)计算相关系数,说明相关程度;
(2)确定单位成本对产量的直线回归方程,指出产量每增加1000件时,单位成本平均下降多少元?
(3)如果单位成本为70元时,产量应为多少? (4)计算估计标准误差。
第二部分 习题参考答案
一、单项选择题
1.B 2.B 3.D 4.A 5.D 6.A 7.A 8.A 9.A 10.A 11.B 12.C 13.A 14.D 15.D 16.D 17.D 18.A 19.A 20.B 21.B 22.C 23.A 24.B 25.B
二、多项选择题
1.BDE 2.ABCDE 3.BC 4.AD 5.ABDE 6.AD 7.AC 8.ADE 9.ABCD 10.CD 11.AD 12.ABE 13.BCDE 14.ABE 15.ABE
三、填空题
1简单相关、多元相关、线性相关、非线性相关、完全相关、不完全相关、不相关、正相关、负相关;
2函数关系;3方向、密切程度;4无线性相关关系
2??????1,10,1??y?y?5高;6、;7最小平方法、为最小值;8大于;
9确定的可由变量X来解释的线性变化部分、由其他一切随机因素引起的不可解释的随机项;
10前提、继续;11回归平方和、剩余平方和;12估计标准误差。
四、简答题 1.(1)概念 相关关系是变量之间的一种不确定的关系,它是相对于函数关系而言的,例如学生的学习成绩与学习的时间长短有一定的关系,但学习的时间不是唯一确定学生的学习成绩。
(2)特点 首先它们都反映变量之间的不确定关系的程度与方向,数值的正负反映相关的方向,而大小反映了相关的程度;其次,相关系数的取值始终在-1与1之间;另外,对于两个变量,它们之间的相关系数受样本观测值的影响,在不同的样本数据下,计算的结果可能不同。因而存在着变量之间相关程度的检验问题,只有通过显著性检验的相关系数才能真正说明变量之间具有相关关系;最后,相关关系度量的是变量之间的线性相关程度,如果相关系数为0,排除的只是变量之间没有线性关系,但变量之间可能存在着某种非线性关系。 (3)度量 对于两个变量之间的线性关系通常使用变量的样本资料来计算相关系数,包括反映定量变量的积矩相关系数r和反映定性变量的等级相关系数量的观察值
rs,
假设我们有n组两个变
(xi,yi),i?1,2,,n,则它们的计算公式分别为:
r??(x?x)(y?y)iii?1n?(x?x)?(y?y)2iii?1i?1nn2 rs?1?di为变量相同观测对应的等级差。
6?di2n(n?1)
i?12n2.相关关系的分类因分类的标准不同而有不同的分类结果: (1)从相关的方向上可以分为正相关和负相关;
(2)从相关的形式上可以分为直线相关和曲线相关; (3)从包含的变量的个数上可以分为简单相关和复相关;
(4)从相关的程度上可以分为完全相关、完全不相关和不完全相关。
3.相关分析的主要的内容包括两个方面:测定变量相关分析的方向和相关程度。一般首先采用定性分析的方法对变量之间是否具有相关关系进行判断,如果它们具有相关关系,再采用一些分析手段来进行分析,如相关表、相关图、相关系数等。
4.测定相关关系的主要方法有:相关表和相关图,这两种方法具有直观简便的特点,能够反映出两个变量的相关方向,也能在一定程度反映相关的程度。相关系数法,常用的相关有变量之间的积矩相关系数和等级相关系数,其中积矩相关系数主要适用于定距和定比变量,而等级相关系数主要用于有序变量,相关系数的大小反映变量之间的相关程度,而正负反映了相关的方向。
5.积矩相关系数检验的步骤如下:
(1)建立假设 假设样本是从一个不相关的总体中抽取出来的,即假设为:
H0:??0(2)根据样本资料计算样本相关系数r;
H1:??0
t?r(3)构造检验的统计量,这里使用的统计量为有tn?21?r2,在原假设成立的情况下
t(n?2);