统计学练习与思考 2 下载本文

第一章 绪论

练习题:

(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号

内)

1.“统计”一词的基本含义是( )。 ①统计调查、统计整理、统计分析 ②统计设计、统计分组、统计计算 ③统计方法、统计分析、统计预测 ④统计科学、统计工作、统计资料

2.要了解某市国有工业企业生产设备情况,则统计总体是( )。 ①该市国有全部工业企业 ②该市国有每一个工业企业 ③该市国有某一台设备

④该市国有工业企业全部生产设备

3.有200个公司全部职工每个人的工资资料,如要调查这200个公司职工的工资水平情况,则统计总体为( )。

①200个公司的全部职工  ②200个公司

③200个公司职工的全部工资 ④200个公司每个职工的工资 4.构成统计总体的个别事物称为( )。

①调查单位 ②总体单位 ③调查对象 ④填报单位

5.构成统计总体的那些个体(总体单位)必须至少在某一方面具有( )。 ①差异性 ②同质性 ③相关性 ④可加性

6.调查某大学2000名学生学习情况,则总体单位是( )。 ①2000名学生 ②2000名学生的学习成绩 ③每一名学生 ④每一名学生的学习成绩 7.要了解某市职工收入状况,其总体单位是( )。 ①该市所有职工 ②该市每名职工 ③该市所有职工的收入 ④该市每名职工的收入 8.某城市进行工业企业未安装设备普查,总体单位是( )。 ①该市工业企业全部未安装设备 ②该市工业企业每一台未安装设备 ③该市每个工业企业的未安装设备

1

④该市每一个工业企业

9.下列总体中,属于无限总体的是( )。

①全国的人口总数 ②水塘中所养的鱼 ③城市年流动人口数 ④工业中连续大量生产的产品产量

10.总体与总体单位不是固定不变的,是指( )。

①随着客观情况的变化发展,各个总体所包含的总体单位数也在变动 ②随着人们对客观认识的不同,对总体与总体单位的认识也是有差异的 ③随着统计研究目的与任务的不同,总体和总体单位可以变换位置 ④客观上存在的不同总体和总体单位之间,总是存在着差异 11.标志是指( )。

①总体单位的特征或属性的名称 ②总体单位数量特征

③标志名称之后所表现的属性或数值 ④总体单位所具有的特征 12.一个统计总体( )。

①只能有一个标志 ②只能有一个指标 ③可以有多个标志 ④可以有多个指标 13.构成统计总体的总体单位( )。

①只能有一个标志 ②只能有一个指标 ③可以有多个标志 ④可以有多个指标 14.下列属于品质标志的是( )。

①工人年龄 ②工人性别 ③工人体重 ④工人工资

15.像家庭出身、企业所有制形式这样的概念,可用作( )。 ①数量指标 ②质量指标 ③品质标志 ④数量标志 16.标志与指标的区别之一是( )。

①标志是说明总体特征的,指标说明总体单位的特征 ②指标是说明总体特征的,标志是说明总体单位的特征 ③指标是说明有限总体特征的,标志是说明无限总体特征的 ④指标是说明无限总体特征的,标志是说明有限总体特征的 17.连续变量是指( )。

①整数变量 ②数量标志 ③其数值在整数之间可以有有限个数值

2

④其数值在整数之间可以有无限个数值 18.下列变量中,属于连续变量的是( )。 ①大中型企业个数  ②大中型企业的职工人数 ③大中型企业的利润额  ④大中型企业拥有的设备台数

19.随机从某个农贸市场抽取15个摊位,检查这些摊主照章纳税情况。其中( )。 ①.摊位数量和纳税额都是离散变量 ②摊位数量和纳税额都是连续变量

③摊位数量是离散变量,纳税额是连续变量 ④摊位数量是连续变量,纳税额是离散变量 20.工业企业的设备台数、产品产值是( )。 ①连续变量

②离散变量

④前者是离散变量

③前者是连续变量

21.某工人月工资为2000元,工资是( )。

①品质标志 ②数量标志 ③变量值 ④指标 22.指出下面的数据哪一个属于定类数据( )。 ①年龄 ②工资 ③汽车产量 ④购买商品的支付方式(现金、信用卡、支票) 23.指出下面的数据哪一个属于定序数据( )。 ①年龄 ②工资 ③汽车产量

④员工对企业某项制度改革措施的态度(赞成、中立、反对)

24.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是( )。

①定类变量 ②定序变量 ③数值型变量 ④离散变量 25.统计学的基本方法包括有( )。 ①调查方法、整理方法、分析方法 ②调查方法、汇总方法、预测方法 ③相对数法、平均数法、指数法 ④大量观察法、分组法、综合指标法 26.统计最基本的职能是( )。

①信息职能 ②咨询职能 ③反映职能 ④监督职能

27.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2009年城镇家

3

庭的人均收入数据属于( )。

①分类数据 ②顺序数据 ③截面数据 ④时间序列数据

(二)多项选择题(在下列备选答案中,有二至五个正确答案,请将其全部选出并把

顺序号填入括号内)

1.“统计”一词的三种不同涵义是( )。

①统计活动 ②统计资料 ③统计学 ④统计分析 ⑤统计预测

2.下列各项中属于品质标志的有( )。 ①性别 ②年龄 ③职务 ④民族 ⑤工资 3.某企业是总体单位,数量标志有( )。 ①所有制 ②职工人数 ③月平均工资 ④年工资总额 ⑤产品合格率

4.研究某厂全体工人情况,可变标志有( )。 ①工龄 ②性别 ③工资 ④工种 ⑤籍贯 5.统计指标构成要素包括( )。

①指标名称 ②计量单位  ③计算方法 ④时空限制  ⑤指标数值  6.在工业普查中( )。 ①机器台数是统计指标 ②机器台数是离散变量

③工业总产值5亿元是统计指标 ④工业总产值是离散变量 ⑤每一个工业企业是总体单位

7.对某市工业生产进行调查,得到以下资料,其中的统计指标是( ) ①某企业为亏损企业 ②实际产值为1.1亿元 ③职工人数为10万人 ④某企业资金利率为30% ⑤机器台数为750台

8.品质标志表示事物质的特征,数量标志表示事物量的特征,所以( ①数量标志可以用数值表示 ②品质标志可以用数值表示 ③数量标志不可以用数值表示 ④品质标志不可以用数值表示 ⑤两者都可以用数值表示

9.统计总体的基本特征表现为( )。

4

。 )。

①大量性 ②数量性 ③同质性 ④差异性 ⑤客观性 10.总体按照其所包含单位(个体)数目的多少可以划分为( )。 ①目的总体 ②调查总体 ③单个总体 ④有限总体 ⑤无限总体

11.当观察和研究某省国有工业企业的生产活动情况时( )。 ①该省所有的国有工业企业为总体 ②该省国有工业企业生产的全部产品为总体 ③该省国有企业的全部资产为总体 ④该省每一个国有工业企业为总体单位

⑤该省国有工业企业生产的每一件产品为总体单位 12.变量按其是否连续可分为( )。

①确定性变量 ②随机性变量 ③连续变量 ④离散变量 ⑤常数 13.连续变量的数值( )。

①是连续不断的 ②是以整数断开的 ③相邻两值之间可取无限数值 ④要用测量或计算的方法取得 ⑤只能用计数方法取得

14.离散变量的数值( )。

①是连续不断的 ②是以整数断开的 ③相邻两值之间不可能有小数 ④要用测量或计算的方法取得 ⑤只能用计数方法取得

15.下列各项中属于连续变量的有( )。

①厂房面积 ②职工人数 ③原材料消耗量 ④设备数量 ⑤产值

16.下列变量中,属于连续变量的有( )。 ①棉花产量 ②棉花播种面积 ③单位面积棉花产量 ④植棉专业户数 ⑤农业科研所数

17.下列变量中,属于离散变量的有( )。 ①商业企业单位数 ②商品总销售额 ③职工人数 ④商品库存额 ⑤商店经营商品品种数

5

18.假设某地区五家企业的工业总产值分别为25万元、20万元、40万元、33万元和65万元,则( )。

①“国有企业”是企业的品质标志 ②“工业总产值”是企业的数量标志 ③“工业总产值”是企业的统计指标 ④“工业总产值”是个变量

⑤25、20、40、33和65这几个数字是变量值 19.统计的基本概念中( )。 ①标志是说明总体单位属性和特征的 ②指标是说明总体特征的 ③变异是总体单位标志表现相同 ④变量是指可变的数量指标 ⑤变异是统计的前提

20.有一统计报告如下:某市工业企业1000个,职工人数30万人,工业总产值9亿元,平均劳动生产率为3000元/人。其中,某一企业的总产值为542.6万元,职工人数2000人。上述统计报告中出现有( )。

①总体 ②总体单位 ③标志 ④指标 ⑤变量 21.在第六次全国人口普查中( )。 ①全国人口数是统计总体 ②总体单位是每一个人 ③全部男性人口数是统计指标 ④人口的性别比例是总体的品质标志 ⑤人的年龄是变量

(三)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”)

1.统计学与统计工作的研究对象是一致的。 ( ) 2.总体的同质性是指总体中的各个单位在所有标志上都相同。 ( )

3.总体的差异性是指总体单位必须具有一个或若干个可变的品质标志或数量标志。 ( )

4.数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。( ) 5.品质标志和质量指标一般不能用数值表示。 ( ) 6.所有的统计指标和可变的数量标志都是变量。 ( ) 7.社会经济现象都是有限总体。 ( ) 8.全国人口普查的总体单位是户。 ( ) 9.所有总体单位与总体之间都存在相互转换关系。 ( )

6

10.统计所研究的对象必须是可度量的现象。 ( ) 11.统计指标是客观事实的具体反映,不具有抽象性。 ( ) 12.品质标志不能转变为统计指标数值。 ( ) 13.三位工人的工资不同,因此存在三个变量。 ( ) 14.商品的价格在标志分类上属于数量标志。 ( ) 15.要了解一个企业的产品生产情况,总体单位是每一件产品。 ( ) 16.大量观察法要求对社会经济现象的全部单位进行调查。 ( ) 17.总体单位是标志的承担者,标志是依附于总体单位的。 ( ) 18.变异是统计存在的前提,没有变异就没有统计。 ( )

19.统计学是一门研究现象总体数量特征的方法论科学,所以它不关心、也不考虑个别现象

的数量特征。 ( ) 20.统计学是从质与量的对立统一中研究客观现象总体数量特征的。 ( )

(四)填空题

1.凡是客观存在的,具有 的许多个别事物构成的整体,称为 。 2.按总体单位数量是否可以计数(或总体单位数的有限性)进行区分,总体有___________总体和_____________总体。

3.统计总体的基本特征可概括为 、 、 。 4.为了了解国有企业职工的年龄构成进行的统计调查,其统计总体是____________,总体单位是________________。

5.总体的 实际上是指总体各单位至少在一个标志上其具体表现是相同的。 6.标志是说明 特征的,而指标是说明 特征的。 7.标志按其表现形式不同,有______________标志和_____________标志。 8.工人的年龄,工厂设备的价值,属于 标志,而工人的性别,设备的种 类是 标志。

9.我们研究居民户的生活水平时,全部居民户便构成____________,而每户居民则是_______________。

10.一般来说,统计指标的数值是从总体单位的 汇总而来的。 11.统计指标体系是________________的指标所构成的__________。

12.在全市的工业普查中,机器台数是____________指标,工业总产值发展速度是__________指标,每个工业企业是总体单位,所有工业企业是总体。

13.随着研究目的的不同,如果原先的统计总体变成总体单位,则对应的 变成 。

14.统计指标反映的是 的数量特征,数量标志反映的是 的数量特征。 15.变量是指可变的_________________和__________ _。

7

16.按变量值的连续性分,可把变量分为____________变量和___________变量。 17.按变量的性质分有_______ ___变量和______ ______变量。

18.工厂的设备台数、工厂的人数属于__________变量,而人的身高、体重属于__________变量。

19.一个完整的统计工作过程应包括 、 和 。

20.统计工作的职能包括: 、 、 。其中以 为主。

21.数据的计量尺度从低级到高级分别有___________、___________、___________、___________;其中定性尺度包括___________和___________,定量尺度包括___________和___________。

(五)简答题

1.什么是统计,一般有几种理解?(*) 2.为什么说有变异才有统计?

3.什么是标志和指标?两者有何区别与联系?(*) 4.统计学的研究对象是什么?有哪些特征?

5.时期指标与时点指标的区别,请举例加以说明。(*)

第二章 统计资料的收集、整理与显示

练习题:

(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)

1.统计调查的基本要求是( )。 

①准确性、及时性、完整性 ②准确性、整体性、及时性 ③全面性、及时性、完整性 ④全面性、准确性、完整性 2.在统计调查中,填报单位是( )。

①调查项目的承担者 ②构成调查对象的每一个单位 ③负责向上报告调查内容的单位 ④构成统计总体的每一个单位 3.在统计调查中,调查单位和填报单位之间( )。 ①是一致的 ②是无区别的

③是无关联的两个概念 ④一般是有区别的,但有时也一致 4.某地区对小学学生情况进行普查,则每所小学是( )。

8

①调查对象 ②调查单位 ③填报单位 ④调查项目 5.对百货商店工作人员进行普查,调查对象是( )。

①各百货商店 ②各百货商店的全体工作人员 ③一个百货商店 ④每位工作人员 6.对某停车场上的汽车进行一次性登记,调查单位是( )。 ①全部汽车 ②每辆汽车 ③一个停车场 ④所有停车场

7.对国有工业企业设备进行普查时,每个国有工业企业是( )。 ①调查单位 ②填报单位

③既是调查单位又是填报单位 ④既不是调查单位又不是填报单位 8.对工业企业生产设备进行普查,调查单位是( )。 

①所有工业企业 ②工业企业的所有生产设备 ③每个工业企业 ④工业企业的每台生产设备 9.在统计调查阶段,对有限总体( )。

①只能进行全面调查 ②只能进行非全面调查 ③既能进行全面调查,也能进行非全面调查 ④以上答案都对

10.统计调查按调查对象包括的范围不同,可分为( )。

①定期调查和不定期调查 ②经常性调查和一次性调查 ③统计报表和专门调查 ④全面调查和非全面调查 11.经常性调查与一次性调查的划分( )。  ①是以调查组织规模大小来划分的

②是以最后取得的资料是否全面来划分的 ③是以调查对象所包括的单位是否完全划分的 ④是以调查登记的时间是否连续来划分的 12.统计报表大多属于( )。

①一次性全面调查 ②经常性全面调查 ③经常性非全面调查 ④一次性非全面调查

13.为了了解某商业企业的期末库存量,调查人员亲自盘点库存,这种方法是( ①大量观察法 ②采访法 ③直接观察法 ④报告法 14.问卷法属于( )。

①直接观察法 ②询问法 ③报告法 ④一次性调查 15.区别重点调查和典型调查的标志是( )。

①调查单位数目不同 ②搜集资料方法不同

9

)。

③确定调查单位标准不同 ④确定调查单位目的不同 16.重点调查的重点单位是指( )。  ①标志值很大的单位 

②这些单位的单位总量占总体全部单位总量的绝大比重 ③这些单位的标志总量占总体标志总量的绝大比重 ④经济发展战略中的重点部门

17.某城市拟对占全市储蓄额五分之四的几个大储蓄所进行调查,以了解全市储蓄的 基本情况,则这种调查方式是( )。

①普查 ②典型调查 ③抽样调查 ④重点调查

18.有意识地选择三个农村点调查农民收入情况,这种调查方式属于( )。 ①重点调查 ②普查 ③抽样调查 ④典型调查

19.某地区为了解轻纺工业生产情况,要进行一次典型调查,在选择调查单位时,应选择( )。

①生产情况较差的企业 ②生产情况中等的企业 ③生产情况较好的企业 ④差、中、好各类企业

20.调查几个主要铁路枢纽, 就可以了解我国铁路货运量的基本情况,这种调查方式属于( )。

①典型调查 ②重点调查 ③普查 ④抽样调查

21.为了了解全国钢铁企业生产的基本情况,可对首钢、宝钢、武钢、鞍钢等几个大型钢铁企业进行调查,这种调查方式是( )。 

①非全面调查 ②典型调查 ③重点调查 ④抽样调查 22.目前我国进行的职工家庭收支调查是( )。

①普查 ②重点调查 ③全面调查 ④抽样调查

23.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。

①统计报表 ②重点调查 ③全面调查 ④抽样调查

24.在我国,获得预计农产量全面资料最有效、最可行的调查方式是( )。  ①统计报表 ②重点调查 ③典型调查 ④抽样调查

25.某工业企业系统内欲进行工业企业生产设备状况普查,要求在1月1日至20日全部调查完毕,这一时间规定是( )。 

①调查期限 ②调查时间 ③登记时间 ④标准时间 26.人口普查规定统一的标准时间是为了( )。

①避免登记的重复和遗漏 ②具体确定调查单位 ③确定调查对象的范围 ④为了统一调查时间、一齐行动

10

27.我国第五次人口普查,是为了了解在2000年11月1日零时人口的状况,某地区要求将调查单位资料于11月20日前登记完毕,普查的标准时间是( )。 ①2000年11月20日零时 ②2000年11月19日24时 ③2000年11月1日24时 ④2000年10月30日24时

28.假设人中普查的标准时点为7月1日零点,7月2日调查员在各家调查时,得知 王××家6月30日出生一小孩,李家7月1日出生一小孩,则这两个小孩如何登记?( )。 ①两家小孩均应登记 ②王家的小孩应予登记,李家小孩不应登记 ③两家小孩均不予登记 ④王家小孩不应登记,李家小孩应予登记 29.非全面调查中最完善、最有计量科学根据的调查方式是( )。 ①重点调查 ②典型调查 ③抽样调查 ④非全面统计报表 30.统计分组的关键在于( )。 

①确定组距和组数 ②确定全距和组数 ③确定分组标志和划分各组界限 ④确定组距和组中值 31.将统计总体按某一标志分组的结果表现为( )。 

①组内同质性,组间差异性 ②组内差异性,组间差异性 ③组内差异性,组间同质性 ④组内同质性,组间同质性

32.在区分事物性质的分组中,划分经济类型具有重要意义,通过这种分组,可以研究各经济类型的( ) 。

①品质特征 ②数量特征 ③规模大小 ④依存关系 33.区分简单分组和复合分组的根据是( )。 

①分组对象的复杂程度 ②采用分组标志的多少不同  ③分组的数目多少不同 ④研究的总体变化如何

34.以一个企业的工人为总体,研究任务是分析该企业工人的文化素质,则分组标志应选择( ) 。

①工人的技术等级 ②工人的文化程度 ③工人的日产量 ④工人的出勤天数 35.次数分配数列是指( ) 。

①各组组别依次排成的数列  ②各组次数依次排成的数列 ③各组组别与次数依次排列而成的数列  ④各组频率依次排成的数列

36.变量数列中各组频率的总和应该( )。 

①小于1 ②等于1 ③大于1 ④不等于1 37.划分连续型变量的组限时,相邻两组的组限必须( )。 

11

①不等 ②重叠 ③间断 ④没有严格要求 38.划分离散型变量的组限时,相邻两组的组限( )。

①不等 ②重叠 ③间断 ④没有严格要求

39.有12名工人分别看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、4,按以上资料编制变量数列,应采用( )。

①单项式分组 ②等距分组 ③不等距分组 ④以上几种分组均可 40.一般情况下,按年龄分组的人口死亡率表现为( )。 ①钟形分布 ②正J布 ③U分布 ④对称分布

41.在分组时,若有某单位的变量值正好等于相邻组的上下限时,一般应将其归在( )。 ①上限所在组 ②下限所在组 ③任意一组均可 ④另设新组

42.工业企业按经济类型分组和工业企业按职工人数分组,两个统计分组是( )。  ①按数量标志分组 ②按品质标志分组 ③前者按数量标志分组,后者按品质标志分组 ④前者按品质标志分组,后者按数量标志分组

43.某企业职工按工资水平分为4组:500元以下;500—600元;600—700元;700元以上。第一组和第四组的组中值分别是( )。

①450元和750元 ②500元和700元 ③400元和800元 ④500元和750元

44.某连续变量数列,其末组为开口组,下限为500,又知其邻组组中值为480,则末组组中值为( )。

①520 ②510 ③500 ④490 45.等距数列中,组距的大小与组数的多少成( )。  ①正比 ②等比 ③反比 ④ 不成比例 46.要准确地反映异距数列次数的实际分布情况,必须计算( )。  ①次数 ②次数密度 ③频率 ④ 累计频率

47.在组距数列中,向下累计到某组的次数是100,这表示总体单位中( )。 ①大于该组下限的累计次数是100 ②小于该组下限的累计次数是100 ③大于该组上限的累计次数是100 ④小于该组上限的累计次数是100 58.把统计表分为简单表和分组表的依据是( )。  ①分组标志的选定 ②分组数目多少 ③根据主词的分组情况不同 ④总体是否相同

(二)多项选择题(在下列备选答案中,有二至五个正确答案,请将其全部

12

选出并把顺序号填入括号内)

1.普查是( )。

①非全面调查 ②专门调查 ③全面调查 ④经常性调查 ⑤一次性调查 2.非全面调查方式有( )。

①重点调查 ②抽样调查 ③典型调查 ④非全面统计报表 ⑤统计报表

3.乡镇企业抽样调查中,抽取的每一个乡镇企业是( )。 ①调查主体 ②调查对象 ③调查单位 ④调查项目 ⑤填报单位 4.全国工业企业普查中( )。

①全国工业企业数是调查对象 ②每个工业企业是调查单位 ③每个工业企业是填报单位 ④全国工业企业数是统计指标 ⑤全国工业企业是调查主体

5.下列统计调查中属于一次性调查的有( )。

①人口普查 ②大中型基本建设项目投资效果调查 ③职工家庭收支变化调查 ④单位产品成本变动调查 ⑤全国实有耕地面积调查

6.下列情况的统计调查中,属于经常性调查的是( )。 ①职工家庭收入与支出变化 ②全国实有耕地面积 ③清仓核资实物盘点 ④交通事故造成的后果与善后处理 ⑤工资总额统计

7.统计调查按搜集资料的方法,可以分为( )。 ①采访法 ②抽样调查法 ③直接观察法 ④典型调查法 ⑤报告法

8.调查单位和填报单位既有区别又有联系,是指( )。 ①某一客体不可能既是调查单位又是填报单位 ②某一客体可以同时做为调查单位和填报单位

③调查单位是调查项目的承担者,填报单位是向上报告调查内容的单位 ④调查单位是向上报告调查内容的单位,填报单位是调查项目的承担者 ⑤调查单位和填报单位都是总体单位

9.重点调查是在调查对象中,选择其中的一部分重点单位所进行的调查, 所谓重点单位是( )。

①在总体中举足轻重的单位 ②它们在总体单位数中占有很大比重

13

③在总体中它们的数目不多

④就调查的标志值来说,它们在总体中占有很大比重 ⑤能够反映出总体的基本情况的那些单位

10.下列统计调查中,调查单位与填报单位一致的有( )。 ①工业企业设备普查 ②零售商店调查 ③人口普查 ④工业企业普查 ⑤学校学生健康状况调查 11.专门组织的调查包括( )。

①典型调查 ②统计报表 ③重点调查 ④普查 ⑤抽样调查 12.重点调查( )。

①可用于经常性调查 ②不能用于经常性调查 ③可用于一次性调查 ④不可用于一次性调查 ⑤既可用于经常性调查,也可用于一次性调查 13.统计调查方案中的调查时间是指( )。

①时期现象资料所属的起止时间 ②时点现象资料所属的标准时点 ③调查工作进行的时间 ④公布调查结果的时间 ⑤调查期限

14.代表性误差可能产生在( )。

①普查中 ②重点调查中 ③抽样调查中 ④典型调查中 ⑤全面统计报表中 15.以下说法正确的是( )。

①抽样调查是非全面调查,因而也无法最终推算得到总体的全面资料 ②现行的统计报表制度是采用报告法搜集资料的 ③重点调查既可以是一次性调查,也可以是经常性调查 ④典型调查应和其他调查结合起来使用,以避免出现片面性 ⑤统计报表的内容包括表式和填表说明两个方面 16.我国进行的五次人口普查属于( )。 ①全面调查 ②不定期调查 ③定期调查 ④经常性调查 ⑤一次性调查

17.我国第五次人口普查规定的标准时间是2000年11月1日零时,下列哪些人口现象不应计算在人口总数之内( )。 ①2000年11月1日出生的婴儿

②2000年10月31日8时出生、20时死亡的婴儿

③2000年10月31日21时出生、11月1日零时死亡的婴儿

14

④2000年10月31日3时死亡的人口 ⑤2000年11月1日死亡的人口

18.我国工业企业设备普查中( )。

①每台设备是调查单位 ②每台设备是填报单位 ③每台设备是调查对象 ④每个工业企业是填报单位 ⑤所有设备是调查对象 19.统计整理是( )。

①统计调查的继续 ②统计汇总的继续 ③统计调查的基础 ④统计分析的前提 ⑤对客观现象从个体量观察到总体量认识的必要环节 20.统计分组( )。 ①是全面研究客观现象的重要方法

②可将复杂现象分类 ③可分析总体内部结构 ④可采用多种标志分组 ⑤利于揭示现象间依存关系 21.统计分组( )。

①是一种统计方法 ②对总体而言是“合” ③对总体而言是“分” ④对个体而言是“合” ⑤对个体而言是“分”

22.分组标志的选择( )。

①是对总体划分的标准 ②要根据统计研究目的进行 ③要适应被研究对象的特征 ④必须是数量标志 ⑤必须考虑历史资料的可比性

23.统计分组的关键在于( )。

①按品质标志分组 ②按数量标志分组 ③选择分组标志 ④划分各组界限 ⑤按主要标志分组

24.下列按数量标志分组的有( )。

①教师按聘任职务分组 ②学生按所学专业分组 ③职工按工资级别分组 ④人口按民族分组 ⑤商业企业按销售额分组

25.按分组标志特征不同,分布数列可分为( )。 ①等距数列 ②异距数列 ③属性分布数列 ④变量分布数列 ⑤次数与频率 26.分布数列的两个组成要素为( )。

15

①品质标志 ②数量标志 ③各组名称 ④次数 ⑤分组标志

27.统计表按分组的情况分类,可分为( )。 ①调查表 ②简单表 ③汇总表 ④简单分组表 ⑤复合分组表 28.影响次数分布的要素是( )。

①变量值的大小 ②变量性质不同 ③选择的分组标志 ④组距与组数 ⑤组限与组中值

29.次数分布的主要类型有( )。

①J形分布 ②S形分布 ③钟形分布 ④U形分布 ⑤Z形分布 30.组距数列,组距的大小与( )。

①组数的多少成正比 ②组数的多少成反比 ③总体单位数多少成反比 ④全距的大小成正比 ⑤全距大小成反比

31.在组距数列中,组中值( )。

①是上限和下限的中点数 ②是用来代表各组标志值的平均水平 ③在开口式分组中无法确定

④在开口式分组中,可以参照邻组的组距来确定 ⑤就是组平均数

32.现将某班级40名学生按成绩分别列入不及格(59分以下),及格(60 -69分),中等(70-79分),良好(80-89分),优秀(90分以上)5个 组中去,这种分组( )。

①形成变量数列 ②形成组距数列 ③形成品质分布数列 ④形成开口式分组 ⑤是按品质标志分组

33.第五次人口普查中( )。

①调查单位是每一个人 ②填报单位是每一个人 ③调查对象是每一户家庭 ④调查对象是全国所有人口 ⑤填报单位是每一户家庭

34.通过调查鞍钢、首钢、宝钢等几个大钢铁基地来了解我国钢铁生产的基本情况,这种调查属于( )。

①重点调查 ②典型调查 ③抽样调查

16

④非全面调查 ⑤普查

35.据中央人民广播电台《午间半小时》节目报道,北京某记者为了掌握市场上假酒流通情况,采用了以下的调查方式:首先将名酒销售量非常大的星级饭店作为调查对象;其次从这些饭店中选出了一部分饭店进行了实地调查;当在一家饭店发现某种品牌的假酒情况特别严重后,该记者对这种假酒从生产到流通的来龙去脉进行了深入的调查。请指出该记者在这次调查中都采用了哪些调查方法( )。

①普查 ②非概率抽样 ③重点调查 ④典型调查 ⑤统计报表调查

(三)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”)

1.统计调查的任务是搜集总体的原始资料。 ( ) 2.统计调查方案的首要问题是确定调查任务与目的,其核心是调查表。 ( )

3.在统计调查方案中,调查时间是指调查资料所属的时间,调查期限是指调查工作的期限。 ( )

4.调查单位是调查项目的承担者。 ( )

5.确定调查对象和调查单位,是为了回答向谁调查,由谁来具体提供统计资料的问题。 ( )

6.统计调查中,调查单位和填报单位在任何情况下都不可能一致。 ( )

7.普查可以得到全面、详细的资料,但需花费大量的人力、物力和财力及时间。因此,在统计调查中不宜频繁组织普查。 ( ) 8.普查是专门组织的一次性全面调查,所以其调查结果不可能存在误差。( )

9.在工业企业生产设备状况的普查中,调查单位是工业企业的每台生产设备,报告单位是每个工业企业。 ( )

10.我国第五次人口普查规定以2000年11月1日零时为标准时点,是为了保证登记工作在同一时刻进行。 ( )

11.抽样调查不可避免地会产生代表性误差,还有可能产生登记性误差,所以它的误差要比全面调查的误差大。 ( )

12.重点调查的结果,不仅可以反映总体的基本情况,而且还能用于说明总体的全貌。 ( )

13.重点调查的重点单位是这些单位在全部总体中虽然数目不多,但就调查的标志值来说却在总量中占很大的比重。 ( )

14.能够对统计总体进行分组,是由统计总体中的各个单位所具有的“同质性”特点决定的。 ( )

15.按数量标志分组,各组的变量值能准确地反映客观现象性质上的区别。

17

( )

16.统计分组的关键问题是确定分组标志和划分各组界限。 ( ) 17.按品质标志分组的结果形成变量数列。 ( )

18.离散型变量可以做单项式或组距式分组,而连续型变量只能做组距式分组,组限表示方法只能是重叠的。 ( )

19.异距分组中,为消除组距不等对次数实际分布的影响,一般需计算次数密度。

( )

20.进行组距分组时,当标志值刚好等于相邻两组上下限数值时,一般把此值归并列为下限的那一组。 ( ) 21.组中值的假定性是指假定各单位标志值在本组范围内均匀分布。 ( ) 22.组中值可以近似地表示各组变量值的平均水平。 ( ) 23.登记性误差,在全面调查和非全面调查中都会产生。 ( ) 24.由于离散型变量不能用小数表示,因此只能以单项数列来表现资料。 ( )

25.按一个标志分组的就是简单分组,按两个或两个以上标志分组的就是复合分组。

( )

(四)填空题

1.按调查对象包括的范围不同,统计调查可分为 和 ;按组织方式不同,

可分为 和 ;按登记时间的连续性划分,可分为 和 ;按搜集资料的方法不同,可分为 、 、 和 。

2.统计分组是根据统计研究需要,将统计总体按照 区分若干个组成部分的一种 。

3.统计分组的关键在于 和 。 4.变量数列是由 和 两部分构成的。

5.一个完整的统计调查方案,应包括的主要内容有

、 、 、 和 。

6.按品质标志分组形成的次数分布数列叫 分布数列;按数量标志分组形成的分布数列叫 数列。

7.统计表从形式上看由 、 、 和 等四部分组成。 8.对同一总体选择二个或二个以上的标志分别进行 分组,就形成平行分组体系。 9.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为 和 。

10.对连续大量生产的某种小件产品进行质量检验,最合适的调查方式方法

18

是 。

(五)简答题

1.完整的统计调查方案包括哪些内容?

2.重点调查、典型调查、抽样调查有什么相同点和不同点? 3.为什么说抽样调查是所有非全面调查中最科学的调查方式? 4.统计分组的作用是什么?如何选择分组标志?

(六)计算应用题

1.某班40名学生统计学考试成绩分别为: 66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81

学校规定:60分以下为不及格,60—70为及格,70—80分为中,80—90分为良,90—100分为优。

要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表; (2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况。 2.某企业某班组工人日产量资料如下:

日产量分组(件) 50-60 60-70 70-80 80-90 90-100 合计 工人数(人) 6 12 18 10 7 53 根据上表指出:(1)该数列属于哪种类型的变量数列? (2)上表中的变量、变量值、上限、下限、次数; (3)计算组距、组中值、频率。

3.某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35

要求:根据数据分组,编制频数分布表,并绘制直方图和折线图。

19

第三章 数据分布特征的统计描述

练习题:

(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)

1.平均指标反映了( )。

①总体变量值分布的集中趋势 ②总体分布的离散特征 ③总体单位的集中趋势 ④总体变动趋势 2.加权算术平均数的大小( )。

①受各组标志值的影响最大 ②受各组次数的影响最大

③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响

3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。 ①接近于变量值大的一方 ②接近于变量值小的一方 ③不受权数的影响 ④无法判断 4.权数对于平均数的影响作用取决于( )。

①总体单位总量 ②各组的次数多少

③各组标志值的大小 ④各组次数在总体单位总量中的比重

5.由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( )。

①各组的次数必须相等 ②各组标志值必须相等 ③各组标志值在本组内呈均匀分布 ④各组必须是封闭组

6.如果次数分布中,各个标志值扩大为原来的2倍,各组次数都减小为原来的1/2,则算术平均数( )。 ①增加到原来的③减少到原来的

1 ②稳定不变 212 ④扩大为原来的2倍

7.已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销 售额基本相同的情况下,计算平均价格可采取的平均数形式是( )。 ①简单算术平均数 ②加权算术平均数 ③简单调和平均数 ④加权调和平均数

8.凡是变量值的连乘积等于总比率或总速度的现象,要计算其平均比率或平均速度都可以采用( )。

①算术平均法 ②调和平均法

20

③几何平均法 ④中位数法

9.某公司下属5个企业,共有2000名工人。已知每个企业某月产值计划完成百分比和实际产值,要计算该公司月平均产值计划完成程度,应采用加权调和平均数的方法计算,其权数是( )。

①计划产值 ②实际产值 ③工人数 ④企业数

10.某机械局所属的3个企业2009年完成的实际产值分别为400万元,600万元,500万元。执行结果,计划完成程度分别为108%,106%,108%,则该局三个企业平均计划完成程度为( )。

①3108%?106%?108%=107.33%

400600500108%?400+106%?600+108?500++④108%106%108%=107.2%400+600+500

11.四分位差排除了数列两端各( )单位标志值的影响。

106%+108%+108%=107.33%

3400+600+500③=107.19% ②

①10% ②15% ③25% ④ 35% 12.如果一组变量值中有一项为零,则不能计算( )。 ①算术平均数 ②调和平均数 ③众数 ④中位数

13.在掌握了各组单位成本和各组产量资料时,计算平均单位成本所使用的方法应是( )。 ①算术平均数 ②调和平均数 ③几何平均数 ④中位数 14.各变量值与算术平均数离差平方的和为( )。 ①0 ②1 ③最小 ④最大 15.出现次数最多的那个标志值是( )。

①众数 ②中位数 ③算术平均数 ④几何平均数 16.各总体单位的标志值都不相同时( )。

①众数不存在 ②众数就是最小的变量值 ③众数是最大的变量值 ④众数是出现次数最多的变量值 17.由组距数列确定众数时,如果众数组的相邻两组的次数相等,则( )。 ①众数在众数组内靠近上限 ②众数在众数组内靠近下限 ③众数组的组中值就是众数 ④众数为零 18.当各个变量值的频数相等时,该变量的( )。 ①众数不存在 ②众数等于均值

21

③众数等于中位数 ④众数等于最大的变量值

19.如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?( ) ①算术平均数 ②几何平均数 ③中位数 ④众数 20.一组数据排序后处于25%和75%位置上的值称为( )。 ①众数 ②中位数 ③四分位数 ④均值 21.四分位数实际上是一种( )。

①算术平均数 ②几何平均数 ③位置平均数 ④数值平均数

22.当数据组高度偏态时,哪一种平均数更具有代表性? ( ) ①算术平均数 ②中位数 ③众数 ④几何平均数

23.假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用( )。

①算术平均数 ②几何平均数 ③众数 ④调和平均数

24.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用( )。

①众数 ②中位数 ③四分位数 ④算术平均数 25.在标准正态分布条件下,有( )。

①?=Me=Mo ②Mo>Me>? ③Me>?>Mo ④?>Me>Mo 26.若某总体次数分布呈轻微左偏分布,则有( )成立。 ①?> Me>Mo ②?Mo>Me ④?

27.已知某企业职工消费支出,年支出6000元人数最多,平均年支出为 5500元,该企业职工消费支出分布属于( )。 ①左偏分布 ②右偏分布 ③对称分布 ④J形分布 28.下列变异指标中,消除了量纲影响的是( )。

①全距 ②平均差 ③标准差 ④离散系数

22

29.标准差系数抽象了( )。

①总体指标数值大小的影响 ②总体次数多少的影响

③标志变异程度的影响 ④平均水平高低对离散分析的影响 30.下列标志变异指标中,最易受极端值影响的是( )。 ①全距 ②平均差 ③标准差 ④离散系数

31.可直接用标准差评价两数列差异程度大小的条件是:两数列的平均数( )。 ①相差较大 ②相差较小 ③不等 ④相等

32.若两组数列的计量单位不同,在比较两数列的离散程度大小时,应采用( )。 ①全距 ②平均差 ③标准差 ④标准差系数

33.甲班学生平均成绩80分,标准差8.8分,乙班学生平均成绩70分,标准差8.4分,因此( )。

①甲班学生平均成绩代表性好一些 ②乙班学生平均成绩代表性好一些

③无法比较哪个班学生平均成绩代表性好 ④两个班学生平均成绩代表性一样

34.两个总体的平均数不等,但标准差相等,则( )。 ①平均数小,代表性大 ②平均数大,代表性大 ③两个平均数代表性相同 ④不能判断哪个平均数代表性大

35.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成数方差为( )。 ①25% ②30% ③40% ④50% 36.是非标志的成数方差最大值为( )

①1 ②0.5 ③0.25 ④0 37.下列分布中,集中度最大的是( )。

① ② ③ ④ 38.下列分布中,离中度最大的是( )。

23

① ② ③ ④

39.峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值( )。

①等于0 ②大于0 ③小于0 ④等于1

40.某企业有甲、乙两个生产车间,已知2008年甲、乙两车间工人的月平均工资分别为1820元和1900元,又知2009年甲车间工人数占全厂工人总数比重上升,乙车间的下降。若2009年两车间工人工资水平不变,则全厂工人平均工资将( )。 ①提高 ②下降 ③不变 ④升降不定

(二)多项选择题(在下列备选答案中,有二至五个正确答案,请将其全部选出并把顺序号填入括号内)

1.计算和应用平均数的原则是( )。

①现象的同质性 ②用组平均数补充说明总平均数

③用变量数列补充说明平均数 ④用时间变量数列补充说明平均数 ⑤把平均数和典型事例结合起来 2.平均数的作用是( )。 ①反映总体的一般水平

②对不同时间、不同地点、不同部门的同质总体平均数进行对比 ③测定总体各单位的离散程度

④测定总体各单位分布的集中趋势 ⑤反映总体的规模 3.下面关于权数的描述,正确的是( )。 ①权数衡量相应的变量对总平均数作用的强度 ②权数起作用在于次数占总次数的比重大小 ③权数起作用在于次数本身绝对值大小

④权数起作用的前提之一是各组的变量值必须互有差异 ⑤权数起作用的前提之一是各组的频率必须有差别 4.加权算术平均数的大小受哪些因素的影响( )。 ①受各组频数或频率的影响 ②受各组标志值大小的影响 ③受各组标志值和权数的共同影响 ④只受各组标志值大小的影响 ⑤只受权数大小的影响

24

5.在什么条件下,加权算术平均数等于简单算术平均数( )。 ①各组变量值不相同的条件下 ②各组次数相等的条件下 ③各组权数都为1的条件下 ④在分组组数较少的条件下 ⑤各组次数不相等的条件下

6.几何平均数主要适用于( )。 ①标志值的代数和等于标志值总量的情况 ②标志值的连乘积等于总比率的情况 ③标志值的连乘积等于总速度的情况

④具有等比关系的变量数列 ⑤求平均比率时 7.中位数是( )。

①由标志值在变量数列中所处的位置决定的

②根据标志值出现的次数决定的 ③总体单位水平的平均值 ④总体一般水平的代表值 ⑤不受总体中极端数值的影响 8.众数是( )。

①位置平均数 ②总体中出现次数最多的标志值 ③不受极端值的影响

④适用于总体单位数多,有明显集中趋势的情况 ⑤处于变量数列中点位置的那个标志值

9.在各种平均数中,不受极端值影响的平均数是( )。 ①算术平均数 ②调和平均数 ③中位数 ④几何平均数 ⑤众数

10.若一组数据的众数大于其算术平均数,则可以认为( )。 ①该组数据呈左偏分布 ②该组数据呈右偏分布 ③数据中存在极大值 ④数据中存在极小值 ⑤该组数据分布的偏度系数大于0

11.下列指标中,反映数据组中所有数值变异大小的指标有( )。 ①四分位差 ②平均差 ③标准差 ④极差 ⑤离散系数 12.关于极差,下列说法正确的有( )。

①只能说明变量值变异的范围 ②不反映所有变量值差异的大小 ③反映数据的分配状况 ④最大的缺点是受极端值的影响

25

⑤最大的优点是不受极端值的影响

13.有些离中趋势指标是用有名数表示的,它们是( )。 ①极差 ②平均差 ③标准差 ④平均差系数 ⑤四分位差

14.不同总体间的标准差不能简单进行对比,是因为( )。 ①平均数不一致 ②标准差不一致 ③计量单位不一致 ④总体单位数不一致 ⑤与平均数的离差之和不一致

15.不同数据组间各标志值的差异程度可以通过标准差系数进行比较,因为标准差系数( )。

①消除了不同数据组各标志值的计量单位的影响 ②消除了不同数列平均水平高低的影响 ③消除了各标志值差异的影响

④数值的大小与数列的差异水平无关 ⑤数值的大小与数列的平均数大小无关

16.若一组数据的偏度系数是-0.25,则下列说法正确的有( )。 ①平均数、中位数与众数是分离的 ②众数在左边、平均数在右边

③数据的极端值在右边,数据分配曲线向右延伸 ④众数在右边、平均数在左边

⑤数据的极端值在左边、数据分配曲线向左延伸 17.关于峰度系数,下列说法正确的有( )。 ①当β=3时,次数分配曲线为正态曲线 ②当β<3时,为平顶曲线

③当β接近于1.8时,次数分配趋向一条水平线 ④当β小于1.8时,次数分配曲线是“U”形分配 ⑤β的数值越大于3,则次数分配曲线的顶端越尖峭。

18.某公司下属5个企业,共有2000名职工,已知每个企业某月的产值计划完成百分比及其实际产值,要计算公司平均产值计划完成程度,则( )。 ①应采用算术平均数 ②应采用调和平均数 ③实际产值是权数 ④工人数是权数

26

⑤企业数是权数

(三)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”)

1.权数对算术平均数的影响作用取决于权数本身绝对值的大小。 ( ) 2.算术平均数的大小,只受总体各单位标志值大小的影响。 ( ) 3.在特定条件下,加权算术平均数可以等于简单算术平均数。 ( )

4.在资料已分组形成变量数列的条件下,计算算术平均数或调和平均数时,应采用简单式;反之,采用加权式。 ( )

5.未知计算平均数的基本公式中的分子资料时,应采用加权算术平均数方法计算。

( )

6.根据组距式数列计算得到的算术平均数只能是一个近似值。 ( )

7.当各标志值的连乘积等于总比率或总速度时,宜采用几何平均法计算平均数。

( )

8.当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,应采用倒数平均数来计算平均比率。 ( )

9.中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响。 ( )

10.分位数都属于数值平均数。 ( ) 11.众数是总体中出现最多的次数。 ( ) 12.如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在。

( )

13.投资者连续三年股票投资收益率为4%、2%和5%,则该投资者三年内平均收益率为3.66%。 ( ) 14.总体中各标志值之间的差异程度越大,标准差系数就越小。 ( ) 15.在一个总体中,算术平均数、中位数和众数始终是相等的。 ( )

16.若已知甲数列的标准差小于乙数列,则可断言:甲数列算术平均数的代表性好于乙数列。 ( )

17.变量数列的分布呈右偏分布时,算术平均数的值最小。 ( ) 18.是非标志的标准差是总体中两个成数的几何平均数。 ( )

19.若A、B、C三个公司的利润计划完成程度分别为95%、100%和105%,则这三个公司平均的利润计划完成程度应为100%。 ( )

20.在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全

27

部的离差之和一定等于0。 ( )

(四)填空题

1.平均指标就是在 内,将各单位 ,用以反映总体在一定时间、地点条件下的一般水平。

2.统计中的变量数列是以 为中心而上下波动,所以平均数反映了总体分布的 。

3.根据组距数列计算算术平均数时,假定各组内的标志值是 分布的,并以 代表变量值计算平均数。

4.利用组中值计算算术平均数是假定各组内的标志值 分布,计算结果只是一个 值。

5.加权术平均数受两个因素的影响,一个是 ,一个是 。 6.权数对算术平均数的影响作用,不决定于权数 的大小,而决定于 的比重大小。

7.权数在算术平均数的计算方法中有两种表现形式,即 和 ,其中 是权数的实质。

8.在计算加权算术平均数时,必须慎重选择权数,务必使各组的 和 的乘积等于各组的 。

9.加权算术平均数的大小接近于 的这一组的标志值。

10.几何平均数又称 ,当各项变量值的连乘积等于 或 时,都可以适用几何平均数计算平均比率或平均速度。

11.算术平均数、调和平均数、几何平均数又称为 平均数;众数、中位数又算称为 __ 平均数。其中 平均数不受极端数值的影响。 12.某日某农贸市场最普遍的成交价格,这在统计上称做 。

13.由组距数列求众数时,如众数组相邻两组的次数相同,则 即为众数。

14.某总体呈轻微偏态分布,已知其算术平均数等于94,中位数等于96,则众数等于 ,该总体为 分布。

15.平均指标说明变量数列中变量值的 ,而标志变异指标则说明变量的 。

16.标志变异指标的大小与平均数代表性的大小成 关系。 17.是非标志的平均数为 ,标准差为 。

28

18.某种产品的合格率为95%,废品率为5%,则该种产品的平均合格率为 ,其标准差是 。

19.某企业职工按工资额分组,最高组为140-150元,最低组为50-60元,其全距为 。

20.变异指标是衡量 的尺度,它与 成 关系。

21.已知平均数?=120元,标准差系数V=30%,则标准差?= 。 22.全距是标志值的 与 之差。在组距分组资料中,可以用 和 之差来近似地表示全距。

23.标准差系数是 与 之比,其计算公式 。 24.现象的 是计算或应用平均数的原则。 25.成数方差的最大值,是当P值趋近于 。

(五)简答题

1.对统计数据的分布特征,主要从哪几个方面进行描述? 2.平均指标的计算原则是什么?有何作用? 3.简述变异指标的概念和作用。(*) 4.为什么要研究标志变异指标?

5.什么是标志变动度?测定它的方法有几种?

(六)计算应用题

1.某研究所职工月工资资料如下:

按月工资分组(元) 6000—7000 7000—8000 8000—9000 9000以上 职工人数(人) 20 45 35 10 试用次数权数和比重权数分别计算该所职工的平均工资。 2.某企业工人按日产量分组如下:

单位:件 工人数(人) 工人按日产量分组 七月份 20以下 20—30 30—40

八月份 18 30 72 30 78 108 29

40—50 50—60 60以上 合计 90 42 12 360 120 90 30 3600 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。

3.以下数据给出的是道森供应公司和J.C克拉克批发公司两家公司交付定货天数的数据。 道森供应公司交货天数:

11 10 9 10 11 11 10 11 10 10 克拉克批发公司交货天数:

8 10 13 7 10 11 10 7 15 12

哪一家供应公司交货时间更稳定、更可靠。用数据支持你的结论。

4.某职员每天可以有两种方法去上班:公共交通和小汽车。每种方法所需要的样本时间记录如下(单位:分钟) 公共交通:

28 29 32 37 33 25 29 32 41 34 小汽车:

29 31 33 32 34 30 31 32 35 33 应该选用那一种方法更合适?请解释。 5.设甲、乙两单位职工的工资资料如下:

甲单位 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 2 4 10 7 6 4 30 乙单位 月工资(元) 600以下 600-700 700-800 800-900 900-1000 1000-1100 合计 职工人数(人) 1 2 4 12 6 5 30 比较哪个单位的职工工资差异程度小。

6.2009年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:

甲市场成交额 品种 价格(元/斤) (万元) (万斤) 乙市场成交量 30

甲 乙 丙 合计 1.2 1.4 1.5 — 1.2 2.8 1.5 5.5 2 1 1 4 哪一个市场农产品的平均价格高?并说明原因。

7.某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计算三道生产工序的平均合格率。 8.已知某企业有如下资料:

按计划完成百分比分组(%) 80—90 90—100 100—110 110—120 计算该企业平均计划完成程度。

9.(选做题)某高校某系学生的体重资料如下:

按体重分组(公斤) 52以下 52—55 55—58 58—61 61以上 合计 学生人数(人) 28 39 68 53 24 212 实际产值(万元) 986 1057 1860 1846 根据所给资料计算学生体重的算术平均数、中位数、众数。

10.已知某公司职工的月工资收入为965元的人数最多,其中,位于全公司职工月工资收入中间位置职工的月工资收入为932元,试根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入变量数列属于何种偏态?

11.某地区居民某年医疗费支出的众数为300元,算术平均数为250元。

要求:

(1)计算中位数近似值;

(2)说明该地居民医疗费支出额分布的态势;

(3)若该地区居民医疗费支出额小于400元的占人数的一半,众数仍为300元,试估计算术平均数,并说明其分布态势。

12.对成年组和幼儿组共500人身高资料分组,分组资料列表如下:

成年组 幼儿组 31

按身高分组(cm) 150—155 155—160 160—165 165—170 170以上 合计 要求:

人数(人) 30 120 90 40 20 300 按身高分组(cm) 70—75 75—80 80—85 85—90 90以上 合计 人数(人) 20 80 40 30 30 200 (1)分别计算成年组和幼儿组身高的平均数、标准差和标准差系数。 (2)说明成年组和幼儿组平均身高的代表性哪个大?为什么?

13.对某车间甲、乙两工人当日产品中各取10件产品进行质量检查,得如下资料:

按零件的长度分组(mm) 9.6以下 9.6—9.8 9.8—10.0 10.0—10.2 10.2—10.4 合计 甲工人零件(件) 1 2 3 3 1 10 已知经过计算乙工人生产零件的平均长度为9.96mm,标准差为0.254mm。试比较甲、乙两工人谁生产的零件质量较稳定。

14.两种水稻分别在五块田地上试种,其产量如表:

甲品种 地块标号 地块面积(亩) 1 2 3 4 5 合计 1.2 1.1 1.0 0.9 0.8 5.0 产量(斤) 1200 1045 1100 810 840 4995 地块面积(亩) 1.5 1.3 1.3 1.0 0.9 6.0 产量(斤) 1680 1300 1170 1208 630 5988 乙品种 假定各地块两个品种的生产条件相同,试计算这两个品种的平均收获率,进而确定哪一品种具有较大的稳定性和推广价值。

15.一批苹果自山东某地运往上海口岸,随机抽出200箱检验,其中有4箱不符合质量要求,试问是非标志的平均数和标准差各是多少?

16.某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表。

32

使用时间 (小时) 900以下 900—950 950—1000 1000—1050 抽样检查电灯泡数(个) 2 4 11 71 使用时间 (小时) 1050—1100 1100—1150 1150—1200 1200以上 合计 抽样检查电灯泡数(个) 84 18 7 3 200 按照质量规定,电灯泡使用寿命在1000小时以上者为合格品,试计算平均合格率、标准差及标准差系数。

17.某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。

18.某市场上某种蔬菜早市每斤0.25元,中午每斤0.2元,晚市每斤0.1元,现在早、中、晚各买一元,求平均价格。

19.某地区20个商店某年第四季度资料: 商品销售计划完成程度分组(%) 80—90 90—100 100—110 110—120 3 4 8 5 商店数目 实际商品销售额 (万元) 45.9 68.4 34.4 94.3 流通费用率 (%) 14.8 13.2 12.0 11.0 试计算该地区20个商店平均完成销售计划指标以及总的流通费用率(提示:流通费用率=流通费用额/实际销售额)。

20.(选做题)早在1988年末美国人口统计的报告指出有2500万美国人早晨起床后在他们的家里办公。个人计算机的不断普及是越来越多的人在家里工作的重要原因之一。文章公布了当时在家里上班的人士有关年龄方面的资料。下面是这些人年龄资料的一个样本:

22 58 24 50 29 52 57 31 30 41 44 40 46 29 31 37 32 44 49 29 (1)计算样本的平均数和众数;

(2)所有成年人总体的年龄中位数是40.5岁。问:根据上面样本的中位数来判断家里工作的人比所有成年人总体年轻还是年长?

(3)计算第一个和第三个四分位数。

21.(选做题) 某银行3月份为100家企业贷款情况资料,见下表:

贷款额(万元)

33

贷款企业数(个)

0—10 10—20 20—30 30—40 40—50 合计 20 10 22 34 14 100 计算平均每家企业的贷款额、贷款额众数;贷款额中位数;并判断数据分布的形态。 22.(选做题)公路损失数据协会《伤害和碰撞数据记录》根据某一年存入档案的保险索赔数,对汽车型号进行了等级排序,指数等级平均为100。低等级说明该型号的汽车更安全、更好。下面是20种中型卡车和20种小型卡车的等级数据: 中型卡车等级数据:

81 91 93 127 68 81 60 51 58 75

小型卡车的等级数据:

73 100 127 100 124 103 119 108 109 113 108 118 103 120 102 122 96 133 80 140 100 103 119 82 128 76 68 81 91 82 (1)分别计算中型卡车、小型卡车的最小值、最大值、第一四分位数、第二四分位数和第三四分位数;

(2)画出箱线图;

(3)根据汇总资料,比较说明中型卡车和小型卡车的安全性能。

第四章 参数估计

(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)

1.在抽样推断中,必须遵循( )抽取样本。

34

①随意原则 ②随机原则 ③可比原则 ④对等原则 2.抽样调查的主要目的在于( )。

①计算和控制抽样误差 ②了解全及总体单位的情况 ③用样本来推断总体 ④对调查单位作深入的研究 3.抽样误差是指( )。

①计算过程中产生的误差 ②调查中产生的登记性误差 ③调查中产生的系统性误差 ④随机性的代表性误差 4.在抽样调查中( )。

①既有登记误差,也有代表性误差 ②既无登记误差,也无代表性误差 ③只有登记误差,没有代表性误差 ④没有登记误差,只有代表性误差 5.在抽样调查中,无法避免的误差是( )。

①登记误差 ②系统性误差 ③计算误差 ④抽样误差 6.能够事先加以计算和控制的误差是( )。

①抽样误差 ②登记误差 ③系统性误差 ④测量误差 7.抽样平均误差反映了样本指标与总体指标之间的( )。 ①可能误差范围 ②平均误差程度 ③实际误差 ④实际误差的绝对值 8.抽样平均误差的实质是( )。

①总体标准差 ②全部样本指标的平均差 ③全部样本指标的标准差 ④全部样本指标的标志变异系数 9.在同等条件下,重复抽样与不重复抽样相比较,其抽样平均误差( )。 ①前者小于后者 ②前者大于后者 ③两者相等 ④无法确定哪一个大 10.在其他条件保持不变的情况下,抽样平均误差( )。 ①随着抽样数目的增加而加大 ②随着抽样数目的增加而减小 ③随着抽样数目的减少而减小 ④不会随抽样数目的改变而变动 11.允许误差反映了样本指标与总体指标之间的( )。 ①抽样误差的平均数 ②抽样误差的标准差 ③抽样误差的可靠程度 ④抽样误差的可能范围 12.极限误差与抽样平均误差数值之间的关系为( )。

35

①前者一定小于后者 ②前者一定大于后者 ③前者一定等于后者

④前者既可以大于后者,也可以小于后者 13.所谓小样本一般是指样本单位数( )。

①30个以下 ②30个以上 ③100个以下 ④100个以上 14.样本指标和总体指标( )。 ①前者是个确定值,后者是个随机变量 ②前者是个随机变量,后者是个确定值

③两者均是确定值 ④两者均是随机变量 15.在区间估计中,有三个基本要素,它们是( )。 ①概率度,抽样平均误差、抽样数目 ②概率度、点估计值、误差范围 ③点估计值、抽样平均误差、概率度 ④误差范围、抽样平均误差、总体单位数 16.区间估计表明的是一个( )。

①绝对可靠的范围 ②可能的范围 ③绝对不可靠的范围 ④不可能的范围 17.置信区间的大小表达了区间估计的( )。

①可靠性 ②准确性 ③显著性 ④及时性 18.抽样推断中的概率保证程度表达了区间估计的( )。 ①显著性 ②准确性 ③可靠性 ④规律性

19.用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的( )。

①2倍 ②3倍 ③4倍 ④5倍

20.假定10亿人口大国和100万人口小国的居民年龄的变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄的抽样平均误( )。 ①两者相等 ②前者比后者大 ③前者比后者小 ④不能确定

21.对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度

36

为95.45%,则优等生比重的抽样极限误差为( )。 ①4% ②4.13% ③9.18% ④8.26%

22.对某单位职工的文化程度进行抽样调查,得知其中80%的人是高中毕业,抽样平均误差为2%。当概率为95.45%时,该单位职工中具有高中文化程度的比重( )。 ①等于78% ②大于84% ③在76%与84%之间 ④小于76%

23.对进口的一批服装取25件作抽样检验,发现有一件不合格。概率为0.9545时计算服装不合格率的抽样误差为7.3%。要使抽样误差减少一半,必须抽( )件服装做检验。 ①50 ②100 ③625 ④25

24.一般情况下,总体平均数的无偏、有效、一致的估计量是( )。 ①样本算术平均数 ②样本中位数 ③样本众数 ④不存在

25.对标志变异程度较大的总体进行抽样调查时,宜采用( )。 ①纯随机抽样 ②等距抽样 ③类型抽样 ④整群抽样

26.某企业连续性生产,为检查产品质量,在24小时中每隔30分钟抽出一分钟的产品进行全部检查,这种抽查方式是( )。

①整群抽样 ②简单随机抽样 ③类型抽样 ④等距抽样

27.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做( )。

①分层抽样 ②简单随机抽样 ③等距抽样 ④整群抽样

28.按地理区域划片所进行的区域抽样,其抽样方法属于( )。 ①简单随机抽样 ②等距抽样 ③类型抽样 ④整群抽样 29.参数估计的置信度为1-α的置信区间表示( )。 ①以1-α的可能性包含了未知总体参数真值的区间 ②以α的可能性包含了未知总体参数真值的区间

③总体参数取值的变动范围 ④抽样误差的最大可能范围 30.在抽样设计中,最好的方案是( )。

37

①抽样误差最小的方案 ②调查单位最少的方案 ③调查费用最省的方案 ④在一定误差要求下费用最少的方案

(二)多项选择题(在下列备选答案中,有二至五个正确答案,请将其全部选出并把顺序号填入括号内)

1.抽样调查的特点是( )。

①按随意原则抽取样本 ②按随机原则抽取样本 ③由部分推断总体 ④可以事先计算并控制抽样误差 ⑤缺乏科学性和可靠性 2.点估计( )。

①考虑了抽样误差大小 ②没有考虑抽样误差大小 ③能说明估计结果的把握程度 ④是抽样估计的主要方法 ⑤不能说明估计结果的把握程度

3.对某大学学生进行消费支出调查,采用抽样的方法获取资料。按组织方式不同,常见的抽样方法有( )。

①纯随机抽样 ②等距抽样 ③类型抽样 ④整群抽样 ⑤不重复抽样和重复抽样

4.假设从6个人的总体中随机抽取2个人进行调查,可能有15个样本组合,所以说( )。

①样本指标是随机变量 ②总体指标是随机变量 ③样本指标是唯一确定的 ④总体指标是唯一确定的 ⑤样本指标是样本变量的函数

5.抽样调查中的抽样误差是( )。

①不可避免的 ②是可以通过改进调查方法来消除的 ③可以事先计算并加以控制的 ④抽样估计值与总体参数值之差 ⑤受总体标志变动程度的影响的 6.抽样平均误差是( )。  ①反映样本指标与总体指标的平均误差程度

②样本指标的标准差 ③样本指标的平均差  ④计算抽样极限误差的衡量尺度 ⑤样本指标的平均数 7.影响抽样误差的主要因素有( )。

38

①抽样数目的多少 ②总体标志变异程度的大小 ③不同的组织方式 ④抽样周期的长短 ⑤不同抽样方法

8.要提高抽样推断的精确度,可采用的方法有( )。 ①增加样本数目 ②减少样本数目 ③缩小总体被研究标志的变异程度

④改善抽样的组织方式 ⑤改善抽样的方法 9.要增大抽样推断的可信程度,可采用的方法有( )。 ①增加抽样数目 ②增大显著性水平? ③增大抽样误差范围 ④缩小抽样误差范围 ⑤减小显著性水平?

10.影响样本容量大小的因素有( )。 ①总体被研究标志值的变异程度

②抽样的组织方式 ③允许误差的大小 ④抽样估计的可靠程度 ⑤抽取调查单位的方法

11.在简单随机重复抽样条件下,欲使误差范围缩小1/2,其他要求保持不变,则样本容量必须( )。

①增加2倍 ②增加3倍 ③增加到4倍 ④减少2倍 ⑤减少3倍

12.在区间估计中,在其它条件不变的情况下,抽样极限误差的大小和概率的保证程度的关系是( )。

①允许误差范围愈小,概率保证程度愈大 ②允许误差范围愈小,概率保证程度愈小 ③允许误差范围愈大,概率保证程度愈大 ④成正比关系 ⑤成反比关系 13.抽样法的基本特点是( )。 ①根据样本资料对总体的数量特征做出估计 ②深入研究某些复杂的专门问题 ③按随机原则从总体中抽选样本单位

④调查单位少,调查范围小,了解总体基本情况

39

⑤抽样推断的抽样误差可以事先计算并加以控制 14.当抽样的误差范围扩大时( )。 ①抽样推断的把握程度随之提高 ②抽样推断的把握程度随之降低

③抽样推断的精确度提高 ④抽样推断的精确度降低 ⑤抽样推断的把握程度和精确度均保持不变

15.由于以下原因引起的误差中,不属于抽样误差的是( )。 ①被调查者隐瞒了自己的非法收入,将自己的月收人填报为1000元 ②由于调查员的失误,将数字1568填报为1658

③入户调查时被调查者不在家,调查员根据自己的估计将户主的收入填报为1 500元 ④调查者按自己的主观愿望选择样本单位所造成的误差 ⑤以上都不对

16.根据抽样调查,某地区10户居民家庭月消费(元)与月收入的资料,配合了反映家庭消费收入关系的回归方程。当置信度为95%、月收入为1500元时,yo的置信区间为975—1225,这表示( )。

①月收入1500元的10户家庭月消费介于975—1225之间 ②该地区所有家庭月消费在975—1225元之间 ③该地区有95%的家庭月消费在975~1225元之间

④有95%的把握断言该地区月收入为1500元的家庭月消费介于975—1225元之间 ⑤该地区月收入为1500元的家庭月消费不在975-1225元之间的概率为5% 17.评价点估计量优良性的准则有( )。 ①精确性 ②无偏性 ③有效性 ④一致性 ⑤可靠性 18.在一定误差范围的要求下( )。 ①概率度大,要求可靠性低,抽样数目相应要多 ②概率度大,要求可靠性高,抽样数目相应要多 ③概率度小,要求可靠性低,抽样数目相应要少 ④概率度小,要求可靠性高,抽样数目相应要少 ⑤概率度小,要求可靠性低,抽样数目相应要多

(三)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”)

40

1.抽样误差是抽样调查中无法避免的误差。 ( ) 2.抽样误差的产生是由于破坏了随机原则所造成的。 ( ) 3.在其他条件相同的情况下,重复抽样条件下的抽样平均误差总是大于不重复抽样 条件下的抽样平均误差。 ( )

4.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的4倍。 ( ) 5.当总体单位数很大但分布不均匀时,不宜采用抽样调查方法。 ( ) 6.遵循随机原则抽样,可以使样本与总体同分布,进而提高样本的代表性。

( )

7.抽样调查所遵循的基本原则是可靠性原则。 ( ) 8.样本指标是一个客观存在的常数。 ( )

9.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。 ( ) 10.所有可能的样本平均数等于总体平均数。 ( ) 11.抽样极限误差总是大于抽样平均误差。 ( ) 12.抽样调查的着眼点就在于对样本数量特征的认识。 ( )

13.某企业在调查本厂的产品质量时,有意把管理较差的某车间的产品不算在内。这种做法必将导致系统性偏差。 ( )

14.极限误差就是最大的抽样误差,因此,总体指标必然落在样本指标和极限误差共同构成的区间之内。 ( )

15.抽样极限误差反映的是抽样指标与总体指标之间的抽样误差的可能范围,实际上每次抽样极限误差可能大于、小于或等于抽样平均误差。 ( )

16.在总体各单位标志值大小悬殊的情况下,运用类型抽样比简单随机抽样可以得到比较准确的结果。 ( )

17.抽样平均误差同样本单位数的多少成正比,而与总体变异程度的大小无关。

( )

18.抽样推断中不可避免会产生抽样误差,但人们可以通过调整总体方差的大小来控制抽样误差的大小。 ( ) 19.在抽样推断中,样本和总体一样都是确定的、唯一的。 ( )

20.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样的估计精确度。

41

( )

(四)填空题

1.抽样调查是按照 从总体中抽取一部分单位进行观测,并根据这部分单位的资料推断 的一种方法。

2.抽样调查的组织方式主要有 、等距抽样、 和整群抽样等四种。 3.在抽样推断中,按照随机原则从总体中抽取出来的那一部分单位叫做 。 4.简单随机抽样在抽取样本单位时有 和 两种不同的抽样方法。 5.对被研究标志变动较大的总体进行抽样推断时,宜采用 组织方式调查。 6.置信区间的大小表达了区间估计的 。

7.总体指标与抽样指标相比较,前者是一个确定值,后者是 。 8. 是抽样调查中不可避免的误差。

9.抽样推断中的概率保证程度表达了区间估计的 。 10.抽样平均误差是全部样本指标的 。

11.在抽样调查中,使总体的每个单位都有相同的被抽中可能性的原则,称为__________ 。

12.总体指标的区间估计必须具备 、误差范围和 三个基本要素。

13.简单重复抽样情况下,如果其他条件保持不变,仅将误差范围缩小一半,则抽样单位数目必须 ;若将误差范围扩大一倍,则抽样单位数为原来的 。 14. 反映了样本指标与总体指标之间的抽样误差的可能范围。 15. 反映了样本指标与总体指标之间的平均误差程度。 16.参数估计有两种形式:一是 ,二是 。

17.点估计是直接用 估计总体指标的推断方法。点估计不考虑 及 。

18.区间估计是在一定的 下,用以 值为中心的一个区间范围估计总体指标数值的推断方法。

(五)简答题

1.什么是随机性原则?在抽样调查中为什么要坚持随机性原则? 2.什么是抽样推断?抽样推断有哪几个方面的特点? 3.什么是抽样误差?影响抽样误差的因素有哪些?

42

4.抽样估计的优良标准是什么? 5.影响必要样本容量的因素有哪些?

(六)计算应用题

1.某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表。

使用时间 (小时) 900以下 900-950 950-1000 1000-1050 抽样检查电灯泡数(个) 2 4 11 71 使用时间 (小时) 1050-1100 1100-1150 1150-1200 1200以上 合计 抽样检查电灯泡数(个) 84 18 7 3 200 按照质量规定,电灯泡使用寿命在1000小时以上者为合格品,按以上资料计算抽样平均误差。

2.某灯具生产厂家生产一种60W的灯泡,假设其寿命为随机变量X,服从正态分布

N(?,1296)。现在从该厂生产的60W的灯泡中随机地抽取了27个产品进行测试,直到灯

泡烧坏,测得它们的平均寿命为1478小时。请计算该厂60W灯泡的平均寿命的置信水平为95%的置信区间。

3.可口可乐公司生产的雪碧,瓶上标明净容量是500ml,在市场上随机抽取了25瓶,测

得到其平均容量为499.5ml,标准差为2.63ml。试求该公司生产的这种瓶装饮料的平均容量的置信水平为99%的置信区间(假定饮料的容量服从正态分布N(?,?2))。

4.为研究某内陆湖的湖水的含盐量,随机地从该湖的32个取样点采了32个湖水样本,测得它们的含钠量(单位:ppm)分别为:

13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9 20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1 25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4 16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6

假设湖水中钠的含量为随机变量X,服从正态分布N(?,?2),试求湖水钠的平均含量?的95%置信区间。

5.某公司有职工3000人,从中随机抽取100人调查其工资收入情况。调查结果表明,职工的月平均工资为3350元,标准差为403元,月收入在5000元及以上职工8人。试以95.45%的置信水平推断该公司职工月平均工资所在的范围和月收入在5000元及以上职工在全部职工中所占的比重。

43

6.某批发站欲估算零售商贩的平均每次进货额,根据历史资料进货额的标准差为1000元,假定到批发站进货的商贩有2000人,若要求置信水平为99.73%,容许误差不超过250元,应该抽取多大的样本?

7. 某社区想通过抽样调查了解居民参加体育活动的比率,如果把容许误差范围设定在5%,问如果以95%的置信度进行参数估计,需要多大的样本?

第五章 相关与回归分析

练习题:

(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)

1.现象之间相互关系的类型有( )。 

①函数关系和因果关系 ②相关关系和函数关系 ③相关关系和因果关系 ④回归关系和因果关系 2.进行相关分析,要求相关的两个变量( )。  ①都是随机的 ②都不是随机的 ③一个是随机的,一个不是随机的 ④随机或不随机都可以 

3.当价格不变时销售额与销售量之间存在着( )。

①相关关系 ②因果关系 ③函数关系 ④比较关系

4.当自变量按一定数量变化时,因变量也大致按照一个固定的量变化,这时两个变量之间存在着( )。

①线性相关关系 ②曲线相关关系 ③负相关关系 ④正相关关系

5.当变量X值增加时,变量y值随之下降,X和y两个变量之间存在着( )。 ①正相关关系 ②负相关关系 ③曲线相关关系 ④直线相关关系

6.当居民的收入减少时,居民的储蓄存款也会相应减少,二者之间的关系是( )。 ①负相关关系 ②曲线相关关系 ③零相关关系 ④正相关关系 7.Pearson相关系数( )。

①只适用于直线相关 ②只适用于曲线相关

44

③既可用于直线相关,也可用于曲线相关 ④既不适用于直线相关,也不适用于曲线相关 8.线性相关系数反映了( )。 ①两个变量线性关系的密切程度 ②两个变量线性关系的拟合程度 ③两个变量变动的一致性程度 ④自变量变动对因变量变动的解释程度 9.相关系数r的取值范围是( )。

①0?r?1 ②?1?r?1 ③?1?r?0 ④0?r 10.现象之间相互依存关系的程度越低,则相关系数( )。  ①越接近于0 ②越接近于-1 ③越接近于1 ④越接近于0.5

11.当所有观察值都落在回归直线上,则X与y之间的相关系数( )。  ①r=0 ②-1

12.如果变量X和变量y之间的相关系数为-0.85,这说明两变量之间是( )。①高度相关关系 ②完全相关关系 ③低度相关关系 ④完全不相关

13.在回归直线中,若b<0,则X与y之间的相关系数( )。  ①r=0 ②r=1 ③0

①现象之间完全无关 ②相关程度较小 ③现象之间完全相关 ④无直线相关关系

15.已知变量X与y之间的关系,如图所示,下面哪个数字最可能是其相关系数(①-1.01 ②-0.23 ③-0.91 ④-0.32

y

x

45

。 )

16.已知某工厂甲产品产量和生产成本有直接关系,在这条直线上,当产量为500时,其生产成本为10000元,其中不随产量变化的成本为2000元,则成本总额对产量的回归方程是( )。

①y=2000+16X ②y=2000+1.6X ③y=16000+2X ④y=16+2000X

17.在一元线性回归方程y=a+bX中,回归系数b表示( )。

①当X=0时,y的期望值 ②当X变动1个单位时,y的变动总额 ③当y变动1个单位时,X的平均变动额 ④当X变动1个单位时,y的平均变动额

18.产品的产量X(千件)与单位产品成本y (元)之间的回归方程为y=110-6.57X,这意味着产量每提高一个单位(千件),成本平均( )。 ①提高110元 ②降低110元 ③降低6.57元 ④提高6.57元 19.下列直线回归方程中,肯定错误的是( )。  ①yc=2+3X,r=0.88 ②yc=4+5X,r=0.55 ③yc=-10+5X,R=-0.90 ④yc=-100-0.9X,r=-0.83

20.某校经济管理类的学生学习统计学的时间(X)与考试成绩(y)之间建立回归方程yC=a+bX。经计算,方程为yC=20-0.8X,该方程参数的计算( )。  ①a值是明显不对的 ②b值是明显不对的 ③a值和b值都是不对的 ④a值和b值都是正确的

21.已知X与y的相关系数r = 0.87,?y= 41.40,则X与y的线性回归模型的估计标准误差Sxy=( )。

①27.3 ②20.41 ③25.6 ④32.1

22.已知某简单线性回归方程的SSE=16.94,n=20,则估计标准误差Sxy=( )。 ①1.92 ②2.93 ③0.99 ④0.97 23.利用最小二乘法求解回归系数的基本要求是( )。

2①??y?y??=任意值 ②?t?t?=最小值 ?y?y22③??y?y??=最大值 ④?t?t?=0 ?y?y224.当两个相关变量之间只能配合一条回归直线时,那么这两个变量之间的关系( )。

46

①存在明显因果关系  ②不存在明显因果关系而存在相互联系

③存在自身相关关系  ④存在完全相关关系 25.回归方程用于预测时( )。

①适于内插预测 ②适于外推预测 ③不适于外推预测 ④适于内插和外推预测

(二)多项选择题(在下列备选答案中,有二至五个正确答案,请将其全部选出并把顺序号填入括号内)

1.下列现象属于相关关系的是( )。

①家庭收入越多,则消费也增长 ②圆的半径越长,则圆面积也越大 ③一般地说,一个国家文化素质提高,则人口的平均寿命也越长 ④一般地说,施肥量增加,农作物收获率也增加 ⑤体积随温度升高而膨胀,随压力加大而收缩 2.下列现象属于函数关系的是( )。

①圆的半径和圆的周长 ②家庭收入和消费支出 ③产量和总成本 ④价格不变时,销售量和销售额 ⑤身高和体重

3.按照相关性的密切程度,相关关系可以分为( )。 ①正相关 ②完全相关 ③负相关 ④不完全相关 ⑤无相关

4.如果变量X、y之间的相关系数r=-1,表明两个变量之间存在( )。 ①完全负相关关系 ②完全正相关关系

③正相关关系 ④负相关关系 ⑤函数关系 5.简单线性相关分析的特点是( )。

①两个变量是对等关系 ②只能算出一个相关系数 ③相关系数有正负号 ④相关的两个变量必须都是随机的 ⑤相关系数的大小反映两个变量之间相关的密切程度

6.据统计资料证实,银行利率与股票价格指数有依存关系,即随银行利率的上升,股票指数有下降的趋势,但这种变动不是均等的。可见这种关系是( )。 ①函数关系 ②相关关系 ③正相关

47

④负相关 ⑤曲线相关 7.建立回归模型的目的是( )。

①描述变量之间的变动关系 ②用因变量推算自变量 ③用自变量推算因变量 ④自变量和因变量互相推算 ⑤确定两个变量之间的函数关系

8.简单线性相关分析与简单线性回归分析的区别在于( )。

①相关的两个变量都是随机的,而回归分析中自变量是给定的数值,因变量是随机的 ②回归分析中的两个变量都是随机的,而相关中的自变量是给定的数值,因变量是随机的 ③相关系数有正负号,而回归系数只能取正值

④相关的两个变量是对等关系,而回归分析中的两个量不是对等关系

⑤相关分析中根据两个变量只能计算出一个相关系数,而回归分析中根据两个变量可以求出两个回归方程

9.简单线性回归分析中,下面哪几点正确反映了相关系数r和估计标准误差Sxy的关系?( )

①r越大,Sxy越小 ②二者为同向变动关系 ③其他条件不变,r=0时,Sxy取最大值

④r=-1,Sxy= 0 ⑤Sxy与r是反比例关系

10.下列那些统计量可以用来衡量回归模型的拟合优度( )。 ①t?统计量 ②F?统计量

③估计标准误差 ④回归变差 ⑤判定系数 11.估计标准误差是反映( )。

①回归方程代表性的指标 ②自变量离散程度的指标 ③因变量数列离散程度的指标 ④因变量估计值可靠程度的指标 ⑤自变量可靠程度的大小

12.在直线回归方程中( )。  ①在两个变量中须确定自变量和因变量 

②一个回归方程只能作一种推算 ③回归系数只能取正值

④两个变量都是随机变量 ⑤自变量是给定的,因变量是随机的

48

13.确定直线之间方程必须满足的条件是( )。  ①现象之间存在着直接因果关系  ②现象之间存在着较密切的直线相关关系

③相关关系必须等于1  ④两变量必须均属于随机变量 ⑤相关数列的项数必须足够多

(三)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”)

1.两个变量之间为完全相关即两个变量之间为函数关系。 ( ) 2.在相关系数的计算中,如果互换自变量和因变量,计算结果会不同。 ( )

3.X与y的相关系数为0.89,Z与y的相关系数为-0.92,所以X与y的相关程度高。 ( )

4.如果变量X与y间相关系数r= 0,则两个变量之间没有相关关系。 ( ) 5.相关系数r越大,则变量之间的线性相关关系越强。 ( ) 6.简单线性回归中,若回归系数为正数,则相关系数也为正数。 ( )

7.工人的技术水平提高,使得劳动生产率提高。这种关系是一种不完全的正相关关系。 ( )

8.正相关指的就是两个变量之间的变动方向都是上升的。 ( ) 9.负相关指的是两个变量变化趋势相反,一个上升而另一个下降。 ( ) 10.相关系数是测定变量之间相关关系的唯一方法。 ( ) 11.回归分析和相关分析一样,所分析的两个变量都一定是随机变量。 ( )

12.回归分析中,对于没有明显因果关系的两个变量可以求得两个回归方程。

( ) 13.当回归系数大

于零时,两变量之间为正相关,当回归系数小于零时,则变量之间为负相关。 ( )

14.相关的两个变量,只能算出一个相关系数。 ( )

15.计算回归方程时,因变量是随机的,而自变量不是随机的,是给定的数值。

( )

16.我国的GDP与印度的人口之间的相关系数大于0.8,因此两者具有高度正相关关系。 ( )

49

17.设两个变量的一元线性回归方程为

?y??10?0.5?,由此可以判定这两个变量之间存在

着负相关关系。 ( ) 18.函数关系是相关关系的一个特例。 ( )

(四)填空题

1.在相关分析中,要求两个变量都是 。

2.在回归分析中,要求自变量是 ,因变量是 。 3.相关关系按相关方向不同分为 和 。

4.当变量X倚y之间存在负相关关系时,随着变量X值的增加,变量y的值会相应 ;随着X 值的 ,而y 值会相应增加。

5.当两个变量的相关系数为-1时,相关关系是 ,实际是 。 6.经统计,产量X(千件)和单位成本y(元)之间的回归方程:y =120-21X,这意味着

产量为3(千件)时,单位成本为 元,产量每增加1000件时,单位成本下降 元。

7.已知Sxy?5.2,?y?13.2,那么变量X和y的相关系数r = 。 8.若身高与体重的直线相关系数为0.85,则体重与身高的直线相关系数为________。 9.若商品销售额和零售价格的相关系数为-0.96,商品销售额和居民人均收入的相关系数为0.85,据此可以认为,销售额对零售价格具有 相关关系,销售额与人均收入具有 相关关系,且前者的相关程度 后者的相关程度。

10.回归系数b与相关系数r的符号应 ,当b大于0时,表明两变量是 。

(五)简答题

1.相关关系与函数关系的区别和联系是什么? 2.相关分析的主要内容有哪些? 3.在直线回归方程

yc?a?b?中,参数a和b的几何意义和经济意义是什么?

(六)计算应用题

1.为了调查某商品广告投入对销售收入的影响,某企业记录了五个月的销售收入y(万元)和广告费用X(万元),如下: 月份 X 1 12 100 2 23 110 3 16 90 4 32 160 5 43 230 6 34 150 7 56 300 y (1)绘制散点图,编制相关表; (2)判断X与y之间的相关关系的类型;

50