《统计学》习题2 第一章 绪论
一、 单项选择题
1、统计总体的特点是( )
A. 大量性、同质性、差异性 B. 数量性、综合性、具体性 C. 数量性、社会性、工具性 D. 数量性、同质性、差异性
2、某学校的所有学生为一总体时,则学生的平均年龄就是( ) A. 数量标志 B. 质量指标 C. 品质标志 D. 数量指标
3、某商店有职工50人,把他们的工资加起来除以50,就是( ) A. 对50个变量求平均数 B. 对50个变量值求平均数 C. 对50个标志求平均数 D. 对50项指标数值求平均数 4、某学生某门课成绩为75分,则其中的变量为( ) A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 5、连续型变量可以( )
A. 被无限分割,无法一一列举 B. 按一定次序一一列举 C. 不按一定次序一一列举 D. 可以一一列举 6、统计指标( )
A. 都是可量的 B. 不都是可量的
C. 不具有综合特征 D. 具有综合特征,但不可量 7、了解某地区职工情况时,统计指标是( ) A. 该地区某个企业 B. 该地区每个职工
C. 该地区职工工资总额 D. 某企业人数1000人 8、对统计指标来说,( )
A. 其中的数量指标是由数量标志汇总而成 B. 其中的质量指标是由品质标志汇总而成
C. 既有数量标志汇总而成的,也有品质标志汇总而成的 D. 是根据指标汇总而成的
9、某地区全部商品作为总体,每一商店为总体单位,则该地区全部商品零售额是( )
A. 数量指标 B. 品质标志 C. 质量指标 D. 数量标志 10、统计学的研究对象是( ) A. 现象的数量方面 B. 统计学的规律和方法 C. 统计活动的规律和方法 D. 现象的规律和方法
11、统计指标的根本作用是( )
A. 认识作用 B. 管理作用 C. 比较作用 D. 考核作用 12、统计指标体系的整体性是指( )
A. 统计指标体系内各具体指标不可分开使用 B. 统计指标体系内各具体指标分开无意义
C. 统计指标体系的整体功能要大于其所属各指标的具体功能 D. 统计指标体系的整体功能要不小于其所属各指标的简单加总 13、统计指标体系内各指标之间相互关联,因此( ) A. 各指标之间一定存在数量上的平衡关系
B. 各指标之间一定存在数量上的推算关系 C. 各指标之间一定存在数量上的依存关系 D. 各指标一定在逻辑上或数量上相关 14、数量指标是反映( )
A. 总体内部数量关系的统计指标
B. 总体单位内部数量关系的统计指标 C. 总体绝对数量多少的统计指标 D. 总体相对数量多少的统计指标 15、数量指标是用( )表现的 A. 相对数形式 B. 平均数形式
C. 相对数或平均数形式 D. 绝对数形式
16、要了解某班50个学生的学习情况,则总体单位是( ) A. 50个学生 B. 50个学生的学习成绩 C. 每一个学生 D. 每个学生的学习成绩
17、某班三名学生统计学的考试成绩分别是76分、85分和92分,这里的“统计学成绩”是( )
A. 数量指标 B. 质量指标 C. 数量标志 D. 品质标志
18、某生产班组四名工人月工资收入分别是785元、860元、1015元和1200元,这四个数字是( )
A. 变量 B. 变量值 C. 数量标志 D. 数量指标 19、统计学的研究对象是( )
A. 现象 B. 现象的数量方面 C. 统计活动
D. 现象总体的数量方面,从数量上反映现象的规律性 20、统计学的研究对象有如下明显的特点( )
A. 数量性、总体性、社会性 B. 总体性、变异性、具体性 C. 数量性、总体性、变异性 D. 总体性、变异性、广泛性
21、指标与标志的关系是: (甲)数量指标的数值是总体中各单位数量标志值(变量值)汇总而来;(乙)数量指标数值是由数量标志值汇总而来,质量指标的数值由品质标志汇总而来;(丙)随着研究目的的不同,指标可以成为标志,标志也可以成为指标。请指出其中的正确答案( ) A. 甲 B. 乙 C. 甲丙 D. 乙丙 二、多项选择题
1、据对某市工业生产进行调查得到的资料,其中的统计指标是( ) A. 某企业为亏损企业 B. 全市工业产值1. 2亿元 C. 全市机床台数7500台 D. 某企业资金利税率为30% E. 全市工业企业职工人数10万人
2、把某市15个大企业的产值进行平均,这是对( ) A. 15个变量值求平均 B. 15个变量求平均 C. 15个数量标志求平均 D. 15个指标求平均 E. 15个数量标志的具体表现求平均 3、指出下列指标中的质量指标( )
A. 劳动生产率 B. 单位产品工时消耗量 C. 利税额 D. 设备利用率 E. 新产品品种数
4、总体和总体单位的内容不是固定不变的,可以( )
A. 总体可以转化为总体单位 B. 总体单位可以转化为总体 C. 只能是总体转化为总体单位 D. 只能是总体单位转化为总体 E. 总体和总体单位可以相互转化 5、全国人口普查中( )
A. 全国人口数量是总体 B. 每个人是总体单位
C. 全国男性人口数量是指标 D. 人的性别是总体单位的标志 E. 人的年龄是变量
6、“统计”一词的含义有( )
A. 统计活动 B. 统计数据 C. 统计机构 D. 统计学 E. 统计软件
7、统计认识社会的特点是( ) A. 数量性 B. 大量性 C. 总体性 D. 科学性 E. 客观性
8、数量指标反映总体某一特征的( ) A. 规模 B. 工作总量 C. 强度 D. 水平 E. 内涵
9、统计指标按功能不同有( )
A. 数量指标 B. 相对指标 C. 评价指标 D. 描述指标 E. 实物指标
10、统计指标体系按其作用不同可分为( )
A. 宏观指标体系 B. 科学技术指标体系 C. 基本指标体系 D. 国民经济指标体系 E. 专题指标体系 三、填空题
1、统计一词从不同的角度去理解,可以有三种涵义,即____________________、____________________和统计学。
2、统计是认识现象________方面的实质性工作。
3、统计学的研究对象是统计活动的__________和________。
4、凡是________的,在________基础上结合起来的许多个别事物的整体就是总体。
5、构成总体的个别事物称作__________,它是组成总体的__________。 6、总体的基本特征是__________、大量性和__________。
7、变异是__________存在的,这是统计的_________________条件。 8、一个完整的统计工作过程包括统计设计、__________、统计整理和_____________四阶段。
9、指标是说明______________特征的,而标志是说明_______________特征的。 10、指标都是用_________________表示的,它是指标的_________________表现形式。 11、总体的同质性和总体单位的_______________是进行______________的条件。 12、按变量值的连续性分,可把变量分为________________________变量和__________________变量。
13、按变量的性质分有______________变量和________________变量。
14、按总体单位数量是否可以计数(或总体单位数的有限性)进行区分,总体有_______________总体和________________总体。
15、我们研究居民户的生活水平时,全部居民户便构成_____________,而每户
居民则是__________________。
16、工人的年龄、工厂设备价值,属于______________标志,而工人的性别、设备种类属于_________________标志。
17、在全市的工业普查中,机器台数是____________指标,工业总产值发展速度是______________指标,每个工业企业是总体单位,所有工业企业是总体。 18、工厂的设备台数、工厂的人数属于______________变量,而人的身高、体重属于_____________变量。
19、统计指标按其所反映总体现象内容的不同,可分为___________________和_____________________。
20、统计指标按其作用功能不同,可分为描述指标、_____________________和______________________。
21、统计指标体系是________________的指标所构成的____________________。 22、统计指标具有_________________和_________________的特点。
23、总的来说,统计指标体系可分为两大类:___________________________和_________________________。
24、为了了解国有企业职工的年龄构成进行的统计调查,其统计总体是________________,总体单位是________________。
25、标志按其表现形式不同,有_________________标志和_____________标志。 26、变量是指_________________数量标志。
27、统计指标按其反映的时间特点不同有_______________指标和____________指标两类。
28、指标和标志的区别之一就是指标是说明_____________________特征,而标志则是说明_________________特征。
29、统计学是一门_____________、____________和______________统计数据的________________科学,其目的是索数据的__________________。 30、统计学的分科从统计方法的构成来看,可以分为_______________和________________;从统计方法研究和统计方法的应用角度来看,可以分为__________________和_________________ 四、简答题
1. 统计一词有哪几种含义?它们之间构成哪些关系? 2. 怎样理解统计学与统计数据的关系?
3. 怎样理解描述统计学和推断统计学在统计方法探索数量规律性中的地位和作用?
4. 什么是统计学?统计学与数学有何区别与联系? 5. 怎样理解统计学与其他学科的关系? 6. 简述统计的基本任务和作用。 7. 统计研究的基本方法有哪些?
8. 什么是统计总体、总体单位?请举例说明。如何认识总体与总体单位的关系?量
9. 简述统计总体的特点。
10. 什么是统计指标?简述统计指标的特点。 11. 怎样理解指标与标志的关系? 12. 标志有哪几种主要分类?
13. 统计活动过程包括哪几个阶段?
14. 如何理解统计学的性质?
15. 简述统计指标的种类和统计指标体系的种类? 16. 统计指标和指标体系设计的内容有哪些?
第二章 统计数据的搜集与整理 一、单项选择题
1、要对某工厂生产设备状况进行调查,则某工厂“全部生产设备”是( ) A. 调查对象 B. 调查单位 C. 报告单位 D. 调查项目 2、重点调查中的“重点单位”是指( )
A. 这些单位的数量占总体全部单位数的很大比重 B. 这些单位是工作重点
C. 这些单位具有举足轻重的作用
D. 这些单位的标志值在总体标志总量中占有绝大比重
3、对占煤炭开采量75%的大矿井进行劳动生产率调查;统计机关在住有全国城市人口一半以上的各大城市的超市零售价格水平进行系统调查。这些都是( ) A. 全面调查 B. 抽样调查 C. 重点调查 D. 典型调查 4、调查时间是( )
A. 调查工作的期限 B. 调查资料所属的时间 C. 标准时间 D. 调查登记的时间 5、区分全面调查和非全面调查的标志是( ) A. 最后取得的结果是否反映总体特征的全面资料 B. 调查组织方式不同
C. 搜集资料的方法不同 D. 调查对象包括的范围不同
6、我国的人口普查采用的是( )
A. 直接观察法 B. 报告法 C. 通讯法 D. 采访法 7、抽样调查与典型调查的根本区别在于( )
A. 调查的范围不同 B. 选取调查单位的方法不同 C. 组织方式不同 D. 作用不同 8、统计分组的关键问题是( )
A. 确定组距和组数 B. 确定全距和组数
C. 确定分组标志和划分各组界限 D. 确定组距和组中值
9、某企业职工按工资水平分为4组:500元以下;500—600元;600—700元;700元以上。第一组和第四组的组中值分别是( ) A. 450元和750元 B. 500元和700元 C. 400元和800元 D. 500元和750元
10、按连续变量分组,第一组55—65;第二组65—75;第三组75—85;第四组85以上。则数据( )
A. 65在第一组 B. 75在第二组 C. 75在第三组 D. 85在第三组
11、某种产品单位成本计划规定比基期下降了3.5%,实际比基期下降3.5%,单位成本计划完成程度为( )
A. 116.7% B. 100.5% C. 85.7% D. 99.5% 12、区别全面调查和非全面调查的根据是( )
A. 调查单位的多少 B. 调查项目的多少
C. 是否包括所有的调查单位 D. 最后取得的资料是否全面 13、我国统计报表制度中,多数统计报表属于( ) A. 经常性的全面调查 B. 经常性的非全面调查 C. 一次性的全面调查 D. 一次性的非全面调查
14、人口自然变动(出生和死亡)的资料来源于( ) A. 统计报表 B. 普查 C. 重点调查 D. 抽样调查 15、调查时间的含义是( )
A. 调查资料所属时间 B. 调查进行的起止时间 C. 调查时实际登记的时间 D. 进行调查的时间 16、普查的标准时点是( )
A. 调查人员进行登记时的统一时刻 B. 普查登记工作所进行的时间 C. 普查工作的期限
D. 以上三个时间概念都不对
17、区别重点调查与典型调查的主要标志是( ) A. 调查单位的多少 B. 调查项目的多少
C. 调查单位的性质不同 D. 调查的组织形式不同
18、要了解我国工农业产品的比价情况,这种调查最适合采用( ) A. 普查 B. 典型调查 C. 重点调查 D. 抽样调查 19、填报单位是指( ) A. 调查项目的承担者
B. 构成调查对象的具体单位
C. 负责向上级报告调查内容的单位
D. 按照统计报表制度要求填报统计报表的单位
20、在我国,获得预计农产量全面资料最有效、最可行的调查方式是( ) A. 统计报表 B. 重点调查 C. 典型调查 D. 抽样调查 二、多项选择题
1、以下说法正确的是( )
A. 抽样调查是非全面调查,因而也无法最终推算得到总体的全面资料 B. 现行的统计报表制度是采用报告法搜集资料的
C. 重点调查既可以是一次性调查,也可以是经常性调查 D. 典型调查应和其他调查结合起来使用,以避免出现片面性 E. 统计报表的内容包括表式和填表说明两个方面 2、我国进行的五次人口普查属于( ) A. 全面调查 B. 不定期调查 C. 定期调查 D. 经常性调查 E. 一次性调查
3、下列调查中,调查单位与填报单位不一致的有( ) A. 关于全国冶金企业炼钢设备的情况调查 B. 全国工业企业的生产情况调查 C. 城镇家庭生活水平调查 D. 学校教学设备普查
E. 城市食品部门食品质量调查
4、下列指标中,属于强度相对指标的有( )
A. 人均国民收入 B. 人口密度 C. 商品流通费用率 D. 人均粮食产量 E. 人口自然增长率
5、我国第五次人口普查规定的标准时间是2000年11月1日0时,下列哪些人口现象不应计算在人口总数之内( ) A. 2000年11月1日出生的婴儿
B. 2000年10月31日8时出生,20时死亡的婴儿
C. 2000年10月31日21时出生,11月1日8时死亡的婴儿 D. 2000年10月31日3时死亡的人口 E. 2000年11月1日死亡的人口
6、相对指标中,作为对比的分子,分母属于同一时间的有( ) A. 结构相对数 B. 强度相对数 C. 比较相对数 D. 比例相对数 E. 动态相对数 7、比较相对指标可用于( )
A. 不同国家、地区、单位之间的比较 B. 不同时期的比较
C.实际水平与计划水平的比较 D. 落后水平与先进水平的比较
E实际水平与标准水平或平均水平的比较 8、下列属于时点指标的有( )
A. 企业个数 B. 机器台数 C. 电视机销售量 D. 某地区2003年末人口数 E. 产品产量
9、在相对指标中,属于不同总体数值对比的指标有( ) A. 动态相对指标 B. 结构相对指标 C. 比较相对指标 D. 比例相对指标 E. 强度相对指标
10、下列相对指标中,分子分母不能对换的指标有( ) A. 比较相对指标 B. 结构相对指标 C. 比列相对指标 D. 强度相对指标 E. 计划完成相对指标 11、普查是一种( )
A. 非全面调查 B. 专门调查 C. 全面调查 D. 一次性调查 E. 经常性调查
12、我国工业企业设备普查中( )
A. 每台设备是调查单位 B. 每台设备是填报单位
C. 每台设备是调查对象 D. 每个工业企业是填报单位 E. 所有设备是调查对象 13、统计调查对象是指( )
A. 普查登记的所有单位 B. 负责向上汇报资料的总体 C. 进行调查的那些现象的总体 D. 统计标志承担者的总体 E. 应搜集资料的所有单位的总体
14、计算比较相对指数,采用下列哪项计算较能反映现象发展的本质差异( ) A. 年销售额 B. 平均销售额 C. 产销率 D. 平均利润率 E. 人均销售额 15、工业增加值是( )
A. 时期指数 B. 时点指数 C. 实物指标 D. 价值指标 E. 总量指标
16、下列统计调查中,调查单位与填报单位一致的是( ) A. 工业企业设备普查 B. 零售商店调查 C. 人口普查 D. 工业企业普查 E. 某学校学生健康状况调查 17、统计报表要( )
A. 自上而下统一布置 B. 自下而上逐级填报
C. 按照规定的报送时间报出 D. 按照统一的表式和项目填报 E. 以一定的原始记录为根据
18、普查和统计报表这两种调查方式( ) A. 可以都是全面调查 B. 都是经常性调查
C. 调查对象都要根据调查目的选择 D. 都是专门组织的一次性调查
E. 普查资料可以采用统计报表形式收集 19、统计调查表的表式一般有( ) A. 一览表 B. 单一表 C. 综合表 D. 明细表 E. 汇总表
20、统计专门调查包括( )
A. 统计报表 B. 抽样调查 C. 普查 D. 重点调查 E. 典型调查 三、填空题
1、统计调查按调查对象包括的范围不同,可以分为__________________与_________________________。
2、统计调查按调查登记时间是否连续可以分为_______________与____________。
3、统计调查的主要组织形式有:___________、___________、____________、重点调查和典型调查。
4、统计调查可采用____________表和__________表两种形式。 5、调查单位是_____________的承担者,而____________则是负责向上报告调查内容的单位。
6、数据的搜集方法有访问调查、____________、___________、座谈会和个别深访。 7、数据的计量尺度由低级到高级有四个层次,即_____________、____________、______________、______________。
8、数据整理通常包括数据的___________、___________、___________等几个方面的内容。
9、审核数据准确性的方法主要有_____________和_______________。 10、次数分布由两个要素构成:______________和______________。 11、对于连续变量,组限可以采取____________的方法,根据“_______________”的规定解决不重的问题。
12、为消除组距不同对频数分布的影响,需要计算________________。 13、茎叶图是以该组数据的__________________作为树茎。
14、常见的频数分布曲线主要有________________、______________、______________、________________等几种类型。
15、统计表一般由四个主要部分组成,即___________、____________、
______________和____________。
16、统计调查是按照统计任务的要求,运用_______________的调查方法,有组织地___________________的过程。
17、______________和_________________是统计调查的两项基本要求。 18、调查对象是指需要调查的那些社会经济现象的_______________,它是由________________的许多调查单位组成的。
19、工业企业职工普查中,调查对象为工业企业全部职工,调查单位为__________________,填报单位为_____________________。
20、统计调查资料包括_______________资料和_________________资料两种。 21、所谓原始资料,是指直接向_____________收集未经加工整理,需要由_______________过渡到总体的统计资料。 22、所谓次级资料,是指已经经过整理加工由___________________过渡到总体,能说明___________________的统计资料。
23、统计报表要按照国家统一规定的表格形式,统一的指标内容,统一的__________________和___________________进行填报。
24、按调查范围不同,统计报表分为_____________和_____________。 25、普查是一种____________________的_______________全面调查。 26、抽样调查是以______________指标数值来推算________________指标数值的一种调查。
27、重点调查的特征在于:调查对象中的重点单位与一般单位之间___________的________________非常悬殊。
28、人口普查是一种全面调查,由于它涉及范围广,资料多层汇总,往往会产生__________,所以需要用_______________资料加以修正。 29、__________________与________________的有机结合,能更好的发挥统计工作的作用。 四、简答题
1. 什么是定类尺度与定序尺度? 2. 定距尺度与定比尺度有何区别? 3. 定性数据与定量数据据的区别?
4. 数据的计量尺度有哪几种?不同的计量尺度各有什么特点? 5. 统计数据可分为哪几种类型?不同类型的数据各有什么特点? 6. 什么是绝对数与相对数?各有几种表现形式? 7. 什么是比例与比率?两者有何区别?
8. 强度相对指标和其它相对指标的主要区别是什么? 9. 时期指标与时点指标有什么区别与联系?
10. 什么是普查、抽样调查、重点调查及统计报表制度? 11. 统计报表与普查有何区别? 12. 三种非全面调查有何区别? 13. 简述抽样调查和普查的特点。 14. 统计数据的具体搜集方法有哪些? 15. 统计调查方案包括哪几个方面的内容? 16. 什么是调查单位、调查对象与报告单位? 17. 调查表主要由哪三部分构成?
18. 统计数据的审核需要哪几种审核方式?
19. 什么是数据分组与频数分布?
20. 什么是组距、组中值、全距、组数、向上累积、向下累积? 21. 次数分配的图形有哪几种?它们各自的特征是什么? 22. 数据的预处理包括哪些内容?
23. 定类数据和定序数据的整理和图示方法各有哪些? 24. 定距数据和定比数据的分组方法有哪些? 25. 简述组距分组的步骤。 26. 统计分组具有什么作用?
27. 如何理解统计整理在整个统计研究中占有重要的地位? 28. 统计整理包括哪些步骤? 29. 组数和组距的关系如何?
30. 累计频数、累计频率的应用意义如何? 五、计算题
1. 某行业管理局所属40个企业2004年的产品销售收入数据(单位:万元)如下:
152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:
(1)根据上面的数据进行适当分组,编制频数分布表,并计算出累积频数和累积频率。 (2)按规定,销售收入在125万元以上为先进企业,115万元—125万元为良好企业,105万元 ——115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
2. 为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100名进行测试,所得结果如下 :
700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688
要求:(1)对上面的数据进行排序。(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图。(3)制作茎叶图,并与直方图进行比较。 3. 有27个工人看管机器台数如下: 5 4 2 4 3 4 3 4 4 2 4 3 4 3 2 6 4 4
2 2 3 4 5 3 2 4 3 要求:编制分配数列。
4. 某班有40名学生统计学考试成绩分别为: 66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81
学校规定:60分以下为不及格,60—70分为及格,70—80分为中,80—90分为良,90—100 分为优。 要求:
(1)该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。 (2)指出分组标志及类型;分组方法的类型;画直方图并分析本班学生考试情况。
5. 有资料如下:
企业编号 1 2 3 4 5 6 7 8 9 10
工人数(人) 483 515 622 417 840 445 953 1200 280 1440 总产值(万元) 410 370 500 300 740 320 860 1480 180 1680 要求:说明该地区不同规模的工业企业构成特点,以及企业规模和劳动生产率之间的关系。 (企业规模按人数分:300以下,301—500,501—1000,1001及以上)
6. 2003年某市出口创汇大户出口实绩(万美元)列举如下: 1101 1052 865 721 2032 1218 1046 721 546 623 2495 1015 1113 1104 1084 707 878 678 2564 620 575 943 828 2035 2375 4342 751 505 798 728 1103 1285 2856 3200 518
要求:
(1)出口额分为2000万美元以上,1000—2000万美元和500—1000万美元三组。
(2)总各组和总体的企业数和出口金额。
(3)把汇总结果编成一张统计表。
7. 某车间同工种的40名工人完成个人生产定额百分数如下:(%) 97 88 123 115 119 158 112 146 117 108 105 110 107 137 120 136 125 127 142 118 103 87 115 114 117 124 129 138 100 103 92 95 113 126 107 108 105 119 127 104
要求:编制分配数列,进一步再编制累计频数和累计频率数列。 8. 现有某年15个工厂人数和产量资料如下:
序号 人数 产量(百万元) 序号 人数 产量(百万元) 1 160 2.4 9 299 4.2
2 207 2.2 10 252 2.3 3 350 3.6 11 435 5.5 4 328 3.7 12 262 2.2 5 292 2.8 13 223 1.9 6 448 5.1 14 390 6.1 7 300 2.2 15 236 4.5 8 182 1.9
试按工人人数进行等距分组,组距和组数自行确定;汇总各组和总体的工厂个数,工人人数和产量;计算各组和总体的平均工厂产量和每个工人的平均产量。 要求设计一张统计表来反映以上分组,汇总计算的结果,看出工人人数同产量、同劳动生产率的依存关系,体现企业规模效益。 9. 某企业产值计划完成103%,实际比上年增长5%,试问产值计划规定比上年增长多少?又知 该企业产品单位成本应在上期699元的水平上降低12元,本期单位成本为672元,试确定降低成本计划完成程度指标。 10. 某公司所属三个厂近两年产量完成资料如下:
上年实际产量(吨) 本年计划 本年实际 本年计划完成程度(%) 本年为上年实际完成程度(%)
产量(吨) 比重(%) 产量(吨) 比重(%) 甲厂 90 20 110 乙厂 150 100.7 115 丙厂 230 237 合计 500 498
要求:请填出空格中的数字。
11. 下面是我国人口和国土面积资料: 单位:万人
根据第四次人口普查调整数 人口总数男女 1982年 1990年 101654 114333 52325 58904 49302 55429
国土面积960万平方公里。试计算全部可能计算的相对指标,并指出它们属于哪一种相对指标。
12. 某企业2004年产品销售量计划为上年实际的108%,2003-2004年实际的动态相对指标为11 4%,试确定2003年产品销售计划完成程度。 13. 某企业计划生产某单位产品工时消耗较上期降低5%,实际较上期降低4. 5%,试计算降低 劳动量计划完成程度。
14. 某工厂2004年产量计划完成百分数为110%,当年产量计划比上年实际提高20%,试确定2004年际比2003年增长百分之几?
15. 某厂2004年上半年主要材料进货计划执行情况如下: 名称 计量单位 全年计划 第一季度 第二季度 计划 实际 计划 实际
甲 吨 20000 5000 5000 6000 6180
乙 吨 10000 2500 3000 3500 3000 丙 吨 5000 1000 800 2000 1800 试根据上述资料计算每种材料的: ①各季度进货计划完成百分比。 ②上半年计划完成情况。
③上半年累计计划进度执行情况。
16. 某家用电器生产厂家想通过市场调查了解以下问题: a. 企业产品的知名度; b. 产品的市场占有率;
c. 用户对产品质量的评价及满意程度。 要求:
(1) 请你设计出一份调查方案;
(2) 你认为这项调查采取哪种调查方法比较合适? (3) 设计出一份调查问卷。
17. 某百货公司连续40天的商品销售如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 47 35 28 46 34 30 37 44 26 38 48 44 42 36 37 37 49 39 42 32
根据上面的数据进行适当的分组,编制频数分析表,并绘制频数分布的直方图和折线图。
第三章 数据分布特征的描述 一、单项选择题
1、变量数列中各组频率的总和应该( ) A.小于1 B. 等于1 C. 大于1 D. 不等于1 2、次数密度的计算公式是( )
A. 各组次数相互之比 B. 各组次数与各组组距之比
C. 各组组距与各组组数之比 D. 各组次数与总次数之比 3、在次数分布数列中,频率是指( )
A. 各组的频率相互之比 B. 各组次数相互之比
C. 各组分布次数与频率之比 D. 各组分布次数与总次数之比 4、一般情况下,按年龄分组的人口死亡率表现为( ) A. 钟型分布 B. 正J型分布 C. U型分布 D. S型分布
5、统计整理作为一个相对独立的统计工作阶段来说主要指( ) A. 对历史资料的整理 B. 对次级统计资料的整理 C. 对原始调查资料的整理 D. 对统计分析资料的整理 6、统计分组就是按照一定的标志( ) A. 将总体区分为性质相同的若干部分 B. 将总体区分为性质不同的若干部分 C. 将总体单位区分为性质相同的若干部分 D. 将总体单位区分为性质不同的若干部分 7、按某一标志分组的结果,就表现为( )
A. 组内同质性、组间同质性 B. 组内差异性、组间差异性
C. 组内同质性、组间差异性 D. 组内差异性、组间同质性 8、对某班学生有如下分组: 按性别分组 人数 男女 3225
按年龄分组 人数
20岁以下20岁以上 3027
这样的分组属于( )
A. 简单分组 B. 平行分组体系 C. 复合分组 D. 复合分组体系 9、次数分布数列( )
A. 是按数量标志分组形成的数列 B. 是按品质标志分组形成的数列
C. 按数量标志或品质标志分组形成的数列 D. 是若干数值的顺序罗列
10、在全距一定的情况下,等距数列中的组距与组数的关系为:( ) A. 成正比 B. 成反比 C. 不成比例 D. 无法判断 11、对离散型变量( ) A. 只能标志分组数列 B. 只能编制单项数列 C. 只能编制组距数列
D. 根据变量值个数和变动范围大小决定编制组距数列或单项数列
12、利用组中值反映分布在该组中各单位变量值的一般水平是因为( ) A. 组中值就是组平均数 B. 组中值比组平均数更有代表性 C. 无法计算组平均数 D. 组中值更有说服力
13、某连续变量数列,其末组为开口组,下限为500,又知其邻组组中值为480,则末组组中值为( )
A. 520 B. 510 C. 500 D. 490
14、某工业企业产品年生产量为10万件,期末库存量为3. 8万件,它们是( ) A. 时期指标 B. 时点指标
C. 前者是时期指标后者是时点指标 D. 前者是时点指标,后者是时期指标
15、两数对比,若分母数值比分子数值大很多时,常用的相对数形式为( ) A. 成数 B. 倍数 C. 百分数 D. 千分数
16、比例相对指标是反映总体的内部各部分之间内在的( ) A. 数量关系 B. 质量关系 C. 计划关系 D. 密度关系 17、下列指标中属于结构相对指标的是( ) A. 产值计划完成程度
B. 物质生产部门净产值占总产值的比重 C. 产值资金占用率 D. 百元流动资金利税率
18、某厂1997年完成产值200万元,1998年计划增长10%,实际完成231万元,超额完成计划( )
A. 5% B. 5.5% C. 15.5% D. 115.5% 19、按人口平均计算的钢产量是( ) A. 算术平均数 B. 比例相对数 C. 比较相对数 D. 强度相对数
20、我国第五次人口普查结果,我国男、女之间的对比关系为 1.063:1,这个数是( )
A. 比较相对数 B. 比例相对数 C. 强度相对数 D. 结构相对数
21 同质总体标志变动度指标是反映( )的
A. 集中趋势 B. 离中趋势 C. 变动情况 D. 一般水平 22、总体标志总量是( )
A. 说明总体单位特征 B. 表示总体本身的规模大小 C. 指总体各单位标志值的总和 D. 指总体单位总量 23、用水平法检查五年计划的执行情况适用于( ) A. 规定计划期初应达到的水平
B. 规定计划期内某一期应达到的水平 C. 规定计划期末达到的水平 D. 规定五年累计应达到的水平
24、计算计划完成程度相对数时,分子和分母的数值是( ) A. 只能是绝对数 B. 只能是相对数 C. 只能是平均数 D. 既可以是绝对数、也可以是相对数或平均数 25、平均数反映了( )
A. 总体分布的集中趋势 B. 总体中总体单位的集中趋势 C. 总体分布的离散趋势 D. 总体变动趋势 26、已知5个水果商店香蕉的单价和销售额,要求计算5个商店香蕉的平均单价,应该采用( )
A. 简单算术平均数 B. 加权算术平均数 C. 加权调和平均数 D. 几何平均数
27、某机械局所三个企业1995年计划产值分别为400万元、600万元和500万元。执行结果,计划完成程度分别为108%、106%、108%,则该局三个企业平均计划完成程度为( ) A. =107.33% B. % C. % D.
28、根据同一资料(当x>0时)计算的算术平均数( ) 、几何平均数(G)和调和平均数(H)之间的关系为( ) A. B. G C. H D. H
29、权数对算术平均数的影响作用,决定于( ) A. 权数本身数值的大小
B. 作为权数的单位数占总体单位数的比重大小 C. 各组标志值的大小 D. 权数的经济意义
30、在各种平均数中( )
A. 中位数和调和平均数称为位置平均数 B. 算术平均数和众数称为位置平均数 C. 算术平均数和中位数称为位置平均数 D. 中位数和众数称为位置平均数
31、标志变动度指标中易受极端数值影响的是( ) A. 极差 B. 平均差 C. 标准差 D. 标准差系数 32、用是非标志计算平均数,其计算结果为( ) A. p+q B. p-q C. 1-p D. p 33、标志变动度指标可以反映社会经济活动过程的均衡性和稳定性,它们之间存在( )
A. 正比关系 B. 反比关系 C. 恒等关系 D. 倒数关系
34、有两个变量数列,甲数列: ;乙数列: 、 ,此资料说明( ) A. 甲数列平均数的代表性高于乙 数列 B. 乙 数列平均数的代表性高于甲数列 C. 两数列平均数的代表性相同
D. 两数列平均数的代表性无法比较
35、若把全部产品分为合格品和不合格品,所采用的标志属于 ( ) A. 不变标志 B. 是非标志 C. 品质标志 D. 数量标志 36、标准差属于( )
A. 强度相对指标 B. 绝对指标 C. 相对指标 D. 平均指标
37、由(0,1)标志的 方差可以推知,数列中具有“是”这种性质的单位数的方差是( )
A. n(p+q) B. npq C. n(p-q) D. 二、多项选择题
1、 在等距数列中,各组次数的分布( )。 A. 不受组距的大小 B. 受组距大小的影响
C. 与次数密度的分布相一致 D. 与次数密度的分布不一致 E. 一定是正态分布
2、 次数分布的主要类型有( )
A. 钟型分布 B. S型分布 C. L型分布 D. J型分布 E. U型分布
3、影响次数分布的要素是( )
A. 变量值的大小 B. 变量性质的不同 C. 选择的分组标志 D. 组距和组数 E. 组限和组中值
4、统计分组的关键是( )
A. 选择分组标志 B. 划分各组界限 C. 确定组数 D. 计算组距 E. 将性质相同的单位划到同一组中
5、统计表是表现统计资料最常用的形式,从构成形式上看,它一般包括:( ) A. 总标题 B. 横行标题 C. 总栏标题 D. 计量单位 E. 指标数值
6、 设有某班学生考试成绩如下: 考分(分) 人数
50—6060—7070—8080—9090—100 2711128 合计 40 这是( )
A. 分组数据 B. 组距数列 C. 等距数列 D. 异距数列 E. 变量数列 7、 统计分组的含义是( )
A. 将总体区分为性质不同的若干部分 B. 将总体区分为性质相同的若干部分 C. 将性质相同的单位组合在一起 D. 将性质不同的单位组合在一起 E. 在总体内部进行一种定性分类
8、 根据总量指标反映的现象的性质不同,计量单位一般有( ) A. 实物单位 B. 数量单位 C. 劳动单位 D. 价值单位 9、 比较相对指标可用于( )
A. 不同国家、地区、单位之间的比较 B. 不同时期的比较 C. 实际水平与计划水平的比较 D. 落后水平与先进水平的比较 E. 实际水平与标准水平或平均水平的比较 10、下列属于时点指标的有( )
A. 企业个数 B. 机器台数 C. 电视机销售量 D. 某地区1990年末人口数 E. 产品产量
11、在相对指标中,属于不同总体数值对比的指标有( ) A. 动态相对指标 B. 结构相对指标 C. 比较相对指标 D. 比例相对指标 E. 强度相对指标
12、下列相对指标中,分子分母不能对换的指标有( ) A. 比较相对指标 B. 结构相对指标 C. 比例相对指标 D. 强度相对指标 E. 计划完成相对指标 13、相对数的表现形式有( )
A. 无名数 B. 百分数 C. 成数 D. 结构相对数 E. 名数 14、计算和应用平均数的原则是( ) A. 现象的同质性
B. 用组平均数补充总平均数 C. 用变量数列补充说明平均数 D. 用时间数列补充说明平均数 E. 把平均数和典型事例结合起来
15、一般地说,加权算术平均数等于简单算术平均数是在( ) A. 各组次数不等的条件下 B. 各组次数相等的条件下 C. 各组变量值不相同的条件下 D. 各组权数都为1的条件下 E. 在分组组数较少的条件下 16、在统计中加权算术平均数和加权调和平均数计算方法的选择,应根据已知资料的情况而定( )
A. 如果掌握基本公式的分子资料用加权调和平均数计算 B. 如果掌握基本公式的分母资料用加权调和平均数计算
C. 如果掌握基本公式的分母资料用加权算术平均数计算 D. 如果掌握基本公式的分子资料用加权算术平均数计算 E. 如果无基本公式的分子、分母资料,则无法计算平均数 17、下列采用调和平均数计算的有( )
A. 已知各级工人的月工资水平和工资总额,求平均工资 B. 已知某工厂各车间废品率和废品量,求平均废品率
C. 已知各工厂产量计划完成百分比和实际产量,求平均计划完成百分比
D. 假定企业按工人劳动生产率分组,并已知道各组产量,求平均劳动生产率 E. 已知某工厂产品产量及单位成本,求平均单位成本 18、不受数列极端值影响的平均数有( ) A. 众数 B. 中位数 C. 几何平均数 D. 调和平均数 E. 算术平均数
19、反映总体各单位标志值离散程度的指标( ) A. 只能是相对数 B. 只能是绝对数 C. 可以是相对数 D. 可以是绝对数 E. 只能是平均数
20、是非标志的方差是( )
A. q+p B. qp C. p-q D. (1-p)(1-q) E. p(1-p)
21、某小组3名工人的工资分别为102元,104元和109元,根据这一资料计算的各种标志变动度指标的关系是( ) A. 极差大于标准差 B. 极差大于平均差
C. 平均差小于标准差 D. 平均差系数小于标准差系数 E. 平均差系数大于标准差系数
三、填空题
1、次数分布表示方法有 和 两种形式。 2、影响次数分布的要素主要有 和 。
3、将各组频数和频率由变量低的组向变量值高的组累计,称为 ,由变量值高的组向变量值低的组累计,则称为 。
4、在市场经济中,对某项事业的投资随着利率的提高而不断增加,因此投资额按利润大小的分布就是 分布,而人口总体按年龄大小分布,一般是 分布。 5、在次数分布数列中,表示各组单位数的次数,又称 ,各组次数与总次数相比称为 。
6、频率是一个介于 和 之间的系数。
7、统计整理是从对社会经济现象 的观察到对社会 的认识的连接点。 8、组距数列按各组组距是否相等分为______________________ 和 。
9、划分连续变量的组限时,各组一般包括 变量值的单位,而不包括 变量值的单位,这叫做“上组限不在内”的原则。 10、 是各组变量值的中点数值,计算公式是 11、用组中值来代表组内变量值的一般水平,是假定各组的变量值在本组范围内呈 或在组中值两侧是 。
12、根据分组标志的特征不同,统计总体可按 标志分组,也可按 标志分组。 13、统计分组同时具备两方面的含义,对总体而言,是 的过程;对总体单位而言,是 的过程。
14、选择分组标志,就是要确定将统计总体区分为各个性质不同的组的 ;划分
各组的组限,就是要在分组标志的变异范围内划定各相邻组间的 和数量界限。 15、统计表从内容上来看,由 和 两大部分构成。
16、统计分组可以按总体单位的 分组,也可根据小总体的 分组。 17、总量指标是反映社会经济现象总体规模或水平的统计指标,是计算 和 的基础。
18、相对指标的数值表现形式有 和 。
19、强度相对指标数值大小,如果与现象的发展程度或密度成正比,称之为 ,反之称为 。
20、检查考核中长期计划常用的方法有_____________________ 和 。
21、两个同类指标静态对比得到的指标叫 ,两个同类指标动态对比得到的指标叫 。 22、保持相对指标的可比性,主要是指计算指标的基础数据所包含的内容、 和 方面的可比。
23、国民收入中积累额与消费额的比例为1:3(A),积累率为25%(B),这里(A)为 相对指标;(B)为 相对指标。
24、总量指标按其反映总体的内容不同,分为__________________ 和 。 25、在社会经济统计中,总量指标是对社会经济现象 认识的 。
26、成数是将对比的基数定为 而得到的相对数;系数和倍数是将对比的基数定为 而计算的相对数。 27、统计中的变量数列是以 为中心而左右波动,所以平均数反映了总体分布的 。 28、利用组中值计算算术平均数是假定各组内的 分配的,计算结果只是一个 值。 29、标志值次数多少对平均数的影响有 的作用,所以又称为 。 30、 在加权算术平均数的计算中,表示的是 ,称为 。
31、调和平均数是平均数的一种,它是 的算术平均数的倒数,又称 平均数。 32、几何平均数是计算 和 最使用的一种方法,凡是变量值的连乘积等于总比率或总速度的现象都可以用几何平均数计算平均比率和平均速度。
33、中位数是为于数列 的那个标志值,众数则是在总体中出现次数 的标志值。 34、设某数A与一变量数列中所有 之差的和为零,则A为该数列的 。
35、算术平均数、众数和中位数的关系与分布的特征有关。如果分布是对称的,则 ;如果分布 ,则 ;如果分布 ,则 。
36、变动度指标是衡量 的尺度,它与平均数代表性大小成 的关系。
37、某厂生产某种产品30000件,其中一等品27000件,一等品率为 ,其是非标志的平均数为 。
38、在计算平均差时,所以取离差的绝对值,是因为 对其算术平均数的离差总和 。
四、简答题
1. 测度分布集中趋势的特征值有哪些?
2. 什么是均值、几何平均数、调和平均数?它们有哪些特点? 3. 什么是极差、方差、标准差?其特点是什么? 4. 什么是偏态?什么是峰度?
5. 什么是统计表与统计图?常用的统计图有哪几组?涵义如何?6. 怎样理解均值在统计学中的地位?
7. 简述众数、中位数和均值的特点及应用场合? 8. 什么是变异系数?变异系数的应用条件是什么?
9. 考察一个分布数列的特征时,为什么必须运用平均指标和变异指标?两者之间有何种关系?
10. 怎样理解平均指标是频率分布中标志变量集中趋势的数量特征,变异指标是标志变量离中趋势的数量特征? 11. 在计算平均指标时,算术平均数和调和平均数分别适用于什么样的资料条件? 12. 在计算同一经济意义的平均指标时,为什么加权算术平均数和加权调和平均数必须分别采用不同的资料进行加权?
13. 数值平均数和位置平均数是依据什么来区分的?这两类平均数之间有何异同? 14. 与众数、中位数比较,算术平均数在对数据的计算处理上有何特点?
15. 试比较极差、平均差和标准差三种变异指标的特点,并说明,为什么标准差是最常用、 最基本的变异指标。
16. 在分析意义上,偏度和峰度指标与平均指标、变异指标有何区别?为什么除了计算一般的平均指标和变异指标之外,还需要考察分布的偏度与峰度? 17. 试归纳一下,在本章介绍的有关各种指标中,哪些指标具有“平均不变”的特性?哪些指 标又不具有这一特性? 18. 中位数也是一种分位数;与中位数比较,其他分位数在分析作用上有何不同?
19. 在运用加权算术平均数时,怎样正确选择权数?为什么说简单平均数是加权算术平均数的 特例?
20. 对于不同类型的频数(频率)分布,如钟型分布、U型分布和J型分布,平均指标都能表明它们的集中趋势吗?如果不能,那么计算平均数的意义又何在呢?
五、计算题
1. 某企业两个车间的工人生产定额完成情况如下表:
技术水平 A车间 B车间
工人数 完成定额工时 人均完成工时 工人数 完成工时定额 人均完成工时 高 50 14000 280 20 6000 300 中 30 7500 250 40 10400 260 低 20 4000 200 40 8200 205
合计 100 25500 255 100 24600 246 从表中看,各个技术级别的工人劳动生产率(人均完成工时定额)都是A车间低于B车间,试问:为什么A车间的平均劳动生产率又会高于B车间呢?
2. 在某个核算年度内,两个建筑施工单位采购同一种建筑材料的价格和批量情况如下表。试 分别计算两个施工单位的平均采购价格。并从平均数计算的角度说明,为什么两个施工单位的平均采购价格会有差别? 采购单价(元/吨) 采购金额(万元) A单位 B单位 800 120 100 820 105 100 835 84 100 850 56 100 860 35 100
合计 400 500
3. 根据某城市500户居民家计调查结果,将居民户按其食品开支占全部消费开支的比重(即恩 格尔系数)分组后,得到如下的频数分布资料: 恩格尔系数(%) 居民户数 20以下 6 20~30 38 30~40 107 40~50 137 50~60 114 60~70 74 70以上 24 合计 500
要求:(1)据资料估计该城市恩格尔系数的中位数和众数,并说明这两个平均数的具 体分析意义。(2)利用上表资料,按居民户数加权计算该城市恩格尔系数的算术平均数。(3)试考虑,上面计算的算术平均数能否说明该城市恩格尔系数的一般水平?为什么?
4. 某学院二年级两个班的学生英语统考成绩如下表。要求:(1)分别计算两个班的平均成绩;(2)试比较说明,哪个班的平均成绩更有代表性?哪个班的学生英语水平差距更大?你是用什么指标来说明这些问题的;为什么? 英语统考成绩 学生人数 A班 B班 60以下 4 6 60~70 12 13 70~80 24 28 80~90 6 8 90以上 4 5 合计 50 60
5. 利用上题资料,试计算A班成绩分布的极差与平均差,并与标准差的计算结果进行比较,看看三者之间是何种数量关系。
6. 根据某城市居民家计调查结果,将500户居民按年收入水平分组后,分别观察其食品开支占全部消费开支的比重,整理得到如下的复合分组资料,试以恩格尔系数作为考察变量,利用资料(即恩络尔系数)分别计算该变量的总方差,平均组内方差、组间方差,并验证三者之间的数量关式: 恩格尔系数% 年收入水平 合计 2万元以下 2—5万元 5万元以上 20以下 0 0 6 6 20~30 0 24 14 38 30~40 15 60 32 107 40~50 26 96 15 137 50~60 48 57 9 114 60~70 35 35 4 74 70以下 16 8 0 24 合计 140 280 80 500
7. 给出两个企业的员工工资资料如下表:
A企业 B企业
月工资(元) 员工数(人) 月工资(元) 员工数(人) 500以下 15 800以下 16 500~700 30 800~1000 33 700~900 65 1000~1200 64 900~1100 96 1200~1400 98 1100~1300 44 1400~1600 43 1300~1500 33 1600~1800 34 1500以上 17 1800以上 18 合计 300 合计 306 要求:
(1)分别计算两个企业的平均工资和工资标准差。
(2)试比较说明,哪个企业的员工工资水平差距更大?为什么?8. 利用上题资料,试以矩法计算A企业员工工资分布的偏度和峰度指标,并据以确定其所属 的分布类型。
9. 某农场在不同自然条件的地段上用同样的管理技术试种两个粮食新品种,有关资料如下表 所示:
试种地段 一号品种 二号品种
播种面积(亩) 收获率(公斤/亩) 播种面积(亩) 收获率(公斤/亩) A 2. 0 450 2. 5 383 B 1. 5 385 1. 8 405 C 4. 2 394 3. 2 421 D 5. 3 420 5. 5 372 合计 13. 0 13. 0 试计算有关指标,并从作物收获率的水平和稳定性两方面综合评价,哪个品种更有推广价值 ?
10. 甲、乙两个企业生产三种产品的单位成本和总成本资料如下: 产品名称 单位成本(元) 总成本(元) 甲企业 乙企业 A 15 2100 3255 B 20 3000 1500 C 30 1500 1500
试比较哪个企业的总平均成本高并分析其原因。
11. 一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg,请回答下面的问题: (1)男生的体重差异大还是女生的体重差异大?为什么?
(2)以磅为单位(1磅=2. 2kg)求体重的平均数和标准差。
12.某年某月份甲、乙两农贸市场某农产品价格及成交量、成交额的资料如下: 品种 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 甲 1.2 1.2 2 乙 1.4 2.8 1 丙 1.5 1.5 1 合计 — 5.5 4
试问哪一个市场农产品的平均价格高,并说明其原因。
13. 2004年某月份某企业按工人劳动生产率高低分组的生产班组数和产量资料如下:
按工人劳动生产率分组(件/人) 生产班组 生产工人数 50~60 10 150 60~70 7 100 70~80 5 70 80~90 2 30 90以上 1 16 合计 25 336
试计算该企业工人平均劳动生产率。
14. 某班共有60名学生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分 ,女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题:
(1)如果该班的男女学生各占一半,全班考试成绩的平均数是多少?标准差又是多少?
(2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是多少?
(3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是多少?
(4)比较(1)、(2)和(3)的平均考试成绩有何变化,并解释其变化的原因。 (5)比较(2)和(3)的标准差有何变化,并解释其原因。
15. 为研究少年儿童的成长发育情况,某研究所的一位调查人员在某城市抽取100名7岁—17 岁的少年儿童作为样本,另一位调查人员则抽取了1000名7岁—17岁的少年儿童作为样本。
请回答下面的问题,并解释其原因。
(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样 本的平均身高相同?
(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组 样本的标准差相同?
(3)哪一位调查研究人员有可能得到这1100名少年儿童身高的最高者或最低者?对两位调查研 究人员来说,这种机会是否相同? 16. 某企业职工奖金的分组资料如下: 工人 技术及管理人员
奖金水平(元) 人数 奖金水平(元) 人数 200~300 220 200~300 50 300~500 350 300~500 120
500~700 80 500~700 700~1000 4010 合计 650 合计 220 要求:
(1)计算该企业职工的平均奖金及标准差。
(2)分别计算工人和技术及管理人员的平均奖金(即组平均数)和标准差、方差(组内方差);
(3)计算工人和技术及管理人员奖金的组间方差;
(4)用具体数值证明方差的加法定理,即总方差等于组内方差的平均数加组间方
差。
17. 某百货公司6月份各天的销售数据如下(单位:万元): 257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295
(1) 计算该百货公司日销售额的均植和中位数; (2) 计算日销售额的标准差。
18. 已知某地区农民家庭按年人均收入分组的资料如下: 按人均收入分组(元) 家庭户数占总户数比重(%) 1000以下 2.3 1000~2000 13.7 2000~3000 19.7 3000~4000 15.2 4000~5000 15.1 5000~6000 20.0 6000以上 14.0 合计 100.0
要求:计算该地区平均每户人均收入的中位数、均值及标准差。
19.对10名成年人和10名幼儿的身高(单位:厘米)进行抽样调查,结果如下:
成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 要求:
(1)要比较成年组和幼儿组的身高差异应采用什么样的指标测度值?为什么? (2)比较分析哪一组的身高差异大。
20. 对某地区120家企业按利润额进行分组,结果如表所示。 按利润额分组(万元) 企业数(个) 200~300 19 300~400 30 400~500 42 500~600 18 600以上 11 合计 120
(1) 计算120家企业利润的众数、中位数和均值; (2) 计算分布的偏态系数和峰度系数。
21. 某企业有两个生产车间,甲车间20名工人,人均日加工产品数为78件,标准差为8件;乙车间有30名工人,人均日加工产品数为72件,标准差为10件。计算两个车间日加工产品的平均值及标准差。
22. 已知某地区农民家庭按年人均收入分组的资料如表所示。 按人均收入分组(元) 家庭户数占总户数比重(%) 100以下 2.3 100~200 13.7 200~300 19.7 300~400 15.2
400~500 15.1 500~600 20.0 600以上 14.0 合计 100
计算该地区平均每户人均收入的中位数、均值及标准差。 23. 已知1991-1997年我国的国内生产总值数据如表所示。 年份 国内生产总值 1992 26638.1 1991 21617.8 1993 34634.4 1994 46622.3 1995 58260.5 1996 67885.0 1997 74772.0 其中:在1997年的国内生产总值中,第一产业为13969亿元,第二产业为36770亿元,第三产业为24033亿元。
(1)根据1991-1997年的国内生产总值数据,利用Excel软件绘制线图和条形图;
(2)根据1997年的国内生产总值及其构成数据,绘制圆形图和环形图。 第四章 抽样与抽样估计 一、单选题
1. 抽样推断中,几个基本概念是( ) A. 总体和样本 B. 样本个数和样本容量 C. 参数和统计量 D. 以上○1○2○3均是 2. 评价一个点估计量是否优良的标准有( )
A. 无偏性、有效性、一致性 B. 无偏性、一致性、准确性 C. 准确性、有效性、及时性 D. 准确性、及时性、完整性
3. 在重复简单随机抽样时,当抽样平均误差缩小一半,则n要( ) A. 扩大3倍 B. 增大4倍 C. 增大2倍 D. 缩小2倍 4. 统计量是( )
A. 确定性变量 B. 随机变量 C. 连续变量 D. 离散变量 5. 抽样调查的主要目的是 ( )
A. 用样本指标来推算总体指标 B. 对调查单位作深入研究 C. 计算和控制抽样误差 D. 广泛运用数学方法 6. 在抽样设计中,最好的方案是( )
A. 抽样误差最小的方案 B. 抽样单位最小的方案
C. 调查费用最少的方案 D. 在一定误差要求下费用最小的方案 7. 抽样平均误差反映了样本指标与总体指标之间的 ( ) A. 实际误差 B. 实际误差的绝对值 C. 平均误差程度 D. 可能误差范围
8. 事先确定总体范围,并对总体的每个单位都编号,然后根据《随机数码表》或抽签的方式来抽取样本的抽样组织形式,被称为( ) A. 简单随机抽样 B. 机械抽样 C. 分层抽样 D. 整群抽样
9. 先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为( )
A. 简单随机抽样 B. 机械抽样 C. 分层抽样 D. 整群抽样 10. 按地理区域划分所进行的区域抽样,其抽样方法属( ) A. 简单随机抽样 B. 等距抽样 C. 类型抽样 D. 整群抽样
11. 在同样条件下,不重复抽样的抽样标准误差与重复抽样的抽样标准误差相比,有( )
A. 前者小于后者 B. 前者大于后者 C. 两者相等 D. 无法判断
12. 在相同的样本容量的要求下,不重复抽样的样本个数( ) A. 总是多于重复抽样的样本个数 B. 总是少于重复抽样的样本个数 C. 总是等于重复抽样的样本个数 D. 以上情况都可能发生
13. 抽样平均误差的实质是( )
A. 总体标准差 B. 抽样总体的标准差
C. 抽样误差的标准差 D. 样本平均数的标准差
14. 假定一个人口一亿的大国与百万人口的小国居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄抽样平均误差( )
A. 不能确定 B. 两者相等
C. 前者比后者大 D. 前者比后者小 15. 在重复的简单随机抽样中,当概率保证程度从68. 27%提高到95. 45%时(其它条件不变),必要的样本容量将会( )
A. 增加一倍 B. 增加两倍 C. 增加三倍 D. 减少一半 16. 一个连续的生产的工厂,为检验产品的质量,在一天中每隔一个小时取下五分钟的产品做全部检验,这是( )
A. 等距抽样 B. 分层抽样 C. 整群抽样 D. 纯随机抽样 17. 影响分层抽样误差大小的主要因素是( )
A. 层间方差 B. 层内方差 C. 总体方差 D. 样本方差 18. 分层抽样一般应用于( )
A. 总体各单位在某标志上的分布比较均匀的场合 B. 总体各单位标志值变异很大的场合 C. 总体各单位可以进行编号的场合 D. 具有抽样框的场合
19. 反映抽样指标与总体指标之间抽样误差可能范围的指标是 ( ) A. 抽样平均误差 B. 抽样极限误差 C. 抽样误差系数 D. 概率度
20. 成数与成数方差的关系是 ( )
A. 成数的数值越接近于1,成数的方差越大 B. 成数的数值越接近于0,成数的方差越大 C. 成数的数值越接近于0.5,成数的方差越大 D. 成数的数值越大,成数的方差越大
21. 对某单位职工的文化程度进行抽样调查,得知其中80%的人是高中毕业,抽
样平均误差为2%。当概率为95.45%时,该单位职工中具有高中文化程度的比重是 ( )
A. 等于78% B. 大于84% C. 在76%与84%之间 D. 小于76% 二、多项选择题
1. 对于总体、样本及其指标的认识( )
A. 总体是唯一确定的,样本是随机的 B. 总体指标是确定不变 C. 抽样指标是样本变量的函数 D. 抽样指标也是随机变量 E. 抽样指标是确定不变的
2. 统计量的抽样分布是指( )
A. 统计量的概率分布 B. 样本平均数、成数的抽样分布 C. 简单随机抽样样本平均数概率分布 D. 成数的抽样分布 E. 两个统计量差异的抽样分布
3. 评价一个点估计量是否优良的标准有( )
A. 无偏性 B. 一致性 C. 有效性 D. 准确性 E. 客观性 4. 样本容量n受三个因素的影响( )
A. 总体方差 B. 允许的最大估计误差 C. 置信度 D. 概率分布 E. 抽样估计标准差 5. 在其它条件不变的情况下( )
A. 总体方差越大,所需的样本容量越多 B. 总体方差越小,所需的样本容量越少
C. 允许的最大估计误差越小,所需的样本容量越多 D. 允许的最大估计误差越大,所需的样本容量越少 E. 当置信度越高,所需样本容量越少
6. 从一个全及总体中可以抽取一系列样本,所以 ( ) A. 样本指标的数值不是唯一确定的 B. 样本指标是样本变量的函数 C. 总体指标是随机变量 D. 样本指标是随机变量
E. 样本指标的数值随样本不同而不同
7. 类型抽样中每类型组应该抽取多少样本单位,应遵循( ) A. 等数分配 B. 等比例分配 C. 最优分配 D. 等差分配 E. 按重要性分配 8. 基本抽样组织形式中( ) A. 简单随机抽样最符合随机原则
B. 简单随机抽样较适合于总体单位标志变异度较大的情况 C. 类型抽样的效果,优于简单随机抽样 D. 整群抽样误差较大,代表性较差 E. 等距抽样要防止发生系统性的偏差
9. 总体参数的区间估计必须同时具备的要素有( ) A. 样本单位数 B. 抽样指标—总体参数的估计值 C. 抽样误差范围 D. 概率保证程度 E. 抽样标准误差
10. 抽样推断中,常用的总体参数有( ) A. 统计量 B. 总体平均数 C. 总体成数
D. 总体方差 E. 总体标准差
11. 在抽样推断中,样本就是( )
A. 抽样框 B. 推断对象的总体 C. 子样 D. 样本个数 E. 代表总体的那部分单位的集合体
12. 置信度、概率度和精确关系表现在( ) A. 概率度增大,估计的可靠性也增大 B. 概率度增大,估计的精确度下降 C. 概率度缩小,估计的精确度也缩小 D. 概率度缩小,估计的置信度也缩小 E. 概率度增大,估计的可靠性缩小 13. 简单随机抽样一般适用于( ) A. 总体单位在某标志上的分布比较均匀
B. 总体单位标志变异比较大,而在实际工作中又不可能抽选更多的单位进行调查时
C. 总体单位可以加以编号的场合 D. 可以形成抽样框的场合
E. 总体按某一重要标志划分的类型或组 14. 下面属于分层抽样的是( )
A. 为研究城市邮政信件传递速度,从普通信件和快递信件中抽取一定信件组成样本
B. 为研究某工厂工人平均工龄,把工厂工人划分为100个生产班组,从中抽出一定数量的班组组成样本
C. 某产品的质量抽检从加工车床的性能(自动或半自动)分组中抽取一定数量的车床组成样本
D. 农产量抽样按地理条件分组从中取样
E. 为调查某市育龄妇女生育人数,把全市按户籍派出所的管辖范围分成许多区域,对抽中的区域全面调查育龄妇女的生育人数 15. 影响抽样误差的因素有 ( ) A. 是有限总体还是无限总体 B. 是变量总体还是属性总体 C. 是重复抽样还是不重复抽样 D. 总体被研究标志的变异程度 E. 抽样单位数的多少 三、填空题
1. 抽样推断就是按照 ,从总体中抽取一部分单位进行调查,根据样本资料对总体 _________
做出具有一定可靠程度的估计和判断。
2. 是总体的数量特征,对于 来说是个定值。
3. 是样本的数量特征,随着样本的不同而变化,因此是个 。 4. 点估计是用样本 估计总体参数,代表总体 。
5. 区间估计是用 和 构成的区间,估计总体参数,并说明总体参数落在这样一个区间的可能性或置信度。
6. 根据样本各单位标志值或标志属性计算的综合指标称为 。 7. 基本抽样组织形式,一般有 _、 、 、 等四种。
8. 某乡有水田2000亩,随机抽选400亩,测得平均亩产量为600斤,方差为16斤,概率保证程度为95. 45%。用点估计的方法,水稻亩产量为 。用区间估计法,水稻亩产量为 。
9. 在重复简单随机抽样中,当抽样误差缩小一半,则n要增大 倍;当抽样误差扩大一倍,则n只需原来的 。
10. 在不重复简单随机抽样中,如果 。 11. 扩大或缩小抽样误差范围的倍数称为 ,用符号 表示。扩大或缩小以后的抽样平均误差称为 ,用符号 表示。
12. 如果n个样本单位是来自于数学期望值为μ,而方差 未知的正态分布总体,当n较小时(n≤30)则 服从自由度为(n-1)的 分布。
13. 影响抽样误差大小的因素主要有:总体各单位标志值的差异程度 、 和抽样调查的组织形式。
14. 代表性误差可以分为 和 两种。
15. 分层抽样应尽量缩小 差异,增大 差异。
16. 甲班男生33人,女生25人,乙班男生25人,女生20人,所以学生性别误差甲班 乙班。 四、简答题
1. 什么是抽样推断?它有哪些基本特点? 2. 简述抽样推断的意义。
3. 说明总体、样本、参数、统计量、样本个数和样本容量的涵义。 4. 抽样框及主要形式。
5. 什么是抽样误差?为什么它不同于登记误差和系统误差?抽样误差的大小受哪些因素影响?
6. 什么是重复抽样和不重复抽样?不同的抽样方法怎样影响着抽样推断的结果?
7. 什么叫抽样极限误差?它和抽样平均误差的关系是什么? 8. 什么叫抽样分布?其作用如何? 9. 什么叫精确分布?什么叫渐近分布? 10. χ2分布、t分布、F分布的性质。 11. 什么叫正态分布?其性质如何?
12. 为什么说不重复抽样误差总是小于而又接近于重复的抽样误差 13. 什么叫估计量?评价估计量优劣有哪些标准? 14. 矩估计法、最大似然估计法基本思想是什么? 15. 什么是概率度?什么是置信度?这两者有什么关系? 16. 点估计和区间估计有什么区别和联系? 17. 必要抽样数目的影响因素。
18. 常用的抽样组织形式有哪些?各有什么特点? 19. 进行简单随机重复抽样,假定抽样单位增加3倍,则抽样平均误差将发生如何变化?如果 要求抽样误差范围减少20%,其样本单位数应如何调整? 20. 假定10亿人口大国和100万人口小国的居民年龄变异程度相同。现在各自用重复抽样的方 法抽取本国的1%人口计算平均年龄,问两国平均年龄抽样平均误差是否相同,或哪国比较大 ? 五、计算题
1. 某钢铁厂生产某种钢管,现从该厂某月生产的500根产品中抽取一个容量为
100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。 2. 对某型号的电子元件进行耐用性能检查,抽查的资料分组如下表。又知该厂的产品质量检验标准规定,元件耐用时数达到1000小时以上为合格品。求耐用时数的平均抽样误差和合格 率的抽样平均误差。 耐用时数 元件数 900以下 1 900~950 2 950~1000 6 1000~1050 35 1050~1100 43 1100~1150 9 1150~1200 3 1200以上 1 合计 100
3. 某商店抽出36名顾客组成一个随机样本,调查他们对某种商品的需求量。根据以往的经验 , 对这种商品的需求量服从正态分布,标准差为2,从调查结果算出样本平均数为20试求总 体平均数为95%的置信区间。 4. 某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水 平,资料如下:
月平均工资(元) 524 534 540 550 560 580 600 660 工人数(人) 4 6 9 10 8 6 4 3 要求:
(1)计算样本平均数和抽样平均误差。
(2)以95. 45%的可靠性估计该厂工人的月平均工资和工资总额的区间。
5. 对一批成品按不重复方法抽取200件,其中废品8件,又知道样本单位数是成品总量的1/20 。当概率为0. 9545时,可否认为这一批产品的废品率不超过5%?
6. 采用简单随机重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求:
(1)计算样本合格率及其抽样平均误差。
(2)以95. 45%的概率保证程度对该批产品合格品率和合格品数量进行区间估计。 (3)如果极限误差为2. 31%,则其概率保证程度是多少?
7. 某土畜产品进出口公司出口一种名茶,抽样检验结果如下: 每包重量(克) 包数 148~149 10 149~15 20 150~151 50 151~152 20 合计 100
又知道这种茶叶规格重量不低于150克。试以99.73%的概率估计这批茶叶平均每包重量的范围,并确定是否达到规定重量的要求。
8. 假定某统计总体有5000个总体单位,其被研究标志的方差为400,若要求抽样极限误差不 超过3,概率保证程度为0.9545,试问采用不重复抽样应抽取多少样本单位?
9. 某一样本包含80个单位,其零件长度平均数 =69. 7mm, 若S2=3. 5,试以95%的置 信系数估计该批零件长度期望值的置信区间。
10. 设已知某果园某种果树每株产量按正态分布。随机抽取6株计算其年产量(单位:公斤)为 :221.2,190.4,201.9,205.0,256.1,236.0。试以95%的置信水平,估计全部果树的平均 年产量的置信区间。 11. 我们希望从n个观察的随机样本中估计总体均值,过去的经验显示σ=12.7。如果希望估计总体平均数正确的范围在1.6以内,概率为0.95,试问样本中应包含多少个样品?
12. 某学校随机抽查10个男学生,平均身高170厘米,标准差12厘米,问有多大把握程度估计全校男学生身高介于160.5-179.5厘米之间?
13. 一个电视节目主持人想了解观众对某个电视专题节目的喜欢情况,他选取了500个观众做样本,结果发现喜欢该节目的有175人。试以95%的概率估计观众喜欢这一专题节目的区间范围 。若该节目主持人希望估计的极限误差不超过5%,问有多大把握程度?
14. 某县收购花生,已知过去几次抽样调查合格率分别为91%、92%、93%,今年要求把握程度 为0.8664,允许误差不超过3%,问需要抽多少包花生检查? 15. 从某厂生产的一批灯泡中随机重复抽取100只,检查结果是:100只灯泡的平均使用寿命为100小时,标准差为15小时。要求:
(1)试以95.45%的概率保证程度推断该批灯泡平均使用寿命的区间。 (2)假定其他条件不变,如果将抽样极限误差减少至原来的 ,应抽取多少只灯泡进行检查?
16. 从火柴厂仓库随机抽取100盒火柴,检验结果,平均每盒火柴99支,样本标准差为3支,(1)计算可靠程度为99.73%时,该仓库平均每盒火柴支数的区间范围。(2)如果极限误差减 少到原来的1/2,则对可靠程度的要求不变,问需要抽查多少盒火柴?
17. 作为质量管理计划的一部分,某锻铁板制造商想估计每平方米产品重量的方差。由51个 样品组成的一个随机样本所给出的方差为0. 021。试求出σ2的95%置信区间。
18.某单位按重复抽样方式抽取40名职工,对其业务考试成绩进行检查,资料如下:
68 89 88 84 86 87 75 73 72 68 75 82 99 58 81 54 79 76 95 76 71 60 91 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 87
要求:(1)根据上述资料按成绩分成以下几组:60分以下,60-70分,70-80分,80-9 0分,90-100分,并根据分组整理成变量分配数列。
(2)根据整理后的变量数列,以95. 45%的概率保证程度推断全体职工业务考试成绩的区间范围。(3)若其他条件不变,将允许误差缩小一半,应抽取多少名职工?
19. 某厂有甲乙两个车间都生产保温瓶胆,乙车间技术先进,产量是甲车间的2倍,为了调查 该厂保温瓶胆的保温时间,按两车间产量比例共抽查60支瓶胆,取得资料如下表,试以95% 的可靠程度推断该厂生产的全部瓶胆的平均保温时间的可能范围。
车间 车间代码 平均保温时间(小时) 保温时间的标准差(小时) 甲 1 25 1. 2 乙 2 28 0. 8
20. 某地区有一万户家庭,按城市和农村户比例,按不重置抽样方法抽取1000户,进行彩色电视机拥有量的调查,资料如下: 家庭户分类 分类代码 抽样户 彩电拥有户比重(%) 城市 1 300 80 农村 2 700 15
试以80%的概率推断该地区彩电拥有户比重的范围。
21. 一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸广告的家庭占多大 比例。为了估计这个比例,首先要确定抽多少个家庭做调查。该公司希望以90%的置信水平对这个比例作出估计,并使估计值处在真正比例附近0.04范围之内。在一个由15个家庭组成的预备样本中,有35%的响应者指出他们家中有某个人看过这种广告,试问应抽取多大的样本?
22. 某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。调查结果,平均亩产为450公斤,亩产量的标准差为52公斤。试以95%的置信度估计该地区粮食平均亩产量和总产量的区间。
23. 某地对上年栽种一批树苗(共5000株)进行了抽样调查,随机抽查的200株树苗中有170株成活。试以95. 45%的概率估计该批树苗的成活率的置信区间和成活总数的置信区间。
24.某车间生产的螺杆直径服从正态分布N(μ,0.32),现随机抽取5只,测得直径(单位:mm)为:22.3,21.5,22.0,21.8,21.4,试求直径μ的95%的置信区间。
25. 已知某种电子管的使用寿命服从正态分布。从一批电子管中随机抽取16只,检验结果,样本平均寿命为1950小时,标准差为300小时。试求这批电子管的平均寿命及其方差、标准差的置信区间(置信度为95%)。
26. 某厂日产某电子元件2000只,最近几次抽样调查所得得产品不合格率分别为4.6%、3.5%、5%,现为了调查产品不合格率,问至少应抽查多少只产品才能以95.45%得概率保证抽样误差不超过2%?
27. 某企业对职工用于某类消费得支出进行了等比例分层抽样,调查结果如下; 青年职工 中老年职工
职工人数(人) 2400 1600 调查人数(人) 120 80 平均支出(元) 230 140 标准差(元) 60 47
试以95.45%得概率估计该企业职工平均支出和总支出得置信区间。
28. 某公司购进某种商品600箱,每箱内装5只。随机抽取30箱,并对这30箱内的商品全部进行了检查。整群抽样资料计算出合格率为95%,各箱合格率之间的方差为4%。试求合格率的抽样平均误差,并以68.3%的把握程度对这批产品的合格率作出区间估计。 第五章 假设检验 一、单项选择题
1、若总体服从正态分布,均值μ 与方差σ2均未知,H0:μ=μ0,H1:μ≠μ0,置信水平为α,采用n为大样本,则统计量Z的拒绝域为( ) A. Z<-Z B. Z>Z C. >Z D. 2、正态总体,方差 未知,对总体均值进行检验,H : ,H : ,置信水平为 ,n 为小样本,则统计量的拒绝域为: A. Z>Z B. Z<-Z C. t >t D. t<-t 3、假设检验时,如果拒绝了真实的原假设称为( ) A. 犯第Ⅰ类错误 B. 犯第Ⅱ类错误 C. 犯第Ⅰ类错误;第Ⅱ类错误 D. 犯第Ⅰ类错误的概率为β 4、生产航天飞机零部件,要求以99%的可靠性能耐高温1000℃ ,对产品质量检验时的假设应为( ) A. H : 1000℃ B. H : 1000℃ C. H : =1000℃ D. H : >1000℃ 5、要求有95%的把握次品率低于10%才能出厂,在检验时设立的假设应该是( ) A. H :P 0. 1 B. H :P=0. 1 C. H :P 0. 1 D. H :P<0. 1 6、若H : = ,H : ,抽出一个样本,其均值 < ,则( ) A. 肯定拒绝原假设 B. 有可能拒绝原假设 C. 肯定会接受原假设 D. 以上结论都不对 7、若H : ,H : > ,抽取一个样本,其均值 < ,则( ) A. 有可能拒绝原假设 B. 肯定拒绝原假设 C. 有可能接受原假设 D. 肯定接受原假设 8、在假设检验中,显著水平 是表示( ) A. 原假设为真时被拒绝的概率 B. 原假设为假时被接受的概率 C. 原假设为真时被接受的概率 D. 原假设为假时被拒绝的概率 9、在一次假设检验中当显著性水平 =0. 01H 被拒绝时,则用 =0. 05( ) A. 一定会被拒绝 B. 一定不会被拒绝 C. 可能会被拒绝 D. 需要重新检验 10、当H 用单侧检验被拒绝时,用同样的显著性水平双侧检验时( ) A. 也一定会被拒绝 B. 就不会被拒绝 C. 可能会拒绝也可能不会拒绝 D. 没有可比性 11、t检验适用于( ) A. 非正态总体用小样本对总体均值检验 B. 正态总体、方差已知的总体均值检验 C. 正态总体、方差未知的总体均值检验 D. 非正态总体用大样本的均值检验 12、假设职工用于上、下班路途的是时间服从正态分布,经抽样调查得知这一时间为1. 2小时。调查人员根据以往的调查经验,认为这一时间与往年没有多大变化。为了证实这一看法,需采用的假设检验方法是 ( ) A. 双侧检验 B. 单侧检验 C. 左单侧检验 D. 右单侧检验 二、多项选择题 1、当原假设H 为真时而拒绝H 的错误又称( ) A. 第一类错误 B. 第二类错误 C. 取伪错误 D. 弃真错误 E. 错误 2、当我们所要检验的是样本所取自总体的参数值是偏高或偏低某个特定值时,应选择( ) A. 双侧检验 B. Z检验 C. t检验 D. 左侧检验 D. 右侧检验 3、已知总体服从正态分布,H : = ;H1: ≠ 且样本方差已知,则 的否定域为( ) A. t -t B. t -t C. t t D. t -t E. t 4、以下哪一种表示属于单侧检验( ) A. H : ,H : > B. H : ,H : < C. H : = ,H : D. H : > ,H : < E. H :P P ,H :P >P 5、已知总体服从正态分布,H : = ;H1: ≠ 且总体方差 已知,则 的拒绝域为( ) A. t -t B. t -t C. z z D. z - z E. z 6、假设检验的程序是( ) A. 提出原假设 和备选假设 B. 选择显著水平 C. 确定样本统计量及其分布 D. 计算检验统计量 E. 决策 三、填空题 1、 正态总体均值的假设检验,H : = ,H : ,若总体方差 已知,样本量为n,则其检验的统计量为___________,其公式为____________,若显著性水平为 ,接受域为______________。 2、 正态总体均值的假设检验,H : ,H : < ,这种检验称作___侧检验,若显著性水平为 ,大样本,其拒绝域为_______________________。 3、 正态总体均值的假设检验,H : ,H : > ,显著性水平为 ,这种检验称作_____侧检验,若总体方差 已知,n为小样本,则检验统计量为_____________,其公式为__________,拒绝域为___________________。 4、 正态总体均值的假设检验,H : = ,H : ,称作_____侧检验,若方差未知,n为小样本,则检验的统计量为_______,其公式为___________,显著性水平为 ,拒绝域为__________________。 5、 两个正态总体的均值是否相等的假设检验,其假设为H :________________,H :_______________,若总体方差 和 已知,检验统计量为________,其公式为:_________________,显著性水平为 ,拒绝域为______________。 6、 两个正态总体均值比较的假设检验,设H : ,H : > ,两个总体的方差未知,分别的样本量n 和n 为小样本,检验的统计量为________,其计算公式为_______________,显著性水平为 ,拒绝域为_____________。 7、 两个总体比例是否相等的假设检验,n 和n 分别为大样本,设总体比例为P 和P 样本比例分别为p 和p ,则检验的统计量为_____,其公式为_________________。 8、 当原假设H 为真而被拒绝的错误称作_______________,原假设H 为假而被接受的错误称作_________________。 9、 假设检验中若其他条件不变,显著性水平 的取值越小,接受H 的可能性__________,原假设为真而被拒绝的概率__________________。 10、 称为检验的功效。其值越大说明检验功效 ,反之说明检验功效 。 11、 假设检验是利用_____________资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。 12、 在假设检验过程中,依据显著性水平的大小把概率分布划分为两个区间:小于给定标准的概率区间称为_______________;大于给定标准的概率区间称为________________。 13、 假设一般包括两部分即______________和_______________。 14、 统计假设检验依据所研究问题的性质可分为____________检验和________________检验两种类型。 15、 如果所要检验的是样本所取自总体的参数值是否大于某个特定值,应采用_____________检验,反之,若问是否小于某个特定值,则应采用____________检验。 16、 在假设检验中,Ⅰ类错误就是弃真错误,弃真是指_____________状况;Ⅱ类错误就是纳伪错误,纳伪是指_____________状况。 17、 进行假设检验时,若总体的分布形式已知,可采用____________检验;若总体的分布形式未知,可采用___________检验。 四、简答题 1. 什么是假设检验?其目的是什么? 2. 假设检验与参数估计有什么相同点和不同点? 3. 什么是假设检验中的显著性水平? 4. 假设检验中的基本步骤。 5. 假设检验依据的基本原理是什么? 6. 简述双侧检验与单侧检验的适用条件。 7. 什么是假设检验中的两类错误?它们之间存在什么关系? 8. 假设检验的P值含义? 9. 什么是参数检验与非参数检验?两者的区别是什么? 五、计算题 1. 某食品公司销售一种果酱,按标准规格每罐净重为250克,标准差为3克。现该公司从生产该果酱的工厂进了一批货,抽取其中的100罐,测得平均净重为251克。问该批果酱是符合标准?(α=0.05) 2. 某质量管理部门从一企业抽查了准备出厂的产品180件作为样本进行检查,发现其中168 件为合格品,问该企业全部产品的合格率是否达到95%?(α=0.05) 3. 一项调查结果声称某市老年人口比重为14.7%,该市老龄人口研究会为了检验该项调查是否可靠,随机抽选了400名居民,发现其中57人年龄在65岁以上。调查结果是否支持该市老 年人口比重为 14.7%的看法?(α=0. 05) 4. 已知某炼铁厂的含碳量服从正态分布N(4.55,0.1082),现在测定了9炉铁水,其平均含 碳量为4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为4. 55?(α= 0.05) 5. 一种元件,要求其寿命不得低于700小时,现从一批这种元件中随机抽取36件,测得平均寿 命为680小时。已知该元件寿命服从正态分布,б=60小时,试在显著水平0.05下定这批元件是否合格。 6. 某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤。现用一种化肥进行试验 ,从25个小区抽样结果,平均产量为270公斤。问这种化肥是否使小麦明显增产。(α=0.05) 7. 糖厂用自动打包机打包,每包标准重量是100kg。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量如下: 99.3 、 98.7、 100.5、 101.2、 98.3 、 99.7 、 99.5 、102.1、 100.5 已知包重服从正态分布,试检验该日打包机工作是否正常。 (α=0.05) 8. 某种大量生产的袋装食品,按规定不得少于250克,今从一批该食品中任意抽取50袋,发 现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,该批食品能否出厂?(α=0.05) 9. 某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下的平均寿命高于25000。 对一个由15个轮胎组成的随机样本作了试验,得到样本均值和标准差分别为27000和5000 。假定轮胎寿命服从正态分布,问该厂家的广告是否真实。(α=0.05) 10. 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问是否有理由认为元件的平均寿命显著地大于225小时。(α=0.05) 11. 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规 模是明显地超过60万元,还是维持着原来的水平。一个n=144的随机样本被抽出,测得 =68.1万元,S=45。用α=0.01的显著性水平,采用P值进行检验。 12. 某企业产品目前的平均成本为250元。现在有一种新的生产方法可能降低产品成本。由于推广新方法要付出一定的时间和费用,所以必须对新方法所生产产品抽取一个样本,通过假设检验来确信新方法是否能够降低成本。 (1) 试建立合适的原假设和备择假设。 (2) 第一类错误指什么?发生这类错误会导致怎样的结果? (3) 第二类错误指什么?发生这类错误会导致怎样的结果? (4) 发生两类错误的概率之间有何关系? 13. 对总体参数进行假设检验时,若在1%的显著性水平下拒绝了原假设,下列说法哪些是错误的?为什么? (1) 原假设不成立而备择假设才是正确的; (2) 总体参数的真值与原假设有很大差异; (3) 检验P值小于1%。 14. 一种电子元件,要求其使用寿命不得低于1000小时。已知这种元件的使用寿命服从标准差为100小时的正态分布。现从一批元件种随机抽取25件,测得平均使用寿命为958小时。试在0.05的显著性水平下,确定这批元件是否合格。 15. 在正常生产情况下,某厂生产的一种无缝钢管的内径服从均值为54mm、标准差为0. 9mm的正态分布。从某日生产的钢管种随机抽取9根,测得其内径分别为: 53.8, 55.1, 54.2, 52.1, 54.2, 55.0, 55.8, 55.4, 55.5 (单位:mm) 试在0.05得显著性水平下检验该日产品得生产是否正常?[提示:对均值和标准差(或方差)都要检验。] 16. 某企业管理者认为,该企业职工对工作环境不满意得人数至少占职工总数得1/5。随机抽取了100人,调查得知其中有26人对工作环境不满意。试问: (1) 在0.10的显著性水平下,调查结果是否支持这位负责人的看法? (2) 若检验的显著性水平位0.05,又有何结论? (3) 检验P值是多少? 17. 某种导线要求其电阻的标准差不得超过0.005欧姆。今从一批导线中抽取样品9根,测得样本得标准差为0.007欧姆。设总体为正态分布,试问在0.05得检验水平下能否认为这批导线的电阻的标准差显著偏大? 18. 近几年某地区大学一年级学生英语4级考试成绩的均值为73分,方差为220.5。今年随机抽取由200名学生组成一个样本,样本均值为71.15分,试问当显著性水平为5%时, (1) 今年学生考试成绩与往年是否处于同一水平? (2) 今年学生考试成绩是否比往年由显著下降? (3) 上述两种检验有何不同?为什么? (4) 利用置信区间的方法对(1)进行检验。 第六章 方差分析 一、 单选题 1、方差分析是( ) A.对一个总体均值的检验 B.对一个总体离散趋势的检验 C.对多个总体均值是否相等进行检验 D.对多个总体均值是否不等进行的检验 2、方差分析要求各水平下的样本容量( ) A. 可以相同 B. 可以不同 C. 既可以相同也可以不同 D. 无所谓 3、总离差平方和反映了离差平方和的总体情况,则( ) A. SST= B. SST= C. SST= D. SST= 4、误差项离差平方和反映的是水平内部或组内观察值离散情况,则( ) A. SSE= B. SSE= C. SSE= D. SSE= 5、水平项离差平方和反映的是组间差异,则( ) A. SSA= B. SSA= C. SSA= D. SSA= 二、填空题 1、方差分析是对________这一假设进行检验。 2、________是一个独立的变量,也是方差分析研究的对象。其内容称为________。 3、在方差分析中,通常假定各个水平的观察数据是来自于服从________ 总体中的随机样本,各个总体相互 ________,且方差 ________。 4、观察值之间存在着差异,差异的产生来自于两个方面,一方面是由因素中的 不同 ________ 造成的,对此我们可以称为 ________ 差异;另一方面是由于抽样的随机性而产生的差异。两个方面产生的差异可以用两个方差来计量,一个称为________的方差,一个称为 ________的方差。前者既包括 ________,也包括________。后者仅包括 ________。 5、如果不同的水平对结果没有影响,那么在水平之间的方差中,就仅仅有________ 的差异,而没有________差异,它与水平内部方差就应该 ________ ,两个方差的比值就会接近于 ________ ;反之,如果不同的水平对结果产生影响,在水平之间的方差中就不仅包括了________,也包括 ________。这时,该方差就会________ 水平内方差,两个方差的比值就会显著地________ 许多,当这个比值大到某个程度,或者说达到某________,就可以做出判断,说不同的水平之间存在着显著性差异。 6、在单因素方差分析中,离差平方和有三个,它们分别是________,________和________。 7、对SST来说,其自由度为________,因为它只有一个约束条件,即 ________。 8、SSA来说,其自由度为________,SSA反映的是组间差异,它也有一个约束条件,即要求 ________。 9、对SSE来说,其自由度为________。 10、与离差平方和一样,SST、SSA、SSE之间的自由度也存在着如下关系________。 三、简答题 1. 简述方差分析的基本原理。 2. 简述方差分析的步骤。 3. 说明单因素方差分析中SST、SSE、SSA的含义及三者之间的关系。 4. 简述因素、水平、试验指标、单因素方差分析、多因素方差分析、等重复方差分析、不等重复方差分析。 5. F分布及特征。 四、计算题 1. 进行某种农作物栽培试验,选用五种不同品种,每一品种在四块试验田上试种,亩产量如下:五种品种在四块田上的亩产量 A1 A2 A3 A4 A5 1 256 244 250 288 206 2 222 300 277 280 212 3 280 290 230 315 220 4 298 275 322 259 212 试考察“品种”这一因素对农作物的产量是否有显著影响(α=5%)。 2. 设有三台同样规格的机器,用来生产厚度为0. 250厘米的铝板。为了解各台机器产品的平均厚度是否相同,取样测至10-3(厘米),结果如下表 机器编 号 Ⅰ Ⅱ Ⅲ 1 0.236 0.257 0.258 2 0.238 0.253 0.264 3 0.248 0.255 0.259 4 0.245 0.254 0.267 5 0.243 0.216 0.262 问:这三台机器的产品在α=0.05下有无显著差异? 3. 某商店采用四种不同的方式推销商品。为检验不同方式推销商品的效果是否 有显著差 异,随机抽取样本,得到如下数据: 方式一 方式二 方式三 方式四 77 95 72 80 86 92 77 84 80 82 68 79 88 91 82 70 84 89 75 82 要求:计算F统计量,并以α=0. 05的显著性水平作出统计决策。 4. 五个地区每天发生交通事故的次数如下: 东部 北部 中部 南部 西部 15 12 10 14 13 17 10 14 9 12 14 13 13 7 9 11 17 15 10 14 - 14 12 8 10 - - - 7 9 由于是随机抽样,有一些地区的样本容量较多(如南部和西部),而有些地区样本容量较少( 如东部)。试以α=0. 01的显著性水平检验各地区平均每天交通事故的次数是否相等。5. 将24家生产产品大致相同的企业,按资金分为三类,每个公司的每100元销售收入的生产成本(单位:元)如下表。这些数据能否说明三类公司的市场生产成本有差异?(α=0. 05) 20~30 30~50 50以上 69 75 77 72 76 80 70 72 75 76 70 86 72 80 74 72 68 86 66 80 80 72 74 83 6. 有四种小麦品种,分别种在面积相同的五块土地上,测得收获量如下: 地块A地块B A1 A2 A3 A4 A5 B1 32.3 34.0 34.7 36.0 35.5 B2 32.2 33.6 36.8 34.3 36.1 B3 30.8 34.4 32.3 35.8 32.8 B4 29.5 26.2 28.1 28.5 29.4 问:不同品种小麦和不同地块对产量有无显著影响?(α=0. 01) 7. 为了解三种不同配比的饲料对仔猪生长影响的差异,对三种不同品种的仔猪各选三头进行 试验,分别测得它们的体重增加的重量如下表: 因素B(品种)因素A(饲料) B1 B2 B3 A1 51 56 45 A2 53 57 49 A3 52 58 47 假定其体重增长量服从正态分布,且各种配合的方差相等,试分析不同饲料与不同品种对仔 猪的生长有无显著影响?(α=0. 05) 8. 某商品不同的装潢,在五个地区销售。销售资料如表所示: 地区(因素B),装潢(因素A,)试以α=0.05的显著水平检验该商品不同的装潢和在不同的地区销售数量之间是否有显著差异。 A A A B 41 45 34 B 53 51 44 B 54 48 46 B 55 43 45 B 43 39 51 第七章 相关与回归分析 一、单项选择题 1. 相关关系与函数关系的区别就在于( ) A. 相关关系是指变量之间存在的相互依存关系,而函数关系是因果关系 B. 相关关系是指两个变量之间的具体关系值是不变的,而函数关系则是变动的 C. 相关关系是指两个变量之间的具体关系值是变动的,而函数关系是不变的 D. 相关关系是模糊的,函数关系是确定的 2. 回归分析中简单回归是指( ) A. 时间数列自身回归 B. 变量之间的线性回归 C. 两个变量之间的回归 D. 两个变量之间的线性回归 3. 相关系数的取值范围是( ) A. 0≤r≤1 B. —1≤r≤0 C. r>0 D. —1≤r≤1 4. 简单线性回归模型的理论假设为( ) A. 有效性、无偏性、一致性、随机性 B. 无偏性、等方差性、独立性、正态性 C. 大量性、同质性、差异性、可比性 D. 无偏性、有效性、相关性、独立性 5. 在多元线性回归分析中,随着自变量个数的增加,SSR( ) A. 随之增大 B. 随之缩小 C. 不变 D. 为1 6. 产品产量与单位成本的相关系数是—0. 85,单位成本与利润率的相关系数是0.90,产量与利润的相关系数是0.80,因此( ) A. 产量与利润的相关程度最高 B. 单位成本与利润率的相关程度最高 C. 产量与单位成本的相关程度最高 D. 看不出哪对变量的相关程度高 7. 估计标准差是( ) A. 说明平均数代表性的指标 B. 说明现象之间相关关系的指标 C. 说明回归直线代表性的指标 D. 说明抽样误差平均程度的指标 8. 对小样本的相关系数的检验使用( ) A. B. t检验 C. Z检验 D. F检验 9. 变量x与y之间的负相关是指( ) A. x值增大时y值也随之增大 B. x值减少时y值也随之减少 C. x值增大时y值随之减少,或x值减少时y值随之增大 D. y的取值几乎不受x取值的影响 10. 如果相关系数r=0,则表明两个变量之间存在着( ) A. 相关程度低 B. 不存在任何关系 C. 不存在线性相关关系 D. 存在非线性相关关系 11. 如果相关系数│r│=1,则表明两个变量之间存在着( ) A. 正相关 B. 完全正相关 C. 完全负相关 D. 完全正相关或完全负相关 12. 根据你的判断,粮食单位面积产量与施肥量之间的关系为( ) A. 线性相关关系 B. 非线性相关关系 C. 完全相关关系 D. 负相关关系 13. 根据最小二乘法配合直线回归方程是使( ) A. B. C. D. 14. 如果两个变量之间存在着负相关,指出下列回归方程中哪个肯定有误( ) A. B. C. D. 15. 对居民收入(x)与消费支出(y)的几组不同样本数据配合的直线回归方程如下,你认为哪个回归方程可能是正确的( ) A. B. C. D. 16. 在一元线性回归分析中,检验回归方程线性关系的显著性采用的统计量是( ) A. B. C. D. 17. 在一元线性回归方程 中,回归系数b的实际意义是( ) A. 当x=0时,y的期望值 B. 当x变动一个单位时,y的平均变动数额 C. 当x变动一个单位时,y增加的总数额 D. 当y变动一个单位时,x的变动平均变动数额 18. 在回归分析中,F检验主要是用来检验( ) A. 相关系数的显著性 B. 回归系数的显著性 C. 线性关系的显著性 D. 估计标准误差的显著性 19. 设某产品产量为1000件时平均总生产成本为60000元,其中不变成本为10000元,则总生产成本(y)对产量(x)的一元线性回归方程为( ) A. B. C. D. 20. 若已知 , , , ,n=100,则直线回归方程 ( ) A. 5.4+0.2736x B. 5.4+0.2736x C. 5.4-0.2739x D. -5.4-0.2736x 21. 对不同年份的产品成本配合的直线方程为 ,回归系数b= -1.75表示( ) A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75个时间单位 D. 时间每减少一个单位,产品成本平均增加1.75个单位 22. 在多元线形回归模型中,若自变量 对因变量y的影响不显著,那么它的回归系数 的取值( ) A. 可能为零 B. 可能为1 C. 可能小于零 D. 可能大于1 23. 设产品产量与产品单位成本之间的线形相关系数相关系数为-0.87,这说明二者之间存在着( ) A. 高度相关 B. 中度相关 C. 低度相关 D. 极弱相关 24. 若已知 是 的2倍, 是 的1.2倍,则相关系数r等于( ) A. B. C. 0.92 D. 0.65 25. 说明回归方程拟合程度的统计量是( ) A. 相关系数 B. 回归系数 C. 判定系数 D. 估计标准误差 26. 各实际观测值 与回归值 的离差平方和称为( ) A. 总变差平方和 B. 剩余平方和 C. 回归平方和 D. 判定系数 27. 在直线回归方程 中,若回归系数b=0。则表示( ) A. y对x的影响是显著的 B. y对x的影响是不显著的 C. x对y的影响是显著的 D. x对y的影响是不显著的 28. 若两个变量之间完全相关,在以下结论中不正确的是( ) A. B. C. D. 回归系数b=0 29. 如果变量x与y之间没有线形相关关系,在以下结论中不正确的是( ) A. 相关系数r=0 B. 回归系数b=0 C. 判定系数 D. 二、多项选择题 1. 设r为X与Y的相关系数,则有( ) A. B. r=0则x和y独立 C. 若x和y独立,则r=0 D. r=0,则x和y不相关 E. 2. 在相关关系各现象之间( ) A. 一定存在严格的依存关系 B. 存在关系,但不确定 C. 存在着不明显的因果关系 D. 存在着不固定的依存关系 E. 存在着明显的因果关系 3. 多元线形回归模型的理论假设为( ) A. 无偏性 B. 等方差性 C. 独立性 D. 有效性 E. 正态性 4. 估计标准误差是反映( ) A. 回归方程的代表性指标 B. 自变量数列的离散程度指标 C. 因变量数列的离散程度指标 D. 因变量估计值的可靠程度指标 E. 因变量数列的集中程度指标 5. 相关系数的计算公式有( ) A. B. C. D. E. 三、填空题 1. 按变量的性质,相关关系可分为 和 。 2. 判定两变量之间的相关程度和相关方向最简单、最直观的方法是 、 。 3. 相关系数等于1,表明两变量之间 ,相关系数等于—1,表明两变量之间 。 4. 简单先行回归模型的理论假设可概括为 、 、独立性、正态性。 5. 回归方程只能用于由 推算 。 6. 直线回归中,总变差等于 和 之和。 7. 多元线性回归模型的统计推断内容有:模型的总检验、 和 。 8. 回归方程的总检验是判断自变量全体与因变量之间的 是否显著,而 则是进一步判断某一自变量与因变量之间是否存在显著的线性相关关系。 9. 在由积差法测定相关系数时,相关系数r取正或负只决定于 ,r的符号与 的符号保持一致。 10. 在估计方程 称为 ,又称为 。 11. 多元线性回归模型的理论假设主要有无偏性、等方差性、 、 。 12. 若Y为每亩蔬菜产量(单位:百公斤),X为每亩地施肥量(单位:公斤)。已知 并已知每亩地最高稿施肥量为70公斤,最低施肥量为35公斤,那么每亩地蔬菜产量的大致变动范围是 到 。 13. 在线性相关中,如果两个变量的变动方向相同则称为 ;如果两个变量的变动方向相反则称为 。 14. 用于描述变量之间关系形态的图形称为 ;用于度量变量之间关系密切程度的量称为 。 15. 相关系数r的取植范围是 ;判定系数 的取植范围是 。 16. 若变量x与y之间为完全正相关,则相关系数r= ;若变量x与y之间为完全负相关,则相关系数r= ;若x与y之间不存在线性相关关系,则r= 。 17. 检验回归系数的显著性时,只涉及一个自变量的回归称为 ;涉及多个自变量的回归称为 。 18. 因变量的观察值 与其平均值 的总变差由两部分组成,其中回归值 与均值 的离差平方和称为 ;观察值 与回归值 的离差平方和称为 。 19. 回归平方和(SSR)占总变量平方和(SST)的比例称为 ,它测度了回归直线对各观测数据的 。 20. 回归方程的假设检验通常包括两方面的内容:一是 检验,二是 检验。 21. 对于两个变量x和y,若已 =1239, =879, =11430, =17322,n=100,则一元线性回归方程的回归系数b= 。 四、简答题. 1. 简单回归分析意味着什么? 2. 回归直线的Y截距是X=0时直线和Y轴的交点。在脂肪/热量的例子中Y截距是什么?解释这个数使得一个节食者能够明白。 3. 如果发现散点图中的所有点都在回归直线上,对于下面几个问题你能得出什么样的结论?○1自变量和因变量的关系?○2残差变量对因变量的效应?○3X和Y的相关系数。 4. 比较回归分析和相关分析的优点,在分析两个数值变量时,这两种方法各有什么特别的地方? 5. 在一个实验中扩展X变量的值会对相关系数有何影响?这时相关系数的P值 有影响吗? 6. 在一个散点图上,哪个变量在X轴上,哪个变量在Y轴上?你想作关于反对抽烟的商业广告的播放次数和看电视的高中生的戒烟率和数据的散点图吗?哪个变量应作为X轴?如果两个变量时正相关时,散点图看上去是什么样子? 7. 相关关系与函数关系有何区别与联系? 8. 简述相关关系的判别方法。 9. 说明相关系数的取值范围及其判断标准。 10.什么是估计标准误差?有什么作用? 11. 简单相关、复相关、以及偏相关的含义是什么?请写出其计算公式。 12. 因变量y的总变差、回归变差和剩余变差分别反映什么问题? 13. 协方差能否反映变量之间的相关程度?在相关系数r的计算中 x和 y的作用是什么? 14. 相关系数与判定系数之间有何区别和联系? 15. 随机误差项(u)有哪几种基本假定?u与残差e有什么区别? 16. 什么是总体回归函数?什么是样本回归函数?它们之间有什么区别和联系? 17. 为什么说最小二乘估计量β是总体回归系数β的无偏估计量? 18. 回归模型检验的种类有哪些?解释其含义。 19. 什么是多元线性回归预测法?其模型的检验方法有哪些? 20. 什么是非线性回归预测法?常见的非线性回归模型有哪些? 21. 什么是相关指数?在何种场合应用? 22. 试证明最小二乘估计量 是标准一元线性回归模型中总体回归系数β1的无偏估计量。 23. 设x为自变量,y为因变量,Sy为y对x的估计标准误差,r为x与y之间的简单相关系数。 试推导关系式:Sy= 24. 应用相关分析与回归分析应注意哪些问题? 25. 已知 、 两变量( =15, =41),y对x的回归直线方程为 =a+bx,当x=0 时x =5,又知σx=1. 5,σy=6。试求y对x的估计标准误差。 26. 设x为自变量,y为因变量,当y对x的估计标准误差Sy在y的标准差中所占的比重由50%降低为40%时,问简单相关系数r如何变化? 五、计算题 1. 在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期 内的价格与需求量进行观察,得到如表所示的一组数据。 价格x(元) 10 6 8 9 12 11 9 10 12 7 需求量y(吨) 60 72 70 56 55 57 57 53 54 70 要求: (1)计算价格与需求量之间的简单相关系数,并说明相关方向和程度。 (2)拟合需求量对价格的回归直线,并解释回归系数的实际含义。 (3)计算判定系数r2和估计标准误差Sy,说明回归直线的拟合程度。 2. 设x为自变量,y为因变量,σy是σx的1/2而Sy又是σy的1/2。试求回归系数b。 3. 设x为自变量,y为因变量,n为样本容量,回归直线方程为 =a+bx;又知相 关系数为0.8 , 是σx=1/2σy,∑x/n=20,∑y /n =50。试求回归直线方程。 4. 设销售收入x为自变量,销售成本y为因变量。现已根据某百货公司12个月的有关资料计算出以下数据:(单位:万元) ∑(x- )2=425053.73 =647.88 ∑(y- )2=262855.25 =549.80 ∑(y- )(x- )=334229.09 要求: (1)拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。 (2)计算可决系数和回归估计的标准误差。 (3)对β2进行显著水平为5%的显著性检验。 (4)假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给置信度为95%的预测区间。 5. 某工厂管理人员要对工人使用老操作方法完成某项工作的时间(X)与使用新操作方法完成 同样工作的时间(Y)之间的关系进行回归分析。用随机方法抽选20名工人进行测试,结果如下表。单位:分钟 i Xi Yi i Xi Yi i Xi Yi i Xi Yi 1 5.5 3.1 6 6.2 2.7 11 4.9 2.0 16 4.3 1.4 2 4.8 2.3 7 6.0 3.4 12 5.4 2.9 17 5 2.0 3 4.7 3.0 8 5.2 2.6 13 5.0 2.3 18 5.9 3.8 4 3.9 1.9 9 4.7 2.8 14 6.3 3.2 19 4.1 2.2 5 4.5 2.5 10 4.3 1.6 15 4.6 1.8 20 4.7 1.5 假若回归模型yi=β0+β1xi+εi是适用的,请完成下列要求: (1)求β0和β1的最小平方估计值,写出回归函数估计式。 (2)求σ2ε的无偏估计量的样本值。 (3)画出回归函数估计式和样本数据,估计式对样本数据拟合得好吗? (4)检验回归效果的显著性(显著性水平0.05)。 (5)检验回归系数β1是否显著不等于零(显著性水平0.05)。 (6)如果某工人用老操作方法完成这种工作需用的时间是5.7分钟,试计算他用新操作方法完 成这项工作需用时间的点估计值以及期望的置信区间(置信概率0.95)。 6.为研究家庭收入和食品支出的关系,随机抽取了10个家庭的样本,得到数据如表。 10个家庭的月收入额与食品支出额数据 单位:百元 家庭 1 2 3 4 5 6 7 8 9 10 收入 20 30 33 40 15 13 26 38 35 43 支出 7 9 9 11 5 4 8 10 9 10 试根据这些数据: (1)建立收入和支出之间的回归方程,并解释结果。 (2)测定回归方程的拟合程度。 (3)以α=0.05的显著水平对回归系数进行检验。 (4)以α=0.05的显著水平对回归方程的 解释能力进行检验。 (5)以95%的置信水平估计当家庭收入为4200元时,平均食品支出额的置信区间。 7. 某糖业烟酒公司历年国内纯销售额的多少,主要决定于该市消费品购买力的 大小,已知19 92-2000年该公司的纯销售额和消费品购买力资料如下: 年份 1992 1993 1994 1995 1996 1997 1998 1999 2000 纯销售额(千万元) 1.86 2.20 2.28 2.47 2.89 3.03 3.51 3.87 4.09 消费品购买力(亿元) 1.75 1.91 2.17 2.54 3.17 3.47 3.96 4. 40 4.78 根据以上统计资料要求: (1)建立纯销售额与消费品购买力的回归方程。 (2)检验回归方程的显著性。 (3)若预测2004年该市消费品购买力5.16亿元,求纯销售额以95%的置信水平的预测范围。 8. 下面是一个企业的广告费支出与销售额资料:单位:万元 广告费 600 400 800 200 500 销售额 5000 4000 7000 3000 6000 (1)求销售额与广告费间的回归方程。 (2)以α=0.05检验回归系数的显著性。 (3)计算广告费支出与销售额间的相关系数,判定系数。 (4)若下月投入700万元的广告费,估计销售额有多少? 9.为研究收入与受教育程度之间的关系,现抽取一个包括20个人的随机样本,得到资料如下表: 编号 受教育程(年) 平均年收入(美元) 编号 受教育程度(年) 平均年收入(美元) 1 2 5012 11 12 21690 2 4 9680 12 13 24750 3 8 28430 13 14 30100 4 8 8774 14 14 24798 5 8 21008 15 15 28532 6 10 26565 16 15 26000 7 12 25428 17 16 38908 8 12 23113 18 16 22050 9 12 22500 19 17 33060 10 12 19456 20 21 48276 要求: (1)画出收入与受教育程度之间的相关图。 (2)求出收入与受教育程度之间的回归方程。 (3)当显著水平为5%时,对回归方程进行统计检验。 (4)当显著水平为5%时,对回归参数进行统计检验。 (5)当置信概率为95%时,对回归参数进行区间估计。 (6)当置信概率为95%时,求出受教育程度为10年的年收入的估计区间。 (7)计算判定系数和相关系数。 10. 有资料如下: 编号 受教育程度(年) 工作经历(年) 平均年收入(千美元) 编号 受教育程度(年) 工作经历(年) 平均年收入(千美元) 1 2 9 5.0 11 12 7 21.7 2 4 18 9.7 12 13 9 24.8 3 8 21 28.4 13 14 12 30.1 4 8 12 8.8 14 14 17 24.8 5 8 14 21.0 15 15 19 28.5 6 10 16 26.6 16 15 6 26.0 7 12 16 25.4 17 16 17 38.9 8 12 9 23.1 18 16 4 22.1 9 12 18 22.5 19 17 1 23.1 10 12 5 19.5 20 21 17 48.3 试根据上述资料: (1)求出经验回归方程。 (2)对回归参数进行区间估计(α=5%)。 (3)对回归模型进行总检验和偏检验(1-α=95%)。 (4)求出接受正式教育10年,并且已工作20年的该批人口年收入平均值的95%置信区间。 (5)在置信度为95%时,预测按受正式教育10年,并且已工作20年的年收入。 (6)计算复相关系数及各种偏相关系数。 11. 对32炉合金钢的成分与性能进行了测定,得出合金钢的含碳量(单位:%)与抗拉强度(单位:公斤/毫米2)的实测数据如下: 含碳量X(%) 抗拉强度Y(公斤/毫米2) 含碳量X(%) 抗拉强度Y(公斤/毫米2) 0.04 41.5 0.13 47.5 0.05 40.0 0.14 47.5 0.06 43.0 0.14 49.0 0.07 42.5 0.15 49.0 0.08 41.5 0.15 49.0 0.08 42.0 0.16 48.0 0.09 43.5 0.16 51.0 0.09 44.5 0.17 53.0 0.10 44.0 0.18 50.0 0.10 41.5 0.20 52.5 0.11 42.5 0.21 56.0 0.12 46.5 0.23 60.0 0.12 44.0 0.24 56.0 0.13 44.5 0.24 53.0 0.13 49.5 0.25 54.5 要求: (1)求相关系数r。 (2)求y对x的线性回归方程。 (3)计算估计标准误差。 (4)当含碳量为0.15(%)时,试以0.9545的概率推断抗拉强度(公斤/毫米2)的置信区间。 第八章 时间序列 一、单选题 1. 时间序列的构成要素是( ) A. 变量和次数 B. 时间和指标数值 C. 时间和次数 D. 主词和宾词 2. 序时平均数中的“首尾折半法”适用于计算( ) A. 时期数列的资料 B. 间隔相等的时点数列的资料 C. 间隔不等的时点数列的资料 D. 由两个时期数列构成的相对数时间序列资料 3. 时间序列中的发展水平( ) A. 只能是绝对数 B. 只能是相对数 C. 只能是平均数 D. 既可以是绝对数,也可以是相对数或平均数 4. 间断的时点数列计算序时平均数,是假定研究现象在相邻两个时点之间的变动是( ) A. 间断的 B. 连续的 C. 均匀的 D. 稳定的 5. 下列时间序列分析指标中,不取负值的是( ) A. 增长量 B. 发展速度 C. 增长速度 D. 平均增长速度 6. 若无季节变动,则季节比率应为( ) A. 0 B. 1 C. 大于1 D. 小于1 7. 已知同一指标不同年度的数值顺序排列,欲求季节比率,则( ) A. 用原始资料平均法 B. 用移动平均趋势剔除法 C. 上述两种方法都可以 D. 上述两种方法都不可以 8. 用几何平均法计算平均发展速度,它的大小取决于( ) A. 最末水平的大小 B. 最初水平的大小 C. 总速度的大小 D. 各期发展水平总和的大小 9. 如果时间序列二级增长量大体相同,应拟合( ) A. 直线 B. 二次曲线 C. 三次曲线 D. 指数曲线 10. 在时点数列中,称为间隔的是( ) A. 最初水平与最末水平之间的距离 B. 最初水平与最末水平之间 C. 两个相邻指标在时间上的距离 D. 两个相邻指标数值之间的距离 11. 对时间数列进行动态分析的基础指标是( ) A. 发展水平 B. 平均发展水平 C. 发展速度 D. 平均发展速度 12. 序时平均数与一般平均数的共同点是( ) A. 两者均是反映同一总体的一般水平 B. 都是反映现象的一般水平 C. 两者均可消除现象波动的影响 D. 共同反映同质总体在不同时间上的一般水平 13. 某企业生产某种产品,其产量年年增加5万吨,则该产品产量的环比增长速度( ) A. 年年下降 B. 年年增长 C. 年年持续不变 D. 无法做结论 14. 若要观察现象在某一段时期内变动的基本趋势,需测定现象的( ) A. 季节变动 B. 循环变动 C. 长期趋势 D. 不规则变动 15. 假定被研究现象基本上按不变的发展速度发展,为描述现象变动的趋势,借以进行预测,应拟合的合适方程( ) A. 直线趋势方程 B. 二次曲线方程 C. 指数曲线方程 D. 直线或曲线方程均可 16. 说明现象在较长时期内发展的总速度的指标是( ) A. 环比发展速度 B. 平均发展速度 C. 定基发展速度 D. 定基增长速度 17. 增长量同作为比较基准的数列水平之比,就是( ) A. 总速度 B. 平均速度 C. 发展速度 D. 增长速度 18. 最基本的时间序列是( ) A. 时点数列 B. 绝对数时间数列 C. 相对数时间数列 D. 平均数时间数列 19. 时间数列中,每次指标数值可以相加的是( ) A. 相对数时间数列 B. 时期数列 C. 平均数时间数列 D. 时点数列 20. 由连续时点数列计算序时平均数的公式为( ) A. B. C. D. 二、多项选择题 1. 下列社会经济现象属于时期数列的有( ) A. 某商店各月商品库存额 B. 某商店各月实现的销售额 C. 某企业某年各季度产值 D. 某企业某年各月末人数 E. 某地区各年新增人口数 2. 时间数列的水平分析指标有( ) A. 发展速度 B. 发展水平 C. 平均发展水平 D. 增减量 E. 平均增减量 3. 平均发展水平一般也称为( ) A. 平均增减量 B. 动态平均数 C. 平均增减速度 D. 序时平均数 E. 平均发展速度 4. 计算平均发展速度的方法有( ) A. 几何平均法 B. 简单序时平均法 C. 方程法 D. 加权序时平均法 E. 首尾折半法 5. 直线趋势方程中的参数b是表示( ) A. 趋势值 B. 趋势线的截距 C. 趋势线的斜率 D. 当t=0时 的数值 E. 当t每变动一个单位时, 平均增减的数值 6. 下列哪些属于序时平均数( ) A. 一季度平均每月的职工人数 B. 某产品产量某年各月的平均增长量 C. 某企业职工第四季度人均产值 D. 某商场职工某年月平均人均销售额 E. 某地区近几年出口商品贸易额平均增长速度 7. 平均发展速度从广义上讲属于( ) A. 静态平均数 B. 动态平均数 C. 序时平均数 D. 几何平均数 E. 调和平均数 8. 定基增减速度等于( ) A. 环比增减速度的连乘积 B. 累积增减量除以固定基期水平 C. 定基发展速度减1(100%) D. 逐期增减量除以固定基期水平 E. 环比发展速度连乘积减去100% 9. 适合于计算平均发展速度的几何平均法公式要求的算式有( ) A. B. C. D. E. 10. 计算季节比率通常用( ) A. 按月(季)平均法 B. 移动平均法 B. 移动平均趋势剔除法 D. 时距扩大法 E. 最小平方法 三、填空题: 1. 时间数列的两个构成要素是 和 。 2. 在时间数列中, 是基本数列, 是派生数列。 3. 绝对数时间数列按其指标性质不同,分为 和 。 4. 平均发展速度的计算方法有两种: 和 。 5. 序时平均数所平均的是社会经济现象在 的数量差异,而一般平均数所平均的则是社会经济现象在 的数量差异。 6. 移动平均修匀时间数列时,移动平均的时距越长,修匀数列比原数列越 ,而其所表现的长期趋势越 。 7. 环比发展速度和定基发展速度的关系可以表述为 。 8. 逐期增长量和累计增长量的关系可以表述为 。 9. 计算平均发展速度,由于总速度不等于各年环比发展速度的 ,而是等于各年环比发展速度的 ,所以 不能应用 法,通常要应用 法。 10. 几何法计算的平均发展速度仅受 和 的影响,不受 影响。它的三个计算公式是:⑴ ________⑵ ⑶ 。 11. 在使用移动平均法测定长期趋势时,若现象的变化存在着周期性,则时间数列间隔以 为逐项移动的时间长度。 12. 增长速度的计算方法有两种:⑴ ⑵ 。 13. 平均发展速度是对各期 速度求平均的结果,它也是一种 平均数。 14. 测量季节变动的方法有两大类:一类是 ,另一类是 。 15. 时间序列的总变动Y可以分解为以下四种变动形式:T、S、C、I。当四种变动因素是互相影响的关系,Y= ,当四种变动因素是相互独立的关系,Y= 。 四、简答题 1. 简述时间序列的概念和种类。 2. 编制时间序列的基本原则是什么? 3. 时期数列与时点数列有什么区别? 4. 什么是序时平均数?它与一般平均数有什么相同点和不同点? 5. 根据时点序列计算序时平均数的基本思想是什么? 6. 什么叫逐期增长量和累计增长量?二者有什么换算关系? 7. 什么叫定基发展速度和环比发展速度?二者有什么换算关系? 8. 试对计算平均发展速度的几何平均法和方程式法作一比较,指出它们的基本