《统计学原理》练习题 下载本文

第一章 总论

一、单项选择题

1.一个总体单位( C )

A.只有一个标志 B.只有一个指标 C.可有多个标志 D.可有多个指标 2.考察全国的工业的情况时,以下标志中属于不变标志的是( D ) A.产业分类 B.职工人数 C.劳动生产率 D.所有制 3.要考察全国居民的人均住房面积,其统计总体是( A )

A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 4.社会经济统计学的研究对象是( B ) A.社会经济现象的数量方面 B.统计方法 C.社会经济的内在规律 D.统计工作

5.有5名工人其月工资分别为200,250,300,350,400元,这五个数据是( B ) A.变量 B.变量值 C.总体单位 D.标志 6.现要了解某机床厂的经营情况,该厂的产量和利润是( D ) A.都是连续变量 B.都是离散变量

C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 7.下列叙述中,采用推断统计的方法是( B ) A.用饼图描述某企业职工的学历构成

B.从某果园中采摘36个橘子,用这36个橘子的平均重量估计果园中橘子的平均重量 C.一个城市在1月份的平均汽油价格 D.反映大学生统计学成绩的条形图 8.以下属于截面数据的是( )

A. 1981—2010年各年某地区20个乡镇的平均工业产值 B. 1981—2010年各年某地区20个乡镇的各镇工业产值 C. 2010年某地区20个乡镇工业产值的合计数 D. 2010年某地区20个乡镇各乡镇的工业产值 9.下列标志具体表现中,属于顺序数据的是( )

A.年龄 B.购买商品的支付方式(现金、信用卡、支票) C.汽车产量 D.对某改革措施的态度(赞成、中立、反对)

1

班级 10会4班 姓名 马瑶 学号 110508611

10.劳动生产率是( )

A.动态指标 B.流量指标 C.质量指标 D.强度指标 11.下列指标属于结构相对数的是( )

A.人均粮食产量 B.产品合格率 C.储蓄与消费的比例 D.职工平均工资 12.人口数和出生人数( )

A.前者是时期指标,后者是时点指标 B.前者是时点指标,后者是时期指标 C.两者都是时期指标 D.两者都是时点指标

13.某企业2010年计划要求成本降低3%,实际降低5%,则计划完成程度为( ) A.97.94% B.166.67% C.101.94% D.1.94%

14.某企业2010年计划要求销售收入增长8%,实际增长12%,则超额完成计划程度为( )

A.103.70% B.50% C.150% D.3.7% 15.考察全国的工业企业基本情况时,以下标志中属于不变标志的是( ) A.产业分类 B.所有制 C.职工人数 D.劳动生产率 二、判断题

1.统计学是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。( )

2.描述统计是用文字和图表对客观世界进行表述。( ) 3.对于有限总体不必应用推断统计方法。( ) 4.社会经济统计问题属于有限总体问题。( )

5.统计研究方法的具体性是统计学区别于数学重要特性。( )

6.一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。( ) 三、问答题

1.简述标志和指标的区别和联系。

2.简述统计的三种含义及其相互之间的关系。

2

3.以一实例说明总体的同质性与差异性的具体表现,并阐明两者的辩证关系。

4.一家研究机构从IT行业中随机抽取1000人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。问:

(1)这一研究的总体是什么?

(2)“月收入”和“消费支付方式”分别属于“分类变量、顺序变量还是数值变量?

(3)这一研究涉及的是截面数据还是时间序列数据?

3

第二章 统计数据的搜集与整理

班级 姓名 学号 一、单项选择题

1.下列调查中属于连续性调查的是( )

A.每隔10年进行一次人口普查 B.对近年来物价变动情况进行一次摸底调查 C.对2010年大学毕业生分配状况的调查 D.按旬上报钢铁生产量

2.第六次人口普查的标准时点是2010年11月1日零点,11月2日调查人员在各家调查时,得知王家10月31日出生一小孩,李家11月1日出生一小孩,则这两个小孩如何登记?( )

A.两家小孩均登记 B.两家小孩均不予登记

C.王家小孩应予登记,李家小孩不应登记 D.王家小孩不应登记,李家小孩应予登记 3.了解工业企业的期末在制品数量,调查人员去现场观察、计数,这种搜集数据资料的方法是( )

A.采访法 B.直接观察法 C.大量观察法 D.报告法 4.为了了解和推算全国居民的消费支出结构,统计应采取的调查方式是( ) A.普查 B.典型调查 C.抽样调查 D.重点调查.

5.为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是( )

A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样

6.为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行全面调查,这种调查方法是( )

A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样

7.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方法是( )

A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样

8.通过调查鞍钢、武钢等几个大钢铁基地,了解我国钢铁生产的基本状况,这种调查方式是( )

A.普查 B.典型调查 C.抽样调查 D.重点调查 9.为了反映商品价格与需求之间的关系,在统计中应采用( ) A.经济类型的分组

B.表明现象结构的分组

4

C.分析现象间依存关系的分组 D.上述都不正确 10.次数分布数列的两个构成要素是( )

A.单位数和指标数 B.分组及其次数

C.指标数和分配次数 D.总体单位总量与总体标志总量

11.某连续变量数列,最后一组为120以上,与它临近的一组组中值为105,则该分配数列中最后一组组中值为( )

A.125 B.130 C.135 D.140 12.按某一标志分组的结果表现为( )

A.组内差异性,组间同质性 B.组内同质性,组间差异性 C.组内同质性,组间同质性 D.组内差异性,组间差异性 13.划分连续变量的组限时,相邻组限必须( )

A.重叠 B.间断 C.相等 D.不等 14.下面统计图中不适合描述离散变量分布状况的是( )

A.直方图 B.柱形图 C.饼图 D.环形图 15.统计表分为简单表、分组表和复合表,这是按照( ) A.统计表是否分组和分组程度划分的 B.统计表的作用划分的

C.宾词是否分组和分组的程度划分的 D.主词是否分组和分组的程度划分的 二、多项选择题

1.某城市进行广告企业情况调查,则每一家广告单位是( ) A.调查对象

B.调查单位

C.报告单位

D.调查项目 E.总体单位

2.制定一个周密的统计调查方案,应包括的内容有( ) A.确定调查目的 B.确定调查对象 C.确定标志性质 D.确定资料使用范围 E.确定调查项目 3.统计报表的特点是( )

A.自上而下统一布置 B.自下而上逐级填报 C.按统一的表式和项目填报 D.一般属于全面调查 E.按规定的报送时间上报 4.统计分组的关键在于( )

A.选择分组标志 B.划分各组界限 C.确定组距 D.确定组数 E.区分事物性质

5

5.对一些企业按计划完成程度不同分为三组:第一组为80%~100%,第二组为100%~120%,第三组为120%以上,则下列说法正确的是( )

A.若将上述各组组别及次数依次排列,就是变量分布数列 B.该数列的变量属于连续变量,所以相邻组的组限必须重叠 C.此类数列只能是等距数列,不可能采取异距数列

D.某企业计划完成100%应归第一组 E.某企业计划完成100%应归第二组 6.选择分组标志的基本原则是( )

A.服从统计研究的目的 B.选择最能反映现象本质的标志 C.要依据统计调查方案的要求 D.充分考虑现象所处历史背景和经济条件 E.必须反映总体单位之间的依存关系 三、简答题

1.比较抽样调查、重点调查和典型调查的特点及适用场合。

2.何谓统计分组?其作用是什么?应遵循什么原则?

6

第三章 统计数据分布特征的描述

班级 姓名 学号 一、单项选择题

1.某地区2009年工人劳动生产率为11300元/人,人均国民收入1200元,这两个指标( )

A.均为平均指标 B.均为强度相对数

C.前者为平均指标,后者为强度相对数 D.前者为强度相对数,后者为平均指标 2.下列关于平均数、中位数和众数的描述,错误的是( ) ..A.三者都是用来反映数据的集中趋势

B.平均数易被大多数人理解和接受,实际中用的也较多 C.众数容易受到极端值的影响

D.当数据为偏态分布时,使用众数和中位数的代表性较强

3.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( ) A.算术平均数 B.几何平均数 C.调和平均数 D.中位数 4.算术平均数均有如下哪个数学性质( )

A.?x?x?min B.?(x?x)2?min C.?(x?x)?min D.?(x?x)2?max 5.某大学财经学院有2000名学生,法学院有1200名学生,医学院有800名学生,理学院有500名学生。描述该组数据的集中趋势宜采用( )

A.众数 B.中位数 C.调和平均数 D.算术平均数 6.某居民小区采取一项新的物业管理措施,为此抽取了100户居民进行了调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。该组数据的中位数是( )

A.69 B.22 C.中立 D.赞成

7.某企业工人有一半月收入低于1000元,有一半高于1000元,众数为800元,则该企业工人月收入的算术平均数x的近似值及分布态势分别为( )

A.x?1100;左偏 B.x?1100;右偏 C.x?1000;左偏 D.x?1000;右偏

8.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( ) A.接近于变量值小的一方 B.接近于变量值大的一方

7

C.不受权数的影响 D.无法判断 9.在变异指标中,其数值越小,则( ) A.说明变量值越分散,平均数的代表性越低 B.说明变量值越集中,平均数的代表性越低 C.说明变量值越分散,平均数的代表性越高 D.说明变量值越集中,平均数的代表性越高 10.平均差和标准差的主要区别在于( )

A.意义不同 B.计算结果不同 C.计算条件不同 D.数学处理方法不同 11.两个总体的平均数不等,但标准差相等,则( ) A.平均数大,代表性大 B.平均数小,代表性大 C.两个平均数的代表性相同 D.无法判断

12.一家公司招收职员时进行了两项能力测试,在甲项测试中,平均分数是100分,标准差是15分;在乙项测试中,平均分数是400分,标准差是50分。一位应试者在甲项测试中得了115分,乙项测试中得了425分,则该应试者哪一项测试更理想( )

A.甲项测试 B.乙项测试 C.两项测试同样理想 D.无法判断 13.最不受极端值影响的平均数是( )

A.调和平均数 B.中位数 C.众数 D.几何平均数 14.是非标志标准差的最大值是( )

A. 1.0 B. 0.5 C. 0.75 D. 0.25

15.计算标准差时,如果从每个变量值中减去任意数A,则计算结果与原标准差相比( )

A.变大 B.变小 C.不变 D.可能变大也可能变小 二、简答题

1.算术平均数与加权算术平均数之间有什么关系?

8

2.当比较几组数据的离散程度时,应采取哪类变异指标?为什么?

三、计算题

1.已知甲乙两企业生产同一种产品,2009年按单位成本分组资料如下表: 按平均单位成本分组(元/件) 10~12 12~14 14~16 16~18 甲企业 产量比重(%) 22 30 28 20 乙企业 成本比重(%) 25 25 25 25 (1)分别计算甲乙两企业2009年的平均单位成本;

(2)比较甲乙两企业2009年的平均单位成本,并作简单分析。

2.某银行利息按复利计算,前6年年利率为5%,后4年年利率为6%,求这10年间年平均利率。

3.某生产车间50名工人日加工零件数分组资料如下:

按日加工零件数分组(件) 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计

9

工人数 3 5 8 14 10 6 4 50 试计算该生产车间工人日加工零件的众数和中位数。

4.某班20名同学参加两门课程考试,成绩如下: 政治经济学考试成绩(按4分制评分) 成绩(分) 5 4 3 2 合计 学生数(人) 2 9 5 4 20 统计学考试成绩(按百分制评分) 成绩(分) 60以下 60-~70 70~80 80~90 90~100 合计 学生数(人) 2 3 8 5 2 20 (1)分别计算各门课程的平均成绩;

(2)通过计算,说明哪门课程的平均成绩具有较大的代表性。

10

第四章 时间序列分析

班级 姓名 学号 一、单项选择题

1.下列属于时点数列的是( )

A.某地历年工业增加值 B.某地历年工业总产值 C.某地历年年末城镇总人口数 D.某地历年工业产品进出口总额 2.下列哪一项是计算其它动态数列分析指标的基础( )

A.发展水平 B.发展速度 C.平均发展水平 D.平均发展速度 3.某单位的营业收入如下:200万,220万,250万,300万,320万,则平均增长量为( ) A.

320320120120 B. C.5 D.4

200200544.定基增长速度与环比增长速度的关系( ) A.定基增长速度等于各环比增长速度的连乘积 B.定基增长速度等于各环比增长速度的连乘积

C.定基增长速度等于各环比增长速度加1后的连乘积再减1 D.定基增长速度等于各环比增长速度的连乘积加1或100%

5.如果侧重分析研究现象在各时期的发展水平之和,则计算平均发展速度应用( ) A.算术平均法 B.调和平均法 C.几何平均法 D.方程法 6.移动平均法的主要作用是( )

A.削弱短期因素引起的波动 B.削弱长期的基本因素引起的波动 C.消除季节变动的影响 D.预测未来 7.计算年距指标的目的是( )

A.为反映时间序列中的季节变动 B.为消除时间序列中的季节变动 C.为反映时间序列中的循环变动 D.为消除时间序列中的长期趋势的变动 8.假定被研究对象基本上按不变的发展速度发展,为描述现象变动的趋势,借以预测,应选择的趋势方程为( )

A.直线趋势方程 B.指数曲线方程 C.直线或指数曲线方程均可 D.无法判断

9.某农贸市场土豆价格2月份比1月份上升5%,3月份比2月份下降2%,则3月份土豆价格与1月份相比( )

11

A.提高2.9% B.提高3% C.下降3% D.下降2% 10.按同期平均法测定的各月季节比率之和应等于( )

A.100% B.120% C.400% D.1200% 二、多项选择题

1.时间序列中的派生序列是( ) A.绝对数时间序列

B.相对数时间序列

C.平均数时间序列

D.时期序列 E.时点序列 2.下列属于时期序列的是( )

A.某省历年出生的婴儿数 B.某省历年年末人口数 C.某省历年固定资产投资额 D.某省历年国内生产总值 E.某商场各季末商品库存量 3.时点数列的特点主要有( )

A.数列中每个指标数值不能相加 B.数列中每个指标数值可以相加 C.一般来说,数列中每个指标数值的大小与间隔长短成正比 D.数列中每个指标数值是通过连续不断的登记而取得的 E.数列中每个指标数值是通过每隔一定时间登记一次取得的 4.定基增长速度等于( )

A.累计增长量除以基期水平 B.环比增长速度的连乘积 C.环比发展速度的连乘积减1 D.定基发展速度减1 E.逐期增长量分别除以基期水平

5.进行时间序列分解时,一般把时间序列的构成因素分为( ) A.长期趋势 B.季节变动 C.循环变动 D.不规则变动 E.趋势变动 三、简答题

1.试叙述次数分布数列与时间数列的区别。

2.序时平均数与一般平均数有何异同?

12

四、计算题

1.某企业2010年第一季度职工人数及产值资料如下: 产值 月初人数 单 位 万 元 人 一月 180 600 二月 160 580 三月 200 620 四月 190 600 试计算:(1)第一季度的月平均劳动生产率; (2)第一季度的劳动生产率。

2.将下表填写完整,并按水平法计算2007—2010的平均发展速度和平均增长速度。 年份 2006 2007 2008 2009 2010

3.西藏2005—2010各年年末人口数如下表:

年份 年末人口数(万人) 2005 277 2006 281 2007 284 2008 287 2009 290 2010 294 产值 100 —— 10 5 —— 110 与上年比较 —— 6 —— (万元) 增长量(万元) 发展速度(%) 增长速度(%) 增长1%的绝对值(万元) 试用合适的趋势方程预测西藏2011年年末人口数。

13

第五章 统计指数

班级 姓名 学号 一、单项选择题

1.反映现象总规模或总水平变动程度的指数是( )

A.质量指标指数 B.数量指标指数 C.平均指数 D.个体指数 2.编制总指数的两种形式是( )

A.数量指标指数和质量指标指数 B.综合指数和平均指数 C.算术平均数指数和调和平均数指数 D.定基指数和环比指数 3.用综合指数计算总指数的主要问题是( )

A.选择同度量因素 B.同度量因素时期的确定 C.同度量因素选择和时期的确定 D.个体指数和权数的选择

4.设q代表销售量,p代表销售价格,则?q1p0??q0p0的经济意义是( ) A.综合反映销售额变动的绝对额

B.反映价格变动而使消费者少付(多付)的金额 C.反映价格变动的绝对额

D.反映销售量变动引起的销售额变动的绝对额 5.质量指标综合指数

?qp?qp1110变形为加权调和平均数时的权数是( )

A.q1p1 B.q0p0 C.q0p1 D.q1p0

6.某厂产品单位成本今年比去年增长20%,产量增长25%,则产品总成本增长( ) A.5% B.80% C.45% D.50% 7.由三个指数所组成的指数体系中,两个因素指数的同度量因素通常( ) A.都固定在基期 B.一个固定基期,一个固定在报告期 C.都固定在报告期 D.采用基期和报告期的平均数

8.某市2006年社会商品零售额为120亿元,2010年为220.8亿元,这4年中物价上涨47.2%,则商品零售量指数为( )

A.170.8% B.86.8% C.125% D.289.8%

9.当我们研究各技术级工人工资的变动影响全体工人平均工资的变动程度时,应计算( )

14

A.结构影响指数 B.加权算术平均数指数 C.固定构成指数 D.可变构成指数 10.如果生活费用指数上涨了20%,则现在1元钱( ) A.与原来1元钱等值 B.只值原来的0.8元 C.只值原来的0.83元 D.无法与原来比较

11.某市居民以相同的人民币在物价上涨后少购商品20%,则物价指数为( ) A.25% B.75% C.115% D.125% 12.产量指数

?kqp?qp000中的k是( )

0A.同度量因素 B.数量指标的项数 C.产量个体指数 D.价格个体指数 二、多项选择题

1.按指数化指标性质的不同,可将综合指数分为( ) A.个体指数

B.总指数

C.平均指数

D.数量指标指数 E.质量指标指数 2.下列属于质量指标指数的有( )

A.企业产值指数 B.职工工资指数 C.商品零售价格指数 D.劳动生产率指数 E.产品单位成本指数

3.要反映某地区工业产品产量报告期比基期的增长状况,应采用( ) A.个体指数 B.总指数 C.动态指数 D.静态指数 E.数量指标指数

4.已知某工业企业报告期生产费用(?z1q1)为2850万元,比基期增长14%,又知基期假定生产费用(?z0q1)为3000万元,则( )

A.成本降低5% B.产量增长20%

C.报告期费用比基期增加350万元 D.由于成本降低而节约的生产费用为150万元 E.由于产量增加而多支出的生产费用为500万元

5.在计算综合指数时,同度量因素时期的选择( ) A.应根据指数的经济内容来决定

B.在计算数量指标指数时,应将同度量因素固定在基期 C.在计算质量指标指数时,应将同度量因素固定在报告期 D.在实际应用中,可将不变价格作为同度量因素 E.应根据基期或报告期资料是否全面来决定

15

三、简答题

1.什么是统计指数,其主要作用有哪些?

2.什么是同度量因素,它有什么作用?

3.综合指数和平均指数有什么样的联系,二者如何区别?

三、计算题

1.某商场只经营四种商品,其报告期相对于基期的个体销售量指数分别为110%、104%、108.5%、118%,若四种商品基期的销售额在总销售额中的比重分别为11%、29%、35%、25%,试计算这四种商品的销售量指数。

2.某企业产品产量和成本资料如下表

产 品 名 称 甲 乙 计 量 单 位 吨 件 产量 基期 2000 3000 报告期 2210 3500 单位成本(元) 基期 报告期 10 8 12 12 要求:试从相对数和绝对数两个方面分析产量和产品单位成本变动对企业总成本变动的影响。

16

第六章 抽样分布与参数估计

班级 姓名 学号 一、单项选择题

1.样本统计量和总体参数( )

A.前者是确定的,后者是随机变量 B.两者都是随机变量

C.两者都是确定的 D.前者是随机变量,后者是确定的 2.设x1、x2、?、x10是来自二项分布B(1,p)的一个样本,其中0

110A.?xi B.max(x1,x2,?,x10) C.min(x1,x2,?,x10) D.x8?E(x1) 10i?13.某地区居民收入的方差为900,随机抽取400户调查,则调查户平均收入的方差为( )[西安交大2007研]

A.30 B.2.25 C.900 D.300 4.抽样分布是指( )

A.一个样本各观测值的分布 B.总体中各观测值的分布 C.样本统计量的分布 D.样本数量的分布

5.在参数估计中,要求通过样本统计量来估计总体参数,评价统计量标准之一是使它与总体参数的离差越小越好。这种评价标准称为( )

A.有效性 B.无偏性 C.一致性 D.充分性

6.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间为75分~85分。则全班学生的平均分数( )

A.肯定在这一区间 B.有95%的可能性在这一区间内

C.有5%的可能性在这一区间内 D.要么在这一区间内,要么不在这一区间内 7. 95%的置信水平是指( )

A.总体参数落在一个特定的样本所构造的区间内的概率为95%

B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为95% C.总体参数落在一个特定的样本所构造的区间内的概率为5%

D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比率为5% 8.在其他条件不变的情况下,提高参数估计的可靠程度,其估计的精确度( ) A.随之扩大 B.随之缩小 C.保持不变 D.无法判断

17

9. 抽样平均误差和极限误差之间的关系是( )

A.抽样平均误差大于极限误差 B.抽样平均误差等于极限误差

C.抽样平均误差小于极限误差 D.抽样平均误差大于、等于或小于极限误差 10.下列关于点估计的说法,正确的是( )

A.不考虑抽样误差及可靠程度 B.考虑抽样误差及可靠程度

C.适用于推断的准确度要求高的情况 D.无需考虑无偏性、有效性、一致性 11.在对某住宅小区居民的调查中,随机抽取由48个家庭构成的样本,其中有36个家庭对小区的物业管理服务表示不满意。该小区所有家庭对物业服务不满意的比率的95%置信区间为( )

A.0.75 ± 0.1225 B. 0.75 ± 0.1325 C. 0.75 ± 0.1425 D. 0.75 ± 0.1525 12.在置信水平不变的条件下,要缩小置信区间,则( ) A.保持样本容量不变 B.需要减少样本容量

C.需要增加样本容量 D.需要改变统计量的抽样标准差 二、计算题

1.某学校随机抽查的10个男生,平均身高170厘米,标准差12厘米。假设该校全体男生的身高服从正态分布,问置信水平为多少,可得到该校全体男生的平均身高的置信区间为160.5~179.5厘米?

2.调查某住宅区居民用水情况,该区共有N=10000户,采取无放回抽样随机抽取了n=100户,测得x?12.5,s2?12.52,其中有40户用水超过了规定标准。要求计算(列出公式)

(1)该地区的总用水量及95%的置信区间;

(2)若要求在95%的可靠性下,估计平均用水量的最大误差不超过0.1吨,应抽取多少户作样本?

(3)以95%的可靠性估计用水超过标准的户数;

(4)若认为估计用水的超标户的置信区间过宽,要求缩短一半,这时应抽多少户作样本?[人大2002研]

18

3.若样本x1,x2,?,xn是来自正态总体N(?1,?12)的样本,y1,y2,?,ym是来自正态总

2体N(?2,?2)的样本,且两个样本相互独立,x和y分别是它们的样本均值。

(1)若?1和?2已知,求?1??2的1??置信区间;

(2)若?1和?2未知,但样本容量n和m充分大,求?1??2的1??置信区间; (3)某地区教育部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立地抽取两个随机样本,有关数据如下表所示。试根据(2)的结果计算两所中学高考英语平均分数之差的95%置信区间。

两个样本的有关统计量 中学1 n=46 中学2 m=33 y?118 x?126 样本标准差sx?5.8

19

样本标准差sy?7.2

三、应用题

“养鱼大王”老张为了与销售商签订购销合同,需要对自己鱼塘中鱼的总重量进行估计。请帮他设计一份估计方案,并给出估计的精度和可靠程度。

20

第七章 假设检验

班级 姓名 学号 一、单项选择题

1.某公司正与一新供应商洽谈合作事宜,该供应商声称其产品平均使用寿命μ大于1000小时,若要检验该供应商是否属实,提出的检验假设为( )

A.H0:??1000VSH1:??1000 B.H0:??1000VSH1:??1000 C.H0:??1000VSH1:??1000 D.H0:??1000VSH1:??1000 2.在假设检验中,显著性水平?的意义是( )[中南财大2006研]

A.H0为真,经检验拒绝H0的概率 B.H0为真,经检验不拒绝H0的概率 C. H0不成立,经检验拒绝H0的概率 D.H0不成立,经检验不拒绝H0的概率 3.对正态总体的数学期望?进行假设检验,如果在显著性水平??0.05下没有拒绝假设

H0:???0,则在显著性水平??0.1下,下列结论正确的是( )[华中科大2004研]

A.不拒绝H0 B.可能拒绝,也可能不拒绝H0 C.必拒绝H0 D.以上均不正确 4.在假设检验中,不拒绝原假设意味着( )

A.原假设肯定是正确的 B.原假设肯定是错误的

C.没有充分证据证明原假设是正确的 D.没有充分证据证明原假设是错误的 5.若假设检验H0:新工艺不比旧工艺好,H1:新工艺好于旧工艺,则下列属于犯第Ⅱ类错误的是( )

A.新工艺较好,采用新工艺 B.新工艺较好,保留旧工艺 C.新工艺不好,采用新工艺 D.新工艺不好,保留旧工艺

6.将显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的

1,这是( ) 2A.单侧检验 B.双侧检验 C.左侧检验 D.右侧检验 7.假设检验的p值越小,( )

A.拒绝原假设的把握越大 B.拒绝原假设的把握越小 C.拒绝备择假设的把握越大 D.拒绝备择假设的把握越小

21

8.检验总体成数的假设:H0:P?0.3VSH1:P?0.3,由n=100组成的一个随机样本,得到样本成数p=0.295。用于检验的p值为0.2,在??0.05的显著性水平下,得到的结论是( )

A.拒绝H0 B.不拒绝H0

C.可以拒绝,也可以不拒绝H0 D.可能拒绝与可能不拒绝H0 二、简答题

1.在研究方法上,参数估计与假设检验有什么相同点和不同点?[中南财大2006研、西南财大2003研]

2.在单个总体均值的假设检验中,检验统计量要根据总体是否服从正态分布、总体方差是否已知,以及样本容量的大小来确定。说明在不同情况下分别需要使用何种检验统计量。[中央财大2009研]

三、计算题

1.如果能够证明某一电视连续剧在播出的前13周其观众的收视率超过了25%,则可以断定它获得了成功。假定由400个家庭所组成的一个样本中,有112个家庭在头13周看过了某

22

电视连续剧。在??0.05的显著性水平下,检验这部电视连续剧是否获得了成功。

2.某企业2007年11月1日对12名员工的抽样调查表明,他们从居住地到达工作地点花费的时间如下(分钟):

10,55,70,25,30,45,30,50,25,40,55,90

(1)计算数据的均值、中位数和众数。你认为哪一个结果最能反映这组数据的一般水平?为什么?

(2)已知总体服从正态分布,样本标准差等于22.1,计算总体均值95%的置信区间。[t0.025(11)=2.20]

(3)根据以上数据,在5%的显著性水平下能否认为总体中职工的平均上班时间等于35分钟?[中央财大2008研]

23

四、应用分析题

对于考试,人们最关心及格线是多少,因为及格线上下的考生可能得到完全不同的待遇。目前国内最常用的是传统的百分制60分及格的方法,即得分为总分的60%就及格,然而为什么是60分就及格呢?

提示:我国最常见的百分制是把试卷分成100个采分点,并且假设每个采分点是相互独立的。最典型的例子就是,试卷中有100道“正误”判断题,也就是说答题者在完全不具备相关知识的情况下,仅凭猜测判断,那么正确的概率为0.5。

24

第八章 回归分析

班级 姓名 学号 一、单项选择题

1.下面关系中不是相关关系的是( )

A.身高与体重之间的关系 B.工资水平与工龄之间的关系 C.农作物单位面积产量与降雨量的关系 D.圆的面积与半径之间的关系 2.如果变量之间的关系近似地表现为一条直线,则称这两个变量之间为( ) A.正线性相关关系 B.负线性相关关系 C.线性相关关系 D.非线性相关关系 3.下面关于相关系数的陈述中,哪一个是错误的?( ) A.数值越大说明两个变量之间的关系越强

B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.不一定意味着两个变量之间一定有因果关系 D.绝对值不会大于1

4.如果相关系数r = 0,则表明两个变量之间( ) A.相关程度很低 B.不存在任何关系 C.不存在线性相关关系 D.存在非线性相关关系

5.将一枚硬币重复投掷n次,用x和y分别表示正面朝上和负面朝上的次数,则x和y的相关系数为( )[东北财大2004研]

A.-1 B.0 C.0.5 D.1 6.在回归模型y?b0?b1x?u中,随机误差项u反映的是( ) A.由于x的变化引起的y的线性变化部分 B.由于y的变化引起的x的线性变化部分 C.除x和y的线性关系之外的随机因素对y的影响 D.由于x和y的线性关系对y的影响

7.下列直线回归方程与相关系数不匹配的是( )

y?0.9?0.5x,r?0.9 B.?y??0.9?0.5x,r?0.9 A.?y??0.9?0.5x,r??0.9 D.?y?2?0.5x,r?0.9 C.?8.估计标准误差说明回归直线的代表性,因此( )[西安交大2008研] A.估计标准误差数值越大,说明回归直线的代表性越大

25

B.估计标准误差数值越大,说明回归直线的代表性越小 C.估计标准误差数值越小,说明回归直线的代表性越小 D.估计标准误差数值越小,说明回归直线的实用价值小

9.已知某一直线回归方程的判定系数为0.81,则自变量与因变量之间的相关系数为( )

A.±0.41 B.±0.81 C.±0.90 D.±0.95

10.对于一元线性回归模型,以se表示估计标准误差,r表示样本相关系数,则有( ) A. se=0时,r=1 B. se=0时,r=-1 C. se=0时,r=0 D.se=0时,r=1或r=-1 11.应用某市1979—2010年人均可支配收入与人均消费支出的数据资料建立的一元线性消费函数,估计结果得到判定系数R2=0.99,总离差平方和TSS = 480,则随机误差项u的标准差估计值为( )

A. 3.980 B. 3.854 C. 0.4 D. 0.38

12.用一组20个样本观测值估计模型y?b0?b1x?u,在0.05的显著性水平下对b1的显著性作t检验,则b1显著不等于零的条件是统计量t的绝对值大于( )

A.t0.05(20) B.t0.025(20) C.t0.05(18) D.t0.025(18)

13.下列关于一元线性回归模型中某特定自变量x0对应的因变量平均值E(y0)的置信区间和个别值y0的预测区间的说法,正确的是( )

A.x0越远离其均值,预测区间越窄 B.样本容量越大,预测精度越高 C.样本容量越大,预测精度越低

D.样本容量一定时,平均值的置信区间比个别值的预测区间宽

14.利用样本容量为25的一组样本建立的三元线性回归模型中,计算的判定系数为0.86,则调整后的判定系数为( )

A.0.8 B.0.86 C.0.84 D.0.9

15.用一组20个样本观测值估计模型y?b0?b1x1?b2x2?u,在0.05的显著性水平下对回归方程的整体显著性作F检验,则回归方程整体显著的条件是统计量F大于( )

A.F0.05(2,20) B.F0.025(2,20) C.F0.05(2,17) D.F0.025(2,17) 二、计算题

1.设人均收入x为自变量,人均消费y为因变量。现根据某地12个住户的有关资料计算出以下数据:(单位:元)

26

?(x?x)2?425053.73,?(y?y)2?262855.25

?(x?x)(y?y)?334229.09,x?647.88,y?549.8

(1)拟合简单线性回归方程,并解释方程中回归系数的经济意义; (2)计算判定系数和回归估计的标准误差,并作简单评析;

(3)对x的回归系数进行显著性检验(显著性水平为0.05,t0.025(10)?2.228) (4)假定人均收入为800元,利用拟合的回归方程预测相应的人均消费水平。并给出置信度为95%的预测区间。[中南财大2004研]

2.研究人员通过随机调查取得了50名从业人员的月收入和月消费支出的数据。用Excel进行回归分析(支出为因变量,收入为自变量)部分结果如表1和表2所示。

表1 回归统计

R Square Adjuested R Square

标准误差 观测值

27

0.9188 0.9171 229.1852 50

表2

Intercept 收入 Coefficents 191.91 0.62 标准误差 82.04 0.03 t Stat 2.34 23.30 P-value 0.0235 0.0000 (1)计算收入和支出的相关系数;

(2)根据本题的经济意义,对收入进行t检验时应该进行单侧检验还是双侧检验?写出原假设和备择假设。根据Excel的计算结果,如果??0.01,检验的结论如何?

(3)写出回归方程的表达式,说明回归系数的含义,并计算月收入为3000元时的平均支出。[中央财大2009研]

28