统计学题库及题库答案 下载本文

统计学题库及题库答案 题库1

一、单项选择题(每题2分,共20分) 1、调查时间是指( )

A、调查资料所属的时间 B、进行调查的时间

C、调查工作的期限 D、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( )。 A、工业企业全部未安装设备 B、企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业

3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。

A、全距 B、平均差 C、标准差 D、变异系数

4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( )

A、扩大为原来的3倍 B、扩大为原来的2/3倍 C、扩大为原来的4/9倍 D、扩大为原来的2.25倍

5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。

A、576户 B、144户 C、100户 D、288户 6、当一组数据属于左偏分布时,则( )

A、平均数、中位数与众数是合而为一的 B、众数在左边、平均数在右边 C、众数的数值较小,平均数的数值较大 D、众数在右边、平均数在左边

7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为( )。

A、520 B、 510 C、 500 D、490

8、用组中值代表组内变量值的一般水平有一定的假定性,即( )

A、各组的次数必须相等

B、变量值在本组内的分布是均匀的 C、组中值能取整数 D、各组必须是封闭组

2X,X,?,XN(?,?)的样本,样本均值X服从( )分布 12n9、是来自总体

22N(0,1)N(?,?)N(n?,n?) D、A、 B.、 C.、

N(?,?2n

)10、测定变量之间相关密切程度的指标是( )

A、估计标准误 B、两个变量的协方差 C、相关系数 D、两个变量的标准差 二、多项选择题(每题2分,共10分)

1

1、抽样推断中,样本容量的多少取决于( )。

A、总体标准差的大小 B、允许误差的大小 C、抽样估计的把握程度 D、总体参数的大小 E、抽样组织形式

2、抽样估计中的抽样误差( )。

A、是不可避免要产生的 B、是可能通过改进调查方式来消除的 C、是可以事先计算出来的 D、只能在调查结束后才能计算的 E、其大小是可能控制的

3、在什么条件下,加权算术平均数等于简单算术平均数( )。

A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为1 E、各组次数占总次数的比重相等

4、总体平均数的假设检验方法通常有( )

2?A、 Z检验法 B、 t检验法 C、 检验法

D、 F检验法 E、 几何检验法

5、指出下列分组哪些是属性分组( )

A、 人口按性别分组 B、 企业按产值多少分组 C、 家庭收入水平分组 D、 在业人员按文化程度分组 E、 产品按质量等级分组

三、填空题(每空2分,共20分)

1、统计分组的关键问题是正确选择 与划分 。

2、对某村6户居民家庭共30人进行调查,所得的结果是,人均收入400元,其离差平方和为480,则标准差是 ,标准差系数是 。 3、抽样推断的主要内容有 和 两个方面。 4、假设检验中的两类错误分别称为 和 。 5、相关系数r的取值范围是 到 。

四、简答题(每题5分,共20分)

1、众数、中位数、均值的特点与应用场合是什么?

2、什么是假设检验的P值?如何根据P值作出假设检验的结论? 3、为什么要计算标准差系数? 4、单因素方差分析的步骤是什么? 五、计算题(每题10分,共30分)

1、某班学生统计学原理考试成绩次数分布如下:

要求:根据上表资料,计算相应的的数字,填入表中空格。

2N(4,1)。现从北京市家2、根据有关调查,北京市每天每个家庭上网的时间服从正态分布

庭中随机抽取16户,测得平均每天每户家庭上网时间为4.5小时。试在0.05的显著性水平下判断北京市家庭上网的时间是否有显著提高?(

Z0.05?1.645,Z0.025?1.96)

3、从100家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:

n=100,∑X=10,∑Y=20,∑X2=1.5,∑Y2=50,∑XY=3。根据以上数据,求出利润额对销售额的直线回归方程。

2

题库2

一、单项选择题(每题2分,共20分)

1、统计学自身的发展,沿着两个不同的方向,形成( ) A、描述统计学与理论统计学

B、理论统计学与推断统计学 C、理论统计学与应用统计学 D、描述统计学与推断统计学

2、某地区为了掌握地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( ) A 普查 B 典型调查 C 抽样调查 D 重点调查 3、用组中值与次数求坐标点连接而成的统计图是( ) A 直方图 B 条形图 C 曲线图 D 折线图 4、离中趋势指标中,最容易受极端值影响的是( ) A 极差 B 平均差

C 标准差 D 标准差系数 5、一组数据的偏态系数为1.3,表明该组数据的分布是( ) A 正态分布 B 平顶分布 C 左偏分布 D 右偏分布 6、抽样平均误差说明抽样指标与总体指标之间的( ) A 实际误差 B 平均误差 C 实际误差的平方 D 允许误差 7、假设检验是检验( )的假设是否成立。

A 样本方差 B 总体指标

C 样本方差 D 样本平均数

8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A、各组的次数必须相等

B、变量值在本组内的分布是均匀的 C、组中值能取整数 D、各组必须是封闭组

9、总体平均数的假设检验方法,在小样本,且方差未知时,通常采用( )

2?A、Z检验法 B、t检验法 C、检验法 D、F检验法

10、年劳动生产率x(千元)和工人工资y=10+70x,这意味着年劳动生产率每提高

1千元时,工人工资平均( )

A、增加70元 B、减少70元 C、增加80元 D、减少80元

二、多项选择题(每题2分,共10分)

1、概率抽样调查 ( ) A、是一种非全面调查

B、 其目的是根据抽样结果推断总体数量特征

C、它具有经济性、时效性、准确性和灵活性等特点

D、其调查单位是随机抽取的 E、抽样推断的结果往往缺乏可靠性 2、常用的样本指标有( )

3

A 样本平均数 B 样本成数 C 抽样误差 D 样本方差 E 标准差

3、在什么条件下,加权算术平均数等于简单算术平均数( )。 A、各组次数相等 B、各组变量值不等 C、变量数列为组距数列 D、各组次数都为1 E、各组次数占总次数的比重相等

4、总体平均数的假设检验方法通常有( )

2?A、 Z检验法 B、 t检验法 C、 检验法

D、 F检验法 E、 几何检验法

5、中位数是( )

A 由标志值在变量数列中所处的位置决定的 B 根据标志值出现的次数决定的 C 总体单位水平的平均值 D 总体一般水平的代表值 E 不受总体中极端数值的影响

三、填空题(每空2分,共20分)

1、一个完整的统计工作过程可以划分为_____、____、_____、_______四个阶段。

2、当变量数列中算术平均数大于众数时,这种变量数列的分布呈_____分布;反之,算术平均数小于众数时,变量数列的分布呈______分布。

3、评价点估计量好坏的标准有_____、______和______。

4、相关系数,用于反映______条件下,两变量相关关系的密切程度和方向的统计指标。

四、简答题(每题5分,共20分)

1、离中趋势的指标有哪些(至少列出三个),它们之间有何区别?

2、影响抽样误差的因素有哪些?

3、相关分析和回归分析的联系与区别? 4、假设检验一般有哪些步骤?

五、计算题(每题10分,共30分)

1、某班级分甲、乙两个学习小组,在统计学考试中,甲小组平均成绩75分,标准差11.5,乙小组成绩资料如表: 成绩(分) 60以下 60-70 70-80 80-90 90以上 合计 人数(人) 2 5 8 6 4 25 (1)计算乙小组的平均成绩。

(2)以尽可能精确的方法比较两小组平均成绩的代表性。

2、根据历史的统计,某种产品的次品率为2%。如果要求置信水平为95.45%的置信区间,

4

并要求允许误差不超过4%,应抽取多大的样本?(

P(Z?2)?95.45%)

3、从100家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:

n=100,∑X=10,∑Y=20,∑X2=1.5,∑Y2=50,∑XY=3。根据以上数据,

(1)求出利润额对销售额的直线回归方程;

(2)预测当销售额为0.5亿元时,利润额在置信度为95.45%的预测区间(已知预测标准误差为0.05亿元)。

题库3

一、单项选择题(每题2分,共20分)

1.某地进行私营商业企业经营情况调查,则调查对象是( ) A 该地所有商业企业 B 该地所有私营商业企业 C 该地每一私营商业企业 D 该地每一商业企业 2. 统计分组的关键问题是( ) A 确定分组标志和划分各组界限 B 确定组距和组数

C 确定组距和组中值 D 确定全距和组距 3用组中值与次数求坐标点连接而成的统计图是( ) A 直方图 B 条形图 C 曲线图 D 折线图 4. 离中趋势指标中,最容易受极端值影响的是( ) A 极差 B 平均差 C 标准差 D 标准差系数 5. 所谓大样本是指样本单位数在( )及以上。 A 30个 B 50个 C 80个 D 100个

6. 抽样指标与总体指标之间抽样误差的可能范围是( )

A 抽样平均误差 B 抽样极限误差 C 区间估计范围 D 置信区间 7. 原假设为真,我们却拒绝它的概率为( ) A 1-? B ? C 1-? D ? 8. 假设检验是检验( )的假设是否成立。 A 样本方差 B 总体指标 C 样本方差 D 样本平均数 9. 下面的函数关系是( )

A 销售人员测验成绩与销售额大小的关系 B 圆周的长度决定于它的半径 C 家庭的收入和消费的关系

5

D 数学成绩与统计学成绩的关系

10. 年劳动生产率x(千元)和工人工资(元)y=30+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )

A 增加70元 B 减少70元 C 增加100元 D 减少100元 二、多项选择题(每题2分,共10分)

1.询问调查法有以下几种( )

A 访问调查 B 邮寄调查 C 电话调查 D 实验法 E 观察法 2.某单位100名职工按工资额分为300以下、300-400、400-600、600-800、800以上等五个组。这一分组( )

A 是等距分组 B 是异距分组 C 末组组中值为800

D 相邻的组限是重叠的 E 某职工工资600元,应计在600-800元组内 3.在各种平均数中,不受极端值影响的平均数是( ) A 算术平均数 B 调和平均数 C 中位数 D 几何平均数 E 众数

4.在总体1000个单位中,抽取20个单位进行调查,下列各项正确的是( ) A 样本单位数是20个 B 样本个数是20个 C 一个样本有20个单位 D 样本容量是20个 E 是一个小样本

5.下列哪些变量之间的关系为相关关系( ) A 家庭收入与消费支出关系 B 圆的面积与它的半径关系 C 广告支出与商品销售额关系 D 单位产品成本与利润关系

E 在价格固定情况下,销售量与商品销售额关系

三、填空题(每空2分,共20分)

1、统计学按方法的构成可以分________________与_________________。 2、组距式变量数列,根据各组的组距是否相等可以分为________________和_________________。

3、直方图是用__________________的宽度和高度来表示频数分布的图形。 4、标准差系数是______________与________________之比。

5、常用的总体指标有_______________、_____________、______________。

四、简答题(每题5分,共20分) 1、统计调查方案包括有哪几个方面的内容?

6

2、数据的计量尺度分几类?它们之间有什么区别与联系?

3、标准差与标准差系数各是什么含义?衡量数据的离散程度时,如何选择? 4、必要的抽样数目受哪些因素的影响? 五、计算题(每题10分,共30分)

1. 2006年某月份甲、乙两农贸市场某农产品价格和成交额、成交量资料如下: 品种 甲 乙 丙 合 计

2、某食品厂用自动装袋机包装食品,每袋标准重量为50克,每隔一定时间抽取包装袋进行检验。现抽取10袋,测得其重量为(单位:克);

49.8,51,50.5,49.5,49.2,50.2,51.2,50.3,49.7,50.6

若每袋重量服从正态分布,每袋重量是否符合要求。

(?=0.05,t0.025?2.2622)

3、某10户家庭样本具有下列收入和食品支出(元/天)数据: 收入x 支出y 20 30 7 9 32 8 40 11 45 12 53 14 56 13 58 15 65 74 17 16 价格(元/斤) 1.2 1.4 1.5 - 甲市场成交额(万元) 1.2 2.8 1.5 5.5 乙市场成交量(万斤) 2 1 1 4 试问哪一个市场农产品的平均价格高?并说明理由。

试求出以最小二乘法计算的回归方程,并预测当x=5时y的值。

题库4

一、单项选择题(每题2分,共20分)

1、.人口普查的调查单位是( )。

A .全部人口 B.每个人 C.全部人口数 D.每户家庭;

2、将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是()。

A.、单侧检验 B、双侧检验 C、右单侧检验 D、左单侧检验

3、产品质量的检查应该采用( )。

A、重点调查的方法; B、典型调查的方法; C、普查的方法; D、抽样检验的方法;

7

4某组向上累计次数表示( )

A、大于该组上限的次数有多少; B、大于该组下限的次数有多少; C、小于该组上限的次数有多少; D、小于该组下限的次数有多少;

5、对正态总体均值进行区间估计时,其它条件不变,置信水平1??越大,则置信上限与置信下限的差( )

A、越大 B、越小 C、不变 D、不确定

6、在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2倍,则样本容量( )。

A.扩大为原来的4倍 B. 扩大为原来的2倍 C.缩小为原来的二分之一 D. 缩小为原来的四分之一

7、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和

680

( )

A、甲类较大 B、乙类较大 C、两类相同 D、不确定

8、所谓显著水平是指 ( )

A、原假设为真时将其接受的概率; B、原假设不真时将其舍弃的概率; C、原假设为真时将其舍弃的概率; D、原假设不真时将其接受的概率;

9、在一元线性回归方程y?a?bx中,b表示( )

A、当x增加一个单位时,y增加a的数量; B、当y增加一个单位时,x增加b的数量; C、当x增加一个单位时,y的平均增加量; D、当y增加一个单位时,x的平均增加量.

10.在其他条件相同的前提下:不重复抽样误差( )

A、大于重复抽样误差 B、小于重复抽样误差

C、等于重复抽样误差 D、与重复抽样误差何者更大无法判定 二、多项选择题(每题2分,共10分)

1.频率是( )

A 概率 B 各组次数 C 非负数 D 自然数 E 各组的次数占总体单位数的比重

2. 下列的表述正确的有( ) A. 总体是唯一确定的,样本是随机的 B. 总体指标是确定不变的

8

C. 抽样指标是样本量的函数 D. 抽样指标也是随机变量 E. 抽样指标是确定不变的

3.若一组数据的偏度系数是-0.25,则下列说法正确的有( ) A 平均数、中位数与众数是分离的 B 众数在左边、平均数在右边

C 数据的极端值在右边,数据分配曲线向右延伸 D 众数在右边、平均数在左边

E 数据的极端值在左边、数据分配曲线向左延伸 4. 进行方差分析需要满足的假设条件有( ) A 每次试验都是独立进行 B 各样本都来自正态总体 C 各总体的方差相等 D 各样本的样本量相等 E 各总体分布相互独立

5.人的血压与体重之间存在一定的相关关系,这种相关属于( ) A 正相关 B 单相关 C 负相关 D 复相关 E 完全相关

三、填空题(每空2分,共20分)

1、统计调查按调查对象包括的范围不同可分为_____________与______________。 2、测定峰度系数β=3时,次数分布曲线为____________;为β<3时,为____________;β>3时,为________________曲线。

3、当___________________时,加权算术平均数等于简单算术平均数。

4、总体方差越大,抽样误差就___________;总体方差越小,抽样误差______________。

5、当变量数列中算术平均数大于众数时,这种变量数列的分布呈__________分布;反之,算术平均数小于众数时,变量数列的分布呈___________分布。

四、简答题(每题5分,共20分)

1、什么是统计学?怎样理解统计学与统计数据的关系? 2、如何对任意两个总体平均数的代表性进行比较?

3、影响抽样误差的因素有哪些?

4、什么是假设检验的P值?如何根据P值来作出假设检验的结论? 五、计算题(每题10分,共30分)

1、随机抽查某企业100名职工,其月工资资料如下表 月工资额(百元)

职工数(人) 9

要求:根据表中资料计

5—8 8-10 10-12 12-14 14—18 合计 4 10 80 3 3 100 算职工月工资的平均数、标准差和离散系数。 2、从500名初中生中随机抽出100名测量身高,通过计算得样本身高平均值X为1.65米,样本标准差s为0.073,在概率为95.45%的保证程度下,对这些初中生的身高作出区间估计。(φ(2)=0.9545)

3、对9位青少年的身高y与体重x进行观测,并已得出以下数据:

?y?13.54 ,

?,

y2?22.9788,

?x?472,

?要求:

x2?28158?xy?803.02以身高为因变量,体重为自变量,建立线性回归方程。

题库5

一、单项选择题(每题2分,共20分)

1.统计学的方法分为( ) A 描述统计学与理论统计学 B 理论统计学与推断统计学 C 理论统计学与应用统计学 D 描述统计学与推断统计学

2.某蕊片厂为了掌握该厂的产品质量,拟进行一次质量大检查,这种检查应选择( )

A 统计报表 B 重点调查 C 全面调查 D 抽样调查 3.下列分组中按品质标志分组的是( )

A 人口按年龄分组 B 产品按质量优劣分组 C 企业按固定资产原值分组 D 乡镇按工业产值分组

4. 在分组时,若有某个数据的值正好等于相邻组的下限时,一般应将其归在( )

A 上限所在组 B 下限所在组 C 任意一组均可 D 另设新组 5.方差是数据中各变量值与其算术平均的( )

A 离差绝对值的平均数 B 离差平方的平均数 C 离差平均数的平方 D 离差平均数的绝对值

10

6. 一组数据的偏态系数为-1.3,表明该组数据的分布是( ) A 正态分布 B 平顶分布 C 左偏分布 D 右偏分布 7. 原假设为假,我们却不拒绝它的概率为( ) A 1-? B ? C 1-? D ?

8.在简单随机重复抽样条件下,若要求抽样误差为原来的1/2,则样本容量( ) A 扩大为原来的5倍 B 扩大为原来的2倍 C 扩大为原来的4倍 D 扩大为原来的2.5倍 9. 假设检验和区间估计之间的关系,下列说法正确的是( ) A 虽然概念不同,但实质相同 B 两者完全没有关系 C 互相对应关系

D 不能从数量上讨论它们之间的对应关系 10. 当相关系数r=0时,表明( )

A 现象之间完全相关 B 相关程度较小 C 现象之间完全相关 D 无直线相关关系 二、多项选择题(每题2分,共10分)

1.不属于询问调查法有( )

A 访问调查 B 邮寄调查 C 电话调查 D 实验法 E 观察法 2. 非全面调查是指( )

A 普查 B 全面统计报表 C 重点调查 D 典型调查 E 抽样调查 3.变量数列中频率应满足的条件是( ) A 各组频率大于1 B 各组频率大于0 C 各组频率之和等于1 D 各组频率之和小于1 E 各组频率之和大于1

4.在500位同学中,抽取100名同学进行调查,下列各项正确的是( A 样本单位数是1000个 B 样本个数是100个 C 一个样本有100个单位 D 样本容量是100个 E 是一个大样本

5.下列哪些变量之间的关系为函数关系( ) A 家庭收入与消费支出关系 B 圆的面积与它的半径关系 C 广告支出与商品销售额关系 D 单位产品成本与利润关系

E 在价格固定情况下,销售量与商品销售额关系

11

三、填空题(每空2分,共20分)

1、统计数据大体上可分为________________与_________________两种类型。 2、数据的计量尺度由低级到高级可以分为______________、____________、________________和__________________。

3、当满足___________________条件,加权算术平均数等于简单算术平均数。4、参数点估计的方法有____________________与_______________________。 5、相关系数的取值范围是______________。

四、简答题(每题5分,共20分)

1、简述平均数、众数、中位数三者的特点与应用场合? 2、什么是随机原则?在抽样调查中为什么要遵循随机原则? 3、什么是离散系数?它的计算有什么意义?

4、什么是假设检验的P值?如何根据P值来作出假设检验的结论? 五、计算题(每题10分,共30分)

1.根据下表数据,计算10名工人日加工零件数均值、标准差。

按零件数分组 0~10 10~20 20~30 合计 人数 2 5 3 10 2N(4,1)。现从西2、根据过去大量资料,西安市每天每个家庭看电视的时间服从正态分布

安市家庭中随机抽取16户,测得平均每天每户家庭看电视时间为4.5小时。试在0.05的显著性水平下判断西安市家庭看电视的时间是否有显著提高?(3、检查5位同学统计学的学习时间与成绩分布如下表:

每周学习时数x 学习成绩 y 题库6

一、单项选择题(每题2分,共20分)

1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于( )

A、应用统计学 B、描述统计学 C、推断统计学 D、理论统计学

12

Z0.05?1.645)

13 90 4 40 6 60 7 50 10 70 试求出以最小二乘法计算的回归方程,并预测当每周学习时数为8时,统计学成绩。

2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( )

A、扩大2倍 B、减少到1/3 C、不变 D、减少到1/2 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31.

( )

A、32.5 B、33 C、39.6 D、30 ( )

A、平均值的代表性越好 B、离散程度越大 C、稳定性越高 D、离散程度越小

5、对正态总体均值进行区间估计时,其它条件不变,置信水平1??越小,则置信上限与置信下限的差( )

A、越大 B、越小 C、不变 D、不确定 ( )

A、各水平总体方差是否相等 B、各水平的理论均值是否相等 C、同一水平内部数量差异是否相等 D、同一水平内部数值相等

7、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为

230

元和

680

( )

A、甲类较大 B、乙类较大 C、两类相同 D、不确定 8、在假设检验中,若( )

A、左侧检验 B、右侧检验 C、双侧检验 D、不知道

9、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为 ( )

A、45 B、40 C、44 D、43

10、某次考试学生的考试成绩X近似服从正态分布,X~N?78,64?,则可认为有大约( )

13

4、若两个变量的平均水平接近,标准差越大的变量,其

6、方差分析中的原假设是关于所研究因素

元,则职工月平均收入的离散程度

H0:??500,?H1:??500,则此检验是

95.45%的学生考试成绩分布的范围是

A、(70,80) B、(70,86) C、(62,94) D、(70,90) 二、多项选择题(每题2分,共10分)

1.估计量的评价标准是( )

A 无偏性 B 有效性 C 一致性 D 客观性 E 及时性 2. 下列哪些属于全面调查( )

A 普查 B 全面统计报表 C 重点调查 D 典型调查 E 抽样调查 3.下列关于变量数列中频率的说明不正确的是( ) A 各组频率大于1 B 各组频率大于0 C 各组频率之和等于1 D 各组频率之和小于1 E 各组频率之和大于1

4. 总体平均数的假设检验方法通常有( ) A Z检验法 B t检验法 C D F检验法 E 几何检验法

5.收入与消费存在一定的相关关系,这种相关属于( ) A 正相关 B 单相关 C 负相关 D 复相关 E 完全相关

三、填空题(每空2分,共20分)

1、统计词有三种涵义,即________________、_________________与_____________________。

2、加权算术平均数受两个因素的影响,一个是______________,一个是_____________。

3、在假设检验中,把符合

?2检验法

H0的总体判为不符合H0加以拒绝,这类错误称为

H0的总体当作符合H0而接受,这类错误称为

____________错误;把不符合

____________错误;显著性水平?是用来控制犯第_______类错误的概率。 4、直线相关系数等于零,说明两变量之间________________;直线相关系数等于-1,说明两变量之间_______________________。

四、简答题(每题5分,共20分)

1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法? 2、随机抽样的含义与特点?

14

3、什么是标准差系数?在什么场合下计算标准差系数?

4、说明单因素方差分析中,总离差平方和、水平项离差平方和、误差项离差平方和的含义与三者的关系?

五、计算题(每题10分,共30分)

1、随机抽查某企业100名职工,其月工资资料如下表

月工资额(百元) 5—8 8-10 10-12 12-14 14—18 合计 职工数(人) 4 10 80 3 3 100 要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。

2、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)

3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下: 产品产量(台)xi 生产费用(万元)yi 要求:利用最小二乘法求出估计的回归方程。 附: x?58 y?144.2

5540 130 50 140 50 145 70 150 80 156 ?xii?12?17900

?yii?12 ?104361?xyi?1i5i 0?4243

15

题库一答案

一、选择题(每题2分,共20分)

1. B 2.C 3.D 4.D 5.A 6.D 7A 8.B 9.D 10.C

二、多项选择题(每题2分,共10分)

1.ABCE 2.ACE 3.ADE 4.AB 5.ADE

三、填空题(每空2分,共20分)

1. 2. 3. 4. 5.

分组标志、组矩 4元、0.01

参数估计、假设检验 弃真错误、纳伪错误 -1,1

1.答:(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。其缺点是具有不唯一性。(1分)

(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。(1分)

(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响。(1分)

应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。此外,均值只适用于定距或定比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。(2分)

2.答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。

四、简答题(每题5分,共20分)

p值检验:若p??,不能拒绝H0;若p

3.3.答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。(2分)。

因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数(3分)。

4、答:方差分析的步骤:首先,计算出总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA)。SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小,三者之间的关系:SST=SSA+SSE。第二,计算SSE的均方MSE,SSA的均方MSA。将MSA和MSE进行对比,即得到所需要的F检验统计量。第三,将统计量的值F与给定的显著性水平a的临界值Fa进行比较,作出对原假设H0的决策。

五、计算题(每题10分,共30分) 1.解:(全对,给10分,错一空扣1分)

考分 人数 比率 向上累计 向下累计 人数(人) 比率(%) 人数(人) 比率(%) 16

60以下 60-70 70-80 80-90 90以上 合计 2 7 11 12 8 40 5.0 17.5 27.5 30.0 20.0 100.0 2 9 20 32 40 — 5.0 22.5 50.0 80.0 100.0 — 40 38 31 20 8 — 100.0 95.0 77.5 50.0 20.0 — 2.解:根据题意:提出假设:H0:u?4,H1:u?4(2分) 检验统计量Z?x?u0?/n?4.5?4?2(3分) 1/16由?=0.05,查表临界值Z??Z0.05?1.645

由于Z=2>Z?=1.645,所以应拒绝H0而接受H1,即北京市家庭每天上网的时间确有显著提高。(5分)

??n?XY??X?Y?100?3?10?20?2(4分) 3.解:?2n?X2?(?X)2100?1.5?102??Y/n??????12?X/n?Y??2X?202?10??0(4分) 100100??2X(2分) 样本回归方程:Y

题库二答案

一、选择题(每题2分,共20分)

1. C 2.D 3.D 4.A 5.D 6.B 7B 8.B 9.B 10.A

二、多项选择题(每题2分,共10分)

1.ABCD 2.ABD 3.ADE 4.AB 5.ADE

三、填空题(每空2分,共20分)

1. 2. 3. 4.

统计设计、统计调查、统计整理、统计分析 右偏、左偏

无偏性、有效性、一致性 线性相关

四、简答题(每题5分,共20分)

1. 答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数(2分)。(1)全距:计算简单、但容易受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差(2分)。(2)平均差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算(2分)。(3)标准差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算(2分)。(4)离散系数:用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小(2分)。

17

2.答:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差越大(4分);样本单位数的多少,样本单位数越大,抽样误差越小(2分);抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小(2分);抽样组织方式:简单随机抽样的误差最大(2分)。 3.答:相关分析,就是用一个指标来表明现象相互依存关系的密切程度。回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系(2分)。

(1)两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时,必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度(4分)。

(2)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,确定一个相关的数学方程式,根据这个数学方程式从已知变量推测未知量,从而为估算和预测提供了一个重要的方法(4分)。

4、答:基本步骤:1.提出原假设和备择假设(2分)

2.确定适当的检验统计量(2分)

3.规定显著性水平α,确定临界值(2分) 4.计算检验统计量的值(2分) 5.作出统计决策(2分)

五、计算题(每题10分,共30分)

1.解:

(1)乙班的平均分数: x乙??xff?3750?75(5分) 502 乙班平均分数的标准差:?乙??(x?x)?ff?4800?9.79 50 乙班平均分数的标准差系数:?乙?9.79?13.05%(3分) 75(2)比较哪个班的平均分数更有代表性:

因为?甲?9.99.79?12.22%小于?乙??13.05% 81752所以甲班的平均分数更有代表性(2分)。

2.解:已知:??P(1?P)?0.02?0.98,?p?4%。(5分) 1-?=95.45%即Z?/2?2。

2Z?22?0.02?0.98/2P(1?P)必要的抽样数目:n?(5分) ??49(件)22?p0.04n?XY??X?Y100?3?10?20???2 3.解::?2?n?X2?(?X)2100?1.5?102

18

??Y/n??????12?X/n?Y??2X?202?10??0 100100??2X(6分) 样本回归方程:Y??2X?2?0.5?1(亿元) 将有关数据代入回归方程,得:Y置信度为95.45%的利润额的预测区间为:

1?2?0.05?Y?1?2?0.05,即0.9(元)?Y?1.1(元)(4分)。

题库三答案

一、选择题(每题2分,共20分)

1.B 2.A 3.D 4.A 5.A 6.A 7.D 8.B 9.B 10.A

二、多项选择题(每题2分,共10分)

1.ABC 2. BDE 3.CE 4.ACDE 5.ACD

三、填空题(每空2分,共20分)

1. 2. 3. 4. 5.

描述统计学、推断统计学 等距式分组、异距式分组 矩形

标准差、均值

总体均值、总体比例、总体方差

四、简答题(每题5分,共20分)

1. 答:完整的统计调查方案包括:

(1)确定调查目的,即为什么调查(2分);

(2)确定调查对象和调查单位,即向谁调查(2分); (3)确定调查项目和调查表,即调查什么(2分); (4)其他内容,包括调查的时间与组织安排等(4分)。

2.答:数据的计量尺度由低级到高级、由粗略到精确分为四个层次,即定类尺度、定序尺度、定距尺度和定比尺度。

定类尺度,是最粗略、计量层次最低的计量尺度,它是按照事物的某种属性对其进行平行的分类或分组。各类别之间是平等的并列关系,无法区分优劣或大小。(1分)

定序尺度,它是对事物之间等级差或顺序差别的一种测度。该尺度不仅可以将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。该尺度的计量结果只能比较大小,不能进行加、减、乘、除数学运算。(1分)

定距尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。该尺度的计量结果表现为数值,并可以计算差值,因而,其结果可以进行加减运算。定距尺度没有一个绝对零点,不能进行乘、除运算。(1分)

定比尺度,与定距尺度属于同一层次,其计量的结果也表示为数值。由于有绝对的零点,可以进行加、减、乘、除运算。(1分)

上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。(1分)

3.答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。变量值绝对水平越高,离散程度的测度值

19

自然也就大,绝对水平越低,离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。(2分)

标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(1分)

因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(2分)

4、答:必要抽样数目受以下因素影响:

(1)总体方差?。其他条件不变的条件下,总体单位的差异程度大,则应多抽,反之可少抽一些(1分)。

(2)允许误差范围

2?x或?p。允许误差增大,意味着推断的精度要求降低,在其他条

件不变的情况下,必要的抽样数目可减少;反之,缩小允许误差,就要增加必要的抽样数目(1分)。

(3)置信度(1-?)。在其他条件不变的情况下,要提高推断的置信程度,就必须增加抽样数目(1分)。

(4)抽样方法。相同条件下,采用重复抽样应比不重复抽样多抽一些样本单位(1分)。 (5)抽样组织方式。由于不同抽样组织方式有不同的抽样误差,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同(1分)。

五、计算题(每题10分,共30分)

1.解: 1. 解: 甲市场 品种 甲 乙 丙 合 计 甲市场平均价格x?价格(元/斤) 成交额(m) 1.2 1.4 1.5 - 1.2 2.8 1.5 5.5 成交量(m/x) 1 2 1 4 乙市场 成交量(f) 2 1 1 4 成交额(xf) 2.4 1.4 1.5 5.3 ?m?5.5?1.375(元)(3分) m?x4乙市场平均价格x??xf?f?5.3?1.325(元)(3分) 4说明:两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。甲市场销售价格较高的乙产品最

20

多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。这就是权数在平均数形成中所起的权衡轻重的作用(4分)。 2.解:根据题意:提出假设:H0:u?50,H1:u?50 检验统计量t?x?u0S/n?50.2?50?0.9733

0.65/10由?=0.05,查表临界值t?/2?t0.025?2.2622

由于t=0.9733

3.解:b?n?xy??x?yn?x2???x?2?10?6275?473?122?0.195(4分) 210?24959?473a?y?bx?12.2?0.915?47.3?2.9765(4分)

yc?a?bx?12.9756?0.195x

当x?5时y?a?bx?2.9756?0.195?5?3.95元(2分)

题库四答案

一、选择题(每题2分,共20分)

1.D 2.D 3.B 4.B 5.B 6.C 7.B 8.C 9.C 10.D

二、多项选择题(每题2分,共10分)

1.DE 2. CDE 3.BC 4.ACDE 5.BE

三、填空题(每空2分,共20分)

1. 2. 3. 4. 5.

定性数据、定量数据

定类尺度、定序尺度、定距尺度、定比尺度 各组权数相等

矩估计法、极大似然估计法 -1,1

四、简答题(每题5分,共20分)

1. 答:(1)众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。 (2)中位数:不受极端值影响,数据分布偏斜程度较大时应用(2分)。

(3)平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(2分)。 2.答:随机原则,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否入样是随机的(2分)。

遵循随机原则抽样,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。

3.答:以标准差系数为例。标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分)

21

因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(3分)

4、答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。

p值检验:若p??,不能拒绝H0;若p

10i标准差:s??(x?x)f?f?1x?u0?490(5分) ?7.38(件)

10?12.解:根据题意:提出假设:H0:u?4,H1:u?4

检验统计量Z??/n?4.5?4?2(5分) 1/16由?=0.05,查表临界值Z??Z0.05?1.645

由于Z=2>Z?=1.645,所以应拒绝H0而接受H1,即西安市家庭每天看电视的时间确有显著提高。(5分)

3.解:b?n?xy??x?yn?x???x?22?5.2(4分)

a?y?bx?20.4(4分)

yc?a?bx?20.4?5.2x

当x?5时y?a?bx?20.4?5.2?8?62分(2分)

题库五答案

一、选择题(每题2分,共20分)

1.B 2.A 3.B 4.B 5.B 6.B 7.A 8.A 9.C 10.C

二、多项选择题(每题2分,共10分)

1.ABC 2. AB 3.ADE 4.AB 5. AB

三、填空题(每空2分,共20分)

1. 统计工作、统计数据、统计学

22

2. 3. 4. 5. 变量水平、权数 各组权数相等

所有单位、全面调查 无线性相关、完全负相关

四、简答题(每题5分,共20分)

1. 答:有关数据均值的计算。当数据呈较严重偏态分布时,用平均数则代表性很差(2分)。正确使用的原则:

(1)众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。 (2)中位数:不受极端值影响,数据分布偏斜程度较大时应用(1分)。

(3)平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(1分)。 2.答:随机原则,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否入样是随机的(1分)。

遵循随机原则抽样,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。

3.答:标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分)

因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(3分)

4、答:SST----总离差平方和,反映全部数据总的误差程度;SSE-----误差项离差平方和,反映随机误差的大小;SSA-----水平项离差平方和,反映随机误差和系统误差的大小;(3分) 三者之间的关系:SST=SSA+SSE。(2分)

五、计算题(每题10分,共30分)

1.解:x??xf1083??10.83(百元/人)(4分) f100?2s?v?(xi?x)?=1.44 (百元/人) (4分)

?f?1s?13.3% (2分) x

2.解:n?49是大样本,

已知:x?12.6,S?2.8 ??0.0455

则有: Z??Z0.022752S22.8?2 平均误差=??0.4 (3分)

n7极限误差??Z?2S2?2?0.4?0.8 (3分) n 23

据公式 x?Z?2S2?x?? (4分) n代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)元。 3.解:计算估计的回归方程:

?1??0???n?xy??x?y5?42430?290?7213060==0.567 (4分) ?2225400n?x?(?x)5?17900?290?yn??1??xn?144.2 – 0.567×58=111.314 (4分)

?估计的回归方程为:y=111.314+0.567x (2分)

题库六答案

一、选择题(每题2分,共20分)

1.B 2.B 3.D 4.C 5.A 6.D 7.A 8.C 9.C 10.B

二、多项选择题(每题2分,共10分)

1.CE 2. ABCD 3.ADE 4.ABC 5. AB

三、填空题(每空2分,共20分)

1. 2. 3. 4. 5.

全面调查、非全面调查

正态曲线、平顶曲线、尖顶曲线 各组权数相等 越大,越小 右偏、左偏

四、简答题(每题5分,共20分)

1. 答:(1)是一门搜集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。(3分)

(2)统计学与统计数据有密不可分的关系。统计学是由一套收集和处理统计数据的方法所组成,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。统计数据不用统计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。(2分)

2.答:任意两个总体平均数的代表性比较,应当用标准差系数。标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分)

因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(3分)

3.答:影响因素包括:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差越大(2分);样本单位数的多少,样本单位数越大,抽样误差越小(1分);抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小(1分);抽样组织方式:简单随机抽样的误差最大(1分)。

4、答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。

24

p值检验:若p??,不能拒绝H0;若p

五、计算题(每题10分,共30分)

1.解:x??xf1083(4分) ??10.83(百元/人)f100?2s?v?(xi?x)?=1.44 (百元/人) (4分)

?f?1s?13.3% (2分) xsn0.07310=0.0073,(3分)

2.解:解:抽样平均误差已知F (z)=95.45%,z=2,

???x?z?2?0.0073?0.0146 (3分)

?x??区间的下限是:X??=1.65-0.0146=1.6354(米) 区间的上限是:X??=1.65+0.0146=1.6646(米)

故可以95.45%的概率保证这些初中生的身高在1.6354米- 1.6646米之间。(4分)

3.解:计算估计的回归方程:

???2

n?xy??x??y?9?803.02?472?13.54?0.02739?28158?(472)n?x?(?x),(4分)

222

??y???x??1213.54472?0.0273??0.072799 (4分)

Y=0.0727+0.0273x (2分)

25