统计学期末试题 - 模拟试卷一及答案 下载本文

模拟试卷一:

统计学期末试题

院系________姓名_________成绩________

一. 单项选择题(每小题2分,共20分)

1. 对于未分组的原始数据,描述其分布特征的图形主要有( )

A. 直方图和折线图 B. 直方图和茎叶图 C. 茎叶图和箱线图 D. 茎叶图和雷达图

2. 在对几组数据的离散程度进行比较时使用的统计量通常是( )

A. 异众比率 B. 平均差 C. 标准差 D. 离散系数

3. 从均值为100、标准差为10的总体中,抽出一个n?50的简单随机样本,样本均值的

数学期望和方差分别为( )

A. 100和2 B. 100和0.2 C. 10和1.4 D. 10和2

4. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是使它与

总体参数的离差越小越好。这种评价标准称为( ) A. 无偏性 B. 有效性 C. 一致性 D. 充分性

5. 根据一个具体的样本求出的总体均值95%的置信区间( )

A. 以95%的概率包含总体均值 B. 有5%的可能性包含总体均值 C. 一定包含总体均值 D. 可能包含也可能不包含总体均值

6. 在方差分析中,检验统计量F是( )

A. 组间平方和除以组内平方和 B. 组间均方和除以组内均方 C. 组间平方和除以总平方和 D. 组间均方和除以组内均方

7. 在回归模型y??0??1x??中,?反映的是( )

A. 由于x的变化引起的y的线性变化部分 B. 由于y的变化引起的x的线性变化部分

C. 除x和y的线性关系之外的随机因素对y的影响 D. 由于x和y的线性关系对y的影响

8. 在多元回归分析中,多重共线性是指模型中( )

A. 两个或两个以上的自变量彼此相关 B. 两个或两个以上的自变量彼此无关 C. 因变量与一个自变量相关

D. 因变量与两个或两个以上的自变量相关

9. 若某一现象在初期增长迅速,随后增长率逐渐降低,最终则以K为增长极限。描述该

类现象所采用的趋势线应为( )

A. 趋势直线 B. 指数曲线 C. 修正指数曲线 D. Gompertz曲线

10. 消费价格指数反映了( )

A. 商品零售价格的变动趋势和程度

B. 居民购买生活消费品价格的变动趋势和程度 C. 居民购买服务项目价格的变动趋势和程度

D. 居民购买生活消费品和服务项目价格的变动趋势和程度

二. 简要回答下列问题(每小题5分,共20分)

1. 解释总体与样本、参数和统计量的含义。

2. 简述方差分析的基本假定?

3. 简述移动平均法的基本原理和特点。

4. 解释拉氏指数和帕氏指数。

三. (20分)一种产品需要人工组装,现有三种可供选择的组装方法。为比较哪种方法更好,

随机抽取10个工人,让他们分别用三种方法组装。下面是10个工人分别用三种方法在相同时间内组装产品数量(单位:个)的描述统计量:

方法1 平均 中位数 众数 标准差 峰值 偏斜度 极差 最小值 最大值 165.7 165 164 2.45 -0.63 0.38 8 162 170 平均 中位数 众数 标准差 峰值 偏斜度 极差 最小值 最大值 方法2 129.1 129 129 1.20 -0.37 -0.23 4 127 131 平均 中位数 众数 标准差 峰值 偏斜度 极差 最小值 最大值 方法3 126.5 126.5 126 0.85 0.11 0.00 3 125 128 (1) 你准备采用什么方法来评价组装方法的优劣?试说明理由。 (2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。

四. (20分)从一批零件中随机抽取36个,测得其平均长度为149.5cm,标准差为1.93cm。

(1) 试确定该种零件平均长度95%的置信区间。

(2) 若要求该种零件的标准长度应为150cm,用假设检验的方法和步骤检验该

批零件符合标准要求?(??0.05)。 (3) 在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释

这一定理。

五. ((20分)一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司

的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到30个地

区的有关数据。利用Excel得到下面的回归结果(??0.05): 方差分析表 变差来源 df 回归 残差 总计 参数估计表 Intercept X Variable 1 X Variable 2 X Variable 3 Coefficients 7589.1025 -117.8861 80.6107 0.5012 标准误差 2445.0213 31.8974 14.7676 0.1259 t Stat 3.1039 -3.6958 5.4586 3.9814 P-value 0.00457 0.00103 0.00001 0.00049 29 SS 13458586.7 MS 4008924.7 — F — — Significance F 8.88341E-13 — — (1) 将方差分析表中的所缺数值补齐。

(2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各

回归系数的意义。

(3) 检验回归方程的线性关系是否显著? (4) 检验各回归系数是否显著?

(5) 计算判定系数R2,并解释它的实际意义。 (6) 计算估计标准误差sy,并解释它的实际意义。

模拟试卷二:

一、 1.

单项选择题(每小题2分,共20分)

甲、乙、丙三人的数学平均成绩为72分,加上丁后四人的平均成绩为78分,则丁的数学成绩为

A. 96 B. 90 C.80 D.75

2.

以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 4557362

5860则销售的中位数为 3.

A. 5 B. 45 C. 56.5 D. 7.5

10个翻译当中有8个人会英语,7个人会日语。从这10个人当中随机地抽取一个人,他既会英语又会日语的概率为 A. 4.

810 B.

510 C.

710 D.

110

某汽车交易市场共发生了150项交易,将销售记录按付款方式及汽车类型加以区分如下:

一次付款 分期付款 新车 5 95 旧车 25 25 如果从销售记录中随机抽取一项,该项是分期付款的概率是

5.

A. 0.95 B. 0.5 C. 0.8 D. 0.25

某火车票代办点上季度(共78天)的日销售额数据如下: 销售额(元) 3000以下 3000—3999 4000—4999 5000—5999 6000及以上 天数 8 22 25 17 6 从中任选一天,其销售额不低于5000元的概率为 A. 6.

113 B.

2378 C.

7278 D. 0

纺织品平均10平方米有一个疵点,要观察一定面积上的疵点数X,X近似服从 A. 二项分布 B. 泊松分布 C. 正态分布 D. 均匀分布

某总体容量为N,其标志值的变量服从正态分布,均值为?,方差为?。X为样本容量为n的简单随机样本的均值(不重复抽样),则X的分布为

27.

A. N(?,?) B. N(?,2?2n) C. N(X,?2n) D. N(?,?2n?N?nN?1)

8.

在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是使它与总体参数的离差越小越好。这种评价标准称为

B. 无偏性 B. 有效性 C. 一致性 D. 充分性 拉氏指数方法是指在编制综合指数时

A. 用基期的变量值加权 B. 用报告期的变量值加权 C. 用固定某一时期的变量值加权 D. 选择有代表性时期的变量值加权

9.

10. 根据各季度商品销售额数据计算的季节指数分别为∶一季度125%,二季度70%,三季

度100%,四季度105%。受季节因素影响最大的是

B. 一季度 B. 二季度 C. 三季度 D. 四季度

二、 简要回答下列问题(每小题5分,共20分) 1. 解释95%的置信区间。

2. 简述风险型决策的准则。

3. 简述居民消费价格指数的作用。

4. 在回归模型y??0??1x1??2x2????pxp??中,对?的假定有哪些?

三、 (15分)下面是36家连锁超市10月份的销售额(万元)数据: 167 190 166 180 167 165 174 170 187 185 183 175 158 167 154 165 179 186 189 195 178 197 176 178 182 194 156 160 193 188 176 184 179 176 177 176

(1) 根据上面的原始数据绘制茎叶图。

(2) 将销售额等距分为5组,组距为10,编制次数分布表; (3) 绘制销售额次数分布的直方图,说明销售额分布的特点。 (4) 说明直方图和茎叶图的区别。

四、 (15分)甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为

12分。乙班考试成绩的分布如下:

考试成绩(分) 60以下 60—70 70—80 80—90 90—100 合计 学生人数(人) 2 7 9 7 5 30 要求:(1)计算乙班考试成绩的均值及标准差; (2)比较甲乙两个班哪个班考试成绩的离散程度大?

五、 (15分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某

天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:

每包重量(克) 96~98 98~100 100~102 102~104 104~106 合计 已知食品包重服从正态分布,要求:

(1) 确定该种食品平均重量95%的置信区间。

(2) 如果规定食品重量低于100克属于不合格,确定该批食品合格率95%的置

信区间。 (3) 采用假设检验方法检验该批食品的重量是否符合标准要求?(写出检验的

具体步骤)。

(注:z?

2包数 2 3 34 7 4 50 ?z0.025?1.96)

六、 (15分)随着零售业市场竞争的日益加剧,各零售商不断推出新的促销策略。物通百货

公司准备利用五一假日黄金周采取部分商品的大幅度降价策略,旨在通过降价赢得顾客、提高商品的销售额,同时也可以进一步调整商品的结构。为分析降价对销售额带来的影响,公司收集的降价前一周和降价后一周集中主要商品的有关销售数据,如下表:

几种主要商品一周的销售数据

商品名称 甲 乙 丙 计量单位 台 套 件 价格(元) 降价前 降价后 销售量 降价前 降价后 3200 2560 50 70 860 516 120 180 180 126 240 336 (1) 降价后与降价前相比,三种商品的总销售额增长的百分比是多少?销售额增长的绝对值是多少?

(2) 以降价后的销售量为权数,计算三种商品的平均降价幅度是多少?由于降价而减少的销售额是多少? (3) 以降价前的价格为权数,计算三种商品的销售量平均增长幅度是多少?由于销

售量增长而增加的销售额是多少?

说明你在分析上述问题时采用的是什么统计方法?采用该方法的理由是什么?

模拟试卷一答案:

一、 单项选择题

1-5CDABD 6-10.BCACD

二、 i.

总体:所研究的全部个体(元素)的集合。

样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。 参数:研究者想要了解的总体的某种特征值,参数通常是一个未知的常数。

统计量:根据样本数据计算出来的一个量。由于样本是我们所已经抽出来的,所以统计量总是知道的。 ii. (1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观

测值是来自正态分布总体的简单随机样本。

(2)各个总体的方差?2必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的。 (3)观测值是独立的。 iii.

移动平均法是趋势变动分析的一种较简单的常用方法。当时间数列的变动趋势

为线性状态时,可采用移动平均法进行描述和分析。该方法是通过扩大原时间数列的时

间间隔,并按一定的间隔长度逐期移动,分别计算一系列移动平均数,由这些平均数形成的新的时间数列对原时间数列的波动起到一定的修匀作用,削弱了原数列中短期偶然iv.

因素的影响,从而呈现出现象发展的变动趋势。

拉氏指数是1864年德国学者拉斯贝尔斯(Laspeyres)提出的一种指数计算方

简答题

法,它是在计算一组项目的综合指数时,把作为权数的各变量值固定在基期而计算的指数。

帕氏指数是1874年德国学者帕煦(Paasche)所提出的一种指数计算方法,计算一组项目的综合指数时,把作为权数的变量值固定在报告期计算的指数。

三、

(1)用离散系数。 因为标准差不能用于比较不同组别数据的离散程度。 (2)三种组装方法的离散系数分别为:vA?0.015,vB?0.009,vC?0.007。虽然方法A的离散程度要大于其他两种方法,但其组装产品的平均数量远远高于其他两种方法。所以还是应该选择方法A。 四、

(1)x?z?s2n?149.5?1.96?1.9336?149.5?0.63

(148.87,150.13)

(2)H0:??150,H1:??150。 检验统计量z?149.5?1501.9336??1.55,由于z??1.55?z??1.96。不拒绝原假设。

2符合要求。

(3)使用了中心极限定理。从均值为?、方差为?2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n?30),样本均值x的抽样分布近似服从均值为?、方差为?2n的正态分布。

五、 (1)

SS 12026774.1 1431812.6 13458586.7 MS 4008924.7 55069.7 — F 72.8 — — Significance F 8.88341E-13 — — 3 26 29 变差来源 df 回归 残差 总计 ??7589.1025?117.8861x1?80.6107x2?0.5012x3 (2)y???117.8861表示:在年人均收入和广告费用不变的条件下,销售价 回归系数?1??80.6107表示:在年销售价格和广格每增加1元,销售量平均减少117.8861个单位;?1??0.5012告费用不变的条件下,人均收入每增加1元,销售量平均增加80.6107个单位;?3表示:在年销售价格和人均收入不变的条件下,广告费用增加1元,销售量平均增加0.5012

个单位。

(3)由于Significance F=8.88341E-13<0.05。拒绝原假设,线性关系显著。 (4)各回归系数检验的P值分别为:0.00103、0.00001、0.00049,均小于0.05,表明各回归系数均显著。

(5)R2?12026774.113458586.7?89.36%。它表示在销售量的总变差中,被销售价格、年人

均收入、广告费用与销售量之间的线性关系所解释的比例为89.36%。

(6)sy?1431812.630?3?1?234.67。它表示销售价格、年人均收入和广告费用预测销

售量时的平均预测误差为234.67元。

模拟试卷二答案:

一、 单项选择题

1-5.ACCCB 6-10.BDBAB

二、 简要回答下列问题

1. 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间

不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。

2. (1)期望值准则。它是以各方案收益的期望值的大小为依据,来选择合适的方案。

(2)变异系数准则根据变异系数作为选择方案的标准,以变异系数较低的方案作为所要选择的方案。

(3)最大可能准则。在最可能状态下,可实现最大收益值的方案为最佳方案。 (4)满意准则。首先要给出一个满意水平,然后,将各种方案在不同状态下的收益值与目标值相比较,并以收益值不低于目标值的累积概率为最大的方案作为所要选择的方案。

3. (1)用于反映通货膨胀状况。(2)反映货币购买力变动。货币购买力是指单位货

币能够购买到的消费品和服务的数量。(3)反映对职工实际工资的影响。消费价格

指数的提高意味着实际工资的减少,消费价格指数下降则意味着实际工资的提高。因此,利用消费价格指数可以将名义工资转化为实

4. (1)误差项?是一个期望值为0的随机变量,即E(?)?0。

(2)对于自变量x1,x2,?,xp的所有值,?的方差?2都相同。

(3)误差项?是一个服从正态分布的随机变量,且相互独立。即?~N(0,?2)。

三、

(1)茎叶图如下: 茎 叶 15 16 17 18 19

4 0 0 0 0 6 5 4 2 3 8 5 5 3 4 6 6 4 5 7 6 5 7 7 6 6 7 6 7 7 8 8 9 8 9 9 (1) 频数分布表如下: 分组 150-155 155-160 160-165 165-170 170-175 175-180 180-185 185-190 190-195 195-200 合计

(2) 直方图如下:

频数 1 2 1 6 2 10 4 5 3 2 36

121086420150-115555-116600-116655-117700-117755-118800-118855-119900-119955-200

(3) 茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布

状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。

四、

(1)x乙-77 ,s乙?11.86

1286?0.140,v乙?11.8677?0.154。乙班的离散程度大。

(2) v甲? 五、

(1)x?101.32,s?1.63。 x?z?s2n?101.32?1.96?1.6350?101.32?0.45

(100.87,101.77)

(2)p?550?0.10。

p?z?p(1?p)2n?0.10?1.96?0.10(1?0.10)50?0.10?0.08

(2%,18%)

(3)H0:??100,H1:??100。 检验统计量z?不符合要求。 六、

(1)三种商品的总销售额增长的百分比:

10101.32?1001.6350?5.73,由于z?5.73?z?2?1.96。拒绝原假设。

?pq?pq10?1?2560?70?516?180?126?3363200?50?860?120?180?240?1?314416306400?1?102.62%?1?2.62%销售额增长的绝对值=?p1q??p0q0?314416?306400?8016(元) 1(2)三种商品的平均降价幅度: p10??pq?pq1011?1?2560?70?516?180?126?3363200?70?860?180?180?336?1?314416439280?1?71.58%?1??28.42%由于降价而减少的销售额=?p1q??p0q1?314416?439280??124864(元)

1(3)三种商品的销售量平均增长幅度:

q10??p?p00q1q0?1?3200?70?860?180?180?3363200?50?860?120?180?240?1?439280306400?1?143.37%?1?43.37%由于销售量增长而增加的销售额=

?p0q?1?p0q0?439280?306400?132880(元)

(4)采用的是统计指数方法。由于所要分析的是三种不同商品销售额、价格和销售量的综合变动。要进行综合并进行对比,通常要采用指数的方法。