7. 计算抽样平均误差,当缺少总体方差资料时,可以用样本方差来代替。( )
8. 抽样平均误差、总体标准差和样本容量的关系可用公式表达,因此在统计实践中,为了降低抽样平均误差,可缩小总体标准差或增大样本容量来达到。( ) 9. 重复抽样误差一定大于不重复抽样误差。( )
10. 整群抽样为了降低抽样平均误差,在总体分群时注意增大群内方差缩小群间方差。( ) 11. 当全及总体单位数很大时,重复抽样和不重复抽样计算的抽样平均误差相差无几。( ) 12. 类型抽样应尽量缩小组间标志值变异,增大组内标志值变异,从而降低影响抽样误差的总方差。( )
13. 在总体各单位标志值大小悬殊的情况下,运用类型抽样比简单随机抽样可以得到比较准确的结果。( ) 四、 简答题
1. 什么是总体参数估计?
2. 什么是总体?什么是样本?二者有何异同?
3. 参数估计的优良标准是什么?抽样平均数和抽样成数是否符合优良估计标准,试加以说明。 4.在参数估计中,为什么说准确性的要求和可靠性的要求是一对矛盾,在实际估计中又如何解决这对矛盾? 5.以样本方差s2?(x?x)?n?12作为总体方差?的估计量,为什么分母是n-1而不是n?
26.什么是抽样平均误差?影响的因素有哪些?
7.什么是样本统计量,它和总体参数有什么样区别和联系? 8.什么是抽样分布?
9.什么是重复抽样?什么是不重复抽样?
10.为什么重复抽样的分布的误差总是大于不重复抽样分布的误差?
11.什么是类型抽样?什么是整群抽样?类型抽样中的分组和整群抽样中的分群有什么不同意义? 12.什么是等距抽样?等距抽样有哪些方法? 13.什么是阶段抽样?
14.影响必要样本容量的因素有哪些? 五、 计算题
1.假设某班期末统计学考试成绩服从正态分布,平均成绩为70分,标准差为12分,要求计算:(1)随机抽取1人,该同学成绩在82分以上的概率;(2)随机抽取9人,其平均成绩在82分以上的概
率。
2.某手表厂在某段时间内生产100万个某种零件,用纯随机抽样方式不重复抽取1000个零件进行检验,测得废品为20件。如以99.73%概率保证,试对该厂这种零件的废品率作定值估计和区间估计。
3.电子元件厂日产10000只元件,经多次一般测试得知一等品率为92%,现拟采用随机抽样方式进行抽检,如果求误差范围在2%之内,可靠程度为95.45%,问需抽取多少电子元件?
4.从麦当劳餐厅连续三个星期抽查49位顾客,以调查顾客的平均消费额,得样本平均消费额为25.5元。要求:
(1)假如总体的标准差为10.5元,那么抽样平均误差是多少?
(2)在0.95的概率保证下,抽样极限误差是多少?极限误差说明什么问题? (3)总体平均消费额95%的信赖区间是多少?
5.随机抽取某市400家庭作为样本,调查结果80户家庭有1台以上的摄像机试确定一个以99.73%的概率保证估计的该市有一台以上摄像机家庭的比率区间(F(t)=99.73% t=3)。 6.从仓库中随机取100盒火柴,检验结果,平均每盒火柴99支,样本标准差为3支。 (1)计算可靠程度为99.73%时,该仓库平均每盒火柴支数的区间。
(2)如果极限误差减少到原来的1/2,对可靠程度的要求不变,问需要抽查多少盒火柴。 7.采用简单随机抽样的方法,从2000件产品中抽查200件,其中合格品190件,要求: (1) 计算合格品率及其抽样平均误差。
(2) 以95.45%概率保证程度,对合格品率和合格品数量进行区间估计。 (3) 如果合格品率的极限误差为2.31%,则其概率保证程度是多少?
8.某进出口公司出口一种名茶,为检查其每包规格的质量,抽取样本100包,检验结果如下:
每包重量(克) 148-149 149-150 150-151 151-152 合计 按规定这种茶叶每包规格重量应不低于150克。 试以99.73%的概率保证程度(t=3): (1) 确定每包平均重量的极限误差;
包数(包) 10 20 50 20 100
(2) 估计这批茶叶每包重量的范围,确定是否达到规格要求。
9.某电子产品使用寿命在3000小时以下为次品,现在用简单随机抽样方法,从5000个产品中抽取100个对其使用寿命进行测试。其结果如下:
电子产品使用寿命表
使用寿命(小时) 3000以下 3000—4000 4000—5000 5000以上 合计 根据以上资料,要求:
(1) 按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。 (2) 按重复抽样和不重复抽样计算该产品次吕率的抽样平均误差。
(3) 以68.27%的概率保证程度,对该产品的平均使用寿命和次品率进行区间估计。
10.对一批成品按不重复简单随机抽样方式抽选200件,其中废品8件。又知道抽样是成品总量的4%。当概率为95.45%时,可否认为这一批产品的废品率不超过5%。
11.从5000名学生中抽查200名测得平均身高为1.65m抽样平均误差为0.05m,试以95%的把握程度推算全部学生平均身高的可能范围。若200名学生中女生数为50名,试以95%的概率,抽样成数平均误差为0.03,估计全部学生数中女生的比重的区间。
12.某公司欲将某种产品推向某国市场,为此先进行抽样调查,了解该产品在该国家的家庭拥有情况,问应抽多少家庭调查才能以98%的概率保证估计误差不超过5% (t=2.33)
13.某市有职工100000人,其中职员40000人,工人60000人,现在进行职工收入抽样调查,事先按不同类型抽查40名职员和60名工人,结果如下:
职工月收入表
职 员 月收入(元) 600 800 1000 根据以上资料,要求:
产品个数 2 30 50 18 100 工 人 人数 10 20 10 月收入(元) 400 600 700 人数 20 30 10
(1) 在概率保证程度95.45%下,对该市职工的平均收入进行区间估计。
(2) 如果要求极限误差不超过20元,概率保证程度为95.45%,试计算按类型抽样组织形式必要
的样本单位数。
如果按简单随机抽样组织形式,请问:
(3) 同样的极限误差和概率保证程度,需要抽多少样本单位数? (4) 同样的样本单位数和概率保证程度,则会有多大的极限误差? 同样的样本单位数和极限误差,应有多大的概率保证程度?
14.某地有储户4万户,采用不重复随机抽样从中抽出9%户调查资料如表。
存款(千元) 400 500 600
试在95.45%的概率保证条件下,估计: (1)4万户储户平均存款的可能范围
(2)4万户储户中工人户比重的可能范围(结果留两位小数)
第六章 相关与回归分析习题
一、填空题
1.现象之间的相关关系按相关的程度分为 、 和 ;按相关的形式分为 和 ;按影响因素的多少分为 和 。
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量 ,这种相关称为正相关;当一个现象的数 量由小变大,另一个现象的数量 ,这种相关称为负相关。
3.相关系数的取值范围是 。
4.完全相关即是 关系,其相关系数为 。
5.相关系数,用于反映 条件下,两变量相关关系的密切程度和方向的统计指标。 6.直线相关系数等于零,说明两变量之间 ;直线相关系数等1,说明两变量之间 ;直线相关系数等于—1,说明两变量之间 。 7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的 ,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为 。
8.回归方程y=a+bx中的参数a是 ,b是 。在统计中估计待定参数的常用方法是 。
9. 分析要确定哪个是自变量哪个是因变量,在这点上它与 不同。
10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通 过 化成 来解决。
11.用来说明回归方程代表性大小的统计分析指标是 。
户 数 900 1800 900 其中工人户 360 720 180