现代心理与教育统计学 下载本文

第七章 参数估计

第一节 点估计、区间估计与标准误 一 点估计的定义

以样本的统计量(数轴上的一个点)作为总体参数的估计值称为点估计。如:用样本平均数作为总体参数?的估计值,样本标准差作为总体标准差?

例如:知样本的语文成绩的平均数是75分,我们便推论这个样本的总体参数(字母)也是75分。

二良好估计量的标准 1.无偏性:(多选简答)

即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。 例如:用样本平均数作为总体?的估计值就是无偏估计,因为无数个样本平均数的平均值既为?。

如果多个样本的统计量作为总体参数的估计值,其偏差的平均数大于或者小于

2

零,则为偏估计,例如:样本方差s2就不是?2无偏估计 而是sn?1

2.有效性

当总体参数的无偏估计不止一个统计时,无偏估计变异小的有效性高,反之则有效性低。

即样本统计量的方差越小越好。(考虑M、MO、Md)(平均数方差最小) 例如:判断下列两个平均数的样本哪个有效。 3.一致性

当样本容量无限增大时,估计值应能够越来越接近他所估计的总体参数,估计值越来越精确,逐渐趋于真值。 如:当N??时,s1n?1??,X??

2—4.充分性

指一个容量为n的样本统计量,是否充分的反应了全部n个数据所反应总体的信息。 例如

平均数m就能充分反映各个数据的信息。 中数Md和Mo只能反映部分数据信息。

29

三,区间估计与标准误

一,区间估计的定义(名词解释)

区间估计是一个统计量的区间来估计相应的总体参数,它要求按照一定的概率要求,根据样本统计量来估计总体参数可能落入的数值范围。 特点,用数轴上的一段距离来表示未知参数可能落入的范围。

例如:当已知样本的平均数是60时可以用区间(55.65)来估计总体参数的范围。 二,置信区间与显著性水平。(名词解释选择题) 1.置信区间

也叫置信间距:是指在特定的可靠性(即置信系数)要求下估计总体参数所落的区间范围。

例如:在95%的可靠下,总体的参数落在(90 100)5%以下为小概率事件 2.置信系数

是指被估计的总体参数落在置信区间内的概率,又叫置信水平,置信度。 例如:置信系数为95%时是指总体参数落在某个区间时的可靠性为95%,意味着可靠性能提高。 3.显著性水平

一个置信系数同时反映了在做出一个估计时所犯错误的小概率(?),即可靠性为95%时 意味着犯错误的概率为5%,可靠性为99%时,意味着犯错误的概率为1%。 这种犯错误的小概率也叫做显著性水平,用a表示。 1-置信系数=显著性水平。(?)如:1-95%=5% 4.置信系数和置信区间的关系。(选择)

观察:100%的可能性你的考试分数在(0,100)分 95%的可能性,你的考数分数在(50,90)分 置信系数越高,区间越大,估计越模糊。 置信系数越小 ,区间越小,估计越精确。 最佳的估计要置信区间适度,又要置信系数较高

置信区间长度与显著性水平是反比的关系。(判断谁增大谁减小的问题) 三区间估计的原理与标准误 1.如何确定估计的区间? 回想一下生活中的例子。

某个食品包装袋上会告诉你被食品的重量是100+减3克,你们能否猜出这种食品的实际重量的区间是多少? (97.103)我们把3叫做误差

在统计学中也是用误差来估计参数区间的长度的,解释总体参数落入这个置信区间的概率水平,这个误差有时候也叫样本统计量的标准差,为了区别总体的标准差,把它叫做标准误(SE) 即:误差

=样本统计量的标准差 =标准误(SE)

2.样本分布---区间估计的原理与依据。

第二节 总体平均数的估计 一.估计总体平均数的步骤

30

1.根据实得样本的数据,计算样本的平均数与标准差。 2.计算标准误(最关键)

3.确定置信水平或显著性水平。

4.根据样本平均数抽样分布,确定查何种统计表 5.计算置信区间

6.解释总体平均数的置信区间。 估计标准误 1.

当总体方差?2已知时,使用总体标准差?来计算标准误。

SE??n

2.当总体方差?2未知时 使用样本方差s计算标准误。

SE?S n?1二,总体方差?2已知时,估计参数?

正态估计法:

一是总体正态时,不论样本容量的大小,样本均数的分布都呈正态分布。 二是总体成非正态时,只要样本容量大于30,样本均数的分布呈渐进(近似)正态分布。

三,总体方差(字母)未知时,估计参数(字母) t分布估计法

1.总体正态,方差(字母)未知,样本容量无论大小都可以采用t分布系法。 2.总体呈非正态,方差((字母))未知,若(n?30)时,可用t分布法。 若(n<30)时,不能推论。

分析:总体分布为正态,总体方差未知,但样本标准差已知,无论样本容量大小,都可以采用t分布估计法。

t分布中,在相同置信系数下,t值会随样本容量n和自由度(字母)的变化而不同。

为此,根据自由度df?n?1 查“t分布显著性临界值表”,确定t值

31

第三节:标准差和方差的区间估计。(基本不会考) 一,标准差的区间估计

当n大于30样本标准差的分布渐进正态。 标准差分布平均数为Xs?? 标准差分布的标准误为?s?区间估计公式为(公式)

1.因为总体未知,用样本标准差估计标准误。??sn?1 二,方差的区间估计

从正态分布总体中抽取容量为n的样本。

样本方差与总体方差比值为卡方分布,即(公式) 和推论其置信区间为:(公式)

框架小结

参数估计的基本内容: 点估计 区间估计 标准误

总体平均数的估计:

总体方差已知,对总体平均数的估计。 总体方差未知,对总体平均数的估计。 标准差异方差的区间估计: 标准差的区间估计 方差的区间估计

二总体方差之间的区间估计。 相关系数的区间估计: 积差相关系数的区间估计。 等级相关系数的区间估计。 比率与比率差异的区间估计: 比率的区间估计 比率差异区间估计

—?2n

32