华东师大心理统计学大纲 下载本文

第六章 抽样分布及总体平均数的推断

第一节 抽样分布 一、抽样分布的概念

要区分以下三种不同性质的分布:

1、总体分布:总体内个体数值的频数分布。 2、样本分布:样本内个体数值的频数分布。 3、抽样分布:某一种统计量的概率分布。

二、平均数抽样分布的几个定理

1、从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。公式表示为(6.1)。 2、容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的方根。公式表示为(6.2)。 3、从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。

4、虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。

三、样本平均数与总体平均数离差统计量的形态

从正态总体中随机抽取的容量为n的一切可能样本平均数为中心呈正态分布。当总体标准差已知时,一切可能样本平均数与总体平均数的离差统计量呈标准正态分布(6.3)。

总体标准差σ的无偏估计量S等于样本统计量σx乘以贝赛耳氏校正数,公式(6.4)。

从正态总体中随机抽取容量为n的一切可能样本平均数的抽样分布呈正态分布。当总体标准差σ未知,需用估计值S来代替,于是平均数标准误也被平均数标准误的估计值所代替,这时一切可能样本平均数与总体平均数的离差统计量呈t分布(6.6)。

t分布与正态分布的相似之处:t分布基线上的t值从-∞-+∞;从平均数等于0处,左侧t值为负,右侧t值为正;曲线以平均数处为最高点向两侧逐渐下降,尾部无限延伸,永不与基线相接,呈单峰对称形。t分布与正态分布的区别之处在于:t分布的形态随自由度(df=n-1)的变化呈一簇分布形态(即自由度不同的t分布形态也不同,见图6.1)。自由度逐渐增大时,t分布逐渐接近正态分布。

自由度是指总体参数估计量中变量值独立自由变化的个数。

第二节 总体平均数的参数估计 一、总体参数估计的基本原理

1、点估计:用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。 点估计的评价标准:

(1)无偏性:如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。

(2)有效性:当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。

(3)一致性:当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计量是总体参数一致性估计量。

2、区间估计:以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。

区间估计涉及置信水平和置信区间。

对总体参数进行区间估计,就是在一定的可靠度上求出总体参数的置信区间的上下限,那么有如下步骤: (1)、要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布; (2)、要求出该种统计量的标准误;

(3)、要确定在多大的可靠度上对总体参数作估计,再通过查某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。

二、σ已知条件下总体平均数的区间估计

当总体σ已知,总体呈正态分布,样本容量无论大小时,或者当总体σ已知,总体虽不呈正态分布,但样本容量较大(n >30)时,样本平均数与总体平均数离差统计量均呈正态分布。

区间估计的计算公式为(6.8)和(6.9)。

三、σ未知条件下总体平均数的区间估计

1、σ未知条件下,总体平均数的区间估计的基本原理:

当总体σ未知,总体呈正态分布,样本容量无论大小时,或者当总体σ未知,总体虽不呈正态分布,但样本容量较大(n >30)时,样本平均数与总体平均数离差统计量均呈t分布。

区间估计的计算公式为(6.10)和(6.11)。

公式为(6.10)和(6.11)中 是平均数的标准误的估计量。为了适合各种计算器的使用,可表示为以下三种形式。

① ② ③ 于是 置信限有三种形式:

置信下限 置信上限 ① ② ③

2、小样本的情况:当总体标准差未知时,样本的容量较小,在此条件下,样本平均数与总体平均数离差统计量服从 分布。总体平均数置信区间的上下限用总体标准差的估计值计算。

3、大样本的情况:可以用正态分布近似处理。

第三节 假设检验的基本原理。公式(6。15)

利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。 现以总体参数的假设检验来简要、概括地说明它的基本原理。

1、当对某一总体参数进行假设检验时,首先从该总体中随机抽取一个样本,计算出统计量的值并根据经验对相应的总体参数提出一个假设值,这个假设是说:这个样本统计量的值是这个假设总体参数值的一个随机样本。

2、根据这一假设,可以认为,像这样的一切可能样本统计量的值,应当以总体参数(假设的)为中心,形成该种统计量的一个抽样分布,如果这个随机样本统计量的值在其抽样分布上出现的概率较大,这时只好保留这个假设。

3、如果这个随机样本统计量的值在其抽样分布上出现的概率极小,根据概率事件在一次随机抽样中几乎是不可能发生的,于是不得不否定这个样本统计量的值是来自于这个总体参数值的假设。 一、假设

假设检验一般有两个相互对立的假设。即零假设(或称原假设、虚无假设、解消假设)和备择假设(或称研究假设、对立假设)。假设检验是从零假设出发,视其被拒绝的机会,从而得出决断。

二、小概率事件

把出现小概率的随机事件称为小概率事件。小概率事件是否出现,这是对假设作出决断的依据。

三、显著性水平

拒绝零假设的概率称为显著性水平,用 =0。05, =0。01来表示。

也可以说,显著性水平是统计推断时,可能犯错误的概率。人图中可以看出,显著性水平越高( 值越小),越不容易拒绝零假设,推断的可靠性越大。

显著性水平和可靠性程度之间的关系是:两者之和为1。

四、统计决断的两类错误及其控制

如果拒绝了属于真实的零假设,即如果样本统计量的总体参数正是假设的总体参数,但是由于样本统计量的值落入了拒绝区域。而零假设遭到拒绝,这时就会犯第一类型的错误。这种错误的可能性大小正是显著性水平的大小,故又称这类错误为α错误。

如果保留了属于不真实的零假设,就会犯第二类型的错误。犯这种“假设属伪而被保留”的第二类错误的概率,等于β值,故又称这类错误为β错误。

要使第一类错误的概率保持在需要的水平上,而控制第二类错误的概率,有以下方法:

(1)、利用已知的实际总体参数与假设参数值之间的大小关系,合理安排拒绝领域的位置,选择双侧检验还是单侧检验,左侧检验还是右侧检验;

(2)、加大样本容量。

第四节 总体平均数的显著性检验

总体平均数的显著性检验的适用公式与相应的参数估计一脉相承。

一、σ已知条件下总体平均数的显著性检验(公式6.3)

检验步骤: (1)、提出假设

(2)、选择检验统计量并计算其值

(3)、确定检验形式 (4)、统计决断

二、σ未知条件下总体平均数的假设检验 1、小样本的情况(公式6.16)

2、大样本的情况(公式6.3)