统计学名词解释 下载本文

而有不同的分布形态。

(5)正态分布中各差异量数值相互间有固定比率。

(6)在正态分布曲线下,标准差与概率有一定的数量关系。

7.二项分布:又叫贝努里分布,是一种具有广泛用途的离散型随机变量的概率分布。具体定义是(次处不太确定):设有n次试验,各次试验都是彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是q(等于1-p)。

需满足以下条件:

(1)任何一次实验恰好有两个结果,成功与失败, (2)共有n次试验,并且n是预先给定的任一正整数, (3)每次试验各自独立,各次试验之间无相互影响。 (4)某种结果出现的概率在任何一次试验中都是固定的。

第七章 参数估计

1.参数估计:当在研究中以样本获得一组数据后,如何通过这组信息,对总体特征进行估计。也就是如何以局部结果推论总体的情况,称为总体参数估计。

2.点估计:是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。

3.区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围,它虽不具体指出总体参数等于什么,但能指出未知总体参数落入某一区间的概率有多大。(2011年真题)

4.置信区间(置信间距):是指在某一位置信度时,总体参数所在的区域距离或区域长度。置信区间的上下二端点值称为置信界限。

5.显著性水平:指估计总体参数落在某一区间时,可能犯错误的概率,用α表示。1-α为置信度或置信水平。

6.区间估计和假设性检验的关系。2013简答 联系:

①都是根据样本信息推断总体

②都是抽样分布理论为依据,建立在概率论之上的推断 区别:

①参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立

②区间估计求得的是以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验

③区间估计立足于大概率,假设检验立足于小概率 7.完全随机设计和随机区组设计的关系

①完全随机设计和随机区组设计的分组方式不同

完全随机设计把被试分为若干组,每组分别接受一种实验处理,有几种处理,就相应地有几组被试,即不同的被试接受不同自变量水平的实验处理;

随机区组设计根据被试特点,将被试分为几个区组,再根据自变量水平数在每一个区组内划分若干小区,同一区组接受不同处理,设计原则是同一区组被试应尽量同质,区组间可以异质。

5

②完全随机设计与随机区组设计的设计思想不同 完全随机设计为单因素设计,仅考虑处理因素

随机区组设计为双因素设计,考虑的因素有两个,一个是处理因素,一个是区组因素

8.估计总体平均数的步骤 详细请参考p201页

第八章 假设检验

1、 差异显著:当两个事物之间出现差异时,有可能是抽样误差,也有可能是实质性的差异,如果经过统计检验发现差异超过了统计学所规定的某一误差限度时,则表示差异已经不属于抽样误差了,统计上将这样的情况称为差异显著,反之即是差异不显著。

2、 假设检验:在统计学中,通过的样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异,这种推论过程称为假设检验。

3、 假设与假设检验:假设一般专指统计学属于对总体参数所作的假定性说明。在进行任何一项研究时,都需要根据已有的经验和理论先对研究结果作出一种预想的希望证实的假设。这种假设叫科学假设,记作 H1,又叫备择假设。由于证实远比证伪困难,在统计学中,不对 H1 的真实性直接检验,需要建立与其对立的假设,成为虚无假设,记作H0。假设检验的问题就是要判断虚无假设是否正确,因此虚无假设就是 统计推论的出发点。

注意:备择假设总是要假设对比两者间是有差异的,例如单总体检验样本均值与总体均值是否有差异时,我们的备择假设就是 X ≠ μ ,对应备择假设,虚无假设总是假设两者并无差异,即表示为 X = μ 。

4、 显著性水平:指的是拒绝虚无假设的小概率值,用α表示。也就是说,如果一件事情发生的概率小于我们设定的这么一个显著性水平,我们就将其归为“小概率事件”,也就是认为它是一件“几乎不可能发生”的事件。

5、 小概率原理: 假设检验的基本思想是概率性质的反证法,基于统计学中广泛采用的小概率原理,该原理认为“小概率事件在一次实验中几乎是不可能发生的”,由此假设检验首先假定虚无假设为真,在虚无假设为真的前 提下,若导致了违反常理或不合理的现象出现,则表明“虚无假设为真”的假定错误,必须拒绝虚无假设。而若没有,那就认为“虚无假设为真”是正确的,即要接受虚无假设。

6、 假设检验中的两类错误

(1)I 类错误:当 H0 为真,而按照概率法则,需将落入拒绝区域的假设判定为假,统计学中将这类拒绝 H0 时所犯的错误,也叫α类错误。

(2)II 类错误:如果平均值未落入拒绝区域,但按照小概率原理,要接受 H0(等距拒绝 H1)时,所犯的错误,也叫β类错误。

6

7、 差异显著:经过检验,如果所得差异超过了统计学规定的某一误差限度,则表明这个差异已不属于抽样误差,而是总体上确有差异,这种情况叫做差异显著。

8、两类错误的关系: (1)α+β不一定等于 1;

(2)在其他条件不变的情况下,α与β不可能同时减小或 增大。 (3)统计检验力与两种密切相关。

9、影响β错误的因素:II 型错误与 I 型错误不同,影响β值大小的因素主要有三:

一、在参数检验中,β依赖于参数的实际值与 假设值之间的距离,两者相差越大,β越小;

二、α越小,β就越大; 三、当α与 n 固定时,根据研究问题的 性质选择适当的检验类型可以减少β

10、双侧检验与单侧检验

(1)双侧检验:是指推断差异是否存在,而不断言差异的方向。其显著性水平标记为:α=0.05/2 或α=0.01/2

(2)单侧检验:是研究者根据已有的资料事先能够预料到谁优谁劣,检验只是为了进一步确证而选择的方法。(即是说研究者已经不只能够判断出“有差异”,而且可以判断出“A 比 B 好/优/大/快”的情况下所采用的方法)

11、假设检验的基本步骤

(1)根据问题要求,提出虚无假设和备择假设 (2)选择适当的检验统计量 (3)规定显著水平α (4)计算检验统计的值 (5)作出决策 12、平均数的显著性检验:是对样本平均数与总体平均数之间差异进行的显著性检验。

样本类型:分为独立样本和相关样本

(1) 独立样本:即两个互不相关的样本,往往来自不同总体,即是不同组别间相同性质的比较。

(2) 相关样本:即两个样本间是存在某些联系的,往往来自同一个总体,即是同一个组内产生的两种不同类别的数据。 13、假设检验与参数估计的区别与联系

假设检验是当样本统计量超过一定标准时,就说统计显著,是检验两事物差异是否显著的一种方法;而参数估计是要找到总体值所可能落入的可靠范围,是利用样本统计量对总体参数所作的估计。而作为两者的代表性指标——显著性水平和置信水平也是从不同角度回答了相同的问题。

第九章 方差分析

方差分析又称作变异分析,它是斯内德克为了探讨一个因变量和一个或多个

7

自变量之间的关系,1946年根据费舍的早期工作发明的一种检验方法。其主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。

1.方差分析的适用条件是什么?主要用来检验什么?

答:进行方差分析时有一定的条件限制,数据必须满足以下几个基本假定条件,否则由它得出的结论将会产生错误。方差分析的适用条件如下

(1)总体正态分布

方差分析同Z检验及检验一样,也要求样本必须米自正态分布的总体。在心理与教育研究领域中,大多数变量是可以假定其总体服从正态分布,一般进行方差分析时并不需要去检验总体分布的正态性。当有证据表明总体分布不是正态时,可以将数据做正态转化,或采用非参数检验方法

(2)变异的相互独立性

总变异可以分解成几个不同来源的部分,这几个部分变异的来源在意义上必须明确,而且彼此要相互独立。

(3)各处理内的方差一致

在方差分析中用MS作为总体组内方差的估计值,求组内均方MS.时,相当于将各个处理中的样本方差合成,它必须满足的一个前提条件就是,各实验处理内的方差彼此无显著差异。这一假定若不能满足,原则上是不能进行方差分析的。方差分析主要用来检验两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。

2.简述方差分析法的步骤 答:方差分析法的步骤是

(1)和一般的假设检验一样设立零假设和研究假设;

(2)根据实验设计的类型确定各变异源,进行相应的平方和分解,即有几个变异源就从总平方和中分解出几个平方和

(3)根据平方和分解得到各变异源对应的自由度,即进行总自由度的分解; (4)根据研究的目的和实验设计考虑要检验什么效应,从而将其对应的平方和比上相应的自由度得到该效应的均方,其中误差均方必须计算

(5)将各待检验效应的均方比上误差的均方,计算各F统计量

(6)将计算来的各F统计量值和F检验的临界值进行比较得出统计结论,其中临界值的分子自由度和分母自由度分别是待检验效应的自由度和误差自由度;

(7)如果效应检验结果显著,可以进入事后检验,即对多水平的自变量进行多重比较考察各水平间的具体差异,如果是多因素方差分析,交互作用效应检验显著,也可以进入简单效应检察具体考察交互作用的情况。

完全随机设计的方差分析

完全随机设计的方差分析,就是对单因素组间设计的方差分析。在这种实验研究设计中,各种处理的分类仅以单个实验变量为基础,因而,把它称为单因素方差分析或单向方差分析。

(一)各实验处理组样本容量相同

各实验处理组样本容量相同时,对于每一种实验处理而言,它们被重复进行的次数是相同的。这种情况,也称之为“等重复”。

(二)各实验处理组样本容量不同 这种情况又称作“不等重复”。进行方差分析的过程与“等重复”情况基本相同。

8