统计学名词解释 下载本文

(三)利用样本统计量进行方差分析 有时欲分析的资料只有各组的X1、s及n等样本特征值,没有原始数据,在这种情况下要进行方差分析,关键在于对方差分析的思想和基本概念的理解,只要对平方和、均方等概念真正理解,进行方差分析比用原始数据进行方差分析还要简单。计算公式依据平方和的定义公式。

随机区组设计的方差分析

1.随机区组设计的方差分析,就是重复测量设计的方差分析,或称为组内设计的方差分析。

随机区组设计指在实验中将实验对象按一定的标准划分为n个区组,使得区组内的实验对象的个别差异尽可能小,即保证区组内的同质性,并使每个区组均接受所有K个处理。且各个区组内每个处理仅有一个观测。其顺序是随机决定的。

2.随机区组设计根据被试特点把被试划分为几个区组,再根据实验变量的水平数在每一个区组内划分为若干个小区,同一区组随机接受不同的处理。这类实验设计的原则是同一区组内的被试应尽量“同质”。

每一区组内被试的人数分配大致有三种情况:

(1)一个被试作为一个区组,这时不同的被试(区组)均需接受全部K个实验处理。每人接受K种实验处理的顺序不同所产生的误差,应该用一定的方法加以平衡。

(2)每一区组内被试的人数是实验处理数的整数倍。

(3)区组内的基本单位不是个别被试,而是以一个团体为单位。总之,对于每一区组而言,它应该接受全部实验处理;对于每种实验处理而言,它在不同的区组中重复的次数应该相同。

3.随机区组设计由于同一区组接受所有实验处理,使实验处理之间有相关,因此又称之为相关组设计,或称被试内设计。与完全随机设计相比,其最大优点是考虑到个别差异的影响。这种由于被试之间性质不同导致产生的差异就称为区组效应。随机区组设计可以将这种影响从组内变异中分离出来,从而提高效率。但是这种设计也有不足,主要表现为划分区组困难,如果不能保证同一区组内尽量同质,则有出现更大误差的可能。

事后检验

一般来说,方差分析的主要目的是通过F检验讨论组间变异在总变异中的作用,借以对两组以上的平均数进行差异检验,得到一个整体性的检验结果。如果F检验的结果表明差异不显著,说明实验中的自变量对因变量没有显著影响。相反,如果方差分析F检验的结果表明差异显著,拒绝了虚无假设,就表明几个实验处理组的两两比较中至少有一对平均数间的差异达到了显著水平,至于是哪一对,方差分析并没有回答。虚无假设被拒绝的结果旦出现,就必须对各实验处理组的多对平均数进一步分析,做深入比较,判断究竟是哪一对或哪几对的差异显著,哪几对不显著,确定两变量关系的本质,这就是事后检验。这个统计分析过程也被称作事后多重比较。

为什么不能用t检验对多个平均数的差异进行比较

同时比较的平均数越多,其中差异较大的一对所得t值超过原定临界值L。的概率就越大,这时α错误的概率将明显增加,或者说本来达不到显著性水平的差异就很容易被说成是显著了,这时用t检验就不适宜。比如要比较3个总体平均数之间的差异,如果用t检验就需要比较3(C3)次,假如每次比较的置信区间为95%,那么3次比较后检验的可靠性就降低为0.95=0.857。目前,关于多重比较的

9

方法有多种:如Sche检验法、 Newman- Keuls检验法、Dun-can的多距检验法,Tukey的可靠显著差异法、费舍的最小显著差异法等方法。

第十章 卡方检验

1.卡方检验方法:能处理一个因素两项或者多项分类的实际观察频数与理论频数分布是否相一致问题,或说有无显著差异问题。

2.实际频数:简称实计数或实际数,是指在实验或调查中得到的计数资料,又称为观察频数。

3.理论次数:是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数,又称为期望次数。

4.配合度检验:主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种卡方检验有时也称无差假说检验。当对连续数据的正太性进行检验时,这种检验又可称为正太吻合性检验。

5.独立性检验:用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。

6.同质性检验:主要目的在于检定不同人群母体总体在某一个变量的反应是否具有显著差异。

7.期望次数:虚无假设成立时的数值。 8.配合度检验:主要用于检验单一变量的实际观察次数分布与某理论次数是否有差别。

9.独立性检验:主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。

10.同质性检验:在教育与心理研究中,经常要分析几种因素之间是否真有实质上的差异,或者判断几次重复实验的结果是否同质,这类问题的卡方检验称为同质性检验。

11.卡方检验用途:主要用来处理某随机变量是否服从某种特定分布、两个样本的总体分布是否一致、变量之间是否存在关联性以及总体分布位置差异检验等问题。它也能同时检验一个因素两项或多项分类的实际观察数与某理论次数分布是否相致的问题,或说有无显著差异问题,即检验样本观测次数(或百分比)与理论或总体次数(或百分比)的差异性。理论次数的计算是卡方检验运算过程中的关键。

第十一章 非参数检验

1.什么是非参数检验?

非参数检验是对总体数据分布形态未知,研究资料大多数为分类数据的数据分析。

2.非参数检验常用的统计方法有哪些?

1. 秩和检验法。秩和就是数据等级之和。它是一种建立在秩和基础上的非参数方法,用于两个独立样本的检验。

2. 中数检验法。用于两个独立样本组之间的非参数检验。

3. 符号检验法。最为简单、直观,它不要求知道被检验总体的分布规律,仅仅依据某种特定的正负号数目多少对总体的、中位数进行判断和

10

检验。这种方法在单样本和两样本检验中均可采用。尤其是对实际中难以用数值确切表达的问题十分有效。 4. 等级方差分析。用于多组数据的非参数检验。

第十二章 线性回归

1.回归分析:通过大量的观测发现变量之间存在的统计规律性,并用一定的数学模型表示变量相关关系的方法。当只有一个自变量并且统计量成一次函数的线性关系的回归分析叫一元线性回归分析。

2.最小二乘法:就是如果散点图中每一点沿Y轴方向到直线的距离的平方和最小,简单讲就是使误差的平方和最小,则认为这条直线的代表性最好,它的表达式就是所要求的回归方程。

3.决定系数:指r方,表示回归平方和在总平方和中所占的比例,即回归引起的变异在总变异中所占的比例。

第十三章 多变量统计分析简介

1. (2015真题)因素分析:是一种多变量统计分析方法,它将彼此高度相关而又于别的变量相对独立的一组变量聚合成群,称之为“因素”。因素分析的基本思想是,根据相关性大小把变量分组,使得同组内的变量间相关较高,不同组变量间相关较低;每组变量代表一个基本结构,即因素。其目的是识别少数几个因子,因子表示并解释多个相关变量之间的关系,从而减少变量数目,简化复杂的数据结构。

2. 多重线性回归:在回归分析中,如果对两个或两个以上的自变量对因变量影响现象进行分析,这就叫做多重回归。

3. 最优方程选择法:即从所有可能的自变量组合建立的回归方程中选择最优的。

4. 同时多重回归法:将所有的预测变量同时纳入回归方程中估计因变量。

5. 强制进入法:在某一显著水平下,不考虑预测变量间的关系,把对因变量具有解释力的所有预测变量纳入回归方程式,计算所有变量的回归系数。

6. 强制淘汰法:在某一显著水平下,不考虑预测变量间的关系,将对因变量没有解释力的所有预测变量,一次性全部排除在回归方程之外,再计算保留在回归方程式中的所有预测变量的回归系数。

7. 逐步多重回归发:依据预测变量解释力的大小,逐步检查每一个预测变量对因变量的影响。

8. 层次多重回归法:先将人口变量用强迫进入法进行回归分析,计算回归系数,其次再将情意变量以逐步分析法计算自尊、焦虑感各自的预测力,完成对因变量的回归分析,这种方法称为层次多重回归法。

9. 因子分析:是处理多变量数据的一种统计方法,它可以解释多变量之间的关系,其主要目的是从为数众多的可观测的变量中概括和综合出少数几个因子,用较少的因子变量来最大程度地概括和解释原有的观测信息,从

11

而建立起简洁的概念系统,揭示出事物之间的本质关系。(斯皮尔曼【英】)

第十四章 抽样原理及方法

1.整体抽样:整群抽样又称集体抽样,是指从总体单位中成批(组)抽取样本,而不是一个一个地从总体中抽取样本。整群抽样可采用随机抽样法,而更多的是采用等距抽样法。整体抽样的优点是便于组织,节省经费,容易控制调查质量。它的缺点是:一般来说,由于各群间的差异比较大,所以其抽样误差要比简单随机抽样、系统抽样和分层抽样的误差要大一些。

2.分层抽样:

分层抽样又称分类抽样或类型抽样,是先将总体按某种特征分为若干部分(层),然后再从每一层内进行随机抽样或机械抽样,组成一个样本的方法,分层抽样的特点是将科学分组法与抽样法结合在一起,分组减少了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。

3.简单随机抽样

将抽样范围中每个人或每个抽样单位编号,随机选择,以避免由于标记、姓名或其他社会赞许性偏见而造成抽样误差,或者按随机数码表选择被试作为样本,每个人或抽样单位都有相同的机会作为常模团体中的一部分。

4.等距抽样(机械抽样)

指以被试的某些与所测特质无关的特性,将被试按照一定的顺序排列,研究者确定一个随机的起点,如果从总体中抽取1/k的被试,那么列表中的第k个就成为样本组成中的被试,如果在到达时仍不够预定的样本样组容量,只需简单地到列表前面继续选取,直到第k个被试便可。

12