2.离差智商 (韦克斯勒) :表示的是个体智力在年龄组中的位置。] 离差智商的平均数为100,标准差定为15。 公式(5--6):IQ=100+15Z`=100+15(X-X)/SD
必须指出:从不同的测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。(参见本课程教学参考资料:专栏5-2几种导出分数间的相互关系)
[离差智商的优点:(1)建立在统计学基础之上;(2)它表示的是个体智力水平年龄组中所处的位置;(3)是表示智力高低的一种理想指标。]
[若儿童的心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在实践中发现,单纯用心理年龄来表示智力高低的方法缺乏不同()儿童间的可比性。年龄]五、注意的问题
1、发展常模换算及解释时需要注意的问题 : 只适合于所测特质随年龄发展变化的情况,对成年人不适用;只适用于在典型环境下成长的儿童;一年的差异在不同年龄有不同的含义。
2、百分位换算及解释时需要注意的问题 :顺序量表,缺少相等单位。靠近中央的原始分数差异扩大,而两端的差异缩减。不能比较和说明不同被试间分数差异的数量。 3、标准分数换算及解释时需要注意的问题 :计算非线性转换的标准分数时,特质的分数实际上应该是常态分布。标准差不同,其分数的意义不同。 第三单元 常模分数的表示方法
一、转换表法 :最简单而且最基本的表示常模的方法就是转换表,有时也叫常模表。
二、剖面图法 :剖面图就是将测验分数的转换关系用图形表示出来,效果更直观。 第三节 测验的信度 第一单元 信度的概念 一、信度的定义
信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随机误差的影响。随机误差越大,信度越低。
第一个测试的实际分数(X)总是由真实分数(T)和误差(E)两部分构成。 (公式5-7):X=T+E
如果用方差代表具体分数,就得到(公式5-8)。
在测量理论中,信度被定义为:一组测量分数的真实分数方差与总方差(实得分数的方差)的比率。(公式5-9)。
真实分数是无法统计的,因此公式5-9还可以转化为(公式5-10)。 二、信度的指标
1.信度系数与信度指数 : 大部分情况下,信度是以信度系数为指标,它是一种相关系数。是真分数方差与实得方差的比值。(公式5-11)。 信度指数的平方就是信度系数。(公式5-12) 2.测量标准误
测量的标准误与信度之间有相互消长的关系:信度越高,标准误越小;信度越低,标准误越大。
第二单元 信度评估的方法(四个)
一、重测信度 :使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫重测信度,又称稳定性系数。一般是两周到四周较宜,间隔时间最好不超过六个月。
由于人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大的变化。
二、复本信度: 又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。这个相关系数就代表了复本信度的高低。
复本信度反映的是测验在内容上的等值性,故又称等值性系数。 复本信度也要考虑两个复本实施的时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。
[复本信度的缺点:(1)如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;(2)由于第二个测验只改变了题的内容,已经掌握的解题原则可以迁移到同类的问题;(3)对于许多测验来说,建立复本是十分困难的。] 三、内部一致性信度
1.分半信度:分半信度指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度,因而属于内部一致性系数。 修正公式是斯皮尔曼-布朗公式:( 公式5-14)。
斯皮尔曼--布朗公式为经验公式,它的假设条件是两半测验的变异数相等,但实际资料有时未必完全符合这一条件。当假设不成立时,可采用弗朗那根公式或卢伦公式,直接求得测验的信度系数。
2.同质性信度:同质性主要代表测验内部所有题目间的一致性。当各个题目的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。 相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。 几个计算同质性信度的公式如下:
(1)库德-理查逊公式 (用于0、1记分) 计算同质性信度,常用的是K-R20公式,在各测题难度相同或近似的情况下,还可采用计算更为简便的K-R21公式。
[K-R20公式、K-R21公式有别于克伦巴赫α系数的是,它们只能用于()。是非题] (2)克伦巴赫α系数 (不适用于多重记分)
四、评分者信度 : 用于测量不同评分者之间所产生的误差。(0.90以上,才认为是客观的)。
为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。
当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数作为评分者信度的估计。
[下列描述中正确的是:(1)随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度;(2)所有题目看起来好象测同一特质,但相关很低或负相关时,则测验为异质的;(3)人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大的变化;(4)不同信度反映测验误差的不同来源。] 第三单元 信度与测验分数的解释 一、解释真实分数与实得分数的相关
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
二、确定信度可以接受的水平
当rxx﹤ .70时,测验不能用于对个人作出评价或预测,而且不能做团体比较;当.70≤ rxx <.85时,可用于团体比较;当rxx ≥ .85时,才能用来鉴别或预测个人成就或作为。
三、解释个人分数的意义
作用:其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。 测量标准误可以通过第一次测验的结果及信度估计到:(公式5-15)。
例:在一个智力测验中,某个被试的iQ为100,这是否反映了他的真实水平?如果再测一次,他的分数将改变多少?
X―1.96SE<XT≤X+1.96SE (公式5-16)
已知该智力测验的标准差为15,信度系数为.84,则其iq的测量标准误和可能范围为:套(公式5-15)得 SE= 6 , 即: IQ=100±1.966=100±11.76≈88~112我们可以说这个被试的真实性IQ可能性落在88与112之间,即若再测一次,他的智商低于88、高于112的可能性不超过5%。 四、比较不同测验分数的差异 差异分数的标准误:(公式5-17)。
例;某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否显著高于言语智商呢? 首先计算出差异分数的标准误:SED=7. 5
在统计上,经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是误差的影响。因此,将差异标准误(7.5)乘以1.96,结果为14.7,这表明个体在韦氏测验两半得分的差异高于大约15分,才能达到0.05显著水平。上述被试的差异分数110-102=8是不显著的。
第四单元 影响信度的因素 一、样本特征
(一)样本团体异质性的影响
若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。