《心理测量学》南京廖华答案网

《心理测量学》下载本文

文章发布时间 : 2026/7/27 14:21:25星期一

1 心里测量学

一、单项选择题1.在370名被试中，选为高分组和低分组的被试者各有100人，其中高分组有70人答对第1题，低分组有40人答对第1题，则第1题的难度为（ 0.55 ）2.2．通过考察测验的区分效度可以来确定测验的（构想效度）3．（比内）编制了世界上第一个心理测验4．测验中，有些被试者认为选项长、内容多，一般是正确答案，在无法确定何者正确时，有偏好长选项的反应定势．在编制测验时，只要我们尽量使选项的长度（一致），就不难避免这类问题5．心理测验题目的来源应该排除（直接翻译国外测验的题目）6．为了使测验的分数具有意义，需要把原始分数转换成（导出分数）7．在测验编制过程中，正确答案的位置在整个测验中出现在各位置的概率（相等），就可以控制喜好特殊位置定势的影响8．一个6岁儿童甲智龄为8岁，一个12岁儿童乙智龄为14岁，用心智商数来衡量智力水平的高低，这两个儿童的智力水平高低为（甲大于乙） 9. 16PF在编制过程中主要使用了（因素分析）10. SCL-90的总分能反映受测者的（病情严重程度）11.（心理测量）是根据一定的心理学理论，使用一定的操作程序，按照一定的法则，给人的行为和心理属性确定出一种数量化的价值的过程12．（比内－西蒙）量表中首先使用心理年龄的概念13．（常模团体）是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本14．如果某测验的信度系数为0.8，那么该测验中真分数造成的变异占（80% ）15．若某测验的同质性信度高，则表现为所有题目之间（都具有较高的正相关）16．常模样本量的大小，一般最低不小于（30或100 ）17．取样是指从（目标人群）中选择有代表性的样本18．随机号码表法是（简单随机抽样）19．在测验理论中，效度被定义为在一组测量中，与测量目标有关的真实方差（或称有效方差）与（总）方差的比率20．如果其他条件相同，样本团体越同质，分数分布范围越小，测验效度就越（低）21．数学测验的第七题满分为15分，该题考生的平均分得分为9.6分，则该题的难度为（ 0.64 ）22．一般来说心理测验除了（典型行为测验）以外，都有时限23．解释测验结果的过程中，主试者（需要依据一定的理论进行解释） 24．导出分数又叫（量表分数）25．设法使每个被试对测验材料的步骤和所需技巧有相同的熟悉程度，是为了控制（应试技巧）对测验结果的影响26．如果测验编制者发现，一个以预测工作成就为目标的新的职业测验与职员的表现评估相关，这个测验显示了（效标效度）的证据。27．效标效度的两种类型是（预测性的和同时性的）28．难度P值越接近于0或接近于1，越无法区分被试者之间能力的差异。相反，P值越接近0.5，区别力越高。为了使测验有更大的区别力，应该选择难度在0.50左右的试题比较合适，各题难度应选择在（ 0.50±0.20 ）之间。29．正确的测验观应是( 决策的辅助工具 )。30. 下列哪一项是客观测验形式？（多项选择）31. 测验开发者的经验是：所编写的测验项目应该是测验计划所要求项目数的（ 2 ）倍？32. 关于是否对测验使用的每个情境都有必要进行效度研究、测验效度是否具有情境特异性的问题，属于（效度的概化）33. 受应试动机影响不太大的测验是（投射）测验34. （适度的焦虑）会提高智力测验、成就测验和能力倾向测验的成绩35. 以下不会影响受测者测验分数的是（职业道德）36. 准许进入高中或大学、录用人员，属于（评价式的报告）37. 在比内一西蒙1908年的智力量表中首次使用了（智力年龄）的概念。38. ( 离差智商 )表示的个体智力在年龄组中所处的位置。39. 由于个体智力增长是一个由快到慢再到停止的过程，即心理年龄与实足年龄（不同步）增长，所以比率智商并不适合于年龄较大的被试者。 40. 检测有言语障碍的被试的推断性能力可使用（联合型瑞文测验 41．关于心理特质的如下叙述中，哪个是错误的（是一个人身上很不稳定的特点）42．０℃并不意味着没有温度，这种说法（对）43．关于经典测量理论的优点，哪个是错误的（在多数情况下经典测验理论是不够精确的，测验结果是不可信的）44．最常见的特殊常模是（地方性常模）45．常模一般可分为( 一般常模和特殊常模 )46．对于想通过增加测验长度来提高信度的测验编制者来说，可以通过（斯皮尔曼-布朗公式）公式进行估计。47．某能力倾向测验的效标的标准误是0.50，测验和效标的相关是0.60，那么，从该效标测验估计等级水平的标准误是（ 0.40 ）。48．（同质性信度）也叫内部一致性系数，它是指测验内部所有题目间的一致性程度。49．下面的（重测信度）方法检验了测验跨时间的性能，并提供了对测验稳定性的估计。50. 当测验信度很高时，测量的标准误__低；随着测验信度降低，测量的标准误_升高__。51. 若某测验的同质性信度高，则表现为所有题目之间（都具有较高的正相关）52. 复本信度值等于两个测验分数之间的（皮尔逊积差相关系数）53. 以下不属于效标效度估计方法的是（预期表法）54. 在编制问卷时，为了防止被试的受测动机产生的影响，要十分注意隐藏测验的目的，实际上也就是问了降低问卷的（表面效度）55. 一名教师自己编制了一份发展心理学的期末考试试题，之后他认真分析这份卷子，看其是否适合作为这门课程全部内容的一个充分样本。这位教师此时正在估计这次测试的（内容效度）1．下列对测量的描述，正确的是（就是依据一定的法则用数字对事物加以确定）2. 我们通常将学生的考试结果按名次排队，这些名次属于（顺序）变量3．心理测量的误差中，影响测验稳定性的是（随机误差）4．已知某个由20个项目组成的医学院测验的信度水平是0.87，为了达到希望的信度水平0.95，可以通过增加原测验项目数到（56 ）5．某测验含有40个题目，信度系数是0.8，估计还需要加入（50 ）个同质的题目才能将该测验的信度提高到0.906. 被试团体的同质性程度会影响（题目区分度）7. 测验总分分布出现负偏态，说明测验整体难度（偏易）8. 项目的（区分度）也叫鉴别力，是指测验项目对被试者的心理特性的区分能力9．受应试动机不太大的测验是（投射）测验10. 心理测验的实施中，对主试资格的要求，以下不包括（年龄）11. 焦虑对测验成绩的影响可用（倒U形）曲线来表示12. 在心理测验实施中，主试者和被试者之间建立了一种友好的、合作的、能使被试者最大限度地作好测验的关系，叫（协调）关系13. 为了对测验分数作出确切的解释，只有常模资料是不够的，还必须有（效度资料）14. 放弃比率智商，开始采用离差智商的智力测验是（韦克斯勒儿童智力量表） 15. 对MMPI施测形式的选择，错误的是（手册式只适用于团体） 16．对于项目同质并且有多于两种反应的测验，下面（alpha系数）

2 心里测量学

是适合于估计其信度的方法17．以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越（大）18. （内容效度）指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样19．如果一个测验编制者发现一个新的数学成就测验的分数与另一个数学成就测验的分数相关，则显示了这个测验具有（构想效度）20. 难度是指试题的难易程度。用P代表。P值越（大），难度越低21.（ φ相关）适用于两个变量均为二分称名变量的相关计算22.难度与区分度的关系，一般来说，较难的项目对高水平的被试者区分度（高），中等难度的项目对中等水平的被试者区分度高23.一个满分为5的测验项目，全体被试在此项目上的平均分为3分，此项目的难度P是（60% ）24.（心理测验的目标）是指编制的测验是测什么的，即用来测量什么样的心理变量或行为特征25．主试向被试预告测验时，不包括测验的（指导语）26. 下列说法中，（安排测验材料）不是对测验环境条件的要求27. 解释测验分数时应以（一段分数）来解释28. 从不同测验获得的离差智商只有当（标准差）相同或接近时才可以比较 29．采用量表高低分特征作为结果解释依据的心理测验是（16PF ） 30．评定求助者的抑郁症状可使用（ SDS ） 31．用１代表男，用２代表女等等，这样的量表通常叫（名称）量表32．1879年，德国心理学家（冯特）建立了世界上第一个心理实验室33．经典测验理论（CCT）的数学模型是（X = T + E ）34．不影响稳定性只影响准确性的误差是（系统误差）35．确定可以接受的信度水平的一般原则是，当（rxx<0.70 ）时，测验不能用于对个人做出评价或预测，而且不能作团体比较。36．一个包括40个题目的测验信度为0.80，欲将信度提高到0.90，通过斯皮尔曼－布朗公式的导出公式就是出至少应增加（50 ）个题数37．在心理测验中，效度是指所测量的与所要测量的心理特点之间符合的程度，或者简单地说是指一个心理测验的（准确性）38．最早的一个发展顺序量表的范例是（葛塞尔）发展顺序表39．四分位数是将量表分成四等份，相当于百分等级的（２５％、５０％、７５％）、（）和（）对应的三个百分数分成的四段40．如果测验编制者发现，一个以预测工作成就为目标的新的职业测验与职员的表现评估相关，则显示了这个测验具有（效标效度）41．在200个学生中，答对某项目的人数为120人，则该项目的难度为（ 0.6 ）42．要想使项目的区分度越大，难度应该越接近（ 0.5 ）43．项目分析时划分高分组和低分组，一般是选取总分最高和总分最低的（27% ）44．编制简答题的原则不包括（将其操作化）45．主试的期望对被试的反应所产生的影响叫作（罗森塔尔效应）46．参照点就是确定事物的量时，计算的（起点）47．其数值可以进行加减乘除运算的变量是（等比变量）48．既影响稳定性又影响准确性的误差是（随机误差）49．样本大小适当的关键是样本具有（代表性）50．常模分数构成的分布，就是通常所说的（常模），它是解释心理测验分数的基础51．55的百分等级表示在常模样本中有５５％的人比这个分数（低）52．同质性信度主要代表测验内容（所有题目）间的一致性53．王红在３０名同学中物理成绩是８０分，排列第五名，则其百分等级是（８５）54．专家判断法，就是请有关专家对测验题目与原定内容的符合性作出判断，看测验的题目是否代表规定的内容。如果专家认为测验题目恰当地代表了所测内容，则测验具有内容效度．因此，内容效度有时又称（逻辑效度）55．（区分法）是检验测验分数能否有效地区分由效标所定义的团体的一种方法二、多项选择题

1．在测验实施时，需要考虑测验时限的有（）C.最高行为测验 D.速度测验

2．下列说法中正确的有（） A.要将测验结果解释为一个范围 B.结果解释时应充分估计测验的常模和效度的局限性 C.有关原因的解释要慎重 D.要让当事人积极参与测验分数的解释过程

3. 与其他人格量表相比，MMPI的主要优点是（） A. 临床诊断符合率较高 B. 首次将效度量表纳入个性量表 C. 广泛应用于人才选拔 D. 可揭示潜意识层次的动机冲突

4. 关于卡特尔16种人格因素测验，下列说法中正确的是（） A. 属于客观化测验 D. 可应用于人才选拔 5．对于内部一致性信度考察的理解正确的是（）B.只需施测一次，就可以估计信度系数 C.分半的方法不同，估计出的信度系数就不同

6. 实证效度的常用评估方法有（） B.相关法 C.区分法 D.命中率法

7．正确的测验观包括（）A.心理测验是最重要的心理学研究方法之一，是决策的辅助工具 C.心理测验作为研究方法和测量工具尚不完善 8．按测验的材料性质，测验可分为（）A.操作测验 B.文字测验

9．下列说法中，（）是对测验环境条件的要求 A.完全遵从测验手册对环境的要求 C.记录下任何意外的测验环境因素 D.在解释测验结果时也必须考虑环境因素

10．对于练习对测验结果的影响，以下说法正确的有（）A.智力较高者，其受练习效应的影响较大B.着重速度的测验，练习效应较为明显C.重复实施相同的测验，受练习效应影响的程度要大于复本的测验

11．在WISC-CR中,常识分测验可以反映被试者的( ) A. 天资B. 早期的文化环境与经验 C. 学校教育的理论及文化的偏好 D. 良好的记忆能力

12. 受捡者16PF实验性高分，人格特征是( ) A.自由 C.激进 D.不拘泥于现实 13．参照点的类型有（）A.绝对零点 B. 相对零点

3 心里测量学

14．效度可以分为3类（）A. 内容效度 B. 结构效度 C. 效标关联效度

15．受测者哪些方面可以引起测量误差（）A. 测验的经验 B. 练习效应 C. 应试动机 D. 测验焦虑 16．取样的具体方法有（）A. 简单随机取样 B. 系统抽样 C. 分组抽样 D. 分层抽样

17．关于信度作用的理解正确的有（）B. 信度是测量过程中所存在的随机误差大小的反映 C. 信度可以用来解释个人测试分数的意义 D. 信度可以帮助进行不同测验分数的比较

18．内容效度的评估方法有（） B. 专家判断法 C. 统计分析法 D. 经验推测法

19．相关法是求测验分数与效标间的相关，这一相关系数称为效度系数，数据变量的不同，可选用的计算方法有（）A. 积差相关 B. 点二列相关 C. 二列相关 D. 贾斯朋(Juspen)

20．测验实施中的干扰因素主要包括（）A. 主事者的影响因素 B. 测验情境 C. 其他干扰因素 D. 被试者的影响因素 21．系统误差的来源是（）A. 题目取样不当 B. 题目用词的模棱两可 C. 测验难度不当 D. 测验题目的数目

22．真分数理论的优点是（）A. 经典测验理论（CCT）以随机抽样理论为基础，建立在简单的数学模型之上 B. 理论假设较弱，在此基础上推导出来的一系列假设都容易得到满足 C. 在多数情况下经典测验理论（CCT）是足够精确的，测验结果是可信的 D. 经典测验理论（CCT）的假设，是人们为刻画人的外显行为反应水平与人的心理特质发展水平之间的关系而架设的一座桥梁，他的作用和价值是巨大的。

23．下列选项中可能引起测验结果报告误差的有（） A. 参照标准不统一 B. 信息来源不同 C. 宽严倾向 D. 趋中评定 24. 如果一个测验有多个常模，在解释测验分数时，对于常模的选择应注意（）C. 选择最相近的团体 D. 选择最匹配的情境 25．评分者信度的考察需要注意（）A. 常应用于投射测验、学业测验中的高考作文水平的测试、职业选拔中的面试 B. 被试得分常常会受到评分者主观判断的影响 C. 一般要求对评估者进行统一的评估细则训练 D. 多个评分者之间平均一致性达到0.90以上，才认为评分是客观的

26．下列关于结构效度说法不正确的是（）B. 当实际测量的资料无法证实我们的理论假设时，表明该测验结构效度不高 C. 应该有单一的数量指标来描述结构效度

27. 与韦氏成人智力量表不同,韦氏儿童智力量表的主要特点是 ( ). A. 言语与操作测验交叉进行 B.有备用分测验 D.粗分换算量表分各年龄组不同

28．韦氏测验中，对于有时间限制的项目以（）作为评分依据，超过规定时间即使通过也记0分，提前完成的按提前时间的长短记奖励分。A. 正确性 C. 反应的速度

1．理想的测量单位应当具备两个良好的条件是（）A.确定的意义 B.相等的价值 2．信度是指测验结果的（）A.可靠性 D.一致性

3．在下列信度类型中，受测的时间间隔影响的有（）A.重测信度 D.重测复本信度 4．良好的效标应该具备的条件有（）A.测量的方便性 B.测量结果的准确性

5. 项目的定性分析包括考虑项目的内容效度，题目编写的（）和（）等 C.恰当性 D.有效性 6．心理测验对主试资格的要求包含（）两方面A.心理测验技术 D.职业道德

7．以下有关测验焦虑的叙述中，正确的有（） A.抱负水平与焦虑呈正相关 B.成就测验和智力测验的分数与测验焦虑呈显著负相关 C.情绪不稳定的人容易产生测验焦虑 D.当测验成绩与被试关系重大时，被试容易产生焦虑 8. 以下会影响受测者测验分数的是（）A.遗传特征 B.测验前的学习与经验 D.测验情境

9．常见的影响信度的因素主要包括（）A.样本特征 B.测验的长度 C.测验的难度 D.测量的时间间隔

10. 关于效度的理解正确的说法有（）A.效度是相对于一定的测量目的而言的 B.效度是测量的随机误差和系统误差的综合反映 C.判断一个测量是否有效要从多方面搜集证据 D.在正常情况下，一个量表的效度不会为零 11．按测验的要求，测验可分为（） C.最高作为测验 D.典型行为测验

12．在学生行将毕业，面临升学或就业选择时，可选用（），以帮助其选择合适的专业或职业 A.职业倾向测验 B.兴趣测验 13. 如果一个测验有多个常模，在解释测验分数时，对于常模的选择应注意（） C.选择最相近的团体 D.选择最匹配的情境

14. 离差智商的优点是（）A.建立在统计学的基础之上 B.表示的是个体智力在年龄组中所处的位置 C.表示的是智力高低的一种理想的指标

15. SCL-90没有测评（） A情绪高涨 B思维飘忽 16. MMPI的缺点是（） B受文化背景影响 C测试时间长 17．常用的信度指标有（）A.内部一致性系数 B.复本信度

4 心里测量学

18．效度具有（）A.相对性D.连续性

19．一般来说，测验的项目分析包括（）分析和（）分析C. 定性 D.定量 20．按照测验的方式分类，可将测验分为（） C.个别测验 D.团体测验

21．在进行测验选择时，应注意（）A.要使所选测验适合测量目的 B.了解测试对象的受测条件 C.测验要符合心理测量学的要求 D.要了解测量工具本身的特点

22．在向受测者报告分数时，以下说法正确的有（） A.使用当事人理解的语言 B.要说明分数的可信度 C.要说明常模团体的类型 D.要考虑测验分数将给受测者带来的影响

23．在下列WIRS-CR的分测验中,有时间限制的分测验是( ) A.. 填图 B. 排列 D. 算术

24．SCL-90的总分主要用途是反映（）A. 病情严重程度 B. 症状群的特点 C. 症状群的分布D. 病情演变情况 25．内容效度主要应用于（）A.成就测验 C.选拨和分类的职业测验

26．计算区分效度最常用的方法是相关法，常用的相关法有（）A.点二列相关 B.二列相关 C.Φ相关 D.积差相关 27．按测验的功能，测验可分为（）B.智力测验 C.特殊能力测验D.人格测验

28．测验实施前的准备工作主要包括（）A.预告测验 B.熟悉测验的指导语C.熟悉测验的具体程序 D.准备测验材料三、名词解释

1．导出分数：就是在原始分数转换的基础上，按照一定的规则，经过统计处理后获得的具有一定参照点和单位，且可以相互比较的分数，也叫量表分数。2．离差智商：是将一个人在智力测验上的成绩和同年龄组的平均成绩比较而得到的一个相对分数。3．表面效度：外行人对某个测验从表面上看好像是测某种心理特质的程度。4．评分者信度：指的是多个评分者给同一组被试的同一份测量结果进行评分的一致性程度。5．罗森塔尔效应：是指主试的期望对被试的反应所产生的影响，亦称皮格马利翁效应或期望效应。6．测量误差：指的是在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。7．分半信度：指将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。8．实证效度：指一个测验对处于特定情境中的个体的行为进行估计的有效性。9．复本信度：根据一组被试在两个平行测验上的得分计算的相关系数（等值性系数）—皮尔逊积差相关系数。10．系统误差：是那种由与测量目的无关的变因引起的一种恒定而又规律的效应。这种误差稳定地存在于每一个测量之中，此时尽管多次测量的结果非常一致，但实测结果仍与真是数值有所差异，是不正确的。11．标准分数：是将原始分数与平均数的距离以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数，因它的基本单位是标准差，所以叫标准分数。1．同质性信度：也叫内部一致性系数，它是指测验内部所有题目间的一致性程度。2．项目区分度：也叫鉴别力，是指测验项目对被试心理特质水平高低差异的区分能力。3．反应定势：亦称反应风格，是指独立于测验内容的反应倾向，即由于每个人回答问题的习惯不同，而使能力相同的被试得到不同的测验分数。4．效度：指对测验准确性程度的估计，即测验实际测出所要测的心理特质的程度。5．随机误差：由与测量目的无关的、偶然的因素引起的、而又不易控制的误差。6．稳定性系数：就是重测信度。即采用重测法，使用同一测验在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数。该系数表明测验的稳定性程度，所以又叫稳定性系数。7．结构效度：表示测验实际测量出所欲测量的心理结构或特征的程度。8．常模团体：由具有某种共同特征的人所组成的群体，或者是该群体的一个样本。9．信度：指的是测量结果的稳定性程度。换句话说，若能用同一测量工具反复测量同一种心理特质，则其多次测量的结果间的一致性程度就叫信度，有时也叫测量的可靠性。10．效标关联效度：又称实证效度，它是测验分数与作为效标的另一独立测验结果之间的一致程度。11．重测信度：重测信度也称稳定系数，是一组被试在不同时间用同一测验测量两次（两次测验间隔一段时距），两次测验分数的相关系数。四、简答题

1. 简述效度的种类及其估计方法。答：内容效度是指测验题目对有关内容或行为取样的适用程度，从而确定测验是否是所测量的行为领域的代表性取样。估计方法有：专家判断法；统计分析法；经验推测法。

结构效度是指一个测验实际测到所要测量的理论结构或特质的程度，或者说测验分数能够说明心理学理论的某种结构或特质的程度。估计方法有：对测验本身内容的分析；测验间的相互比较；考察测验的实证效度；通过实验法和观察法证实。

实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。主要重视那些与测验独立的效标行为，而不太注重测验内容或结构，有时也称为效标关联效度。估计方法有：相关法；区分法；命中率法。

2．在选择测验时应该注意哪些问题。答：（1）所选测验必须适合测量的目的。施测者在选择测验时，应该对测验的特殊用途、使用范围、功用及特长、优缺点有一个了解，进而选择与测验目的相匹配的测验。（2）了解测试对象的受测条件。施测者要对测试对象的一些特点，如测试对象(总体)的年龄、年级和居住所在地等，做到心中有数。（3）所选测验必须符合心理测量的要求。考虑该测验是否经过了标准化，它的信度、效度如何，常模样本是否符合你的测试对象，常模资料是否太久而失效等等。（4）要了解测量工具本身的特点；经济效益；测验工具的跨文化差异等。

5 心里测量学

3．3. 什么是常模团体？确定常模团体时应注意哪些问题？答：1）常模团体是由具有某一特征的人所构成的群体，或该群体的样本；在为测验制定常模时，首先要确定常模团体；

2）确定常模团体需要注意以下6方面： a、群体构成的界限必须明确，必须清楚地说明所要测量的群体的性质与特征； b、常模团体必须是所测群体的一个有代表性的样本，为克服取样偏差，采用统计学抽样； c、取样过程必须有详细且明确的描述，以免测验误用或错误解释； d、样本大小要适当，其他条件相同时，样本越大越好，但也要考虑人力物力因素；e、注意常模团体的时间性，必须是近时的，要经常修订更新； f、注意一般常模与特殊常模的结合，以获取最大信息量。

4．简述随机误差的来源。答：（1）主试者方面引起的误差比如被试的年龄、性别、外表、施测时的言谈举止、表情动作等都可能会对测验结果造成影响。（2）由受测者本身引起的误差受测者的测验的经验、应试动机、测验焦虑、定势反应和生理因素等都会引起随机误差。（3）施测过程中的有关误差物理环境，如施测现场的温度、光线、声音、桌面好坏、空间宽窄等；施测过程中的意外干扰，如突然停电，他人的意外闯入等。（4）评分的解释和误差评分的不客观，如评卷老师根据自己的喜好对这个题目进行给分；计分的出错，比如计算分数过程中出现的错误；解释的不一致，由于个体知识经验的不同，对于同一个测验结果的理解不同，就可能导致对同一个分数做出不同的解释。

5．常模是什么？是如何产生的？答：常模（norm）又称为测验常模。一种描述由个体所组成的总体的行为特性的概念，这种总体行为特征的描述一般需要借助与测验才能实现。因此常模可以直接的解释成一个总体关于某一被测量对象（即心理属性）确定的特殊分数的分布状态。常模是针对一个具体的总体而言，从理论上说这个总体的容量应该是无限大的，而且在实践中其容量也的确非常大，因此要产生一个总体的常模并不是一件简单的事，因为测验一般不可能对整个总体实施。所以，常模产生的关键在于寻求一个能有代表总体的样本，即标准化样本。常模可根据标准化样本的测验分数经过一定的数据统计处理而产生。

6. 鉴别指数对测题的意义是什么？答：鉴别指数是评价项目质量和筛选项目的主要指标，也是影响测验效度的重要因素。

7．简述智力年龄、比率智商和离差智商。答：1905年，比奈和助手西蒙发表了世界上第一个正式使用的儿童智力测验——比奈—西蒙量表。测验结果用智龄（智力年龄Mental Age, MA）表示。智龄是由儿童答对测题的多少确定的。然后通过智龄与实龄（实足年龄Chronological Age, CA）的比较来衡量儿童智力水平的高低。凡智龄大于实龄的，儿童即被认为智力较高（聪明），智龄等于实龄的则被认为智力中等，智龄小于实龄的被认为智力较低（愚笨）。但是智龄只能表示一名儿童智力的绝对水平，它不能用来比较实龄不同的儿童智力的高低。比奈—西蒙智力量表迅速传到许多国家，在美国，修订成绩最大的当数斯坦福大学教授推孟（L. M. Terman），他于1916年发表了斯坦福—比奈智力量表。斯坦福—比奈智力量表第二版的突出进步是引入了智商（智力商数IQ）的概念，即其结果用智商（IQ）来报告。IQ是英文Intelligence Quotient的缩写。智商能表示智力的相对水平，成为比较儿童聪明程度的指标。比率智商的计算公式：智商（IQ）=智龄（MA）／实龄（CA）×100

智商能表示智力的相对高低，因此不同实龄的儿童的智力水平的高低就能进行比较了。

但是，比率智商的基本假设是智力发展和年龄增长成正比，是一种直线关系，但实际上当年龄增大时就不是这样的情况了。1949年韦克斯勒首次在他编制的儿童智力量表中采用了离差智商。所谓离差智商是将一个人在智力测验上的成绩和同年龄组的平均成绩比较而得到的一个相对分数。同样的智商分数在不同年龄水平上代表同样的相对位置。

1．常模团体的构成条件。答：（1）群体的构成必须明确界定。（2）常模团体必须是所测群体的代表性样本。（3）样本的大小要适当。（4）标准化样组是一定时空的产物。

2．提高效度的方法有哪些。答：提高测量效度的具体方法有：精心编制测验量表，避免出现较大的系统误差；妥善组织测验，控制随机误差；创设标准的应试情境，让每个被试都能发挥正常的水平；选好正确的效标，定好恰当的效标测量，正确地使用有关公式。

3．提高信度的方法有哪些。答：提高信度的方法有：（1）适当增加测验的长度；（2）使测验中所有试题的难度接近正态分布，并控制在中等水平；（3）努力提高测试题的区分度；选取恰当的被试团体，提高测验在各同质性较强的亚团体上的信度；（4）尽量减少无关因素的干扰。

4．心理测验的标准化包括哪几个方面。答：心理测验的标准化是指测验编制、实施、记分以及测验分数的解释的程序的一致性。心理测验的标准化主要包括：（1）测验内容的标准化，即给所有被试实施相同的一组测题；（2）测验实施的标准化，包括一致的指导语、测验时限以及测验环境；（3）测验记分和解释的标准化，即记分和分数的解释要客观、一致。 5．简述信度的类型及其特点。

答：（1）复本信度（等值性系数）是指一组被试在两个平行测验上的得分之间的一致性程度。它可以反映两个测验之间等值性程度。使用复本信度有一个基本的前提条件，即两个测验必须是真正意义上的平行测验。（2）再测信度（稳定性系数）是指用同一量表对同一组被试施测两次所得分数的一致性程度。它可以反映两次测验的结果有无变动，亦即测验分数的稳定性。使用再测信度有三个前提条件：所测量的心理特质必须是稳定的；遗忘与练习的效果相同；两次施测期间，被试的学习效果不存在差异。（3）分半信度是指按正常程序施测，然

6 心里测量学

后将全部项目分成两个部分，所有被试在两个部分上所得分数的一致性程度。分半信度属于内在一致性系数，测量的是两半题项得分间的一致性。（4）同质性信度（内部一致性系数）是指测量内部所有题目之间的一致性。若所有题目测量的是同一心理特质，即称之为具有高度一致性，表现为所有题目间都具有较高的正相关。（5）评分者信度是指多个评分者多同一组被试的侧量结果进行评分的一致性程度。总的来说，再测信度看估计同一测验在时间上的稳定性，复本信度估计两个测验之间的一致性，分半信度估计一个测验两部分之间的一致性，同质性信度估计一个测验内部各个项目间的一致性，评分者信度估计不同评分者对同一个测验多个对象评分的一致性。 6. 测验信度与测验效度的关系。答：信度和效度的如下关系：

1）信度高是效度高的必要而非充分条件

效度高的测验，信度一定高，反之，信度高的测验，效度不一定高；

因为随机误差变异减小，真分数变异增大，信度提高，但这仅给有效变异的增加提供了可能，至于是否能提高效度，还要看系统误差的大小。

2）效度受信度制约

7．简述测量误差的分类及主要来源。

答：1）误差，即测量中与测验目的无关的因素引起的测量结果不准确或不一致的测量效应；主要的测量误差有两大类，即系统误差和随机误差；系统误差，是各次测量中保持恒定的无关因素引起的测量效应，只影响准确性，不影响稳定性；随机误差，是测量中偶然因素引起的不易控制的误差，既影响准确性，也影响稳定性。

2）心理测量中误差主要来源于以下三方面：（1）工具方面：心理测验主要以测验量表为工具，量表是否稳定，是否真实的测得了我们所要测量的特质，是工具造成误差的主要原因；例如数学考试如果依赖于文字理解能力，则测验结果就会不准确；（2）对象方面：误差产生的原因是受测者是否真正发挥水平，例如如疲劳、焦虑、紧张、练习、动机等都会影响测验的结果；（3）过程方面：主要是一些偶然因素引起的误差，例如测验环境的温度、光线、声音等会造成误差，主试者的年龄、性别、外表、言谈举止、是否按照规定施测等会造成误差，还有评分计分环节错误、意外干扰如停电、试卷印刷错误等同样导致误差。五、论述题

1．试述在测验实施过程中可能引起误差的被试方面的主要因素。

答：（1）应试技巧，具有较高测验技巧的被试会及时适应测题形式，他们善于觉察正确答案与错误答案的细微差别，懂得合理的分配时间，因此经常比那些与他们能力相当但缺乏测验技巧的被试获得更高的测验分数。

（2）练习效应，任何一个测验在重复使用时，由于被试对内容和程序已经相当熟悉，因此会使成绩提高。

（3）应试动机，被试对测验的动机不同，会影响其作答态度、注意力、持久性及反应速度等，从而影响测验的结果。如果被试动机效应在反复测量中以一种恒定的方式出现，会导致系统误差，从而使测量的有效性降低；如果动机效应引起了偶然性的不稳定的反应，会使测量的有效性、可信性都降低。

（4）测验焦虑，适当的焦虑会使人维持一定的兴奋水平，注意力增强，反应速度加快，从而对测验产生积极的影响。但过高的焦虑会使工作效率降低，注意力分散，思维狭窄，反应速度减慢，因而会大大影响成绩。

（5）反应倾向，独立于测验内容的反应倾向，由于每个人回答问题的习惯不同，而使能力相同的被试得到不同的测验分数。如饥饿、疲劳等生理原因会产生某种单调消极的反应定势，个人偏好或某种态度等心理原因会使被试倾向于选某一特点的答案，等等。（6）生理变因，生病、疲劳、失眠等生理因素，以及在智力、情绪、体力等方面的生物节律也会影响测验成绩而带来误差。 2．简述心理测验的客观性指标。

答：1.信度测验的可靠程度，是对测验结果的一致性的估计。一个好的测量工具必须稳定，每次测量的结果要保持一致，否则便不可信。由于系统误差（也就是恒定误差）对测验的影响是恒定的，所以信度只考虑随机的，偶然的误差影响（如被试样本、实施条件、动机水平和注意力等等）。随机误差越大，信度越低。

2.效度（validity）效度指对测验准确性程度的估计，即测验实际测出所要测的心理特质的程度。

3.难度项目难度是衡量测题难易水平的数量指标。估计项目难度的方法通常是以被试通过每个项目的百分比来决定的。

4.区分度指测验项目对被试心理品质差异的区分能力。如果一个测题的区分度高，那么水平高的或能力强的被试就会得分高，水平低或能力弱的被试就会得分低，这样就能把不同水平的被试区分开了。

3．信度、效度、难度、区分度有何区别与联系？为什么在编制测验的时候要考察“四度”？

答：区别与联系：信度，指测量结果的稳定性程度，也叫测量的可靠性。获得较高的信度只是测验有效的必要条件。效度，指一个测验或量表实际能测出其所要测的心理特质的程度。（1）效度是一个相对的概念：每个测量工具都有自己的目的；内隐特质是通过外显行为间接

7 心里测量学

测得的。（2）效度是测量的随机误差和系统误差的综合反映。（3）判断一个测量是否有效要从多方面收集证据

效度与信度的关系：1.信度高是效度高的必要而非充分的条件一个测验效度高，其信度也必然高；但一个测验信度高，其效度不一定高。 2.测验的效度受它的信度制约一个测验的信度必然比效度高，至少相等。

难度，指项目的难易程度。在最高作为测验中，称为“难度”，而在典型作为测验中，则指“通俗性”。两者都是指在总体中，能够正确或确切回答某项目的人数。测验过难或过易，分数全距缩小，信度降低。P=0.50时最佳区分度，指测题对不同心理特质水平个体的区分程度。

大体而言，难度为0.50时最理想，此时项目具有最大的鉴别力。但在实际操作中，让所有项目难度都到达0.50困难很大，而且也不必要，一般只需使项目的平均难度接近0.50，而各个项目的难度在0.50± 0.20之间变化。

考察“四度”的目的：信度是为了保证整个测验的稳定性和所测内容的一致性；效度是为了保证测验预测的有效性、结构的可靠性、内容的合理性；难度和区分度是为了保证每道测题对不同水平个体区分的有效性。 1．试述影响信度的因素。答：一、样本特征

（一）样本团体异质性 1.被试团体同质性越高（个体差异越小），所得相关系数（信度）就越低。2.被试团体异质性越高（个体差异越大），所得相关系数（信度）就越高。

（二）样本团体平均能力水平 1.被试的水平高，反映真实能力，信度高。2.被试的水平低，凭猜测得分，信度低。二、测验长度（数量）一般来说，一个测验中增加同质的题目，可以使信度提高。

（一）测验越长，测验的测题取样或内容取样就越有代表性。（二）测验越长，被试的猜测因素影响就越小。

三、测验难度（一）难度对信度的影响只存在于某些测验中，如智力测验、成就测验、能力倾向测验等，对于人格测验、兴趣测验，态度量表等不存在难度问题，因为这些测验的题目没有正确或错误答案之分。

（二）难度与信度没有简单的对应关系。难度为50%时信度最大（适用于简答题，选择题有猜测因素）四、时间间隔（一）间隔时间越短，信度越高；（二）间隔时间越长，信度越低。

2．比较内容效度、实证效度、结构效度这三种效度估计方法的相似与不同之处，分析它们的不同使用情境。

答：1、结构效度能帮助我们运用测验分数解释人的心理特质，可由结构效度研究的资料来回答测验所测量的东西或所测量的变量的性质，对于测量一个抽象构想（很难用行为表现来描述的构想，如智力、人格、婚姻满意度）是合适的；实证效度可用来了解测验分数能否有效地预测或估计某种行为表现，对于职业测验、大学入学测验以及临床诊断测验都是合适的，是关于测验结果的一些实际用途的检验；内容效度研究的问题是变量的内容范围，对于像成就测验这样可清晰观察和测量的行为的测验很适合；同时，它有帮助我们决定测验分数能否代表某种习惯结果的成果，也是关于测验结果的一些实际用途的检验。

2、任何一个测验都需要各式各样的效度证据，但是并不总是需要检验这三种类型的效度，关键在于效度是由一定的测验目的规定的，不同测验偏重于不同种类的测验效度。

3、在效度验证的过程中，内容效度验证的重点是确定测验内容与某个行为领域的一一对应关系，而该行为领域往往是已经被明确界定了的；实证效度着重于测验分数是否与效标测量有高度的相关，也就是说，它注重的不是预测变量，而是效标的测量；结构效度的着重点则是测验本身、测验赖以编制起来的心理结构理论和测验测量到该理论结构或特质的能力。 3．测量效度的影响因素有哪些，如何提高测验效度？

答：1）效度是测验的有效性，是一个测验对其所要测量的特质准确测量的程度，即与测验目的有关的真实变异与总变异的比；它是测验的系统误差和随机误差的综合反映； 2）要保证测验的效度，需要综合考虑以下几方面因素：（1）测验本身的影响因素：有两方面，一是测验本身的质量，例如指导语、题目的含义是否明确，题目的难度、区分度是否合适，题目编排是否合理，题目是否符合测验目的等；二是测验长度，增加题目数量可以适当提高效度；（2）实施过程的影响因素：测验过程中不遵循指导语操作，出现意外干扰，评分计分出错，环境不良等都会降低测验的效度；（3）被试方面的影响因素：被试的情绪、动机、兴趣、态度、身体状况都会产生随机误差，从而影响测验的效度；（4）效标的影响因素：效标的测量是否准确，效标与测验分数的关系类型，都会影响测验效度；（5）测验信度的影响因素：信度高是效度高的必要而非充分条件，信度不高的测验不可能具有较高的效度；3）总之，要提高测验的效度，就要控制随机误差，减小系统误差，选择合适的效标，具体来说有如下方法：（1）精心编制测验，避免产生较大的系统误差，要求题目能够较好的代表欲测得内容和结果；（2）妥善组织测验，控制随机误差，施测者要严格按照手册操作，避免无关干扰；（3）创造标准的测验情境，让每个被试都能够发挥正常水平；（4）选择合适的效标，定好效标测量，选择正确的公式。

Word文档下载：《心理测量学》.doc

搜索更多:《心理测量学》