教育测量与评价
现代教育测量与评价学 第一章 教育测量与评价概述 一、教育测量的含义(33分)
本节测验题:智力测量属于 A. 物理测量 B. 心理测量 C. 生理测量 D. 社会测量
二、教育测量的特点、教育评价的含义(35分)
提出“凡物之存在必有其数量”命题的是谁? A. 麦柯尔 B. 孟子 C. 桑戴克 D. 孔子
三、教育评价的特点、教育测量与评价的产生(35分)
现代教育评价产生的标志是 A. 《比纳.西蒙量表》 B. 科举考试 C. T.B.C.F制 D. “八年研究”
四、现代教育测量与评价的发展(30分)
第四代教育评价”的创立者是 A. 枯巴和林肯 B. 比纳和西蒙 C. 桑代克和麦柯尔 D. 泰勒与布鲁姆
五、教育测量与教育评价相关概念辨析(30分)
我国教育法规定的两项基本教育制度:一是教育督导制度,二是 A. 教育评价制度 B. 教育考试制度 C. 教育测量制度 D. 教育评估制度
第二章 教育测量与评价的信度 一、信度概述(31分)
样本统计量与总体参数越接近,说明测验的信度 A. 越低 B. 无法判断 C. 越高
D. 需要验证
二、重测信度、复本信度、同质性信度(一)(35分)
用同一个量表对同一组被试先后施测两次,所得结果的一致性程度是 A. 等值性信度
B. 等值稳定性信度 C. 分半信度 D. 重测信度
三、同质性信度(二)、评分者的信度(一)(31分)
若2个评分者评阅N份试卷,计算评分者的信度可用 A. 斯皮尔曼等级相关系数公式 B. 斯皮尔曼-布朗公式 C. 积差相关系数公式 D. 肯德尔和谐系数公式
四、评分者的信度(二)、标准参照测验的信度(33分)
估计标准参照测验的信度需要预先确定 A. 淘汰的人数 B. 达标的比例 C. 通过的人数 D. 决断的分数
第三章 教育测量与评价的效度
一、效度概述、内容效度的含义(30分)
下列适合于内容效度的测验是 A. 能力倾向测验 B. 成就测验 C. 人格测验 D. 性格测验
二、内容效度的估计方法、结构效度(38分)
下面哪种测验的效度不属于结构效度? A. 智力测验 B. 焦虑测验 C. 动机测验 D. 学科测验
三、效标关联效度(44分)
效标关联效度也称为 A. 实证效度 B. 预测效度 C. 同时效度 D. 逻辑效度
第四章 教育测量与评价题目的难度和区分度
一、难度及其计算、区分度及其计算(一)(40分)
最适宜的难度系数是 A. 0.50 B. 0.00 C. 1.00 D. -1.00
二、区分度的计算(二)、区分度与信度和难度的关系(31分)
难度系数越接近何值,题目的区分度越大? A. 0.50
B. 1.00 C. 0.00 D. -1.00
第五章 教育测量与评价分数的整理和转换 一、教育测量与评价分数的整理(32分)
被试者只有连续通过一次又一次的不同测验取舍分数线,才能最终获得成功。这种组合分数的方法是 A. 多重回归 B. 临床诊断 C. 多重选择 D. 连续选择
二、教育测量与评价分数的转换(34分)
原始分数与其所在团体的平均分数之差除以标准差所得的商是 A. 百分等级分数 B. T分数 C. 标准分数 D. CEEB分数
第六章 教育测验的编制原理与方法 一、教育测量的目标及其确定(36分)
测验目标的确定是以什么分类理论为基础的? A. 行为目标 B. 教育目标 C. 情感目标 D. 认知目标
二、教育测验的总体设计(30分)
编制测验双向细目表的两个维度是 A. 内容和目标 B. 目标和过程 C. 内容和结果 D. 结果和目标
三、测验试题的类型及其编写技巧(45分)
简答题属于 A. 选择性试题 B. 客观性试题 C. 操作性试题 D. 主观性试题
第七章 教育测验试题的评分与项目的质量分析
一、测验试题的评分、常模参照性测验的质量分析(38分)
在二重选择题中,若每题2分,则答错一道题应扣 A. 1分 B. 2分 C. 1/3 分 D. 2/3 分
二、编制测验项目分析报告、目标参照性测验的质量分析(35分)
有一道试题,经过教学后通过试题的学生比率从1/3提高到5/6,则这道试题对教学感受的灵敏度指数为 A. 1.00 B. -1.00 C. -0.5 D. 0.5
第八章 教育评价程序及其心理与调控 一、教育评价的一般程序(31分)
“设计评价方案”的工作属于教育评价的 A. 准备阶段
B. 结果的分析阶段 C. 实施阶段
D. 结果的处理阶段
二、教育评价心理与调控(一)(30分)
评价者在评价过程中“以好盖差”,属于哪种心理行为? A. 角色心理 B. 期望心理 C. 晕轮心理 D. 成见心理
三、教育评价心理与调控(二)(32分)
被评价者担心他人会借评价来“搞什么名堂”,属于哪种心理行为? A. 被审心理 B. 责备心理 C. 拒绝心理 D. 疑惧心理
第九章 教育评价表的编制原理与方法 一、编制教育评价表的意义和原则(35分)
评价标准的构成要素是 A. 强度、标号和标度
B. 强度和频率、标号、标度 C. 频率、标号和标度 D. 强度、频率和标度
二、编制教育评价表的方法和步骤(一)(32分)
初拟评价指标就是要初步分解 A. 评价标准 B. 评价目标 C. 评价指标 D. 评价目的
三、编制教育评价表的方法和步骤(二)(31分)
教育评价指标的层次结构一般不超过 A. 二级 B. 三级 C. 四级 D. 五级
四、编制教育评价表的方法和步骤(三)(44分)
一般情况下,评价标准确定为几个等级为宜? A. 2—3个 B. 3—5个 C. 2—4个 D. 3—6个
第十章 教育评价资料的搜集、分析与价值判断的方法 一、教育评价资料的搜集方法(一)(31分)
多项选择法属于下列哪种教育评价资料的搜集方法? A. 问卷法 B. 测验法 C. 观察法 D. 访谈法
二、教育评价资料的搜集方法(二)、教育评价资料的分析方法(一)(31分)
现存统计资料分析属于下列哪种教育评价资料的搜集方法? A. 观察法 B. 文献研究法 C. 个案研究法 D. 访谈法
三、教育评价资料的分析方法(二)、教育评价的价值判断方法(一)(34分)
某班学生的语文平均成绩是70分,标准差是5。若某生得78分,则该生语文成绩的T分数是: A. 148 B. 83 C. 66 D. 75
四、教育评价的价值判断方法(二)(31分)
纵断评价的结论表示方式多采用 A. 等级方式 B. 评语方式 C. 名次方式 D. 数字方式
第十一章 现代教育测量与评价理论的发展 一、经典测验理论简介(32分)
经典测验理论的理论基础是 A. 真分数模型 B. 标准分数模型 C. 百分等级分数模型 D. T分数模型
二、经典测验理论的优点和局限性(31分)
经典测验理论的局限性在于
A. 参数估计对样本的依赖性较小 B. 信度估计精度不高
C. 参数指标间的配套性较差 D. 误差指标精细
三、项目反应理论及与经典测验理论的比较(37分)
项目特征曲线中的上渐近线是 A. P(@)=c B. P(@)=0 C. P(@)=1 D. P(@)=0.5
四、教育评价理论(39分)
在CIPP教育评价模式中,输入评价 A. 为实施决策服务 B. 为计划决策服务 C. 为再循环决策服务 D. 为组织决策服务
五、现代教育测量与评价额功能和发展趋势(41分)
就教学情境而言,教育测量与评价的主要目的是 A. 改进评比与奖惩 B. 改进投入与产出 C. 改进学习与教学 D. 改进管理与服务
习题浏览
单选
一、单项选择题
1、 在教育测量与评价中,用来描述一组观测值离散情况的统计量是A. 标准差 B. 平均数 C. 等级分数 D. T分数
100分) (分数: 正确答案:A
2、 下列属于绝对评价结论表示方式的 (分数:100分) A. 名次法 B. 标准分数 C. T分数 D. 等级
正确答案:D
3、 在测量中,最理想的参照点是 (分数:100分) A. 相对参照点 B. 绝对参照点 C. 人为参照点 D. 公认参照点
正确答案:B
4、 将评价对象与同类集体内其他对象相比较而做出评价属于 (分数:100分) A. 绝对评价 B. 相对评价
C. 个体内差异评价 D. 标准参照评价
正确答案:B
5、 区分度D的值域范围是 (分数:100分) A. (―1,1) B. (-3,3) C. [0,1] D. [―1,1]
正确答案:D
6、 下列属于个体内差异评价结论表示方式的是 (分数:100分) A. 名次法 B. 等级 C. 标准分数 D. 数值
正确答案:D
7、 判断评价对象是否达到或在多大程度上达到了目标要求的依据是 (分数:100分) A. 评价指标 B. 评价目标 C. 评价标准 D. 评价方式
正确答案:C
8、 属于选择型的试题类型是 (分数:100分) A. 匹配题
B. 简答题 C. 填空题 D. 论文题
正确答案:A
9、 在测验中,用F代表回答失败,P代表通过。如果一道试题分别在教学前、教学过程中、教学后对学生先后进行四次测验,下列测验结果对教学有足够灵敏性的是 (分数:100分) A. FFPP B. FPPF C. PFPF D. FFFF
正确答案:A
10、 提出“凡物之存在必有其数量”命题的心理学家是 (分数:100分) A. 麦柯尔 B. 费舍 C. 桑戴克 D. 比纳
正确答案:C
11、 用倒扣分的方法可以矫正因猜测带来的误差,若在四重选择题中,每题3分,答错一题应扣 (分数:100分) A. 3分 B. 1分 C. 1/3 分 D. 2/3 分
正确答案:B
12、 测验的效度是指 (分数:100分) A. 测量结果与测量目的的吻合程度 B. 测量结果与真实水平的吻合程度 C. 测量结果与测量标准的吻合程度 D. 测量结果与测量水平的吻合程度
正确答案:A
13、 测验信度的值域范围是 (分数:100分) A. (―1,1) B. (-3,3) C. [0,1] D. [―1,1]
正确答案:C
14、 属于供答型的试题类型是 (分数:100分) A. 是非题 B. 匹配题
C. 简答题 D. 选择题
正确答案:C
15、 下列哪种试题属于主观性试题? (分数:100分) A. 选择题 B. 论述题 C. 匹配题 D. 填空题
正确答案:B
16、 根据既定的客观标准,将评价对象与客观标准进行比较,从而评定其优劣。这种评价属于 (分数:100分) A. 绝对评价 B. 相对评价
C. 个体内差异评价 D. 相互参照评价
正确答案:A
17、 横断评价是用来指出个体的优势和不足,主要采用的方式是 (分数:100分) A. 等级 B. 数值 C. 名次法 D. 评语
正确答案:D
18、 提出“凡有数量之东西都可以测量”的是 (分数:100分) A. 麦柯尔 B. 费舍 C. 桑戴克 D. 比纳
正确答案:A
19、 在一次语文测验中,第五题满分为15分,该题考生的平均得分为9.6分;第七题满分为30分,该题考生的平均得分为21分。两题相比较 (分数:100分) A. 两题难易程度相同 B. 第七题难于第五题 C. 第五题难于第七题 D. 无法比较
正确答案:C
20、 用倒扣分的方法可以矫正因猜测带来的误差,若在四重选择题中,每题2分,答错一题应扣 (分数:100分) A. 3分 B. 1分 C. 1/3 分
D. 2/3 分
正确答案:D
21、
三个测验各有80个题目,各测验得分情况如下表所示,直观判断哪个测验最适宜? 最高分 最低分 全距 平均分 测验一 75 测验二 80 测验三 40
(分数:100分) A. 测验一 B. 测验二 C. 测验三 D. 无法判断
正确答案:A
22、 在测验中,用F代表回答失败,P代表通过。如果一道试题分别在教学前、教学过程中、教学后对学生先后进行四次测验,下列测验结果对教学缺乏灵敏性的是 (分数:100分) A. FPPP B. FPPF C. FPFP D. FFPP
正确答案:B
23、 下列属于相对评价结论表示方式的是 (分数:100分) A. 等级 B. 数值 C. 评语 D. 名次法
正确答案:D
24、 测验的信度是指 (分数:100分) A. 测量结果与测量目的的吻合程度 B. 测量结果与真实水平的吻合程度 C. 测量结果与测量水平的吻合程度 D. 测量结果与测量标准的吻合程度
正确答案:B
25、 如果原始分数的分布是正态分布或近似于正态分布,则标准分数的取值范围大致
11 50 0 64 30 40 42 69 15 在 (分数:100分) A. -1至+1之间 B. 1至9之间 C. -3至+3之间 D. 20至80之间
正确答案:C
26、 下列哪种试题属于客观性试题? (分数:100分) A. 是非题 B. 论述题 C. 操作题 D. 作文题
正确答案:A
27、 对评价对象进行价值判断的依据是 (分数:100分) A. 评价指标 B. 评价目标 C. 评价标准 D. 评价方式
正确答案:A
28、 在教育测量与评价中,对任何一种测量来说,效度与信度相比 (分数:100分) A. 信度比效度更重要 B. 效度比信度更重要 C. 两者都不重要 D. 两者一样重要
正确答案:B
29、 用倒扣分的方法可以矫正因猜测带来的误差,若在四重选择题中,每题1分,答错一题应扣 (分数:100分) A. 3分 B. 1分 C. 1/3 分 D. 2/3 分
正确答案:C
30、 用来描述一组观测值集中情况的统计量是 (分数:100分) A. CEEB分数 B. 平均数 C. 等级分数 D. T分数
正确答案:B
31、 测量量表依据水平从高到低的顺序排列为 (分数:100分) A. 比率量表、等距量表、顺序量表、命名量表 B. 等距量表、顺序量表、命名量表、比率量表
C. 顺序量表、命名量表、比率量表、等距量表 D. 命名量表、顺序量表、等距量表、比率量表
正确答案:A
32、
在学科测验中,以零分作为计分的起点,该零点属于
(分数:100分) A. 绝对参照点 B. 相对参照点 C. 难以确定 D. 不是参照点
正确答案:B
33、 名称量表属于 (分数:100分) A. 命名量表 B. 顺序量表 C. 等距量表 D. 比率量表
正确答案:A
34、 类别量表属于 (分数:100分) A. 命名量表 B. 顺序量表 C. 等距量表 D. 比率量表
正确答案:A
35、下面适合于对命名量表进行统计分析的方法是 (分数:100分) A. 平均数 B. 标准差 C. 中位数 D. 次数
正确答案:D
36、 下面适合于对顺序量表进行统计分析的方法是 (分数:100分) A. 中位数 B. 平均数 C. 标准差 D. 次数
正确答案:A
37、在体育比赛中,用1、2、3、? ? 分别代表冠军、亚军、季军、? ?,这种量表属于 (分数:100分) A. 命名量表 B. 顺序量表 C. 等距量表
D. 比率量表
正确答案:B
38、 测量气温时所使用的量表属于 (分数:100分) A. 命名量表 B. 顺序量表 C. 等距量表 D. 比率量表
正确答案:C
39、 测量长度时所使用的量表属于 (分数:100分) A. 顺序量表 B. 等距量表 C. 命名量表 D. 比率量表
正确答案:D
40、具有绝对零点的量表属于 (分数:100分) A. 命名量表 B. 等距量表 C. 顺序量表 D. 比率量表
正确答案:D
41、教育测量主要是对学生哪种特性的测量? (分数:100分) A. 物理特性 B. 精神特性 C. 身高特征 D. 体重特征
正确答案:B
42、 广义的教育测量属于 (分数:100分) A. 物理测量 B. 生理测量 C. 社会测量 D. 心理测量
正确答案:C
43、 狭义的教育测量属于 (分数:100分) A. 物理测量 B. 社会测量 C. 生理测量 D. 心理测量
正确答案:D
44、对学生的观察、识记、分析、判断、推理等思维活动能力的测量属于 (分
数:100分) A. 智力测验 B. 能力倾向测验 C. 成就测验 D. 人格测验
45、对学生绘画能力的测验属于 (分数:100分) A. 智力测验 B. 能力倾向测验 C. 成就测验 D. 人格测验
46、
对学生学业成绩进行的测验属于
(分数:100分) A. 智力测验 B. 能力倾向测验 C. 成就测验 D. 人格测验
47、对学生性格的测验属于 (分数:100分) A. 智力测验 B. 能力倾向测验 C. 成就测验 D. 人格测验
48、年龄量表常用来测量学生的 (分数:100分) A. 学业成绩 B. 智力发育 C. 潜在能力 D. 兴趣爱好
49、用优、良、中、差来测量学生的作业时所使用的量表属于A. 百分量表 B. 等级量表 C. 年龄量表 D. T量表
50、教育测量的度量单位是 (分数:100分) A. 迷糊的
正确答案:A
正确答案:B
正确答案:C
正确答案:D
正确答案:A
100分) 正确答案:B
(分数:B. 复杂的 C. 相对的 D. 绝对的
正确答案:C
51、强调通过评价判断教育目标或计划的实现程度。属于下列哪种观点? (分数:100分) A. 注重效果 B. 注重方法 C. 注重信息 D. 注重过程
正确答案:A
52、强调通过评价收集资料,为教育决策服务。属于下列哪种观点? (分数:100分) A. 注重效果 B. 注重信息 C. 注重方法 D. 注重过程
正确答案:B
53、在单元教学、学期或学年开始时进行的评价属于 (分数:100分) A. 诊断性评价 B. 形成性评价 C. 总结性评价 D. 比较性评价
正确答案:A
54、
在教学活动进行中的评价属于 (分数:100分) A. 诊断性评价 B. 形成性评价 C. 总结性评价 D. 比较性评价
正确答案:B
55、在一项活动、一门学科或一个学期结束时进行的评价属于 (分数:100分) A. 诊断性评价 B. 形成性评价 C. 总结性评价 D. 比较性评价
正确答案:C
56、
评价的目的在于比较个体在团体中的位置,这种评价属于
(分数:100分) A. 比较性评价 B. 常模参照性评价 C. 目标参照性评价 D. 标准参照性评价
正确答案:B
57、定量评价的结果 (分数:100分) A. 不精确具体 B. 比较模糊 C. 主观性强 D. 说服力增强
正确答案:D
58、国内外不少学者认为,教育测量起源于 (分数:100分) A. 英国的选拔官吏制度 B. 中国的科举考试制度 C. 美国的“八年研究” D. 德国的莱比锡心理实验室
正确答案:B
59、《乡村小学比赛表》的起草者是 (分数:100分) A. 赵叔寓 B. 陶行知 C. 陈玉琨 D. 王汉澜
正确答案:B
60、发表研究成果报告《“八年研究”的历程》的是 (分数:100分) A. 桑戴克 B. 麦柯尔 C. 泰勒 D. 艾钦
正确答案:D
61、被称为“智力测验鼻祖”的是 (分数:100分) A. 桑戴克 B. 泰勒 C. 比纳 D. 艾钦
正确答案:C
62、被称为“教育测量鼻祖”的是 (分数:100分) A. 泰勒
B. 桑戴克 C. 艾钦 D. 比纳
正确答案:B
63、被称为“教育评价之父”的是 (分数:100分) A. 泰勒 B. 比纳 C. 桑戴克 D. 艾钦
正确答案:A
64、 “第四代教育评价”者认为,第一代教育评价属于 (分数:100分) A. 测量时代 B. 描述时代 C. 判断时代 D. 构建时代
正确答案:A
65、 “第四代教育评价”者认为,第二代教育评价属于
(分数:100分) A. 测量时代 B. 描述时代 C. 判断时代 D. 构建时代
正确答案:B
66、“第四代教育评价”者认为,第三代教育评价属于
(分数:100分) A. 测量时代 B. 描述时代 C. 判断时代 D. 构建时代
正确答案:C
67、 我国教育法规定的两项基本教育制度是 (分数:100分) A. 教育督导制度和教育评价制度 B. 教育评价制度和教育测量制度 C. 教育测量制度和教育视导制度 D. 教育视导制度和教育评估制度
正确答案:A
68、 在估计信度时,对单个测量结果进行比较,需要用下列哪种方法确定? (分数:100分)
A. 绝对误差 B. 相对误差 C. 平均数 D. 计算方差
正确答案:A
69、在估计信度时,对两种以上测量结果的比较,需要用下列哪种方法进行确定? (分数:100分) A. 绝对误差 B. 相对误差 C. 平均数 D. 计算方差
正确答案:B
70、 在估计信度时,对一组人的测量,需要用下列哪种方法进行确定? (分数:100分) A. 绝对误差 B. 相对误差 C. 平均数 D. 计算方差
正确答案:D
71、重测信度需要 (分数:100分)
A. 用同一个量表对同一组被试先后实测两次 B. 用不同的量表对同一组被试先后实测两次 C. 用同一个量表对两组被试先后实测两次 D. 用不同的量表对两组被试先后实测两次
正确答案:A
72、 复本信度需要 (分数:100分) A. 用同一个量表对同一组被试先后实测两次 B. 用不同的量表对同一组被试先后实测两次 C. 用同一个量表对两组被试先后实测两次 D. 用不同的量表对两组被试先后实测两次
正确答案:B
73、 当测验题型较多,并非都是二分计分题时,估计测验的信度采用 (分数:100分)
A. 库德尔—查理逊信度公式 数公式?B. 克龙巴赫系 C. 积差相关系数公式
D. 斯皮尔曼等级相关系数公式
正确答案:B
74、
估计标准参照测验信度的关键是,在测验中要确定一个
(分数:100分) A. 效标 B. 决断分数 C. 参照点 D. 测验目标
正确答案:B
75、在测量中,实得分数可以表示为 (分数:100分) A. X=V+I+E B. X=T+I+E C. X=V-I-E D. X=T-I-E
正确答案:A
76、下列适合于内容效度的测验是 (分数:100分) A. 能力倾向测验 B. 人格测验 C. 成就测验 D. 动机测验
正确答案:C
77、一次选拔考试,共70人参加,通过测验选取了50人,淘汰了20人。在
选出的人中,只有40人合格;而在淘汰的人中,实际上只有8人是不合格。那么,该测验的负命中率是 (分数:100分)
A. 0.69 B. 0.8 C. 0.4 D. 0.2
正确答案:C
78、 一次选拔考试,共70人参加,通过测验选取了50人,淘汰了20人。
在选出的人中,只有40人合格;而在淘汰的人中,实际上只有8人是不合格。那么,该测验的正命中率是 (分数:100分)
A. 0.69 B. 0.8 C. 0.4 D. 0.2
正确答案:B
79、 区分度与信度的关系是 (分数:100分) A. 信度随区分度的提高而增长 B. 信度随区分度的提高而减小 C. 区分度随信度的提高而增长 D. 区分度随信度的提高而减小
正确答案:A
80、区分度与难度的关系是 (分数:100分) A. 难度越接近0,题目的区分度越大 B. 难度越接近1.00题目的区分度越大 C. 难度越接近0.50,题目的区分度越大 D. 难度越接近0.50,题目的区分度越小
正确答案:C
81、 编制测验分数的次数分布过程中,一般情况下,确定组限时 (分数:100分)
A. 上线包括在本组中,下线不包括在本组中 B. 上线包括在本组中,下线也包括在本组中 C. 上线不包括在本组中,下线包括在本组中 D. 上线不包括在本组中,下线也不包括在本组中
正确答案:A
82、 一个学生的测验成绩为80分,经换算,其百分等级分数为73,则表示参加测验的学生中 (分数:100分) A. 有73%的学生低于80分 B. 有27%的学生低于80分 C. 80分超过全体人数的27% D. 80分低于全体人数的73%
正确答案:A
83、 某班语文测验的平均成绩是80分,标准差分别是10。已知某生考了85分,则该生的标准分数是 (分数:100分) A. -0.5 B. 0.5 C. 0.8 D. 0.9
正确答案:B
84、 是谁在1956年制订了教育目标的分类系统? (分数:100分) A. 汉密尔顿 B. 辛普森 C. 克拉斯沃尔 D. 布鲁姆
正确答案:D
85、 根据答案的来源不同,可以将测验试题分为 (分数:100分) A. 选择题和供答题
B. 主观性试题和客观性试题 C. 是非题和匹配题 D. 简答题和论述题
正确答案:A
86、 根据被试作答的范围和评分方法不同,可以将测验试题分为 (分数:100
分)
A. 选择题和供答题 B. 是非题和匹配题
C. 主观性试题和客观性试题 D. 简答题和论述题
正确答案:C
87、在一个全为四重选择题的测验中,每题1分,某生答错30道题,应倒扣 (分数:100分) A. 0分 B. 10分 C. 13分 D. 30分
正确答案:B
88、 从结构上分析,教育评价表主要由三部分组成,即 (分数:100分) A. 评价指标、指标权重和评价方法 B. 评价指标、评价标准和评价结果 C. 评价指标、评价方法和评价结果 D. 评价指标、指标权重和评价标准
正确答案:D
89、将评价对象与同类集体内其他对象相比较而做出评价的方法是 (分数:100分) A. 绝对评价 B. 相对评价 C. 横断评价 D. 纵断评价
正确答案:B
90、把被评价者的过去和现在进行比较,从而做出评价的方法是 (分数:100分) A. 绝对评价 B. 相对评价
C. 个体内差异评价 D. 相互参照评价
正确答案:C
91、
重视听取教育方案和教育活动的争议意见,尤其是反对的意见。这种评价模式是
(分数:100分) A. 对手模式 B. 应答评价模式 C. 目标游离模式 D. 系统分析评价模式
正确答案:A
92、 在编制教育评价表时,确定评价指标的依据是 (分数:100分) A. 评价标准 B. 教育目标 C. 评价目标 D. 教育现状
93、 经典测验理论的理论基础是 (分数:100分) A. 信度与效度理论 B. 难度与区分度理论 C. 真分数模型 D. 特征曲线模型
94、一组数据中各标准分数的平均数等于 (分数:100分) A. 1 B. 0.5 C. 0 D. -1
95、一组数据中各标准分数的标准差等于 (分数:100分) A. 1 B. 0.5 C. 0 D. -1
96、韦氏智力量表中,表示离差智商的公式是 (分数:100分) A. IQ=50+10Z B. IQ=100+15Z C. IQ=90+20Z D. IQ=5+2Z
97、百分等级的分布呈矩形,它与正态分布的关系是 (分数:100分)A. 互补关系 B. 包含关系 C. 传递关系 D. 一一对应
98、下列哪种组合分数的方法具有互偿性 (分数:100分) A. 多重选择
正确答案:C
正确答案:C
正确答案:C
正确答案:A
正确答案:B
正确答案:D
B. 多重回归 C. 连续选择 D. 加权求和
正确答案:B
99、在一次测验后,选取高分组和低分组的被试各100人,其中高分组有70人答对第一题,低分组有40人答对第一题,则第一题的难度是 (分数:100分) A. 0.7 B. 0.4 C. 0.55 D. 1.1
正确答案:C
100、把被评价者自身的若干侧面相比较,从而做出评价的方法是 (分数:100分)
A. 绝对评价 B. 相对评价
C. 个体内差异评价 D. 标准参照评价
正确答案:C
多选
一、多项选择题
1、 符合标准分数特性的是 (分数:100分) A. 以标准差为单位 B. 有绝对零点作参照点 C. 等距量数 D. 具有可比性 E. 具有可加性
正确答案:ABCDE
2、 下列使用绝对参照点的测量是 (分数:100分) A. 长度测量 B. 学习成绩测量 C. 温度测量 D. 体重测量 E. 地势高度测量
正确答案:AD
3、 下列测量属于生理测量的是 (分数:100分) A. 对人的职业兴趣的测量
B. 对动植物各种化学成分含量的测量 C. 在民意调查中所进行的测量 D. 对人体生理机能的测量
E. 对人的智力的测量
正确答案:BD
4、 对于教育评价,国际上具有代表的观点是 (分数:100分) A. 注重效果 B. 注重价值 C. 注重信息 D. 注重过程 E. 注重方法
正确答案:ABCDE
5、 以估计效度的方法为标准,可以把效度分为 (分数:100分) A. 逻辑效度 B. 内容效度 C. 结构效度 D. 统计效度 E. 校标关联效度
正确答案:AD
6、 1956年,布鲁姆制定出了教育目标的分类系统,他把教育目标分为 (分数:100分)
A. 认知领域的目标 B. 社会领域的目标 C. 情感领域的目标 D. 经济领域的目标 E. 动作技能领域的目标
正确答案:ACE
7、 从直观上看,如果一个测验具有适宜的难度,需要具备的条件有 (分数:100分) A. 测验分数呈标准正态分布 B. 测验分数的全距大 C. 没有零分或满分 D. 难度系数为0.5
E. 平均分数在测验分数分布范围的中间或接近中间的位置上
正确答案:BCE
8、 如下所列举的测验,通常需要用内部一致性分析方法的是 (分数:100分) A. 单一的学科测验 B. 多门学科的综合测验 C. 某种独立的智力因素 D. 综合的智力测验 E. 人格测验
正确答案:AC
9、 下列哪种行为是评价者在评价程序中可能产生的心理行为 (分数:100分) A. 角色心理
B. 晕轮心理 C. 期望心理 D. 同行心理 E. 成见心理
正确答案:ABCDE
10、 费用——效果分析评价的主要方法有 (分数:100分) A. 费用——效益法 B. 费用——成本法 效果法??C. 费用 D. 费用——成就法 E. 费用——效用法
正确答案:ACE
11、 下列使用相对参照点的测量是 (分数:100分) A. 长度测量 B. 学习成绩测量 C. 温度测量 D. 体重测量 E. 地势高度测量
正确答案:BCE
12、 根据测量的不同水平以及测量中使用的不同单位和参照点,把测量量表分为 (分数:100分) A. 命名量表 B. 顺序量表 C. 等距量表 D. 比率量表 E. 智商量表
正确答案:ABCD
13、 下列测量属于心理测量的是 (分数:100分) A. 对物体运动速度的测量
B. 对动植物各种化学成分含量的测量 C. 在民意调查中所进行的测量 D. 对人的职业兴趣的测量 E. 对人的智力的测量
正确答案:DE
14、 内容效度主要适用于 (分数:100分) A. 智力测验 B. 人格测验 C. 成就测验 D. 能力倾向测验
E. 某些用于选拔和分类的职业测验
正确答案:CE
15、 对于一个测验来说,有鉴别力的区分度系数是 (分数:100分) A. -1 B. -0.5 C. 0 D. 0.5 E. 1.0
正确答案:DE
16、 符合标准分数特性的是 (分数:100分) A. 平均数为0 B. 标准差为1 C. 最大值为+3 D. 最小值为-3 E. 线性变换
正确答案:ABCDE
17、 情感领域的教育目标有 (分数:100分) A. 注意 B. 领会 C. 反应 D. 分析 E. 评价
正确答案:AC
18、 如下所列举的测验,通常需要用项目效度分析方法的是 (分数:100分) A. 单一的学科测验 B. 多门学科的综合测验 C. 某种独立的智力因素 D. 综合的智力测验 E. 人格测验
正确答案:BDE
19、 被评价者在评价程序中可能产生的心理行为主要有 (分数:100分) A. 疑惧心理 B. 被审心理 C. 拒绝心理 D. 逢迎心理 E. 责备心理
正确答案:ABCDE
20、 教育评价中常用的观察法有 (分数:100分) A. 自然观察法 B. 时间样本观察法 C. 情境样本观察法
D. 追踪观察法 E. 为观察法
21、 测量的基本要素有 (分数:100分) A. 测量的参照点 B. 测量的内容 C. 测量的量表 D. 测量的单位 E. 测量的手段
22、 导致测量误差的因素主要有 (分数:100分) A. 测量仪器和设备的精确程度 B. 所测事物的一致性程度 C. 测量者的认识程度 D. 测量参照点的选择程度 E. 测量环境的差异程度
23、 下列测量属于社会测量的是 (分数:100分) A. 对物体运动速度的测量
B. 对动植物各种化学成分含量的测量 C. 在民意调查中所进行的测量 D. 对人的职业兴趣的测量 E. 对全国人口进行普查
24、 枯巴、林肯认为,‘四代评价’所采用的最基本的方法是A. 实用主义方法
B. 应答性(资料)收集法 C. 构建主义方法 D. 科学主义方法
E. 文献综述性(资料)收集法
25、 结构效度主要适用于 (分数:100分) A. 智力测验 B. 人格测验 C. 成就测验 D. 能力倾向测验
E. 某些用于选拔和分类的职业测验
阶段测验
正确答案:ABCD
正确答案:ACD
正确答案:ABC
正确答案:CE
100分) 正确答案:BC
正确答案:AB
(分数:填空 1. 总结性 2. 客观性测验 3. 指标权重 4. 测量目的 5. 校标关联 6. -0.3 7. 教学效果 8. 心理 9. 教育评估 10. 同质性 11. 0.4 12. 精神特性 13. 人为 14. 诊断性 15. 方差 16. 知识点 17. 重测 18. 八年研究 19. 数量化 20. 心理行为 21. 项目识别度
22. 评价标准 23. 组合分数 24. 投射测验 25. 输入评价 26. 定量 27. 形成性 28. 教育督导 29. 相对误差 30. 校标污染 31. 复本信度 32. 结构效度 33. 知识 34. 评价过程 35. 整理分数 36. 有效识别 37. 成果评价 38. 随机误差 39. 连续体 40. 绝对误差 41. 相对性 42. 待查分数 43. 评价指标
44. 过程评价 45. 论文测验 46. 相等 47. 名称 48. 评价标准 49. 认知 50. 标准差 名词解释
1. 评分信度:指评分得分可靠性程度。即指不同人评定同
一份试卷或同一人在不同时间评定同一份试卷所得分数的一致性程度。
2. 教育测量就是一度一定的发展对教育活动中的某一现
象给予数量化的描述,也就是说是对学生的学习能力学业成绩兴趣爱好思想品德一级教育措施上血多问题的数量化测定。
3. 教育评价是根据一定的目的和标准,采取科学的态度和
方法,对教育工作中的活动人员管理和调节的状态与绩效,进行质和量的价值判断。
4. 校标关联效度是指测验分数与作为校标的另一独立测
验结果之间的一致性程度。
5. 百分等级分数是针对原始分数而言的,他是指在一个群
体性测验中,低于这个原始分数的人数占总人数的百分比。
6. 标准分数是将原始分数与其所在团体的平均分数之差
除以标准差所得的商。
7. 期望心理是指评价者以预先对被评价者所产生的期望
来进行评价。
8. 晕轮效应是指在个体的认知过程中将知觉对象的眸子
印象不加分析地扩展到其他方面的一种心理行为。 9. 评价标准是衡量评价对象达到评价质保要求的尺度,判
断其是否达到或在多大程度上达到了目标的要求。 10. 问卷法是评价者根据评价质保的要求,提出一些问题,
拟好题目和表格,以问卷的形式进行调查,通过调查对象作题来搜集评价信息的方法。
11. 情景样本观察法是指评价者根据评价的项目,宣纸和设
计一定的情景,对评价对象的行为表现进行针对性观察的一种方法。
12. 访谈法是评价者通过与评价对象的知情者面对面谈话,
直接收集资料的一种方法。
13. 统计分析法就是通过数学的方法对教育评价资料进行
分析和比较、统计等的方法,它通常用于对测量资料的分析。
14. 个案研究法是评价者根据评价指标的要求为了了解教
育活动中某一方面的情况通过对某个个体的发展变化研究以获取有关资料的方法。
15. 文献研究法是评价者通过查阅有关评价对象的文献,以
获取评价资料的方法
16. 绝对评价是根据既定的客观标准,将评价对象与客观标
准进行比较,从而评定其优劣。
17. 相对评价是指评价对象与同类集体内其他对象相比较
而做出评价的方法。
18. 个体内差异评价是把被评价者的过去和现在进行比较,
或把被评价者的自身的若干侧面相比较,从而做出评价的一种方法。
19. 常模即使从某一总体中抽取的被试样本在该测验上得
分分布,以常模团体的平均数为参照点,将个体分数标定在高于或低于参照点的某一位置,以确定该被试在团体中的相对位置。
20. 平行测验指在试题格式、题数、难度、指导语说明、施
测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验,称为复本测验,也叫做平行测验。
21. 标准化指对测验实施程序、对象范围、施测环境、施测
方式、测验时限、分数解释作了统一规定,使测验能够
在异时、异地,不同的主试等条件下进行,并能得到相等有效的测验结果。
22. 评分者信度是指多个评分者给同一份试卷进行评分的
一致性程度。
23. 复本信度:指用两个平行测验测量同一批被试所得结果
的一致性程度。
24. 测量的两倍是指测量事物的某种属性,并确定该属性的
数量的连续体。
25. 客观标准化测验:简单的说就是根据一定的目的,认真
细致的编制测验量表,科学地规定出标准答案和给分标准,对大量的被试进行测验,再按年龄或者年级分别求出各年龄或各年级在测验中所得成绩分数的平局数和成绩分数分布情况,而后,以此为标准来衡量以后的被试者所得成绩。 简答题
1. 教育评价方案的内容有哪些?1、评价的对象和目的要
求2、评价的组织和领导3、评价指标体系4、评价方法和程序5、评价的时间安排6、评价的注意事项 2. 一个理想的测量单位需要具备哪些条件?1、要有确定
的意义;2、要有相等的价值
3. 简述评分者本身因素而降低评分信度的主要表现?1、
评分者知识水平的影响2、评分者心理状况的影响3、
评分者个人倾向的影响4、各种效应的影响5、评分者工作态度的影响。
4. 答案:个体内差异评价充分注意了个体的差异和发展,
能使评价者和被评价者准确了解到个体的有优势和弱点以及努力的方向,在评价过程中不会给被评价对象造成很大压力,适合于因材施教;它既不与客观标准相比较,也不与别人相比较,故容易使评价对象坐井观天自我满足。
5. 答案:1、强调评价的判断功能,把评价作为实现目标
管理的手段;2、强调评价的决策服务功能。 6. 答案:1、因为学生是活生生的人,学生的精神时刻在
发生变化,不易控制;2、因为对学生精神特性的测量不能采取直接的方法,只能通过他的动作外在的表现简介地测量;3、因为对学生精神特性的测量结果不像物理特性的测量那样精确稳定。
7. 1、教育评价具有较大的包容性;2、教育评价具有多
主体性;3、教育评价具有整合性。
8. 1、获得校标的时间不同;2、目的和作用不同 9. 1、科学性与异向性原则2、完备性与独立性原则3、
发展性与整体性原则4、操作性与可测性原则5、科学性与可比性原则6、超前性与持续性原则
10. 绝对评价的优点:其一,如果评价的标准设置的准确,
则只要将评价对象与标准相对照就能够判断其价值状况。其二,如果评价标是准确的则评价之后每个评价对象就很清楚地明确自己与客观标准的差距,从而可以对评价者起到激励的作用。绝对评价的不足之处:评价标准的设置容易主观,很难做到客观。
11. 1、信度高是小杜高的必要而非充分条件;2、测验的
效度受它的信度制约。
12. 优点:其一,相对评价由于是同类事物比较所以比较容
易掌握。其二,相对评价各等级的价值意义比较明确,易于鉴定被评价对象的优劣,可以作为评价的依据。不足:其一,容易降低客观标准。其二,相对评价的结果并不表示被评价对象的实际水平,只表示其在该集合中所处的位置。
13. 1、测量的仪器和设备;2、所测量的事物缺乏一致性;
3、测量人的因素。
14. 1、表示一个分数在团体中的位置;2、比较一个人两
种学科测验或两次不同测验的成绩;3、比较两个团体的成绩。
15. 1、通常是指人们对客观事物进行某种数量化的测定。
2、实际上就是依据一定的法则使用量具对事物的特征进行定量描述的过程,
16. 1、两者着眼点不同;2、两者特点不同;3、两者复杂
程度不同。
17. 1、学校应该达到哪些教育目标;2、提供哪些教育经
验才能实现这些目标;3、怎样才能有效地组织这些教育经验;4、我们怎样才能确定这些目标正在得到实现。 18. 假设一:真分数具有不变性。假设二:误差是完全随机
的。假设三:观测分数是真分数与误差分数的和。 19. 题目间的一致性有两层含义:其一,是指所有题目测的
是同一种心理特质;其二,是指所有题目得分之间都具有较高的正相关。
20. 一份高质量的测验双向细目表具有两个基本的作用:其
一,保证测验试题是所测量的教学内容的代表性样本,且能反映出部分内容之间的相对重要性,以便测验内容取样适当提高测验的效度。其二,规划代表不同知识内容和学习水平的各类测验目标的比例分配在保证测验效度的同时保证测验的难度合理。 计算
1. PR=100-(100×10-50)/100=该生此次数学测验
的百分等级分数是90.5,说明此次数学测验低于80分的学生人数占总人数的90.5%。
2. 该生生物成绩为:85×30%+90×50%+100×
20%=90.5分
3. 1、评价指标集U;2评价指标权重W;3、评价等级
对应赋值V=(2,1,-1,-2);4、评价结果模糊矩阵;5计算评价结果:首先将评价指标权重集W与评价结果模糊矩阵R相乘得B=W*R,其次把矩阵B与评价等级赋值集V相乘得A=B*V=0.89,0.89接近较好的等级,说明该生的综合素质较好。
4. 该生语文标准分Z语文=(80-85)/10=-0.5,数学标
准分Z数学=(70-82)/15=-0.8,该生的数学成绩好于语文成绩
5. 该生数学标准分Z数学=(80-75)/7=0.71语文标准
分Z语文=(78-70)/5=1.6,该生语文成绩由于数学成绩
6. V1=1/(100-1)×100%=1%,V2=1/(180-1)
=0.56%,测量成人身高的信度大于测量儿童身高的信度。
7. 甲学生成绩为:75×60%+85×40%=78,乙学生成
绩为:85×60%+75×40%=81,乙省成绩优于甲生 8. a=4,b=5,c=4,d=87,d/(a+b+c+d)=87/
(4+5+4+87)=0.87,该测验的内容效度是0.87,效度相对较高。
9. Y=X/(M-1)=3/(4-1)=1,答错一题应扣一分。 10. 1、计算每份试卷被评等级之和R,2、计算T和∑T
T=(33-3)/12=2;3、计算其他统计量,k=3,N=4, ∑R=7+4+11+5=27,∑R2=72+42+112+52=211;4、计算肯德尔和谐系数,S=211-272/4=28.5,W=28.5/{1/12[32(43-4)]-3×2.5}=0.64 作业
1. 论述题试述我国学校教育评价模式存在的问题。
答案:第一,现有的模式尚不够成熟、完善。突出表现在测量技术和测量手段的落后,有重原则讨论、轻技术研究的倾向。
第二,现有的模式比较单一、死板,不够丰富、灵活。在评价研究领域中,重视评价在宏观领域的应用研究,忽视评价在微观领域的应用研究。在评价指导思想上,重要求,轻需求
在评价目的上,重视评价的鉴定,评优功能,五十评价的诊断,检查功能。在评价研究分方法论上,侧重从管理的角度多,重量化技术,轻其他领域的开拓。在测试方法上,试题编制比较简单、死板,指注重指标设计的完善,强调全面准确地体现需求,而忽视有针对性的、灵活的从解决时间问题出发编制试题。
2、论述题什么是评分信度?影响评分信度的因素及其表现主要有哪些? 答案:评分信度是指评分的可靠性程度。即指不同人评定同一份试卷或同一个人在不同时间评定同一份试卷所得分数的一致性程度。
影响因素及主要表现:(1)评分者知识水平的影响;(2)评分者心理状况的影响;(3)评分者个人倾向的影响;(4)各种“效应”的影响;(5)评分者工作态度的影响。 3论述题何谓信度?信度的作用有那些?如何理解信度的涵义?
答案:信度是指测量结果的稳定性程度或可靠性程度。换句话说,若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量结果之间的一致性程度。 信度的作用:1.信度是测量过程中所存在的随即误差大小的反映;2.信度可以用来解释个人测验分数的意义;3.信度可以帮助进行不同测验分数的比较。
信度的涵义:1.信度是指实测值和真值相差的程度;2信度是指统计量与参数之间的接近程度;3.信度是指一种测验先对的被试者再次测验时引起的同样反应的程度。 4、论述题:试述现代教育测量与评价的主要功能。
答案:(一)实现教育判断功能:1.测量评定功能;2.事实判断功能;3.价值判断功能;4.问题诊断功能;5.区分选拔功能。(二)改进教师教学功能:1.了解学生起点行为的诊断功能;2.改进教学的参考和补救功能;3.实现教学目标的决策功能。(三)促进学生学习的功能:1.激励学生的学习动机;2.帮助学生记忆和促进知识迁移;3.促进学生自我评价。(四)形式教育管理的功能:1.对教师的管理;2.对目标的管理;3.对过程的管理。 5、论述题举例说明选择测验结果作为效标的依据是什么?
答案:1.依据本测验的目的为转移。如果本测验以预测学生升学为目的,那么学生升学考试的分数即为校标。2.因时间不同而不同。本测验的目的是检察师范生的学习成绩,在学生毕业前可采用各科考试分数为校标,而学生毕业当了老师,则采用所学学科的学生成绩、学生操行或健康水平为校标。
1、 关键字:【不够成熟|不过硬|重原则|轻技术|单一死板|指导思想|评价的目|评价研究|测试方法|指标设计】 分 数:【10|10|10|10|10|10|10|10|10|10】 2、论述题 什么是评分信度?影响评分信度的因素及其表现主要有哪些? 关键字:【不同人|评定|同一份试卷|分数|一致性|知识水平|心理状况|个人倾向|各种效应|工作态度 】 分 数:【10|10|10|10|10|10|10|10|10|10】 3、论述题 何谓信度?信度的作用有那些?如何理解信度的涵义? 关键字:【测量结果|稳定性|随即误差|测验分数|实测值|真值|统计量|总体参数|再次测验|同样反应】 分 数:【10|10|10|10|10|10|10|10|10|10】 4、论述题 试述现代教育测量与评价的主要功能。 关键字:【教育判断|测量评定|事实判断|价值判断|问题诊断|区分选拔|改进教学|学生学习|学习动机|自我评价】 分 数:【10|10|10|10|10|10|10|10|10|10】 5、论述题 举例说明选择测验结果作为效标的依据是什么? 关键字:【本测验|目的|转移|升学|分数|校标|时间|不同|教师|学生成绩】 分 数:【10|10|10|10|10|10|10|10|10|10】