当前位置:首页 » 义务教育 » 教育考试对信度的标准有何要求

教育考试对信度的标准有何要求

发布时间: 2020-11-18 06:59:10

A. 试计算信度及测验标准误各是多少

信度是指测验结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。反之,随机误差可能导致不一致性,从而降低信度

B. 标准误的计算公式

标准误=标准差 / N的根号。标准误差定义为各测量值误差的平方和的平均值的平方根,故又称为均方根误差。

标准误,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。标准误不是标准差,是多个样本平均数的标准差。标准误用来衡量抽样误差。

标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。

(2)教育考试对信度的标准有何要求扩展阅读:

需要注意的是,标准误差不是测量值的实际误差,也不是误差范围,它只是对一组测量数据可靠性的估计。标准误差小,测量的可靠性大一些,反之,测量就不大可靠。进一步的分析表明,根据偶然误差的高斯理论,当一组测量值的标准误差为σ时,则其中的任何一个测量值的误差εi有68.3%的可能性是在(-σ,+σ)区间内。

信度系数与信度指数:

除了测量标准误,通常在理测量中会使用信度系数和信度指数作为指标。

1、信度系数:即信度,一种相关性系数。常为同一受测者样本所得的两组资料的相关。

2、信度指数:也可作为信度系数。信度指数的平方就是信度系数。

C. 什么是心理与教育测量

心理与教育测量大纲/讲义

第一章 心理与教育测量概论
本章考核知识点和考核要求
一、识记
(一)测量的定义:P2
测量是依据一定的法则,使用量具对事物的特征进行定量描述的过程。
(二)测量的基本要素:P4
任何测量都必须具备两个基本要素,即测量的参照点和测量的单位。
(三)心理与教育测量的定义:P6—7
依据一定的心理学和教育学理论,使用测验对人的心理特征和教育成就进行定量描述的过程。
二、领会
(一)测量量表的4种类型:P5
命名表、顺序量表、等距量表、比率量表
(二)心理测验的4个基本条件:P9—12
1、行为样本 2、标准化 3、难度或应答率 4、信度和效度
(三)心理测验的5种不用分类:P12—14
1、按测量对象所作的分类:
智力测验、能力倾向测验、成就测验、人格测验
2、按测量方式所作分类:
个别测量、团体测量
3、按测验内容的形式所作的分类:
文字测验、非文字测验
4、按测验功能所作的分类:
成就测验与预测测验、难度测验与速度测验、描述测验与诊断测验
5、按评价所参照的标准分类:
常模参照测验、目标参照测验、潜力参照测验

第二章 心理与教育测量的产生与发展
考核知识点与考核要求
一、识记:
(一)高尔顿的主要贡献:P28
1、英国优生学的创始人。出版了《遗传的天才》一书,提出人的能力是由遗传而来的,其差异是可以测量的。
2、1884年,成立“人类测量实验室”,被视为第一个大规模系统测量人的个别差异的尝试。
3、发明了许多测量仪器;是应用评定量表、问卷法、自由联想法的先驱。
4、最重要的贡献之一是把统计方法应用到对个别差异资料的分析之中。
(二)卡特尔的主要贡献:P28
美国心理学家,1890年,首次提出“心理测验”这一术语,他的许多观点都已成为测量学上的重要观点。
(三)比内的主要贡献:P29
法国心理学家,1904年,与其助手西蒙合作完成了世界上第一个智力测验量表——比内—西蒙量表。
二、领会:
西方心理学与教育测量的发展:P30
1、智力测验的发展
2、能力倾向测验的发展
3、成就测验的发展
4、人格测验的发展

第三章 经典测验理论的基本假设
考核知识点与考核要求
一、识记
(一)测量误差:P40
指在测量过程中由哪些与测量目的无关的变化因素所产生的一种不确定或不一致的测量效应。
(二)随机误差:P40
由与测量目的无关的、偶然因素引起的又不易控制的误差。
(三)系统误差:P40
是那种由与测量目的无关的变因引起的一种恒定而有规律的效应。
(四)真分数:P42
把反映被试某种心理特质真正水平的那个数值称为该特质的真分数,简称T分数。
(五)平行测验:P43
如果两个题目不同的测验测的是同一特质,并且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布都是一致的,则这两个测验被称作平行测验。
二、领会:
(一)测量误差的三个主要来源:P41
测量工具、被测对象、施测过程
(二)观察分数、真分数和随机误差之间的关系:P42—43
观察分数是指实测的分数,它们的关系是:
观察分数被假定等于真分数与误差分数之和,二者关系被假定为线性关系,随机误差服从均值为零的正态分布,它独立与真分数。

第四章 测量信度
考核知识点与考核要求
一、识记
(一)信度的含义及测量学的定义:
1、信度的含义:P45指测量结果的稳定性程度,也测量的可靠性。
2、信度的测量学定义:P46乃是一个X(A卷)与它的任意一个平行测验X/(B卷)的相关系数。即RXX=PXX’
(二)重测信度的含义:P48
指用同一个量表对同一组被测试施测两次所得结果的一致性程度。
(三)复本信度的含义:P49
指两个平行的测验测量同一批被试所得结果的一致性程度。
(四)分半信度的含义:P50
指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
(五)同质性信度的含义:P51
指多个评分者给同一批人的答卷进行评分的一致性程度。
二、领会:
(一)信度的作用:P47
1、信度是测量过程中所存在的随机误差大小的反映。
2、信度可以用来解释个人测验分数的意义
3、信度可以帮助进行不同测验分数的比较。
(二)重测信度的使用条件:P48
(三)复本信度的使用条件:P49
(四)分半信度的使用条件:P50—51
(五)同质信度的使用条件:P51
(六)影响信度的因素:P55
被测、主试、施测情境、测量工具、两次施测的间隔时间
(七)提高信度的方法:P56
1、适当增加测验的长度,
2、使测验中所有试题的难度接近正态分布,并控制在中等水平,
3、努力提高测验试题的区分度,
4、选取恰当的被试团体,
5、主试者严格执行实测规程,评分者严格按标准给分,减少无关因素的干扰。
三、应用
(一)能用克龙巴赫系数计算项目的同质性信度
克龙巴赫α系数 P52 公式、例题
(二)能用肯德尔和谐系数计算评分这信度
P53 公式 P54 举例
(三)通过增加题目长度来提高测验的信度。
P56

第五章 测量效度
考核知识点与考核要求
一、识记
(一)效度的含义:P59
指一个测验或量表时间能测出其所要测的心理特质的程度。
(二)效度的测量学定义:P60
在一系列测量中,与测量目的有关的真实变异数与总变异数(实得变异数)的比率。即
效度=SV2/RXY2
(三)内容效度的含义:P62
指一个测验时间测到的内容与所要测量的内容之间的吻合程度。
(四)结构效度的含义:P63
是指一个测验实际测到所要测量的理论结构和特质的程度。
(五)实证效度的含义:P66
指一个测验对处于特定情境中的个体的行为进行估计的有效性。
(六)效标的含义:P67
就是衡量一个测验是否有效的外在标准。
二、领会
(一)效度的特点:P59
1、效度是一个相对的概念
2、效度是测量的随机误差和系统误差的综合反映
3、判断一个测量是否有效要多个方面搜集证据。
(二)效度与信度的关系:P61
1、信度是效度高的必要而非充分的条件
2、测验的效度受它的信度制约
(三)三种效度的适用范围:
1、内容效度的适用范围P62
成就测验、职业测验
2、结构效度的适用范围P63
智力测验、人格测验等
3、实证效度的适用范围P67
诊断现状、预测个体将来的行为
(四)影响效度的因素P69
测验的构成、实施的过程、被试、所选效标的性质、测量信度
(五)提高效度的方法P70
1、精心编制测验量表,避免出现较大的系统误差
2、妥善组织测验,控制随机误差
3、创设标准的应试情境,让每个被试都能发挥正常的水平
三、应用
三种效度的估计方法
(一)内容效度的确定方法P63
主要是逻辑分析法
(二)结构效度的确定方法P64
1、测验内部寻找证据法
2、测验之间寻找证据法
3、考察测验的实证效度法
4、多种特质——多种方法矩阵法
(三)实证效度的确定方法P68
1、相关法 2、区分法 3、命中率

第六章 测验的项目分析
考核知识点与考核要求
一、识记
(一)项目难度的含义:P72
是指测验项目的难易程度。
(二)区分度的含义:P77
是指测验项目对被试心理品质水平差异的区分能力。
二、领会:
(一)难度对测验分数的影响:P76
1、测验难度影响测验分数的分布形态
2、测验难度影响测验分数的离散程度
(二)项目鉴别指数评价题目性能的标准P79 表6—1
(三)区分度的相对性:P85
1、不同的计算方法,所得区分值不同。
2、样本容量大小影响相关法区分值的大小
3、分组标准影响鉴别指数值D
4、被试样本的同质性程度影响区分度值的大小
(四)区分度和难度的关系:P84
1、难度越接近0.50,项目潜在的区分越大
2、难度越接近1.00或0时,项目的潜在区分度越小
三、应用
(一)计算不同形式题目(是非题、选择题、论述题)的难度。P72—74
1、二分法记分形式项目的难度计算P72—73
公式、例题
2、非二分法记分项目的难度计算P73—74
公式、例题
(二)用鉴别指数法计算测验题的区分度P78
鉴别指数的计算P78
公式、例题
(三)根据难度和区分度进行多重选择题的项目分析:P91 表

第七章 测验常模
考核知识点与考核要求
一、识记
(一)原始分数和导出分数的含义 P93
1、被试在接受测验后,根据测验的记分标准,对照被试的反应所计算出的测验分数称作原始分数。
2、在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参考点和单位,且可以相互比较的分数。
(二)百分等级的含义P94
是应用最广的导出分数,是指在一个群体的测验分数中,得分低于这个分数的人数的百分比。就是说,如果将某一被试群体分为一百个等级,则每位被试所占的等级数就是百分等级。
(三)标准分数的含义和种类:P96
1、含义:又称公分数,是将原始分数与团体的平均数之差除以标准差所得的商数。公式。
2、种类:P97-100。T分数、其他形式、标准九分数。
(四)常模团体的含义:P106
是由具有某种共同特征的人所组成的一个群体,或是该群体的一个样本。
二、领会
(一)标准分数的优缺点
优点:P96,它是一个抽象值,不受原始测量单位的影响,并可接受进一步的统计处理。
缺点:公分数由于计算中经常出现负数和小数,且单位过大,因此使用起来不够方便。P97
(二)确定常模团体的注意事项P106-107:共六点
(三)制定常模的过程P108
1、确定测验将用于哪一个群体。
2、对常模团体进行施测,获得团体成员的测验分数和分数分布。
3、确定常模分数类型,制作常模量表,给出书面说明等。
(四)几种主要的常模参照分数P108-110
1、发展量表P108
2、商数P110分式
三、应用
(一)比较几种导出分数的优缺点P94
1、百分等级分数的优缺点P95
2、标准分数的优缺点P96-97
3、T分数的优缺点P98下
(二)计算未分组资料的百分等级
P94 公式、例题

第八章 心理与教育测验的编制与实施
一、领会
(一)心理测验编制的一般程序P117
1、确定测验目的
2、制定编题计划
3、编辑测验项目
4、预测与项目分析
5、合成测验
6、测验标准化
7、鉴定测验
8、编写测验说明书。
(二)编辑测验项目的注意事项P120
共六点
(三)测验标准化应注意的问题:P122
1、测验内容
2、施测过程
3、测验评分
4、测验分数的解释
(四)测验实施过程中应注意的问题:P125
1、施测前的准备工作
2、指导语
3、测验情境
4、测验焦虑
5、与受测者建立良好的协调关系
(五)测验焦虑的相关内容P126
二、应用
(一)项目编排和制作复本的方法
1、项目编排的方法:P121
并列直进式、混合螺旋式
2、制造复本的方法P122
(1)先将所有可用的项目按难度排列,其次序为1、2、3、4、5、6、……
(2)分成两个等值的测验本方法
(3)分成3个等值的没测验本方法
(二)解释测验分数意义时遵循的基本原则P129:共六点
(三)向受测者报告测验分数时的注意事项P131-132共九点
第九章 测验等值
一、识记:
(一)测验等值的含义P135
就是通过对考核同一种心理品质的多个测验形式作出测量分数系统的转换,进而使得这些不同测验形式的测验分数之间具有可比性。这样一套专门技术称为~
(二)锚测验的含义:P138
在测验等值设计中,有时会采用一组测验试题来关联两个待等值的测验形式,以便寻找两形式的等值关系,这些测验试题被称为锚测验。
(二)领会
(一)测验等值的条件P136
1、同质性2、等信度3、公平性4、可递推性5、对称性6、样本不变性。
(二)测验等值结果的表示方法:P140
1、表列法2、公式法3、图示法
三、应用
(一)等百分位等值的计算:P142例题
(二)线性等值的计算P143、公式P144例题
第十章 目标参照测验
一、识记
(一)目标参照测验的含义:P154
当一个测验是以某一明确界定的内容范围为基础编制而成,并且其分数是参照该内容范围所要求的绝对标准进行解释,我们便称这一测验为~
(二)分类一致性信度的含义:P161
对测验的分类一致性的度量指标,称作~
二、领会
(一)双向细目表的构成要素:P154-155
1、教学目标
2、教学内容
3、在整个内容范围中每一类内容和每一种目标结合后,所占的比重(相对重要性)
(二)测验项目区分度的两类指标P159
1、难度差值
2、相关系数
(三)目标参照测验的效度及其估计P163
1、内容效度及评估重要条件
2、效标关联效度的估计——决策效度。
(四)目标参照测验分数分界点确定的几种方法P165
1、专家判是法2、效标组预测法
三、应用
(一)根据测验项目的内容效度分析来决定项目的取舍P155-158
关键词:专家评定法、项目内容评定表、等级评定均值和中位数分析。
(二)测验项目难度差值的计算分析P158
1、难度分析P158下
2、计算——与常模参照测验相同,以通过率表示。P159,难度差值。
(三)比较目标参照测验和常模参照测验的异同。
1、P152-P153 上,两者差异
2、相同点:P168

第十一章 学绩测验
一、 识记
(一) 学绩测验的含义P170
是对个体在某一阶段的学习或训练之后知识、技能的发展水平的测定。
(二) 标准化学绩测验的含义P173
在心理与教育测量学原理指导下,遵循一定的程序所编制的各方面质量都达到规定标准的学绩测验,称为~
(三) 斯坦福成就测验P177
属于综合性学绩考查测验,也是一种供团体使用的常模参照性测验,历史比较长。
二、 领会
(一) 学绩测验的分类P172
1、 按测验的编制方法分
2、 按测验的内容分
3、 按测验用途分
4、 按测验评分的参照系分
5、 按测验的题型分
(二) 标准化学绩测验的基本条件P174
1、 命题组卷标准化
2、 施测标准化
3、 评分标准化
4、 测验分数解释标准化
(三) 标准化学绩测验的编制过程P175-177。共五点
(四) 教师自编课堂测验的特点P182
1、 测验形式灵活多样,与测验目的完全一致
2、 测验内容与教材内容高度一致
3、 测验难度切合学生实际水平
4、 测验编制简易快速。
第十二章 能力测验(上)
一、 识记
(一) 几种智力理论的名称、主要代表人物和观点
1、 智力的心理测量学理论P188
① 主要代表人物
② 主要观点
2、 智力的生物学理论P189
① 主要人物质
② 主要观点
3、 智力的认知心理学理论P190
(二) 三种常用的团体智力测验名称P206
1、 陆军测验
2、 瑞文推理测验
3、 认知能力测验
二、 领会
(一) 比内量表的发展阶段P198-199
1、 比内——西蒙量表的发展阶段
2、 斯坦福——比内量表的发展阶段
(二) 韦氏成人智力量表修订本的构成P201
1、1981年修订版P201
2、中国修订本P202-203
(三)斯比量表和韦氏量表的信度估计
1、斯比量表的信效度估计P199
2、韦氏量表的信效度估计P202
(四)瑞文推理测验的三种水平及其优点P206
1、三种水平:标准推理测验,采图推理测验,高级推理测验
2、优点:P207
三、应用
评价传统智力测验存在的若干问题P192-195
共四大点

第十三章 能力测验(下)
一、领会
(一)能力倾向测验的特点:P211
1、测验的目的
2、测验的编制
3、测验结果的解释
(二)创造力测验的理论基础P222
吉尔福特发散思维的研究

第十四章 人格测量
一、识记
(一)人格测量发展过程中出现几个重要人物P228
1、英国学者高尔顿1884年首倡用科学方法测量人格
2、1892年,克雷培林将联想测验用于临床诊断
3、1919年美国戴德沃斯发表第一个自陈人格量表
4、1920年,罗夏克墨迹测验问世,投射测验由此产生
(二)自陈量表的含义:P230
就是根据要测量的人格特质,编制许多有关的问题,要求受测者根据自己的实际情况逐一回答这些问题,然后根据受测者的答案,去衡量受测者杂一这种人格特质上的表现程度。为完成自陈人格测量而编制的测量工具叫自陈量表。
(三)投射测验的含义:P241
指向受测者提供预先编制的一些未经组织的、意义模糊的标准化刺激情境,让受测者在不受任何限制的情况下,自由地对刺激情境作出他的反应,然后通过分析受测者的反应,推断受测者的人格特质。
三、 领会
(一)自陈量表的编制方法和特点:P230
1、编制方法:是否式、二择一式、是否折中式、文字等级式、数字等级式
2、特点:
①题量较大,多数用于测量人格的若干特质
②通常采用纸笔测验
③记分规则简单客观,施测手续简便,测量分数容易获得解释
(二)明尼苏达人格问卷概况P233
(三) 卡特尔16种人格问卷概况P235
(四) 艾森克人格问卷简介P236
(五) 投射测验的理论假设P242
1、 人们对外部事物的解释性反应都是有其心理原因的,同时也是可以给予说明和预测的。
2、 反应者过去形成 的人格特征,他当时的心理状态以及他对未来的期望会渗透在他对外部刺激的反应过程及结果中。
3、 个人的人格会无意识地渗透在对刺激情境的解释性反应中,因此可以通过测验得以解释。
(六) 罗夏克墨迹测验的四个阶段P243
1、 自由反应阶段
2、 提问阶段
3、 类比阶段
4、 极限测验阶段
(七) 罗夏克墨迹测验概况:P243
(八) 主题统觉测验简介:P245
第十五章 其他心理与教育测验
一、 识记
(一) 状态焦虑的含义P148
是指由紧张、担忧、神经过敏和忧虑所引起的主观感觉和由主性神经系统的唤醒所引起的生理反应。
(二) 物质焦虑的含义P249
是一种比较稳定的人格物质,它存在着个体差异,是一种习得的行为倾向。
二、 领会
(一) 常用的焦虑测验P249
1、 显性焦虑量表(MAS)
2、 状态——物质焦虑量表(STAI)
3、 测验焦虑量表
4、 其他临床焦虑量表
(二) 职业兴趣测验P253
1、 斯特朗职业兴趣问卷
2、 库德职业兴趣调查表
3、 自我指导问卷
(三) 品德和态度测量的常用方法
1、 态度测量方法:P260等距量表法、克利特量表法、哥特曼量表法
2、 品德测量方法:P265情境测验法、问卷测量法等

第十六章 测量的综合应用
一、 应用:
论述心理测量在三个领域中的应用情况及需要补充完善的地方。
(一) 心理测量在心理咨询中的应用:P271
1、 在自我认识、人生规划咨询中的应用
2、 在神经症、人格障碍等咨询中的应用
(二) 心理测量在人事测评中的应用P275
1、 在人的心理特点评估中的应用
2、 人员培训后的心理特点评估
3、 工作人员的效绩评估
(三) 心理测量在教育评价中的应用P281
1、 在测量学生的学习与发展状况中的应用
2、 在教师与管理者评价中的应用
第十七章 心理与教育测量理论的新发展
本章不作考试要求

附录 题型举例
一、 填空题
1、按测量方式所作的分类,心理测量可分为个别测量和 。
2、首次提出“心理测验”这个术语的人是 。
二、单选题
1、在EPQ量表中,反映被试的社会朴实或者幼稚水平的分量表是( )
A 、P量表 B、E量表 C、N量表 D、L量表
2、某一项目上高分组和低分组的通过率分别为0.83和0.43,则该项目的难度是( )
A、0.43 B、0.40 C、0.59 D、0.75
三、名词解释
1、重测信度
2、结构效度
四、简答题
1、简述信度和效度的关系。
2、简述投射测验的基本原理及其特点。
五、计算和分析题
1、某人在一次由80人参加的成就测验中得76分,排名18,则该生成绩(76分)的百分等级是多少?
2、下表为一个由370人参加的测验中的4个题目的项目信息统计结果列表,请您对这4个题目进行项目分析和评价。


号 组别 选答人数 正确
答案 难度P 区分度
A B C D 未答 Rpb D
1 高分组 5 92 1 2 0 B
0.71 0.52 0.42
低分组 22 50 12 16 0
2 高分组 58 10 15 16 1 A 0.42 0.33 0.32
低分组 26 21 15 36 2
3 高分组 17 25 28 28 12 D
0.31 -0.04 -0.06
低分组 25 11 19 34 11
4 高分组 1 44 14 36 5 C 0.12 0.08 0.04
低分组 1 56 10 28 5

七、论述题
联系实际谈谈心理测验在实际工作中有哪些具体应用?

D. 什么是心理测试

“心理测验”一词很容易让人联想到我们一般看到的趣味性心理测试,但它并非真正意义上的心理测验,带有一定的娱乐性。心理测验是对行为样本的客观和标准化的测量,它在鉴别力、因材施教、人才选拔、就业指导、临床诊断等方面具有咨询、鉴定和预测功能的测量工具。 一般来说,编制一个可供使用的标准化的心理测验要经过以下几个步骤:(1)确定测验目的;(2)制定编题计划;(3)编辑测验题目;(4)预测与分析;(5)合成测验;(7)鉴定测验;(8)编写测验说明书。每个心理测验编制完成后,我们需要很多指标来评价和衡量其科学性的高低,其中信度和效度是重要的指标之一。 信度是指测验结果的可靠性或稳定性。换句话说,多次测量结果间的一致程度就叫信度。而效度是指测验能够测量某种特定心理特性的真实性和准确性。简单地理解就是一个心理测验是否有效的程度。对于一个测验而言,效度比信度更为重要。一个心理测验有信度,不一定有效度,但是效度高,信度也一定高。 为了提高测验的信度和效度,对心理测验进行标准化是十分必要的。标准化是指测验的编制、实施、评分和测验分数的解释程序的一致性,以使外界因素对测验结果的影响降到最低。为了使不同被试所获得的分数有比较的可能性,测验的条件对所有的被试必须使相同的,即:对所使用的材料、时间、指导语、例题的解释、测验的情境、对被试的要求等都有明确的规定;对评分也要事先确定标准,不能让评分者完全主观地评分,使得不管谁来评分结果都一样。 心理测验的标准化的另一个方面就是建立常模。心理测验不像考试,预先规定都少分以上及格,心理测验的结果是将分数与其他人的分数相比,然后来确定分数的意义。常模就是正常或平均的分数。一个人的测验得分只有与这个常模加以对照才能知道他的水平,也能评价其优劣的程度。 由此可见心理测验从其编制、实施、评分以及结果的解释都是按照严格的程序、标准来执行的,尽量避免受主观判断的影响。

E. 智力测验中解释测验结果的依据是 A.信度 B.效度 C.智商 D.常模

智力测验中解释测验结果的依据是常模。

个人在测验上的实得分数为原始分数。原始分数的本身,显示不出什么意义,必须参照标准样本的平均分数与各分数的分配情况,才能决定个人在分配中的地位是高于平均数,还是低于平均数。这个标准化样本的平均数,即为测验的常模。因此,一个测验的常模,也就是解释测验分数的主要根据。

测验必须经过标准化,才能成为客观的测量工具。在标准化的进程中,首先应从将来实际应用该测验的全体对象中,抽取足以代表全体的样本先行测量,并以样本分数为根据建立常模。为使测验标准化而抽取的样本,即为上述的标准化样本。



(5)教育考试对信度的标准有何要求扩展阅读

常模表达方法

1、转换表法,最简单而且最基本的表示常模的方法。

一个转换表显示出一个特定的标准化样组的原始分数与其对应的等值分数—百分位、标准分数、T分数或其他任何分数。利用转换表可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。

简单的转换表将单项测验的原始分数转换成一种或几种导出分数。复杂的转换表通常包括几个分测验或几种常模团体的原始分数与导出分数的对应关系。

2、剖面图,将测验分数的转换关系用图形表示出来。可以很直观地看出被试在各分测验上的表现及其相对位置。

标准差代表一组数据的离散程度,如一个班内学生数学成绩的离散程度从理论上说,心理测量数据一般服从为正态分布,或接近正态分布。

正态分布曲线的形状取决于标准差,但曲线下的面积始终为1个单位在心理测量中,个体在团体中的相对位置,以Z分数的大小表示,而Z分数是标准差作为单位,既以包含几个标准差表示个体分数与总体平均分数的距离,而不是用两者的绝对分数之差表示表示个体在团体中的相对位置。

根据Z分数可确定低于或某或高于某个分数的人数比例,也可以对不同的测量结果进行比较心理统计基本知识。

F. 什么是心理测量,心理测量一般会用到什么工具

实施、对被试的要求等都有明确的规定。 信度是指测验结果的可靠性或稳定性,我们需要很多指标来评价和衡量其科学性的高低,它在鉴别力、评分和测验分数的解释程序的一致性。对于一个测验而言。 由此可见心理测验从其编制、因材施教、测验的情境。 为了提高测验的信度和效度。
一般来说。每个心理测验编制完成后,然后来确定分数的意义。一个人的测验得分只有与这个常模加以对照才能知道他的水平、评分以及结果的解释都是按照严格的程序、人才选拔、就业指导,测验的条件对所有的被试必须使相同的,效度比信度更为重要:对所使用的材料,尽量避免受主观判断的影响、临床诊断等方面具有咨询,也能评价其优劣的程度、鉴定和预测功能的测量工具。简单地理解就是一个心理测验是否有效的程度,多次测量结果间的一致程度就叫信度。心理测验不像考试,不能让评分者完全主观地评分,编制一个可供使用的标准化的心理测验要经过以下几个步骤;对评分也要事先确定标准,预先规定都少分以上及格:(1)确定测验目的、时间;(2)制定编题计划。 心理测验的标准化的另一个方面就是建立常模;(3)编辑测验题目,但它并非真正意义上的心理测验,以使外界因素对测验结果的影响降到最低、例题的解释;(5)合成测验;(8)编写测验说明书。换句话说;(7)鉴定测验,其中信度和效度是重要的指标之一,使得不管谁来评分结果都一样。标准化是指测验的编制,对心理测验进行标准化是十分必要的。而效度是指测验能够测量某种特定心理特性的真实性和准确性。一个心理测验有信度,不一定有效度;(4)预测与分析,信度也一定高、指导语。为了使不同被试所获得的分数有比较的可能性,带有一定的娱乐性,心理测验的结果是将分数与其他人的分数相比。常模就是正常或平均的分数、实施、标准来执行的“心理测验”一词很容易让人联想到我们一般看到的趣味性心理测试。心理测验是对行为样本的客观和标准化的测量,但是效度高,即

G. 什么叫做信度、效度、标准化

信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能勾多大程度测量你的智力水平。再如,用一把尺子来量一个人的体重,其信度是有的,但是没有效度。如果一个事物具有效度,那一定具有信度,反之则不然

H. 评价量表的评价量表的标准

一、测量精度和测量误差

测量值是指反映一个对象某个特殊的数值。测量值不是所感兴趣的真点值,而是它们的一个观测。有许多因素都会引起测量误差,可将观测值O表示成如下的形式:O=T+S+R

观测值O和真点值T之间的差距称为误差,误差的大小反映了测量的精度的高低。误差包括两部分:系统误差S和系统误差R。S是一种偏差,代表着影响观测值的稳定性因素,每次都以相同的方式影响观测值。可能产生系统误差的原因很多。

随机误差不稳定。代表看影响观测值的暂时性因素,次都以不同的形式出现,例如暂时性的人员因素或环境因素等。

二、内容效度、标准则效度和建构效度来评价量表。

内容效度是指量表涵盖研究主题的程度。调研人员必须检查量表中的项目能否是够地覆盖测量对象的主要方面。为了获得足够的内容效度,要特别注意设计量表时应遵循的程序和规则。

内容效度的主观性使其不能单独地用来衡量表的效度,但可以用来对观测结果作大致的评价。一个更好的评价量是下面介绍的准则效度。

准则效度是指量表所得到的数据和其他被选择的变量的值相比是否有意义。准则变量可以是人文学和心理学特好、态度和行为、以及从其他量表得到的数据。根据时间跨度的不同,准则效度可分为同时效度和预测效度。当量表的测量数据和准则变量的值被同时收集时,使用同时效度。

三、建构效度

建构效度要求对每个特征的测量背后有足够的理论支持,并且这些被测量的特征之间应该有合理的关系。建构效度包括同质效度、异质效度和语意逻辑效度。

同质效度是指量表测量同一特征的其他测量方法相互关联的程度。异质效度是指量表和测不同特征的测量方法不同但理论上有关特征的测量方法之间相互关联的程度。

在设计量表时,首先建立一个理论模型,然后从中导出一系列推论、测试,逐渐形成一个由几个特征系统地联系起来的语意逻辑网。从表面上看,就是含有多个有关测量对象测量项目的量表。

四、测量的信度

信度指的是如果重复测量,量表所测结果的一致程度。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。随机误差可能导致不致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。R=0,就认为测量是完全可信的,信度最高。

一般通过使用同一量表进行不同测量,分析各测量结果之间联系的方法来评价信度。如果联系密切,各测量结果具有一致性,则认为量表是可信的。

五、评价信度的方法主要有:再预测量、替换形式、内部一致性方法。

再测信度:用同样的量表,对同一组访问对象在尽可量相同的情况下,在不同的时间进行两次测量。两次测量相距一般在两到四周之间。用两次测量结果间的相关分析或差异的显著性检验方法,可以评价量表信度的高低。结果越是相关,差异越不显著则信度越高。

替换形式信度:用两个形式不同的等价量表,对同一组受访者在不同的时间(通常间隔两到四周)进行测量。两次测量结果间的相关性被用来评价量表的信度。

内部一致信度:内部一致信度用于评价累加量表的信度。在这种量表中,各个测量项目的得分被累加以得到一个总分,每个项目都测量整个量表所要测量对象的某个方面,项目之间就它们各自的特征而言应该是一致的。内部一致信度强调的是组成量表的一组测量项目内部的一致性。

六、效度和信度的关系

效度和信度的关系可以用前面讨论过的测量值的构成公式O=T+S+R来理解。如果测量是完全有效的,即0=T,S=0,R=0,此时测量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因为有O=T+R。

量表是完全可信的,可以达到完全有效,也可能达不到,存在导致误差,缺管信度缺乏效度,但信度的大小并不能体现效度的大小。信度是效度的必要条件,但不是充分条件。从理论的角度来看,量应具有足够的效度和信度;从实践的观点来看,一个好的量表还应该具有实用性。

I. Cronbach系数是什么意思

克朗巴哈系数(Cronbach's alpha或Cronbach's α)是一个统计量,是指量表所有可能的项目划分方法的得到的折半信度系数的平均值,是最常用的信度测量方法。它最先被美国教育学家Lee Cronbach在1951年命名。

若一份量表有n题,题间的平均相关系数为r,则此量表的标准化α系数为α=nr/[(n-1)r+1]。通常Cronbachα系数的值在0和1之间。如果α系数不超过0.6,一般认为内部一致信度不足;达到0.7-0.8时表示量表具有相当的信度,达0.8-0.9时说明量表信度非常好。

(9)教育考试对信度的标准有何要求扩展阅读

Cronbach α系数的一个重要特性是它们值会随着量表项目的增加而增加,因此,Cronbach α系数可能由于量表中包含多余的测量项目而被人为地、不适当地提高。

还有一种可以和Cronbach α系数同时使用的系数。系数能够帮助评价,在计算Cronbach α系数的过程中,平均数的计算是否掩盖了某些不相关的测量项目。不同的研究者对信度系数的界限值有不同的看法。

J. 情商测试的标准问卷,背景历史信度效度急啊!!!!!回答好会追加分

有一份,这马上就可以测一下。
哈佛心理学系博士戴尼尔·高尔曼为此做了一些努力,尝试出了一些问题,通过对这些问题的回答,您可以获得一个关于自己的EQ的粗略的感性印象。问题共10个,计分标准见后文,最高分数为200分,一般人的平均分为100分,如果您得了25分以下,最好另找个时间重测一下。
现在,请静下心来,诚实地回答下面的测题。一定要按照您真正可能会去做的实际去回答,而不要试图用在学校里获取的做多项选择题的技巧去猜哪一个才是对的。好,下面开始!

情商测试题
1. 坐飞机时,突然受到很大的震动,你开始随着机身左右摇摆。这时候,您会怎样做呢? A. 继续读书或看杂志,或继续看电影,不太注意正在发生的骚乱。 B. 注意事态的变化,仔细听播音员的播音,并翻看紧急情况应付手 以备万一。 C. A和B都有一点。 D. 不能确定--根本没注意到。
2. 带一群4岁的孩子去公园玩,其中一个孩子由于别人都不和他玩而大哭起来。这个时候,您该怎么办呢? A. 置身事外--让孩子们自己处理。 B. 和这个孩子交谈,并帮助她想办法。 C. 轻轻地告诉她不要哭。 D. 想办法转移这个孩子的注意力,给她一些其他的东西让她玩。
3. 假设您是一个大学生,想在某门课程上得优秀,但是在其中考试时却只得了及格。这时候,您该怎么办呢? A. 制定一个详细的学习,并决心按计划进行 。 B. 决心以后好好学。 C. 告诉自己在这门课上考不好没什么大不了的,把精力集中在其他可能考得好的课程上。 D. 去拜访任课教授,试图让他给您高一点的分数。
4. 假设您是一个保险推销员,去访问一些有希望成为您的顾客的人。可是一连十五个人都只是对您敷衍,并不明确表态,您变得很失望。这时候,您会怎么做呢? A. 认为这只不过是一天的遭遇而已,希望明天会有好运气。 B. 考虑一下自己是否适合做推销员。 C. 在下一次拜访时再做努力,保持勤勤恳恳工作的状态。 D. 考虑去争取其他的顾客。
5. 您是一个经理,提倡在公司中不要搞种族歧视。一天您偶然听到有人正在开有关种族歧视的玩笑。您会怎么办呢? A. 不理它--这只是一个玩笑而已。 B. 把那人叫到办公室去,严厉斥责他一顿。 C. 当场大声告诉他,这种玩笑是不恰当的,在您这里是不能容忍的。 D. 建议开玩笑的人去参加一个有关反对种族歧视的培训班。
6. 您的朋友开车时别人的车突然危险地抢到你们前面,您的朋友勃然大怒,而您试图让他平静下来。您会怎么做呢? A. 告诉他忘掉它吧--现在没事了,这不是什么大不了的事。 B. 放一盘他喜欢听的磁带,转移他的注意力。 C. 一起责骂那个司机,表示自己站在他那一边。 D. 告诉他您也曾有同样的经历,当时您也一样气得发疯,可是后来您看到那个司机出了车祸,被送到医院急救室。
7. 您和伴侣发生了争论,两人激烈地争吵;盛怒之下,互相进行人身攻击,虽然你们并不是真的想这样做。这时候,最好怎么办呢? A. 停止20分钟,然后继续争论。 B. 停止争吵……保持沉默,不管对方说什么。 C. 向对方说抱歉,并要求他(她)也向您道歉。 D. 先停一会儿,整理一下自己的想法,然后尽可能清楚地阐明自己的立场。
8. 您被分到一个单位当领导,想提出一些解决工作中烦难问题的好方法。这时候,您第一件要做的是什么呢? A. 起草一个议事日程,以便充分利用和大家在一起讨论的时间。 B. 给人们一定的时间相互了解。 C. 让每一个人说出如何解决问题的想法。 D. 采用一种创造性地发表意见的形式,鼓励每一个人说出此时进入他脑子里的任何想法,而不管该想法有多疯狂。
9. 您3岁的儿子非常胆小,实际上,从他出生起就对陌生地方和陌生人有些神经过敏或者说有些恐惧。您该怎么办呢? A. 接受他具有害羞气质的事实,想办法让他避开他感到不安的环境。 B. 带他去看儿童精神科医生,寻求帮助。 C. 有目的地让他一下子接触许多人,带他到各种陌生的地方,克服他的恐惧心理。 D. 设计渐进的系列挑战性计划,每一个相对来说都是容易对付的,从而让他渐渐懂得他能够应付陌生的人和陌生的地方。
10. 多年以来,您一起想重学一种您在儿时学过的乐器,而现在只是为了娱乐,您又开始学了。您想最有效的利用时间。您该怎么做呢? A. 每天坚持严格的练习。 B. 选择能稍微扩展佻的能力的光曲去练习。 C. 只有当自己有情绪的时候才去练习。 D. 选择远远超出您的能力但通过勤奋的努力能掌握的乐曲去练习。

测题答案及解释
1. 除了D以外的任何一个答案。选择答案D反映了您在面临压力是经常缺少警觉性。A=20,B=20,C=20,D=0。
2. B是最好的选择。情商高的父母善于利用孩子情绪状态不好的时机对孩子进行情绪教育,帮助孩子明白是什么使他们感到不安,他们正在感受的情绪状态是怎样的,以及他们能进行的选择。A=0,B=20,C=0,D=0。
3. A自我激励的一个标志是能制定一个克服障碍和挫折的计划,并严格执行它。A=20,B=0,C=20,D=0。
4. C为最佳答案。情商高的一个标志是面对挫折时,能把它看成一种可以从中学到东西的挑战,坚持下去,尝试新的方法,而不是放弃努力,怨天尤人,变得萎靡不振。A=0,B=0,C=20,D=0。
5. C形成一种欢迎多样化的气氛的最有效的方法是公开挑明这一点。当有人违反时,明确告诉他您的组织的规范不容许这种情况发生。不是力图改变这种偏见(这是一个更困难的任务),而只是让人们遵照规范去行事。A=0,B=0,C=20,D=0。
6.D有资料表明,当一个人处于愤怒状态时,使他平静下来的最有效的办法是转移他愤怒的焦点,理解并认可他的感受,用一种不激怒他的方式让他看清现状,并给他以希望。A=0,B=5,C=5,D=20。
7.A中断20分钟或更长的时间。这是使愤怒引起的生理状态平息下来的最短时间。否则, 种状态会歪曲您的理解力,使您更可能出口伤人。平静了情绪后,你们的讨论才会更富有成效。A=20,B=0,C=0,D=0。
8.B当一个组织的成员之间关系融洽、亲善,每一个人都感到心情舒畅时,组织的工作效率才会最高。在这种情况下,人们才能自由地做出他们最大的贡献。A=0,B=20,C=0,D=0。
9.D生来带有害羞气质的孩子,如果他们父母能安排一系列渐进的针对他们害羞的挑战,并且这种挑战是能逐个应付得了的,那么他们通常会变得喜欢外出起来。A=0,B=5,C=0,D=20。
10.B给自己适度的挑战,最有可能激发自己最大的热情。这既能使您学得愉快,又能使您完成得最好。A=0,B=20,C=0,D=0。
风雨阁伴你走过风风雨雨。

热点内容
幼师专业怎么样 发布:2021-03-16 21:42:13 浏览:24
音乐小毛驴故事 发布:2021-03-16 21:40:57 浏览:196
昂立中学生教育闸北 发布:2021-03-16 21:40:47 浏览:568
建筑业一建报考条件 发布:2021-03-16 21:39:53 浏览:666
2017年教师资格注册结果 发布:2021-03-16 21:39:49 浏览:642
中国教师资格证查分 发布:2021-03-16 21:39:41 浏览:133
踵什么成语有哪些 发布:2021-03-16 21:38:20 浏览:962
东营幼师专业学校 发布:2021-03-16 21:35:26 浏览:467
机械电子研究生课程 发布:2021-03-16 21:33:36 浏览:875
杭州朝日教育培训中心怎么样 发布:2021-03-16 21:33:28 浏览:238