教育考試對信度的標准有何要求
A. 試計算信度及測驗標准誤各是多少
信度是指測驗結果的一致性、穩定性及可靠性,一般多以內部一致性來加以表示該測驗信度的高低。信度系數愈高即表示該測驗的結果愈一致、穩定與可靠。系統誤差對信度沒什麼影響,因為系統誤差總是以相同的方式影響測量值的,因此不會造成不一致性。反之,隨機誤差可能導致不一致性,從而降低信度
B. 標准誤的計算公式
標准誤=標准差 / N的根號。標准誤差定義為各測量值誤差的平方和的平均值的平方根,故又稱為均方根誤差。
標准誤,即樣本均數的標准差,是描述均數抽樣分布的離散程度及衡量均數抽樣誤差大小的尺度,反映的是樣本均數之間的變異。標准誤不是標准差,是多個樣本平均數的標准差。標准誤用來衡量抽樣誤差。
標准誤越小,表明樣本統計量與總體參數的值越接近,樣本對總體越有代表性,用樣本統計量推斷總體參數的可靠度越大。因此,標准誤是統計推斷可靠性的指標。
(2)教育考試對信度的標准有何要求擴展閱讀:
需要注意的是,標准誤差不是測量值的實際誤差,也不是誤差范圍,它只是對一組測量數據可靠性的估計。標准誤差小,測量的可靠性大一些,反之,測量就不大可靠。進一步的分析表明,根據偶然誤差的高斯理論,當一組測量值的標准誤差為σ時,則其中的任何一個測量值的誤差εi有68.3%的可能性是在(-σ,+σ)區間內。
信度系數與信度指數:
除了測量標准誤,通常在理測量中會使用信度系數和信度指數作為指標。
1、信度系數:即信度,一種相關性系數。常為同一受測者樣本所得的兩組資料的相關。
2、信度指數:也可作為信度系數。信度指數的平方就是信度系數。
C. 什麼是心理與教育測量
心理與教育測量大綱/講義
第一章 心理與教育測量概論
本章考核知識點和考核要求
一、識記
(一)測量的定義:P2
測量是依據一定的法則,使用量具對事物的特徵進行定量描述的過程。
(二)測量的基本要素:P4
任何測量都必須具備兩個基本要素,即測量的參照點和測量的單位。
(三)心理與教育測量的定義:P6—7
依據一定的心理學和教育學理論,使用測驗對人的心理特徵和教育成就進行定量描述的過程。
二、領會
(一)測量量表的4種類型:P5
命名表、順序量表、等距量表、比率量表
(二)心理測驗的4個基本條件:P9—12
1、行為樣本 2、標准化 3、難度或應答率 4、信度和效度
(三)心理測驗的5種不用分類:P12—14
1、按測量對象所作的分類:
智力測驗、能力傾向測驗、成就測驗、人格測驗
2、按測量方式所作分類:
個別測量、團體測量
3、按測驗內容的形式所作的分類:
文字測驗、非文字測驗
4、按測驗功能所作的分類:
成就測驗與預測測驗、難度測驗與速度測驗、描述測驗與診斷測驗
5、按評價所參照的標准分類:
常模參照測驗、目標參照測驗、潛力參照測驗
第二章 心理與教育測量的產生與發展
考核知識點與考核要求
一、識記:
(一)高爾頓的主要貢獻:P28
1、英國優生學的創始人。出版了《遺傳的天才》一書,提出人的能力是由遺傳而來的,其差異是可以測量的。
2、1884年,成立「人類測量實驗室」,被視為第一個大規模系統測量人的個別差異的嘗試。
3、發明了許多測量儀器;是應用評定量表、問卷法、自由聯想法的先驅。
4、最重要的貢獻之一是把統計方法應用到對個別差異資料的分析之中。
(二)卡特爾的主要貢獻:P28
美國心理學家,1890年,首次提出「心理測驗」這一術語,他的許多觀點都已成為測量學上的重要觀點。
(三)比內的主要貢獻:P29
法國心理學家,1904年,與其助手西蒙合作完成了世界上第一個智力測驗量表——比內—西蒙量表。
二、領會:
西方心理學與教育測量的發展:P30
1、智力測驗的發展
2、能力傾向測驗的發展
3、成就測驗的發展
4、人格測驗的發展
第三章 經典測驗理論的基本假設
考核知識點與考核要求
一、識記
(一)測量誤差:P40
指在測量過程中由哪些與測量目的無關的變化因素所產生的一種不確定或不一致的測量效應。
(二)隨機誤差:P40
由與測量目的無關的、偶然因素引起的又不易控制的誤差。
(三)系統誤差:P40
是那種由與測量目的無關的變因引起的一種恆定而有規律的效應。
(四)真分數:P42
把反映被試某種心理特質真正水平的那個數值稱為該特質的真分數,簡稱T分數。
(五)平行測驗:P43
如果兩個題目不同的測驗測的是同一特質,並且題目形式、數量、難度、區分度以及測查等值團體後所得分數的分布都是一致的,則這兩個測驗被稱作平行測驗。
二、領會:
(一)測量誤差的三個主要來源:P41
測量工具、被測對象、施測過程
(二)觀察分數、真分數和隨機誤差之間的關系:P42—43
觀察分數是指實測的分數,它們的關系是:
觀察分數被假定等於真分數與誤差分數之和,二者關系被假定為線性關系,隨機誤差服從均值為零的正態分布,它獨立與真分數。
第四章 測量信度
考核知識點與考核要求
一、識記
(一)信度的含義及測量學的定義:
1、信度的含義:P45指測量結果的穩定性程度,也測量的可靠性。
2、信度的測量學定義:P46乃是一個X(A卷)與它的任意一個平行測驗X/(B卷)的相關系數。即RXX=PXX』
(二)重測信度的含義:P48
指用同一個量表對同一組被測試施測兩次所得結果的一致性程度。
(三)復本信度的含義:P49
指兩個平行的測驗測量同一批被試所得結果的一致性程度。
(四)分半信度的含義:P50
指將一個測驗分成對等的兩半後,所有被試在這兩半上所得分數的一致性程度。
(五)同質性信度的含義:P51
指多個評分者給同一批人的答卷進行評分的一致性程度。
二、領會:
(一)信度的作用:P47
1、信度是測量過程中所存在的隨機誤差大小的反映。
2、信度可以用來解釋個人測驗分數的意義
3、信度可以幫助進行不同測驗分數的比較。
(二)重測信度的使用條件:P48
(三)復本信度的使用條件:P49
(四)分半信度的使用條件:P50—51
(五)同質信度的使用條件:P51
(六)影響信度的因素:P55
被測、主試、施測情境、測量工具、兩次施測的間隔時間
(七)提高信度的方法:P56
1、適當增加測驗的長度,
2、使測驗中所有試題的難度接近正態分布,並控制在中等水平,
3、努力提高測驗試題的區分度,
4、選取恰當的被試團體,
5、主試者嚴格執行實測規程,評分者嚴格按標准給分,減少無關因素的干擾。
三、應用
(一)能用克龍巴赫系數計算項目的同質性信度
克龍巴赫α系數 P52 公式、例題
(二)能用肯德爾和諧系數計算評分這信度
P53 公式 P54 舉例
(三)通過增加題目長度來提高測驗的信度。
P56
第五章 測量效度
考核知識點與考核要求
一、識記
(一)效度的含義:P59
指一個測驗或量表時間能測出其所要測的心理特質的程度。
(二)效度的測量學定義:P60
在一系列測量中,與測量目的有關的真實變異數與總變異數(實得變異數)的比率。即
效度=SV2/RXY2
(三)內容效度的含義:P62
指一個測驗時間測到的內容與所要測量的內容之間的吻合程度。
(四)結構效度的含義:P63
是指一個測驗實際測到所要測量的理論結構和特質的程度。
(五)實證效度的含義:P66
指一個測驗對處於特定情境中的個體的行為進行估計的有效性。
(六)效標的含義:P67
就是衡量一個測驗是否有效的外在標准。
二、領會
(一)效度的特點:P59
1、效度是一個相對的概念
2、效度是測量的隨機誤差和系統誤差的綜合反映
3、判斷一個測量是否有效要多個方面搜集證據。
(二)效度與信度的關系:P61
1、信度是效度高的必要而非充分的條件
2、測驗的效度受它的信度制約
(三)三種效度的適用范圍:
1、內容效度的適用范圍P62
成就測驗、職業測驗
2、結構效度的適用范圍P63
智力測驗、人格測驗等
3、實證效度的適用范圍P67
診斷現狀、預測個體將來的行為
(四)影響效度的因素P69
測驗的構成、實施的過程、被試、所選效標的性質、測量信度
(五)提高效度的方法P70
1、精心編制測驗量表,避免出現較大的系統誤差
2、妥善組織測驗,控制隨機誤差
3、創設標準的應試情境,讓每個被試都能發揮正常的水平
三、應用
三種效度的估計方法
(一)內容效度的確定方法P63
主要是邏輯分析法
(二)結構效度的確定方法P64
1、測驗內部尋找證據法
2、測驗之間尋找證據法
3、考察測驗的實證效度法
4、多種特質——多種方法矩陣法
(三)實證效度的確定方法P68
1、相關法 2、區分法 3、命中率
第六章 測驗的項目分析
考核知識點與考核要求
一、識記
(一)項目難度的含義:P72
是指測驗項目的難易程度。
(二)區分度的含義:P77
是指測驗項目對被試心理品質水平差異的區分能力。
二、領會:
(一)難度對測驗分數的影響:P76
1、測驗難度影響測驗分數的分布形態
2、測驗難度影響測驗分數的離散程度
(二)項目鑒別指數評價題目性能的標准P79 表6—1
(三)區分度的相對性:P85
1、不同的計算方法,所得區分值不同。
2、樣本容量大小影響相關法區分值的大小
3、分組標准影響鑒別指數值D
4、被試樣本的同質性程度影響區分度值的大小
(四)區分度和難度的關系:P84
1、難度越接近0.50,項目潛在的區分越大
2、難度越接近1.00或0時,項目的潛在區分度越小
三、應用
(一)計算不同形式題目(是非題、選擇題、論述題)的難度。P72—74
1、二分法記分形式項目的難度計算P72—73
公式、例題
2、非二分法記分項目的難度計算P73—74
公式、例題
(二)用鑒別指數法計算測驗題的區分度P78
鑒別指數的計算P78
公式、例題
(三)根據難度和區分度進行多重選擇題的項目分析:P91 表
第七章 測驗常模
考核知識點與考核要求
一、識記
(一)原始分數和導出分數的含義 P93
1、被試在接受測驗後,根據測驗的記分標准,對照被試的反應所計算出的測驗分數稱作原始分數。
2、在原始分數轉換的基礎上,按照一定的規則,經過統計處理後獲得的具有一定參考點和單位,且可以相互比較的分數。
(二)百分等級的含義P94
是應用最廣的導出分數,是指在一個群體的測驗分數中,得分低於這個分數的人數的百分比。就是說,如果將某一被試群體分為一百個等級,則每位被試所佔的等級數就是百分等級。
(三)標准分數的含義和種類:P96
1、含義:又稱公分數,是將原始分數與團體的平均數之差除以標准差所得的商數。公式。
2、種類:P97-100。T分數、其他形式、標准九分數。
(四)常模團體的含義:P106
是由具有某種共同特徵的人所組成的一個群體,或是該群體的一個樣本。
二、領會
(一)標准分數的優缺點
優點:P96,它是一個抽象值,不受原始測量單位的影響,並可接受進一步的統計處理。
缺點:公分數由於計算中經常出現負數和小數,且單位過大,因此使用起來不夠方便。P97
(二)確定常模團體的注意事項P106-107:共六點
(三)制定常模的過程P108
1、確定測驗將用於哪一個群體。
2、對常模團體進行施測,獲得團體成員的測驗分數和分數分布。
3、確定常模分數類型,製作常模量表,給出書面說明等。
(四)幾種主要的常模參照分數P108-110
1、發展量表P108
2、商數P110分式
三、應用
(一)比較幾種導出分數的優缺點P94
1、百分等級分數的優缺點P95
2、標准分數的優缺點P96-97
3、T分數的優缺點P98下
(二)計算未分組資料的百分等級
P94 公式、例題
第八章 心理與教育測驗的編制與實施
一、領會
(一)心理測驗編制的一般程序P117
1、確定測驗目的
2、制定編題計劃
3、編輯測驗項目
4、預測與項目分析
5、合成測驗
6、測驗標准化
7、鑒定測驗
8、編寫測驗說明書。
(二)編輯測驗項目的注意事項P120
共六點
(三)測驗標准化應注意的問題:P122
1、測驗內容
2、施測過程
3、測驗評分
4、測驗分數的解釋
(四)測驗實施過程中應注意的問題:P125
1、施測前的准備工作
2、指導語
3、測驗情境
4、測驗焦慮
5、與受測者建立良好的協調關系
(五)測驗焦慮的相關內容P126
二、應用
(一)項目編排和製作復本的方法
1、項目編排的方法:P121
並列直進式、混合螺旋式
2、製造復本的方法P122
(1)先將所有可用的項目按難度排列,其次序為1、2、3、4、5、6、……
(2)分成兩個等值的測驗本方法
(3)分成3個等值的沒測驗本方法
(二)解釋測驗分數意義時遵循的基本原則P129:共六點
(三)向受測者報告測驗分數時的注意事項P131-132共九點
第九章 測驗等值
一、識記:
(一)測驗等值的含義P135
就是通過對考核同一種心理品質的多個測驗形式作出測量分數系統的轉換,進而使得這些不同測驗形式的測驗分數之間具有可比性。這樣一套專門技術稱為~
(二)錨測驗的含義:P138
在測驗等值設計中,有時會採用一組測驗試題來關聯兩個待等值的測驗形式,以便尋找兩形式的等值關系,這些測驗試題被稱為錨測驗。
(二)領會
(一)測驗等值的條件P136
1、同質性2、等信度3、公平性4、可遞推性5、對稱性6、樣本不變性。
(二)測驗等值結果的表示方法:P140
1、表列法2、公式法3、圖示法
三、應用
(一)等百分位等值的計算:P142例題
(二)線性等值的計算P143、公式P144例題
第十章 目標參照測驗
一、識記
(一)目標參照測驗的含義:P154
當一個測驗是以某一明確界定的內容範圍為基礎編制而成,並且其分數是參照該內容範圍所要求的絕對標准進行解釋,我們便稱這一測驗為~
(二)分類一致性信度的含義:P161
對測驗的分類一致性的度量指標,稱作~
二、領會
(一)雙向細目表的構成要素:P154-155
1、教學目標
2、教學內容
3、在整個內容範圍中每一類內容和每一種目標結合後,所佔的比重(相對重要性)
(二)測驗項目區分度的兩類指標P159
1、難度差值
2、相關系數
(三)目標參照測驗的效度及其估計P163
1、內容效度及評估重要條件
2、效標關聯效度的估計——決策效度。
(四)目標參照測驗分數分界點確定的幾種方法P165
1、專家判是法2、效標組預測法
三、應用
(一)根據測驗項目的內容效度分析來決定項目的取捨P155-158
關鍵詞:專家評定法、項目內容評定表、等級評定均值和中位數分析。
(二)測驗項目難度差值的計算分析P158
1、難度分析P158下
2、計算——與常模參照測驗相同,以通過率表示。P159,難度差值。
(三)比較目標參照測驗和常模參照測驗的異同。
1、P152-P153 上,兩者差異
2、相同點:P168
第十一章 學績測驗
一、 識記
(一) 學績測驗的含義P170
是對個體在某一階段的學習或訓練之後知識、技能的發展水平的測定。
(二) 標准化學績測驗的含義P173
在心理與教育測量學原理指導下,遵循一定的程序所編制的各方面質量都達到規定標準的學績測驗,稱為~
(三) 斯坦福成就測驗P177
屬於綜合性學績考查測驗,也是一種供團體使用的常模參照性測驗,歷史比較長。
二、 領會
(一) 學績測驗的分類P172
1、 按測驗的編制方法分
2、 按測驗的內容分
3、 按測驗用途分
4、 按測驗評分的參照系分
5、 按測驗的題型分
(二) 標准化學績測驗的基本條件P174
1、 命題組卷標准化
2、 施測標准化
3、 評分標准化
4、 測驗分數解釋標准化
(三) 標准化學績測驗的編制過程P175-177。共五點
(四) 教師自編課堂測驗的特點P182
1、 測驗形式靈活多樣,與測驗目的完全一致
2、 測驗內容與教材內容高度一致
3、 測驗難度切合學生實際水平
4、 測驗編制簡易快速。
第十二章 能力測驗(上)
一、 識記
(一) 幾種智力理論的名稱、主要代表人物和觀點
1、 智力的心理測量學理論P188
① 主要代表人物
② 主要觀點
2、 智力的生物學理論P189
① 主要人物質
② 主要觀點
3、 智力的認知心理學理論P190
(二) 三種常用的團體智力測驗名稱P206
1、 陸軍測驗
2、 瑞文推理測驗
3、 認知能力測驗
二、 領會
(一) 比內量表的發展階段P198-199
1、 比內——西蒙量表的發展階段
2、 斯坦福——比內量表的發展階段
(二) 韋氏成人智力量表修訂本的構成P201
1、1981年修訂版P201
2、中國修訂本P202-203
(三)斯比量表和韋氏量表的信度估計
1、斯比量表的信效度估計P199
2、韋氏量表的信效度估計P202
(四)瑞文推理測驗的三種水平及其優點P206
1、三種水平:標准推理測驗,采圖推理測驗,高級推理測驗
2、優點:P207
三、應用
評價傳統智力測驗存在的若干問題P192-195
共四大點
第十三章 能力測驗(下)
一、領會
(一)能力傾向測驗的特點:P211
1、測驗的目的
2、測驗的編制
3、測驗結果的解釋
(二)創造力測驗的理論基礎P222
吉爾福特發散思維的研究
第十四章 人格測量
一、識記
(一)人格測量發展過程中出現幾個重要人物P228
1、英國學者高爾頓1884年首倡用科學方法測量人格
2、1892年,克雷培林將聯想測驗用於臨床診斷
3、1919年美國戴德沃斯發表第一個自陳人格量表
4、1920年,羅夏克墨跡測驗問世,投射測驗由此產生
(二)自陳量表的含義:P230
就是根據要測量的人格特質,編制許多有關的問題,要求受測者根據自己的實際情況逐一回答這些問題,然後根據受測者的答案,去衡量受測者雜一這種人格特質上的表現程度。為完成自陳人格測量而編制的測量工具叫自陳量表。
(三)投射測驗的含義:P241
指向受測者提供預先編制的一些未經組織的、意義模糊的標准化刺激情境,讓受測者在不受任何限制的情況下,自由地對刺激情境作出他的反應,然後通過分析受測者的反應,推斷受測者的人格特質。
三、 領會
(一)自陳量表的編制方法和特點:P230
1、編制方法:是否式、二擇一式、是否折中式、文字等級式、數字等級式
2、特點:
①題量較大,多數用於測量人格的若干特質
②通常採用紙筆測驗
③記分規則簡單客觀,施測手續簡便,測量分數容易獲得解釋
(二)明尼蘇達人格問卷概況P233
(三) 卡特爾16種人格問卷概況P235
(四) 艾森克人格問卷簡介P236
(五) 投射測驗的理論假設P242
1、 人們對外部事物的解釋性反應都是有其心理原因的,同時也是可以給予說明和預測的。
2、 反應者過去形成 的人格特徵,他當時的心理狀態以及他對未來的期望會滲透在他對外部刺激的反應過程及結果中。
3、 個人的人格會無意識地滲透在對刺激情境的解釋性反應中,因此可以通過測驗得以解釋。
(六) 羅夏克墨跡測驗的四個階段P243
1、 自由反應階段
2、 提問階段
3、 類比階段
4、 極限測驗階段
(七) 羅夏克墨跡測驗概況:P243
(八) 主題統覺測驗簡介:P245
第十五章 其他心理與教育測驗
一、 識記
(一) 狀態焦慮的含義P148
是指由緊張、擔憂、神經過敏和憂慮所引起的主觀感覺和由主性神經系統的喚醒所引起的生理反應。
(二) 物質焦慮的含義P249
是一種比較穩定的人格物質,它存在著個體差異,是一種習得的行為傾向。
二、 領會
(一) 常用的焦慮測驗P249
1、 顯性焦慮量表(MAS)
2、 狀態——物質焦慮量表(STAI)
3、 測驗焦慮量表
4、 其他臨床焦慮量表
(二) 職業興趣測驗P253
1、 斯特朗職業興趣問卷
2、 庫德職業興趣調查表
3、 自我指導問卷
(三) 品德和態度測量的常用方法
1、 態度測量方法:P260等距量表法、克利特量表法、哥特曼量表法
2、 品德測量方法:P265情境測驗法、問卷測量法等
第十六章 測量的綜合應用
一、 應用:
論述心理測量在三個領域中的應用情況及需要補充完善的地方。
(一) 心理測量在心理咨詢中的應用:P271
1、 在自我認識、人生規劃咨詢中的應用
2、 在神經症、人格障礙等咨詢中的應用
(二) 心理測量在人事測評中的應用P275
1、 在人的心理特點評估中的應用
2、 人員培訓後的心理特點評估
3、 工作人員的效績評估
(三) 心理測量在教育評價中的應用P281
1、 在測量學生的學習與發展狀況中的應用
2、 在教師與管理者評價中的應用
第十七章 心理與教育測量理論的新發展
本章不作考試要求
附錄 題型舉例
一、 填空題
1、按測量方式所作的分類,心理測量可分為個別測量和 。
2、首次提出「心理測驗」這個術語的人是 。
二、單選題
1、在EPQ量表中,反映被試的社會朴實或者幼稚水平的分量表是( )
A 、P量表 B、E量表 C、N量表 D、L量表
2、某一項目上高分組和低分組的通過率分別為0.83和0.43,則該項目的難度是( )
A、0.43 B、0.40 C、0.59 D、0.75
三、名詞解釋
1、重測信度
2、結構效度
四、簡答題
1、簡述信度和效度的關系。
2、簡述投射測驗的基本原理及其特點。
五、計算和分析題
1、某人在一次由80人參加的成就測驗中得76分,排名18,則該生成績(76分)的百分等級是多少?
2、下表為一個由370人參加的測驗中的4個題目的項目信息統計結果列表,請您對這4個題目進行項目分析和評價。
題
號 組別 選答人數 正確
答案 難度P 區分度
A B C D 未答 Rpb D
1 高分組 5 92 1 2 0 B
0.71 0.52 0.42
低分組 22 50 12 16 0
2 高分組 58 10 15 16 1 A 0.42 0.33 0.32
低分組 26 21 15 36 2
3 高分組 17 25 28 28 12 D
0.31 -0.04 -0.06
低分組 25 11 19 34 11
4 高分組 1 44 14 36 5 C 0.12 0.08 0.04
低分組 1 56 10 28 5
七、論述題
聯系實際談談心理測驗在實際工作中有哪些具體應用?
D. 什麼是心理測試
「心理測驗」一詞很容易讓人聯想到我們一般看到的趣味性心理測試,但它並非真正意義上的心理測驗,帶有一定的娛樂性。心理測驗是對行為樣本的客觀和標准化的測量,它在鑒別力、因材施教、人才選拔、就業指導、臨床診斷等方面具有咨詢、鑒定和預測功能的測量工具。 一般來說,編制一個可供使用的標准化的心理測驗要經過以下幾個步驟:(1)確定測驗目的;(2)制定編題計劃;(3)編輯測驗題目;(4)預測與分析;(5)合成測驗;(7)鑒定測驗;(8)編寫測驗說明書。每個心理測驗編制完成後,我們需要很多指標來評價和衡量其科學性的高低,其中信度和效度是重要的指標之一。 信度是指測驗結果的可靠性或穩定性。換句話說,多次測量結果間的一致程度就叫信度。而效度是指測驗能夠測量某種特定心理特性的真實性和准確性。簡單地理解就是一個心理測驗是否有效的程度。對於一個測驗而言,效度比信度更為重要。一個心理測驗有信度,不一定有效度,但是效度高,信度也一定高。 為了提高測驗的信度和效度,對心理測驗進行標准化是十分必要的。標准化是指測驗的編制、實施、評分和測驗分數的解釋程序的一致性,以使外界因素對測驗結果的影響降到最低。為了使不同被試所獲得的分數有比較的可能性,測驗的條件對所有的被試必須使相同的,即:對所使用的材料、時間、指導語、例題的解釋、測驗的情境、對被試的要求等都有明確的規定;對評分也要事先確定標准,不能讓評分者完全主觀地評分,使得不管誰來評分結果都一樣。 心理測驗的標准化的另一個方面就是建立常模。心理測驗不像考試,預先規定都少分以上及格,心理測驗的結果是將分數與其他人的分數相比,然後來確定分數的意義。常模就是正常或平均的分數。一個人的測驗得分只有與這個常模加以對照才能知道他的水平,也能評價其優劣的程度。 由此可見心理測驗從其編制、實施、評分以及結果的解釋都是按照嚴格的程序、標准來執行的,盡量避免受主觀判斷的影響。
E. 智力測驗中解釋測驗結果的依據是 A.信度 B.效度 C.智商 D.常模
智力測驗中解釋測驗結果的依據是常模。
個人在測驗上的實得分數為原始分數。原始分數的本身,顯示不出什麼意義,必須參照標准樣本的平均分數與各分數的分配情況,才能決定個人在分配中的地位是高於平均數,還是低於平均數。這個標准化樣本的平均數,即為測驗的常模。因此,一個測驗的常模,也就是解釋測驗分數的主要根據。
測驗必須經過標准化,才能成為客觀的測量工具。在標准化的進程中,首先應從將來實際應用該測驗的全體對象中,抽取足以代表全體的樣本先行測量,並以樣本分數為根據建立常模。為使測驗標准化而抽取的樣本,即為上述的標准化樣本。
(5)教育考試對信度的標准有何要求擴展閱讀
常模表達方法
1、轉換表法,最簡單而且最基本的表示常模的方法。
一個轉換表顯示出一個特定的標准化樣組的原始分數與其對應的等值分數—百分位、標准分數、T分數或其他任何分數。利用轉換表可將原始分數轉換為與其對應的導出分數,從而對測驗的分數作出有意義的解釋。
簡單的轉換表將單項測驗的原始分數轉換成一種或幾種導出分數。復雜的轉換表通常包括幾個分測驗或幾種常模團體的原始分數與導出分數的對應關系。
2、剖面圖,將測驗分數的轉換關系用圖形表示出來。可以很直觀地看出被試在各分測驗上的表現及其相對位置。
標准差代表一組數據的離散程度,如一個班內學生數學成績的離散程度從理論上說,心理測量數據一般服從為正態分布,或接近正態分布。
正態分布曲線的形狀取決於標准差,但曲線下的面積始終為1個單位在心理測量中,個體在團體中的相對位置,以Z分數的大小表示,而Z分數是標准差作為單位,既以包含幾個標准差表示個體分數與總體平均分數的距離,而不是用兩者的絕對分數之差表示表示個體在團體中的相對位置。
根據Z分數可確定低於或某或高於某個分數的人數比例,也可以對不同的測量結果進行比較心理統計基本知識。
F. 什麼是心理測量,心理測量一般會用到什麼工具
實施、對被試的要求等都有明確的規定。 信度是指測驗結果的可靠性或穩定性,我們需要很多指標來評價和衡量其科學性的高低,它在鑒別力、評分和測驗分數的解釋程序的一致性。對於一個測驗而言。 由此可見心理測驗從其編制、因材施教、測驗的情境。 為了提高測驗的信度和效度。
一般來說。每個心理測驗編制完成後,然後來確定分數的意義。一個人的測驗得分只有與這個常模加以對照才能知道他的水平、評分以及結果的解釋都是按照嚴格的程序、人才選拔、就業指導,測驗的條件對所有的被試必須使相同的,效度比信度更為重要:對所使用的材料,盡量避免受主觀判斷的影響、臨床診斷等方面具有咨詢,也能評價其優劣的程度、鑒定和預測功能的測量工具。簡單地理解就是一個心理測驗是否有效的程度,多次測量結果間的一致程度就叫信度。心理測驗不像考試,不能讓評分者完全主觀地評分,編制一個可供使用的標准化的心理測驗要經過以下幾個步驟;對評分也要事先確定標准,預先規定都少分以上及格:(1)確定測驗目的、時間;(2)制定編題計劃。 心理測驗的標准化的另一個方面就是建立常模;(3)編輯測驗題目,但它並非真正意義上的心理測驗,以使外界因素對測驗結果的影響降到最低、例題的解釋;(5)合成測驗;(8)編寫測驗說明書。換句話說;(7)鑒定測驗,其中信度和效度是重要的指標之一,使得不管誰來評分結果都一樣。標准化是指測驗的編制,對心理測驗進行標准化是十分必要的。而效度是指測驗能夠測量某種特定心理特性的真實性和准確性。一個心理測驗有信度,不一定有效度;(4)預測與分析,信度也一定高、指導語。為了使不同被試所獲得的分數有比較的可能性,帶有一定的娛樂性,心理測驗的結果是將分數與其他人的分數相比。常模就是正常或平均的分數、實施、標准來執行的「心理測驗」一詞很容易讓人聯想到我們一般看到的趣味性心理測試。心理測驗是對行為樣本的客觀和標准化的測量,但是效度高,即
G. 什麼叫做信度、效度、標准化
信度是指其可信度,既是在多大程度上是正確的,效度是指能夠多有效的表示所需表達的含義。以一份量表(測量智力,記憶力之類的標准化試卷)為例,其信度就是指同一個人在幾次參加同一份試卷的考試(假設此人並未有改變)分數不會有大的差異,而效度是指這份試卷能勾多大程度測量你的智力水平。再如,用一把尺子來量一個人的體重,其信度是有的,但是沒有效度。如果一個事物具有效度,那一定具有信度,反之則不然
H. 評價量表的評價量表的標准
一、測量精度和測量誤差
測量值是指反映一個對象某個特殊的數值。測量值不是所感興趣的真點值,而是它們的一個觀測。有許多因素都會引起測量誤差,可將觀測值O表示成如下的形式:O=T+S+R
觀測值O和真點值T之間的差距稱為誤差,誤差的大小反映了測量的精度的高低。誤差包括兩部分:系統誤差S和系統誤差R。S是一種偏差,代表著影響觀測值的穩定性因素,每次都以相同的方式影響觀測值。可能產生系統誤差的原因很多。
隨機誤差不穩定。代表看影響觀測值的暫時性因素,次都以不同的形式出現,例如暫時性的人員因素或環境因素等。
二、內容效度、標准則效度和建構效度來評價量表。
內容效度是指量表涵蓋研究主題的程度。調研人員必須檢查量表中的項目能否是夠地覆蓋測量對象的主要方面。為了獲得足夠的內容效度,要特別注意設計量表時應遵循的程序和規則。
內容效度的主觀性使其不能單獨地用來衡量表的效度,但可以用來對觀測結果作大致的評價。一個更好的評價量是下面介紹的准則效度。
准則效度是指量表所得到的數據和其他被選擇的變數的值相比是否有意義。准則變數可以是人文學和心理學特好、態度和行為、以及從其他量表得到的數據。根據時間跨度的不同,准則效度可分為同時效度和預測效度。當量表的測量數據和准則變數的值被同時收集時,使用同時效度。
三、建構效度
建構效度要求對每個特徵的測量背後有足夠的理論支持,並且這些被測量的特徵之間應該有合理的關系。建構效度包括同質效度、異質效度和語意邏輯效度。
同質效度是指量表測量同一特徵的其他測量方法相互關聯的程度。異質效度是指量表和測不同特徵的測量方法不同但理論上有關特徵的測量方法之間相互關聯的程度。
在設計量表時,首先建立一個理論模型,然後從中導出一系列推論、測試,逐漸形成一個由幾個特徵系統地聯系起來的語意邏輯網。從表面上看,就是含有多個有關測量對象測量項目的量表。
四、測量的信度
信度指的是如果重復測量,量表所測結果的一致程度。系統誤差對信度沒什麼影響,因為系統誤差總是以相同的方式影響測量值的,因此不會造成不一致性。隨機誤差可能導致不致性,從而降低信度。信度可以定義為隨機誤差R影響測量值的程度。R=0,就認為測量是完全可信的,信度最高。
一般通過使用同一量表進行不同測量,分析各測量結果之間聯系的方法來評價信度。如果聯系密切,各測量結果具有一致性,則認為量表是可信的。
五、評價信度的方法主要有:再預測量、替換形式、內部一致性方法。
再測信度:用同樣的量表,對同一組訪問對象在盡可量相同的情況下,在不同的時間進行兩次測量。兩次測量相距一般在兩到四周之間。用兩次測量結果間的相關分析或差異的顯著性檢驗方法,可以評價量表信度的高低。結果越是相關,差異越不顯著則信度越高。
替換形式信度:用兩個形式不同的等價量表,對同一組受訪者在不同的時間(通常間隔兩到四周)進行測量。兩次測量結果間的相關性被用來評價量表的信度。
內部一致信度:內部一致信度用於評價累加量表的信度。在這種量表中,各個測量項目的得分被累加以得到一個總分,每個項目都測量整個量表所要測量對象的某個方面,項目之間就它們各自的特徵而言應該是一致的。內部一致信度強調的是組成量表的一組測量項目內部的一致性。
六、效度和信度的關系
效度和信度的關系可以用前面討論過的測量值的構成公式O=T+S+R來理解。如果測量是完全有效的,即0=T,S=0,R=0,此時測量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因為有O=T+R。
量表是完全可信的,可以達到完全有效,也可能達不到,存在導致誤差,缺管信度缺乏效度,但信度的大小並不能體現效度的大小。信度是效度的必要條件,但不是充分條件。從理論的角度來看,量應具有足夠的效度和信度;從實踐的觀點來看,一個好的量表還應該具有實用性。
I. Cronbach系數是什麼意思
克朗巴哈系數(Cronbach's alpha或Cronbach's α)是一個統計量,是指量表所有可能的項目劃分方法的得到的折半信度系數的平均值,是最常用的信度測量方法。它最先被美國教育學家Lee Cronbach在1951年命名。
若一份量表有n題,題間的平均相關系數為r,則此量表的標准化α系數為α=nr/[(n-1)r+1]。通常Cronbachα系數的值在0和1之間。如果α系數不超過0.6,一般認為內部一致信度不足;達到0.7-0.8時表示量表具有相當的信度,達0.8-0.9時說明量表信度非常好。
(9)教育考試對信度的標准有何要求擴展閱讀
Cronbach α系數的一個重要特性是它們值會隨著量表項目的增加而增加,因此,Cronbach α系數可能由於量表中包含多餘的測量項目而被人為地、不適當地提高。
還有一種可以和Cronbach α系數同時使用的系數。系數能夠幫助評價,在計算Cronbach α系數的過程中,平均數的計算是否掩蓋了某些不相關的測量項目。不同的研究者對信度系數的界限值有不同的看法。
J. 情商測試的標准問卷,背景歷史信度效度急啊!!!!!回答好會追加分
有一份,這馬上就可以測一下。
哈佛心理學系博士戴尼爾·高爾曼為此做了一些努力,嘗試出了一些問題,通過對這些問題的回答,您可以獲得一個關於自己的EQ的粗略的感性印象。問題共10個,計分標准見後文,最高分數為200分,一般人的平均分為100分,如果您得了25分以下,最好另找個時間重測一下。
現在,請靜下心來,誠實地回答下面的測題。一定要按照您真正可能會去做的實際去回答,而不要試圖用在學校里獲取的做多項選擇題的技巧去猜哪一個才是對的。好,下面開始!
情商測試題
1. 坐飛機時,突然受到很大的震動,你開始隨著機身左右搖擺。這時候,您會怎樣做呢? A. 繼續讀書或看雜志,或繼續看電影,不太注意正在發生的騷亂。 B. 注意事態的變化,仔細聽播音員的播音,並翻看緊急情況應付手 以備萬一。 C. A和B都有一點。 D. 不能確定--根本沒注意到。
2. 帶一群4歲的孩子去公園玩,其中一個孩子由於別人都不和他玩而大哭起來。這個時候,您該怎麼辦呢? A. 置身事外--讓孩子們自己處理。 B. 和這個孩子交談,並幫助她想辦法。 C. 輕輕地告訴她不要哭。 D. 想辦法轉移這個孩子的注意力,給她一些其他的東西讓她玩。
3. 假設您是一個大學生,想在某門課程上得優秀,但是在其中考試時卻只得了及格。這時候,您該怎麼辦呢? A. 制定一個詳細的學習,並決心按計劃進行 。 B. 決心以後好好學。 C. 告訴自己在這門課上考不好沒什麼大不了的,把精力集中在其他可能考得好的課程上。 D. 去拜訪任課教授,試圖讓他給您高一點的分數。
4. 假設您是一個保險推銷員,去訪問一些有希望成為您的顧客的人。可是一連十五個人都只是對您敷衍,並不明確表態,您變得很失望。這時候,您會怎麼做呢? A. 認為這只不過是一天的遭遇而已,希望明天會有好運氣。 B. 考慮一下自己是否適合做推銷員。 C. 在下一次拜訪時再做努力,保持勤勤懇懇工作的狀態。 D. 考慮去爭取其他的顧客。
5. 您是一個經理,提倡在公司中不要搞種族歧視。一天您偶然聽到有人正在開有關種族歧視的玩笑。您會怎麼辦呢? A. 不理它--這只是一個玩笑而已。 B. 把那人叫到辦公室去,嚴厲斥責他一頓。 C. 當場大聲告訴他,這種玩笑是不恰當的,在您這里是不能容忍的。 D. 建議開玩笑的人去參加一個有關反對種族歧視的培訓班。
6. 您的朋友開車時別人的車突然危險地搶到你們前面,您的朋友勃然大怒,而您試圖讓他平靜下來。您會怎麼做呢? A. 告訴他忘掉它吧--現在沒事了,這不是什麼大不了的事。 B. 放一盤他喜歡聽的磁帶,轉移他的注意力。 C. 一起責罵那個司機,表示自己站在他那一邊。 D. 告訴他您也曾有同樣的經歷,當時您也一樣氣得發瘋,可是後來您看到那個司機出了車禍,被送到醫院急救室。
7. 您和伴侶發生了爭論,兩人激烈地爭吵;盛怒之下,互相進行人身攻擊,雖然你們並不是真的想這樣做。這時候,最好怎麼辦呢? A. 停止20分鍾,然後繼續爭論。 B. 停止爭吵……保持沉默,不管對方說什麼。 C. 向對方說抱歉,並要求他(她)也向您道歉。 D. 先停一會兒,整理一下自己的想法,然後盡可能清楚地闡明自己的立場。
8. 您被分到一個單位當領導,想提出一些解決工作中煩難問題的好方法。這時候,您第一件要做的是什麼呢? A. 起草一個議事日程,以便充分利用和大家在一起討論的時間。 B. 給人們一定的時間相互了解。 C. 讓每一個人說出如何解決問題的想法。 D. 採用一種創造性地發表意見的形式,鼓勵每一個人說出此時進入他腦子里的任何想法,而不管該想法有多瘋狂。
9. 您3歲的兒子非常膽小,實際上,從他出生起就對陌生地方和陌生人有些神經過敏或者說有些恐懼。您該怎麼辦呢? A. 接受他具有害羞氣質的事實,想辦法讓他避開他感到不安的環境。 B. 帶他去看兒童精神科醫生,尋求幫助。 C. 有目的地讓他一下子接觸許多人,帶他到各種陌生的地方,克服他的恐懼心理。 D. 設計漸進的系列挑戰性計劃,每一個相對來說都是容易對付的,從而讓他漸漸懂得他能夠應付陌生的人和陌生的地方。
10. 多年以來,您一起想重學一種您在兒時學過的樂器,而現在只是為了娛樂,您又開始學了。您想最有效的利用時間。您該怎麼做呢? A. 每天堅持嚴格的練習。 B. 選擇能稍微擴展佻的能力的光曲去練習。 C. 只有當自己有情緒的時候才去練習。 D. 選擇遠遠超出您的能力但通過勤奮的努力能掌握的樂曲去練習。
測題答案及解釋
1. 除了D以外的任何一個答案。選擇答案D反映了您在面臨壓力是經常缺少警覺性。A=20,B=20,C=20,D=0。
2. B是最好的選擇。情商高的父母善於利用孩子情緒狀態不好的時機對孩子進行情緒教育,幫助孩子明白是什麼使他們感到不安,他們正在感受的情緒狀態是怎樣的,以及他們能進行的選擇。A=0,B=20,C=0,D=0。
3. A自我激勵的一個標志是能制定一個克服障礙和挫折的計劃,並嚴格執行它。A=20,B=0,C=20,D=0。
4. C為最佳答案。情商高的一個標志是面對挫折時,能把它看成一種可以從中學到東西的挑戰,堅持下去,嘗試新的方法,而不是放棄努力,怨天尤人,變得萎靡不振。A=0,B=0,C=20,D=0。
5. C形成一種歡迎多樣化的氣氛的最有效的方法是公開挑明這一點。當有人違反時,明確告訴他您的組織的規范不容許這種情況發生。不是力圖改變這種偏見(這是一個更困難的任務),而只是讓人們遵照規范去行事。A=0,B=0,C=20,D=0。
6.D有資料表明,當一個人處於憤怒狀態時,使他平靜下來的最有效的辦法是轉移他憤怒的焦點,理解並認可他的感受,用一種不激怒他的方式讓他看清現狀,並給他以希望。A=0,B=5,C=5,D=20。
7.A中斷20分鍾或更長的時間。這是使憤怒引起的生理狀態平息下來的最短時間。否則, 種狀態會歪曲您的理解力,使您更可能出口傷人。平靜了情緒後,你們的討論才會更富有成效。A=20,B=0,C=0,D=0。
8.B當一個組織的成員之間關系融洽、親善,每一個人都感到心情舒暢時,組織的工作效率才會最高。在這種情況下,人們才能自由地做出他們最大的貢獻。A=0,B=20,C=0,D=0。
9.D生來帶有害羞氣質的孩子,如果他們父母能安排一系列漸進的針對他們害羞的挑戰,並且這種挑戰是能逐個應付得了的,那麼他們通常會變得喜歡外出起來。A=0,B=5,C=0,D=20。
10.B給自己適度的挑戰,最有可能激發自己最大的熱情。這既能使您學得愉快,又能使您完成得最好。A=0,B=20,C=0,D=0。
風雨閣伴你走過風風雨雨。