心理測量學(xué)課件

上傳人：子*** IP屬地：未知上傳時間：2024-03-19 格式：PPTX 頁數(shù)：888 大小：5.16MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩883頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

心理測量概論心理測量學(xué)

心理測量的基本性質(zhì)

1測驗的類型與功能

2測驗的編制與實施

3心理測量發(fā)展簡史

4心理測量學(xué)

心理測量的基本性質(zhì)

第一節(jié)心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)

DBCA升學(xué)升級要測驗

應(yīng)聘謀職要測驗執(zhí)業(yè)上崗要測驗晉職晉級要測驗

人生的每個關(guān)鍵時刻都要用到測驗心理測量應(yīng)用的普遍性一、心理測量學(xué)一、心理測量應(yīng)用的普遍性（續(xù)）

4評估人的心理發(fā)展水平有心理成熟測驗評估人的智力發(fā)展水平有智力測驗

評估人的心理健康水平有心理健康測驗評估人的人格特征有人格測驗人心理的各個側(cè)面都有測驗心理測量學(xué)一、心理測量應(yīng)用的普遍性（續(xù)）5評估人的教育水平有教育成就測驗

6評估人的職業(yè)能力有執(zhí)業(yè)資格測驗7評估人的學(xué)術(shù)能力有學(xué)術(shù)性向測驗

三百六十行，行行有測驗心理測量學(xué)一、心理測量應(yīng)用的普遍性（續(xù)）需要更多的專業(yè)人員

社會發(fā)展和進步的標志

心理測量發(fā)展

心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)二、心理的可測性人的心理非物質(zhì)，人的心理可測嗎？

心理測量學(xué)二、心理的可測性（續(xù)）孟子：權(quán)，然后知輕重；度，然后知長短。物皆然，心為甚。桑代克：凡客觀存在的事物都有其數(shù)量。麥考爾：凡有其數(shù)量的事物都可以測量。心理測量學(xué)二、心理的可測性（續(xù)）辯證唯物主義的觀點：

人的外顯行為客觀存在，可以感覺、知覺，進而可以測量。心理學(xué)的研究證明：

可以通過測量人的外顯行為而推測人的心理。

心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)三、心理測量的間接性心理測量是一種間接測量。間接測量必須找準中介媒質(zhì)。物理測量也有間接測量：測氣溫中介媒質(zhì)：水銀心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)三、心理測量的間接性（續(xù)）心理測量的中介媒質(zhì)：人的外顯行為外顯行為：種類眾多而且復(fù)雜多變心理測量的間接測量難度更大。心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)四、心理測量的定義廣義測量定義：

測量是依據(jù)一定的法則使用量具對事物的特征進行定量描述的過程。心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)四、心理測量的定義心理測量定義：

依據(jù)一定的心理學(xué)理論，使用測驗對人的心理品質(zhì)進行定量描述的活動。心理測量學(xué)四、心理測量的定義（續(xù)）定義理解1、心理測量依據(jù)的法則：心理學(xué)理論心理測量學(xué)四、心理測量的定義（續(xù)）定義理解（續(xù)）2、心理測量工具：測驗。測驗的本質(zhì)：一個一個精心設(shè)計、精心編排，被稱為“題目”的行為刺激組成，“測驗”內(nèi)容千差萬別，形式林林總總。

心理測量學(xué)四、心理測量的定義（續(xù)）定義理解（續(xù)）3、測量的對象：人的心理品質(zhì)。心理品質(zhì)具有內(nèi)隱性，概念具有抽象性心理測量所測的心理品質(zhì)實際上是人們的某種理論“構(gòu)念”我們還要在所測對象為何物的界定上下功夫。心理測量學(xué)四、心理測量的定義（續(xù)）定義理解（續(xù)）4、心理測量的結(jié)果：對象的定量描述作為現(xiàn)代科學(xué)的心理測量學(xué)，涉及多門學(xué)科。心理測量學(xué)四、心理測量的定義（續(xù)）1“心理測量”：多指一項活動、一個過程。2“心理測驗”：多指一樣工具，一個測量文本偶爾當動詞用3“心理評估”：指獲取了測量結(jié)果信息后根據(jù)某種標準做出狀態(tài)優(yōu)劣判斷的活動。

區(qū)別本書三詞用法差異心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)五、心理測量的心理影響性心理影響性：無論主觀愿望是什么，只要實施測量，就會給被測量者的心理發(fā)展帶來影響。影響可能是積極的，也可能是消極的，可能是短期的，也可能是長期的。心理測量學(xué)五、心理測量的心理影響性（續(xù)）積極的心理影響：教育測量：準確評價，激勵學(xué)習(xí)。經(jīng)歷測量也是學(xué)習(xí)，有助于提高。心理測量學(xué)五、心理測量的心理影響性（續(xù)）積極的心理影響：人格測驗：了解人格，促使人格健康發(fā)展，促使行為被人悅納。心理測量學(xué)五、心理測量的心理影響性（續(xù)）積極的心理影響：能力傾向測驗：了解特長，選擇和分配合適工作，人、崗和諧匹配。心理測量學(xué)五、心理測量的心理影響性（續(xù)）消極的心理影響：誤用和濫用，使用質(zhì)量低劣的測驗夸大教育考試的作用：為應(yīng)試而學(xué)習(xí)，忽視綜合素質(zhì)發(fā)展。頻繁施行教育考試，學(xué)生疲于應(yīng)付，身心受摧殘。心理測量學(xué)五、心理測量的心理影響性（續(xù)）消極的心理影響（續(xù)）：不科學(xué)解釋智力測驗：盲目樂觀，迷失方向或自暴自棄，喪失動力。不合理使用人格測驗：傷害自尊，甚至導(dǎo)致人格分裂。心理測量學(xué)五、心理測量的心理影響性（續(xù)）消極的心理影響（續(xù)）：使用質(zhì)量低劣測驗：對被試做出錯誤的描述，引發(fā)嚴重后果。結(jié)論：編制、選擇和使用測驗都要非常慎重。

心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)六、心理測量的工具及其特性測驗的本質(zhì)：任何測量工具都是有參照點和測量單位的數(shù)字系統(tǒng)。在心理測量學(xué)中也把它叫做量表。量表的兩要素：參照點、測量單位心理測量學(xué)六、心理測量的工具及其特性（續(xù)）參照點：測量的起點，也稱零點。參照點分類：絕對零點：絕對理解相對零點：測值零只能說品質(zhì)處于“零點”這個狀態(tài)有絕對零點的測量比只有相對零點的測量性能更好優(yōu)良測量單位：有統(tǒng)一的意義，有恒定的價值。心理測量學(xué)六、心理測量的工具及其特性（續(xù)）心理測量量表兩要素的特點：參照點是人為的測量的單位要經(jīng)過統(tǒng)計處理才能有統(tǒng)一意義，有恒定價值心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)七、心理測量誤差存在的普遍性與嚴重性測量的誤差：測量所得值與欲測品質(zhì)實際值之間的差異值。誤差的區(qū)別：誤差的性質(zhì)誤差的大小誤差的來源誤差控制的難度心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)七、心理測量誤差存在的普遍性與嚴重性心理與教育測量誤差：不僅存在而且還非常的嚴重。測量研究主要任務(wù)：研究如何控制測量的誤差。

心理測量學(xué)七、測量誤差存在的普遍性與嚴重性（續(xù)）（一）測量誤差的類型隨機誤差：所得值與實際值之間大小和方向都會隨機變化的差異值。系統(tǒng)誤差：所得值與實際值之間的那種大小和方向都不變的差異值。心理測量學(xué)七、測量誤差存在的普遍性與嚴重性（續(xù)）（一）測量誤差的類型（續(xù)）特點：誤差與實際測量值共居一體、混淆難分。任務(wù)：將它們分離出來，評估它們的大小，研究控制辦法。心理測量學(xué)七、測量誤差存在的普遍性與嚴重性（續(xù)）（二）測量誤差形成的原因1、心理品質(zhì)的特殊性內(nèi)隱、抽象，造成對目標認識不清晰，導(dǎo)致誤差不穩(wěn)定，波動起伏，導(dǎo)致誤差。受測者未掌握正確作答技能，致使作答不能代表真實水平。受測者故意掩飾。致使評價出現(xiàn)誤差。心理測量學(xué)七、測量誤差存在的普遍性與嚴重性（續(xù)）2、使用質(zhì)量不高的測量工具人的外顯行為與人的心理品質(zhì)只具備相關(guān)關(guān)系所測外顯行為不是欲測心理品質(zhì)的代表性行為測驗項目只“刺激”出了欲測心理品質(zhì)的一部分行為外顯行為不清晰、不穩(wěn)定心理測量學(xué)（二）測量誤差形成的原因（續(xù)）3、施測過程和施測環(huán)境安排控制不好施測過程沒有統(tǒng)一要求，測試指導(dǎo)語沒有統(tǒng)一版本，作答起始時間和長短不統(tǒng)一，測試時的內(nèi)外環(huán)境令被試不能集中精力測試過程失控、紀律混亂，舞弊。心理測量學(xué)（二）測量誤差形成的原因（續(xù)）4、主試的不良品質(zhì)主試對所測心理品質(zhì)的理解有誤主試實施的程序有誤評分標準掌握不準確心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)

八、心理測量誤差控制的理論與技術(shù)概述目標真分數(shù)，記為V，是測量者所追求的測量值。隨機誤差分數(shù)，記為E非目標真分數(shù)(系統(tǒng)誤差分數(shù))：記為I目標真分數(shù)與非目標真分數(shù)合在一起稱為真分數(shù)，記為T。心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)

九、心理測量誤差控制的理論與技術(shù)概述（續(xù)）心理與教育測量學(xué)假設(shè)：

進而有：心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)

九、心理測量誤差控制的理論與技術(shù)概述（續(xù)）在三者都相互獨立的假設(shè)下，推得以下兩公式：

心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)

九、心理測量誤差控制的理論與技術(shù)概述（續(xù)）信度：真分數(shù)方差在觀察分數(shù)方差中所占的比，記為：效度：目標真分數(shù)方差在觀察分數(shù)方差中所占的比記為；

心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)

九、心理測量誤差控制的理論與技術(shù)概述（續(xù)）心理測量的誤差控制的任務(wù)：努力控制測量的隨機誤差，提高測量的信度。努力控制測量的隨機誤差和系統(tǒng)誤差，提高測量的效度。心理測量學(xué)第一節(jié)心理測量的基本性質(zhì)

九、心理測量誤差控制的理論與技術(shù)概述（續(xù)）經(jīng)典測量理論（ClassicalTestTheory,CTT）。其他理論：項目反應(yīng)理論（ItemResponseTheory,，TRT）概化理論（JeneralizabilityTheory，GT）心理測量學(xué)第一章心理測量概論測驗的類型與功能

第二節(jié)心理測量學(xué)第二節(jié)測驗的類型與功能

一、按所測心理品質(zhì)不同分類（一）能力測驗1.智力測驗（IntelligenceTest）：

測量人的一般認知能力水平高低的測驗。智力測驗的結(jié)果比較穩(wěn)定。測量理論與技術(shù)研究最早涉及領(lǐng)域心理測量學(xué)（一）能力測驗（續(xù)）1斯坦福-比內(nèi)量表2韋克斯勒智力量表3瑞文推理測驗著名智力測驗

心理測量學(xué)（一）能力測驗（續(xù)）2.能力傾向測驗（AptitudeTest）：能力傾向測驗類型：一般能力傾向測驗：測量個體在多種能力上的潛在優(yōu)勢的測驗。

特殊能力傾向測驗：測量個體在音樂、繪畫等特殊能力上的潛在優(yōu)勢的測驗。心理測量學(xué)（一）能力測驗（續(xù)）2.能力傾向測驗（續(xù)）：能力傾向特點：依賴于先天，與生活經(jīng)驗有關(guān)，一般不受專門教學(xué)或訓(xùn)練影響。

能力傾向測驗性質(zhì)：測值相對穩(wěn)定，具有預(yù)測功能。心理測量學(xué)（一）能力測驗（續(xù)）3.成就測驗（AchievementTests）：成就測驗特點：

在特定領(lǐng)域為檢測應(yīng)試者對有關(guān)知識和技能的掌握程度而設(shè)計的測驗。教學(xué)和訓(xùn)練會明顯改變成就測驗的結(jié)果。成就測驗類型：學(xué)科成就測驗、綜合成就測驗、診斷測驗心理測量學(xué)（一）能力測驗（續(xù)）具體性越來越強抽象性越來越弱穩(wěn)定性越來越差

智力測驗

能力傾向測驗

成就測驗?zāi)芰y驗類型特征：心理測量學(xué)一、按所測心理品質(zhì)不同分類（續(xù)）（二）人格測驗人格測驗（PersonalityTest）：測量個體人格的獨特性和傾向性特征的測驗。心理學(xué)人格概念特征：概念非常廣泛，涉及所有情感和非智力因素。應(yīng)用較廣的人格測驗：自陳人格測驗、人格投射測驗。心理測量學(xué)（二）人格測驗（續(xù)）1艾森克人格問卷（EPQ）2明尼蘇達多相人格調(diào)查表（MMPI）.3卡特爾16種人格因素測驗（16PF）

著名自陳人格測驗

心理測量學(xué)（二）人格測驗（續(xù)）1羅夏墨跡測驗（RIT）著名投射測驗

2主題統(tǒng)覺測驗（TAT）心理測量學(xué)（二）人格測驗（續(xù)）4句字完成測驗3詞語聯(lián)想測驗其他投射測驗

心理測量學(xué)第二節(jié)測驗的類型與功能

二、按對被試評價時所用的參照標準不同分類對被試評價所用的參照標準：相對標準、絕對標準應(yīng)用相對標準的稱作為常模參照測驗應(yīng)用絕對標準的稱作為標準參照測驗心理測量學(xué)二、按評價參照標準不同分類

（一）常模參照測驗（Norm-ReferencedTest）定義：以個體在團體中的相對地位來評價個體發(fā)展水平的測驗。心理測量學(xué)二、按評價參照標準不同分類

（一）常模參照測驗性質(zhì)：執(zhí)行可高可低的相對難度標準，難度的高低決定于團體本身的水平?？赡苁挂恍└呃?、高競爭性測驗難度失控。團體水平發(fā)生變化，常模參照測驗要重新修訂。心理測量學(xué)二、按評價參照標準不同分類

（二）標準參照測驗（Criterion-ReferencedTest）定義：以個體水平是否達到測驗領(lǐng)域某一固定標準來評價個體發(fā)展水平的測驗。心理測量學(xué)二、按評價參照標準不同分類

（二）標準參照測驗（續(xù)）性質(zhì)：使用絕對標準，不因很多個體都已達到而提高標準，也不因很多個體都未達到而降低標準。各種專業(yè)資格測驗都屬于標準參照測驗。心理測量學(xué)二、按評價參照標準不同分類

按評價參照標準不同分類小結(jié)：常模參照和標準參照區(qū)分：理論上絕對，實際應(yīng)用中有二者兼具的。附：潛力參照測驗：定義：以個體可能達到的水平來評價個體已經(jīng)達到水平的測驗。性質(zhì)：符合對個體進行自身激勵的評價思想。

心理測量學(xué)第二節(jié)測驗的類型與功能

三、標準化測驗與非標準化測驗標準化測驗:四個方面的標準化要求測驗編制過程標準化測驗實施標準化測驗評分標準化測驗分數(shù)解釋標準化心理測量學(xué)四個方面的標準化編制過程標準化

標準化測驗編制步驟（六步）：測驗?zāi)繕朔纸饩幹品桨冈O(shè)計命題征題心理測量學(xué)四個方面的標準化編制過程標準化

標準化測驗編制步驟（續(xù)）：測試分析分數(shù)體系設(shè)計與制作測驗使用指導(dǎo)書編寫心理測量學(xué)四個方面的標準化編制過程標準化編制質(zhì)量的標準化：

測驗信度效度要求每個題目的質(zhì)量要求心理測量學(xué)四個方面的標準化（續(xù)）測驗實施標準化：對主試的要求對被試的要求對測試場所內(nèi)外環(huán)境的要求測試過程順序的要求心理測量學(xué)四個方面的標準化（續(xù)）測驗評分標準化：試題要有公認的科學(xué)答案有統(tǒng)一規(guī)范的評分標準心理測量學(xué)四個方面的標準化（續(xù)）測驗分數(shù)解釋標準化：測驗的報告分數(shù)要有明確的解釋方法和解釋依據(jù)。常模參照測驗：配有解釋常模，可以確定每個分數(shù)在團體中的確切地位。標準參照測驗：配有合格分數(shù)線以確定每個分數(shù)的合格與否

。心理測量學(xué)標準化測驗（續(xù)）標準化概念說明：標準化主要都是為了控制測量的隨機誤差和系統(tǒng)誤差。教育與心理測量中“標準化”可以理解為是一系列的嚴格標準，也可以理解為是一個過程—測驗的標準化過程。實際應(yīng)用的測驗是否是標準化測驗必須嚴格鑒別。心理測量學(xué)標準化測驗（續(xù)）標準化測驗特點：編制要求嚴格，測驗編制周期長，人財物投入大，測驗設(shè)計要求面向盡量大的被試群體，使用的針對性、靈活性常常不能滿足要求。心理測量學(xué)三、標準化測驗與非標準化測驗（續(xù)）非標準化測驗特點：編制目的明確、測試對象熟悉、內(nèi)容設(shè)計針對性強、方法靈活多變、編程短不能輕視自編測驗的作用，同時也要努力提高自編測驗的編制質(zhì)量心理測量學(xué)第二節(jié)測驗的類型與功能

四、計算機化測驗與非計算機化測驗（一）計算機化測驗的發(fā)展計算機化測驗：被試在計算機前根據(jù)指令進行作答計算機化測驗特點：實施方便、反饋及時，測驗效率高。非計算機化測驗--傳統(tǒng)的紙筆測驗，還有用武之地。心理測量學(xué)（二）幾種常見的計算機化測驗基于計算機的測驗（Computer-BasedTest，CBT）。由計算機出題，要求被試在計算機前操作作答。各種基于計算機的測驗對計算機的利用程度會有很大不同。除了計算機的形式，基于計算機的測驗的方法、理念與傳統(tǒng)紙筆測驗無本質(zhì)不同。心理測量學(xué)（二）幾種常見的計算機化測驗計算機化自適應(yīng)測驗（ComputerizedAdaptTest，CAT）。一種新的測驗理念：改變傳統(tǒng)測驗千人一面形式針對被試的水平即時調(diào)題、即時施測、即時反饋、即時估算。同時提高測驗的效率和準確率。實現(xiàn)條件：新的測驗理論指導(dǎo)、使用計算機。優(yōu)點明顯，但技術(shù)上也還需進一步完善心理測量學(xué)（二）幾種常見的計算機化測驗基于網(wǎng)絡(luò)的測驗（Internet-bestTest，IBT）基于計算機的測驗或計算機化自適應(yīng)測驗采用網(wǎng)絡(luò)的形式實施遠程測試，則稱其為基于網(wǎng)絡(luò)的測驗。基于網(wǎng)絡(luò)的測驗是當前計算機化測驗發(fā)展的最高形式。心理測量學(xué)五、其它分類

（一）最佳行為測驗和典型行為測驗最佳行為測驗：作答時必須盡能力找到最佳答案。典型行為測驗：作答時要根據(jù)自己平時怎么想、怎么做如實作答。能力測驗是最佳行為測驗，自陳式人格測驗是典型行為測驗。典型行為測驗的誤差控制更為困難心理測量學(xué)五、其它分類

（二）個別測驗與團體測驗個別測驗應(yīng)用：面向特殊被試或在測試中主被試間需不斷交流的測驗。個別測驗特點：耗時費力，一般能用團體測驗就不用個別測驗。教育測驗大多采用團體測驗，但也有例外。心理測驗采用個別測驗的要多一些。心理測量學(xué)五、其它分類

（三）難度測驗與速度測驗（四）文字測驗與非文字測驗（五）主觀題測驗與客觀題測驗（六）預(yù)測測驗（七）行為情境判斷測驗（八）內(nèi)隱聯(lián)想測驗心理測量學(xué)第二節(jié)測驗的類型與功能

測驗類型豐富：反應(yīng)社會需求的復(fù)雜性和旺盛性。測量學(xué)者的任務(wù)：開發(fā)出更多更好的測驗來滿足社會的各種需求。心理測量學(xué)第一章心理測量概論測驗的編制與實施

第三節(jié)心理測量學(xué)一、測驗的編制明確用于：招聘、晉職升級決策？診斷、評價？了解品質(zhì)還是做合格決策？

明確：測能力、人格？能力屬哪個層次？人格哪個側(cè)面？探明品質(zhì)結(jié)構(gòu)明確：測驗對象的社會身份、身心特點、分布的范圍與數(shù)量。

測驗的對象是誰？

測何種心理品質(zhì)？

測驗結(jié)果作何用？

（一）確定測驗?zāi)康?-回答三個問題心理測量學(xué)一、測驗的編制（二）設(shè)計測驗編制方案、制定測驗編制計劃目標：設(shè)計一個科學(xué)、詳細、可行的測驗編制方案科學(xué)：方案從目標到內(nèi)容、到方法都要符合心理學(xué)和心理測量學(xué)原理可行：其一是科學(xué)意義上的可行、其二是主客觀條件意義上的可行心理測量學(xué)一、測驗的編制（二）設(shè)計測驗編制方案、制定測驗編制計劃（續(xù)）

測驗編制方案的內(nèi)容：測驗的方法測驗的類型題型及其分布題量及其分布分數(shù)系統(tǒng)量評價法測驗質(zhì)量總體目標編制流程設(shè)計和要求心理測量學(xué)一、測驗的編制（三）題目編寫測驗題目：基本元素，主體材料。題目類型：客觀題、主觀題題型性質(zhì)和功能：各有不同，有互補傾向。編寫要求：發(fā)揮題型功能，測出欲測心理品質(zhì)心理測量學(xué)一、測驗的編制（三）題目編寫（續(xù)）題干編寫：內(nèi)容科學(xué)、語言精練。作答要求編寫：語言準確無歧義、信號強烈醒目?？陀^題：正確項唯一正確，迷惑項有適度迷惑力。主觀題：保證答案科學(xué)性、評分標準的客觀性。題量分布：題型分布、品質(zhì)或內(nèi)容分布、題目難度分布。

心理測量學(xué)一、測驗的編制（四）測試分析測試分析目的：評估和篩選試題評估篩選指標：定性指標、定量指標。分析決策：留用、修改留用、修改再測、淘汰心理測量學(xué)一、測驗的編制（四）測試分析（續(xù)）定性指標：題目的科學(xué)性、所測心理品質(zhì)的相符性、答案的正確性、表述的準確性等等。定量指標：題目定性質(zhì)量優(yōu)劣的量化指標有各自的定義和計算方法，有各自的質(zhì)量優(yōu)劣標準心理測量學(xué)一、測驗的編制（四）測試分析（續(xù)）測試對象：代表性的樣本，有足夠容量，與正式測試相同的動機水平，在似真環(huán)境中進行。心理測量學(xué)一、測驗的編制（五）組卷組卷要求：1、保證入選試題高質(zhì)量2、嚴格按照設(shè)計好的各種題量分布選調(diào)試題。3、試題順序：題型順序、難度順序、心理品質(zhì)層次順序。目的：有效控制測驗的系統(tǒng)誤差。心理測量學(xué)一、測驗的編制（六）信、效度調(diào)查試卷整體質(zhì)量調(diào)查：信度和效度。信度：只需測驗自身數(shù)據(jù)效度：還需要測驗外部的一些相關(guān)憑證調(diào)查目標：信效度證據(jù)足夠且都達到一定標準。

心理測量學(xué)一、測驗的編制（七）編制測驗分數(shù)系統(tǒng)原始分數(shù)：以測驗內(nèi)容為參照背景，不方便比較分數(shù)轉(zhuǎn)換：1、獲取以被試群體為參照背景的分數(shù)。2、獲取以某種客觀標準為參照背景的分數(shù)。報告分數(shù)：方便比較、方便理解和解釋。心理測量學(xué)一、測驗的編制（八）編寫測驗使用手冊：指導(dǎo)正確使用手冊內(nèi)容（10項）：1、測驗?zāi)康呐c性質(zhì)說明；2、適用對象說明；3、測驗內(nèi)容結(jié)構(gòu)、題型結(jié)構(gòu)介紹；心理測量學(xué)一、測驗的編制（八）編寫測驗使用手冊：指導(dǎo)正確使用手冊內(nèi)容（續(xù)）：4、測驗編制方法介紹；5、測驗施測方法說明；6、評分方法與標準說明；7、測試對象范圍、數(shù)量、來源、抽樣方法說明；心理測量學(xué)一、測驗的編制（八）編寫測驗使用手冊：指導(dǎo)正確使用手冊內(nèi)容（續(xù)）：8、測驗信、效度報告；9、分數(shù)系統(tǒng)編制方法及分數(shù)解釋方法介紹；10、測驗使用人員資質(zhì)要求說明。心理測量學(xué)一、測驗的編制（九）編制測驗備份測驗備份：正式測驗的平行復(fù)份。平行復(fù)份不同處：表面文字內(nèi)容相同處：所測心理品質(zhì)內(nèi)容結(jié)構(gòu)難度結(jié)構(gòu)題型結(jié)構(gòu)信度效度心理測量學(xué)一、測驗的編制（九）編制測驗備份（續(xù)）測驗備份目的：應(yīng)付突發(fā)事件特殊研究需要取得更可靠結(jié)果測驗備份的編制：

與正式測驗有完全相同的過程和標準。心理測量學(xué)二、測驗的實施（一）選擇測驗測驗內(nèi)容和報告分數(shù)形式是否符合測驗?zāi)康模繙y驗形式和方法是否適合被試心身特點？測驗的信度和效度是否達到標準？有無所需特殊資質(zhì)技術(shù)人員？心理測量學(xué)二、測驗的實施（二）實際施測施測相對簡單：教育測驗、團體測驗、紙筆測驗施測較為復(fù)雜：心理測驗、個別測驗、操作測驗規(guī)范目的：控制各種可能誤差，提高測驗信效度。心理測量學(xué)二、測驗的實施（二）實際施測(續(xù))施測要求：由具備相應(yīng)資質(zhì)的技術(shù)人員實施按照測驗指導(dǎo)書的要求按步驟實施規(guī)范：測驗環(huán)境布置指導(dǎo)語宣講測驗材料發(fā)放測驗進程控制心理測量學(xué)二、測驗的實施（三）評分評分要求：按照測驗指導(dǎo)書規(guī)定的方法和標準進行客觀題交由計算機評分，主觀題主要采用人工評閱心理測驗：具備相應(yīng)資質(zhì)的技術(shù)人員評閱大規(guī)模教育測驗：篩選閱卷員嚴格培訓(xùn)統(tǒng)一評分標準閱卷質(zhì)量監(jiān)控網(wǎng)上閱卷系統(tǒng)電子閱卷員系統(tǒng)心理測量學(xué)二、測驗的實施（四）測驗結(jié)果解釋注意常模參照測驗與標準參照測驗報告的不同。解釋要有辯證思維，不要絕對化，更不要標簽化。善于在個體內(nèi)部作比較，強調(diào)優(yōu)勢品質(zhì)，鼓勵改善劣勢品質(zhì)。以發(fā)展的眼光解釋測驗結(jié)果，防止負面影響。心理測量學(xué)第三節(jié)測驗的編制與實施

三、測驗編制與實施中的法律與道德問題（一）為維護社會公平而努力保證測驗質(zhì)量因為測量嚴重不準導(dǎo)致決策不公，是測量工作者的法律與道德責(zé)任。心理測量學(xué)三、編制與實施中的法律與道德問題為了保證測驗質(zhì)量，要防止：因粗制濫造而導(dǎo)致測驗結(jié)果嚴重不準；題目內(nèi)容有文化、職業(yè)或宗教偏見；某些群體數(shù)據(jù)失實、或缺失，導(dǎo)致常模失準。心理測量學(xué)三、編制與實施中的法律與道德問題為了保證測驗質(zhì)量，要防止（續(xù)）：因不精心或別有用心而選用粗制濫造的測驗；因不精心或別有用心而導(dǎo)致測試過程失控。無相應(yīng)資質(zhì)人員主持測驗。心理測量學(xué)三、編制與實施中的法律與道德問題（二）為保護個人權(quán)益而尊重測驗對象的選擇要征求被試是否愿意參加測驗，沒有權(quán)利強迫個體參加測驗。要尊重被試的作答選擇，不能干涉被試的作答。使用被試信息和怎么使用被試信息都要有被試的授權(quán)。心理測量學(xué)三、編制與實施中的法律與道德問題（三）為保證測驗的安全而嚴守測驗的秘密測驗泄密后果嚴重：能力測驗泄密，造成虛高能力評價。人格測驗泄密，造成虛假的人格評價。高競爭性測驗泄密，造成社會不公。心理測量學(xué)三、編制與實施中的法律與道德問題（三）嚴守測驗的秘密（續(xù)）重要測驗為國家機密，受法律保護。為了尊重著作權(quán)，維護社會公正，遵守職業(yè)道德有義務(wù)保證測驗的安全、嚴守測驗的秘密，不向他人傳送任何測驗信息。心理測量學(xué)三、編制與實施中的法律與道德問題1心理測驗管理條例中國心理學(xué)會有關(guān)測驗的兩個重要文件：2心理測驗工作者的道德準則心理測量學(xué)第一章心理測量概論心理測量發(fā)展簡史

第四節(jié)心理測量學(xué)第四節(jié)心理測量發(fā)展簡史一、中國古代的心理測量思想（一）個體差異及其可測性思想（二）人才的內(nèi)涵及其測量方法（三）心理與教育測量的實踐活動心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（一）個體差異及其可測性思想孔子：“性相近，習(xí)相遠。”；孟子：“權(quán)，然后知輕重；度，然后知長短。物皆然，心為甚?！毙睦頊y量學(xué)第四節(jié)心理測量發(fā)展簡史（二）人才的內(nèi)涵及其測量方法三國時的魏人劉劭：“夫圣賢之所美，莫美乎聰明。聰明之所貴，莫貴乎知人。知人誠智，則眾材得其序，而庶績之業(yè)興矣?！彼讶说男袨楸憩F(xiàn)概括為9種，稱為“九征”。提出“八觀”和“五視”的觀察方法識別人才。心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（三）心理測量的實踐活動孔子：將人的智力分成三個等級，即中上之人、中人和中下之人；不得中行而與之，必也狂狷乎？狂者進取，狷者有所不為也。董仲舒：“一手畫方，一手畫圓，莫能成?！眲③浚骸度宋镏尽肺髦埽骸皣鴮W(xué)”心理測量學(xué)第四節(jié)心理測量發(fā)展簡史古代中國心理測量的特點：1.描述性的，定性的，而非定量的；2.分類式的；3.注重對人作整體的鑒定和評價，并傾向于和人的道德品質(zhì)聯(lián)系起來；4.具有強烈的應(yīng)用性質(zhì)。心理測量學(xué)第四節(jié)心理測量發(fā)展簡史二、現(xiàn)代心理測量在西方國家的產(chǎn)生與發(fā)展（一）心理測量的產(chǎn)生是社會的需要（二）心理測量的早期探索者（三）心理測量的發(fā)展（四）心理測量發(fā)展的當代趨勢心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（一）心理測量的產(chǎn)生是社會的需要工業(yè)革命成功后，對勞動力的需求急劇增加；19世紀，科學(xué)的發(fā)展和歐洲人道主義思想的廣泛傳播。心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（二）心理測量的早期探索者1.德國：馮特（W.Wundt）2.英國：高爾頓（F.Galton）3.美國：卡特爾（JamesM.Cattell）4.法國：比納（A.Binet）和西蒙（T.Simon）心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（三）心理測量的發(fā)展斯坦福大學(xué)推孟（L.M.Terman）教授1916年修訂斯坦福-比納量表；桑代克（E.L.Thorndike）編制了第一個標準化的教育成就測驗；人格測驗的先驅(qū)克雷佩林（E.Kraepelin），他最早用自由聯(lián)想測驗來診斷精神病患者。心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（四）心理測量發(fā)展的當代趨勢1.實驗法和測驗法相結(jié)合，產(chǎn)生了信息加工測驗；2.計算機測試代替紙筆測試；3.項目反應(yīng)理論和概化理論等現(xiàn)代測量理論的產(chǎn)生；4.新一代測驗理論心理測量學(xué)第四節(jié)心理測量發(fā)展簡史三、現(xiàn)代心理測量在中國的發(fā)展（一）二十世紀前半葉的初步繁榮（二）二十世紀后半葉的再度繁榮與發(fā)展心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（一）二十世紀前半葉的初步繁榮對西方心理測驗量表的介紹和翻譯，以及修訂和編制了多種智力測驗、人格測驗及教育測驗；出版的有關(guān)心理測量方面的著作達到了20多種。心理測量學(xué)第四節(jié)心理測量發(fā)展簡史（二）二十世紀后半葉的再度繁榮與發(fā)展1.理論方面的發(fā)展經(jīng)典測量理論、項目反應(yīng)理論、概化理論、新一代測驗理論2.心理測量的實踐作用測驗編制、教育及社會考試、人才選拔和人事測評心理測量學(xué)本章小結(jié)

心理測量學(xué)研究內(nèi)容：如何編制測驗，如何實施測驗，如何控制測量誤差，提高測驗質(zhì)量。心理測量學(xué)本章小結(jié)心理測量主要性質(zhì):心理測量是間接測量。測量有兩個要素，心理與教育測量的參照點是相對的，測量單位很難恒定。任何測量都有誤差，測量的誤差包括隨機誤差和系統(tǒng)誤差兩種。心理測驗依據(jù)不同指標可做許多不同分類。

心理測量學(xué)本章小結(jié)測量學(xué)工作者的社會責(zé)任：測量學(xué)者關(guān)注測驗編制與實施中的法律與道德問題。測量學(xué)者還從測量及測量學(xué)發(fā)展史中汲取經(jīng)驗和教訓(xùn)，升華品質(zhì)與修養(yǎng)。心理測量學(xué)本章小結(jié)測量學(xué)工作者的社會責(zé)任：測量學(xué)者關(guān)注測驗編制與實施中的法律與道德問題。測量學(xué)者還從測量及測量學(xué)發(fā)展史中汲取經(jīng)驗和教訓(xùn)，升華品質(zhì)與修養(yǎng)。心理測量學(xué)本章小結(jié)測量學(xué)發(fā)展的啟示：我國測量活動歷史悠久現(xiàn)代測量學(xué)發(fā)端于西方心理測量學(xué)者還從測量以及測量學(xué)的發(fā)展歷史中汲取經(jīng)驗和教訓(xùn)，升華品質(zhì)與修養(yǎng)。心理測量學(xué)第一章心理測量概論討論題：1、為什么說人的心理是可測的，心理可測的意義何在？2、分析心理測量誤差的類型與來源，試說控制方法。3、你從心理測量發(fā)展歷史的介紹中感悟到了什么？心理測量學(xué)第一章心理測量概論本章參考文獻[1]安妮?安娜斯塔西，蘇珊娜?厄比納著，廖小春，竺培梁譯.心理測驗[M].杭州：浙江教育出版社，2001.[2]金瑜.心理測量[M].上海：華東師范大學(xué)出版社，2001.[3]戴海崎，張鋒，陳雪楓.心理與教育測量[M].廣州：暨南大學(xué)出版社，2003.[4]鄭日昌，蔡永紅，周益群.心理測量學(xué)[M].北京：人民教育出版社，1999.第一節(jié)信度概述

一、信度與測量誤差1.經(jīng)典測量理論的假設(shè)式中，X為觀察分數(shù)，T為一般真分數(shù)，E為隨機誤差分數(shù)，V為目標真分數(shù)，I為非目標真分數(shù)（系統(tǒng)誤差）。

第一節(jié)信度的概述一、信度與測量誤差2.信度的定義測量追求的初步目標：T占X的比例越大越好。測量追求的終極目標：V占X的比例越大越好。第一節(jié)信度的概述當T占X的比例很大時，那么測值就會是穩(wěn)定的。一般來說，穩(wěn)定的測值是可靠的、可信的，因此，信度可被認為是測量結(jié)果的穩(wěn)定性程度。一、信度與測量誤差2.信度的定義第一節(jié)信度的概述信度（reliability）是指在不同時間，使用同一測驗，或者使用兩個不同項目的等值測驗，抑或在其他不同的測試條件下，對同一組被試實施兩次或多次測試所得分數(shù)的一致性。測驗信度表示測驗分數(shù)中個體差異可歸因于所測特質(zhì)中“真實”差異的程度，以及可歸因于隨機誤差的程度。二、信度的統(tǒng)計定義1.經(jīng)典測量理論假設(shè)的推論第一節(jié)信度的概述二、信度的統(tǒng)計定義2.信度的統(tǒng)計定義定義1：信度是被試團體真分數(shù)方差與實得分數(shù)方差之比定義2：信度是被試團體真分數(shù)與實得分數(shù)相關(guān)系數(shù)的平方定義3：信度是一個測驗X（A卷）與它的任意一個平行測驗（B卷）的相關(guān)系數(shù)第一節(jié)信度的概述三、描述信度的指標1.經(jīng)典測量理論的信度系數(shù)信度系數(shù)是表示測量結(jié)果的穩(wěn)定性程度的指標。記為：第一節(jié)信度的概述信度系數(shù)的值域：[0,1]沒有百分之百可靠的測量，因此，rXX=1只是理論上的值，實際當中是不會存在的。？相關(guān)系數(shù)的值域是[-1,+1]，信度系數(shù)的值域：[0,1]，為什么？三、描述信度的指標1.經(jīng)典測量理論的信度系數(shù)（1）重測信度（test-retestcoefficients），是指用同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度，其大小等于同一組被試在兩次測驗上所得分數(shù)的相關(guān)系數(shù)。（2）復(fù)本信度（alternative--formcoefficients），是指兩個平行的測驗測量同一批被試所得結(jié)果的一致性程度，其大小等于同一批被試在兩個復(fù)本測驗上所得分數(shù)的相關(guān)系數(shù)。（3）內(nèi)部一致性系數(shù)（internalconsistencycoefficients）也叫同質(zhì)性信度（homogeneityreliability），是指測驗內(nèi)部所有題目間的一致性程度，主要的計算方法有KR20公式、KR21公式、克龍巴赫α系數(shù)，以及荷伊特信度等。第一節(jié)信度的概述三、描述信度的指標2.經(jīng)典測量理論的測量標準誤測量標準誤差（standarderrorofmeasurement）是測量誤差的假設(shè)分布的標準差。用下列公式能夠容易地計算測量標準誤差：第一節(jié)信度的概述式中，SDt表示測驗分數(shù)的標準差，rXX表示信度系數(shù)。3.概化理論的概化系數(shù)（generaliabilitycoefficients）4.IRT的測驗信息函數(shù)（testinformationfunction）四、分析測驗信度應(yīng)注意的問題1.針對測驗類型選用恰當指標（1）傳統(tǒng)的信度概念適合于常模參照測驗，這種測驗的主要目的是為了區(qū)分個體在特定特征上所表現(xiàn)出的差異性。個體在測驗分數(shù)中表現(xiàn)出的差異范圍越大，該測驗的信度也就越高。第一節(jié)信度的概述四、分析測驗信度應(yīng)注意的問題1.針對測驗類型選用恰當指標（2）標準參照測驗（內(nèi)容參照或領(lǐng)域參照測驗）的目標是要確定被試是否達到或未達到某個標準，從而將個體分到不同的組別：“達標”和“未達標”。這種情況下，傳統(tǒng)的重測信度、復(fù)本信度以及內(nèi)部一致性系數(shù)就不再適用。標準參照測驗可根據(jù)具體情況分別采用如下指標：適用于簡單的掌握與否的兩分決策，即所有的分類誤差都被認為同樣嚴重而不管它們離開臨界分數(shù)的距離。在這種情況下，可以使用平行型式進行再測，以便得出在兩次測驗上得到相同決策的個體的百分比，進一步可算得分類一致性系數(shù)（coefficientofagreement）。

第一節(jié)信度的概述四、分析測驗信度應(yīng)注意的問題1.針對測驗類型選用恰當指標不僅僅關(guān)心對掌握者和未掌握者的質(zhì)的區(qū)分，同時也在分數(shù)連續(xù)體上描述了關(guān)于掌握和未掌握的量的差異。這類信度主要采用K2(X,T)指標：

第一節(jié)信度的概述式中，、分別為被試總體在測驗上的真分數(shù)方差和觀測分數(shù)方差；、分別為真分數(shù)和觀測分數(shù)的平均值；ng為測驗題目數(shù)，c是以做對題目百分比表示的區(qū)分標準。四、分析測驗信度應(yīng)注意的問題1.針對測驗類型選用恰當指標K2(X,T)值越大，說明觀測分與區(qū)分標準分數(shù)（劃界分數(shù)）之間的差異代表真分數(shù)的對應(yīng)差異量的可能性越大，因而觀測分與劃界分數(shù)的差異就越能反映真實能力上的差異。換言之，測驗就更可信。就單個測驗的結(jié)果而言，K2(X,T)的計算公式如下：第一節(jié)信度的概述式中，是由庫德－理查德KR20公式求出的信度系數(shù)，其余符號意義同前。四、分析測驗信度應(yīng)注意的問題1.針對測驗類型選用恰當指標（3）在純速度測驗（speedtest）中，個體差異完全取決于速度，此時，就無法恰當?shù)亟忉屖y一次測驗的信度系數(shù)。如果條件許可，可采用重測法或是復(fù)本法，這是比較合適的。分半法也可以使用，但是此時的分半是按時間分半，而不是按照項目來分半。也就是，兩半分數(shù)必須根據(jù)分別規(guī)定時間的兩個半測驗。例如，可以把奇偶項目分別印制在兩張卷上，每組項目的用時為全測驗的一半。這種方法等于在同一時間實施了兩個等值測驗。

第一節(jié)信度的概述四、分析測驗信度應(yīng)注意的問題1.針對測驗類型選用恰當指標還有一種替代實施兩個半測驗的方法，就是把總時間四等分，算出每段時間的分數(shù)。這種方法簡便易行，施測時每當主試發(fā)出事先安排的信號，就要測驗參加進在他們正在做的項目上打個記號。然后，把第一段和第四段時間內(nèi)答對的項目數(shù)相加，得出一個半測驗分數(shù)；把第二段和第三段時間內(nèi)答對的項目數(shù)相加，得出另一個半測驗分數(shù)。四段時間如此相加，往往可以平衡練習(xí)、疲勞和其他因素的累積效應(yīng)。特別是當項目難度水平前后一致，而不是逐漸增加時，這種方法尤其令人滿意。第一節(jié)信度的概述四、分析測驗信度應(yīng)注意的問題2.信度的報告（1）任何一個信度系數(shù)是針對引起測驗誤差的特定因素而言的。有多少種影響測驗分數(shù)的條件，就有多少種測驗信度，因此，報告信度時，應(yīng)該詳細說明測試樣本的特性和所報告的信度類型。在信度報告時只是報告信度系數(shù)，而缺乏說明估算系數(shù)的方法細節(jié)，推導(dǎo)系數(shù)時所用的被試群體的特征，以及獲取數(shù)據(jù)當時的施測條件，等等，這種信度報告是不合格的。

第一節(jié)信度的概述四、分析測驗信度應(yīng)注意的問題2.信度的報告（2）沒有一個單一的、最優(yōu)的方法來量化信度，沒有一個單獨的指數(shù)能恰當?shù)乇磉_所有的相關(guān)事實，沒有一個單獨的研究方法在所有的情形下都是最佳選擇，且測驗編制者也不應(yīng)局限于將某一種方法運用到任何一種測量手段上去。所以，測驗編制者在報告測驗信度時，可以從多方面予以報告。

第一節(jié)信度的概述四、分析測驗信度應(yīng)注意的問題2.信度的報告（3）提供詳細的信度分析報告，讓了解相關(guān)知識的人能夠?qū)Y(jié)果進行評定，并能夠重復(fù)信度分析的過程。

例如，簡單說一句“某測驗的信度是0.92”是不能接受的。較恰當?shù)恼f法是“某測驗的信度系數(shù)為0.92，該數(shù)值是通過計算一份能力測驗間隔兩周兩次測試成績的相關(guān)系數(shù)得出的。數(shù)據(jù)來源是從某市隨機抽取的500名小學(xué)5年級的學(xué)生施測……”。第一節(jié)信度的概述五、信度的標準與作用1.信度是評價測驗質(zhì)量的重要指標之一。測驗類型

信度系數(shù)

低中高學(xué)業(yè)成就測驗0.660.920.98學(xué)術(shù)能力測驗0.560.900.97特殊能力傾向測驗0.260.880.96人格測驗0.460.850.97興趣測驗0.420.840.93態(tài)度測驗0.470.790.98注：表中數(shù)據(jù)來源，LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.第一節(jié)信度的概述五、信度的標準與作用2.信度是測量過程中所存在的隨機誤差大小的反映。第一節(jié)信度的概述例如，我們已知高考文科試卷的總信度rXX

=0.965，文科考生總分的標準差為53.42,那么，文科考試成績的標準誤為：3.信度可以用來解釋個人測驗分數(shù)的意義——測量標準誤。如果某生的考試成績?yōu)?95分，在置信度為0.95時，其真分數(shù)的置信區(qū)間為：五、信度的標準與作用4.信度可以幫助進行不同測驗分數(shù)的比較。第一節(jié)信度的概述考察兩個分數(shù)的差異是否可靠，是否真有差異的問題。比如，某人的物理成績是否真的優(yōu)于化學(xué)？某人的數(shù)學(xué)技能本學(xué)期是否真有進步？某人在韋氏智力量表上操作智商與言語智商的差異是否真有顯著意義等。

當兩測驗的方差相等時，差異分數(shù)的信度系數(shù)可用如下公式求出：式中，rXXdiff是差異分數(shù)的信度系數(shù)；rXX和rYY是兩個測驗各自的信度系數(shù)；rXY是兩測驗間的相關(guān)系數(shù)。五、信度的標準與作用4.信度可以幫助進行不同測驗分數(shù)的比較。第一節(jié)信度的概述差異分數(shù)的測量標準誤可用如下公式求出：式中，SEdiff是差異分數(shù)的測量標準誤；rXX和rYY是兩個測驗各自的信度系數(shù)；SD是兩測驗間使用的相同的標準差。在比較分數(shù)之前，必須將兩個測驗分數(shù)轉(zhuǎn)為具有相同量表的標準分數(shù)。五、信度的標準與作用4.信度可以幫助進行不同測驗分數(shù)的比較。第一節(jié)信度的概述例如，在韋氏成人智力量表中，言語和操作分測驗的信度為0.97和0.93，而它們的智商的平均數(shù)為100,標準差為15,故言語和操作智商差數(shù)的標準誤為：因為4.74×1.96＝9.29,因此，言語和操作智商相差10分時，在0.05水平上，我們說存在顯著差異。若要在0.01水平上作出差異顯著的結(jié)論，就要相差13分。？測驗分數(shù)的比較與平均數(shù)差異顯著性檢驗是一回事嗎？第二節(jié)信度的種類

與評估方法詳細介紹第一節(jié)中提出的各種信度估計方法的計算。一、重測信度1.含義同一個測量工具在兩個不同時間對同一組被試施測所得結(jié)果的一致性程度。重測信度主要考察了一個測量工具是否能夠保證在不同時間測量結(jié)果的一致性，他反映了測量工具的結(jié)果受到時間間隔因素影響的大小。一般來說，重測的時間間隔越短，那么各種施測情境的變化就越小，重測信度系數(shù)就會越大。重測信度系數(shù)較大時，說明該測量工具前、后兩次的測量結(jié)果比較一致。結(jié)果具有較好的跨時間上的穩(wěn)定性。第二節(jié)測驗信度的種類與評估方法一、重測信度2.評估方法重測信度的大小可以通過計算測量工具的重測系數(shù)（test-retestcoefficient）或叫穩(wěn)定性系數(shù)（coefficientofstability）來標志。具體來說，就是求取同一組被試在兩個不同時間施測同一個測量工具所得結(jié)果分數(shù)的相關(guān)系數(shù)。第二節(jié)測驗信度的種類與評估方法一、重測信度3.應(yīng)用條件測量工具所測量的個體心理特質(zhì)在時間上應(yīng)該是相對穩(wěn)定的。測量工具所測量的個體心理特質(zhì)應(yīng)該不存在明顯的練習(xí)效應(yīng)和遺忘效應(yīng)。在兩次施測間隔期間不應(yīng)該進行專門的訓(xùn)練和培訓(xùn)，以保證重測信度反映的是隨機因素的影響效應(yīng)。第二節(jié)測驗信度的種類與評估方法一、重測信度4.使用重測信度時需要注意的問題兩次施測時間間隔的長短會影響重測信度系數(shù)估計值的大小，因此，在報告重測信度系數(shù)時應(yīng)該報告間隔的時間長度。應(yīng)該根據(jù)已有的相關(guān)研究結(jié)論考慮所測心理特質(zhì)本身的穩(wěn)定性程度，以確定前后兩次施測時間的間隔究竟應(yīng)該多長比較合適時，不應(yīng)該隨便選擇間隔時間的長短。第二節(jié)測驗信度的種類與評估方法二、復(fù)本信度1.含義兩個平行的測驗（復(fù)本測驗）測量同一批被試所得結(jié)果的一致性程度。復(fù)本信度反映了由于題目的不同以及時間間隔所導(dǎo)致的測量誤差。平行測驗或復(fù)本測驗指的是兩個在題目內(nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語、時限以及所用的例題、公式和測驗等其他方面都相同或相似的測驗。也就是用不同的題目測量同樣的內(nèi)容而且其測驗結(jié)果的平均值和標準差都相同的兩個測驗。第二節(jié)測驗信度的種類與評估方法二、復(fù)本信度2.評估方法復(fù)本信度的估計過程就是計算同一批被試在兩個平行的復(fù)本測驗上所得分數(shù)的相關(guān)系數(shù)，也叫作等價系數(shù)（coefficientofequivalence）。測試設(shè)計：同時測試和延時測試。同時測試是在同一個時間段內(nèi)進行測試，而延時測試則是在兩個時間段進行測試，同時測試可能會存在作答疲勞的效應(yīng)，而延時測試則可能會存在學(xué)習(xí)或培訓(xùn)效應(yīng)。第二節(jié)測驗信度的種類與評估方法二、復(fù)本信度3.應(yīng)用條件要構(gòu)造出兩份或兩份以上真正平行的測驗;計算復(fù)本信度需要對同一批被試測試兩份平行測驗，這就需要掌握一個合理的時間安排。應(yīng)該盡量在測試結(jié)果報告中，詳盡地說明兩次測試的時間間隔、測試順序安排、測試過程中被試的有關(guān)測驗經(jīng)歷等。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度1.含義內(nèi)部一致性信度主要評價了測驗各隨機組成部分之間是否測量了相同的心理特質(zhì)，因此，它反映的是題目內(nèi)容的抽樣一致性程度。具體估計方法主要包括分半信度評估法、庫德-理查森信度評估法、克龍巴赫Alpha系數(shù)評估法。與重測信度和復(fù)本信度不同，在估計測驗的內(nèi)部一致性信度時，只要用同一個測驗對一批被試測試一次。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度2.分半信度含義我們總是可以把一個測驗的所有題目隨機地劃分成對半的兩個部分，然后估計所有被試在這兩個部分題目上得分的一致性程度，這樣得到的測驗一致性估計稱為分半信度。分半信度評價了測驗兩個隨機組成部分的題目是否測量了相同的心理特質(zhì)。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度2.分半信度評估方法計算出被試在測驗兩個隨機組成部分的題目上得分之間的相關(guān)系數(shù)。由于在用分半測驗得分計算相關(guān)系數(shù)時，測驗題量被縮短，信度系數(shù)需要通過以下這個公式對分半相關(guān)系數(shù)進行矯正而得到。為兩個分半測驗之間的相關(guān)系數(shù)，為完整長度測驗的信度系數(shù)估計值。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度2.分半信度評估方法另外一個估計分半信度系數(shù)的方法是Rulon公式，他只需要計算所有被試在兩部分測驗上得分之差的方差以及總分方差：式中，為完整測驗的信度估計值，為被試在兩部分測驗上得分之差的方差，為完整測驗總分方差。

Rulon公式中分子方差反映了由于題目不同等條件帶來的誤差方差，他與總方差之比反映了誤差方差在總方差中所占的比例。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度2.分半信度使用時需注意的問題在估計測驗的分半信度時，雖然要求把一個測驗的所有題目隨機地劃分成對半的兩個部分，但是在實踐中對測驗分半時，為了盡量減少無關(guān)因素的影響，通常需要考慮題型、題分、題目測試先后順序等因素的平衡問題，比如按照題目順序奇偶分半就是一個經(jīng)常選擇的方法第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度3.庫德-理查森信度含義在估計分半信度時，把一個測驗的題目分成兩半的方式是非常多的。而每種分半方式得到的信度估計值總會存在一些差異，但我們無法知道究竟哪種分半結(jié)果所得到的信度估計值是最合適的。估計所有可能的分半信度系數(shù)的平均數(shù)，作為完整測驗的內(nèi)部一致性最佳估計值。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度3.庫德-理查森信度評估方法：所有分半信度系數(shù)的平均數(shù)的估計方法。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度3.庫德-理查森信度使用條件Kuder-Richardson信度系數(shù)的估計只能針對1、0記分題型，對于其他題型需要使用更加一般化的估計方法。K-R21公式假設(shè)測驗中所有項目的難度是相同的。Kuder-Richardson信度反映的是項目間一致性程度，他會嚴重地受到測驗所測行為特質(zhì)的同質(zhì)性程度的影響。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度4.Cronbach’sAlpha系數(shù)含義是一種比Kuder-Richardson方法更加一般化的信度估計方法，它可以針對各種記分方式的題型進行估計。第二節(jié)測驗信度的種類與評估方法三、內(nèi)部一致性信度4.Cronbach’sAlpha系數(shù)評估方法第二節(jié)測驗信度的種類與評估方法公式中，k是測驗題目個數(shù)，是被試在題目i上得分的方差，是被試測驗總分方差。三、內(nèi)部一致性信度4.Cronbach’sAlpha系數(shù)使用條件可以估計各種記分方式的測驗內(nèi)部一致性信度系數(shù)，是更一般化的測驗內(nèi)部一致性信度系數(shù)估計方法。第二節(jié)測驗信度的種類與評估方法四、評分者信度1.含義在評價通過主觀評分方式得到的分數(shù)時，我們必須了解不同的評分者在評價被試作答反應(yīng)時給的分數(shù)值的一致性程度（信度）。一般的客觀型題目在評分時很少出現(xiàn)誤差，然而，對于諸如作文測驗、語言類測驗、以及其他的評價性測驗（如人格特質(zhì)評級、投射測驗評分等），這些測驗類型的評分過程就顯得非常主觀。第二節(jié)測驗信度的種類與評估方法四、評分者信度2.評估方法兩個評分者時：計算這兩個評分者評定分數(shù)之間的相關(guān)系數(shù)。多個評價者評價同一批被試：計算和諧系數(shù)。第二節(jié)測驗信度的種類與評估方法五、信度系數(shù)及其估計方法小結(jié)1.測試次數(shù)和測試卷份數(shù)與信度系數(shù)估計方法第二節(jié)測驗信度的種類與評估方法測試次數(shù)測試卷份數(shù)1份2份1次分半信度Kuder-Richardson信度Alpha系數(shù)復(fù)本信度（同時測試）2次重測信度復(fù)本信度（延時測試）五、信度系數(shù)及其估計方法小結(jié)2.各種信度估計方法的誤差方差來源第二節(jié)測驗信度的種類與評估方法復(fù)本信度（延時測試）復(fù)本信度（延時測試）重測信度復(fù)本信度（同時測試）復(fù)本信度（延時測試）分半信度Kuder-Richardson

和Alpha系數(shù)評分者信度時間間隔題目內(nèi)容時間間隔與題目內(nèi)容題目內(nèi)容題目內(nèi)容與心理行為特質(zhì)的同質(zhì)性評分者間差異第三節(jié)測量的隨機誤差控制一、影響測量信度的因素影響測量信度的因素施測間隔的時間被試主試施測情境測量工具第三節(jié)測量的隨機誤差控制二、提高測驗信度的常用方法提高測驗信度的常用方法規(guī)范施測程度、統(tǒng)一施測環(huán)境適當增加測驗的長度控制試題的難度分布努力提高每道題的區(qū)分度維持測驗的同質(zhì)性努力提高測驗在被試中各個同質(zhì)亞團體上的信度保證被試有充裕的作答時間嚴格控制評分誤差第三節(jié)測量的隨機誤差控制第四節(jié)評分者信度及

評分誤差的控制一、評分誤差存在的嚴重性嚴重到什么程度？歷史教授的答案被評閱為“不及格”高考作文《一幅漫畫的啟示》，67位評閱者，6至25分都有，最高分與最低分相差19分1984年，高考作文評分調(diào)查，438位老師，4篇作文，。最高得分為41.25，最低分為20.75，標準差為2.98。1985年，對1984年的四篇作文再研究，347位老師（有部分年參加研究的老師），最高得分為42.5，最低分為24.75，標準差為3.3。第四節(jié)評分者信度及評分誤差控制二、評分者信度定義：多個評分者對同一批答卷評分結(jié)果的一致性程度。估計方法：①兩位評分者評同一批試卷；②三位或三位以上評分者評同一批試卷第四節(jié)評分者信度及評分誤差控制三、評分誤差產(chǎn)生的原因試題原因評分者原因?qū)I(yè)知識水平不夠評判能力不夠個性傾向心理狀態(tài)客觀效應(yīng)“名片”、“光環(huán)”、“對比”、“先后”環(huán)境、組織管理的原因第四節(jié)評分者信度及評分誤差控制四、控制評分誤差的方法控制試題作答反應(yīng)方向與范圍預(yù)先制訂好評分細則閱卷人員要選擇、要培訓(xùn)流水作業(yè)分因素評分組織復(fù)查要求評分者自覺防止各種客觀效應(yīng)的影響大規(guī)模閱卷可考慮采用統(tǒng)計手段控制第四節(jié)評分者信度及評分誤差控制下次上課再見！提高信度的方法——適當增加測驗的長度為什么增加測驗的長度，會提高信度？測驗長度的增加與信度的提高不是等比例的提高信度的方法——適當增加測驗的長度增加測驗長度與信度提高之間關(guān)系的公式：例：有一包含10題的測驗，其信度系數(shù)為0.30，若把測驗增加到原測驗長度的3倍，那么新測驗的信度系數(shù)應(yīng)該是多少？例：原測驗共10題，信度系數(shù)為0.30，如要把測驗信度系數(shù)提高到0.94，需要把原測驗延長多少倍？增加多少題？返回兩位評分者評同一批試卷的評分者信度例：甲、乙兩位教師評閱10份試卷，他們對每一試卷各自所評分數(shù)如下表，問這兩位教師評分的一致性如何？返回試卷得分D＝甲－乙等級等級之差甲評分乙評分甲乙A94931110B9092－222.5－0.5C8692－63.52.51D8670163.573.5E8682－10541F7076－665.50.5G6865379－2H6676－1085.52.5I6468－4981J6160110100心理測量學(xué)

測量效度概述1測量工具效度驗證的方法2測量的系統(tǒng)誤差控制3心理測量學(xué)

測量效度概述1心理測量學(xué)測量效度概述

什么是效度測量工具測量了他所希望測量的心理特質(zhì)或行為特征的效果和程度。效度總是與一定的測量目標相聯(lián)系的。我們稱為某測量工具進行效度驗證的過程為效度證據(jù)的獲取過程，簡稱為效度驗證。心理測量學(xué)測量效度概述效度與信度的關(guān)系信度研究的是測量結(jié)果的穩(wěn)定性問題，效度研究的是測量結(jié)果的準確性問題。測量的信度只受到隨機誤差或非系統(tǒng)測量誤差的影響，而測量效度會同時受到隨機誤差和系統(tǒng)測量誤差的影響。一個測量工具可能是非常穩(wěn)定（信度高），但卻是無效的，因為他與測量的目標之間產(chǎn)生了系統(tǒng)性的偏差；當然，一個完全不穩(wěn)定的測量工具也不可能是有效的。心理測量學(xué)第三章測量效度與系統(tǒng)誤差控制測量工具效度驗證的方法2心理測量學(xué)測量工具效度驗證的方法根據(jù)測量目標的不同，對測量工具進行效度驗證的方法主要有三種：基于所測內(nèi)容的效度驗證方法?；谒鶞y心理結(jié)構(gòu)的效度驗證方法?；谛岁P(guān)聯(lián)性的效度驗證方法。心理測量學(xué)測量工具效度驗證的方法基于所測內(nèi)容的效度驗證方法含義就是要對測量工具本身的具體內(nèi)容進行系統(tǒng)性的查驗，以確定這些內(nèi)容是不是測量目標特質(zhì)或行為領(lǐng)域的一個有代表性的樣本。主要應(yīng)用學(xué)業(yè)成就測驗、職業(yè)資格測驗，還如人員選拔與安置中的工作樣本測驗。心理測量學(xué)測量工具效度驗證的方法基于所測內(nèi)容的效度驗證方法評估方法確定測量目標的全域范圍及各部分內(nèi)容權(quán)重。確定一批有經(jīng)驗的領(lǐng)域?qū)＜?，在深入培?xùn)的基礎(chǔ)上，要求他們按照已確定的測量全域范圍及各部分內(nèi)容權(quán)重，初步分析測試題目的代表性，并對題目測量的被試作答的內(nèi)部心理過程進行初步分析。進行實測，根據(jù)測試數(shù)據(jù)分析和被試作答過程分析，全面驗證測量工具的效度。心理測量學(xué)測量工具效度驗證的方法基于所測內(nèi)容的效度驗證方法關(guān)于測量工具的表面效度嚴格來說，表面效度并不符合效度的定義，因為他反映的不是實際要測量的目標是什么，或?qū)δ繕藴y量的程度如何，而反映的是，測量工具從表面上看測量了什么。表面效度關(guān)心的是測量的友好性和與公眾的和諧關(guān)系。心理測量學(xué)測量工具效度驗證的方法基于效標關(guān)聯(lián)性的效度驗證方法效標：它是獨立于測量工具并可以從實踐中獲得的被試的行為特征表現(xiàn)，用于驗證測量工具的有效性。根據(jù)測量工具與效標兩者結(jié)果獲得的時間間隔的不同，基于效標關(guān)聯(lián)性的效度證據(jù)采集可以有同時性設(shè)計與預(yù)測性設(shè)計兩種方法。心理測量學(xué)測量工具效度驗證的方法基于效標關(guān)聯(lián)性的效度驗證方法效度證據(jù)采集的預(yù)測性設(shè)計方法含義：驗證現(xiàn)有測量評價結(jié)果與將來才可能獲取的效標評價結(jié)果之間的關(guān)聯(lián)程度。主要應(yīng)用：人員選拔、安置類型的測量工具心理測量學(xué)測量工具效度驗證的方法基于效標關(guān)聯(lián)性的效度驗證方法效度證據(jù)采集的預(yù)測性設(shè)計方法首先，獲取被試在當前測量工具上的評價結(jié)果，如測驗分數(shù)、等級評定；然后，間隔一定的時間，采集被試在預(yù)測目標（效標）上的評價結(jié)果；最后，分析以上這兩個評價結(jié)果之間的關(guān)聯(lián)性程度，這種關(guān)聯(lián)性程度的分析方法常用的有以下幾種：相關(guān)分析區(qū)分能力分析命中率分析心理測量學(xué)測量工具效度驗證的方法基于效標關(guān)聯(lián)性的效度驗證方法效度證據(jù)采集的同時性設(shè)計方法含義：對同時獲得的測量工具評價結(jié)果與效標評價結(jié)果之間的關(guān)聯(lián)性程度進行分析。主要應(yīng)用經(jīng)常用于評價測量工具診斷被試當前心理特質(zhì)狀態(tài)的效果。在許多情形下，效度證據(jù)采集的同時性設(shè)計方法會替代預(yù)測性設(shè)計方法。評估方法心理測量學(xué)測量工具效度驗證的方法基于效標關(guān)聯(lián)性的效度驗證方法基于效標關(guān)聯(lián)性的效度驗證方法的影響因素群體的一致性或同質(zhì)性程度：應(yīng)該盡量擴大被試群體的異質(zhì)性，避免低估測驗的真實效度。測驗長度：一般來說，測驗長度越長，測試結(jié)果越穩(wěn)定，效度系數(shù)會傾向于越高。效標污染心理測量學(xué)測量工具效度驗證的方法基于效標關(guān)聯(lián)性的效度驗證方法估計標準誤指的是測量工具實際測量的結(jié)果與預(yù)先設(shè)定的測量目標之間相互偏離的程度，而效度驗證的過程就是要考察這種偏離程度的大小。從實際應(yīng)用范圍及計算過程的便利性角度看，估計標準誤的實際應(yīng)用更多的是基于效標關(guān)聯(lián)性的效度驗證方法中。心理測量學(xué)測量工具效度驗證的方法基于效標關(guān)聯(lián)性的效度驗證方法估計標準誤是表現(xiàn)為相關(guān)系數(shù)的效度系數(shù)；是效標評定分數(shù)的標準差。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法含義：對測量工具測量了心理學(xué)中某種特質(zhì)或特質(zhì)結(jié)構(gòu)的程度進行驗證的方法。主要應(yīng)用：各種心理測驗，如智力測驗、人格測驗、焦慮測驗、成就動機測驗等。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法評估方法專家判斷分析法主要依靠專家的主觀專業(yè)經(jīng)驗。盡量減少專家主觀隨意性的影響。德爾菲法。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法評估方法測驗內(nèi)部一致性分析法基于所測心理結(jié)構(gòu)的效度驗證的一個重要證據(jù)來源。這個方法的實質(zhì)是，測驗總分本身是用于評價所測心理結(jié)構(gòu)的效度最好的效標。相關(guān)分析法：求取每個項目與測驗總分之間的相關(guān)系數(shù)，如果項目—測驗相關(guān)顯著，表明該項目與總測驗的結(jié)構(gòu)是一致的。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法評估方法測驗內(nèi)部一致性分析法對照組比較法：按照被試的測驗總分，選出一個高分組被試和一個低分組被試，然后，比較高分組被試與低分組被試在各個項目上的作答表現(xiàn)，如果高分組被試的通過比例顯著大于低分組被試的通過比例，表明該項目與總測驗的結(jié)構(gòu)是一致的。心理測量學(xué)基于所測心理結(jié)構(gòu)的效度驗證方法評估方法測驗內(nèi)部一致性分析法很明顯，測驗內(nèi)部一致性證據(jù)保證的是測驗結(jié)構(gòu)的同質(zhì)性或單一性。測驗內(nèi)部一致性證據(jù)的作用是有限的，因為他畢竟無法證明該測驗究竟測量了什么結(jié)構(gòu)。測量工具效度驗證的方法心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法評估方法與現(xiàn)有研究結(jié)論一致性的分析法通過分析新開發(fā)測量工具測試結(jié)果是否與已有研究結(jié)論相一致。在許多傳統(tǒng)智力測驗中，成長發(fā)展性變化證據(jù)是測驗效度的一個重要證據(jù)。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法評估方法與其他測量工具的相關(guān)分析法求取新開發(fā)測量工具與另一個已經(jīng)被公認為有效的測量工具之間的相關(guān)關(guān)系，是證明新開發(fā)測量工具測量了相同內(nèi)容結(jié)構(gòu)的一個有效證據(jù)。求取新開發(fā)測量工具與另一個測量工具之間的相關(guān)關(guān)系，有時候也被用于證明該測量工具沒有受到其他無關(guān)心理因素的影響。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法其他評估方法因素分析法因素分析方法是基于所測心理結(jié)構(gòu)的效度驗證方法中幾乎最為常用的一種方法，他很適合用于鑒別測量工具所測的心理特質(zhì)結(jié)構(gòu)。實際上，因素分析方法是一種分析觀察數(shù)據(jù)之間相關(guān)矩陣的統(tǒng)計分析技術(shù)。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法其他評估方法聚合與區(qū)分效度驗證分析法為了驗證測量工具所測的心理結(jié)構(gòu)，我們不僅必須提供關(guān)于它與另外一個理論上應(yīng)該存在高相關(guān)的測量工具之間存在高相關(guān)的實際證據(jù)，同時，也需要提供關(guān)于它與另外的無關(guān)變量之間不存在顯著相關(guān)的證據(jù)。多特質(zhì)—多方法矩陣分析法心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法其他評估方法實驗介入分析法通過實驗的方法考察某些重要變量的介入是否對被試測量分數(shù)產(chǎn)生顯著影響。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法其他評估方法結(jié)構(gòu)方程建模分析法除了鑒別測量的潛在結(jié)構(gòu)之外，對這些潛在特質(zhì)結(jié)構(gòu)本身之間的關(guān)系以及它們之間的影響路徑進行考察，同樣是非常重要的。分析潛在特質(zhì)結(jié)構(gòu)之間的關(guān)系及其與效標變量之間的路徑，有利于我們更深入理解所測特質(zhì)的作用機制。這種分析過程可以用結(jié)構(gòu)方程建模的方式進行。心理測量學(xué)測量工具效度驗證的方法基于所測心理結(jié)構(gòu)的效度驗證方法其他評估方法尋求當代認知心理學(xué)證據(jù)的分析方法基于信息加工理論的研究方法為我們深入理解人類問題解決的加工過程提供了更豐富的證據(jù)。認知加工模型讓我們了解完成某種認知任務(wù)的智能過程、這個過程的組織方式、涉及的知識內(nèi)容、這些知識在記憶中的表征形式及其提取模式，這些研究無疑會讓我們對人類心理特質(zhì)結(jié)構(gòu)的認知更加深入。心理測量學(xué)第三章測量效度與系統(tǒng)誤差控制測量的系統(tǒng)誤差控制3心理測量學(xué)測量的系統(tǒng)誤差控制影響測量工具有效性的因素測量的心理特質(zhì)本身的特點有些心理特質(zhì)至今研究不夠深入，概念界定還不清晰。有些心理特質(zhì)本身不太穩(wěn)定。測量工具的建構(gòu)過程建構(gòu)過程應(yīng)遵循嚴謹?shù)膽B(tài)度才能建構(gòu)出優(yōu)良的測量工具，避免出現(xiàn)系統(tǒng)偏差。心理測量學(xué)測量的系統(tǒng)誤差控制影響測量工具有效性的因素測量工具本身的信度信度是效度的必要條件。效度驗證時的被試群體相同的一個測量工具，可能會因為測量對象特性的不同而測量到不同的心理特質(zhì)結(jié)構(gòu)。作為用相關(guān)系數(shù)表示的效度系數(shù)，希望參與效度驗證的被試群體越異質(zhì)越好。心理測量學(xué)引子心理測量的工具是測驗，而題目則是構(gòu)成測驗的基石，因此研究題目的性能及其編制至關(guān)重要，它直接影響測量工具(即測驗)的信度及效度，進而影響測量的準確性。在實際工作中，人們應(yīng)如何來編制測驗題目？如何評價測驗題目質(zhì)量的好差呢？本章將對這些問題做出回答。心理測量學(xué)測驗題目性能與題目編制測驗題目類型、功能與題目編制1測驗題目的難度與難度分布控制2測驗題目的區(qū)分度與區(qū)分度的提高3測驗題目的猜測度與猜測控制4選擇題的選項分析與選項修改5題目功能差異與測量偏差控制6

測驗題目的類型功能與編制

第一節(jié)心理測量學(xué)第一節(jié)一、測驗題目類型題目主要可分為客觀題和主觀題兩大類?？陀^題一般有標準唯一的答案，被試的作答只有與標準答案完全一致才視為答對，否則視為答錯。主觀題無標準唯一答案，只有一個參考答案，被試的作答與參考答案相近或基本一致就可視為答對。心理測量學(xué)客觀題主要包括選擇題（含自陳式選擇題）、填空題、是非判斷題、匹配題、行為情景判斷題等。主觀題主要包括名詞解釋、簡

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

心理測量學(xué)課件

文檔簡介

溫馨提示

最新文檔

評論

心理測量學(xué)課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔