心理測(cè)量學(xué)知識(shí)_第1頁
心理測(cè)量學(xué)知識(shí)_第2頁
心理測(cè)量學(xué)知識(shí)_第3頁
心理測(cè)量學(xué)知識(shí)_第4頁
心理測(cè)量學(xué)知識(shí)_第5頁
已閱讀5頁,還剩205頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

心理測(cè)量學(xué)信忠義E-mail:心理測(cè)量學(xué)知識(shí)感悟測(cè)量測(cè)量無處不在……心理測(cè)量學(xué)知識(shí)城市夜晚燈光亮度與GDP科學(xué)家發(fā)現(xiàn)可以通過太空拍攝城市夜間燈光亮度,來反映全球各國經(jīng)濟(jì)的發(fā)展水平。心理測(cè)量學(xué)知識(shí)這是一張衛(wèi)星合成圖。一些國家經(jīng)濟(jì)增長迅速,建了更多的基礎(chǔ)設(shè)施(如街道照明),而人們晚上也會(huì)打開更多的燈。這表明,從太空中看到的夜間燈光強(qiáng)度與一個(gè)國家的國內(nèi)生產(chǎn)總值存在關(guān)聯(lián)。在某些相關(guān)經(jīng)濟(jì)數(shù)據(jù)極少或存在誤導(dǎo)的地區(qū),這種經(jīng)濟(jì)情況評(píng)估方式會(huì)大有用武之地。心理測(cè)量學(xué)知識(shí)這是北美地區(qū)夜間燈光的分布情況。北美是世界上最富裕的地區(qū)之一。心理測(cè)量學(xué)知識(shí)西歐的夜晚同樣是燈火通明心理測(cè)量學(xué)知識(shí)這張圖顯示的是南美海岸、哥倫比亞北部和委內(nèi)瑞拉的人口稠密地區(qū)。不難看出,內(nèi)陸地區(qū)燈光強(qiáng)度相對(duì)很弱。心理測(cè)量學(xué)知識(shí)亞洲既有發(fā)達(dá)國家,也有發(fā)展中國家,中印兩國經(jīng)濟(jì)的快速增長尤其引人注意。這張圖上,還可以看到日本稠密的燈光覆蓋情況。對(duì)比最明顯的是南北朝鮮。心理測(cè)量學(xué)知識(shí)2012年中國家庭金融調(diào)查與研究中心發(fā)布一份《中國家庭金融調(diào)查報(bào)告》稱,中國家庭資產(chǎn)平均為121.69萬元,城市家庭平均為247.60萬元;中國家庭自有住房擁有率為89.68%,遠(yuǎn)超世界60%左右的水平,甚至高過美國和日本;2011年中國城市戶均擁有住房為1.22套。事實(shí)上這一報(bào)告的出爐,引起了人們的議論。與人們對(duì)人均GDP的反應(yīng)一樣,首先認(rèn)為數(shù)據(jù)準(zhǔn)確度不高;其次,驚呼自己拖了國家的后腿。這一數(shù)據(jù)與我們的現(xiàn)實(shí)感受符合嗎?為什么人們的感受與數(shù)據(jù)存在差距呢?一個(gè)原因可能數(shù)據(jù)的準(zhǔn)確性上確實(shí)存在偏差;另一個(gè)可能的原因在于求平均。比如你的隔壁住了一位富翁,資產(chǎn)1000萬,你身無分文,但平均資產(chǎn)都是500萬,瞬間變成了富翁心理測(cè)量學(xué)知識(shí)“心”如何測(cè)量?心理測(cè)量學(xué)知識(shí)心理小測(cè)驗(yàn)1

假如你的戀人在一個(gè)孤立的小島上,小島沒有陸地之間沒有橋,請(qǐng)你選擇到去小島的方式。A劃船過去B坐烏龜過去C不過去D游泳過去請(qǐng)?jiān)诩埳蠈懴履愕拇鸢?!心理測(cè)量學(xué)知識(shí)此測(cè)驗(yàn)是性取向測(cè)驗(yàn)。劃船過去——正常的異性戀坐烏龜過去——性變態(tài)不過去——性冷淡游泳過去——同性戀心理測(cè)量學(xué)知識(shí)心理小測(cè)驗(yàn)2請(qǐng)你回憶自己洗澡的順序,選擇你最后清洗的部位:A頭發(fā)B面部C隱私部位D腿請(qǐng)?jiān)诩埳蠈懴履愕拇鸢?!心理測(cè)量學(xué)知識(shí)此測(cè)驗(yàn)是一項(xiàng)自信測(cè)驗(yàn)。最后清洗的部位即為你最不自信的部位!心理測(cè)量學(xué)知識(shí)剛才的兩個(gè)測(cè)驗(yàn)科學(xué)嗎?這兩個(gè)測(cè)驗(yàn)是“三無產(chǎn)品”,且施測(cè)過程缺乏科學(xué)性。心理測(cè)量學(xué)知識(shí)科學(xué)心理測(cè)量學(xué)的主要內(nèi)容第一節(jié)概述第二節(jié)測(cè)驗(yàn)的常模第三節(jié)測(cè)驗(yàn)的信度第四節(jié)測(cè)驗(yàn)的效度第五節(jié)項(xiàng)目分析第六節(jié)測(cè)驗(yàn)編制的一般程序第七節(jié)心理測(cè)驗(yàn)的使用心理測(cè)量學(xué)知識(shí)第一節(jié)概述第一單元測(cè)量與測(cè)量量表第二單元心理測(cè)驗(yàn)的基本概念第三單元心理測(cè)驗(yàn)的分類第四單元糾正錯(cuò)誤的測(cè)驗(yàn)觀第五單元心理測(cè)驗(yàn)在心理咨詢中的應(yīng)用第六單元心理測(cè)驗(yàn)的發(fā)展史心理測(cè)量學(xué)知識(shí)第一單元測(cè)量與測(cè)量量表一、什么是測(cè)量二、測(cè)量要素三、測(cè)量量表心理測(cè)量學(xué)知識(shí)一、什么是測(cè)量測(cè)量就是依據(jù)一定的法則用數(shù)字對(duì)事物加以確定。三個(gè)主要的元素:(1)事物;(2)數(shù)字;(3)法則。心理測(cè)量學(xué)知識(shí)1.所謂“事物”,指的是我們要測(cè)量的對(duì)象,更準(zhǔn)確地說,就是引起我們興趣的事物的屬性或特征。2.所謂“數(shù)字”,是代表某一事物或事物某一屬性的量。數(shù)字的特性:區(qū)分性--1與2等級(jí)性或位次性--3>2>1等距性--3-2=1、2-1=1可加性3.所謂“法則”,代表的是測(cè)量所依據(jù)的規(guī)則和方法測(cè)量三元素心理測(cè)量學(xué)知識(shí)二、測(cè)量要素(一)參照點(diǎn)參照點(diǎn)就是確定事物的量時(shí),計(jì)算的起點(diǎn)。參照點(diǎn)有兩種:絕對(duì)零點(diǎn):重量,長度人定的參照點(diǎn),即相對(duì)零點(diǎn):智力,新生兒能說他沒有智力嗎?(二)單位好的單位必須具備兩個(gè)條件:確定的意義:所有人理解的意義都一樣相同的價(jià)值:相鄰單位之間的差別是相等的心理測(cè)驗(yàn)對(duì)象往往難以滿足這兩個(gè)條件思考:1.小明考試得了60分,說明了什么?2.小明考試得了60分,班里排名第三說明了什么?3.小明考試得了60分,班里排名第三,班里共5人,說明了什么?心理測(cè)量學(xué)知識(shí)三、測(cè)量量表測(cè)量的本質(zhì)是根據(jù)某一法則將事物數(shù)量化,即在一個(gè)定有單位和參照點(diǎn)的連續(xù)體上把事物的屬性表現(xiàn)出來,這個(gè)連續(xù)體稱為量表。由于制定量表的單位和參照點(diǎn)不同,量表的種類也不同。心理測(cè)量學(xué)知識(shí)四類量表(斯蒂文斯)(一)命名量表(和,或)是最低水平量表,只用數(shù)字來代表事物或把事物歸類,具體分為兩種:(1)代號(hào)——用數(shù)字代表個(gè)別事物,如編號(hào)、學(xué)號(hào)(2)類別——用數(shù)字代表具有某一屬性的事物的全體,即用數(shù)字代表某一群體命名量表,數(shù)字反映差別(代號(hào))與類別(分類),不能數(shù)量化分析,不能做加減乘除運(yùn)算(二)順序量表(>,<)反映差別并對(duì)事物分類,也反映事物某方面屬性的程度,如名次、級(jí)別、喜好程度等順序量表無相等單位和絕對(duì)零點(diǎn),僅表示等級(jí)心理測(cè)量學(xué)知識(shí)(三)等距量表反映差別并對(duì)事物分類;反映先后、大小和強(qiáng)度等;有相等的單位(能加減);沒有絕對(duì)的零點(diǎn)(不能乘除)等距量表的數(shù)值加、減一個(gè)常數(shù)不影響等距關(guān)系。因此,一個(gè)量表上的數(shù)值可以轉(zhuǎn)換為另一個(gè)具有不同單位的量表上的數(shù)值,而且?guī)讉€(gè)不同單位的數(shù)值可以轉(zhuǎn)換到一個(gè)量表上便于比較。(四)等比量表反映差別并對(duì)事物分類;反映先后、大小和強(qiáng)度等;有相等的單位;有絕對(duì)的零點(diǎn)可以加減乘除。心理測(cè)量是在順序量表上進(jìn)行的并且可以將順序量表轉(zhuǎn)化為等距量表心理測(cè)量學(xué)知識(shí)這些說法合理嗎?我比你聰明一百倍!我心理比你健康一百倍?青海西寧夏天平均溫度是15度,陜西西安夏天平均溫度是30度,西安的炎熱度是西寧的兩倍。心理測(cè)量學(xué)知識(shí)第二單元心理測(cè)驗(yàn)的基本概念一、心理測(cè)驗(yàn)的定義二、心理測(cè)驗(yàn)的性質(zhì)心理測(cè)量學(xué)知識(shí)一、心理測(cè)驗(yàn)的定義所謂心理測(cè)驗(yàn),就是依據(jù)心理學(xué)理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對(duì)于貫穿在人的全部行為活動(dòng)中的心理特點(diǎn)做出推論和數(shù)量化分析的一種科學(xué)手段。心理測(cè)量學(xué)知識(shí)1.心理測(cè)量的對(duì)象是人的行為(不是對(duì)心理的直接測(cè)量)2.心理測(cè)量往往只是對(duì)少數(shù)人經(jīng)過慎重選擇的行為樣本進(jìn)行觀察,來間接推知受測(cè)者的心理特征。(心理測(cè)驗(yàn)出現(xiàn)偏差的原因)3.測(cè)驗(yàn)條件對(duì)所有的受測(cè)者都必須相同(測(cè)驗(yàn)的編制、印刷、施測(cè)、評(píng)分標(biāo)準(zhǔn)化)4.原始分?jǐn)?shù)不具有意義,須與常模比較(85分屬于高分還是低分?)心理測(cè)量學(xué)知識(shí)二、心理測(cè)驗(yàn)的性質(zhì)(一)間接性(二)相對(duì)性(三)客觀性心理測(cè)量學(xué)知識(shí)心理測(cè)驗(yàn)的間接性研究者無法直接測(cè)量人的心理,只能測(cè)量人的外顯行為,也就是說,只能通過一個(gè)人對(duì)測(cè)驗(yàn)題目的反應(yīng)來推論他的心理特質(zhì)。心理測(cè)量學(xué)知識(shí)心理測(cè)驗(yàn)的相對(duì)性

人的心理與行為沒有絕對(duì)標(biāo)準(zhǔn),只有一個(gè)連續(xù)的行為序列。心理測(cè)驗(yàn)就是確定個(gè)人處在行為序列的什么位置。連續(xù)序列是由某一個(gè)團(tuán)體或一群人的某類行為特點(diǎn)或心理特征構(gòu)成,所以每個(gè)人被測(cè)得的結(jié)果都是與所在團(tuán)體或大多數(shù)人群的行為相比較而言。心理測(cè)量學(xué)知識(shí)心理測(cè)驗(yàn)的客觀性所測(cè)量的對(duì)象(心理)是客觀存在的;心理測(cè)驗(yàn)是標(biāo)準(zhǔn)化的測(cè)驗(yàn):測(cè)驗(yàn)用的項(xiàng)目或作業(yè)、施測(cè)說明、施測(cè)者的言語態(tài)度及施測(cè)時(shí)的環(huán)境等,要要求標(biāo)準(zhǔn)化,測(cè)驗(yàn)的刺激是客觀的。測(cè)驗(yàn)評(píng)分記分的原則和手續(xù)也要經(jīng)過標(biāo)準(zhǔn)化,使反應(yīng)的量化是客觀的。最后,分?jǐn)?shù)轉(zhuǎn)換和解釋標(biāo)準(zhǔn)化,對(duì)結(jié)果的推論是客觀的。心理測(cè)量學(xué)知識(shí)第三單元心理測(cè)驗(yàn)的分類按測(cè)驗(yàn)的功能分類按測(cè)驗(yàn)材料的性質(zhì)分類按測(cè)驗(yàn)材料的嚴(yán)謹(jǐn)程度分類按測(cè)驗(yàn)的方式分類按測(cè)驗(yàn)的要求分類心理測(cè)量學(xué)知識(shí)一、按測(cè)驗(yàn)的功能分類(一)智力測(cè)驗(yàn)

測(cè)量人的一般智力水平(二)特殊能力測(cè)驗(yàn)

測(cè)量個(gè)人的特殊潛在能力,如繪畫、寫作、機(jī)械等(三)人格測(cè)驗(yàn)

測(cè)量人的性格、氣質(zhì)、興趣、態(tài)度、動(dòng)機(jī)等。測(cè)驗(yàn)方法包括問卷法和投射法艾森克人格問卷——EPQ卡特爾16種人格因素——16PF明尼蘇達(dá)多項(xiàng)人格問卷——MMPI心理測(cè)量學(xué)知識(shí)二、按測(cè)驗(yàn)的性質(zhì)分類(一)文字測(cè)驗(yàn)

文字測(cè)驗(yàn)所用的是文字材料,以言語提出刺激,受測(cè)者用言語作反應(yīng)。團(tuán)體測(cè)驗(yàn)多采用此種方式編制,施測(cè)方便缺點(diǎn):受測(cè)者文化程度影響測(cè)驗(yàn)結(jié)果(二)操作測(cè)驗(yàn)也稱非文字測(cè)驗(yàn)。測(cè)驗(yàn)題項(xiàng)多屬于對(duì)圖形、實(shí)物、工具、模型的辨認(rèn)和操作,不受文化程度影響,可用于幼兒或文盲。如,瑞文和韋克斯勒心理測(cè)量學(xué)知識(shí)三、按測(cè)驗(yàn)材科的嚴(yán)謹(jǐn)程度分類(一)客觀測(cè)驗(yàn)測(cè)驗(yàn)中句子、圖形意義明確,明確界定,不需想象、猜測(cè)和遐想。絕大多數(shù)都屬于客觀測(cè)驗(yàn)。(二)投射測(cè)驗(yàn)——羅夏墨跡、房樹人測(cè)驗(yàn)沒有明確意義,問題模糊,對(duì)受測(cè)者反應(yīng)沒有明確界定。由受測(cè)者想象使之賦予意義,以此投射出受測(cè)者的思想、情感和經(jīng)驗(yàn)。心理測(cè)量學(xué)知識(shí)四、按測(cè)驗(yàn)的方式分類(一)個(gè)別測(cè)驗(yàn)

測(cè)驗(yàn)以一對(duì)一的形式進(jìn)行。優(yōu)點(diǎn):主測(cè)對(duì)受測(cè)言、行有仔細(xì)觀察,結(jié)果可靠。缺點(diǎn):不能在短時(shí)間內(nèi)收集到大量資料,程序復(fù)雜,主測(cè)需接受嚴(yán)格訓(xùn)練,專業(yè)化程度高(二)團(tuán)體測(cè)驗(yàn)

一個(gè)或幾個(gè)主測(cè)對(duì)較多的受測(cè)者同時(shí)進(jìn)行測(cè)驗(yàn)。優(yōu)點(diǎn):時(shí)間經(jīng)濟(jì),主測(cè)不需要接受嚴(yán)格專業(yè)訓(xùn)練缺點(diǎn):對(duì)受測(cè)者不能作切實(shí)控制,結(jié)果不及個(gè)別測(cè)驗(yàn),臨床上使用較少。團(tuán)體測(cè)驗(yàn)可以用來個(gè)別測(cè)驗(yàn),但是個(gè)別測(cè)驗(yàn)一般不能用來團(tuán)體測(cè)驗(yàn)心理測(cè)量學(xué)知識(shí)五、按測(cè)驗(yàn)的要求分類(一)最高作為測(cè)驗(yàn)(智力測(cè)驗(yàn)、成就測(cè)驗(yàn))

要求受測(cè)者盡可能的作出做好的回答,與認(rèn)知過程有關(guān),有正確答案。(二)典型行為測(cè)驗(yàn)(人格測(cè)驗(yàn))要求受測(cè)者按通常的習(xí)慣方式作出反應(yīng),沒有正確答案。心理測(cè)量學(xué)知識(shí)第四單元糾正錯(cuò)誤的測(cè)驗(yàn)觀錯(cuò)誤的測(cè)驗(yàn)觀正確的測(cè)驗(yàn)觀心理測(cè)量學(xué)知識(shí)一、錯(cuò)誤的測(cè)驗(yàn)觀(一)測(cè)驗(yàn)萬能論認(rèn)為測(cè)驗(yàn)可以解決一切問題,迷信測(cè)驗(yàn),測(cè)驗(yàn)分?jǐn)?shù)絕對(duì)化

“福勒效應(yīng)”(二)測(cè)驗(yàn)無用論

人格測(cè)驗(yàn)侵犯隱私;測(cè)驗(yàn)為宿命論、種族歧視提供依據(jù);測(cè)驗(yàn)存在偏差。因此反對(duì)使用測(cè)驗(yàn)(三)心理測(cè)驗(yàn)即智力測(cè)驗(yàn)

心理測(cè)驗(yàn)=智力測(cè)驗(yàn)=智商=遺傳決定論心理測(cè)量學(xué)知識(shí)二、正確的測(cè)驗(yàn)觀(一)心理測(cè)驗(yàn)是重要的心理學(xué)研究方法之一,是決策的輔助工具

心理測(cè)驗(yàn)僅僅是研究方法的一種,是一種工具,對(duì)心理學(xué)研究與部門決策有一定的參考價(jià)值。(二)心理測(cè)驗(yàn)作為研究方法和測(cè)量工具尚不完善

心理測(cè)驗(yàn)的理論基礎(chǔ)不夠堅(jiān)實(shí),因而作為方法與工具的測(cè)驗(yàn)尚不完善。心理測(cè)量學(xué)知識(shí)第五單元心理測(cè)驗(yàn)在心理咨詢中的應(yīng)用

心理咨詢有效性的前提是對(duì)求助者的心理特性、問題有正確的評(píng)估和診斷。

目前,在心理門診中運(yùn)用較多的大致有三類心理測(cè)驗(yàn),即智力測(cè)驗(yàn)、人格測(cè)驗(yàn)以及心理評(píng)定量表。

心理測(cè)量學(xué)知識(shí)智力測(cè)驗(yàn):韋氏成人、韋氏兒童、韋氏幼兒、瑞文——智力障礙的診斷人格測(cè)驗(yàn):EPQ,16PF,MMPI——了解人格特性,尤其是MMPI能夠了解人格異常心理評(píng)定量表:精神病評(píng)定量表、躁狂狀態(tài)評(píng)定量表、抑郁量表、焦慮量表、恐怖量表等。評(píng)分簡便,以了解心理障礙的存在與否及程度,并反映病情演變。(一般來說,這類量表僅僅作為診斷的參照,而不是唯一的依據(jù))心理測(cè)量學(xué)知識(shí)第六單元心理測(cè)驗(yàn)的發(fā)展史科學(xué)心理測(cè)驗(yàn)的產(chǎn)生和發(fā)展現(xiàn)代心理測(cè)驗(yàn)在我國的發(fā)展心理測(cè)量學(xué)知識(shí)心理測(cè)量學(xué)歷史較短,但思想與實(shí)踐源遠(yuǎn)流長。

始于漢代、興于隋唐的科舉制度被公認(rèn)為世界上最早的心理測(cè)量的實(shí)踐。

科學(xué)的心理測(cè)量于工業(yè)革命成功后的19世紀(jì)的歐洲發(fā)展起來的。心理測(cè)量學(xué)知識(shí)一、科學(xué)心理測(cè)驗(yàn)的產(chǎn)生與發(fā)展高爾頓(F·Galton)——“怪誕心理學(xué)”第一人(19世紀(jì)80年代的十年)提出人的不同氣質(zhì)特點(diǎn)和智能是按身體特點(diǎn)的不同而遺傳的。(遺傳決定論者)為了研究差異的遺傳性,便設(shè)計(jì)了測(cè)量差異的方法。為心理測(cè)驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ)。他第一個(gè)提出了相關(guān)的概念,并由學(xué)生皮爾遜發(fā)展創(chuàng)立了積差相關(guān)法。心理測(cè)量學(xué)知識(shí)卡特爾(19世紀(jì)90年代十年)卡特爾是對(duì)心理測(cè)驗(yàn)發(fā)展做出巨大貢獻(xiàn)美國心理學(xué)家。1890年,卡特爾在《心理》雜志上發(fā)表《心理測(cè)驗(yàn)與測(cè)量》一文,這是心理測(cè)驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。倡導(dǎo)心理學(xué)的科學(xué)化——“心理學(xué)若不立足于實(shí)驗(yàn)與測(cè)量上,決不能夠有自然科學(xué)之準(zhǔn)確性?!背珜?dǎo)心理學(xué)的客觀化——“心理測(cè)驗(yàn)如果有一個(gè)普遍的標(biāo)準(zhǔn),則其科學(xué)的與實(shí)用的價(jià)值都可以增加。”主張測(cè)驗(yàn)手續(xù)和考試方法應(yīng)有統(tǒng)一規(guī)定,并要有常模以便比較。心理測(cè)量學(xué)知識(shí)比內(nèi)(A·Binet)(20世紀(jì)頭十年)1905年,與助手西蒙制定了世界上第一個(gè)正式的心理測(cè)驗(yàn),用于診斷和發(fā)現(xiàn)智力發(fā)展落后兒童心理測(cè)量學(xué)知識(shí)20世紀(jì)以后,心理測(cè)驗(yàn)主要有以下幾個(gè)方面的發(fā)展:1.操作測(cè)驗(yàn)的發(fā)展:使未受過教育的兒童能夠接受測(cè)驗(yàn),且反應(yīng)了心理學(xué)界對(duì)操作能力的重視2.團(tuán)體智力測(cè)驗(yàn)的發(fā)展:始于推孟的學(xué)生奧蒂斯所編制的陸軍甲種和乙種智力測(cè)驗(yàn)3.能力傾向測(cè)驗(yàn)的發(fā)展:因素分析的盛行,成為分析心理品質(zhì)的內(nèi)部結(jié)構(gòu)的重要工具。普通能力傾向(智力)多元化發(fā)展,以韋克斯勒的智力量表為代表4.人格測(cè)驗(yàn)的發(fā)展:先驅(qū)是克雷丕林,羅夏測(cè)驗(yàn)是投射測(cè)驗(yàn)的開端,20世紀(jì)40年代以后,人格測(cè)驗(yàn)增多心理測(cè)量學(xué)知識(shí)二、現(xiàn)代心理測(cè)驗(yàn)在我國的發(fā)展我國近代心理測(cè)驗(yàn)源于1914年前后,20世紀(jì)二三十年代兩次修訂比內(nèi)——西蒙量表,此后,處于停滯。1979年后蓬勃發(fā)展。近些年來我國的心理學(xué)家正在致力于測(cè)驗(yàn)本土化.心理測(cè)量學(xué)知識(shí)第二節(jié)測(cè)驗(yàn)的常模第一單元常模團(tuán)體第二單元常模的類型第三單元常模分?jǐn)?shù)的表示方法心理測(cè)量學(xué)知識(shí)什么是常模?思考:1.85分算高分還是低分?2.來自不同省份的大一新生比較高考分?jǐn)?shù),意義大嗎?建立心理測(cè)量的思維,關(guān)注心理常模!心理測(cè)量學(xué)知識(shí)第一單元常模團(tuán)體一、常模團(tuán)體的性質(zhì)常模團(tuán)體是由具有某種共同特征的人所組成的一個(gè)群體,或者是該群體的一個(gè)樣本。由于個(gè)人的等級(jí)會(huì)隨著用作比較的群體不同而有很大變化,因此必須確定合理的常模群體心理測(cè)量學(xué)知識(shí)對(duì)于測(cè)驗(yàn)編制者來說:常模的選擇主要是基于對(duì)測(cè)驗(yàn)將要施測(cè)的總體的認(rèn)識(shí),常模團(tuán)體必須能夠代表該總體。常模的選擇包括:確定一般總體:確定目標(biāo)總體:計(jì)劃實(shí)施的對(duì)象確定樣本:根據(jù)總體的性質(zhì)確定有代表性的樣本對(duì)于測(cè)驗(yàn)使用者來說:由于同一測(cè)驗(yàn)同時(shí)存在多個(gè)常模團(tuán)體,分?jǐn)?shù)的轉(zhuǎn)化與解釋時(shí)需選擇合適的常模團(tuán)體心理測(cè)量學(xué)知識(shí)二、常模團(tuán)體的條件(一)群體的構(gòu)成必須明確界定

確定常模團(tuán)體時(shí)必須清楚說明所要測(cè)量的群體的性質(zhì)與特征。尤其是群體過大時(shí),群體內(nèi)部出現(xiàn)許多小團(tuán)體,他們?cè)跍y(cè)驗(yàn)上存在差異,因此對(duì)每個(gè)團(tuán)體建立常模。例如EPQ就分性別建立常模,韋氏成人量表分城市和農(nóng)村等(二)常模團(tuán)體必須是所測(cè)群體的代表性樣本

所測(cè)群體較小,則全測(cè);若較大,一定要選擇有代表性的樣本作為常模,現(xiàn)實(shí)中往往因?yàn)槟硞€(gè)群體取樣容易,造成常模團(tuán)體取樣存在偏差。心理測(cè)量學(xué)知識(shí)(三)樣本的大小要適當(dāng)在實(shí)際工作中,應(yīng)從經(jīng)濟(jì)的或?qū)嵱玫目赡苄院蜏p少誤差這兩個(gè)方面來綜合考慮樣本的大小。一般最低不小于30或100個(gè)。全國性常模,一般應(yīng)有2000~3000人為宜。樣本大小適當(dāng)?shù)年P(guān)鍵是樣本要有代表性?!皇恰按蟆本秃?四)標(biāo)準(zhǔn)化樣組是一定時(shí)空的產(chǎn)物——隨時(shí)間而須修訂在選擇合適常模時(shí),要注意選擇較為新近的常模。心理測(cè)量學(xué)知識(shí)三、取樣的方法取樣即從目標(biāo)人群中選擇有代表性的樣本。抽樣方法:簡單隨機(jī)抽樣系統(tǒng)抽樣分組抽樣分層抽樣心理測(cè)量學(xué)知識(shí)(一)簡單隨機(jī)抽樣按照隨機(jī)表順序選擇被試構(gòu)成樣本1.隨機(jī)表:按照隨機(jī)表順序選擇受測(cè)者構(gòu)成樣本2.編號(hào)后隨機(jī)抽?。簩⒊闃臃秶拿咳诉M(jìn)行編號(hào),再隨機(jī)選擇避免了由于標(biāo)記、姓名、性別或其他社會(huì)贊許性偏見造成抽樣誤差心理測(cè)量學(xué)知識(shí)首先將總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔,然后隨機(jī)確定起點(diǎn),每隔一定的間隔抽取一個(gè)單位的一種抽樣方式。系統(tǒng)抽樣要求目標(biāo)總體無序可排,也無等級(jí)結(jié)構(gòu)存在。系統(tǒng)抽樣法的關(guān)鍵是計(jì)算組距。(二)系統(tǒng)抽樣(等距抽樣)將已編好號(hào)碼的個(gè)體排成順序,然后每隔若干個(gè)號(hào)碼抽取一個(gè)。心理測(cè)量學(xué)知識(shí)(三)分組抽樣適用情況:總體數(shù)目較大,無法進(jìn)行編好,且群體多樣性做法:先將群體進(jìn)行分組,再在組內(nèi)進(jìn)行隨機(jī)取樣。心理測(cè)量學(xué)知識(shí)(四)分層抽樣——最常使用的抽樣方法。

中國人的主觀幸福感,可以完全隨機(jī)抽嗎?步驟:將目標(biāo)總體按某種變量分成若干層次,再從各層次中隨機(jī)抽取若干受測(cè)者,最后把各層的受測(cè)者組合成常模樣本。優(yōu)點(diǎn):避免簡單隨機(jī)抽樣中樣本集中于某種特性或缺少某種特性,使層次間差異顯著,層次內(nèi)一致性高,增加了樣本代表性分類:分層比例抽樣與分層非比例抽樣心理測(cè)量學(xué)知識(shí)四、常模分?jǐn)?shù)與常模(一)常模分?jǐn)?shù)常模分?jǐn)?shù)就是施測(cè)常模樣本被試后,將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。由原始分?jǐn)?shù)構(gòu)成的分布轉(zhuǎn)換而來的分?jǐn)?shù),叫導(dǎo)出分?jǐn)?shù)原始分?jǐn)?shù)是在測(cè)驗(yàn)中直接獲得的分?jǐn)?shù),不能反映被試之間的差異,地位。導(dǎo)出分?jǐn)?shù)具有一定的參照點(diǎn)和單位,它實(shí)際是一個(gè)有意義的測(cè)驗(yàn)量表,它與原始分?jǐn)?shù)等值。(有意義

等單位

帶參照點(diǎn))心理測(cè)量學(xué)知識(shí)(二)常模常模分?jǐn)?shù)構(gòu)成的分布,就是通常所說的常模,它由標(biāo)準(zhǔn)化樣本測(cè)試結(jié)果計(jì)算而來,是心理測(cè)驗(yàn)用于比較與解釋測(cè)驗(yàn)結(jié)果的參照分?jǐn)?shù)標(biāo)準(zhǔn)。按照樣本大小來源分:全國常模、區(qū)域常模和特殊常模;按照具體應(yīng)用標(biāo)準(zhǔn)與分?jǐn)?shù)特征分:百分位常模和標(biāo)準(zhǔn)分常模心理測(cè)量學(xué)知識(shí)第二單元常模的類型發(fā)展常模百分位常模標(biāo)準(zhǔn)分常模智商及其意義心理測(cè)量學(xué)知識(shí)一、發(fā)展常模人的許多心理特質(zhì)是隨著時(shí)間以有規(guī)律的方式發(fā)展的,所以可將個(gè)人的成績與各種發(fā)展水平的人的平均成績相比較,確定個(gè)體的發(fā)展水平。根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模,亦稱年齡量表。在年齡量表中,個(gè)人的分?jǐn)?shù)指出他的行為在按正常途徑發(fā)展方面處于什么樣的發(fā)展水平。心理測(cè)量學(xué)知識(shí)常見的發(fā)展常模(一)發(fā)展順序量表(二)智力年齡(三)年級(jí)當(dāng)量心理測(cè)量學(xué)知識(shí)(一)發(fā)展順序量表最直觀的發(fā)展常模。因?yàn)樗嬖V人們多大的兒童具備什么能力或行為就表明其發(fā)育正常,相應(yīng)能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。優(yōu)點(diǎn):這種常模對(duì)兒童家長來說最易于理解,并可以監(jiān)察兒童的生長發(fā)育情況。最早的一個(gè)范例是格塞爾發(fā)展程序表(見363)皮亞杰最著名的工作就是對(duì)守恒概念的研究。兒童獲得不同守恒形式的年齡是不一樣的,5歲掌握的是質(zhì)量守恒,6歲掌握重量守恒,7歲容量守恒。心理測(cè)量學(xué)知識(shí)比內(nèi)-西蒙量表中首先使用智力年齡的概念。在比內(nèi)-西蒙量表式的年齡量表中,每個(gè)題目放在大部分兒童都能成功地完成的那個(gè)年齡水平,從而把題目分成若干年齡組。例如,某題若被大多數(shù)7歲兒童通過,則該題放在7歲水平,5歲兒童大多數(shù)能回答的題目則放在5歲水平。如果為每個(gè)年齡水平都編制一些適當(dāng)?shù)念}目,便可得到一個(gè)評(píng)價(jià)兒童智力發(fā)展水平的年齡量表。一個(gè)兒童在年齡量表上所得的分?jǐn)?shù),就是最能代表他的智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡,簡稱智齡。(二)智力年齡心理測(cè)量學(xué)知識(shí)智齡是年齡量表上衡量智力的單位。計(jì)算方法:將兒童測(cè)驗(yàn)分?jǐn)?shù)與各年齡組兒童對(duì)比,便可得到年齡分?jǐn)?shù)。①基礎(chǔ)年齡+附加月份=智齡②不對(duì)題目進(jìn)行年齡分組,將正確題數(shù)當(dāng)做測(cè)驗(yàn)原始分?jǐn)?shù),將標(biāo)準(zhǔn)化樣本中每個(gè)年齡組平均原始分?jǐn)?shù)作為年齡常模,通過將原始分?jǐn)?shù)與年齡常模比較,得出智齡解釋:智齡高于實(shí)際年齡——聰明;智齡低于實(shí)際年齡——愚笨智齡等于實(shí)際年齡——一般心理測(cè)量學(xué)知識(shí)(三)年級(jí)當(dāng)量年級(jí)當(dāng)量實(shí)際上就是年級(jí)量表,測(cè)驗(yàn)結(jié)果說明屬于哪一年級(jí)的水平,在教育成就測(cè)驗(yàn)中最常用。將被試的測(cè)驗(yàn)成績與某一年級(jí)的學(xué)生的平均分?jǐn)?shù)作比較,而說成相當(dāng)于某一年級(jí)水平。

年級(jí)量表單位為10個(gè)月,10個(gè)月為一個(gè)年級(jí)心理測(cè)量學(xué)知識(shí)二、百分位常模百分位常模包括百分等級(jí)和百分點(diǎn)、四分位數(shù)和十分位數(shù)。心理測(cè)量學(xué)知識(shí)(一)百分等級(jí)應(yīng)用最廣的導(dǎo)出分?jǐn)?shù)。一個(gè)原始分?jǐn)?shù)的百分等級(jí)是指在一個(gè)群體的測(cè)驗(yàn)分?jǐn)?shù)中,得分低于這個(gè)分?jǐn)?shù)的人數(shù)百分比。例如,某人得分82,經(jīng)換算百分等級(jí)為75,即表示參加該項(xiàng)測(cè)驗(yàn)的人得分低于82分的占全體被試的75%,并說明超過他的成績82分的人僅有25%。百分等級(jí)取值越大,成績?cè)絻?yōu)秀心理測(cè)量學(xué)知識(shí)(二)百分點(diǎn)(百分位數(shù))在分?jǐn)?shù)量表上,相對(duì)于某一百分等級(jí)的分?jǐn)?shù)點(diǎn)就叫百分點(diǎn)或百分位數(shù)。即處于某一百分比例的人對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)是多少。例如,在招聘、招生中,分?jǐn)?shù)線的劃定實(shí)際應(yīng)用過程,可以由原始分?jǐn)?shù)計(jì)算百分等級(jí),也可由百分等級(jí)確定原始分?jǐn)?shù)。這種雙向方式編制的原始分?jǐn)?shù)與百分等級(jí)對(duì)照表,就是百分位常模。心理測(cè)量學(xué)知識(shí)(三)四分位數(shù)和十分位數(shù)四分位數(shù)是將量表分成四等份,相當(dāng)于百分等級(jí)的25%、50%和75%對(duì)應(yīng)的三個(gè)點(diǎn)分成的四段。十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到小)排序后,用9個(gè)點(diǎn)將全部數(shù)據(jù)分為10等份,與9個(gè)分割點(diǎn)上相對(duì)應(yīng)的數(shù)據(jù)稱為十分位數(shù)。心理測(cè)量學(xué)知識(shí)三、標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分?jǐn)?shù)常模是將原始分?jǐn)?shù)與平均分?jǐn)?shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。標(biāo)準(zhǔn)分?jǐn)?shù)是一種具有相等單位的量數(shù)(以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位),具有可加性,它由符號(hào)與絕對(duì)值兩部分組成,正負(fù)號(hào)表示原始分?jǐn)?shù)在平均數(shù)之下或之上,絕對(duì)值表示原始分?jǐn)?shù)與平均數(shù)的距離。標(biāo)準(zhǔn)分?jǐn)?shù)可以通過線性轉(zhuǎn)換,也可以通過非線性轉(zhuǎn)換得到心理測(cè)量學(xué)知識(shí)(一)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

(公式5-1)其中X為任一原始分?jǐn)?shù),為樣本平均數(shù),SD為樣本標(biāo)準(zhǔn)差。由于z分?jǐn)?shù)易出現(xiàn)小數(shù)點(diǎn)和負(fù)數(shù),計(jì)算不方便,所以將其轉(zhuǎn)化:Z=A+Bz(公式5-2)加上一個(gè)常數(shù)(A)是為了去掉負(fù)值,乘以一個(gè)常數(shù)(B)是為了使單位變小從而去掉小數(shù)點(diǎn)。心理測(cè)量學(xué)知識(shí)常見的標(biāo)準(zhǔn)分?jǐn)?shù)有:z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商(IQ)等。心理測(cè)量學(xué)知識(shí)當(dāng)以50為平均數(shù)(即加上一個(gè)常數(shù)50),以10為標(biāo)準(zhǔn)差(乘以一個(gè)常數(shù)10)來表示時(shí),通常叫做T分?jǐn)?shù),即:T=50+10×(公式5-3)T分?jǐn)?shù)心理測(cè)量學(xué)知識(shí)標(biāo)準(zhǔn)九分、十分、二十分標(biāo)準(zhǔn)九分=5+2×標(biāo)準(zhǔn)十分=5.5+1.5×標(biāo)準(zhǔn)二十分=10+3×使用最廣、影響最大的離差智商以100為平均數(shù),以15為標(biāo)準(zhǔn)差心理測(cè)量學(xué)知識(shí)(二)非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

當(dāng)原始分?jǐn)?shù)不是常態(tài)分部時(shí),可通過非線性轉(zhuǎn)換使之常態(tài)化。步驟:1.對(duì)每個(gè)原始分?jǐn)?shù)計(jì)算累積百分比;2.在常態(tài)曲線面積表中,求出對(duì)應(yīng)于該百分比的Z分?jǐn)?shù)心理測(cè)量學(xué)知識(shí)四、智商及其意義比內(nèi)-西蒙用心理年齡表示智力高低。若心理年齡高于其生理年齡,則智力較一般兒童高,若心理年齡低于其生理年齡,則智力較一般兒童低。但在使用中發(fā)現(xiàn),單純用心理年齡來表示智力高低的方法缺乏不同年齡兒童間的可比性,于是提出了比率智商和離差智商表示智力高低心理測(cè)量學(xué)知識(shí)(一)比率智商推孟修訂的斯坦福-比內(nèi)量表,以比率智商表示測(cè)驗(yàn)結(jié)果。比率智商(IQ)被定義為心理年齡(MA)與實(shí)足年齡(CA)之比。

(公式5-3)由于個(gè)體心理年齡與實(shí)足年齡并不同步增長,所以比率智商并不適合于年齡較大的被試。心理測(cè)量學(xué)知識(shí)(二)離差智商韋克斯勒提出離差智商。它是以年齡組為樣本計(jì)算而得的標(biāo)準(zhǔn)分?jǐn)?shù),它表示的是個(gè)體智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標(biāo)。韋克斯勒將離差智商的平均數(shù)定為100,標(biāo)準(zhǔn)差定為15。

(公式5-4)心理測(cè)量學(xué)知識(shí)離差智商實(shí)際應(yīng)用過程,將原始分?jǐn)?shù)與IQ值的對(duì)應(yīng)關(guān)系計(jì)算出來作為常模表,使用時(shí)可以直接按年齡查出智商。

離差智商的提出影響巨大,許多測(cè)驗(yàn)都采用離差智商。1960年的S-B,使用平均分為100,標(biāo)準(zhǔn)差為16的標(biāo)準(zhǔn)分?jǐn)?shù)量表。心理測(cè)量學(xué)知識(shí)

需要注意:從不同測(cè)驗(yàn)獲得離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時(shí)才能比較,標(biāo)準(zhǔn)差不同,分?jǐn)?shù)意義也不同。(詳見367)心理測(cè)量學(xué)知識(shí)幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系正負(fù)一個(gè)標(biāo)準(zhǔn)差的面積為68.27%;正負(fù)1.96個(gè)標(biāo)準(zhǔn)差的面積為95.45%;正負(fù)2.58個(gè)標(biāo)準(zhǔn)差的面積為99.73%。心理測(cè)量學(xué)知識(shí)第三單元常模分?jǐn)?shù)的表示方法一、轉(zhuǎn)換表法——最簡單、最基本

也叫常模表,是一種最簡單、最基本且最常用的呈現(xiàn)常模資料的方法,它由原始分?jǐn)?shù)、相應(yīng)的導(dǎo)出分?jǐn)?shù)和對(duì)常模團(tuán)體的有關(guān)具體描述三個(gè)要素構(gòu)成。

分為簡單轉(zhuǎn)換表與復(fù)雜轉(zhuǎn)換表。前者將單項(xiàng)測(cè)驗(yàn)的原始分?jǐn)?shù)轉(zhuǎn)化成一種或幾種導(dǎo)出分?jǐn)?shù);后者指包括幾個(gè)分測(cè)驗(yàn)或幾種常模團(tuán)體的原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)的對(duì)應(yīng)關(guān)系。二、剖析圖將測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來。心理測(cè)量學(xué)知識(shí)常模轉(zhuǎn)換表心理測(cè)量學(xué)知識(shí)剖面圖心理測(cè)量學(xué)知識(shí)第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念第二單元信度評(píng)估的方法第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋第四單元影響信度的因素心理測(cè)量學(xué)知識(shí)第一單元信度的概念一、信度的定義信度是指同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。心理測(cè)量學(xué)知識(shí)信度只受隨機(jī)誤差的影響。X=T+EE=Er+Es心理測(cè)量學(xué)知識(shí)二、信度的指標(biāo)1.信度系數(shù):同一受測(cè)者樣本所得到的兩組資料的相關(guān),實(shí)際上就是相關(guān)系數(shù):0≤r≤12.信度指數(shù):信度指數(shù)的平方就是信度系數(shù)3.測(cè)量標(biāo)準(zhǔn)誤信度系數(shù)表示一組測(cè)量的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但未指出個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的變異量。理論上,若對(duì)被試無數(shù)次施測(cè)即可得到個(gè)人真分?jǐn)?shù)(多次觀測(cè)分?jǐn)?shù)的平均數(shù)),標(biāo)準(zhǔn)差則為測(cè)量誤差的大小。

心理測(cè)量學(xué)知識(shí)

但實(shí)際上不能施測(cè)無數(shù)次,僅能以同一組被試兩次施測(cè)結(jié)果來代替對(duì)同一個(gè)人的反復(fù)施測(cè),于是有了信度另一個(gè)指標(biāo)——標(biāo)準(zhǔn)誤(SE)。(個(gè)人在兩次測(cè)驗(yàn)中分?jǐn)?shù)的差異就是測(cè)驗(yàn)誤差,測(cè)驗(yàn)誤差分?jǐn)?shù)形成一個(gè)分布,這個(gè)分布的標(biāo)準(zhǔn)差即為標(biāo)準(zhǔn)誤)SE為測(cè)量的標(biāo)準(zhǔn)誤,SX為所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx為測(cè)驗(yàn)的信度系數(shù)。

可以發(fā)現(xiàn):標(biāo)準(zhǔn)誤與信度互為消長的關(guān)系——信度越高,標(biāo)準(zhǔn)誤越??;信度越低,標(biāo)準(zhǔn)誤越大心理測(cè)量學(xué)知識(shí)第二單元信度評(píng)估的方法對(duì)信度的評(píng)估方法是沒有通用法則的,因?yàn)椴煌男哦确从硿y(cè)驗(yàn)誤差的不同來源,故每一種信度系數(shù)只能說明信度的不同方面,因而具有不同的意義。重測(cè)信度復(fù)本信度內(nèi)部一致性信度評(píng)分者信度心理測(cè)量學(xué)知識(shí)一、重測(cè)信度(穩(wěn)定性系數(shù))使用同一測(cè)驗(yàn),在同樣條件下對(duì)同一組被試者前后施測(cè)兩次測(cè)驗(yàn),求兩次得分間的相關(guān)系數(shù)。(重測(cè)法)重測(cè)信度的提出的原因:多數(shù)心理特征具有相對(duì)的穩(wěn)定性,短時(shí)間不會(huì)變化很大一般是兩周到四周較宜,間隔時(shí)間最好不超過六個(gè)月。優(yōu)點(diǎn):提供測(cè)驗(yàn)跨時(shí)間的穩(wěn)定性缺點(diǎn):受練習(xí)與記憶,身心發(fā)展變化的影響心理測(cè)量學(xué)知識(shí)二、復(fù)本信度以兩個(gè)等值但題目不同的測(cè)驗(yàn)(復(fù)本)來測(cè)量同一群體,然后求得被試者在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)復(fù)本信度反映的是測(cè)驗(yàn)在內(nèi)容上的等值性,故又稱等值性系數(shù)。施測(cè)過程中需要采用AB/BA施測(cè)順序來平衡順序效應(yīng)若副本先后施測(cè),存在時(shí)間間隔,具有了重測(cè)信度的特征,稱重測(cè)復(fù)本信度或穩(wěn)定性等值系數(shù)。優(yōu)點(diǎn):避免了一定的記憶、學(xué)習(xí)效應(yīng)(應(yīng)用較為廣泛)缺點(diǎn):練習(xí)能夠減少但不能消除;易產(chǎn)生遷移作用;復(fù)本建立困難心理測(cè)量學(xué)知識(shí)三、內(nèi)部一致性信度重測(cè)信度和復(fù)本信度主要考察了測(cè)驗(yàn)跨時(shí)間的一致性(穩(wěn)定性)和跨形式的一致性(等值性),而內(nèi)部一致性信度系數(shù)主要反映的是題目之間的關(guān)系,表示測(cè)驗(yàn)?zāi)軌驕y(cè)量相同內(nèi)容或特質(zhì)的程度。分半信度同質(zhì)性信度心理測(cè)量學(xué)知識(shí)(一)分半信度

采用分半法估計(jì)信度系數(shù)。實(shí)際做法:測(cè)驗(yàn)完成后,把測(cè)驗(yàn)項(xiàng)目按奇偶分為兩半,計(jì)算相關(guān),這個(gè)相關(guān)系數(shù)就代表了兩半測(cè)驗(yàn)內(nèi)容取樣的一致程度。缺點(diǎn):低估信度系數(shù)(測(cè)驗(yàn)長度影響使然)心理測(cè)量學(xué)知識(shí)代表測(cè)驗(yàn)內(nèi)部所有題目間的一致性。當(dāng)各個(gè)測(cè)題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,則測(cè)驗(yàn)為同質(zhì)的。相反,即使所有題目看起來好像測(cè)量同一特質(zhì),但相關(guān)很低或?yàn)樨?fù)相關(guān)時(shí),則測(cè)驗(yàn)為異質(zhì)的。(二)同質(zhì)性信度心理測(cè)量學(xué)知識(shí)四、評(píng)分者信度目的:

用于測(cè)量不同評(píng)分者之間產(chǎn)生的誤差。程序:隨機(jī)抽取若干份測(cè)驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。心理測(cè)量學(xué)知識(shí)第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)確定信度可以接受的水平解釋個(gè)人分?jǐn)?shù)的意義比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異心理測(cè)量學(xué)知識(shí)一、解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)信度系數(shù)可以解釋為測(cè)驗(yàn)的總變異中,真分?jǐn)?shù)造成的變異占百分之幾。

若rxx=0.9,則表示觀測(cè)分?jǐn)?shù)中90%的變異由真分?jǐn)?shù)造成,10%為誤差。

在極端的情況下,如有rxx=1.00,則表示完全沒有測(cè)量誤差,所有的變異均來自真實(shí)分?jǐn)?shù);若有rxx=0,則所有的變異和差別都反映的是測(cè)量誤差。心理測(cè)量學(xué)知識(shí)二、確定信度可以接受的水平

多高的信度水平才是可以接受的?

能力、成就測(cè)驗(yàn)信度系數(shù)0.9以上,甚至0.95;人格、興趣測(cè)驗(yàn)信度0.8~0.85一般原則是:當(dāng)rxx<0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人做出評(píng)價(jià)或預(yù)測(cè),而且不能作團(tuán)體比較;當(dāng)0.70≤rxx

<0.85時(shí),可用于團(tuán)體比較;當(dāng)rxx≥0.85時(shí),才能用來鑒別或預(yù)測(cè)個(gè)人成績或作為。注意哪里有“=”心理測(cè)量學(xué)知識(shí)三、解釋個(gè)人分?jǐn)?shù)的意義通過標(biāo)準(zhǔn)誤去解釋分?jǐn)?shù)意義。具體來說兩個(gè)作用:其一是估計(jì)真實(shí)分?jǐn)?shù)的范圍;從實(shí)得觀測(cè)分?jǐn)?shù)推測(cè)得到真分?jǐn)?shù),即確定置信區(qū)間:X-1.96SE<XT<X+1.96SE(有等號(hào))X-2.58SE<XT<X+2.58SE(有等號(hào))其二是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形。案例見書本375心理測(cè)量學(xué)知識(shí)四、比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異測(cè)量標(biāo)準(zhǔn)誤和測(cè)驗(yàn)信度在評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)的分?jǐn)?shù)是否有明顯差異時(shí)也非常重要。這種比較包括:兩個(gè)人不同分?jǐn)?shù)的差別;同一被試在兩個(gè)測(cè)驗(yàn)上的差別。這就是差異分?jǐn)?shù)標(biāo)準(zhǔn)誤問題:SEd=S(2-rxx-ryy)1/2s相同時(shí),兩個(gè)分?jǐn)?shù)才能比較

案例見書本375心理測(cè)量學(xué)知識(shí)第四單元影響信度的因素一、樣本特征二、測(cè)驗(yàn)長度三、測(cè)驗(yàn)難度四、時(shí)間間隔心理測(cè)量學(xué)知識(shí)一、樣本特征信度常用信度系數(shù)來表示,信度系數(shù)就是相關(guān)系數(shù),相關(guān)系數(shù)受樣本是否異質(zhì)及樣本團(tuán)體平均能力水平的影響。(一)樣本團(tuán)體異質(zhì)性的影響(二)樣本團(tuán)體平均能力水平的影響心理測(cè)量學(xué)知識(shí)㈠樣本團(tuán)體異質(zhì)性的影響任何相關(guān)系數(shù)都要受到團(tuán)體中分?jǐn)?shù)分布的范圍所影響,而分?jǐn)?shù)范圍與樣本團(tuán)體的異質(zhì)程度有關(guān)。若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往往會(huì)高估測(cè)驗(yàn)的信度,相反則會(huì)低估測(cè)驗(yàn)的信度。同質(zhì)團(tuán)體,受測(cè)者水平接近,兩次測(cè)驗(yàn)成績受隨機(jī)誤差影響;異質(zhì)團(tuán)體受隨機(jī)誤差影響較小。心理測(cè)量學(xué)知識(shí)㈡樣本團(tuán)體平均能力水平的影響測(cè)驗(yàn)的信度還受取樣不同團(tuán)體間平均能力水平的不同而不同。這是因?yàn)?,?duì)于不同水平的團(tuán)體,題目具有不同的難度,每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。因此報(bào)告信度系數(shù)時(shí),需要對(duì)建立信度系數(shù)的團(tuán)體進(jìn)行描述。心理測(cè)量學(xué)知識(shí)二、測(cè)驗(yàn)長度測(cè)驗(yàn)長度,亦即測(cè)驗(yàn)的數(shù)量,也是影響信度系數(shù)的一個(gè)因素。一般來說,在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目,可以使信度提高。第一,測(cè)驗(yàn)越長,測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣就越有代表性。第二,測(cè)驗(yàn)越長,被試的猜測(cè)因素影響就越小。不過——測(cè)驗(yàn)過長有時(shí)會(huì)引起被試的疲勞和反感而降低可靠性。心理測(cè)量學(xué)知識(shí)三、測(cè)驗(yàn)難度難度對(duì)信度的影響,只存在于某些測(cè)驗(yàn)中。如智力測(cè)驗(yàn)、成就測(cè)驗(yàn)、能力傾向測(cè)驗(yàn)等,對(duì)于人格測(cè)驗(yàn)、興趣測(cè)驗(yàn)、態(tài)度量表等不存在難度問題,因?yàn)檫@些測(cè)驗(yàn)的題目沒有正確或錯(cuò)誤答案之分。在實(shí)際情況下,如果某個(gè)測(cè)驗(yàn)難度水平針對(duì)特定的團(tuán)體可能會(huì)顯得太難、太易,使得分?jǐn)?shù)分布范圍縮小,信度水平降低。(難度水平使測(cè)驗(yàn)分?jǐn)?shù)分布范圍較大時(shí),測(cè)驗(yàn)信度最高,通常平均難度水平為0.5)心理測(cè)量學(xué)知識(shí)四、時(shí)間間隔以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大;間隔時(shí)間越久,其他變因介入的可能性越大,受外界的影響也越大,信度系數(shù)便越低。心理測(cè)量學(xué)知識(shí)第四節(jié)測(cè)驗(yàn)的效度第一單元效度的概念第二單元效度評(píng)估的方法第三單元效度的功能第四單元影響效度的因素心理測(cè)量學(xué)知識(shí)一、效度的定義(概念定義與操作性定義的符合程度)效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者簡單地說是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。也稱為測(cè)驗(yàn)有效性,指一套測(cè)驗(yàn)對(duì)應(yīng)該測(cè)試的內(nèi)容所測(cè)的程度,即一套測(cè)試是否達(dá)到了它預(yù)定的目的以及是否測(cè)量了他要測(cè)量的內(nèi)容。在測(cè)驗(yàn)理論中,效度被定義為在一組測(cè)量中,與測(cè)量目標(biāo)有關(guān)的真實(shí)方差(或稱有效方差)與總方差的比率。心理測(cè)量學(xué)知識(shí)測(cè)驗(yàn)效度受隨機(jī)誤差和系統(tǒng)誤差的影響。可信的測(cè)驗(yàn)未必有效,而有效的測(cè)驗(yàn)必定可信。心理測(cè)量學(xué)知識(shí)二、效度的性質(zhì)(一)效度具有相對(duì)性在評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的與功能。不能籠統(tǒng)說,測(cè)驗(yàn)有效還是無效,而應(yīng)該說對(duì)測(cè)什么有效還是無效。(二)效度具有連續(xù)性測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。因此,我們?cè)u(píng)價(jià)一個(gè)測(cè)驗(yàn)時(shí),不應(yīng)該說“有效”或“無效”,而應(yīng)該用效度較高或較低來評(píng)價(jià)。(例用ipad稱體重,高效嗎?)另外,效度是針對(duì)測(cè)驗(yàn)結(jié)果的,即測(cè)驗(yàn)效度是“測(cè)驗(yàn)結(jié)果”的有效性程度。心理測(cè)量學(xué)知識(shí)信度和效度的關(guān)系一、信度是效度的必要而非充分條件二、效度是受信度制約的心理測(cè)量學(xué)知識(shí)心理測(cè)量學(xué)知識(shí)第二單元效度評(píng)估的方法美國心理學(xué)會(huì)在1974年所發(fā)行的《教育與心理測(cè)量之標(biāo)準(zhǔn)》一書中將效度分為三大類:內(nèi)容效度構(gòu)想效度效標(biāo)效度測(cè)量的效度就是測(cè)量結(jié)果達(dá)到測(cè)量目的的程度,所以測(cè)量效度的估計(jì)很大程度上取決于人們對(duì)測(cè)量目的的解釋。目前常見的解釋角度有三種:用測(cè)量的內(nèi)容說明目的;用心理學(xué)某種理論結(jié)構(gòu)說明目的;用工作實(shí)效說明目的心理測(cè)量學(xué)知識(shí)一、內(nèi)容效度(測(cè)驗(yàn)的代表性和覆蓋性)(一)什么是內(nèi)容效度內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。內(nèi)容效度是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到的內(nèi)容與所要測(cè)量的內(nèi)容之間的吻合程度。例如判斷高中物理試卷的內(nèi)容效度,我們需要分析題目是否涵蓋了力、電、光、熱以及原子物理五方面內(nèi)容,并且沒有化學(xué)和地理其他題目摻入。心理測(cè)量學(xué)知識(shí)編制較高的內(nèi)容效度心理測(cè)驗(yàn)需要注意:第一,對(duì)所測(cè)量的心理特性有明確的概念;第二,測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。需要注意的是,要求內(nèi)容效度的測(cè)驗(yàn)不一定要求測(cè)驗(yàn)同質(zhì),具體情況應(yīng)隨實(shí)際情況而定。心理測(cè)量學(xué)知識(shí)內(nèi)容效度與表面效度表面效度是由外行對(duì)測(cè)驗(yàn)作表面上的檢查確定的,它不反映測(cè)驗(yàn)實(shí)際測(cè)量的東西,只是指測(cè)驗(yàn)表面上看來好像是測(cè)量所要測(cè)的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)而建立的。最高行為測(cè)驗(yàn)要求較高表面效度典型行為測(cè)驗(yàn)要求較低表面效度心理測(cè)量學(xué)知識(shí)在編制“領(lǐng)導(dǎo)能力測(cè)驗(yàn)”時(shí)編寫了這么三個(gè)問題:a.我愿指揮別人.不愿別人指揮我。b.我喜歡聽古典音樂。c.人們經(jīng)常征求我的意見。通過預(yù)測(cè)發(fā)現(xiàn),領(lǐng)導(dǎo)干部對(duì)a、b作肯定回答的人數(shù)比例明顯地高于一般群眾,對(duì)c作肯定回答的人數(shù)比例與一般群眾差不多。從區(qū)分能力來看,c題應(yīng)被淘汰。但是,若從表面上看,a、c兩題都有表面效度,b題沒有表面效度。這個(gè)例子說明,對(duì)于一個(gè)具體的測(cè)量目標(biāo)來說,有表面效度的題目不見得真正有效,沒有表面效度的題目也可能有效,因此,表面效度不是確定內(nèi)容效度的客觀指標(biāo)。心理測(cè)量學(xué)知識(shí)(二)內(nèi)容效度的評(píng)估方法1.專家判斷法2.統(tǒng)計(jì)分析法3.經(jīng)驗(yàn)推測(cè)法心理測(cè)量學(xué)知識(shí)1.專家判斷法請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容的符合性做出判斷,看測(cè)驗(yàn)的題目是否代表規(guī)定的內(nèi)容。又稱“邏輯效度”(logicalvalidity)。心理測(cè)量學(xué)知識(shí)增加專家評(píng)定客觀性的步驟:1.定義好測(cè)驗(yàn)內(nèi)容的總體范圍,描述有關(guān)知識(shí)與技能及所用材料的來源;2.編制雙向細(xì)目表3.制定評(píng)定量表來測(cè)量測(cè)驗(yàn)的整個(gè)效度

最后由每位評(píng)判者在評(píng)定量表上做出判斷,從而獲得測(cè)驗(yàn)內(nèi)容效度的證據(jù)。心理測(cè)量學(xué)知識(shí)2.統(tǒng)計(jì)分析法重測(cè)信度(再測(cè)法):訓(xùn)練前與訓(xùn)練后評(píng)分者一致性信度:多個(gè)評(píng)分者之間的一致程度復(fù)本信度:復(fù)本求相關(guān)——相關(guān)低則至少一個(gè)測(cè)驗(yàn)缺乏效度心理測(cè)量學(xué)知識(shí)3.經(jīng)驗(yàn)推測(cè)法即通過實(shí)踐來檢驗(yàn)效度。如兒童發(fā)展量表是否有效,經(jīng)過對(duì)不同年齡階段的兒童進(jìn)行調(diào)查,然后分析其結(jié)果。若通過率是隨著年齡的增加而增加,就可以推測(cè)該測(cè)驗(yàn)有內(nèi)容效度。心理測(cè)量學(xué)知識(shí)(三)內(nèi)容效度的特性內(nèi)容效度與所有效度的性質(zhì)一樣,不是普遍適用的,而是根據(jù)具體情況分析得來。如果測(cè)驗(yàn)分析者和測(cè)驗(yàn)使用者定義的內(nèi)容范圍相同,則編制者報(bào)告的內(nèi)容效度對(duì)使用者而言是有意義的,否則就沒有意義。

內(nèi)容效度也有時(shí)間特定性,適合過去總體的代表性測(cè)驗(yàn)未必符合現(xiàn)在的總體。心理測(cè)量學(xué)知識(shí)二、構(gòu)想效度(一)什么是構(gòu)想效度(二)構(gòu)想效度的估計(jì)方法心理測(cè)量學(xué)知識(shí)(一)什么是構(gòu)想效度構(gòu)思效度,或結(jié)構(gòu)效度。主要涉及心理學(xué)的理論概念問題。指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果能否證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。心理測(cè)量學(xué)知識(shí)建立構(gòu)想效度的步驟:欲建立構(gòu)想效度,必需先從某一構(gòu)想的理論出發(fā),提出關(guān)于某一心理特質(zhì)的假設(shè),然后設(shè)計(jì)和編制測(cè)驗(yàn)并進(jìn)行施測(cè),最后對(duì)結(jié)果采用相關(guān)或因素分析進(jìn)行分析,驗(yàn)證理論假設(shè)的符合程度。心理測(cè)量學(xué)知識(shí)(二)構(gòu)想效度的估計(jì)方法1.對(duì)測(cè)驗(yàn)本身的分析(測(cè)驗(yàn)內(nèi)部尋找證據(jù))(1)內(nèi)容效度:分析內(nèi)容效度即可得出結(jié)構(gòu)效度(2)內(nèi)部一致性信度:測(cè)驗(yàn)是單一特質(zhì)還是多種特質(zhì)(3)被試對(duì)題目的反應(yīng)特點(diǎn):若有證據(jù)表明某一題目的作答除了反映著所要測(cè)的特質(zhì)之外還反映著其他因素的影響,則構(gòu)想效度受到影響。心理測(cè)量學(xué)知識(shí)2.測(cè)驗(yàn)間的相互比較(測(cè)驗(yàn)之間尋找證據(jù))(1)相容效度:待研究效度測(cè)驗(yàn)與同一成熟測(cè)驗(yàn)求相關(guān)(2)區(qū)分效度:待研究效度測(cè)驗(yàn)與其他異質(zhì)測(cè)驗(yàn)求相關(guān)(3)因素分析法:因素分析因子與構(gòu)想符合程度心理測(cè)量學(xué)知識(shí)3.效標(biāo)效度的研究證明

實(shí)測(cè)成績能否真正將個(gè)體分類:選取不同的被試構(gòu)成對(duì)照組,施測(cè)后比較兩組的分?jǐn)?shù),若二者分?jǐn)?shù)將兩組截然分開,則構(gòu)想效度不錯(cuò)。

分析心理特質(zhì)的發(fā)展變化,如智力隨年齡而發(fā)展,若測(cè)驗(yàn)?zāi)芊磻?yīng)這一規(guī)律則,結(jié)構(gòu)效度高4.實(shí)驗(yàn)法和觀察法證實(shí)

訓(xùn)練前后測(cè)驗(yàn)分?jǐn)?shù)的變化心理測(cè)量學(xué)知識(shí)三、效標(biāo)效度(一)什么是效標(biāo)效度(二)效標(biāo)效度的估計(jì)方法心理測(cè)量學(xué)知識(shí)(一)什么是效標(biāo)效度(實(shí)證效度)效標(biāo)效度反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效程度。(實(shí)證效度)被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡稱效標(biāo)。根據(jù)效標(biāo)資料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度和預(yù)測(cè)效度兩類,前者在于診斷現(xiàn)狀;后者在于預(yù)測(cè)未來。一個(gè)測(cè)驗(yàn)是否有效,以實(shí)踐的效果來作為檢驗(yàn)標(biāo)準(zhǔn)心理測(cè)量學(xué)知識(shí)檢驗(yàn)一個(gè)測(cè)驗(yàn)的效標(biāo)效度時(shí),關(guān)鍵在于找到合適的效標(biāo)一個(gè)好的效標(biāo)必須具備以下條件:

(1)效標(biāo)必須能最有效地反映測(cè)驗(yàn)的目標(biāo),即效標(biāo)測(cè)量本身必須有效;(2)效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素而變化;(3)效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來表示;(4)效標(biāo)測(cè)量的方法簡單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。心理測(cè)量學(xué)知識(shí)(二)效標(biāo)效度的評(píng)估方法1.相關(guān)法2.區(qū)分法3.命中率法心理測(cè)量學(xué)知識(shí)1.相關(guān)法相關(guān)法是評(píng)估效標(biāo)效度最常用的方法,它是求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。計(jì)算效度系數(shù)最常用的是積差相關(guān)法(連續(xù)變量、二列(兩個(gè)變量都為連續(xù)變量,一個(gè)人為劃分為二分變量)、點(diǎn)二列相關(guān)(一個(gè)是真正的二分變量,另一個(gè)是連續(xù)變量)、賈斯朋多系列相關(guān)(測(cè)驗(yàn)分?jǐn)?shù)為連續(xù)變量,效標(biāo)資料為等級(jí)評(píng)定)心理測(cè)量學(xué)知識(shí)2.區(qū)分法區(qū)分法是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。某政府機(jī)關(guān)通過測(cè)驗(yàn)錄用了一批公務(wù)員,經(jīng)半年試用期后,根據(jù)他們的實(shí)際工作成績,將這批公務(wù)員區(qū)分為稱職和不稱職兩組,然后回過頭來檢查這兩組人在測(cè)驗(yàn)上的分?jǐn)?shù)是否有顯著差異,如果差異顯著,說明這個(gè)測(cè)驗(yàn)在錄用公務(wù)員的選拔性測(cè)驗(yàn)中是有效的。具體做法是分析高分組與低分組分布的重疊量:一種是計(jì)算每一組內(nèi)得分超過(低于)另一組平均數(shù)的人數(shù)百分比;一種是計(jì)算兩組共同分布的百分比(詳見書本384)心理測(cè)量學(xué)知識(shí)3.命中率法命中率法是當(dāng)測(cè)驗(yàn)用來做取舍的依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。使用命中率法,可將測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)資料分為兩類。在測(cè)驗(yàn)分?jǐn)?shù)方面是確定一個(gè)臨界分?jǐn)?shù)(即分?jǐn)?shù)線),高于臨界分?jǐn)?shù)者預(yù)測(cè)其成功,低于臨界分?jǐn)?shù)者預(yù)測(cè)其失敗;在效標(biāo)資料方面根據(jù)實(shí)際工作或?qū)W習(xí)成績,確定一個(gè)合格標(biāo)準(zhǔn),標(biāo)準(zhǔn)之上與之下。心理測(cè)量學(xué)知識(shí)根據(jù)測(cè)驗(yàn)分?jǐn)?shù)與實(shí)際工作情況,可以分為四種情況:失敗成功成功失誤命中失敗命中失誤心理測(cè)量學(xué)知識(shí)命中率計(jì)算:總命中率=命中/(命中+失誤)正命中率=測(cè)驗(yàn)與效標(biāo)皆成功人數(shù)/測(cè)驗(yàn)成功人數(shù)分?jǐn)?shù)線越高,正命中率越高;否則越低。心理測(cè)量學(xué)知識(shí)第三單元效度的功能一、預(yù)測(cè)誤差效度系數(shù)的實(shí)際意義常以決定系數(shù)來表示。決定系數(shù)即為效度系數(shù)的平方,表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。另一種表達(dá)方法,估計(jì)的標(biāo)準(zhǔn)誤,指所有具有某一測(cè)驗(yàn)分?jǐn)?shù)的受測(cè)者其效標(biāo)分?jǐn)?shù)分布的標(biāo)準(zhǔn)差,即預(yù)測(cè)誤差大小的估計(jì)值(見385)表示預(yù)測(cè)誤差大小的估計(jì)值。測(cè)驗(yàn)效度完美(為1),估計(jì)標(biāo)準(zhǔn)誤為0心理測(cè)量學(xué)知識(shí)二、預(yù)測(cè)效標(biāo)分?jǐn)?shù)

若X、Y呈直線相關(guān),可利用回歸方程從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)分?jǐn)?shù)三、預(yù)測(cè)效度指數(shù)E=100(1-K)E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差例如,效度系數(shù)為0.8,K=0.6,E=0.4,這表明預(yù)測(cè)誤差僅為隨機(jī)猜測(cè)所產(chǎn)生誤差的60%,即減少了40%誤差。心理測(cè)量學(xué)知識(shí)第四單元影響效度的因素一、測(cè)驗(yàn)本身的因素二、測(cè)驗(yàn)實(shí)施中的干擾因表三、樣本團(tuán)體的性質(zhì)四、效標(biāo)的性質(zhì)心理測(cè)量學(xué)知識(shí)一、測(cè)驗(yàn)本身的因素1.測(cè)驗(yàn)材料必須對(duì)整個(gè)內(nèi)容具有代表性;2.測(cè)題設(shè)計(jì)時(shí)應(yīng)盡量避免容易引起誤差的題型(如是非題);3.測(cè)題難度要適中,具有較高的區(qū)分度;4.測(cè)驗(yàn)長度要恰當(dāng),即要有一定的測(cè)題量;5.測(cè)題的排列按先易后難順序。心理測(cè)量學(xué)知識(shí)二、測(cè)驗(yàn)實(shí)施中的干擾因表(一)主試的影響因素測(cè)驗(yàn)實(shí)施過程、評(píng)分標(biāo)準(zhǔn)化與否。

效標(biāo)與測(cè)驗(yàn)時(shí)間間隔越長,效度降低

測(cè)驗(yàn)情境(二)被試的影響因素興趣、態(tài)度、情緒等心理測(cè)量學(xué)知識(shí)三、樣本團(tuán)體的性質(zhì)(一)樣本團(tuán)體的異質(zhì)性如果其他條件相同,樣本團(tuán)體越同質(zhì),分?jǐn)?shù)分布范圍越小,測(cè)驗(yàn)效度就越低

選拔測(cè)驗(yàn)和選拔標(biāo)準(zhǔn)的增高,導(dǎo)致樣本團(tuán)體同質(zhì)性增大,效度降低(二)干涉變量

性別、年齡、教育水平、智力、動(dòng)機(jī)等心理測(cè)量學(xué)知識(shí)四、效標(biāo)的性質(zhì)

效標(biāo)效度以測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù)來表示,效標(biāo)性質(zhì)影響效度評(píng)價(jià)。

效標(biāo)測(cè)量的可靠性——即效標(biāo)測(cè)量的信度心理測(cè)量學(xué)知識(shí)第五節(jié)項(xiàng)目分析心理測(cè)量學(xué)知識(shí)測(cè)驗(yàn)的項(xiàng)目分析包括定性分析和定量分析兩個(gè)方面。定性分析包括考慮內(nèi)容效度,題目編寫的恰當(dāng)性和有效性等;定量分析主要是指對(duì)題目難度和區(qū)分度等進(jìn)行分析。心理測(cè)量學(xué)知識(shí)第一單元項(xiàng)目的難度心理測(cè)量學(xué)知識(shí)一、定義難度(difficulty),顧名思義,是指項(xiàng)目的難易程度。難度的指標(biāo)通常以通過率表示,即以答對(duì)或通過該題的人數(shù)百分比來表示:

(公式5-31)通過人數(shù)越多(即P值越大),難度越低;心理測(cè)量學(xué)知識(shí)二、項(xiàng)目難度的估計(jì)方法(1)二值記分的測(cè)題:答對(duì)的百分比(或比率)

P值越大,則難度越小。心理測(cè)量學(xué)知識(shí)(2)不是二值記分(3)分組計(jì)分項(xiàng)目心理測(cè)量學(xué)知識(shí)三、難度水平的確定——主要目的在于篩選項(xiàng)目(一)項(xiàng)目的難度——取決于測(cè)驗(yàn)?zāi)康?、性質(zhì)與形式標(biāo)準(zhǔn)測(cè)驗(yàn),為了測(cè)量個(gè)體差異。P接近0.5最大程度上提供個(gè)體差異信息選拔診斷測(cè)驗(yàn),選擇難度接近錄取率的項(xiàng)目。對(duì)于選擇題來說,P應(yīng)大于概率水平:是非題難度應(yīng)為0.75;四擇一,難度0.63心理測(cè)量學(xué)知識(shí)(二)測(cè)驗(yàn)的難度取決于項(xiàng)目難度,通過測(cè)驗(yàn)分?jǐn)?shù)分布對(duì)難度進(jìn)行檢驗(yàn)如果被試樣本具有代表性,對(duì)于中等難度的測(cè)驗(yàn),其測(cè)驗(yàn)總分應(yīng)該接近常態(tài)分配。正偏態(tài)——難度大;負(fù)偏態(tài)——測(cè)驗(yàn)過易心理測(cè)量學(xué)知識(shí)第二單元項(xiàng)目的區(qū)分度心理測(cè)量學(xué)知識(shí)一、定義項(xiàng)目區(qū)分度,也叫鑒別力,是指測(cè)驗(yàn)項(xiàng)目對(duì)被試的心理特性的區(qū)分能力。是評(píng)價(jià)項(xiàng)目質(zhì)量和篩選項(xiàng)目的主要指標(biāo)。水平高者得高分,水平低者得低分——區(qū)分度高區(qū)分度D取值范圍為-1~+1之間,D為正值,則積極區(qū)分;D為負(fù)值,為消極區(qū)分;D為0,則無區(qū)分。D值越大,區(qū)分效果越好。心理測(cè)量學(xué)知識(shí)二、計(jì)算方法(一)鑒別指數(shù)按測(cè)驗(yàn)總分高低排列答卷確定高分組與低分組,每組取答卷總數(shù)的27%分別計(jì)算高分組與低分組在該項(xiàng)目上的通過率高分組通過率-低分組通過率得項(xiàng)目鑒別指數(shù)據(jù)項(xiàng)目鑒別指數(shù)進(jìn)行項(xiàng)目取舍D=PH-PL0.4以上,很好0.3-0.39,良好,修改后更好0.2-029尚可,仍需修改0.19以下,差,必須淘汰心理測(cè)量學(xué)知識(shí)(二)相關(guān)法鑒別指數(shù)易于理解,計(jì)算方便,但結(jié)果不精確,因此采用相關(guān)法。以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測(cè)驗(yàn)總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。計(jì)算區(qū)分度最常用的方法是相關(guān)法1.點(diǎn)二列相關(guān):2.二列相關(guān):3.Ф相關(guān)法:相關(guān)越高表明項(xiàng)目越有區(qū)分功能心理測(cè)量學(xué)知識(shí)三、區(qū)分度與難度的關(guān)系一般來說,較難的項(xiàng)目對(duì)高水平的被試區(qū)分度高,較易的項(xiàng)目對(duì)水平低的被試區(qū)分度高,中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高。若項(xiàng)目通過率為1,則D=?0若項(xiàng)目通過率為0,則D=?0若項(xiàng)目通過率為0.5,則D=?1難度越接近0.5,區(qū)分度越接近1;平均難度水平為0.5心理測(cè)量學(xué)知識(shí)第六節(jié)測(cè)驗(yàn)編制的一般程序第一單元

測(cè)驗(yàn)的目標(biāo)分析第二單元測(cè)題的編寫第三單元測(cè)驗(yàn)的編排和組織心理測(cè)量學(xué)知識(shí)編制心理與教育測(cè)驗(yàn)的基本程序一、確定測(cè)驗(yàn)?zāi)康亩?、制定編題計(jì)劃三、編輯測(cè)驗(yàn)項(xiàng)目四、預(yù)測(cè)與分析五、合成測(cè)驗(yàn)六、測(cè)驗(yàn)標(biāo)準(zhǔn)化七、鑒定測(cè)驗(yàn)八、編寫測(cè)驗(yàn)說明書心理測(cè)量學(xué)知識(shí)第一單元

測(cè)驗(yàn)的目標(biāo)分析

一、測(cè)驗(yàn)的對(duì)象二、測(cè)驗(yàn)的用途三、測(cè)驗(yàn)的目標(biāo)心理測(cè)量學(xué)知識(shí)一、測(cè)驗(yàn)的對(duì)象明確測(cè)驗(yàn)對(duì)象,明確測(cè)量哪些個(gè)人和團(tuán)體。通常以年齡、性別、職業(yè)、受教育程度、經(jīng)濟(jì)狀況、民族、文化背景等指標(biāo)來區(qū)分測(cè)量對(duì)象。心理測(cè)量學(xué)知識(shí)二、測(cè)驗(yàn)的用途所編出的測(cè)驗(yàn)是要對(duì)被試做描述,還是做診斷,亦或是選拔和預(yù)測(cè),(一)顯示性測(cè)驗(yàn)顯示性測(cè)驗(yàn)是指測(cè)驗(yàn)題目和所要測(cè)量的心理特征相似的測(cè)驗(yàn)。(二)預(yù)測(cè)性測(cè)驗(yàn)心理測(cè)量學(xué)知識(shí)三、測(cè)驗(yàn)的目標(biāo)心理測(cè)驗(yàn)的目標(biāo)是指編制的測(cè)驗(yàn)是測(cè)什么的,即用來測(cè)量什么樣的心理變量或行為特征。(一)工作分析對(duì)所預(yù)測(cè)的行為活動(dòng)作具體分析確定哪些心理特征和行為可以使要預(yù)測(cè)的活動(dòng)達(dá)到成功建立衡量被試是否成功的標(biāo)準(zhǔn)(二)對(duì)特定概念下定義(三)確定測(cè)驗(yàn)的具體內(nèi)容心理測(cè)量學(xué)知識(shí)第二單元測(cè)題的編寫一、搜集資料二、命題的一般原則三、測(cè)題的編制要領(lǐng)心理測(cè)量學(xué)知識(shí)一、搜集資科(一)已出版的標(biāo)準(zhǔn)測(cè)驗(yàn)(二)理論和專家的經(jīng)驗(yàn)(三)臨床觀察和記錄心理測(cè)量學(xué)知識(shí)二、命題的一般原則(一)內(nèi)容方面(二)文字方面(三)理解方面(四)社會(huì)敏感性方面心理測(cè)量學(xué)知識(shí)三、測(cè)題的編制要領(lǐng)可以分為兩大類:提供型(supply)和選擇型(selection)題目。選擇題是非題簡答題操作題心理測(cè)量學(xué)知識(shí)第三單元測(cè)驗(yàn)的編排和組織一、合成測(cè)驗(yàn)二、預(yù)測(cè)與項(xiàng)目分析三、信度和效度考察四、常模制定五、編寫指導(dǎo)手冊(cè)心理測(cè)量學(xué)知識(shí)一、合成測(cè)驗(yàn)合成測(cè)驗(yàn)就是把經(jīng)過預(yù)測(cè)以后證明有價(jià)值的項(xiàng)目排成有組織的測(cè)驗(yàn)。解決兩個(gè)問題:一是測(cè)驗(yàn)項(xiàng)目的選擇;二是測(cè)驗(yàn)項(xiàng)目的編排心理測(cè)量學(xué)知識(shí)(一)選擇與審定試題1.選擇試題形式2.審定題目心理測(cè)量學(xué)知識(shí)(二)測(cè)題的編排測(cè)驗(yàn)編排的一般原則:1.測(cè)題的難度排列宜逐步上升。2.盡可能將同類型的測(cè)題組合在一起。3.注意根據(jù)各種類型測(cè)題本身的特點(diǎn)排列題目。兩種常見的排列方式。1.并列直進(jìn)式(按題目)2.混合螺旋式(按難度)心理測(cè)量學(xué)知識(shí)二、預(yù)測(cè)與項(xiàng)目分析(一)預(yù)測(cè)(二)項(xiàng)目分析心理測(cè)量學(xué)知識(shí)三、信度和效度考察(一)信度(二)效度心理測(cè)量學(xué)知識(shí)四、常模制訂選擇常模團(tuán)體施測(cè)獲得常模原始分?jǐn)?shù)轉(zhuǎn)化為導(dǎo)出分?jǐn)?shù)心理測(cè)量學(xué)知識(shí)五、編寫指導(dǎo)手冊(cè)測(cè)驗(yàn)指導(dǎo)手冊(cè)的內(nèi)容有:1.測(cè)驗(yàn)的目的和功用。2.測(cè)驗(yàn)編制的理論背景3.如何實(shí)施測(cè)驗(yàn)的說明。4.測(cè)驗(yàn)的標(biāo)準(zhǔn)答案和記分標(biāo)準(zhǔn)。5.常模資料6.測(cè)驗(yàn)的基本特征心理測(cè)量學(xué)知識(shí)第七節(jié)心理測(cè)驗(yàn)的使用第一單元主試的資格第二單元測(cè)驗(yàn)的選擇第三單元測(cè)驗(yàn)前的準(zhǔn)備工作第四單元測(cè)驗(yàn)實(shí)施的程序及要素第五單元被試誤

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論