![心理測量學(xué)知識_第1頁](http://file4.renrendoc.com/view/1a84b31b3363ad764e24703167e96d14/1a84b31b3363ad764e24703167e96d141.gif)
![心理測量學(xué)知識_第2頁](http://file4.renrendoc.com/view/1a84b31b3363ad764e24703167e96d14/1a84b31b3363ad764e24703167e96d142.gif)
![心理測量學(xué)知識_第3頁](http://file4.renrendoc.com/view/1a84b31b3363ad764e24703167e96d14/1a84b31b3363ad764e24703167e96d143.gif)
![心理測量學(xué)知識_第4頁](http://file4.renrendoc.com/view/1a84b31b3363ad764e24703167e96d14/1a84b31b3363ad764e24703167e96d144.gif)
![心理測量學(xué)知識_第5頁](http://file4.renrendoc.com/view/1a84b31b3363ad764e24703167e96d14/1a84b31b3363ad764e24703167e96d145.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
心理測量學(xué)信忠義E-mail:心理測量學(xué)知識感悟測量測量無處不在……心理測量學(xué)知識城市夜晚燈光亮度與GDP科學(xué)家發(fā)現(xiàn)可以通過太空拍攝城市夜間燈光亮度,來反映全球各國經(jīng)濟的發(fā)展水平。心理測量學(xué)知識這是一張衛(wèi)星合成圖。一些國家經(jīng)濟增長迅速,建了更多的基礎(chǔ)設(shè)施(如街道照明),而人們晚上也會打開更多的燈。這表明,從太空中看到的夜間燈光強度與一個國家的國內(nèi)生產(chǎn)總值存在關(guān)聯(lián)。在某些相關(guān)經(jīng)濟數(shù)據(jù)極少或存在誤導(dǎo)的地區(qū),這種經(jīng)濟情況評估方式會大有用武之地。心理測量學(xué)知識這是北美地區(qū)夜間燈光的分布情況。北美是世界上最富裕的地區(qū)之一。心理測量學(xué)知識西歐的夜晚同樣是燈火通明心理測量學(xué)知識這張圖顯示的是南美海岸、哥倫比亞北部和委內(nèi)瑞拉的人口稠密地區(qū)。不難看出,內(nèi)陸地區(qū)燈光強度相對很弱。心理測量學(xué)知識亞洲既有發(fā)達國家,也有發(fā)展中國家,中印兩國經(jīng)濟的快速增長尤其引人注意。這張圖上,還可以看到日本稠密的燈光覆蓋情況。對比最明顯的是南北朝鮮。心理測量學(xué)知識2012年中國家庭金融調(diào)查與研究中心發(fā)布一份《中國家庭金融調(diào)查報告》稱,中國家庭資產(chǎn)平均為121.69萬元,城市家庭平均為247.60萬元;中國家庭自有住房擁有率為89.68%,遠超世界60%左右的水平,甚至高過美國和日本;2011年中國城市戶均擁有住房為1.22套。事實上這一報告的出爐,引起了人們的議論。與人們對人均GDP的反應(yīng)一樣,首先認為數(shù)據(jù)準確度不高;其次,驚呼自己拖了國家的后腿。這一數(shù)據(jù)與我們的現(xiàn)實感受符合嗎?為什么人們的感受與數(shù)據(jù)存在差距呢?一個原因可能數(shù)據(jù)的準確性上確實存在偏差;另一個可能的原因在于求平均。比如你的隔壁住了一位富翁,資產(chǎn)1000萬,你身無分文,但平均資產(chǎn)都是500萬,瞬間變成了富翁心理測量學(xué)知識“心”如何測量?心理測量學(xué)知識心理小測驗1
假如你的戀人在一個孤立的小島上,小島沒有陸地之間沒有橋,請你選擇到去小島的方式。A劃船過去B坐烏龜過去C不過去D游泳過去請在紙上寫下你的答案!心理測量學(xué)知識此測驗是性取向測驗。劃船過去——正常的異性戀坐烏龜過去——性變態(tài)不過去——性冷淡游泳過去——同性戀心理測量學(xué)知識心理小測驗2請你回憶自己洗澡的順序,選擇你最后清洗的部位:A頭發(fā)B面部C隱私部位D腿請在紙上寫下你的答案!心理測量學(xué)知識此測驗是一項自信測驗。最后清洗的部位即為你最不自信的部位!心理測量學(xué)知識剛才的兩個測驗科學(xué)嗎?這兩個測驗是“三無產(chǎn)品”,且施測過程缺乏科學(xué)性。心理測量學(xué)知識科學(xué)心理測量學(xué)的主要內(nèi)容第一節(jié)概述第二節(jié)測驗的常模第三節(jié)測驗的信度第四節(jié)測驗的效度第五節(jié)項目分析第六節(jié)測驗編制的一般程序第七節(jié)心理測驗的使用心理測量學(xué)知識第一節(jié)概述第一單元測量與測量量表第二單元心理測驗的基本概念第三單元心理測驗的分類第四單元糾正錯誤的測驗觀第五單元心理測驗在心理咨詢中的應(yīng)用第六單元心理測驗的發(fā)展史心理測量學(xué)知識第一單元測量與測量量表一、什么是測量二、測量要素三、測量量表心理測量學(xué)知識一、什么是測量測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。三個主要的元素:(1)事物;(2)數(shù)字;(3)法則。心理測量學(xué)知識1.所謂“事物”,指的是我們要測量的對象,更準確地說,就是引起我們興趣的事物的屬性或特征。2.所謂“數(shù)字”,是代表某一事物或事物某一屬性的量。數(shù)字的特性:區(qū)分性--1與2等級性或位次性--3>2>1等距性--3-2=1、2-1=1可加性3.所謂“法則”,代表的是測量所依據(jù)的規(guī)則和方法測量三元素心理測量學(xué)知識二、測量要素(一)參照點參照點就是確定事物的量時,計算的起點。參照點有兩種:絕對零點:重量,長度人定的參照點,即相對零點:智力,新生兒能說他沒有智力嗎?(二)單位好的單位必須具備兩個條件:確定的意義:所有人理解的意義都一樣相同的價值:相鄰單位之間的差別是相等的心理測驗對象往往難以滿足這兩個條件思考:1.小明考試得了60分,說明了什么?2.小明考試得了60分,班里排名第三說明了什么?3.小明考試得了60分,班里排名第三,班里共5人,說明了什么?心理測量學(xué)知識三、測量量表測量的本質(zhì)是根據(jù)某一法則將事物數(shù)量化,即在一個定有單位和參照點的連續(xù)體上把事物的屬性表現(xiàn)出來,這個連續(xù)體稱為量表。由于制定量表的單位和參照點不同,量表的種類也不同。心理測量學(xué)知識四類量表(斯蒂文斯)(一)命名量表(和,或)是最低水平量表,只用數(shù)字來代表事物或把事物歸類,具體分為兩種:(1)代號——用數(shù)字代表個別事物,如編號、學(xué)號(2)類別——用數(shù)字代表具有某一屬性的事物的全體,即用數(shù)字代表某一群體命名量表,數(shù)字反映差別(代號)與類別(分類),不能數(shù)量化分析,不能做加減乘除運算(二)順序量表(>,<)反映差別并對事物分類,也反映事物某方面屬性的程度,如名次、級別、喜好程度等順序量表無相等單位和絕對零點,僅表示等級心理測量學(xué)知識(三)等距量表反映差別并對事物分類;反映先后、大小和強度等;有相等的單位(能加減);沒有絕對的零點(不能乘除)等距量表的數(shù)值加、減一個常數(shù)不影響等距關(guān)系。因此,一個量表上的數(shù)值可以轉(zhuǎn)換為另一個具有不同單位的量表上的數(shù)值,而且?guī)讉€不同單位的數(shù)值可以轉(zhuǎn)換到一個量表上便于比較。(四)等比量表反映差別并對事物分類;反映先后、大小和強度等;有相等的單位;有絕對的零點可以加減乘除。心理測量是在順序量表上進行的并且可以將順序量表轉(zhuǎn)化為等距量表心理測量學(xué)知識這些說法合理嗎?我比你聰明一百倍!我心理比你健康一百倍?青海西寧夏天平均溫度是15度,陜西西安夏天平均溫度是30度,西安的炎熱度是西寧的兩倍。心理測量學(xué)知識第二單元心理測驗的基本概念一、心理測驗的定義二、心理測驗的性質(zhì)心理測量學(xué)知識一、心理測驗的定義所謂心理測驗,就是依據(jù)心理學(xué)理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點做出推論和數(shù)量化分析的一種科學(xué)手段。心理測量學(xué)知識1.心理測量的對象是人的行為(不是對心理的直接測量)2.心理測量往往只是對少數(shù)人經(jīng)過慎重選擇的行為樣本進行觀察,來間接推知受測者的心理特征。(心理測驗出現(xiàn)偏差的原因)3.測驗條件對所有的受測者都必須相同(測驗的編制、印刷、施測、評分標準化)4.原始分數(shù)不具有意義,須與常模比較(85分屬于高分還是低分?)心理測量學(xué)知識二、心理測驗的性質(zhì)(一)間接性(二)相對性(三)客觀性心理測量學(xué)知識心理測驗的間接性研究者無法直接測量人的心理,只能測量人的外顯行為,也就是說,只能通過一個人對測驗題目的反應(yīng)來推論他的心理特質(zhì)。心理測量學(xué)知識心理測驗的相對性
人的心理與行為沒有絕對標準,只有一個連續(xù)的行為序列。心理測驗就是確定個人處在行為序列的什么位置。連續(xù)序列是由某一個團體或一群人的某類行為特點或心理特征構(gòu)成,所以每個人被測得的結(jié)果都是與所在團體或大多數(shù)人群的行為相比較而言。心理測量學(xué)知識心理測驗的客觀性所測量的對象(心理)是客觀存在的;心理測驗是標準化的測驗:測驗用的項目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時的環(huán)境等,要要求標準化,測驗的刺激是客觀的。測驗評分記分的原則和手續(xù)也要經(jīng)過標準化,使反應(yīng)的量化是客觀的。最后,分數(shù)轉(zhuǎn)換和解釋標準化,對結(jié)果的推論是客觀的。心理測量學(xué)知識第三單元心理測驗的分類按測驗的功能分類按測驗材料的性質(zhì)分類按測驗材料的嚴謹程度分類按測驗的方式分類按測驗的要求分類心理測量學(xué)知識一、按測驗的功能分類(一)智力測驗
測量人的一般智力水平(二)特殊能力測驗
測量個人的特殊潛在能力,如繪畫、寫作、機械等(三)人格測驗
測量人的性格、氣質(zhì)、興趣、態(tài)度、動機等。測驗方法包括問卷法和投射法艾森克人格問卷——EPQ卡特爾16種人格因素——16PF明尼蘇達多項人格問卷——MMPI心理測量學(xué)知識二、按測驗的性質(zhì)分類(一)文字測驗
文字測驗所用的是文字材料,以言語提出刺激,受測者用言語作反應(yīng)。團體測驗多采用此種方式編制,施測方便缺點:受測者文化程度影響測驗結(jié)果(二)操作測驗也稱非文字測驗。測驗題項多屬于對圖形、實物、工具、模型的辨認和操作,不受文化程度影響,可用于幼兒或文盲。如,瑞文和韋克斯勒心理測量學(xué)知識三、按測驗材科的嚴謹程度分類(一)客觀測驗測驗中句子、圖形意義明確,明確界定,不需想象、猜測和遐想。絕大多數(shù)都屬于客觀測驗。(二)投射測驗——羅夏墨跡、房樹人測驗沒有明確意義,問題模糊,對受測者反應(yīng)沒有明確界定。由受測者想象使之賦予意義,以此投射出受測者的思想、情感和經(jīng)驗。心理測量學(xué)知識四、按測驗的方式分類(一)個別測驗
測驗以一對一的形式進行。優(yōu)點:主測對受測言、行有仔細觀察,結(jié)果可靠。缺點:不能在短時間內(nèi)收集到大量資料,程序復(fù)雜,主測需接受嚴格訓(xùn)練,專業(yè)化程度高(二)團體測驗
一個或幾個主測對較多的受測者同時進行測驗。優(yōu)點:時間經(jīng)濟,主測不需要接受嚴格專業(yè)訓(xùn)練缺點:對受測者不能作切實控制,結(jié)果不及個別測驗,臨床上使用較少。團體測驗可以用來個別測驗,但是個別測驗一般不能用來團體測驗心理測量學(xué)知識五、按測驗的要求分類(一)最高作為測驗(智力測驗、成就測驗)
要求受測者盡可能的作出做好的回答,與認知過程有關(guān),有正確答案。(二)典型行為測驗(人格測驗)要求受測者按通常的習(xí)慣方式作出反應(yīng),沒有正確答案。心理測量學(xué)知識第四單元糾正錯誤的測驗觀錯誤的測驗觀正確的測驗觀心理測量學(xué)知識一、錯誤的測驗觀(一)測驗萬能論認為測驗可以解決一切問題,迷信測驗,測驗分數(shù)絕對化
“福勒效應(yīng)”(二)測驗無用論
人格測驗侵犯隱私;測驗為宿命論、種族歧視提供依據(jù);測驗存在偏差。因此反對使用測驗(三)心理測驗即智力測驗
心理測驗=智力測驗=智商=遺傳決定論心理測量學(xué)知識二、正確的測驗觀(一)心理測驗是重要的心理學(xué)研究方法之一,是決策的輔助工具
心理測驗僅僅是研究方法的一種,是一種工具,對心理學(xué)研究與部門決策有一定的參考價值。(二)心理測驗作為研究方法和測量工具尚不完善
心理測驗的理論基礎(chǔ)不夠堅實,因而作為方法與工具的測驗尚不完善。心理測量學(xué)知識第五單元心理測驗在心理咨詢中的應(yīng)用
心理咨詢有效性的前提是對求助者的心理特性、問題有正確的評估和診斷。
目前,在心理門診中運用較多的大致有三類心理測驗,即智力測驗、人格測驗以及心理評定量表。
心理測量學(xué)知識智力測驗:韋氏成人、韋氏兒童、韋氏幼兒、瑞文——智力障礙的診斷人格測驗:EPQ,16PF,MMPI——了解人格特性,尤其是MMPI能夠了解人格異常心理評定量表:精神病評定量表、躁狂狀態(tài)評定量表、抑郁量表、焦慮量表、恐怖量表等。評分簡便,以了解心理障礙的存在與否及程度,并反映病情演變。(一般來說,這類量表僅僅作為診斷的參照,而不是唯一的依據(jù))心理測量學(xué)知識第六單元心理測驗的發(fā)展史科學(xué)心理測驗的產(chǎn)生和發(fā)展現(xiàn)代心理測驗在我國的發(fā)展心理測量學(xué)知識心理測量學(xué)歷史較短,但思想與實踐源遠流長。
始于漢代、興于隋唐的科舉制度被公認為世界上最早的心理測量的實踐。
科學(xué)的心理測量于工業(yè)革命成功后的19世紀的歐洲發(fā)展起來的。心理測量學(xué)知識一、科學(xué)心理測驗的產(chǎn)生與發(fā)展高爾頓(F·Galton)——“怪誕心理學(xué)”第一人(19世紀80年代的十年)提出人的不同氣質(zhì)特點和智能是按身體特點的不同而遺傳的。(遺傳決定論者)為了研究差異的遺傳性,便設(shè)計了測量差異的方法。為心理測驗奠定了統(tǒng)計學(xué)基礎(chǔ)。他第一個提出了相關(guān)的概念,并由學(xué)生皮爾遜發(fā)展創(chuàng)立了積差相關(guān)法。心理測量學(xué)知識卡特爾(19世紀90年代十年)卡特爾是對心理測驗發(fā)展做出巨大貢獻美國心理學(xué)家。1890年,卡特爾在《心理》雜志上發(fā)表《心理測驗與測量》一文,這是心理測驗第一次出現(xiàn)于心理學(xué)文獻中。倡導(dǎo)心理學(xué)的科學(xué)化——“心理學(xué)若不立足于實驗與測量上,決不能夠有自然科學(xué)之準確性?!背珜?dǎo)心理學(xué)的客觀化——“心理測驗如果有一個普遍的標準,則其科學(xué)的與實用的價值都可以增加。”主張測驗手續(xù)和考試方法應(yīng)有統(tǒng)一規(guī)定,并要有常模以便比較。心理測量學(xué)知識比內(nèi)(A·Binet)(20世紀頭十年)1905年,與助手西蒙制定了世界上第一個正式的心理測驗,用于診斷和發(fā)現(xiàn)智力發(fā)展落后兒童心理測量學(xué)知識20世紀以后,心理測驗主要有以下幾個方面的發(fā)展:1.操作測驗的發(fā)展:使未受過教育的兒童能夠接受測驗,且反應(yīng)了心理學(xué)界對操作能力的重視2.團體智力測驗的發(fā)展:始于推孟的學(xué)生奧蒂斯所編制的陸軍甲種和乙種智力測驗3.能力傾向測驗的發(fā)展:因素分析的盛行,成為分析心理品質(zhì)的內(nèi)部結(jié)構(gòu)的重要工具。普通能力傾向(智力)多元化發(fā)展,以韋克斯勒的智力量表為代表4.人格測驗的發(fā)展:先驅(qū)是克雷丕林,羅夏測驗是投射測驗的開端,20世紀40年代以后,人格測驗增多心理測量學(xué)知識二、現(xiàn)代心理測驗在我國的發(fā)展我國近代心理測驗源于1914年前后,20世紀二三十年代兩次修訂比內(nèi)——西蒙量表,此后,處于停滯。1979年后蓬勃發(fā)展。近些年來我國的心理學(xué)家正在致力于測驗本土化.心理測量學(xué)知識第二節(jié)測驗的常模第一單元常模團體第二單元常模的類型第三單元常模分數(shù)的表示方法心理測量學(xué)知識什么是常模?思考:1.85分算高分還是低分?2.來自不同省份的大一新生比較高考分數(shù),意義大嗎?建立心理測量的思維,關(guān)注心理常模!心理測量學(xué)知識第一單元常模團體一、常模團體的性質(zhì)常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。由于個人的等級會隨著用作比較的群體不同而有很大變化,因此必須確定合理的常模群體心理測量學(xué)知識對于測驗編制者來說:常模的選擇主要是基于對測驗將要施測的總體的認識,常模團體必須能夠代表該總體。常模的選擇包括:確定一般總體:確定目標總體:計劃實施的對象確定樣本:根據(jù)總體的性質(zhì)確定有代表性的樣本對于測驗使用者來說:由于同一測驗同時存在多個常模團體,分數(shù)的轉(zhuǎn)化與解釋時需選擇合適的常模團體心理測量學(xué)知識二、常模團體的條件(一)群體的構(gòu)成必須明確界定
確定常模團體時必須清楚說明所要測量的群體的性質(zhì)與特征。尤其是群體過大時,群體內(nèi)部出現(xiàn)許多小團體,他們在測驗上存在差異,因此對每個團體建立常模。例如EPQ就分性別建立常模,韋氏成人量表分城市和農(nóng)村等(二)常模團體必須是所測群體的代表性樣本
所測群體較小,則全測;若較大,一定要選擇有代表性的樣本作為常模,現(xiàn)實中往往因為某個群體取樣容易,造成常模團體取樣存在偏差。心理測量學(xué)知識(三)樣本的大小要適當(dāng)在實際工作中,應(yīng)從經(jīng)濟的或?qū)嵱玫目赡苄院蜏p少誤差這兩個方面來綜合考慮樣本的大小。一般最低不小于30或100個。全國性常模,一般應(yīng)有2000~3000人為宜。樣本大小適當(dāng)?shù)年P(guān)鍵是樣本要有代表性?!皇恰按蟆本秃?四)標準化樣組是一定時空的產(chǎn)物——隨時間而須修訂在選擇合適常模時,要注意選擇較為新近的常模。心理測量學(xué)知識三、取樣的方法取樣即從目標人群中選擇有代表性的樣本。抽樣方法:簡單隨機抽樣系統(tǒng)抽樣分組抽樣分層抽樣心理測量學(xué)知識(一)簡單隨機抽樣按照隨機表順序選擇被試構(gòu)成樣本1.隨機表:按照隨機表順序選擇受測者構(gòu)成樣本2.編號后隨機抽?。簩⒊闃臃秶拿咳诉M行編號,再隨機選擇避免了由于標記、姓名、性別或其他社會贊許性偏見造成抽樣誤差心理測量學(xué)知識首先將總體中各單位按一定順序排列,根據(jù)樣本容量要求確定抽選間隔,然后隨機確定起點,每隔一定的間隔抽取一個單位的一種抽樣方式。系統(tǒng)抽樣要求目標總體無序可排,也無等級結(jié)構(gòu)存在。系統(tǒng)抽樣法的關(guān)鍵是計算組距。(二)系統(tǒng)抽樣(等距抽樣)將已編好號碼的個體排成順序,然后每隔若干個號碼抽取一個。心理測量學(xué)知識(三)分組抽樣適用情況:總體數(shù)目較大,無法進行編好,且群體多樣性做法:先將群體進行分組,再在組內(nèi)進行隨機取樣。心理測量學(xué)知識(四)分層抽樣——最常使用的抽樣方法。
中國人的主觀幸福感,可以完全隨機抽嗎?步驟:將目標總體按某種變量分成若干層次,再從各層次中隨機抽取若干受測者,最后把各層的受測者組合成常模樣本。優(yōu)點:避免簡單隨機抽樣中樣本集中于某種特性或缺少某種特性,使層次間差異顯著,層次內(nèi)一致性高,增加了樣本代表性分類:分層比例抽樣與分層非比例抽樣心理測量學(xué)知識四、常模分數(shù)與常模(一)常模分數(shù)常模分數(shù)就是施測常模樣本被試后,將被試者的原始分數(shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分數(shù)。由原始分數(shù)構(gòu)成的分布轉(zhuǎn)換而來的分數(shù),叫導(dǎo)出分數(shù)原始分數(shù)是在測驗中直接獲得的分數(shù),不能反映被試之間的差異,地位。導(dǎo)出分數(shù)具有一定的參照點和單位,它實際是一個有意義的測驗量表,它與原始分數(shù)等值。(有意義
等單位
帶參照點)心理測量學(xué)知識(二)常模常模分數(shù)構(gòu)成的分布,就是通常所說的常模,它由標準化樣本測試結(jié)果計算而來,是心理測驗用于比較與解釋測驗結(jié)果的參照分數(shù)標準。按照樣本大小來源分:全國常模、區(qū)域常模和特殊常模;按照具體應(yīng)用標準與分數(shù)特征分:百分位常模和標準分常模心理測量學(xué)知識第二單元常模的類型發(fā)展常模百分位常模標準分常模智商及其意義心理測量學(xué)知識一、發(fā)展常模人的許多心理特質(zhì)是隨著時間以有規(guī)律的方式發(fā)展的,所以可將個人的成績與各種發(fā)展水平的人的平均成績相比較,確定個體的發(fā)展水平。根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模,亦稱年齡量表。在年齡量表中,個人的分數(shù)指出他的行為在按正常途徑發(fā)展方面處于什么樣的發(fā)展水平。心理測量學(xué)知識常見的發(fā)展常模(一)發(fā)展順序量表(二)智力年齡(三)年級當(dāng)量心理測量學(xué)知識(一)發(fā)展順序量表最直觀的發(fā)展常模。因為它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常,相應(yīng)能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。優(yōu)點:這種常模對兒童家長來說最易于理解,并可以監(jiān)察兒童的生長發(fā)育情況。最早的一個范例是格塞爾發(fā)展程序表(見363)皮亞杰最著名的工作就是對守恒概念的研究。兒童獲得不同守恒形式的年齡是不一樣的,5歲掌握的是質(zhì)量守恒,6歲掌握重量守恒,7歲容量守恒。心理測量學(xué)知識比內(nèi)-西蒙量表中首先使用智力年齡的概念。在比內(nèi)-西蒙量表式的年齡量表中,每個題目放在大部分兒童都能成功地完成的那個年齡水平,從而把題目分成若干年齡組。例如,某題若被大多數(shù)7歲兒童通過,則該題放在7歲水平,5歲兒童大多數(shù)能回答的題目則放在5歲水平。如果為每個年齡水平都編制一些適當(dāng)?shù)念}目,便可得到一個評價兒童智力發(fā)展水平的年齡量表。一個兒童在年齡量表上所得的分數(shù),就是最能代表他的智力水平的年齡。這種分數(shù)叫做智力年齡,簡稱智齡。(二)智力年齡心理測量學(xué)知識智齡是年齡量表上衡量智力的單位。計算方法:將兒童測驗分數(shù)與各年齡組兒童對比,便可得到年齡分數(shù)。①基礎(chǔ)年齡+附加月份=智齡②不對題目進行年齡分組,將正確題數(shù)當(dāng)做測驗原始分數(shù),將標準化樣本中每個年齡組平均原始分數(shù)作為年齡常模,通過將原始分數(shù)與年齡常模比較,得出智齡解釋:智齡高于實際年齡——聰明;智齡低于實際年齡——愚笨智齡等于實際年齡——一般心理測量學(xué)知識(三)年級當(dāng)量年級當(dāng)量實際上就是年級量表,測驗結(jié)果說明屬于哪一年級的水平,在教育成就測驗中最常用。將被試的測驗成績與某一年級的學(xué)生的平均分數(shù)作比較,而說成相當(dāng)于某一年級水平。
年級量表單位為10個月,10個月為一個年級心理測量學(xué)知識二、百分位常模百分位常模包括百分等級和百分點、四分位數(shù)和十分位數(shù)。心理測量學(xué)知識(一)百分等級應(yīng)用最廣的導(dǎo)出分數(shù)。一個原始分數(shù)的百分等級是指在一個群體的測驗分數(shù)中,得分低于這個分數(shù)的人數(shù)百分比。例如,某人得分82,經(jīng)換算百分等級為75,即表示參加該項測驗的人得分低于82分的占全體被試的75%,并說明超過他的成績82分的人僅有25%。百分等級取值越大,成績越優(yōu)秀心理測量學(xué)知識(二)百分點(百分位數(shù))在分數(shù)量表上,相對于某一百分等級的分數(shù)點就叫百分點或百分位數(shù)。即處于某一百分比例的人對應(yīng)的測驗分數(shù)是多少。例如,在招聘、招生中,分數(shù)線的劃定實際應(yīng)用過程,可以由原始分數(shù)計算百分等級,也可由百分等級確定原始分數(shù)。這種雙向方式編制的原始分數(shù)與百分等級對照表,就是百分位常模。心理測量學(xué)知識(三)四分位數(shù)和十分位數(shù)四分位數(shù)是將量表分成四等份,相當(dāng)于百分等級的25%、50%和75%對應(yīng)的三個點分成的四段。十分位數(shù)是將一組數(shù)據(jù)由小到大(或由大到小)排序后,用9個點將全部數(shù)據(jù)分為10等份,與9個分割點上相對應(yīng)的數(shù)據(jù)稱為十分位數(shù)。心理測量學(xué)知識三、標準分常模標準分數(shù)常模是將原始分數(shù)與平均分數(shù)的距離以標準差為單位表示出來的量表。標準分數(shù)是一種具有相等單位的量數(shù)(以平均數(shù)為參照點,以標準差為單位),具有可加性,它由符號與絕對值兩部分組成,正負號表示原始分數(shù)在平均數(shù)之下或之上,絕對值表示原始分數(shù)與平均數(shù)的距離。標準分數(shù)可以通過線性轉(zhuǎn)換,也可以通過非線性轉(zhuǎn)換得到心理測量學(xué)知識(一)線性轉(zhuǎn)換的標準分數(shù)
(公式5-1)其中X為任一原始分數(shù),為樣本平均數(shù),SD為樣本標準差。由于z分數(shù)易出現(xiàn)小數(shù)點和負數(shù),計算不方便,所以將其轉(zhuǎn)化:Z=A+Bz(公式5-2)加上一個常數(shù)(A)是為了去掉負值,乘以一個常數(shù)(B)是為了使單位變小從而去掉小數(shù)點。心理測量學(xué)知識常見的標準分數(shù)有:z分數(shù)、Z分數(shù)、T分數(shù)、標準九分數(shù)、離差智商(IQ)等。心理測量學(xué)知識當(dāng)以50為平均數(shù)(即加上一個常數(shù)50),以10為標準差(乘以一個常數(shù)10)來表示時,通常叫做T分數(shù),即:T=50+10×(公式5-3)T分數(shù)心理測量學(xué)知識標準九分、十分、二十分標準九分=5+2×標準十分=5.5+1.5×標準二十分=10+3×使用最廣、影響最大的離差智商以100為平均數(shù),以15為標準差心理測量學(xué)知識(二)非線性轉(zhuǎn)換的標準分數(shù)
當(dāng)原始分數(shù)不是常態(tài)分部時,可通過非線性轉(zhuǎn)換使之常態(tài)化。步驟:1.對每個原始分數(shù)計算累積百分比;2.在常態(tài)曲線面積表中,求出對應(yīng)于該百分比的Z分數(shù)心理測量學(xué)知識四、智商及其意義比內(nèi)-西蒙用心理年齡表示智力高低。若心理年齡高于其生理年齡,則智力較一般兒童高,若心理年齡低于其生理年齡,則智力較一般兒童低。但在使用中發(fā)現(xiàn),單純用心理年齡來表示智力高低的方法缺乏不同年齡兒童間的可比性,于是提出了比率智商和離差智商表示智力高低心理測量學(xué)知識(一)比率智商推孟修訂的斯坦福-比內(nèi)量表,以比率智商表示測驗結(jié)果。比率智商(IQ)被定義為心理年齡(MA)與實足年齡(CA)之比。
(公式5-3)由于個體心理年齡與實足年齡并不同步增長,所以比率智商并不適合于年齡較大的被試。心理測量學(xué)知識(二)離差智商韋克斯勒提出離差智商。它是以年齡組為樣本計算而得的標準分數(shù),它表示的是個體智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標。韋克斯勒將離差智商的平均數(shù)定為100,標準差定為15。
(公式5-4)心理測量學(xué)知識離差智商實際應(yīng)用過程,將原始分數(shù)與IQ值的對應(yīng)關(guān)系計算出來作為常模表,使用時可以直接按年齡查出智商。
離差智商的提出影響巨大,許多測驗都采用離差智商。1960年的S-B,使用平均分為100,標準差為16的標準分數(shù)量表。心理測量學(xué)知識
需要注意:從不同測驗獲得離差智商只有當(dāng)標準差相同或接近時才能比較,標準差不同,分數(shù)意義也不同。(詳見367)心理測量學(xué)知識幾種導(dǎo)出分數(shù)間的相互關(guān)系正負一個標準差的面積為68.27%;正負1.96個標準差的面積為95.45%;正負2.58個標準差的面積為99.73%。心理測量學(xué)知識第三單元常模分數(shù)的表示方法一、轉(zhuǎn)換表法——最簡單、最基本
也叫常模表,是一種最簡單、最基本且最常用的呈現(xiàn)常模資料的方法,它由原始分數(shù)、相應(yīng)的導(dǎo)出分數(shù)和對常模團體的有關(guān)具體描述三個要素構(gòu)成。
分為簡單轉(zhuǎn)換表與復(fù)雜轉(zhuǎn)換表。前者將單項測驗的原始分數(shù)轉(zhuǎn)化成一種或幾種導(dǎo)出分數(shù);后者指包括幾個分測驗或幾種常模團體的原始分數(shù)與導(dǎo)出分數(shù)的對應(yīng)關(guān)系。二、剖析圖將測驗分數(shù)的轉(zhuǎn)換關(guān)系用圖形表示出來。心理測量學(xué)知識常模轉(zhuǎn)換表心理測量學(xué)知識剖面圖心理測量學(xué)知識第三節(jié)測驗的信度第一單元信度的概念第二單元信度評估的方法第三單元信度與測驗分數(shù)的解釋第四單元影響信度的因素心理測量學(xué)知識第一單元信度的概念一、信度的定義信度是指同一被試者在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復(fù)測量,所得結(jié)果的一致程度。心理測量學(xué)知識信度只受隨機誤差的影響。X=T+EE=Er+Es心理測量學(xué)知識二、信度的指標1.信度系數(shù):同一受測者樣本所得到的兩組資料的相關(guān),實際上就是相關(guān)系數(shù):0≤r≤12.信度指數(shù):信度指數(shù)的平方就是信度系數(shù)3.測量標準誤信度系數(shù)表示一組測量的實得分數(shù)與真分數(shù)的符合程度,但未指出個人測驗分數(shù)的變異量。理論上,若對被試無數(shù)次施測即可得到個人真分數(shù)(多次觀測分數(shù)的平均數(shù)),標準差則為測量誤差的大小。
心理測量學(xué)知識
但實際上不能施測無數(shù)次,僅能以同一組被試兩次施測結(jié)果來代替對同一個人的反復(fù)施測,于是有了信度另一個指標——標準誤(SE)。(個人在兩次測驗中分數(shù)的差異就是測驗誤差,測驗誤差分數(shù)形成一個分布,這個分布的標準差即為標準誤)SE為測量的標準誤,SX為所得分數(shù)的標準差,rxx為測驗的信度系數(shù)。
可以發(fā)現(xiàn):標準誤與信度互為消長的關(guān)系——信度越高,標準誤越?。恍哦仍降?,標準誤越大心理測量學(xué)知識第二單元信度評估的方法對信度的評估方法是沒有通用法則的,因為不同的信度反映測驗誤差的不同來源,故每一種信度系數(shù)只能說明信度的不同方面,因而具有不同的意義。重測信度復(fù)本信度內(nèi)部一致性信度評分者信度心理測量學(xué)知識一、重測信度(穩(wěn)定性系數(shù))使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關(guān)系數(shù)。(重測法)重測信度的提出的原因:多數(shù)心理特征具有相對的穩(wěn)定性,短時間不會變化很大一般是兩周到四周較宜,間隔時間最好不超過六個月。優(yōu)點:提供測驗跨時間的穩(wěn)定性缺點:受練習(xí)與記憶,身心發(fā)展變化的影響心理測量學(xué)知識二、復(fù)本信度以兩個等值但題目不同的測驗(復(fù)本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關(guān)系數(shù)復(fù)本信度反映的是測驗在內(nèi)容上的等值性,故又稱等值性系數(shù)。施測過程中需要采用AB/BA施測順序來平衡順序效應(yīng)若副本先后施測,存在時間間隔,具有了重測信度的特征,稱重測復(fù)本信度或穩(wěn)定性等值系數(shù)。優(yōu)點:避免了一定的記憶、學(xué)習(xí)效應(yīng)(應(yīng)用較為廣泛)缺點:練習(xí)能夠減少但不能消除;易產(chǎn)生遷移作用;復(fù)本建立困難心理測量學(xué)知識三、內(nèi)部一致性信度重測信度和復(fù)本信度主要考察了測驗跨時間的一致性(穩(wěn)定性)和跨形式的一致性(等值性),而內(nèi)部一致性信度系數(shù)主要反映的是題目之間的關(guān)系,表示測驗?zāi)軌驕y量相同內(nèi)容或特質(zhì)的程度。分半信度同質(zhì)性信度心理測量學(xué)知識(一)分半信度
采用分半法估計信度系數(shù)。實際做法:測驗完成后,把測驗項目按奇偶分為兩半,計算相關(guān),這個相關(guān)系數(shù)就代表了兩半測驗內(nèi)容取樣的一致程度。缺點:低估信度系數(shù)(測驗長度影響使然)心理測量學(xué)知識代表測驗內(nèi)部所有題目間的一致性。當(dāng)各個測題的得分有較高的正相關(guān)時,不論題目的內(nèi)容和形式如何,則測驗為同質(zhì)的。相反,即使所有題目看起來好像測量同一特質(zhì),但相關(guān)很低或為負相關(guān)時,則測驗為異質(zhì)的。(二)同質(zhì)性信度心理測量學(xué)知識四、評分者信度目的:
用于測量不同評分者之間產(chǎn)生的誤差。程序:隨機抽取若干份測驗卷,由兩位評分者按評分標準分別給分,然后再根據(jù)每份測驗卷的兩個分數(shù)計算相關(guān),即得評分者信度。一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。心理測量學(xué)知識第三單元信度與測驗分數(shù)的解釋解釋真實分數(shù)與實得分數(shù)的相關(guān)確定信度可以接受的水平解釋個人分數(shù)的意義比較不同測驗分數(shù)的差異心理測量學(xué)知識一、解釋真分數(shù)與實得分數(shù)的相關(guān)信度系數(shù)可以解釋為測驗的總變異中,真分數(shù)造成的變異占百分之幾。
若rxx=0.9,則表示觀測分數(shù)中90%的變異由真分數(shù)造成,10%為誤差。
在極端的情況下,如有rxx=1.00,則表示完全沒有測量誤差,所有的變異均來自真實分數(shù);若有rxx=0,則所有的變異和差別都反映的是測量誤差。心理測量學(xué)知識二、確定信度可以接受的水平
多高的信度水平才是可以接受的?
能力、成就測驗信度系數(shù)0.9以上,甚至0.95;人格、興趣測驗信度0.8~0.85一般原則是:當(dāng)rxx<0.70時,測驗不能用于對個人做出評價或預(yù)測,而且不能作團體比較;當(dāng)0.70≤rxx
<0.85時,可用于團體比較;當(dāng)rxx≥0.85時,才能用來鑒別或預(yù)測個人成績或作為。注意哪里有“=”心理測量學(xué)知識三、解釋個人分數(shù)的意義通過標準誤去解釋分數(shù)意義。具體來說兩個作用:其一是估計真實分數(shù)的范圍;從實得觀測分數(shù)推測得到真分數(shù),即確定置信區(qū)間:X-1.96SE<XT<X+1.96SE(有等號)X-2.58SE<XT<X+2.58SE(有等號)其二是了解實得分數(shù)再測時可能的變化情形。案例見書本375心理測量學(xué)知識四、比較不同測驗分數(shù)的差異測量標準誤和測驗信度在評價兩個不同測驗的分數(shù)是否有明顯差異時也非常重要。這種比較包括:兩個人不同分數(shù)的差別;同一被試在兩個測驗上的差別。這就是差異分數(shù)標準誤問題:SEd=S(2-rxx-ryy)1/2s相同時,兩個分數(shù)才能比較
案例見書本375心理測量學(xué)知識第四單元影響信度的因素一、樣本特征二、測驗長度三、測驗難度四、時間間隔心理測量學(xué)知識一、樣本特征信度常用信度系數(shù)來表示,信度系數(shù)就是相關(guān)系數(shù),相關(guān)系數(shù)受樣本是否異質(zhì)及樣本團體平均能力水平的影響。(一)樣本團體異質(zhì)性的影響(二)樣本團體平均能力水平的影響心理測量學(xué)知識㈠樣本團體異質(zhì)性的影響任何相關(guān)系數(shù)都要受到團體中分數(shù)分布的范圍所影響,而分數(shù)范圍與樣本團體的異質(zhì)程度有關(guān)。若獲得信度的取樣團體較為異質(zhì)的話,往往會高估測驗的信度,相反則會低估測驗的信度。同質(zhì)團體,受測者水平接近,兩次測驗成績受隨機誤差影響;異質(zhì)團體受隨機誤差影響較小。心理測量學(xué)知識㈡樣本團體平均能力水平的影響測驗的信度還受取樣不同團體間平均能力水平的不同而不同。這是因為,對于不同水平的團體,題目具有不同的難度,每個題目在難度上的微小差異累計起來便會影響信度。因此報告信度系數(shù)時,需要對建立信度系數(shù)的團體進行描述。心理測量學(xué)知識二、測驗長度測驗長度,亦即測驗的數(shù)量,也是影響信度系數(shù)的一個因素。一般來說,在一個測驗中增加同質(zhì)的題目,可以使信度提高。第一,測驗越長,測驗的測題取樣或內(nèi)容取樣就越有代表性。第二,測驗越長,被試的猜測因素影響就越小。不過——測驗過長有時會引起被試的疲勞和反感而降低可靠性。心理測量學(xué)知識三、測驗難度難度對信度的影響,只存在于某些測驗中。如智力測驗、成就測驗、能力傾向測驗等,對于人格測驗、興趣測驗、態(tài)度量表等不存在難度問題,因為這些測驗的題目沒有正確或錯誤答案之分。在實際情況下,如果某個測驗難度水平針對特定的團體可能會顯得太難、太易,使得分數(shù)分布范圍縮小,信度水平降低。(難度水平使測驗分數(shù)分布范圍較大時,測驗信度最高,通常平均難度水平為0.5)心理測量學(xué)知識四、時間間隔以再測法或復(fù)本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大;間隔時間越久,其他變因介入的可能性越大,受外界的影響也越大,信度系數(shù)便越低。心理測量學(xué)知識第四節(jié)測驗的效度第一單元效度的概念第二單元效度評估的方法第三單元效度的功能第四單元影響效度的因素心理測量學(xué)知識一、效度的定義(概念定義與操作性定義的符合程度)效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的準確性。也稱為測驗有效性,指一套測驗對應(yīng)該測試的內(nèi)容所測的程度,即一套測試是否達到了它預(yù)定的目的以及是否測量了他要測量的內(nèi)容。在測驗理論中,效度被定義為在一組測量中,與測量目標有關(guān)的真實方差(或稱有效方差)與總方差的比率。心理測量學(xué)知識測驗效度受隨機誤差和系統(tǒng)誤差的影響。可信的測驗未必有效,而有效的測驗必定可信。心理測量學(xué)知識二、效度的性質(zhì)(一)效度具有相對性在評鑒測驗的效度時,必須考慮其目的與功能。不能籠統(tǒng)說,測驗有效還是無效,而應(yīng)該說對測什么有效還是無效。(二)效度具有連續(xù)性測驗效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。因此,我們評價一個測驗時,不應(yīng)該說“有效”或“無效”,而應(yīng)該用效度較高或較低來評價。(例用ipad稱體重,高效嗎?)另外,效度是針對測驗結(jié)果的,即測驗效度是“測驗結(jié)果”的有效性程度。心理測量學(xué)知識信度和效度的關(guān)系一、信度是效度的必要而非充分條件二、效度是受信度制約的心理測量學(xué)知識心理測量學(xué)知識第二單元效度評估的方法美國心理學(xué)會在1974年所發(fā)行的《教育與心理測量之標準》一書中將效度分為三大類:內(nèi)容效度構(gòu)想效度效標效度測量的效度就是測量結(jié)果達到測量目的的程度,所以測量效度的估計很大程度上取決于人們對測量目的的解釋。目前常見的解釋角度有三種:用測量的內(nèi)容說明目的;用心理學(xué)某種理論結(jié)構(gòu)說明目的;用工作實效說明目的心理測量學(xué)知識一、內(nèi)容效度(測驗的代表性和覆蓋性)(一)什么是內(nèi)容效度內(nèi)容效度指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領(lǐng)域的代表性取樣。內(nèi)容效度是指一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。例如判斷高中物理試卷的內(nèi)容效度,我們需要分析題目是否涵蓋了力、電、光、熱以及原子物理五方面內(nèi)容,并且沒有化學(xué)和地理其他題目摻入。心理測量學(xué)知識編制較高的內(nèi)容效度心理測驗需要注意:第一,對所測量的心理特性有明確的概念;第二,測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。需要注意的是,要求內(nèi)容效度的測驗不一定要求測驗同質(zhì),具體情況應(yīng)隨實際情況而定。心理測量學(xué)知識內(nèi)容效度與表面效度表面效度是由外行對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看來好像是測量所要測的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價而建立的。最高行為測驗要求較高表面效度典型行為測驗要求較低表面效度心理測量學(xué)知識在編制“領(lǐng)導(dǎo)能力測驗”時編寫了這么三個問題:a.我愿指揮別人.不愿別人指揮我。b.我喜歡聽古典音樂。c.人們經(jīng)常征求我的意見。通過預(yù)測發(fā)現(xiàn),領(lǐng)導(dǎo)干部對a、b作肯定回答的人數(shù)比例明顯地高于一般群眾,對c作肯定回答的人數(shù)比例與一般群眾差不多。從區(qū)分能力來看,c題應(yīng)被淘汰。但是,若從表面上看,a、c兩題都有表面效度,b題沒有表面效度。這個例子說明,對于一個具體的測量目標來說,有表面效度的題目不見得真正有效,沒有表面效度的題目也可能有效,因此,表面效度不是確定內(nèi)容效度的客觀指標。心理測量學(xué)知識(二)內(nèi)容效度的評估方法1.專家判斷法2.統(tǒng)計分析法3.經(jīng)驗推測法心理測量學(xué)知識1.專家判斷法請有關(guān)專家對測驗題目與原定內(nèi)容的符合性做出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。又稱“邏輯效度”(logicalvalidity)。心理測量學(xué)知識增加專家評定客觀性的步驟:1.定義好測驗內(nèi)容的總體范圍,描述有關(guān)知識與技能及所用材料的來源;2.編制雙向細目表3.制定評定量表來測量測驗的整個效度
最后由每位評判者在評定量表上做出判斷,從而獲得測驗內(nèi)容效度的證據(jù)。心理測量學(xué)知識2.統(tǒng)計分析法重測信度(再測法):訓(xùn)練前與訓(xùn)練后評分者一致性信度:多個評分者之間的一致程度復(fù)本信度:復(fù)本求相關(guān)——相關(guān)低則至少一個測驗缺乏效度心理測量學(xué)知識3.經(jīng)驗推測法即通過實踐來檢驗效度。如兒童發(fā)展量表是否有效,經(jīng)過對不同年齡階段的兒童進行調(diào)查,然后分析其結(jié)果。若通過率是隨著年齡的增加而增加,就可以推測該測驗有內(nèi)容效度。心理測量學(xué)知識(三)內(nèi)容效度的特性內(nèi)容效度與所有效度的性質(zhì)一樣,不是普遍適用的,而是根據(jù)具體情況分析得來。如果測驗分析者和測驗使用者定義的內(nèi)容范圍相同,則編制者報告的內(nèi)容效度對使用者而言是有意義的,否則就沒有意義。
內(nèi)容效度也有時間特定性,適合過去總體的代表性測驗未必符合現(xiàn)在的總體。心理測量學(xué)知識二、構(gòu)想效度(一)什么是構(gòu)想效度(二)構(gòu)想效度的估計方法心理測量學(xué)知識(一)什么是構(gòu)想效度構(gòu)思效度,或結(jié)構(gòu)效度。主要涉及心理學(xué)的理論概念問題。指測驗?zāi)軌驕y量到理論上的構(gòu)想或特質(zhì)的程度,即測驗的結(jié)果能否證實或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。心理測量學(xué)知識建立構(gòu)想效度的步驟:欲建立構(gòu)想效度,必需先從某一構(gòu)想的理論出發(fā),提出關(guān)于某一心理特質(zhì)的假設(shè),然后設(shè)計和編制測驗并進行施測,最后對結(jié)果采用相關(guān)或因素分析進行分析,驗證理論假設(shè)的符合程度。心理測量學(xué)知識(二)構(gòu)想效度的估計方法1.對測驗本身的分析(測驗內(nèi)部尋找證據(jù))(1)內(nèi)容效度:分析內(nèi)容效度即可得出結(jié)構(gòu)效度(2)內(nèi)部一致性信度:測驗是單一特質(zhì)還是多種特質(zhì)(3)被試對題目的反應(yīng)特點:若有證據(jù)表明某一題目的作答除了反映著所要測的特質(zhì)之外還反映著其他因素的影響,則構(gòu)想效度受到影響。心理測量學(xué)知識2.測驗間的相互比較(測驗之間尋找證據(jù))(1)相容效度:待研究效度測驗與同一成熟測驗求相關(guān)(2)區(qū)分效度:待研究效度測驗與其他異質(zhì)測驗求相關(guān)(3)因素分析法:因素分析因子與構(gòu)想符合程度心理測量學(xué)知識3.效標效度的研究證明
實測成績能否真正將個體分類:選取不同的被試構(gòu)成對照組,施測后比較兩組的分數(shù),若二者分數(shù)將兩組截然分開,則構(gòu)想效度不錯。
分析心理特質(zhì)的發(fā)展變化,如智力隨年齡而發(fā)展,若測驗?zāi)芊磻?yīng)這一規(guī)律則,結(jié)構(gòu)效度高4.實驗法和觀察法證實
訓(xùn)練前后測驗分數(shù)的變化心理測量學(xué)知識三、效標效度(一)什么是效標效度(二)效標效度的估計方法心理測量學(xué)知識(一)什么是效標效度(實證效度)效標效度反映的是測驗預(yù)測個體在某種情境下行為表現(xiàn)的有效程度。(實證效度)被預(yù)測的行為是檢驗效度的標準,簡稱效標。根據(jù)效標資料是否與測驗分數(shù)同時獲得,又可分為同時效度和預(yù)測效度兩類,前者在于診斷現(xiàn)狀;后者在于預(yù)測未來。一個測驗是否有效,以實踐的效果來作為檢驗標準心理測量學(xué)知識檢驗一個測驗的效標效度時,關(guān)鍵在于找到合適的效標一個好的效標必須具備以下條件:
(1)效標必須能最有效地反映測驗的目標,即效標測量本身必須有效;(2)效標必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素而變化;(3)效標可以客觀地加以測量,可用數(shù)據(jù)或等級來表示;(4)效標測量的方法簡單,省時省力,經(jīng)濟實用。心理測量學(xué)知識(二)效標效度的評估方法1.相關(guān)法2.區(qū)分法3.命中率法心理測量學(xué)知識1.相關(guān)法相關(guān)法是評估效標效度最常用的方法,它是求測驗分數(shù)與效標資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。計算效度系數(shù)最常用的是積差相關(guān)法(連續(xù)變量、二列(兩個變量都為連續(xù)變量,一個人為劃分為二分變量)、點二列相關(guān)(一個是真正的二分變量,另一個是連續(xù)變量)、賈斯朋多系列相關(guān)(測驗分數(shù)為連續(xù)變量,效標資料為等級評定)心理測量學(xué)知識2.區(qū)分法區(qū)分法是檢驗測驗分數(shù)能否有效地區(qū)分由效標所定義的團體的一種方法。某政府機關(guān)通過測驗錄用了一批公務(wù)員,經(jīng)半年試用期后,根據(jù)他們的實際工作成績,將這批公務(wù)員區(qū)分為稱職和不稱職兩組,然后回過頭來檢查這兩組人在測驗上的分數(shù)是否有顯著差異,如果差異顯著,說明這個測驗在錄用公務(wù)員的選拔性測驗中是有效的。具體做法是分析高分組與低分組分布的重疊量:一種是計算每一組內(nèi)得分超過(低于)另一組平均數(shù)的人數(shù)百分比;一種是計算兩組共同分布的百分比(詳見書本384)心理測量學(xué)知識3.命中率法命中率法是當(dāng)測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法。使用命中率法,可將測驗分數(shù)和效標資料分為兩類。在測驗分數(shù)方面是確定一個臨界分數(shù)(即分數(shù)線),高于臨界分數(shù)者預(yù)測其成功,低于臨界分數(shù)者預(yù)測其失??;在效標資料方面根據(jù)實際工作或?qū)W習(xí)成績,確定一個合格標準,標準之上與之下。心理測量學(xué)知識根據(jù)測驗分數(shù)與實際工作情況,可以分為四種情況:失敗成功成功失誤命中失敗命中失誤心理測量學(xué)知識命中率計算:總命中率=命中/(命中+失誤)正命中率=測驗與效標皆成功人數(shù)/測驗成功人數(shù)分數(shù)線越高,正命中率越高;否則越低。心理測量學(xué)知識第三單元效度的功能一、預(yù)測誤差效度系數(shù)的實際意義常以決定系數(shù)來表示。決定系數(shù)即為效度系數(shù)的平方,表示測驗正確預(yù)測或解釋的效標的方差占總方差的比例。另一種表達方法,估計的標準誤,指所有具有某一測驗分數(shù)的受測者其效標分數(shù)分布的標準差,即預(yù)測誤差大小的估計值(見385)表示預(yù)測誤差大小的估計值。測驗效度完美(為1),估計標準誤為0心理測量學(xué)知識二、預(yù)測效標分數(shù)
若X、Y呈直線相關(guān),可利用回歸方程從測驗分數(shù)預(yù)測效標分數(shù)三、預(yù)測效度指數(shù)E=100(1-K)E值大小表明使用測驗比盲目猜測能減少多少誤差例如,效度系數(shù)為0.8,K=0.6,E=0.4,這表明預(yù)測誤差僅為隨機猜測所產(chǎn)生誤差的60%,即減少了40%誤差。心理測量學(xué)知識第四單元影響效度的因素一、測驗本身的因素二、測驗實施中的干擾因表三、樣本團體的性質(zhì)四、效標的性質(zhì)心理測量學(xué)知識一、測驗本身的因素1.測驗材料必須對整個內(nèi)容具有代表性;2.測題設(shè)計時應(yīng)盡量避免容易引起誤差的題型(如是非題);3.測題難度要適中,具有較高的區(qū)分度;4.測驗長度要恰當(dāng),即要有一定的測題量;5.測題的排列按先易后難順序。心理測量學(xué)知識二、測驗實施中的干擾因表(一)主試的影響因素測驗實施過程、評分標準化與否。
效標與測驗時間間隔越長,效度降低
測驗情境(二)被試的影響因素興趣、態(tài)度、情緒等心理測量學(xué)知識三、樣本團體的性質(zhì)(一)樣本團體的異質(zhì)性如果其他條件相同,樣本團體越同質(zhì),分數(shù)分布范圍越小,測驗效度就越低
選拔測驗和選拔標準的增高,導(dǎo)致樣本團體同質(zhì)性增大,效度降低(二)干涉變量
性別、年齡、教育水平、智力、動機等心理測量學(xué)知識四、效標的性質(zhì)
效標效度以測驗分數(shù)與效標測量的相關(guān)系數(shù)來表示,效標性質(zhì)影響效度評價。
效標測量的可靠性——即效標測量的信度心理測量學(xué)知識第五節(jié)項目分析心理測量學(xué)知識測驗的項目分析包括定性分析和定量分析兩個方面。定性分析包括考慮內(nèi)容效度,題目編寫的恰當(dāng)性和有效性等;定量分析主要是指對題目難度和區(qū)分度等進行分析。心理測量學(xué)知識第一單元項目的難度心理測量學(xué)知識一、定義難度(difficulty),顧名思義,是指項目的難易程度。難度的指標通常以通過率表示,即以答對或通過該題的人數(shù)百分比來表示:
(公式5-31)通過人數(shù)越多(即P值越大),難度越低;心理測量學(xué)知識二、項目難度的估計方法(1)二值記分的測題:答對的百分比(或比率)
P值越大,則難度越小。心理測量學(xué)知識(2)不是二值記分(3)分組計分項目心理測量學(xué)知識三、難度水平的確定——主要目的在于篩選項目(一)項目的難度——取決于測驗?zāi)康?、性質(zhì)與形式標準測驗,為了測量個體差異。P接近0.5最大程度上提供個體差異信息選拔診斷測驗,選擇難度接近錄取率的項目。對于選擇題來說,P應(yīng)大于概率水平:是非題難度應(yīng)為0.75;四擇一,難度0.63心理測量學(xué)知識(二)測驗的難度取決于項目難度,通過測驗分數(shù)分布對難度進行檢驗如果被試樣本具有代表性,對于中等難度的測驗,其測驗總分應(yīng)該接近常態(tài)分配。正偏態(tài)——難度大;負偏態(tài)——測驗過易心理測量學(xué)知識第二單元項目的區(qū)分度心理測量學(xué)知識一、定義項目區(qū)分度,也叫鑒別力,是指測驗項目對被試的心理特性的區(qū)分能力。是評價項目質(zhì)量和篩選項目的主要指標。水平高者得高分,水平低者得低分——區(qū)分度高區(qū)分度D取值范圍為-1~+1之間,D為正值,則積極區(qū)分;D為負值,為消極區(qū)分;D為0,則無區(qū)分。D值越大,區(qū)分效果越好。心理測量學(xué)知識二、計算方法(一)鑒別指數(shù)按測驗總分高低排列答卷確定高分組與低分組,每組取答卷總數(shù)的27%分別計算高分組與低分組在該項目上的通過率高分組通過率-低分組通過率得項目鑒別指數(shù)據(jù)項目鑒別指數(shù)進行項目取舍D=PH-PL0.4以上,很好0.3-0.39,良好,修改后更好0.2-029尚可,仍需修改0.19以下,差,必須淘汰心理測量學(xué)知識(二)相關(guān)法鑒別指數(shù)易于理解,計算方便,但結(jié)果不精確,因此采用相關(guān)法。以項目分數(shù)與效標分數(shù)或測驗總分的相關(guān)作為項目區(qū)分度的指標。計算區(qū)分度最常用的方法是相關(guān)法1.點二列相關(guān):2.二列相關(guān):3.Ф相關(guān)法:相關(guān)越高表明項目越有區(qū)分功能心理測量學(xué)知識三、區(qū)分度與難度的關(guān)系一般來說,較難的項目對高水平的被試區(qū)分度高,較易的項目對水平低的被試區(qū)分度高,中等難度的項目對中等水平的被試區(qū)分度高。若項目通過率為1,則D=?0若項目通過率為0,則D=?0若項目通過率為0.5,則D=?1難度越接近0.5,區(qū)分度越接近1;平均難度水平為0.5心理測量學(xué)知識第六節(jié)測驗編制的一般程序第一單元
測驗的目標分析第二單元測題的編寫第三單元測驗的編排和組織心理測量學(xué)知識編制心理與教育測驗的基本程序一、確定測驗?zāi)康亩⒅贫ň庮}計劃三、編輯測驗項目四、預(yù)測與分析五、合成測驗六、測驗標準化七、鑒定測驗八、編寫測驗說明書心理測量學(xué)知識第一單元
測驗的目標分析
一、測驗的對象二、測驗的用途三、測驗的目標心理測量學(xué)知識一、測驗的對象明確測驗對象,明確測量哪些個人和團體。通常以年齡、性別、職業(yè)、受教育程度、經(jīng)濟狀況、民族、文化背景等指標來區(qū)分測量對象。心理測量學(xué)知識二、測驗的用途所編出的測驗是要對被試做描述,還是做診斷,亦或是選拔和預(yù)測,(一)顯示性測驗顯示性測驗是指測驗題目和所要測量的心理特征相似的測驗。(二)預(yù)測性測驗心理測量學(xué)知識三、測驗的目標心理測驗的目標是指編制的測驗是測什么的,即用來測量什么樣的心理變量或行為特征。(一)工作分析對所預(yù)測的行為活動作具體分析確定哪些心理特征和行為可以使要預(yù)測的活動達到成功建立衡量被試是否成功的標準(二)對特定概念下定義(三)確定測驗的具體內(nèi)容心理測量學(xué)知識第二單元測題的編寫一、搜集資料二、命題的一般原則三、測題的編制要領(lǐng)心理測量學(xué)知識一、搜集資科(一)已出版的標準測驗(二)理論和專家的經(jīng)驗(三)臨床觀察和記錄心理測量學(xué)知識二、命題的一般原則(一)內(nèi)容方面(二)文字方面(三)理解方面(四)社會敏感性方面心理測量學(xué)知識三、測題的編制要領(lǐng)可以分為兩大類:提供型(supply)和選擇型(selection)題目。選擇題是非題簡答題操作題心理測量學(xué)知識第三單元測驗的編排和組織一、合成測驗二、預(yù)測與項目分析三、信度和效度考察四、常模制定五、編寫指導(dǎo)手冊心理測量學(xué)知識一、合成測驗合成測驗就是把經(jīng)過預(yù)測以后證明有價值的項目排成有組織的測驗。解決兩個問題:一是測驗項目的選擇;二是測驗項目的編排心理測量學(xué)知識(一)選擇與審定試題1.選擇試題形式2.審定題目心理測量學(xué)知識(二)測題的編排測驗編排的一般原則:1.測題的難度排列宜逐步上升。2.盡可能將同類型的測題組合在一起。3.注意根據(jù)各種類型測題本身的特點排列題目。兩種常見的排列方式。1.并列直進式(按題目)2.混合螺旋式(按難度)心理測量學(xué)知識二、預(yù)測與項目分析(一)預(yù)測(二)項目分析心理測量學(xué)知識三、信度和效度考察(一)信度(二)效度心理測量學(xué)知識四、常模制訂選擇常模團體施測獲得常模原始分數(shù)轉(zhuǎn)化為導(dǎo)出分數(shù)心理測量學(xué)知識五、編寫指導(dǎo)手冊測驗指導(dǎo)手冊的內(nèi)容有:1.測驗的目的和功用。2.測驗編制的理論背景3.如何實施測驗的說明。4.測驗的標準答案和記分標準。5.常模資料6.測驗的基本特征心理測量學(xué)知識第七節(jié)心理測驗的使用第一單元主試的資格第二單元測驗的選擇第三單元測驗前的準備工作第四單元測驗實施的程序及要素第五單元被試誤
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 施工單位關(guān)于施工進度報告的工作聯(lián)系函
- 跨越障礙培養(yǎng)學(xué)生創(chuàng)新能力的有效措施
- 跨領(lǐng)域視角下的安全工作與生產(chǎn)計劃整合
- DB3702T 45.1-2024地理標志產(chǎn)品 平度牛肉 第1部分:生產(chǎn)技術(shù)規(guī)程
- 二手貨物買賣合同范文
- 中外合資企業(yè)職工住房公積金合同范本
- 中外合作經(jīng)營企業(yè)合同范本
- 中外合資飯店租賃合同模板
- 專利實施許可合同協(xié)議
- 中外原材料供應(yīng)合同樣本
- 中國數(shù)字貨運發(fā)展報告
- 使用AVF血液透析患者的護理查房
- 《幼兒教師職業(yè)道德》教案
- 2021年高考山東卷化學(xué)試題(含答案解析)
- 客服百問百答
- GA/T 766-2020人精液PSA檢測金標試劑條法
- 品管圈活動提高氧氣霧化吸入注意事項知曉率
- 農(nóng)產(chǎn)品質(zhì)量安全控制課件
- 幼兒園中班健康:《小河馬的大口罩》 課件
- 管道工程污水管網(wǎng)監(jiān)理規(guī)劃(共44)
- 洪屏抽水蓄能電站達標投產(chǎn)策劃方案
評論
0/150
提交評論