第二講 問卷的心理測量學(xué)指標(biāo)及誤差控制_第1頁
第二講 問卷的心理測量學(xué)指標(biāo)及誤差控制_第2頁
第二講 問卷的心理測量學(xué)指標(biāo)及誤差控制_第3頁
第二講 問卷的心理測量學(xué)指標(biāo)及誤差控制_第4頁
第二講 問卷的心理測量學(xué)指標(biāo)及誤差控制_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二講問卷的心理測量學(xué)指標(biāo)及誤差控制中國人民大學(xué)心理學(xué)系董妍副教授dong8958@126.com22023/10/16

第一節(jié)難度分析32023/10/16一、難度的定義難度指測驗(yàn)項(xiàng)目的難易程度以答對(duì)百分比(比率)來估計(jì)難度42023/10/161、二分法記分項(xiàng)目的難度(1)通過率答對(duì)人數(shù)或通過該項(xiàng)目的人數(shù)的百分比(2)極端分組法(被試人數(shù)較多時(shí))將被試依照測驗(yàn)總分從高到低排列分成二組(Kelley,1937):總分最高的27%被試為高分組(NH),總分最低的27%被試為低分組(NL)分布計(jì)算高分組和低分組的通過率求項(xiàng)目的難度2、非二值記分的項(xiàng)目難度項(xiàng)目上的平均得分與項(xiàng)目滿分之比二、難度的計(jì)算52023/10/16三、難度的確定(1)常模參照能力測驗(yàn)

A.一般P=0.50的題目為好,因?yàn)樗箍傮w的變異最大。

B.當(dāng)題目之間正相關(guān)時(shí),題目難度值應(yīng)分布的廣些,但平均難度應(yīng)以0.50為好。

C.當(dāng)題目有猜測可能時(shí),題目的P值應(yīng)適當(dāng)加大。

D.選拔性測驗(yàn)還要考慮錄取率。(2)標(biāo)準(zhǔn)參照能力測驗(yàn)

P=1.0或P=0有可能也是好題(3)人格測驗(yàn)

P≧0.95或P≦0.05的題目考慮刪除62023/10/16四、難度的等距變換1、使用項(xiàng)目難度轉(zhuǎn)換的理由測題的難度分布是等級(jí)量表,不是等距量表難度量表是反序而行的,P值越大,項(xiàng)目越容易。2、方法(1)將項(xiàng)目的難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成具有相等單位的等距量表,即Z分?jǐn)?shù)。查表后,將Z值加上負(fù)號(hào),使得Z值越大,難度越高。72023/10/16(2)計(jì)算新的難度指標(biāo)(避免負(fù)號(hào)出現(xiàn))美國教育服務(wù)中心以Δ作為難度指標(biāo):Δ=13+4ZP=.0013Z=+3Δ=25P=.16Z=+1Δ=17P=.50Z=0Δ=13P=.84Z=-1Δ=9P=.9987Z=-3Δ=182023/10/16五、難度對(duì)測驗(yàn)的影響1、測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的分布形態(tài)2、測驗(yàn)難度影響測驗(yàn)分?jǐn)?shù)的離散程度92023/10/16第二節(jié)項(xiàng)目的區(qū)分度(discrimination)102023/10/16一、區(qū)分度的意義測驗(yàn)項(xiàng)目對(duì)被試心理品質(zhì)水平差異的區(qū)分能力。區(qū)分度(D)的取值范圍:-1.00到+1.00D>0積極區(qū)分D<0消極區(qū)分D=0無區(qū)分112023/10/16二、區(qū)分度的計(jì)算1、項(xiàng)目鑒別指數(shù)法(適用于二分法記分)步驟將被試依照測驗(yàn)總分從高到低排列分成二組:總分最高的27%被試為高分組總分最低的27%被試為低分組分布計(jì)算高分組和低分組的通過率求項(xiàng)目的鑒別力指數(shù)D=PH-PL例題:高分組在某一項(xiàng)目上的通過率為0.75,低分組的通過率為0.35,則該項(xiàng)目的鑒別力指數(shù)為多少?122023/10/162、相關(guān)法以項(xiàng)目分?jǐn)?shù)與校標(biāo)分?jǐn)?shù)或測驗(yàn)總分的相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)。相關(guān)越高,項(xiàng)目的區(qū)分度越高。(1)點(diǎn)二列相關(guān)(pointbiserialcorrelation)(2)二列相關(guān)(3)相關(guān)(4)積差相關(guān)132023/10/16題目鑒別力指數(shù)與評(píng)價(jià)價(jià)標(biāo)鑒別力指數(shù)D題目評(píng)價(jià)0.40以上很好0.30~0.39良好、修改會(huì)更好0.20~0.29尚可、仍需修改0.19以下差、必須淘汰142023/10/16三、區(qū)分度與難度的關(guān)系項(xiàng)目通過率(P)D的最大值1.000.000.900.200.700.600.600.800.501.000.400.800.300.600.100.200.000.00152023/10/16四、區(qū)分度的相對(duì)性1、不同的計(jì)算方法,所得區(qū)分值不同※在分析同一個(gè)測驗(yàn)時(shí),各個(gè)項(xiàng)目要采用相同的公式2、樣本容量大小影響相關(guān)法區(qū)分度值的大小3、分組標(biāo)準(zhǔn)影響鑒別力指數(shù)值(D)4、被試樣本的同質(zhì)性程度影響區(qū)分度值的大小※評(píng)價(jià)項(xiàng)目的有效性時(shí),應(yīng)考慮測驗(yàn)的目的、功能以及被試團(tuán)體的總體水平162023/10/16五、影響題目區(qū)分度的因素(1)題目難度(2)被試群體的同質(zhì)性(3)全卷各題所測心理品質(zhì)的一致性。(4)題目本身的文字與內(nèi)容的質(zhì)量也會(huì)影響題目的區(qū)分度172023/10/16六、提高區(qū)分度的方法(1)控制好題目難度。將題目難度在0.5左右時(shí),區(qū)分能力理論上會(huì)比較高。(2)保證題目所測心理品質(zhì)與全卷所測心理品質(zhì)的一致性。(3)題干及答案無歧義。(4)語言準(zhǔn)確規(guī)范。(5)借助選項(xiàng)分析提供的信息對(duì)不良選項(xiàng)進(jìn)行修改,以提高題目區(qū)分能力。182023/10/16七、多重選擇題的項(xiàng)目分析(一)應(yīng)考慮的四個(gè)問題:項(xiàng)目的區(qū)分度項(xiàng)目的難度項(xiàng)目是否有缺陷誘答選項(xiàng)是否都有效第三節(jié)信度概述一、信度與測量誤差1.經(jīng)典測量理論的假設(shè)式中,X為觀察分?jǐn)?shù),T為一般真分?jǐn)?shù),E為隨機(jī)誤差分?jǐn)?shù),V為目標(biāo)真分?jǐn)?shù),I為非目標(biāo)真分?jǐn)?shù)(系統(tǒng)誤差)。

一、信度與測量誤差2.信度的定義測量追求的初步目標(biāo):T占X的比例越大越好。測量追求的終極目標(biāo):V占X的比例越大越好。當(dāng)T占X的比例很大時(shí),那么測值就會(huì)是穩(wěn)定的。一般來說,穩(wěn)定的測值是可靠的、可信的,因此,信度可被認(rèn)為是測量結(jié)果的穩(wěn)定性程度。一、信度與測量誤差2.信度的定義信度(reliability)是指相同被試在不同時(shí)間或不同場合下重復(fù)使用同一測量工具或等價(jià)工具測量所得結(jié)果的一致性程度。測驗(yàn)信度表示測驗(yàn)分?jǐn)?shù)中個(gè)體差異可歸因于所測特質(zhì)中“真實(shí)”差異的程度,以及可歸因于隨機(jī)誤差的程度。二、描述信度的指標(biāo)1.經(jīng)典測量理論的信度系數(shù)(1)重測信度(test-retestcoefficients)(2)復(fù)本信度(alternative--formcoefficients)(3)內(nèi)部一致性系數(shù)(internalconsistencycoefficients)也叫同質(zhì)性信度(homogeneityreliability)具體估計(jì)方法主要包括分半信度評(píng)估法(包括積差相關(guān)分析、盧龍、弗蘭納根公式)、庫德-理查森信度評(píng)估法、克龍巴赫Alpha系數(shù)評(píng)估法、荷伊特(C.Hoyt)信度、因素分析。(4)評(píng)分者信度二、描述信度的指標(biāo)2.經(jīng)典測量理論的測量標(biāo)準(zhǔn)誤測量標(biāo)準(zhǔn)誤差(standarderrorofmeasurement)是測量誤差的假設(shè)分布的標(biāo)準(zhǔn)差。用下列公式能夠容易地計(jì)算測量標(biāo)準(zhǔn)誤差:式中,SDt表示測驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)差,rXX表示信度系數(shù)。3.概化理論的概化系數(shù)(generaliabilitycoefficients)4.IRT的測驗(yàn)信息函數(shù)(testinformationfunction)三、信度的標(biāo)準(zhǔn)與作用1.信度是評(píng)價(jià)測驗(yàn)質(zhì)量的重要指標(biāo)之一。測驗(yàn)類型

信度系數(shù)

低中高學(xué)業(yè)成就測驗(yàn)0.660.920.98學(xué)術(shù)能力測驗(yàn)0.560.900.97特殊能力傾向測驗(yàn)0.260.880.96人格測驗(yàn)0.460.850.97興趣測驗(yàn)0.420.840.93態(tài)度測驗(yàn)0.470.790.98注:表中數(shù)據(jù)來源,LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.五、分析測驗(yàn)信度應(yīng)注意的問題1.針對(duì)測驗(yàn)類型選用恰當(dāng)指標(biāo)2.信度的報(bào)告“某測驗(yàn)的信度系數(shù)為0.92,該數(shù)值是通過計(jì)算一份能力測驗(yàn)間隔兩周兩次測試成績的相關(guān)系數(shù)得出的。數(shù)據(jù)來源是從某市隨機(jī)抽取的500名小學(xué)5年級(jí)的學(xué)生施測……”。六、影響測量信度的因素影響測量信度的因素施測間隔的時(shí)間被試主試施測情境測量工具七、提高測驗(yàn)信度的常用方法提高測驗(yàn)信度的常用方法規(guī)范施測程度、統(tǒng)一施測環(huán)境適當(dāng)增加測驗(yàn)的長度控制試題的難度分布努力提高每道題的區(qū)分度維持測驗(yàn)的同質(zhì)性努力提高測驗(yàn)在被試中各個(gè)同質(zhì)亞團(tuán)體上的信度保證被試有充裕的作答時(shí)間嚴(yán)格控制評(píng)分誤差心理測量學(xué)第四節(jié)測量效度與系統(tǒng)誤差控制心理測量學(xué)一、測量效度概述什么是效度測量工具測量了他所希望測量的心理特質(zhì)或行為特征的效果和程度。Val=SV2/SX2=rxy2Val為效度,rxy為效度系數(shù)可能是因?yàn)轭A(yù)測效度的最大值為rxy2=rxxryy心理測量學(xué)一、測量效度概述效度驗(yàn)證與效度概化我們稱為某測量工具進(jìn)行效度驗(yàn)證的過程為效度證據(jù)的獲取過程,簡稱為效度驗(yàn)證。本地效度驗(yàn)證(localvalidation)效度概化(validitygeneralization):在某一情境中所作的效度研究能否推廣到其他情境。心理測量學(xué)效度與信度的關(guān)系1、高信度是高效度的必要條件,而不是充分條件2、信度系數(shù)的平方根是效度系數(shù)的最高限度心理測量學(xué)效度的性質(zhì)(1)效度是針對(duì)測驗(yàn)結(jié)果的測驗(yàn)效度是“測驗(yàn)結(jié)果”的有效性程度。(2)效度是針對(duì)某種特定的測驗(yàn)?zāi)康牡臎]有對(duì)任何測量目的都有效的測驗(yàn)(3)效度只有程度上的差異不是“全”或“無”的差異心理測量學(xué)二、測量工具效度驗(yàn)證的方法根據(jù)測量目標(biāo)的不同,對(duì)測量工具進(jìn)行效度驗(yàn)證的方法主要有三種:基于所測內(nèi)容的效度驗(yàn)證方法?;谒鶞y心理結(jié)構(gòu)的效度驗(yàn)證方法?;谛?biāo)關(guān)聯(lián)性的效度驗(yàn)證方法。心理測量學(xué)基于所測內(nèi)容的效度驗(yàn)證方法含義就是要對(duì)測量工具本身的具體內(nèi)容進(jìn)行系統(tǒng)性的查驗(yàn),以確定這些內(nèi)容是不是測量目標(biāo)特質(zhì)或行為領(lǐng)域的一個(gè)有代表性的樣本。主要應(yīng)用學(xué)業(yè)成就測驗(yàn)、職業(yè)資格測驗(yàn),人員選拔與安置中的工作樣本測驗(yàn)。心理測量學(xué)基于所測內(nèi)容的效度驗(yàn)證方法評(píng)估方法確定測量目標(biāo)的全域范圍及各部分內(nèi)容權(quán)重。確定一批有經(jīng)驗(yàn)的領(lǐng)域?qū)<?,在深入培?xùn)的基礎(chǔ)上,要求他們按照已確定的測量全域范圍及各部分內(nèi)容權(quán)重,初步分析測試題目的代表性,并對(duì)題目測量的被試作答的內(nèi)部心理過程進(jìn)行初步分析。進(jìn)行實(shí)測,根據(jù)測試數(shù)據(jù)分析和被試作答過程分析,全面驗(yàn)證測量工具的效度。內(nèi)容效度的注意事項(xiàng)適合于評(píng)價(jià)成就測驗(yàn)尤其適合于內(nèi)容參照測驗(yàn)適合于測量具體屬性的測驗(yàn)也適用于某些對(duì)員工進(jìn)行選拔和分類的職業(yè)測驗(yàn)?zāi)芰A向測驗(yàn)和人格測驗(yàn)不太適合心理測量學(xué)心理測量學(xué)基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效標(biāo):它是獨(dú)立于測量工具并可以從實(shí)踐中獲得的被試的行為特征表現(xiàn),用于驗(yàn)證測量工具的有效性。校標(biāo)污染(criterioncontamination):主試知道了被試的測驗(yàn)分?jǐn)?shù)而影響了對(duì)其校標(biāo)分?jǐn)?shù)的評(píng)定。心理測量學(xué)基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法根據(jù)測量工具與效標(biāo)兩者結(jié)果獲得的時(shí)間間隔的不同,基于效標(biāo)關(guān)聯(lián)性的效度證據(jù)采集可以有同時(shí)性設(shè)計(jì)與預(yù)測性設(shè)計(jì)兩種方法。心理測量學(xué)二、測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的預(yù)測性設(shè)計(jì)方法含義:驗(yàn)證現(xiàn)有測量評(píng)價(jià)結(jié)果與將來才可能獲取的效標(biāo)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)程度。主要應(yīng)用:人員選拔、安置類型的測量工具心理測量學(xué)測量工具效度驗(yàn)證的方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的預(yù)測性設(shè)計(jì)方法首先,獲取被試在當(dāng)前測量工具上的評(píng)價(jià)結(jié)果,如測驗(yàn)分?jǐn)?shù)、等級(jí)評(píng)定;然后,間隔一定的時(shí)間,采集被試在預(yù)測目標(biāo)(效標(biāo))上的評(píng)價(jià)結(jié)果;最后,分析以上這兩個(gè)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)性程度,這種關(guān)聯(lián)性程度的分析方法常用的有以下幾種:相關(guān)分析區(qū)分能力分析命中率分析心理測量學(xué)區(qū)分能力分析分析測量工具對(duì)被試分組的準(zhǔn)確性比如,一個(gè)測量工具根據(jù)分?jǐn)?shù)高低把被試分成了兩個(gè)組:一個(gè)是優(yōu)秀組,一個(gè)是普通組,分組的合理性就需要在被試將來的實(shí)際表現(xiàn)中進(jìn)行驗(yàn)證。在一定的時(shí)間間隔以后,采集這兩個(gè)組被試的實(shí)際工作表現(xiàn),根據(jù)這些實(shí)際表現(xiàn)可以把這批被試重新分組,最后,求取這次分組結(jié)果與最初分組結(jié)果之間的一致性程度,以驗(yàn)證該測量工具預(yù)測的準(zhǔn)確性。心理測量學(xué)命中率分析某銷售崗位需要選拔20名員工,一共有100名報(bào)名,最后,通過制作的測量工具選拔了20名員工。但由于這時(shí)銷售工作的迅速發(fā)展,于是公司設(shè)定把被淘汰的人也招募進(jìn)來成為正式員工。經(jīng)過一年的實(shí)際工作,發(fā)現(xiàn)通過專門的測量工具選拔進(jìn)來的20名員工中,有2人未完成預(yù)定任務(wù),占1/10,而一開始被淘汰的80名員工中,有20人未完成預(yù)定任務(wù),占1/4,這時(shí)候,我們可以得出結(jié)論認(rèn)為,這個(gè)測量工具對(duì)選拔該崗位的銷售人員是有效的,具有較高的預(yù)測能力。心理測量學(xué)基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法效度證據(jù)采集的同時(shí)性設(shè)計(jì)方法含義:對(duì)同時(shí)獲得的測量工具評(píng)價(jià)結(jié)果與效標(biāo)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)性程度進(jìn)行分析。主要應(yīng)用經(jīng)常用于評(píng)價(jià)測量工具診斷被試當(dāng)前心理特質(zhì)狀態(tài)的效果。在許多情形下,效度證據(jù)采集的同時(shí)性設(shè)計(jì)方法會(huì)替代預(yù)測性設(shè)計(jì)方法。評(píng)估方法與預(yù)測性設(shè)計(jì)方法一樣心理測量學(xué)基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法的影響因素群體的一致性或同質(zhì)性程度:應(yīng)該盡量擴(kuò)大被試群體的異質(zhì)性,避免低估測驗(yàn)的真實(shí)效度。測驗(yàn)長度:一般來說,測驗(yàn)長度越長,測試結(jié)果越穩(wěn)定,效度系數(shù)會(huì)傾向于越高。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論