心理測量學(xué)測驗的信度_第1頁
心理測量學(xué)測驗的信度_第2頁
心理測量學(xué)測驗的信度_第3頁
心理測量學(xué)測驗的信度_第4頁
心理測量學(xué)測驗的信度_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

心理測量學(xué)測驗的信度第一頁,共四十五頁,2022年,8月28日補(bǔ):測量的誤差及其來源◆誤差的定義◆誤差的種類◆誤差的來源第二頁,共四十五頁,2022年,8月28日測量結(jié)果測量因素1、誤差的定義與測量目的無關(guān)不準(zhǔn)確或不一致考研題誤差:與測驗?zāi)康臒o關(guān)的因素所導(dǎo)致的測驗結(jié)果不一致或不準(zhǔn)確的現(xiàn)象.第三頁,共四十五頁,2022年,8月28日2、誤差的種類系統(tǒng)誤差隨機(jī)誤差第四頁,共四十五頁,2022年,8月28日隨機(jī)誤差與系統(tǒng)誤差的比較類型產(chǎn)生原因特點(diǎn)效能指標(biāo)隨機(jī)誤差不易控制的偶然因素方向和大小上完全隨機(jī)影響準(zhǔn)確性影響一致性信度系統(tǒng)誤差恒定、有規(guī)律的因素穩(wěn)定地存在于每次測量中不影響一致性效度第五頁,共四十五頁,2022年,8月28日經(jīng)典測驗理論信度概念信度的評估方法信度系數(shù)的應(yīng)用影響信度的因素第六頁,共四十五頁,2022年,8月28日成熟標(biāo)志20世紀(jì)50年代Gulliksen《心理測驗理論》三大支柱基本假設(shè)信度效度

一、經(jīng)典測驗理論ClassicalTestTheory(CTT)考研題第七頁,共四十五頁,2022年,8月28日基本假設(shè)與真分?jǐn)?shù)1、真分?jǐn)?shù)觀測分?jǐn)?shù)誤差分?jǐn)?shù)真分?jǐn)?shù)測驗所得未加工理論定義真正特質(zhì)水平操作定義無數(shù)次測量結(jié)果的均值第八頁,共四十五頁,2022年,8月28日經(jīng)典測驗理論(CTT)假定:

觀察分?jǐn)?shù)(X)與真分?jǐn)?shù)(T)之間是一種線性關(guān)系,并只相差一個隨機(jī)誤差(E)。即:X=T+E第九頁,共四十五頁,2022年,8月28日(1)如果對一個人測量無數(shù)次,其誤差之和為0,平均誤差為0。(2)

誤差與真分?jǐn)?shù)相互獨(dú)立,相關(guān)為0。(3)一個團(tuán)體的平均真分?jǐn)?shù)等于該團(tuán)體中所有被試實得分?jǐn)?shù)的平均值。(4)對于一個團(tuán)體來說,實得分?jǐn)?shù)、真分?jǐn)?shù)、和測量誤差之間有如下關(guān)系:關(guān)于測量誤差還有如下假設(shè):隨機(jī)誤差第十頁,共四十五頁,2022年,8月28日

在一次測驗中,一個團(tuán)體的實測分?jǐn)?shù)的變異數(shù)是由與測量目的有關(guān)的變異數(shù)、穩(wěn)定但出自無關(guān)來源的變異數(shù)和偶然但出自無關(guān)來源的變異數(shù)所決定的。第十一頁,共四十五頁,2022年,8月28日二、信度的定義真分?jǐn)?shù)方差與觀測分?jǐn)?shù)方差的比值信度指的是測量結(jié)果的穩(wěn)定性程度(或一致性程度)。信度是反映測量中隨機(jī)誤差大小的指標(biāo)。第十二頁,共四十五頁,2022年,8月28日三、信度評估的方法信度重測信度復(fù)本信度內(nèi)部一致性信度評分者信度分半信度同質(zhì)性信度第十三頁,共四十五頁,2022年,8月28日(一)重測信度(Test-retestreliability)含義同一測驗同組對象前后測2次相關(guān)系數(shù)穩(wěn)定性程序誤差時間太短練習(xí)效應(yīng)記憶效應(yīng)A卷一定時距A卷太長身心變化第十四頁,共四十五頁,2022年,8月28日第一,所測的心理特性必須是穩(wěn)定的。第二,遺忘和練習(xí)的效果基本上相互抵消。第三,所測心理特質(zhì)在兩次施測的間隔時間內(nèi)沒有獲得更多的學(xué)習(xí)和訓(xùn)練。第四,報告結(jié)果時要報告兩次測驗的間隔及有關(guān)經(jīng)歷.

使用條件第十五頁,共四十五頁,2022年,8月28日

優(yōu)點(diǎn)省力、省時測量屬性相同提供隨時間變化的資料

不足時間間隔長短評價★時間間隔越長,重測信度越低;★時間間隔視測驗?zāi)康?、性質(zhì)、被試特點(diǎn)而定;★年幼兒童,間隔要??;年長成人,間隔可長;★智力測驗間隔不能太短,成就測驗不能太長;★一般以2-4周為宜,智力測驗的間隔時間一般在6個月左右。第十六頁,共四十五頁,2022年,8月28日(二)復(fù)本信度(Alternate-form

raliability)含義兩等值測驗最短時間內(nèi)對同組對象施測結(jié)果r等值性程序誤差內(nèi)容取樣A卷最短時距B卷第十七頁,共四十五頁,2022年,8月28日復(fù)本等值的條件●各測驗測量的是同一種心理特質(zhì);●各測驗具有相同的內(nèi)容和形式;●各測驗的題目不應(yīng)重復(fù);●各測驗題目數(shù)量相等;各測驗難度和區(qū)分度大體相同;●各測驗的分?jǐn)?shù)分布(標(biāo)準(zhǔn)差和平均數(shù))大體相同;●復(fù)本編制好后,應(yīng)再測一次,以確保等值。第十八頁,共四十五頁,2022年,8月28日第一,前提是有復(fù)本測驗。第二,被試有條件接受兩個測驗(時間和經(jīng)費(fèi)等)。第三,報告結(jié)果時要報告兩次測驗的間隔及有關(guān)經(jīng)歷.

使用條件第十九頁,共四十五頁,2022年,8月28日

優(yōu)點(diǎn)代表性增強(qiáng),信度更準(zhǔn)一定程度避免練習(xí)、記憶效應(yīng)

不足編制復(fù)本難影響積極性觸類旁通評價第二十頁,共四十五頁,2022年,8月28日重測信度與復(fù)本信度有何異同?第二十一頁,共四十五頁,2022年,8月28日小結(jié)與問題重測信度復(fù)本信度內(nèi)部一致性跨時間一致性跨形式一致性試題之間有何關(guān)系?第二十二頁,共四十五頁,2022年,8月28日(三)內(nèi)部一致性信度含義測驗各題間一致性題目一致性分半信度類型同質(zhì)性信度第二十三頁,共四十五頁,2022年,8月28日1、分半信度(Split-halfraliablity)分半方法奇偶題分半分析程序兩半相關(guān):rhh校正:rnn難易:低高分半條件兩半相似:M、S項目組間相關(guān)分布常態(tài)第二十四頁,共四十五頁,2022年,8月28日校正方法斯皮爾曼-布朗公式方差相等時弗拉南根公式盧尤公式方差不等時第二十五頁,共四十五頁,2022年,8月28日使用條件測驗只能施測一次或沒有復(fù)本的情況下使用.當(dāng)一個測驗無法分成對等的兩半時不宜使用.第二十六頁,共四十五頁,2022年,8月28日2、同質(zhì)信度(Homogeneityraliability)同質(zhì)性題目間的內(nèi)部一致性類型庫-理信度克龍巴赫系數(shù)各類題型二值記分第二十七頁,共四十五頁,2022年,8月28日(四)評分者信度(Scorerraliability)含義評分者評分的一致性方法2評分者2個以上者rXY肯德爾和諧系數(shù)第二十八頁,共四十五頁,2022年,8月28日附:確定信度的可接受水平測驗類型最低標(biāo)準(zhǔn)標(biāo)準(zhǔn)化測驗人格測驗非標(biāo)準(zhǔn)化測驗0.900.80-0.850.60-0.85典型測驗的一般標(biāo)準(zhǔn)第二十九頁,共四十五頁,2022年,8月28日典型測驗的信度高低水平測驗類型

低中高成套成就測驗學(xué)術(shù)能力測驗成套傾向性測驗客觀人格測驗興趣問卷態(tài)度量表.66.92.98.56.90.97.26.88.96.46.85.97.42.84.93.47.79.98第三十頁,共四十五頁,2022年,8月28日各種信度系數(shù)相應(yīng)誤差變異的來源信度系數(shù)的類型誤差變異的來源再測信度復(fù)本信度(連續(xù)施測)復(fù)本信度(間隔施測)分半信度同質(zhì)性信度評分者信度時間取樣內(nèi)容取樣時間與內(nèi)容取樣內(nèi)容取樣內(nèi)容的一致性評分者間的差異第三十一頁,共四十五頁,2022年,8月28日友情提示實際上,有多少種誤差的來源,就有多少種信度估計的方法。一般來說,一個測驗?zāi)姆N誤差大,就應(yīng)該用哪種誤差估計。有時一個測驗需要幾種信度估計。第三十二頁,共四十五頁,2022年,8月28日操作演練假設(shè)對100個六年級學(xué)生以兩個月的時間間隔先后施測一個創(chuàng)造力測驗的A/B兩個復(fù)本,所得的等值與穩(wěn)定性系數(shù)為0.70。我們還根據(jù)被試對每個復(fù)本的反應(yīng)計算出分半信度為0.80.同時,我們將另一個評分者隨機(jī)抽取50份卷子另外評分,得到評分者信度為0.92。然后,我們對這這三種方法所產(chǎn)生的誤差變異進(jìn)行分析。第三十三頁,共四十五頁,2022年,8月28日一個假想測驗的變異數(shù)分析信度類型誤差變異數(shù)誤差變異來源復(fù)本信度(間隔)1-0.70=0.30時間和內(nèi)容取樣分半信度1-0.80=0.20內(nèi)容取樣上述兩者差異0.30-0.20=0.10時間取樣評分者信度1-0.92=0.08評分者差異誤差變異總和0.20+0.10+0.08=0.38真實變異1-0.38=0.62第三十四頁,共四十五頁,2022年,8月28日四、信度系數(shù)的應(yīng)用1、評價測驗2、解釋分?jǐn)?shù)(1)個人測驗分?jǐn)?shù)的誤差

(X-1.96SE)≥T≤(X+1.96SE)第三十五頁,共四十五頁,2022年,8月28日(2)兩種測驗分?jǐn)?shù)的比較(差異的標(biāo)準(zhǔn)誤)所得結(jié)果與1.96SE(0.05水平)進(jìn)行比較,即可得出兩個測驗的差異是否顯著.第三十六頁,共四十五頁,2022年,8月28日五、影響信度的因素測驗長度樣本特征測驗難度時間間隔

考研題第三十七頁,共四十五頁,2022年,8月28日(一)測驗長度含義測驗試題的數(shù)量特點(diǎn)測驗越長,試題取樣越具有代表性。測驗越長,猜測因素影響就越小。增加測驗長度的效果應(yīng)遵循報酬遞減率原則。第三十八頁,共四十五頁,2022年,8月28日長度與信度的關(guān)系RXX為原測驗的信度.RNN為測驗長度增加后測驗的信度.K為改變后的測驗長度與原來長度之比.第三十九頁,共四十五頁,2022年,8月28日

例2-16:某測驗有40題,信度0.65,若增至120題,信度會是多少?

例2-17:某測驗有30題,信度0.75,試問要達(dá)到多少題才能使信度達(dá)到0.90?第四十頁,共四十五頁,2022年,8月28日特點(diǎn)樣本越異質(zhì),分?jǐn)?shù)分布越廣,有可能高估信度。樣本不同,信度就有可能不同。(二)樣本特征1、樣本團(tuán)體異質(zhì)性的影響第四十一頁,共四十五頁,2022年,8月28日2、樣本團(tuán)體平均能力水平的影響特點(diǎn):

團(tuán)體平均水平太高或太低,分布變窄,可能低估信度.選擇測驗時應(yīng)注意取樣團(tuán)體的變異性和能力水平建立信度的團(tuán)體與欲測團(tuán)體是否一致第四十二頁,共四十五頁,2022年,8月28日一般趨勢測驗太難或太易,分?jǐn)?shù)范圍縮小,降低信度.難度與題型

簡答題:P=0.5時,X為0~100,信度最高。學(xué)績測驗選擇題的理想平均難度(洛德)五擇一:0.70四擇一:0.74三擇一:0.77是非題:0.85

(三)測驗難度第四十三頁,共四十五頁,2022年,8月28日智力的時間變化

間隔期信度系數(shù)同日或次日0.90~0.951年0.852~2.5年0.805年0.75~0.809

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論