心理測量的質(zhì)量標(biāo)準(zhǔn)_第1頁
心理測量的質(zhì)量標(biāo)準(zhǔn)_第2頁
心理測量的質(zhì)量標(biāo)準(zhǔn)_第3頁
心理測量的質(zhì)量標(biāo)準(zhǔn)_第4頁
心理測量的質(zhì)量標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一頁,共二十六頁,2022年,8月28日測量誤差誤差誤差的種類產(chǎn)生誤差的因素誤差的控制誤差的估計(jì)第二頁,共二十六頁,2022年,8月28日測量誤差的認(rèn)識(shí)誤差:由與測量目標(biāo)無關(guān)的變因所引起的不準(zhǔn)確和不一致的效應(yīng)。隨機(jī)誤差:偶然因素所引起的誤差。影響測驗(yàn)結(jié)果的一致性。系統(tǒng)誤差:穩(wěn)定因素所引起的誤差。影響結(jié)果的準(zhǔn)確性。第三頁,共二十六頁,2022年,8月28日誤差的影響因素誤差誘因測驗(yàn)工具:目標(biāo)內(nèi)容項(xiàng)目材料……施測過程:情境主體機(jī)遇……結(jié)果解釋:計(jì)分常模對(duì)象……第四頁,共二十六頁,2022年,8月28日CTT對(duì)誤差的分析:真分?jǐn)?shù)理論真分?jǐn)?shù):即是測量中不存在測量誤差時(shí)的真值或客觀值。操作性定義就是無數(shù)次測量的平均值。通常用T或X表示?;痉匠淌剑篨=T+E,T=V+I其中X為實(shí)測分?jǐn)?shù),V為有效分?jǐn)?shù),I為系統(tǒng)誤差?;炯僭O(shè):(1)誤差分?jǐn)?shù)的平均數(shù)為0;(2)誤差分?jǐn)?shù)與真分?jǐn)?shù)相互獨(dú)立,即相關(guān)為零。(3)兩次測量誤差分?jǐn)?shù)之間相關(guān)為零。方差分離:SX2=SV2+SI2+SE2第五頁,共二十六頁,2022年,8月28日現(xiàn)代測量理論(GT)對(duì)誤差的認(rèn)識(shí)誤差誘因被試:特質(zhì)水平穩(wěn)定性評(píng)分者:標(biāo)準(zhǔn)一致性試題項(xiàng)目:代表性自身相互之間自身相互之間第六頁,共二十六頁,2022年,8月28日GT對(duì)誤差的分類相對(duì)誤差():所有隨機(jī)誤差的和

絕對(duì)誤差(Δ

):樣本觀測值與全域分?jǐn)?shù)的差,其中包含了所有的誤差。

第七頁,共二十六頁,2022年,8月28日CTT對(duì)隨機(jī)誤差的分析:信度信度定義信度的估計(jì)影響信度的因素幾點(diǎn)說明第八頁,共二十六頁,2022年,8月28日信度的定義語詞定義:反應(yīng)測量一致性程度的指標(biāo)。理論定義:兩個(gè)方差的比值第九頁,共二十六頁,2022年,8月28日信度估計(jì)的方法再測信度:時(shí)間復(fù)本信度:工具分半信度:內(nèi)容同質(zhì)信度:項(xiàng)目評(píng)分者信度:記分第十頁,共二十六頁,2022年,8月28日重測信度定義:對(duì)同一被試總體進(jìn)行重復(fù)測量的兩組數(shù)據(jù)之間的一致性程度的量化指標(biāo)估計(jì)方法:Pearson相關(guān)誤差來源:(1)間隔時(shí)間短,記憶的影響;(2)練習(xí)效應(yīng);(3)時(shí)間間隔長,其它因素,如學(xué)習(xí)、發(fā)育、額外訓(xùn)練的影響。實(shí)質(zhì):考慮時(shí)間的影響。所以又叫穩(wěn)定性系數(shù)使用的前提條件:(1)測量的特質(zhì)必須是穩(wěn)定的。(2)遺忘與與練習(xí)相當(dāng)。(3)無特殊學(xué)習(xí)與訓(xùn)練。第十一頁,共二十六頁,2022年,8月28日復(fù)本信度定義:兩個(gè)平行測驗(yàn)測量同一批被試所得結(jié)果的一致性程度。種類(按實(shí)施的時(shí)間):(1)同時(shí)——等值性系數(shù),反映項(xiàng)目之間的差異;(2)間隔一段時(shí)間——穩(wěn)定性與等值性系數(shù),反映項(xiàng)目與施測環(huán)境、時(shí)間等的差異。估計(jì)方法:相關(guān)第十二頁,共二十六頁,2022年,8月28日分半信度定義:將一個(gè)測驗(yàn)分成對(duì)等的兩半后,所有被試在這兩半測驗(yàn)上所得分?jǐn)?shù)的一致性程度。估計(jì)方法:(1)Spearman—Brown公式(2)Flanagan公式(3)Rulon公式使用條件:兩組差異相等,無復(fù)本。分半方法:隨機(jī)、奇偶、匹配(難度、內(nèi)容)等第十三頁,共二十六頁,2022年,8月28日內(nèi)部一致性系數(shù)定義:又稱同質(zhì)信度,測驗(yàn)內(nèi)部所有項(xiàng)目之間的一致性程度。包括:所有項(xiàng)目測量同一種特質(zhì),項(xiàng)目得分高度相關(guān)。估計(jì)方法:KR20、KR21、Cronbach系數(shù)第十四頁,共二十六頁,2022年,8月28日評(píng)分者信度定義:多個(gè)評(píng)分者給同一批人的答案評(píng)分的一致性程度。估計(jì)方法:KendallW系數(shù)、U系數(shù)第十五頁,共二十六頁,2022年,8月28日影響信度的因素分?jǐn)?shù)的分布范圍:越寬越高測驗(yàn)長度的影響:越長越高測試者的能力水平:影響到難度測驗(yàn)難度的影響。太難,越小,趨近于0第十六頁,共二十六頁,2022年,8月28日幾點(diǎn)說明不同類型的測驗(yàn)需要選擇不同的估計(jì)方法,以上的方法是比較常用的方法,主要使用于常模測驗(yàn),目標(biāo)參照常用概化理論及其它方法(如分類一致性指數(shù))。信度范圍:針對(duì)不同測驗(yàn)要求不同。如,標(biāo)準(zhǔn)化能力、學(xué)績測驗(yàn)需要0.90以上,人格測驗(yàn)0.80以上,自編測驗(yàn)0.60以上。信度提高的方法第十七頁,共二十六頁,2022年,8月28日CTT對(duì)系統(tǒng)誤差的分析:效度定義:測驗(yàn)?zāi)軌驕y出它所欲測的特質(zhì)的程度。效度概念的演變:內(nèi)容、效標(biāo)關(guān)聯(lián)和構(gòu)想(結(jié)構(gòu))效度,其中最主要的是構(gòu)想效度。常用的效度概念效度的估計(jì)方法第十八頁,共二十六頁,2022年,8月28日效度概念的發(fā)展內(nèi)容效度效標(biāo)關(guān)聯(lián)效度結(jié)構(gòu)效度第十九頁,共二十六頁,2022年,8月28日常用效度概念內(nèi)容效度:指測驗(yàn)內(nèi)容對(duì)于其所欲測的行為領(lǐng)域的代表性程度。對(duì)教育成就測驗(yàn)尤為重要。效標(biāo)關(guān)聯(lián)效度:一個(gè)測驗(yàn)對(duì)處于特定情境中的個(gè)體的行為進(jìn)行預(yù)測時(shí)的有效性。有時(shí)又叫預(yù)測效度。常用的效標(biāo)(被預(yù)測的行為同時(shí)又檢驗(yàn)測驗(yàn)效度的標(biāo)準(zhǔn))有學(xué)習(xí)成績、工作成就、特殊訓(xùn)練成績、臨床診斷、團(tuán)體比較、現(xiàn)成測驗(yàn)等。效標(biāo)的選擇和使用非常重要,特別其具有時(shí)效性的特征。主要用于:預(yù)測、分類、甑選、人員安置等。構(gòu)想效度:測驗(yàn)對(duì)被稱作構(gòu)想的某一理論概念或特質(zhì)的測量程度。構(gòu)想的兩個(gè)特性為(1)對(duì)本質(zhì)規(guī)律的抽象和概括。(2)與具體的可觀察的本質(zhì)和事件相聯(lián)系。應(yīng)用是對(duì)于分?jǐn)?shù)的解釋和應(yīng)用。第二十頁,共二十六頁,2022年,8月28日效度的估計(jì)內(nèi)容效度效標(biāo)關(guān)聯(lián)效度結(jié)構(gòu)效度邏輯分析專家分析相關(guān)分析統(tǒng)計(jì)檢驗(yàn)因素分析多質(zhì)多法實(shí)驗(yàn)法第二十一頁,共二十六頁,2022年,8月28日影響效度的因素引起誤差的因素——測量的信度測量目標(biāo)——選擇一定的效標(biāo)被試群體的影響——被試自身的特征估計(jì)方法的影響——跟測驗(yàn)?zāi)康挠邢鄳?yīng)的聯(lián)系第二十二頁,共二十六頁,2022年,8月28日CTT項(xiàng)目分析目標(biāo):通過項(xiàng)目參數(shù)的分析,保障每個(gè)項(xiàng)目的質(zhì)量。內(nèi)容:難度和區(qū)分度方法:統(tǒng)計(jì)分析第二十三頁,共二十六頁,2022年,8月28日難度難度:難易程度。計(jì)算:通過率。影響因素:測量目標(biāo)的影響,如目標(biāo)還是常模參照測驗(yàn)。測驗(yàn)的用途:診斷或選拔、人員分配等。第二十四頁,共二十六頁,2022年,8月28日區(qū)分度區(qū)分度:特質(zhì)水平的區(qū)分和鑒別程度。計(jì)算:點(diǎn)二列、二列、

相關(guān)、四分相關(guān)、PEARS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論