心理測驗的信度_第1頁
心理測驗的信度_第2頁
心理測驗的信度_第3頁
心理測驗的信度_第4頁
心理測驗的信度_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于心理測驗的信度第一頁,共四十三頁,2022年,8月28日第二章心理測量的信度信度與誤差1信度的種類與估方法

2信度的影響因素

3心理測量發(fā)展簡史

4第二頁,共四十三頁,2022年,8月28日你如何解釋下述現(xiàn)象?

一個很聰明的孩子,測得智商是80分一個學(xué)習(xí)很好的學(xué)生,考試成績?yōu)?0分一個人緣很好的人,人際關(guān)系測量低于常模值第三頁,共四十三頁,2022年,8月28日量表幫助我們了解教育、心理現(xiàn)象就像尺子幫助我們測量身高。

思考:我們?nèi)绾沃牢覀冇卸喔??有兩個工具:尺子/秤

第四頁,共四十三頁,2022年,8月28日尺子的數(shù)據(jù)與我們的目測更一致,而秤盤的數(shù)據(jù)則與我們的目測不一致。因此,尺子是測量身高的有效工具——效度。什么材料的尺子?——鋼鐵(熱脹冷縮)涉及到一致性的問題?!哦鹊谖屙?,共四十三頁,2022年,8月28日第二章心理測量的信度第一節(jié)信度與誤差1第六頁,共四十三頁,2022年,8月28日一、誤差隨機(jī)誤差(RandomError)在不同情境下測量結(jié)果是不穩(wěn)定的,與測量情境和測量條件有關(guān)由于這一誤差是由測量過程造成的,因此也稱測量誤差(MeasurementEroor)系統(tǒng)誤差(SystemError)。由于測量本身所造成,測量結(jié)果向一個方向偏離,其數(shù)值按一定規(guī)律變化。以相同的方式影響測量值隨機(jī)誤差-----信度,如何控制和減少隨機(jī)誤差系統(tǒng)誤差-----效度,如何提高測量工具本身的準(zhǔn)確性第七頁,共四十三頁,2022年,8月28日二、信度的定義(一)信度的概念可信性\穩(wěn)定性\一致性測量結(jié)果的可信程度

測驗結(jié)果的一致性和穩(wěn)定性程度

受隨機(jī)誤差的影響,隨機(jī)誤差越大,信度越低同一測試---同一測試對象---多次施測—結(jié)果不穩(wěn)定---缺乏信度。測驗本身---抗干擾能力強(qiáng)----誤差控制的好---多次施測分?jǐn)?shù)的一致性高-----信度高,

第八頁,共四十三頁,2022年,8月28日(二)信度的統(tǒng)計學(xué)定義真分?jǐn)?shù)T真實分?jǐn)?shù),在測量學(xué)上叫真分?jǐn)?shù)(TrueScore)理論定義:所謂真分?jǐn)?shù)就是一個測量工具在測量沒有誤差時,所得到的真值(純正值)。操作定義:真分?jǐn)?shù)是,經(jīng)過無數(shù)次測量所得的平均值。即一個被試在許多(理論上無限多)平行測驗上得分的平均值。第九頁,共四十三頁,2022年,8月28日(二)信度的統(tǒng)計學(xué)定義真分?jǐn)?shù)與觀測分?jǐn)?shù)的關(guān)系實的分?jǐn)?shù)與真分?jǐn)?shù)關(guān)系:X=T+EσX2=σT2+σE2(方差可加性)如果誤差為0,則T=X-σX2=ΣT2測驗誤差期望為0(或誤差的平均數(shù)為0)誤差大小、正負(fù)方向是隨機(jī)的,因此其平均數(shù)為0誤差與真分?jǐn)?shù)之間是相互獨立的即誤差的出現(xiàn)、大小方向都與真分?jǐn)?shù)無關(guān)因此得出:T=X即一組被試真分?jǐn)?shù)的平均數(shù)與實的分?jǐn)?shù)的平均數(shù)相等。X:實的分?jǐn)?shù)觀測分?jǐn)?shù)T:真分?jǐn)?shù)E:測驗誤差第十頁,共四十三頁,2022年,8月28日(二)信度的統(tǒng)計定義信度的統(tǒng)計定義1定義1:信度是被試團(tuán)體真分?jǐn)?shù)方差與實得分?jǐn)?shù)方差之比真分?jǐn)?shù)的變異在實得分?jǐn)?shù)變異中所占的比重

實得分?jǐn)?shù)的變異在多大程度上是由真分?jǐn)?shù)的變異引起的。當(dāng)實得分?jǐn)?shù)的變異可以由全部真分?jǐn)?shù)的變異解釋時,測驗誤差就是0,這時測驗的信度為1(rxx=1)第十一頁,共四十三頁,2022年,8月28日信度的統(tǒng)計定義二信度乃是一個被測團(tuán)體真分?jǐn)?shù)與實得分?jǐn)?shù)的相關(guān)系數(shù)的平方。rXX=ρ

2TX思考:相關(guān)系數(shù)的平方?(二)信度的統(tǒng)計定義第十二頁,共四十三頁,2022年,8月28日信度的統(tǒng)計定義三信度乃是一個測驗X與它的任意一個平行測驗X'的相關(guān)系數(shù)。rXX=ρXX'

(操作定義)于是,可根據(jù)測試結(jié)果分?jǐn)?shù)的形式,是連續(xù)變量還是二分變量等,可采用不同的相關(guān)系數(shù)計算公式。(二)信度的統(tǒng)計定義第十三頁,共四十三頁,2022年,8月28日三、信度的作用評價測驗信度越高,說明測驗所得分?jǐn)?shù)越接近被試的真分?jǐn)?shù),分?jǐn)?shù)就可靠。信度要求:解釋分?jǐn)?shù)對被試的真分?jǐn)?shù)進(jìn)行估計,信度越高,實得分?jǐn)?shù)越能代表他的真分?jǐn)?shù),信度為1時,實得分?jǐn)?shù)就是真分?jǐn)?shù).能力測驗:>0.90人格/興趣測驗r>0.85時,可對個人進(jìn)行診斷、鑒別、解也可以進(jìn)行團(tuán)體比較,只能進(jìn)行團(tuán)體比較r<0.70時,不能評價個人,也不能進(jìn)行團(tuán)體比較第十四頁,共四十三頁,2022年,8月28日第二章心理測量的信度第二節(jié)信度的種類與估方法

2第十五頁,共四十三頁,2022年,8月28日信度的種類重測信度復(fù)本信度同質(zhì)性信度分半信度克龍巴赫(cronbach)α系數(shù)庫德-理查森信度評分者信度第十六頁,共四十三頁,2022年,8月28日一、重測信度Test-RetestReliability定義:同一量表,同一被試群體,在不同時間,兩次施測,求其相關(guān)。實質(zhì):表示測驗結(jié)果的穩(wěn)定性。故稱之為穩(wěn)定性系數(shù)(CoefficientofStability)形式:施測再施測間隔適當(dāng)時間第十七頁,共四十三頁,2022年,8月28日重測信度時間間隔的把握間隔時間越長,穩(wěn)定性系數(shù)越低。適宜時間間隔依照測驗?zāi)康?、性質(zhì)及被試特點而定。幾分鐘至幾年。年幼兒童,間隔要??;年長群體,間隔可大。智力測驗的間隔不能太短,成就測驗的間隔不能太長。一般間隔時間不超過六個月。(即不能讓被試記住上一次測驗的內(nèi)容,又不能讓其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識產(chǎn)生遺忘)第十八頁,共四十三頁,2022年,8月28日重測信度的計算方法求取同一組被試在兩個不同時間施測同一個測量工具所得的結(jié)果分?jǐn)?shù)的相關(guān)系數(shù),一般使用積差相關(guān)法(r)計算重測信度的原理是對平行測驗的假定,假設(shè)某測驗所要測量的潛在特質(zhì),短期內(nèi)不會隨著時間推移而改變。但因為重測時被試的心理特質(zhì)會發(fā)生變化,導(dǎo)致真分?jǐn)?shù)變異,練習(xí)和疲勞效應(yīng)也會也會使得重測的結(jié)果出現(xiàn)差異。在測驗手冊上報告的重測信度,一般要注明被試樣本的性質(zhì)、大小,及是間隔多長時間所測的信度系數(shù),以便使用者了解樣本及時間因素對測驗穩(wěn)定性的影響。第十九頁,共四十三頁,2022年,8月28日計算重測信度時應(yīng)注意的問題所欲測量的心理特質(zhì)是否穩(wěn)定所測的如果是人格、智力、興趣等心理特質(zhì),則可以使用重測法,而知識、情緒等不穩(wěn)定的心理特質(zhì)使用重測法必須慎重。重測結(jié)果要盡量減少練習(xí)或遺忘因素的影響智力測驗的時間間隔不能太短,成就測驗則不能間隔太長,既不能讓被試記住上次測驗的內(nèi)容,又不能使其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識產(chǎn)生遺忘。如果使用年齡小的被試時,測驗間隔要小些,年齡大的被試可以長些。對兒童的智力測驗一般是兩周到四周為宜。對成年人,間隔可到半年,很少超過6個月。第二十頁,共四十三頁,2022年,8月28日重測信度適用條件重測信度適用于異質(zhì)性測驗。所謂異質(zhì)性測驗就是說一個測驗包括幾個不同的部分,這幾個部分分別測量著幾個不同的心理特質(zhì),它們之間可能并不存在相關(guān),或相關(guān)較低。重測信度適用于速度測驗而不適用于難度測驗。速度測驗的測題數(shù)量多,而且有一定的時間限制,被試很難記住第一次施測的內(nèi)容,所以第二次施測較少受記憶的影響,而難度測驗則相反。重測信度還適用于運動技能的測驗,如跑、跳、擲等,其測驗成績較少受重復(fù)測量的影響。第二十一頁,共四十三頁,2022年,8月28日二、復(fù)本信度復(fù)本測驗/平行測驗指在試題格式、題數(shù)、難度、指導(dǎo)語說明、施測要求等方面都相當(dāng),并且都用來測量相同潛在特質(zhì)或?qū)傩?,但試題又是不相同的測驗。(AB卷)第二十二頁,共四十三頁,2022年,8月28日復(fù)本測驗等值要符合下列條件:各份測驗測量的是同一種心理特性。各份測驗具有相同的內(nèi)容和形式。各份測驗的題目不應(yīng)重復(fù)。各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。各份測驗的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。復(fù)本編好后,應(yīng)再測一次,以確保各份測驗的等值。第二十三頁,共四十三頁,2022年,8月28日復(fù)本信度(Alternate-formraliability)指兩個平行測驗測量同一批被試所得結(jié)果的一致性程度數(shù)值上是兩個復(fù)本施測于同一被試樣本所得測驗分?jǐn)?shù)的相關(guān)系數(shù).施測方式同一個時間連續(xù)施測--等值性系數(shù)間隔一段時間后施測--等值穩(wěn)定性系數(shù)第二十四頁,共四十三頁,2022年,8月28日復(fù)本測驗的形式1等值性系數(shù):同時連續(xù)施測,反映內(nèi)容變異。形式:復(fù)本A—最短時間—復(fù)本B被試易出現(xiàn)疲勞、失去積極性、會出現(xiàn)遷移(順序效應(yīng))可隨機(jī)分配一半被試先做復(fù)本A后做復(fù)本B,另一半先做B再做A,以平衡順序效應(yīng)。第二十五頁,共四十三頁,2022年,8月28日復(fù)本測驗的形式2等值穩(wěn)定性系數(shù):時間間隔施測,內(nèi)容變異+重測信度誤差同時兼顧試題抽樣與時間影響形式:復(fù)本A—適當(dāng)時間—復(fù)本B時間間隔,減少了練習(xí)效應(yīng)和疲勞效應(yīng)時間間隔適當(dāng),可用于計算穩(wěn)定性不高的心理特質(zhì)的測驗信度,克服了等值性系數(shù)的局限第二十六頁,共四十三頁,2022年,8月28日復(fù)本信度優(yōu)缺點優(yōu)點:復(fù)本信度優(yōu)于重測信度避免了重測帶來的記憶效應(yīng)和練習(xí)效應(yīng);可用于長期追蹤研究前后測量;減少了作弊的可能性。

缺點:有些測驗的復(fù)本很難找到;有些測驗因正遷移效應(yīng)使測驗性質(zhì)改變;如測量的內(nèi)容很容易受練習(xí)的影響,復(fù)本信度也無法清除這種練習(xí)效應(yīng)。第二十七頁,共四十三頁,2022年,8月28日復(fù)本信度使用條件各份測驗測量的是同一種心理特性。各份測驗具有相同的內(nèi)容和形式。各份測驗的題目不應(yīng)重復(fù)。各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。各份測驗的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。復(fù)本編好后,應(yīng)再測一次,以確保各份測驗的等值。第二十八頁,共四十三頁,2022年,8月28日三、同質(zhì)性信度也叫內(nèi)部一致性信度,指測驗內(nèi)部所有題目間的一致性程度,是一個測驗所測內(nèi)容或特質(zhì)的相同程度所有題目測的是同一種心理特質(zhì)所有題目得分之間都具有較高的正相關(guān)假設(shè)同質(zhì)性信度高,說明測驗主要測的是某一單個心理特質(zhì),由于眾多的題目測試了同一心理特質(zhì),那么實測結(jié)果就是該特質(zhì)水平的反映估計方法分半信度克龍巴赫(cronbach)α系數(shù)庫德-理查森系數(shù)第二十九頁,共四十三頁,2022年,8月28日*分半信度(Split-HalfReliability)定義:在測驗沒有復(fù)本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據(jù)被試在這兩半測驗中所得的分?jǐn)?shù)計算相關(guān)系數(shù),即得分半信度。計算分半信度先要對測驗分半。不同的分半法可能會得到不同的信度值。第三十頁,共四十三頁,2022年,8月28日分半方法:為了使兩半基本等值,可將項目按由易到難的順序排列編號,然后按奇數(shù)和偶數(shù)序號將項目分半。要注意使那些性質(zhì)相同、聯(lián)系緊密的項目分在相同的一半,否則會使信度值偏高。由于分半信度實際上只是半個測驗的信度,測驗越長、項目越多,兩半分?jǐn)?shù)的相關(guān)就越高。因此,對長度不同的測驗,要用校正公式。斯皮爾曼-布朗公式:rxx=2rhh/(1+rhh)rxx:---信度系數(shù)rhh---兩個“半測驗”的的相關(guān)系數(shù)第三十一頁,共四十三頁,2022年,8月28日庫德-理查森系數(shù)當(dāng)測驗都是二計分題目時,可以用庫德-理查森系數(shù)來估計同質(zhì)性信度適用條件:只適合預(yù)測題目是二分法計分題目。公式:K:測驗題目的個數(shù)Pi:被試在項目i上的正確做答比例qi:被試在項目i上錯誤作答的比例S2x:測驗的總方差第三十二頁,共四十三頁,2022年,8月28日當(dāng)測驗題型較多、并非都是二分記分題時,估計測驗信度可采用克龍巴赫α系數(shù)表征多個測驗項目的內(nèi)部一致性公式:K:測驗題目的個數(shù)Si2:被試在項目i上的得分的方差Sx2:測驗總分的總方差

*克龍巴赫(Alpha)α系數(shù)第三十三頁,共四十三頁,2022年,8月28日四、評分者信度ScorerReliability指不同評分者之間在測驗結(jié)果計分上的一致性。隨機(jī)抽取若干份試卷,由至少兩位受過訓(xùn)練的評分者按計分規(guī)則分別判分,然后計算它們的相關(guān)。評分越一致,評分者信度越高。適用條件作文、創(chuàng)造力、投射、道德判斷等測驗第三十四頁,共四十三頁,2022年,8月28日評分者信度的評估方法計算積差相關(guān)或斯皮爾曼相關(guān)系數(shù)兩個評分者、或一個人兩次評分計算肯德爾和諧系數(shù):評分者在三人以上,而且采用等級記分。第三十五頁,共四十三頁,2022年,8月28日五、信度系數(shù)誤差來源1、不同類型信度的誤差來源第三十六頁,共四十

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論