(完整版)心理學(xué)中的各種信度和效度_第1頁
(完整版)心理學(xué)中的各種信度和效度_第2頁
(完整版)心理學(xué)中的各種信度和效度_第3頁
(完整版)心理學(xué)中的各種信度和效度_第4頁
(完整版)心理學(xué)中的各種信度和效度_第5頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、心理學(xué)中的各種信度和效度一、信度所謂信度, 指的是測量結(jié)果的穩(wěn)定性程度, 其操作定義是, 信度乃是一個測驗 X 與它的任意一個“平行測驗 X/的相關(guān)系數(shù)。無關(guān)因素、測驗的長度、測驗試題的區(qū)分度、被試團 體的代表性都會影響信度。(一)重測信度1、定義:利用同一量表,讓同一被試群體在不同時間兩次施測之后的相關(guān)值。這一信度值 表示的是測驗結(jié)果的穩(wěn)定性,故也稱之為穩(wěn)定性系數(shù)。2、形式:施測經(jīng)過適當(dāng)時間再施測3、 舉例:假設(shè)有一份主觀幸福感調(diào)查表,先后兩次施測于10 名學(xué)生,時間間隔為半年,結(jié) 果如下表所示,求該測驗的重測信度。4、使用的前提條件(1)所測量的心理特質(zhì)必須是穩(wěn)定的。(2)遺忘和練習(xí)的效果

2、基本上互相抵消。(3)在兩次施測的間隔期內(nèi),被試在所要測查的心理特質(zhì)方面沒有更多的學(xué)習(xí)和訓(xùn)練。5、注意事項(1)有些測驗不宜采用重測法估計信度,如測量推理和創(chuàng)造力的測驗。那些不易受重復(fù)使 用影響的測驗才能用再測法估計信度。如感覺運動測驗、人格測驗。(2)兩次測驗間隔的時間要適當(dāng),并注意提高被試的積極性(3)測驗手冊中報告重測信度時應(yīng)說明兩次施測的間隔,以及在此期間內(nèi)被試的有關(guān)經(jīng)歷(4)時間間隔的把握:適宜時間間隔依照測驗?zāi)康?、性質(zhì)及被試特點而定,可以是幾分鐘 甚至幾年。 例如對于年幼兒童的間隔要??; 年長群體的間隔可大。 但智力測驗的間隔不能太 短,成就測驗的間隔不能太長。 一般間隔時間不超過

3、六個月,既不能讓被試記住上一次測 驗的內(nèi)容,又不能讓其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識產(chǎn)生遺忘。6、重測信度的評價:(1)優(yōu)點:能夠提供有關(guān)測驗結(jié)果是否隨時間而變異的資料,可作為預(yù)測受測者將來行為 表現(xiàn)的依據(jù)。(2)缺點:易受練習(xí)和記憶的影響,前后兩次施測間隔的長短必須要適度。(二)復(fù)本信度1、什么是復(fù)本:任何測驗只是所有可能題目中的一份取樣,所以可編制許多平行的等值測 驗,叫做復(fù)本。復(fù)本等值要符合下列條件:(1)各份測驗測量的是同一種心理特性。 ( 2)各份測驗具有相同的內(nèi)容和形式。(3)各份測驗的題目不應(yīng)重復(fù)。 ( 4)各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。(5)各份測驗的分數(shù)分布(平均數(shù)

4、和標準差)大致相等。(6)復(fù)本編好后,應(yīng)再測一次,以確保各份測驗的等值。2、復(fù)本信度定義:兩個復(fù)本施測同一被試群體,求其相關(guān)。(1) 等值性系數(shù):同時連續(xù)施測,反映內(nèi)容變異。形式:復(fù)本A同時一復(fù)本B(2)穩(wěn)定與等值性系數(shù)是對信度最嚴格的檢驗,反映的是“內(nèi)容變異時間變異”的共同作用效果。形式為:復(fù)本 A一適當(dāng)時間一復(fù)本 B3、使用前提條件:構(gòu)造出兩份或兩份以上真正平行的測驗,被試要有條件接受兩個測驗。4、復(fù)本信度的評價( 1 )優(yōu)點:可以在一定程度上避免重測法的缺點( 2 )缺點 只能減少而不能排除練習(xí)和記憶的影響。 第二個測驗只改變了測驗的具體內(nèi)容,已經(jīng)掌握的解題原則容易遷移到同類問題。 對于

5、許多測驗來說,建立復(fù)本十分困難。(三)分半信度1、定義:在測驗沒有復(fù)本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據(jù) 被試在這兩半測驗中所得的分數(shù)計算相關(guān)系數(shù), 即得分半信度。 計算分半信度先要對測驗分 半。不同的分半法可能會得到不同的信度值。 有時為了使兩半基本等值, 可將項目按由易到 難的順序排列編號, 然后按奇數(shù)和偶數(shù)序號將項目分半。 要注意使那些性質(zhì)相同、 聯(lián)系緊密 的項目分在相同的一半,否則會使信度值偏高。2、 校正:分半信度只是半個測驗的信度,須用斯皮爾曼 -布朗公式校正: r xx=2r hh/(1 +r hh) 且 兩半測驗分數(shù)的變異數(shù)相等時才能使用。(四)同質(zhì)性信度

6、(內(nèi)部一致性信度)1、定義:同質(zhì)性指測驗的所有題目測量的是同一種心理特質(zhì),表現(xiàn)為各個題目得分之間有 較高的相關(guān),相關(guān)越高則同質(zhì)性越強。 同質(zhì)性信度也叫內(nèi)部一致性系數(shù),是指測驗內(nèi)部所 有題目間的一致性程度,一個測驗所測內(nèi)容或特質(zhì)的相同程度。2、注意事項:同質(zhì)測驗分數(shù)的意義比較明確,但是,單獨的同質(zhì)性測驗不能預(yù)測一個異質(zhì)的行為或心理特性。 現(xiàn)行的許多心理測驗都是異質(zhì)的, 不過它們多半是由若干個相對同質(zhì)的分測驗或分量表所組成, 每個分測驗或分量表只測量一個方面的特征。這樣, 當(dāng)把分數(shù)組合起來后便可以做出明確的解釋。3、使用范圍:學(xué)績測驗可不考慮同質(zhì)性。同質(zhì)性信度與結(jié)構(gòu)效度密切相關(guān)。4、計算方式:一般

7、采用數(shù)據(jù)統(tǒng)計軟件,克隆巴赫系數(shù)最為常用。(五)評分者信度1、定義評分者信度是指不同評分者之間在測驗結(jié)果計分上的一致性。在心理測驗中 , 評分者信度的計算 , 通常是隨機抽取若干份試卷 , 由至少兩位受過訓(xùn)練的評分者按計分規(guī)則分別判 分, 然后計算它們的相關(guān)。幾個評分者的評分越一致, 評分者信度越高。2、計算方法:最簡單的估計方法就是隨機抽取若干份答卷,由兩個獨立的評分者打分,再 求每份答卷兩個評判分數(shù)的相關(guān)系數(shù)。 這種相關(guān)系數(shù)的計算可以用積差相關(guān)方法, 也可以采 用斯皮爾曼等級相關(guān)方法。 如果評分者在二人以上, 而且又采用等級記分時, 就需要用肯德 爾和諧系數(shù)來求評分者信度。(六)對信度系數(shù)計

8、算的評價1、在一般情況下,間隔施測的復(fù)本信度最低,因為很多因素有機會影響到分數(shù)。2、校正過的分半相關(guān),因為影響的因素少,所得的信度估計為最高。3、穩(wěn)定與等值性系數(shù)是對信度最嚴格的檢驗,反映的是“內(nèi)容變異時間變異”的共同作 用效果。(七)信度的影響因素和提高信度的方法1、影響因素:被試、主試者方面、施測情景方面、測量工具方面、兩次施測得間隔時間;2、提高信度的方法(1)適當(dāng)增加測驗的長度:雖然增加題目可以提高信度,但并非多多益善。增加測驗長度 的效果遵循報酬遞減率, 測驗過長是得不償失的, 有時還會引起被試的疲勞和反感而降低可 靠性, 還要注意一點的是, 只有當(dāng)新題目是與原題目選自同一總體, 即

9、新題目與原題目具有 同質(zhì)性時,增長測驗才能改進信度。(2)使測驗中所有試題的難度接近正態(tài)分布,并控制在中等水平。(3)努力提高測驗試題的區(qū)分度(4)選取恰當(dāng)?shù)谋辉噲F體,提高測驗在各同質(zhì)性較強的亞團體上的信度。5)減少無關(guān)因素的影響。、效度所謂效度,指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。(一)內(nèi)部效度:在研究的自變量和因變量之間存在一定關(guān)系的密切程度。成熟、歷史、被 試選擇偏差、被試缺失、 前測、實驗程序、統(tǒng)計回歸以及多種條件的交互作用都可影響內(nèi)部 效度。(二)外部效度:是指研究結(jié)果能夠一般化和普通化到樣本來自的總體和其他變量條件、時間和背景中的程度,即研究結(jié)果所代表的普遍性和適用

10、性。被試的代表性、操作定義的準確性、研究的反作用、前測對實驗的影響、被試多重處理、實驗者效應(yīng)、研究和實際情境的差異大小、被試與實驗的交互作用會影響外部效度。(三)內(nèi)容效度1定義:一個測驗實際測得的內(nèi)容與所要測得的內(nèi)容之間的吻合程度。主要應(yīng)用于成就測驗、選拔和分類的職業(yè)測驗,但不適用于能力傾向測驗和人格測量。注意要與表面效度相區(qū)分,是指某個外行人對某個測驗表面上看好像是測某種心理特質(zhì)的一種現(xiàn)象,假如這個外行人能夠有效的的測得某種心理特質(zhì)時,該測驗就可以說是有較高的表面效度。一般來講,最高行為測驗往往表面效度高,而其他的測驗則希望表面效度低。2、確定方法:首先要明確預(yù)測內(nèi)容的范圍,其次確定每個題目

11、所測的內(nèi)容,并與測驗編制者所列的雙向細目表進行比對,最后制定評定量表,考察題目是否能夠反映所要測定內(nèi)容。 此外,還可以測量復(fù)本信度,或者采用再測法(前測后測比較)。3、評價(1) 優(yōu)點:不但是評價學(xué)績測驗的最適合的方法,而且編制任何測驗都要加以考慮的方面;(2)缺點:缺乏理想的數(shù)量指標,因而妨礙了信息交流和各測驗間的相互比較。(四)結(jié)構(gòu)效度1、定義:也叫構(gòu)思效度、構(gòu)念效度,旨在以心理學(xué)的理論概念來說明并分析測驗分數(shù)的意義,即從心理學(xué)的理論觀點,就測驗的結(jié)果加以詮釋和探討,亦即根據(jù)心理學(xué)理論上的構(gòu)想來編制測驗的內(nèi)容或選擇試題。2、確定方法:可以通過測驗內(nèi)部尋找證據(jù)法、測驗之間尋找證據(jù)法、考察實證

12、效度法以及多種特質(zhì)一一多種方法矩陣法。測量之間尋找證據(jù)法需要注意聚合效度和區(qū)別效度,所謂聚合效度,是指當(dāng)測量同一構(gòu)念的多重指標彼此間聚合或有關(guān)連時,就有此種效度存在;所謂區(qū)別效度(分歧效度),是與聚合效度相反,此類效度是指當(dāng)一個構(gòu)念的多重指標相聚合或 呼應(yīng)時,則這個構(gòu)念的多重指標也應(yīng)與其相對立之構(gòu)念的測量指標有負向相關(guān)。3、多種特質(zhì)一一多種方法矩陣法:如圖表所示(1)主對角線數(shù)值:同樣方法測相同特質(zhì)所得相關(guān),是信度指標;(2) 虛線三角形之間的兩條對角線的數(shù)值:不同方法測相同特質(zhì)的相關(guān),是效度指標;(3) 實線三角形內(nèi)的數(shù)值:同樣方法測不同特質(zhì)的數(shù)值;(4) 虛線三角形內(nèi)的數(shù)值:不同方法測不同

13、特質(zhì)的數(shù)值。(五) 實證效度 1、定義:也稱效標關(guān)聯(lián)效度,是指一個測驗對處于特定情境中的個體的行為進行估計的有效程度,一個測驗是否有效, 應(yīng)該以實踐的效果來作為檢驗的標準。效標是衡量一個測驗是否有效的外在標準,獨立于測驗并且可以從實踐中直接獲得我們感興趣的行為。因此,作為效標來講,應(yīng)該具有多樣性、復(fù)雜性、特殊性和時間性,一般常用的效標有學(xué)業(yè)成就、等級 評定、臨床診斷、實際工作表現(xiàn)、某個訓(xùn)練成績等。2、實證效度的確定方法(1) 相關(guān)法:求測驗分數(shù)與效標測量間的相關(guān),是最常用的方法;(2) 區(qū)分法一一t檢驗:比較高低分組的差異;(3) 命中率法:分為總命中率和正命中率法,如下表所示先敗(-)戰(zhàn)功(b)跌功(+)3、失誤命申失敗J)“|命用(刀)失諾A、總命中率法:A + B-C + D 二幣B正命中率法:p _ 總一成現(xiàn)人數(shù) cp 蟲十呂選擇人數(shù)(六) 統(tǒng)計結(jié)論效度:是檢驗研究結(jié)果的數(shù)據(jù)分析程序與方法的一種有效性指標。若數(shù)據(jù)的質(zhì)量差、違反統(tǒng)計檢驗的假設(shè)、統(tǒng)計檢驗?zāi)芰Φ停瑒t統(tǒng)計結(jié)論效度就差。(七) 提高效度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論