估計(jì)信度的方法_第1頁
估計(jì)信度的方法_第2頁
估計(jì)信度的方法_第3頁
估計(jì)信度的方法_第4頁
估計(jì)信度的方法_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二節(jié) 估計(jì)信度的方法前面已經(jīng)提出了信度的概念,但只是一個(gè)理論上的構(gòu)想,實(shí)際測(cè)量過程中,無法對(duì)真分?jǐn)?shù)和誤差分?jǐn)?shù)進(jìn)行測(cè)量,在實(shí)際應(yīng)用中,通常以同一樣本得到的兩組資料的相關(guān),作為測(cè)量一致性的指標(biāo)。估計(jì)信度有不同的方法,常用的估計(jì)的方法有再測(cè)信度、復(fù)本信度、等值穩(wěn)定性系數(shù)、內(nèi)部一致性系數(shù)、評(píng)分者信度等。 一、再測(cè)信度(Test-Retest Reliability)再測(cè)信度,也叫重測(cè)信度,也叫穩(wěn)定性系數(shù)。用同一個(gè)測(cè)驗(yàn),對(duì)同一組被試前后施測(cè)兩次,對(duì)兩次測(cè)驗(yàn)分?jǐn)?shù)求相關(guān),其相關(guān)系數(shù)就叫再測(cè)信度。其計(jì)算公式(皮爾遜積差相關(guān)公式的變式)為: (公式56)式中X1、X2為同一被試的兩次測(cè)驗(yàn)分?jǐn)?shù),、為全體被試兩次

2、測(cè)驗(yàn)的平均數(shù),S1、S2為兩次測(cè)驗(yàn)的標(biāo)準(zhǔn)差(樣組標(biāo)準(zhǔn)差,參見金瑜的書P183),N為被試人數(shù)。再測(cè)法的模式是:施測(cè) 適當(dāng)時(shí)距 再施測(cè)例2:假設(shè)有一份主觀幸福感調(diào)查表,先后兩次施測(cè)于10名學(xué)生,時(shí)間間隔為半年,結(jié)果如表所示,求該測(cè)驗(yàn)的重測(cè)信度。(為了便于理解和計(jì)算,本章估計(jì)信度的例子都是小樣組,實(shí)際應(yīng)用時(shí)應(yīng)采用大樣組。)表51 某幸福感調(diào)查表的兩次測(cè)試結(jié)果測(cè)驗(yàn)被試12345678910X116151313111010987X21616141211911867解:用計(jì)算器算出S1=2.82,S23.38,把以上數(shù)據(jù)代入公式56,可得此題可用計(jì)算機(jī)社會(huì)科學(xué)統(tǒng)計(jì)軟件做,求皮爾遜積差相關(guān)。在測(cè)驗(yàn)手冊(cè)上報(bào)

3、告的再測(cè)信度,一般要注明被試樣本的性質(zhì)、大小,以及間隔多長時(shí)間等,以便使使用者了解樣本及時(shí)間因素對(duì)測(cè)驗(yàn)穩(wěn)定性的影響。計(jì)算再測(cè)信度必須注意幾個(gè)問題:(1)所測(cè)量的特性必須是穩(wěn)定的。當(dāng)然絕對(duì)的穩(wěn)定是不可能的,但應(yīng)該是比較穩(wěn)定的。所欲測(cè)的如果是智力、人格、興趣等心理特質(zhì),則可以采用再測(cè)法;如果是知識(shí)、情緒等心理特質(zhì)就不能使用再測(cè)法,因?yàn)檫@些心理特質(zhì)是不穩(wěn)定的。(2)遺忘和練習(xí)的效果基本上相互抵消。在做第一次測(cè)驗(yàn)時(shí),被試可能會(huì)獲得某種技巧,但只要間隔時(shí)間適度,這種練習(xí)的效果會(huì)基本上被遺忘掉。因此,再測(cè)信度要考慮時(shí)間間隔的問題。到底多長合適呢?一般來說,相隔時(shí)間越長,穩(wěn)定系數(shù)越低。最適宜的時(shí)距隨測(cè)驗(yàn)的目

4、的、性質(zhì)及被試的特點(diǎn)而異。對(duì)于年幼兒童,兩次施測(cè)的時(shí)間間隔應(yīng)比年紀(jì)較大的被試短些,這是因?yàn)樵趥€(gè)體發(fā)展的早期變化較快。一般來說,無論對(duì)于那種被試,初測(cè)與再測(cè)的間隔最好不要超過六個(gè)月。另外,還有一種情況,例如,我們可能在間隔許多年后對(duì)被試施測(cè)同一個(gè)智力測(cè)驗(yàn),此時(shí)我們的目的主要是考察智力隨年齡的發(fā)展變化,而不是用來估計(jì)測(cè)驗(yàn)的信度。(3)再測(cè)法適用于速度測(cè)驗(yàn)而不適用于難度測(cè)驗(yàn)。速度測(cè)驗(yàn)題目較多,時(shí)間較緊,被試無法記住測(cè)驗(yàn)內(nèi)容,所以受第一次測(cè)驗(yàn)的影響小,記憶效果可以忽略不計(jì)。(4)應(yīng)注意提高被試者的積極性。由于再測(cè)法是把原測(cè)驗(yàn)原封不動(dòng)地重測(cè)一次,所以被試者容易興趣索然,采取不積極合作的態(tài)度,使第二次測(cè)驗(yàn)

5、的質(zhì)量下降。所以,提高被試者的積極性,使他們?nèi)缤谝淮文菢诱J(rèn)真負(fù)責(zé)地完成測(cè)驗(yàn),這是再測(cè)法計(jì)算信度能夠成功的一個(gè)重要條件。由于測(cè)驗(yàn)的再測(cè)信度受時(shí)間和其它多種因素的影響,故任何一個(gè)測(cè)驗(yàn)就可有不止一個(gè)再測(cè)信度系數(shù)。所以在測(cè)驗(yàn)手冊(cè)中報(bào)告此種信度時(shí)應(yīng)說明時(shí)間間隔以及在此間隔中被試的經(jīng)歷,如有無受過何種教育訓(xùn)練、心理治療以及有何學(xué)習(xí)經(jīng)歷等。二、復(fù)本信度復(fù)本信度(Alternate Form Reliability),也稱等值性系數(shù)(Coefficient of Equivalence)。用兩個(gè)平行(等值)的測(cè)驗(yàn)對(duì)同一組被試施測(cè),得到兩組測(cè)驗(yàn)分?jǐn)?shù),求這兩組測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),這就是復(fù)本信度。因?yàn)檫@反應(yīng)了兩個(gè)

6、測(cè)驗(yàn)的等值程度,因此又稱等值性系數(shù)。計(jì)算方法與再測(cè)法是一樣的。復(fù)本信度的模式是:復(fù)本A 最短時(shí)距 復(fù)本B例3:假設(shè)用A、B兩型創(chuàng)造力復(fù)本測(cè)驗(yàn)對(duì)初中一年級(jí)10個(gè)學(xué)生施測(cè)。結(jié)果見表52。(此題可以讓學(xué)生自己計(jì)算)表52 某創(chuàng)造力復(fù)本測(cè)驗(yàn)測(cè)試結(jié)果測(cè)驗(yàn)被試12345678910X120191918171614131210X22020181615171211139解:先用計(jì)算器計(jì)算得出以下值:,代入公式56,得復(fù)本信度應(yīng)用時(shí)應(yīng)注意以下幾點(diǎn):(1)復(fù)本信度的關(guān)鍵在于兩個(gè)量表必須等值,即必須具有相同的難度、區(qū)分度、長度、題型等。只有達(dá)到這一要求,根據(jù)兩次測(cè)驗(yàn)分?jǐn)?shù)求出的復(fù)本信度才有意義。施測(cè)過程中的條件當(dāng)然應(yīng)

7、該一致。(2)兩次測(cè)驗(yàn)的時(shí)距應(yīng)盡可能短促,以便避免知識(shí)的積累、練習(xí)效應(yīng)等因素的影響。最短的時(shí)距時(shí)在一次測(cè)驗(yàn)中先后用兩個(gè)量表施測(cè)被試。(3)由于量表的兩個(gè)復(fù)份在許多方面近似,所以信度系數(shù)有稍稍偏高的傾向。(4)被試易出現(xiàn)疲勞、失去積極性等反應(yīng),還會(huì)出現(xiàn)遷移(由于第二個(gè)測(cè)驗(yàn)只改變了題目的具體內(nèi)容,已經(jīng)掌握的解題原則很容易遷移到同類問題)。這些稱為順序效應(yīng),為了抵消順序效應(yīng),可隨機(jī)分配一半被試先做復(fù)本A再做復(fù)本,另一半被試先做復(fù)本再做復(fù)本A,以平衡順序效應(yīng)。(5)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。(6)對(duì)于許多測(cè)驗(yàn)來說,建立復(fù)本是相當(dāng)困難的。一般來說,成就測(cè)驗(yàn)、特殊能力測(cè)驗(yàn)容易建立復(fù)本,

8、因?yàn)檩^容易出題,但對(duì)于一些不易測(cè)量的特質(zhì),如人格、動(dòng)機(jī)等,則不易找到等值的測(cè)題,復(fù)本的編制較困難。同再測(cè)信度一樣,在報(bào)告復(fù)本信度時(shí),也應(yīng)說明兩次測(cè)驗(yàn)的時(shí)間間隔,以及在此間隔內(nèi)被試的有關(guān)經(jīng)歷。三、等值穩(wěn)定性系數(shù)等值穩(wěn)定性系數(shù)是用兩個(gè)平行的(等值的)測(cè)驗(yàn),間隔適當(dāng)時(shí)距施測(cè)于同一組被試得到兩組測(cè)驗(yàn)分?jǐn)?shù),求這兩組測(cè)驗(yàn)分?jǐn)?shù)的相關(guān),其相關(guān)系數(shù)就是等值穩(wěn)定性系數(shù)。等值穩(wěn)定性系數(shù)的模式是:測(cè)驗(yàn)A 適當(dāng)時(shí)距 測(cè)驗(yàn)B計(jì)算方法同穩(wěn)定性系數(shù)和等值性系數(shù)。等值穩(wěn)定性系數(shù)也是采用復(fù)本對(duì)被試施測(cè),但等值性系數(shù)的測(cè)驗(yàn)要求兩次測(cè)驗(yàn)的時(shí)間間隔盡可能短,而計(jì)算等值穩(wěn)定性系數(shù)的兩次測(cè)驗(yàn)卻要求有一個(gè)適當(dāng)?shù)臅r(shí)距。時(shí)距的規(guī)定可參照穩(wěn)定性系

9、數(shù)。優(yōu)點(diǎn):(1)因兩次測(cè)試有適當(dāng)?shù)臅r(shí)間間隔,減少了復(fù)本法中的練習(xí)、疲勞效應(yīng)。 (2)只要時(shí)間間隔適當(dāng),可用于計(jì)算穩(wěn)定性不高的心理特質(zhì)的測(cè)驗(yàn)的信度。如,對(duì)學(xué)生所學(xué)知識(shí)的測(cè)驗(yàn),穩(wěn)定性較差,遺忘或通過學(xué)習(xí)知識(shí)的增長。此時(shí),可以盡量縮短時(shí)間間隔,減少這些不穩(wěn)定的效應(yīng)。注意:等值穩(wěn)定性信度系數(shù)的值一般要比等值性系數(shù)和穩(wěn)定性系數(shù)要低。因?yàn)?,時(shí)間因素會(huì)引起我們所要測(cè)量的心理特質(zhì)的變化以及測(cè)題的取樣不同會(huì)影響兩次測(cè)驗(yàn)分?jǐn)?shù)的一致性。因此,等值穩(wěn)定性系數(shù)是測(cè)驗(yàn)信度的最嚴(yán)格的考察,得到的是信度系數(shù)的下限。四、內(nèi)部一致性系數(shù)前面所講的估計(jì)信度的方法,都必須對(duì)被試測(cè)驗(yàn)兩次,然后計(jì)算兩次測(cè)驗(yàn)得分的相關(guān)系數(shù)。但是,有的測(cè)驗(yàn)

10、沒有復(fù)份,如人格測(cè)驗(yàn),等值的測(cè)題很難編,編制復(fù)本很難。有的測(cè)驗(yàn)在施行一次以后,由于被試流動(dòng)或不易召集,再測(cè)一次比較困難。因此,我們還要設(shè)法利用一次測(cè)驗(yàn)所獲得的資料來計(jì)算信度系數(shù)。這樣計(jì)算出來的信度系數(shù)反應(yīng)的是測(cè)驗(yàn)內(nèi)部的一致性,即測(cè)驗(yàn)項(xiàng)目的同質(zhì)性,也就是測(cè)驗(yàn)內(nèi)部所以題目間的一致性,叫做內(nèi)部一致性系數(shù)或同質(zhì)性系數(shù)或同質(zhì)性信度。計(jì)算內(nèi)部一致性系數(shù)的方法有兩種,下面逐一介紹。(一)分半法(分半信度)分半信度(Split-half reliability):分半信度就是將測(cè)驗(yàn)題目分成等值的兩半,分半求出量表題目的總分,再計(jì)算兩部分總分的相關(guān)系數(shù)。分半法實(shí)際上是一種特殊的復(fù)本法??梢园褜?duì)等的兩半測(cè)驗(yàn)看成是

11、在最短的時(shí)間內(nèi)施測(cè)的兩個(gè)平行的測(cè)驗(yàn)。分半的方法很多,常見的方法是把一個(gè)量表按題目番號(hào)分為兩半,一半是奇數(shù)題,另一半數(shù)偶數(shù)題。求出每個(gè)人的奇數(shù)題的總得分和偶數(shù)題的總得分,然后求出奇數(shù)題總得分和偶數(shù)題總得分的相關(guān)系數(shù),最后對(duì)相關(guān)系數(shù)進(jìn)行校正。為什么要進(jìn)行校正呢?因?yàn)?,分半以后,我們?shí)際上計(jì)算的是測(cè)驗(yàn)的一般題目的信度,而非整個(gè)測(cè)驗(yàn)的信度,也就是說我們把一個(gè)完整的測(cè)驗(yàn)分成了兩個(gè)等值的復(fù)本,所計(jì)算的只是其中一個(gè)復(fù)本的信度,這就會(huì)造成對(duì)整個(gè)測(cè)驗(yàn)的信度的低估,因?yàn)樾哦葧?huì)隨著測(cè)驗(yàn)長度的增加而提高。所以,要對(duì)求出的相關(guān)系數(shù)進(jìn)行校正。校正公式有:(1)斯皮爾曼布朗(Spearman-Brown)公式 (公式57)

12、 式中,是兩半測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),為整個(gè)測(cè)驗(yàn)的信度估計(jì)值。 采用斯皮爾曼布朗(Spearman-Brown)公式進(jìn)行校正時(shí),假定兩半測(cè)驗(yàn)等值,亦即兩半測(cè)驗(yàn)具有相同的平均數(shù)和標(biāo)準(zhǔn)差。當(dāng)假定不能滿足時(shí),可以采用下面兩個(gè)公式來估計(jì)信度。弗朗那根公式: (公式58)式中, 分別為兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù),為測(cè)驗(yàn)總分的變異數(shù)。r為信度值。 盧倫公式: (公式59)式中,為兩半測(cè)驗(yàn)分?jǐn)?shù)之差的變異數(shù),為測(cè)驗(yàn)總分的變異數(shù)。r為信度值。 例4:有一個(gè)由100題構(gòu)成的量表施測(cè)于10個(gè)高三學(xué)生。測(cè)驗(yàn)一次后,應(yīng)試者即畢業(yè)離校?,F(xiàn)在怎樣評(píng)介測(cè)驗(yàn)結(jié)果的信度?解:因不能再次測(cè)驗(yàn),只能求分半信度。步驟:(1)計(jì)算出每個(gè)應(yīng)試者的奇

13、數(shù)題總分(X1)和偶數(shù)題總分(X2),見表53。得分被試12345678910X138373841403638394035X237373639393438393936 解: 用計(jì)算器求得(也可以用計(jì)算機(jī)做):,(1)斯皮爾曼布朗(Spearman-Brown)公式(平均數(shù)和標(biāo)準(zhǔn)差差異顯著性檢驗(yàn)略)(rhh可以通過計(jì)算機(jī)計(jì)算得到) (2)弗朗那根公式:(3)盧倫公式: 采用分半信度應(yīng)注意以下幾個(gè)問題:(1)若用分半法時(shí),以按奇數(shù)題和偶數(shù)題分半為宜。若把整個(gè)測(cè)驗(yàn)分成前后兩半,一方面前半部分題目和后半部分題目未必等值,另一方面可能會(huì)因疲勞、厭倦等原因而影響回答質(zhì)量,以致前后反應(yīng)不一致而影響信度。(1

14、)在使用斯皮爾曼布朗公式時(shí)要求全體被試在兩半測(cè)驗(yàn)上的得分的變異數(shù)相等。當(dāng)一個(gè)測(cè)驗(yàn)不宜分成對(duì)等的兩半時(shí)分半信度不宜采用。(2)當(dāng)試卷中存在任選題時(shí),不宜采用分半法。速度測(cè)驗(yàn)也不宜采用分半法。因?yàn)樗俣葴y(cè)驗(yàn)中試題的難度低,被試得分的多少主要是看答題的多少,分半法易使得分相同,從而夸大分半法的信度估計(jì)。(3)如遇到有牽連的項(xiàng)目或一組解決同一問題的項(xiàng)目時(shí),這些項(xiàng)目應(yīng)放在同一半,否則會(huì)高估信度的值。(4)將一個(gè)測(cè)驗(yàn)分成兩半的方法很多(如,按題號(hào)的奇偶性分半、按題目的難度分半、按題目的內(nèi)容分半等),因此,一個(gè)測(cè)驗(yàn)可以有多個(gè)分半信度值。提供分半信度值時(shí),要說明分半的方法。(二)其它計(jì)算內(nèi)部一致性系數(shù)的方法分半

15、法實(shí)際上是對(duì)測(cè)驗(yàn)內(nèi)部一致性的一個(gè)粗略估計(jì)。但對(duì)于同一個(gè)測(cè)驗(yàn)分半的方法是很多的,而且用不同的分半方法求出的分半信度都不一樣,因此分半信度不是最好的內(nèi)部一致性的估計(jì)。為了彌補(bǔ)分半法的不足,可以采用其它的方法。1.庫德理查遜公式(KR20公式)庫德(Kuder)、理查遜(Richardson)針對(duì)分半法的不足,提出以項(xiàng)目統(tǒng)計(jì)量為轉(zhuǎn)移,利用項(xiàng)目統(tǒng)計(jì)量來計(jì)算信度。稱為K-R20公式。 (公式510)式中k表示構(gòu)成測(cè)驗(yàn)的題目數(shù),為通過第i題的人數(shù)比例,為未通過第i題的人數(shù)比例,為測(cè)驗(yàn)總分的變異數(shù)。如果對(duì)測(cè)驗(yàn)的結(jié)果已經(jīng)做了項(xiàng)目分析,已經(jīng)知道了各個(gè)項(xiàng)目的難度,那么采用上述公式計(jì)算信度較為方便。例5:有一種包含

16、6個(gè)問題的測(cè)驗(yàn),10個(gè)應(yīng)試者的得分如表54(答對(duì)得1分,答錯(cuò)得0分),試估計(jì)應(yīng)試者反應(yīng)的一致性程度。被試題目得分123456110000012100100230000112411100035010011361110003711110048111100491101115101111116875544P0.80.70.50.50.40.4q0.20.30.50.50.60.6pq0.160.210.250.250.240.24 解:用計(jì)算器算出下列統(tǒng)計(jì)量(也可以用計(jì)算機(jī)算) , 將這些統(tǒng)計(jì)量代入公式,得 2. 庫德理查遜另一公式(KR21公式)當(dāng)測(cè)驗(yàn)項(xiàng)目難度接近時(shí)可以采用庫德理查遜提出的簡便公式,稱為KR21公式。這一公式以各個(gè)應(yīng)試者總分的平均數(shù)和方差為基礎(chǔ)進(jìn)行計(jì)算,無需提供各題的難度信息,計(jì)算起來較為方便。但必須保證各項(xiàng)目的難度接近,如果難度相差較大,就可能有低估的傾向。KR21公式為: (公式511)式中k表示構(gòu)成測(cè)驗(yàn)的題目數(shù),為測(cè)驗(yàn)總分的平均數(shù),為測(cè)驗(yàn)總分的變異數(shù)。如上例用KR21

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論