第五章-測(cè)量效度(共12頁(yè))_第1頁(yè)
第五章-測(cè)量效度(共12頁(yè))_第2頁(yè)
第五章-測(cè)量效度(共12頁(yè))_第3頁(yè)
第五章-測(cè)量效度(共12頁(yè))_第4頁(yè)
第五章-測(cè)量效度(共12頁(yè))_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上第五章測(cè)量效度第一節(jié)效度概述一、 什么是效度(一)效度的概念效度是指一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)的心理特質(zhì)的程度。例如,一個(gè)小學(xué)生數(shù)學(xué)測(cè)驗(yàn)的成績(jī)?nèi)敉瑫r(shí)受到其數(shù)學(xué)和語(yǔ)文能力的影響(如,有的人看不懂題意等)則認(rèn)為實(shí)際測(cè)到其所要測(cè)的特質(zhì)(數(shù)學(xué)能力)的程度不高,因而它是個(gè)效度不高的數(shù)學(xué)測(cè)驗(yàn)。(二)對(duì)效度概念的理解1、效度是一個(gè)相對(duì)概念。這種相對(duì)性表現(xiàn)在兩個(gè)方面:(1)效度是相對(duì)于一定的測(cè)量目的而言的。因?yàn)樾Ф仁侵笇?shí)測(cè)結(jié)果與所要測(cè)查的特質(zhì)之間的吻合一致性程度,因此,一個(gè)測(cè)驗(yàn)或量表是否有效主要是看它是否達(dá)到了測(cè)量目的。 測(cè)量某一特質(zhì)有效的量表,若用它來(lái)測(cè)量另一種特質(zhì),則必然會(huì)

2、無(wú)效或效度極低。例如,測(cè)量身高很有效的鋼尺若用它來(lái)測(cè)量體重則必定無(wú)效。又如,人的測(cè)量智力很有效的量表若是用來(lái)測(cè)量性格則必定是效度不高的。(2)心理特質(zhì)是較隱蔽的特性,只能通過(guò)他的行為表現(xiàn)來(lái)進(jìn)行推測(cè),因此,心理測(cè)量不可能達(dá)到百分之百的準(zhǔn)確,而只能達(dá)到某種程度上的準(zhǔn)確。不過(guò),由于任何一個(gè)量表的編制都有其目的,所以在正常情況下,一個(gè)量表的效度也不會(huì)為零。例如,一個(gè)數(shù)學(xué)測(cè)驗(yàn),無(wú)論其文字表達(dá)如何艱深,它總能測(cè)到一定的數(shù)學(xué)能力,即總會(huì)有一定的效度,而不會(huì)效度為零。(3)判斷一個(gè)測(cè)量是否有效要從多方面收集證據(jù)。表面上看來(lái),測(cè)量的效度就是實(shí)際測(cè)量的結(jié)果與我們所要測(cè)量的心理特性的吻合一致性程度,獲取效度的辦法也

3、就是拿實(shí)測(cè)結(jié)果與心理特性來(lái)比較。然而,心理特性是我們要測(cè)的東西,是未知的,通常也是比較抽象和隱蔽的。因此,不能把它直接拿來(lái)與結(jié)果比較,而必須先從多種角度把這種特性描述清楚。由于描述心理特性的角度可以是理論上的,也可以是實(shí)踐上的,途徑很多,因此,獲取測(cè)量效度的途徑也是多樣的。例如,智力測(cè)驗(yàn)是否測(cè)得了人的智力,我們就可以從理論上做邏輯分析,也可以從他在工作、學(xué)習(xí)中的實(shí)際表現(xiàn)等許多方面加以證實(shí)。 (4) 效度和信度一樣,也是指一列測(cè)量的特性,也是一個(gè)構(gòu)想概念。在測(cè)量理論中,效度被定義為:在一列測(cè)量中,與測(cè)量目的的有關(guān)真實(shí)變異數(shù)(由所要測(cè)量的變因引起的有效變異)與總變異數(shù)(實(shí)得變異數(shù))的比率,即:效度

4、=這里,代表測(cè)量的效度系數(shù),代表有效變異數(shù),代表總變異數(shù)。一個(gè)測(cè)驗(yàn)的效度表明,在一組測(cè)驗(yàn)分?jǐn)?shù)中,有多大比例的變異是由測(cè)量的變因引起的。 根據(jù)公式=+,可以得到信度與效度的關(guān)系如下(一) 信度高是效度高的必要而非充分條件當(dāng)隨機(jī)誤差的變異()減小時(shí),真實(shí)分?jǐn)?shù)的變異數(shù)增加,測(cè)驗(yàn)信度()隨之提高。信度的提高只給有效變異數(shù)()的增加提供了可能,至于是否能提高效度,還要看系統(tǒng)誤差變異數(shù)()的大小??梢?jiàn),信度高不一定效度就高。但一個(gè)測(cè)驗(yàn)要想效度高,真分?jǐn)?shù)的變異數(shù)必須占較大的比重,即測(cè)驗(yàn)的信度必須高。(二)測(cè)驗(yàn)的效度受它的信度制約根據(jù)效度和信度的定義( =,=)以及公式()可得到:=- <第二

5、節(jié) 效度的估計(jì)方法由于測(cè)量效度是就測(cè)量結(jié)果達(dá)到測(cè)量目的的程度而言的,所以測(cè)量效度的估計(jì)在很大程度上取決于人們對(duì)測(cè)量目的的解釋。目前比較常見(jiàn)的解釋角度有3種:一是用測(cè)量的內(nèi)容來(lái)說(shuō)明目的的;二是用心理學(xué)上某種理論結(jié)構(gòu)來(lái)說(shuō)明目的;三是用實(shí)際實(shí)效來(lái)說(shuō)明目的。于是有了內(nèi)容效度、結(jié)構(gòu)效度和實(shí)證效度之說(shuō)。當(dāng)然,這種分類是相對(duì)的,一個(gè)測(cè)驗(yàn)也許需要同時(shí)考察它在這3個(gè)方面的效度。有專家認(rèn)為,效度估計(jì)就是多方尋找證據(jù)來(lái)證明一個(gè)測(cè)驗(yàn)的有效性程度的過(guò)程。本章著重介紹內(nèi)容效度、結(jié)構(gòu)效度和實(shí)證效度的含義與估計(jì)方法。(一)內(nèi)容效度的含義及應(yīng)用范圍1、內(nèi)容效度的含義內(nèi)容效度是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到的內(nèi)容與所要測(cè)量的內(nèi)容之間的吻合程

6、度。估計(jì)一個(gè)測(cè)驗(yàn)的內(nèi)容效度就是去確定該測(cè)驗(yàn)在多大程度上代表了所要測(cè)量的行為領(lǐng)域。而所要測(cè)量的內(nèi)容或行為領(lǐng)域是依據(jù)測(cè)量目的而定的。比如,在判斷一個(gè)高中物理試卷是否有較高的內(nèi)容效度時(shí),我們必須首先分析考題是否有效地覆蓋了中學(xué)物理所包括的力學(xué)、電學(xué)、光學(xué)、熱學(xué)以及原子物理5個(gè)方面。內(nèi)容效度高的物理測(cè)驗(yàn)應(yīng)當(dāng)是由這5個(gè)方面最有代表性的試題樣本組成的。其次,我們還必須分析題目的難度等指標(biāo)是否較好地反映了考試大綱中對(duì)這5個(gè)方面能力水平的要求,等等。2、內(nèi)容效度的應(yīng)用范圍(1)內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn)。因?yàn)槌删蜏y(cè)驗(yàn)主要是測(cè)量被試掌握某種技能或?qū)W習(xí)某門課程所達(dá)到的程度的。在這種測(cè)驗(yàn)中,題目取樣的代表性問(wèn)題是內(nèi)

7、容效度的主要考察方面。內(nèi)容效度高,則可以把被試在該測(cè)驗(yàn)上的分?jǐn)?shù)推論到他在相應(yīng)的知識(shí)總體上去,說(shuō)他在某個(gè)方面水平處在一個(gè)什么樣的位置。反之,內(nèi)容效度低,則這種推論將是無(wú)效的。(2)內(nèi)容效度也適合于某些用于選拔和分類的職業(yè)測(cè)驗(yàn)。這種測(cè)驗(yàn)所要測(cè)的內(nèi)容就是實(shí)際工作所需要的知識(shí)和技能,編制這種測(cè)驗(yàn)應(yīng)首先對(duì)實(shí)際工作做較細(xì)的分析,否則,題目取樣的代表性就難以令人滿意。3、應(yīng)該注意的幾點(diǎn)(1)內(nèi)容效度不適合用于能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)。(2)在使用內(nèi)容效度時(shí)要避免與表面效度相混淆。表面效度是外行人對(duì)某個(gè)測(cè)驗(yàn)從表面上看好像是測(cè)某種心理特質(zhì)的一種現(xiàn)象。當(dāng)外行人認(rèn)為某個(gè)測(cè)驗(yàn)?zāi)苡行У販y(cè)得某種心理特質(zhì)時(shí),該測(cè)驗(yàn)就被認(rèn)為有

8、較高的表面效度。一般來(lái)說(shuō),最佳行為測(cè)驗(yàn)往往表面效度高,其他測(cè)驗(yàn)則希望表面效度低。(二)內(nèi)容效度的確定方法1、邏輯分析法內(nèi)容效度的確定方法主要是邏輯分析法,其工作思路是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的吻合程度作出判斷。其具體步驟是:(1)明確欲測(cè)內(nèi)容的范圍明確欲測(cè)內(nèi)容的范圍包括知識(shí)范圍和能力要求兩個(gè)方面。這種范圍的確定必須具體、詳細(xì),并要根據(jù)一定目的規(guī)定好各綱目的比例。(2)確定每個(gè)題目所測(cè)的內(nèi)容確定每個(gè)題目所測(cè)的內(nèi)容,并與測(cè)驗(yàn)編制者所列的雙向細(xì)目表(考試藍(lán)圖)對(duì)照,逐題比較自己的分類與制卷者的分類,并做記錄。(3)制訂評(píng)定量表制訂評(píng)定量表,考察題目對(duì)所定義的內(nèi)容范圍的覆蓋率、判斷題目難度與

9、能力要求之間的差異,還要考察各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式對(duì)內(nèi)容的適當(dāng)性等等,對(duì)整個(gè)測(cè)驗(yàn)的有效性作出總的評(píng)價(jià)。2、克龍巴赫的統(tǒng)計(jì)分析方法克龍巴赫還提出過(guò)內(nèi)容效度的統(tǒng)計(jì)分析方法。其具體方法是:從同一個(gè)教學(xué)內(nèi)容總體中抽取出兩套獨(dú)立的平行測(cè)驗(yàn),用這兩個(gè)測(cè)驗(yàn)來(lái)測(cè)同一批被試,求其相關(guān)。若相關(guān)低,則兩個(gè)測(cè)驗(yàn)中至少有一個(gè)缺乏內(nèi)容效度;若相關(guān)高,則測(cè)驗(yàn)可能有較高的內(nèi)容效度(除非兩個(gè)測(cè)驗(yàn)取樣偏向同一個(gè)方面)。3、再測(cè)法再測(cè)法的操作過(guò)程是:在被試學(xué)習(xí)某種知識(shí)之前作一次測(cè)驗(yàn)(如學(xué)習(xí)電學(xué)之前考電學(xué)知識(shí)),在學(xué)過(guò)該知識(shí)后再作同樣的測(cè)驗(yàn)。這時(shí),若后測(cè)成績(jī)顯著優(yōu)于前測(cè)成績(jī),則說(shuō)明所測(cè)內(nèi)容正是被試新近所學(xué)內(nèi)容,進(jìn)而證明

10、該測(cè)驗(yàn)對(duì)這部分內(nèi)容而言具有較高的內(nèi)容效度。二、結(jié)構(gòu)效度(一)結(jié)構(gòu)效度的含義、特點(diǎn)與應(yīng)用范圍1、結(jié)構(gòu)效度的含義結(jié)構(gòu)效度是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到所要測(cè)量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說(shuō)它是指測(cè)驗(yàn)分?jǐn)?shù)能夠說(shuō)明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。這里,構(gòu)想或結(jié)構(gòu)是指心理學(xué)理論所涉及到的抽象而屬假設(shè)性的概念或特質(zhì),如智力、焦慮、外向、動(dòng)機(jī)等等,它們通常用某種操作來(lái)定義,并用測(cè)驗(yàn)來(lái)測(cè)量。2、結(jié)構(gòu)效度的特點(diǎn)(1)結(jié)構(gòu)效度的大小首先取決于事先假定的心理特質(zhì)理論。一旦人們對(duì)同一種心理特質(zhì)有著不同的定義和假設(shè),則會(huì)使得關(guān)于該特質(zhì)測(cè)驗(yàn)的結(jié)構(gòu)效度的研究結(jié)果無(wú)法比較。(2)當(dāng)實(shí)際測(cè)量的資料無(wú)法證實(shí)我們的理論假設(shè)時(shí),并不一定就表

11、明該測(cè)驗(yàn)結(jié)果效度不高,因?yàn)檫€有可能出現(xiàn)理論假設(shè)不成立,或者該實(shí)驗(yàn)設(shè)計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z驗(yàn)等情況。這就使得結(jié)構(gòu)效度的獲取很難。(3)結(jié)構(gòu)效度是通過(guò)測(cè)量什么、不測(cè)量什么的證據(jù)累積起來(lái)給予確定的,因而不可能有單一的數(shù)量指標(biāo)來(lái)描述結(jié)構(gòu)效度。3、結(jié)構(gòu)效度的應(yīng)用范圍與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。(二)結(jié)構(gòu)效度的確定方法1、確立結(jié)構(gòu)效度的步驟(1)提出理論假設(shè),并把這一假設(shè)分解成一些細(xì)小的綱目,以解釋被試在測(cè)驗(yàn)上的表現(xiàn)。(2)依據(jù)理論框架,推演出有關(guān)測(cè)驗(yàn)成績(jī)的假設(shè)。(3)用邏輯的和實(shí)證的方法來(lái)驗(yàn)證假設(shè)。2、結(jié)構(gòu)效度的估計(jì)方法(1)測(cè)驗(yàn)內(nèi)部尋找證據(jù)法。首先,我們可以

12、考察該測(cè)驗(yàn)的內(nèi)容效度,因?yàn)橛行y(cè)驗(yàn)對(duì)所測(cè)內(nèi)容或行為范圍的定義或解釋類似于理論構(gòu)想的解釋,所以,內(nèi)容效度高實(shí)質(zhì)上也說(shuō)明結(jié)構(gòu)效度高。其次,我們可以分析被試的答題過(guò)程。若有證據(jù)表明某一題的作答除了反映著所要測(cè)的特質(zhì)外,還反映著其他因素的影響,則說(shuō)明該題沒(méi)有較好地體現(xiàn)理論構(gòu)想,該題的存在會(huì)降低結(jié)構(gòu)效度。再次,我們足可以通過(guò)計(jì)算測(cè)驗(yàn)的同質(zhì)性信度的方法來(lái)檢測(cè)結(jié)構(gòu)效度。若有證據(jù)表明該測(cè)驗(yàn)不同質(zhì),則可以斷定該測(cè)驗(yàn)結(jié)構(gòu)效度不高。當(dāng)然,測(cè)驗(yàn)同質(zhì)只是結(jié)構(gòu)效度高的必要條件。(2)測(cè)驗(yàn)之間尋找證據(jù)法。首先,我們可以去考察新編測(cè)驗(yàn)與已知的能有效測(cè)量相同特質(zhì)的舊測(cè)驗(yàn)之間的相關(guān)。若二者相關(guān)較高,則說(shuō)明新測(cè)驗(yàn)有較高的效度。這種

13、方法叫相容效度法。其次,我們也可以去考察新編測(cè)驗(yàn)與某個(gè)已知的能有效測(cè)量不同特質(zhì)的舊測(cè)驗(yàn)間的相關(guān)。若二者相關(guān)較高,則說(shuō)明新測(cè)驗(yàn)效度不高,因?yàn)樗矞y(cè)到了其他心理特質(zhì)。需要注意的是,二測(cè)驗(yàn)間相關(guān)不高只是新測(cè)驗(yàn)效度較高的必要條件,并不是充分條件。這種方法也叫區(qū)分效度法。再次,我們還可以通過(guò)因素分析的方法來(lái)了解測(cè)驗(yàn)的結(jié)構(gòu)效度。其原理是:通過(guò)對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,找出影響測(cè)驗(yàn)的共同因素。每個(gè)測(cè)驗(yàn)在共同因素上的負(fù)荷量(即測(cè)驗(yàn)與各因素的相關(guān))就是測(cè)驗(yàn)的因素效度,測(cè)驗(yàn)分?jǐn)?shù)總變異中來(lái)自有關(guān)因素的比例即是該測(cè)驗(yàn)結(jié)構(gòu)效度的指標(biāo)。(3)考察測(cè)驗(yàn)的實(shí)證效度法。如果一個(gè)測(cè)驗(yàn)有實(shí)證效度,則可以拿該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)與種

14、類作為該測(cè)驗(yàn)的結(jié)構(gòu)效度指標(biāo),至少可以從效標(biāo)的性質(zhì)與種類作為該測(cè)驗(yàn)的結(jié)構(gòu)效度指標(biāo)。其做法有兩種:一是根據(jù)效標(biāo)把人分成兩類,考察其得分的差異。例如,一組被公認(rèn)是性格外向的人在測(cè)驗(yàn)中得分較高,另一組被公認(rèn)為是性格內(nèi)向的人在測(cè)驗(yàn)中的得分較低,則什么說(shuō)明該測(cè)驗(yàn)?zāi)軈^(qū)分人的內(nèi)向與外向特征,進(jìn)而說(shuō)明該測(cè)驗(yàn)在測(cè)量的性格內(nèi)外向方法有較高的結(jié)構(gòu)效度。二是根據(jù)測(cè)驗(yàn)得分把分成高分組和低分組,考察這兩組人在所測(cè)特質(zhì)方面是否確有差異。若兩組人在所測(cè)特質(zhì)方面差異顯著,則說(shuō)明高測(cè)驗(yàn)有效,具有較高的結(jié)構(gòu)效度。此外,對(duì)于一些被認(rèn)為是較穩(wěn)定的特質(zhì),若在短期內(nèi)兩次施測(cè)的結(jié)果差異不大,則說(shuō)明該測(cè)驗(yàn)符合理論構(gòu)想。(4)多種特質(zhì)-多種方法矩

15、陣法。該方法實(shí)質(zhì)是相容效度和區(qū)分效度的綜合運(yùn)用,其原理是若用多種極不相同的方法測(cè)量同一種特質(zhì)相關(guān)很高(用極為相似的方法測(cè)量不同特質(zhì)相關(guān)很低),則說(shuō)明測(cè)量效度較高。例如,若有多種特質(zhì)(如A、B、C)都接受了多種方法(如1、2、3)的測(cè)查,就可以分別計(jì)算出任意兩種方法測(cè)量同一特質(zhì)的相關(guān)和測(cè)量不同特質(zhì)的相關(guān),以及任意兩種特質(zhì)接受同一方法和不同方法的相關(guān),并以這些相關(guān)系數(shù)為元素構(gòu)成一個(gè)矩陣,如表5.1所示:表5.1 多特質(zhì)多方法矩陣  Method 1Teacher ratingMethod 2TestsMethod 3Observers rating  A1B

16、1C1A2B2C2A3B3C3M1A1誠(chéng)實(shí)(.89)        B1 攻擊性.43(.89)       C1智力.36.32(.76)      M2A2誠(chéng)實(shí).62.03.20(.93)     B2攻擊性.22.70.13.40(.94)    C2智力.10.13.64.22.30(.84

17、)   M3A3誠(chéng)實(shí).59.11.02.60.20.21(.94)  B3攻擊性.14.82-.16.13.61.23.30(.92) C3智力.21.10.72.06.19.52.49.36(.85) 在上表中,位于主對(duì)角線上的數(shù)值,是用同樣的方法測(cè)相同特質(zhì)所得的相關(guān),是信度指標(biāo);在實(shí)三角形內(nèi)的數(shù)值,是用同樣方法測(cè)不同特質(zhì)所得之相關(guān)。此相關(guān)若高,則說(shuō)明方法間共同點(diǎn)較多;在虛線三角形內(nèi)的數(shù)值,是用不同方法測(cè)量不同特質(zhì)所得的相關(guān),它一般較低,是特質(zhì)與方法間交互影響的反映;在虛線三角形之間的兩條對(duì)角線上的數(shù)值,是用不同方法測(cè)相同

18、特質(zhì)的相關(guān),它是測(cè)驗(yàn)效度的指標(biāo)。  三、實(shí)證效度(一)實(shí)證效度的含義、種類及作用1、實(shí)證效度的含義實(shí)證效度是指一個(gè)測(cè)驗(yàn)對(duì)處于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性。也就是說(shuō),一個(gè)測(cè)驗(yàn)十分有效,應(yīng)該以實(shí)踐的效果來(lái)作為檢驗(yàn)標(biāo)準(zhǔn)。如,當(dāng)我們用機(jī)械能力傾向測(cè)驗(yàn)測(cè)查了一大批機(jī)械工人之后,若有證據(jù)表明測(cè)驗(yàn)高分組的實(shí)際工作成績(jī)確實(shí)優(yōu)于低分組的實(shí)際工作成績(jī),則可以認(rèn)為該測(cè)驗(yàn)具有較高的實(shí)證效度。又如,在軍隊(duì)選拔汽車駕駛兵時(shí),若用測(cè)驗(yàn)選出來(lái)的兵在學(xué)習(xí)駕駛技術(shù),以及日后的駕駛過(guò)程中的表現(xiàn)都大大好于以前未用測(cè)驗(yàn)隨意指派的汽車兵,則表明該測(cè)驗(yàn)也具有較高的實(shí)證效度。被估計(jì)的行為是檢驗(yàn)測(cè)驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱為效標(biāo)。

19、實(shí)證效度主要重視那些與測(cè)驗(yàn)獨(dú)立的效標(biāo)行為,而不太注重測(cè)驗(yàn)內(nèi)容或結(jié)構(gòu)。實(shí)證效度也稱效標(biāo)關(guān)聯(lián)效度。2、實(shí)證效度的種類根據(jù)效標(biāo)資料搜集的時(shí)間差異,實(shí)證效度可以分成同時(shí)效度和預(yù)測(cè)效度兩種。例如,前面提到的機(jī)械能力傾向測(cè)驗(yàn),其效標(biāo)資料是與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)搜集的,所以它是同時(shí)效度。前面提到的汽車兵選拔測(cè)驗(yàn),其效標(biāo)資料是在測(cè)驗(yàn)之后根據(jù)實(shí)際工作成績(jī)來(lái)確定的,所以它叫預(yù)測(cè)效度。3、實(shí)證效度的作用(1)對(duì)于同時(shí)效度來(lái)說(shuō)同時(shí)效度主要用于診斷現(xiàn)狀,在于用更簡(jiǎn)單、更省時(shí)、更廉價(jià)和更有效的測(cè)驗(yàn)分?jǐn)?shù)來(lái)取代不易搜集的效標(biāo)資料。(2)對(duì)于預(yù)測(cè)效度來(lái)說(shuō)預(yù)測(cè)效標(biāo)的作用在于預(yù)測(cè)某個(gè)個(gè)體將來(lái)的行為。無(wú)論是同時(shí)效度還是預(yù)測(cè)效度,其目的都是想

20、通過(guò)對(duì)測(cè)驗(yàn)在一個(gè)有代表性的樣本上,用實(shí)證的方法來(lái)證明測(cè)驗(yàn)有效,于是在今后就可以用簡(jiǎn)便的測(cè)驗(yàn)去預(yù)測(cè)類似樣本的其他團(tuán)體或個(gè)體的行為。因此,有人把這兩種效度都稱作預(yù)測(cè)效度,并把測(cè)驗(yàn)稱作預(yù)測(cè)源。(二)效標(biāo)1、效標(biāo)的含義效標(biāo)就是衡量一個(gè)測(cè)驗(yàn)是否有效的外在標(biāo)準(zhǔn),它是獨(dú)立于測(cè)驗(yàn)并可以從實(shí)踐中直接獲得的我們所感興趣的行為。2、效標(biāo)測(cè)量 通常我們感興趣的行為往往是一個(gè)觀念上的東西(觀念效標(biāo)),它必須用一個(gè)數(shù)字 或等級(jí)來(lái)進(jìn)行表達(dá)(效標(biāo)測(cè)量)。如,大學(xué)入學(xué)考試的觀念效標(biāo)通常是“大學(xué)學(xué)習(xí)成功”,它的一種常用的效標(biāo)測(cè)量便是大學(xué)頭兩年或一年相關(guān)學(xué)科的平均成績(jī)。同一個(gè)觀念效標(biāo)可以有多個(gè)效標(biāo)測(cè)量(多樣性),而且每一種效標(biāo)行為

21、往往都是由多種特質(zhì)構(gòu)成,因此,效標(biāo)測(cè)量是件極為復(fù)雜的事(復(fù)雜性)。又因效標(biāo)測(cè)量有多種多樣,所以有些效標(biāo)測(cè)量只可以反映測(cè)驗(yàn)在某一特殊方面的有效性程度,即,在一種情況下有效的測(cè)量,在另一種情況下未必有效(特殊性和時(shí)間性)。這就要求測(cè)驗(yàn)的編制者和使用者要特別小心。一般說(shuō)來(lái),效標(biāo)測(cè)量要想較好到體現(xiàn)觀念效標(biāo),那效標(biāo)測(cè)量本身就必須是有效的和可靠的,而且還必須客觀、使用。3、常用的效標(biāo)在心理與教育測(cè)量工作中,常用的效標(biāo)主要有:學(xué)業(yè)成就、等級(jí)評(píng)定、臨床診斷、專門的訓(xùn)練成績(jī)、實(shí)際的工作表現(xiàn)、對(duì)團(tuán)體的區(qū)分能力以及其他現(xiàn)成的有效測(cè)驗(yàn)。這些效標(biāo)可以是連續(xù)變量,也可以是離散變量;可以是自然的現(xiàn)成指標(biāo),也可以是人為設(shè)計(jì)的

22、指標(biāo);可以是主觀判斷,也可以是客觀測(cè)量;可以是自我評(píng)定,也可以是他人評(píng)定等等。(三)實(shí)證效度的確定方法1、確定實(shí)證效度的步驟:(1)明確觀念效標(biāo)(2)確定效標(biāo)測(cè)量(3)考察測(cè)量分?jǐn)?shù)與效標(biāo)測(cè)量的關(guān)系2、估計(jì)實(shí)證效度的方法(1)相關(guān)法實(shí)證效度的一種常用估計(jì)方法是計(jì)算測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù)(積差相關(guān)法、等級(jí)相關(guān)法、二列相關(guān)法、四分相關(guān)法等等)。(2)區(qū)分法該方法的思路是,被試接受測(cè)驗(yàn)后,讓他們工作一段時(shí)間,再根據(jù)工作成績(jī)(效標(biāo)測(cè)量)的好壞分成兩組。這時(shí)再回過(guò)頭來(lái)分析這兩組被試原先接受測(cè)驗(yàn)的分?jǐn)?shù)差異,若這兩種人的測(cè)驗(yàn)分?jǐn)?shù)差異顯著,則說(shuō)明該測(cè)驗(yàn)有較高的效度。(3)命中率當(dāng)用測(cè)驗(yàn)作取舍決策時(shí),決策的

23、正命中率和總命中率是測(cè)驗(yàn)有效性的較好指標(biāo)。其中,總命中率是指根據(jù)測(cè)驗(yàn)選出的人當(dāng)中工作合格的人數(shù),以及根據(jù)測(cè)驗(yàn)淘汰的人當(dāng)中工作不合格的人數(shù)之和與總?cè)藬?shù)之比。若總命中率高,則說(shuō)明測(cè)驗(yàn)的效度高。這種測(cè)驗(yàn)在區(qū)別合格者與不合格者方法是有效的。正命中率是指用測(cè)驗(yàn)選出的人中合格者所占的比例。這個(gè)比例越高,測(cè)驗(yàn)越有效。這類測(cè)驗(yàn)只關(guān)心被選中合格者有多少,而不關(guān)心被淘汰者中是否有合格者。這時(shí)測(cè)驗(yàn)的效度應(yīng)該用測(cè)驗(yàn)的正命中率來(lái)評(píng)價(jià)。另外,在評(píng)價(jià)一個(gè)測(cè)驗(yàn)的效度時(shí),還要注意測(cè)驗(yàn)使用的功利率比例,即:使用測(cè)驗(yàn)所帶來(lái)的好處應(yīng)大大高于使用測(cè)驗(yàn)所耗費(fèi)的時(shí)間、精力和經(jīng)費(fèi),還要比較用測(cè)驗(yàn)與不用測(cè)驗(yàn)的效益之差,若差別不大,則沒(méi)有使用測(cè)

24、驗(yàn)的必要。第三節(jié) 提高測(cè)量效度的方法一、影響測(cè)量效度的因素嚴(yán)格說(shuō)來(lái),凡是與測(cè)量目的無(wú)關(guān)的穩(wěn)定的和不穩(wěn)定的變異來(lái)源都會(huì)影響測(cè)量的效度。這就是說(shuō),測(cè)驗(yàn)本身的構(gòu)成、受測(cè)被試的特點(diǎn)、施測(cè)的過(guò)程、閱卷評(píng)分、分?jǐn)?shù)轉(zhuǎn)換與解釋等一切與測(cè)量有關(guān)的環(huán)節(jié)都可能影響測(cè)量的效度。這里就其主要方面做以說(shuō)明。(一)測(cè)驗(yàn)的構(gòu)成當(dāng)組成測(cè)驗(yàn)的試題樣本沒(méi)有較好地代表欲測(cè)內(nèi)容或結(jié)構(gòu)時(shí),測(cè)量的內(nèi)容效度或結(jié)構(gòu)效度就必然會(huì)不高。同時(shí)若題目語(yǔ)義不清、指導(dǎo)語(yǔ)不明、題目太難或太易、題目太少或安排不當(dāng)?shù)鹊?,都?huì)降低測(cè)量效度。一般而言,增加測(cè)驗(yàn)的長(zhǎng)度可以提高測(cè)量信度,進(jìn)而為提高測(cè)量效度提供了可能。于是,一些研究者便得出了測(cè)量長(zhǎng)度與效度的公式如下:(

25、5.2)式中是測(cè)驗(yàn)x增長(zhǎng)至原來(lái)的K倍后,新測(cè)驗(yàn)與效標(biāo)(y)的相關(guān);K為測(cè)驗(yàn)增長(zhǎng)的倍數(shù);原測(cè)驗(yàn)的效度系數(shù);為原測(cè)驗(yàn)的信度系數(shù)。(二)測(cè)驗(yàn)的實(shí)施過(guò)程一個(gè)測(cè)驗(yàn)在實(shí)施過(guò)程中,如不遵從指導(dǎo)語(yǔ)的要求、或出現(xiàn)以外干擾、或評(píng)分計(jì)分出現(xiàn)差錯(cuò)等等,都會(huì)降低測(cè)量效度。(三)接受測(cè)驗(yàn)的被試一般情況下,被試的應(yīng)試動(dòng)機(jī)、情緒、態(tài)度、身體狀態(tài)等等,都會(huì)影響測(cè)量信度,造成較大的隨機(jī)誤差,進(jìn)而影響測(cè)量的效度。 就整個(gè)被試團(tuán)體而言,如果缺乏必要的同質(zhì)性,則很可能會(huì)得到不恰當(dāng)?shù)男Ф荣Y料。有時(shí)候,同樣一個(gè)測(cè)驗(yàn),對(duì)年齡、性別、文化程度、職業(yè)等方面不同的被試團(tuán)體,常常表現(xiàn)出不同的預(yù)測(cè)能力,即具有不同的測(cè)量效度。事實(shí)上,被試團(tuán)體的年齡、性別、文化程度與職業(yè)等方面的特征,常常成為干涉變量。我們?cè)诳疾煨Ф葧r(shí),要特別注意測(cè)驗(yàn)在不同團(tuán)體上的效果,避免出現(xiàn)測(cè)驗(yàn)偏倚(test bias)。(四)所選效標(biāo)的性質(zhì)由于同一個(gè)測(cè)驗(yàn)可以有不同的效標(biāo),同一個(gè)觀念效標(biāo)也可以有不同的效標(biāo)測(cè)量,所以在評(píng)價(jià)測(cè)量效度時(shí),所選效標(biāo)的性質(zhì)是很重要的考慮因素。有的學(xué)者認(rèn)為,智力測(cè)驗(yàn)分?jǐn)?shù)與教師對(duì)學(xué)生等級(jí)評(píng)定之間的效度系數(shù)只要在0.300.50之間就可以了,因?yàn)榻處煹脑u(píng)價(jià)會(huì)受到與智力無(wú)關(guān)的其他因素的影響。與此類似,相同科目的標(biāo)準(zhǔn)化測(cè)驗(yàn)成績(jī)與教師評(píng)價(jià)之間的相關(guān)應(yīng)達(dá)到0.600.70,兩種不同智力測(cè)驗(yàn)或標(biāo)準(zhǔn)化測(cè)驗(yàn)之間的相關(guān)應(yīng)達(dá)到0.600.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論