第四章測(cè)量的信度與效度_第1頁(yè)
第四章測(cè)量的信度與效度_第2頁(yè)
第四章測(cè)量的信度與效度_第3頁(yè)
第四章測(cè)量的信度與效度_第4頁(yè)
第四章測(cè)量的信度與效度_第5頁(yè)
已閱讀5頁(yè),還剩82頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章測(cè)量的信度與效度第一頁(yè),共八十七頁(yè),編輯于2023年,星期五第一節(jié)測(cè)量信度一、什么是信度1.信度的描述定義信度(reliability)是指測(cè)量結(jié)果的穩(wěn)定性和可靠性程度。第二頁(yè),共八十七頁(yè),編輯于2023年,星期五2.信度的測(cè)量學(xué)定義(操作性定義)第三頁(yè),共八十七頁(yè),編輯于2023年,星期五3.誤差方差與信度的關(guān)系第四頁(yè),共八十七頁(yè),編輯于2023年,星期五二、信度的估計(jì)方法(一)重測(cè)信度(test-retestreliability)1.含義與計(jì)算重測(cè)信度是指用同一量表對(duì)同一組被試測(cè)試兩次所得結(jié)果的一致程度,其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。即:第五頁(yè),共八十七頁(yè),編輯于2023年,星期五第六頁(yè),共八十七頁(yè),編輯于2023年,星期五第七頁(yè),共八十七頁(yè),編輯于2023年,星期五2.重測(cè)信度使用的條件(1)所測(cè)量的心理特質(zhì)必須是穩(wěn)定的(2)遺忘和練習(xí)的效果基本上相互抵消(3)在兩次測(cè)試時(shí)間間隔內(nèi),被試在所要測(cè)查的心理特質(zhì)方面沒(méi)有其他的學(xué)習(xí)和練習(xí)第八頁(yè),共八十七頁(yè),編輯于2023年,星期五3.計(jì)算重測(cè)信度應(yīng)注意的問(wèn)題(1)兩次測(cè)驗(yàn)時(shí)間間隔要適當(dāng)(2)應(yīng)提高被試的積極性(3)適宜于人格測(cè)驗(yàn)與速度測(cè)驗(yàn),不適合于智力等難度測(cè)驗(yàn)第九頁(yè),共八十七頁(yè),編輯于2023年,星期五(二)復(fù)本信度(Alternate-formreliability)1.含義與計(jì)算是指兩個(gè)平行測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致程度,其大小等于同一組被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。計(jì)算公式同重測(cè)信度。第十頁(yè),共八十七頁(yè),編輯于2023年,星期五兩個(gè)復(fù)本測(cè)驗(yàn)實(shí)施的時(shí)間不同,復(fù)本信度所表達(dá)的含義略有不同。(1)等值性系數(shù)如果兩個(gè)復(fù)本測(cè)驗(yàn)是同時(shí)連續(xù)測(cè)試的,則稱這種復(fù)本信度為等值性系數(shù)。等值性系數(shù)的大小主要反映著兩個(gè)復(fù)本測(cè)驗(yàn)的題目差別帶來(lái)的變異情況。第十一頁(yè),共八十七頁(yè),編輯于2023年,星期五(2)穩(wěn)定性與等值性系數(shù)如果兩個(gè)復(fù)本測(cè)驗(yàn)是相距一段時(shí)間分兩次測(cè)試,則稱這種復(fù)本信度為穩(wěn)定性與等值性系數(shù)。此時(shí)兩個(gè)題目間的差別、兩次施測(cè)情境、被試特質(zhì)水平等方面的差別都會(huì)成為測(cè)驗(yàn)結(jié)果不一致的原因。第十二頁(yè),共八十七頁(yè),編輯于2023年,星期五2.復(fù)本信度使用的條件(1)兩個(gè)測(cè)驗(yàn)必須在項(xiàng)目的內(nèi)容、形式、數(shù)量、難易、時(shí)限、指導(dǎo)語(yǔ)等方面相同或相似。(2)兩次測(cè)驗(yàn)的時(shí)間間隔要適當(dāng)。局限:(1)復(fù)本法只能減少而不能排除練習(xí)和記憶效應(yīng)。(2)對(duì)于許多測(cè)驗(yàn)來(lái)說(shuō)要建立復(fù)本是非常困難的。第十三頁(yè),共八十七頁(yè),編輯于2023年,星期五(三)分半信度(Split-halfreliability)1.含義與計(jì)算是指將一個(gè)測(cè)驗(yàn)分成對(duì)等的兩半后,所有被試在這兩半上得分的一致性。分半信度信度與等值性系數(shù)的解釋一樣,即可以把對(duì)等的兩半測(cè)驗(yàn)看成是最短時(shí)距內(nèi)施測(cè)的兩個(gè)平行測(cè)驗(yàn)。分半信度描述的是兩半題目間的一致性,所以也叫內(nèi)部一致性系數(shù)。第十四頁(yè),共八十七頁(yè),編輯于2023年,星期五注意題目分半的方法:按題號(hào)奇偶性分半、按題目難度分半、按題目?jī)?nèi)容分半等。計(jì)算方法與復(fù)本信度類似,但被試在兩半測(cè)驗(yàn)上得分的相關(guān)系數(shù)只是半個(gè)測(cè)驗(yàn)的信度,所以必須用斯皮爾曼—布朗公式加以校正:第十五頁(yè),共八十七頁(yè),編輯于2023年,星期五第十六頁(yè),共八十七頁(yè),編輯于2023年,星期五第十七頁(yè),共八十七頁(yè),編輯于2023年,星期五第十八頁(yè),共八十七頁(yè),編輯于2023年,星期五2.使用的前提條件和范圍分半信度通常是在只能施測(cè)一次或沒(méi)有復(fù)本的情況下使用。其中使用斯皮爾曼—布朗公式時(shí)要求全體被試在兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等。當(dāng)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半時(shí),無(wú)法使用。第十九頁(yè),共八十七頁(yè),編輯于2023年,星期五(四)同質(zhì)性信度(Homogeneityreliability)1.含義同質(zhì)性信度也叫內(nèi)部一致性系數(shù),它是測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度。這里的一致性有兩種含義:一是所有題目都測(cè)的是同一種心理特質(zhì),二是所有題目得分之間都具有較高的正相關(guān)。同質(zhì)性信度就是一個(gè)測(cè)驗(yàn)所測(cè)內(nèi)容或特質(zhì)的相同程度。第二十頁(yè),共八十七頁(yè),編輯于2023年,星期五第二十一頁(yè),共八十七頁(yè),編輯于2023年,星期五第二十二頁(yè),共八十七頁(yè),編輯于2023年,星期五第二十三頁(yè),共八十七頁(yè),編輯于2023年,星期五第二十四頁(yè),共八十七頁(yè),編輯于2023年,星期五實(shí)際上α系數(shù)是所有可能分半信度的平均值,但它是測(cè)驗(yàn)信度的一個(gè)下界值,即α系數(shù)值大,測(cè)量信度必然高,但α系數(shù)值小,卻不能判斷測(cè)量信度不高。第二十五頁(yè),共八十七頁(yè),編輯于2023年,星期五例題:某態(tài)度量表共7道題目,100個(gè)被試在各題上得分的方差分別是0.81,0.82,0.80,0.86,0.88,0.79,0.89,測(cè)驗(yàn)總分的方差是26.00,計(jì)算該測(cè)量的信度。第二十六頁(yè),共八十七頁(yè),編輯于2023年,星期五第二十七頁(yè),共八十七頁(yè),編輯于2023年,星期五(五)評(píng)分者信度(Scorerreliability)1.含義與計(jì)算評(píng)分者信度指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致性程度。對(duì)于主觀試題,不同的評(píng)分者給出的分?jǐn)?shù)是不等的,這樣會(huì)造成誤差,如何降低評(píng)分者信度是心理測(cè)量的重要任務(wù)之一。第二十八頁(yè),共八十七頁(yè),編輯于2023年,星期五當(dāng)評(píng)分者人數(shù)為2時(shí),評(píng)分者信度等于兩個(gè)評(píng)分者給同一批被試答卷所給分?jǐn)?shù)的相關(guān)系數(shù)。如果是多個(gè)評(píng)分者,評(píng)分者信度采用肯德?tīng)柡椭C系數(shù)進(jìn)行估計(jì)。第二十九頁(yè),共八十七頁(yè),編輯于2023年,星期五第三十頁(yè),共八十七頁(yè),編輯于2023年,星期五第三十一頁(yè),共八十七頁(yè),編輯于2023年,星期五第三十二頁(yè),共八十七頁(yè),編輯于2023年,星期五第三十三頁(yè),共八十七頁(yè),編輯于2023年,星期五三、信度的作用(一)評(píng)價(jià)測(cè)驗(yàn)信度是測(cè)量過(guò)程中所存在的隨機(jī)誤差大小的反映。信度低,測(cè)量隨機(jī)誤差大,測(cè)量結(jié)果就會(huì)與真分?jǐn)?shù)發(fā)生較大偏離。信度是衡量一個(gè)測(cè)驗(yàn)好壞的重要指標(biāo)之一,測(cè)驗(yàn)的信度達(dá)到多少才可以接受呢?一般來(lái)講,能力與成就測(cè)驗(yàn)的信度應(yīng)該在0.90以上,人格測(cè)量信度系數(shù)應(yīng)該在0.80以上。測(cè)量中的系統(tǒng)誤差與信度無(wú)關(guān)。第三十四頁(yè),共八十七頁(yè),編輯于2023年,星期五(二)解釋分?jǐn)?shù)1.解釋個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的意義從理論上講,一個(gè)人的真分?jǐn)?shù)本來(lái)是用同一測(cè)驗(yàn)對(duì)他反復(fù)施測(cè)所得的平均值,其誤差則是這些實(shí)測(cè)值的標(biāo)準(zhǔn)差。但實(shí)際上,這是做不到的。實(shí)際的做法是用一個(gè)團(tuán)體(人數(shù)足夠多)兩次施測(cè)得結(jié)果來(lái)代替對(duì)同一個(gè)人的反復(fù)施測(cè),以估計(jì)測(cè)量誤差的變異數(shù)。第三十五頁(yè),共八十七頁(yè),編輯于2023年,星期五此時(shí)每個(gè)人兩次測(cè)量的分?jǐn)?shù)之差構(gòu)成一個(gè)新的分布,這個(gè)分布的標(biāo)準(zhǔn)差就是測(cè)量的標(biāo)準(zhǔn)誤,它是此次測(cè)量中誤差大小的客觀指標(biāo),有了這一指標(biāo),就可以對(duì)團(tuán)體中任何一個(gè)人的測(cè)驗(yàn)成績(jī)做出恰當(dāng)?shù)慕忉尅5谌?yè),共八十七頁(yè),編輯于2023年,星期五第三十七頁(yè),共八十七頁(yè),編輯于2023年,星期五2.不同測(cè)驗(yàn)分?jǐn)?shù)的比較第三十八頁(yè),共八十七頁(yè),編輯于2023年,星期五四、影響測(cè)量信度的主要因素測(cè)量信度是測(cè)量過(guò)程中隨機(jī)誤差大小的反映,隨機(jī)誤差大,信度就低,隨機(jī)誤差小,信度就高。因此,在測(cè)量過(guò)程中凡是能引起測(cè)量隨機(jī)誤差的因素都會(huì)影響測(cè)量信度。影響信度的幾種主要因素為:第三十九頁(yè),共八十七頁(yè),編輯于2023年,星期五(一)被試方面就單個(gè)被試而言,其身心健康狀況、應(yīng)試動(dòng)機(jī)、注意水平、作答態(tài)度等會(huì)影響測(cè)量信度。第四十頁(yè),共八十七頁(yè),編輯于2023年,星期五就團(tuán)體而言,團(tuán)體的異質(zhì)程度與分?jǐn)?shù)的分布密切相關(guān),一個(gè)團(tuán)體越是異質(zhì),其分?jǐn)?shù)分布范圍越大,計(jì)算出來(lái)的信度系數(shù)值越高,這樣會(huì)高估真正的信度值。當(dāng)團(tuán)體內(nèi)部水平相差不大(同質(zhì))時(shí),其得分分布必然會(huì)狹窄,以相關(guān)為基礎(chǔ)計(jì)算出來(lái)的信度值必然小,可能會(huì)低估真正的信度值。此外若團(tuán)體的平均數(shù)太高或太低,同樣使測(cè)驗(yàn)的總分分布變窄,低估測(cè)驗(yàn)的真正信度。第四十一頁(yè),共八十七頁(yè),編輯于2023年,星期五(二)主試者方面就主試者而言,若不按指導(dǎo)手冊(cè)中的規(guī)定施測(cè),或故意制造緊張氣氛,或給考生一定的暗示、協(xié)助等,測(cè)量信度會(huì)大大降低。就閱卷評(píng)分者而言,若評(píng)分標(biāo)準(zhǔn)掌握不一,或前后標(biāo)準(zhǔn)不統(tǒng)一,甚至隨心所欲,則也會(huì)降低測(cè)量信度。第四十二頁(yè),共八十七頁(yè),編輯于2023年,星期五(三)施測(cè)情境方面實(shí)施測(cè)驗(yàn)時(shí),環(huán)境是否安靜,光線和通風(fēng)狀況是否良好,所需設(shè)備是否齊全,桌面是否合乎要求等都可能影響到測(cè)量信度。第四十三頁(yè),共八十七頁(yè),編輯于2023年,星期五(四)測(cè)量工具方面測(cè)量的取樣、測(cè)驗(yàn)的長(zhǎng)度、難度等是影響測(cè)量信度的主要因素或關(guān)鍵因素。一般來(lái)說(shuō),測(cè)驗(yàn)越長(zhǎng),信度值越高。這是因?yàn)椋簻y(cè)驗(yàn)加長(zhǎng),能夠改進(jìn)項(xiàng)目取樣的代表性,從而能夠更好地反映受測(cè)者的真實(shí)水平。測(cè)驗(yàn)的項(xiàng)目越多,每個(gè)項(xiàng)目上得隨機(jī)誤差會(huì)相互抵消。測(cè)驗(yàn)太難或太容易,都會(huì)降低測(cè)驗(yàn)的信度。第四十四頁(yè),共八十七頁(yè),編輯于2023年,星期五第四十五頁(yè),共八十七頁(yè),編輯于2023年,星期五(五)兩次施測(cè)之間的時(shí)間間隔計(jì)算重測(cè)信度、穩(wěn)定性與等值性系數(shù)時(shí),兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度值可能會(huì)越大;兩次測(cè)驗(yàn)相隔時(shí)間越長(zhǎng),其信度值可能會(huì)越小。第四十六頁(yè),共八十七頁(yè),編輯于2023年,星期五五、提高測(cè)量信度的常用方法(一)適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度增加新項(xiàng)目必須與原試卷中的所有項(xiàng)目同質(zhì),新增項(xiàng)目必須適度。(二)使測(cè)驗(yàn)中題目的難度接近正態(tài)分布,并控制在中等難度(三)努力提高測(cè)驗(yàn)試題的區(qū)分度(四)選取適當(dāng)?shù)谋辉噲F(tuán)體(五)主試者嚴(yán)格按照要求去做第四十七頁(yè),共八十七頁(yè),編輯于2023年,星期五

第二節(jié)測(cè)量效度一、什么是效度(validity)(一)效度的概念效度是指一個(gè)測(cè)驗(yàn)或量表實(shí)際能測(cè)出其所要測(cè)的心理特質(zhì)的程度?;蛘哒f(shuō)實(shí)測(cè)結(jié)果與所要測(cè)查的結(jié)果的吻合或一致程度。第四十八頁(yè),共八十七頁(yè),編輯于2023年,星期五例如:一個(gè)小學(xué)數(shù)學(xué)測(cè)驗(yàn)的成績(jī)?nèi)敉瑫r(shí)受到數(shù)學(xué)能力和語(yǔ)文能力(讀懂題意的能力)的影響,測(cè)試結(jié)果成績(jī)低,就不能認(rèn)為實(shí)際所要測(cè)的數(shù)學(xué)能力這一心理特質(zhì)水平不高。第四十九頁(yè),共八十七頁(yè),編輯于2023年,星期五關(guān)于效度應(yīng)該注意以下幾個(gè)方面:1.效度是一個(gè)相對(duì)的概念,其相對(duì)性表現(xiàn)在:(1)效度是相對(duì)于測(cè)量目的而言的。一個(gè)測(cè)驗(yàn)或量表是否有效主要看它是否達(dá)到了測(cè)量的目的。(2)心理特質(zhì)是比較隱蔽的特性,心理測(cè)量不可能百分之百的準(zhǔn)確,只能達(dá)到一定的準(zhǔn)確度。2.效度是隨機(jī)誤差和系統(tǒng)誤差的綜合反映。3.判斷一個(gè)測(cè)量是否有效要從多方面收集證據(jù)。第五十頁(yè),共八十七頁(yè),編輯于2023年,星期五

(二)效度的測(cè)量學(xué)定義第五十一頁(yè),共八十七頁(yè),編輯于2023年,星期五第五十二頁(yè),共八十七頁(yè),編輯于2023年,星期五二、效度與信度的關(guān)系第五十三頁(yè),共八十七頁(yè),編輯于2023年,星期五第五十四頁(yè),共八十七頁(yè),編輯于2023年,星期五三、效度的估計(jì)由于測(cè)量效度是就測(cè)量的結(jié)果達(dá)到測(cè)量目的的程度而言的,所以測(cè)量效度在很大程度上取決于人們對(duì)于測(cè)量目的的解釋。效度的種類很多,分類方法也有所不同。目前被廣泛采用的是弗蘭士(J.W.French)和米希爾(B.Michel)提出的分類方法:他們將效度分為內(nèi)容效度、結(jié)構(gòu)效度(構(gòu)想效度)和效標(biāo)效度(實(shí)證效度)。第五十五頁(yè),共八十七頁(yè),編輯于2023年,星期五(一)內(nèi)容效度(contentvalidity)1.內(nèi)容效度的含義及其應(yīng)用的范圍內(nèi)容效度是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到的內(nèi)容與所要測(cè)的內(nèi)容之間的吻合程度。估計(jì)一個(gè)測(cè)驗(yàn)的內(nèi)容效度就是確定該測(cè)驗(yàn)在多大程度上代表了所要測(cè)量的心理特質(zhì)?;蛘哒f(shuō)內(nèi)容效度就是測(cè)驗(yàn)的測(cè)題對(duì)測(cè)驗(yàn)內(nèi)容范圍的代表程度。第五十六頁(yè),共八十七頁(yè),編輯于2023年,星期五一個(gè)測(cè)驗(yàn)要有好的內(nèi)容效度必須滿足以下兩個(gè)條件:(1)確定好測(cè)驗(yàn)內(nèi)容的范圍,并使得測(cè)驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)。(2)確定好行為樣本及其不同行為樣本項(xiàng)目的比例。第五十七頁(yè),共八十七頁(yè),編輯于2023年,星期五2.確定內(nèi)容效度的方法(1)專家判斷的方法內(nèi)容效度的確定方法主要是邏輯分析的方法。其工作思路是請(qǐng)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的吻合程度作出判斷。步驟如下:第五十八頁(yè),共八十七頁(yè),編輯于2023年,星期五①明確測(cè)驗(yàn)?zāi)康募皽y(cè)驗(yàn)內(nèi)容的范圍②確定每個(gè)題目所測(cè)的內(nèi)容,并與測(cè)驗(yàn)編制者所列的雙向細(xì)目表對(duì)照③制訂評(píng)定量表,考察題目對(duì)所定義的內(nèi)容范圍的覆蓋率、判斷題目難度與能力要求之間的差異等。第五十九頁(yè),共八十七頁(yè),編輯于2023年,星期五(2)復(fù)本法(3)重測(cè)法(4)經(jīng)驗(yàn)法第六十頁(yè),共八十七頁(yè),編輯于2023年,星期五3.內(nèi)容效度的應(yīng)用內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn)以及職業(yè)選拔和分類測(cè)驗(yàn)。在這類測(cè)驗(yàn)中,測(cè)驗(yàn)內(nèi)容是實(shí)際工作所需要的知識(shí)和技能。使用內(nèi)容效度要注意與表面效度(surfacevalidity)的區(qū)別。表面效度是指一個(gè)測(cè)驗(yàn)在使用者和被試看來(lái),直覺(jué)地認(rèn)為它在測(cè)量什么,是否測(cè)到了測(cè)驗(yàn)所要測(cè)量的內(nèi)容。表面效度不是效度。第六十一頁(yè),共八十七頁(yè),編輯于2023年,星期五(二)結(jié)構(gòu)效度(constructvalidity)1.結(jié)構(gòu)效度的含義、特點(diǎn)與應(yīng)用范圍結(jié)構(gòu)效度是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到所要測(cè)量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說(shuō)測(cè)驗(yàn)分?jǐn)?shù)能夠說(shuō)明測(cè)量的理論結(jié)構(gòu)和特質(zhì)的程度。結(jié)構(gòu)效度有如下特點(diǎn):

第六十二頁(yè),共八十七頁(yè),編輯于2023年,星期五(1)結(jié)構(gòu)效度首先取決于事先假定的心理特質(zhì)的結(jié)構(gòu)理論(2)當(dāng)實(shí)際測(cè)量的資料無(wú)法證實(shí)事先的理論假設(shè)時(shí),并不一定就表明該測(cè)驗(yàn)結(jié)構(gòu)效度不高。(3)結(jié)構(gòu)效度通過(guò)測(cè)量什么、不測(cè)量什么的證據(jù)積累起來(lái)給以確定的,因而不可能有單一的數(shù)量指標(biāo)來(lái)描述結(jié)構(gòu)效度。結(jié)構(gòu)效度主要應(yīng)用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。第六十三頁(yè),共八十七頁(yè),編輯于2023年,星期五2.結(jié)構(gòu)效度的確定確定結(jié)構(gòu)效度的基本程序第一,對(duì)所研究的心理特質(zhì)的結(jié)構(gòu)進(jìn)行界定第二,依據(jù)理論框架,提出可能的假設(shè)第三,收集數(shù)據(jù),驗(yàn)證假設(shè)第六十四頁(yè),共八十七頁(yè),編輯于2023年,星期五確定結(jié)構(gòu)效度的具體方法(1)測(cè)驗(yàn)內(nèi)法研究測(cè)驗(yàn)的內(nèi)部結(jié)構(gòu),如測(cè)驗(yàn)的內(nèi)容與題目間的相關(guān)來(lái)分析測(cè)驗(yàn)的結(jié)構(gòu)效度。①確定測(cè)驗(yàn)的內(nèi)容效度:對(duì)于“語(yǔ)文能力”的測(cè)驗(yàn),語(yǔ)文能力是對(duì)詞匯下定義、對(duì)語(yǔ)言進(jìn)行類比推理和文章篇句中正確運(yùn)用文字的能力。第六十五頁(yè),共八十七頁(yè),編輯于2023年,星期五②分析被試對(duì)項(xiàng)目反應(yīng)的過(guò)程:觀察被試的操作,詢問(wèn)他們的解題過(guò)程,做必要的數(shù)據(jù)相關(guān)分析。③考察測(cè)驗(yàn)的同質(zhì)性。④因素分析的方法⑤結(jié)構(gòu)方程的方法第六十六頁(yè),共八十七頁(yè),編輯于2023年,星期五(2)測(cè)驗(yàn)間法通過(guò)對(duì)幾個(gè)測(cè)驗(yàn)的比較研究,找出它們所測(cè)的共同特質(zhì),這樣便可以確定這些測(cè)驗(yàn)是否具有結(jié)構(gòu)效度。①相容效度:計(jì)算被試在新舊兩個(gè)同類測(cè)驗(yàn)上的分?jǐn)?shù)的相關(guān)。如果相關(guān)高,則說(shuō)明兩個(gè)測(cè)驗(yàn)測(cè)的是相同的特質(zhì)。②區(qū)分效度:一個(gè)有效的測(cè)驗(yàn)不僅與其它測(cè)量同一構(gòu)想的測(cè)驗(yàn)有比較高的相關(guān),而且還應(yīng)與測(cè)量不同構(gòu)想的測(cè)驗(yàn)具有比較低的相關(guān)。第六十七頁(yè),共八十七頁(yè),編輯于2023年,星期五(3)效標(biāo)關(guān)聯(lián)法(4)實(shí)際操作法第六十八頁(yè),共八十七頁(yè),編輯于2023年,星期五(三)效標(biāo)效度(實(shí)證效度)1.效標(biāo)效度的含義、種類與作用效標(biāo)效度是指一個(gè)測(cè)驗(yàn)對(duì)于特定情境中的個(gè)體的行為進(jìn)行估計(jì)的有效性,即根據(jù)測(cè)驗(yàn)所作出的預(yù)測(cè)能否被實(shí)際的結(jié)果所證實(shí)。第六十九頁(yè),共八十七頁(yè),編輯于2023年,星期五比如學(xué)習(xí)能力測(cè)驗(yàn),如果測(cè)得某些學(xué)生的學(xué)習(xí)能力高,他們實(shí)際的學(xué)習(xí)成績(jī)高,測(cè)得某些學(xué)生的學(xué)習(xí)能力低,實(shí)際的學(xué)習(xí)結(jié)果成績(jī)低。測(cè)量的實(shí)證效度高。這里被估計(jì)或預(yù)測(cè)的行為的實(shí)際結(jié)果是檢驗(yàn)測(cè)驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。

第七十頁(yè),共八十七頁(yè),編輯于2023年,星期五根據(jù)效標(biāo)資料搜集的時(shí)間,效標(biāo)效度可以分為同時(shí)效標(biāo)和預(yù)測(cè)效標(biāo)。效標(biāo)資料與測(cè)驗(yàn)分?jǐn)?shù)是同時(shí)收集的,獲得的效度叫同時(shí)效度;效標(biāo)資料是根據(jù)測(cè)驗(yàn)之后的實(shí)際業(yè)績(jī)定的,獲得的效度叫預(yù)測(cè)效度。同時(shí)效度主要用于診斷現(xiàn)狀,預(yù)測(cè)效度在于預(yù)測(cè)個(gè)體將來(lái)的行為。第七十一頁(yè),共八十七頁(yè),編輯于2023年,星期五2.效標(biāo)與效標(biāo)測(cè)量估計(jì)測(cè)驗(yàn)效標(biāo)效度首要條件是必須具有效標(biāo),什么是效標(biāo)?效標(biāo)就是衡量一個(gè)測(cè)驗(yàn)是否有效的外在標(biāo)準(zhǔn),是我們所要預(yù)測(cè)的行為。第七十二頁(yè),共八十七頁(yè),編輯于2023年,星期五效標(biāo)可以是連續(xù)變量(如分?jǐn)?shù)),也可以是分類變量(如職業(yè));可以是自然的現(xiàn)成的指標(biāo)(如產(chǎn)量、薪水),也可以是人為設(shè)計(jì)的指標(biāo)(如考試測(cè)驗(yàn));可以是主觀評(píng)判,也可以是客觀測(cè)量。歸納起來(lái),常見(jiàn)的效標(biāo)主要有學(xué)業(yè)成就、等級(jí)評(píng)定、臨床診斷、特殊訓(xùn)練的籌集、實(shí)際工作表現(xiàn)和其他測(cè)驗(yàn)成績(jī)。第七十三頁(yè),共八十七頁(yè),編輯于2023年,星期五阿斯?。ˋ.W.Astin)將效標(biāo)分為觀念效標(biāo)和效標(biāo)測(cè)量。觀念效標(biāo)是一個(gè)概念,效標(biāo)測(cè)量是觀念效標(biāo)的量化。如對(duì)于大學(xué)入學(xué)考試這個(gè)測(cè)驗(yàn)來(lái)說(shuō),觀念效標(biāo)是“大學(xué)學(xué)習(xí)成功”,而大學(xué)學(xué)習(xí)成績(jī)是效標(biāo)測(cè)量。第七十四頁(yè),共八十七頁(yè),編輯于2023年,星期五好的效標(biāo)測(cè)量應(yīng)符合以下條件:(1)必須真實(shí)的反映觀念效標(biāo)的重要側(cè)面(2)必須可靠穩(wěn)定(3)必須客觀,不存在偏見(jiàn)(4)在保證有效性的前提下,盡量簡(jiǎn)單省時(shí)、代價(jià)低。第七十五頁(yè),共八十七頁(yè),編輯于2023年,星期五2.效標(biāo)效度的確定方法效標(biāo)效度的確定方法一般有三個(gè)步驟:明確觀念效標(biāo),確定效標(biāo)測(cè)量,考察測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的關(guān)系。效標(biāo)效度的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論