版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章教育測(cè)量與評(píng)價(jià)
的質(zhì)量特性第一節(jié)教育測(cè)量與評(píng)價(jià)的信度第二節(jié)教育測(cè)量與評(píng)價(jià)的效度第三節(jié)教育測(cè)量與評(píng)價(jià)中項(xiàng)目的難度第三節(jié)教育測(cè)量與評(píng)價(jià)中項(xiàng)目的區(qū)分度第二章教育測(cè)量的質(zhì)量特性衡量教育測(cè)量的質(zhì)量,可采用四個(gè)指標(biāo):信度主要對(duì)整個(gè)測(cè)驗(yàn)而言。效度難度主要對(duì)測(cè)驗(yàn)項(xiàng)目而言。區(qū)分度一、什么是信度——指測(cè)量結(jié)果的穩(wěn)定性或可靠性程度。一般地說(shuō),一個(gè)好的測(cè)量必須具有較高的信度,也就是說(shuō),一個(gè)好的測(cè)量工具,只要遵守操作規(guī)則,其結(jié)果就不應(yīng)隨工具的使用者或使用時(shí)間等方面的變化而發(fā)生較大的變化。第一節(jié)教育測(cè)量與評(píng)價(jià)的信度對(duì)信度的理解①信度指實(shí)測(cè)值(X)和真值(T)相差的程度;②考察信度系數(shù)時(shí),常常采用相關(guān)系數(shù)作為信度指標(biāo),測(cè)驗(yàn)結(jié)果之間的相關(guān)程度越高,信度就越高。采用不同的方式計(jì)算相關(guān)系數(shù),就得到不同類(lèi)型的信度系數(shù)。③心理測(cè)驗(yàn)的信度值在0-1.00之間,當(dāng)信度系數(shù)等于1.00時(shí),表示測(cè)驗(yàn)完全可靠;當(dāng)信度系數(shù)等于0時(shí),則表示測(cè)驗(yàn)根本不可靠。問(wèn)題一個(gè)能力測(cè)驗(yàn)用于人才招聘,經(jīng)檢驗(yàn)它的信度為0.70,如何理解這個(gè)信度系數(shù)的含義。理解:0.70的信度系數(shù)表明,在不同的招聘候選人之間進(jìn)行比較,候選人測(cè)驗(yàn)分?jǐn)?shù)的70%差別是由于個(gè)體之間真實(shí)的能力差異所導(dǎo)致的,而30%差別是由于隨機(jī)誤差所導(dǎo)致。二、信度的種類(lèi)及估計(jì)方法采用不同的方法來(lái)計(jì)算相關(guān)系數(shù),就會(huì)得到不同類(lèi)型的信度指標(biāo):重測(cè)信度、復(fù)本信度、分半信度、同質(zhì)性信度、評(píng)分者信度。五種信度的含義和計(jì)算方法各異,我們?cè)谑褂脮r(shí)要特別注意每一種信度的特定內(nèi)涵和適用范圍。(一)重測(cè)信度——指同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù),一般采用皮爾遜積差相關(guān)的公式來(lái)計(jì)算。施測(cè)再施測(cè)相關(guān)系數(shù)時(shí)間間隔重測(cè)信度的計(jì)算X:第一次測(cè)驗(yàn)的實(shí)得分?jǐn)?shù);Y:第二次測(cè)驗(yàn)的實(shí)得分?jǐn)?shù);N:被試人數(shù)。統(tǒng)計(jì)學(xué)上,我們通常把對(duì)同一組被試實(shí)施的兩次等值測(cè)驗(yàn)的成績(jī)的相關(guān)系數(shù)作為這一測(cè)驗(yàn)的信度。例一用一個(gè)算術(shù)四則的速度測(cè)驗(yàn)12個(gè)小學(xué)生,得分記為X,為了考察測(cè)量結(jié)果的可靠性,于3個(gè)月后再測(cè)一次,得分記為Y,問(wèn)測(cè)驗(yàn)結(jié)果是否可靠?學(xué)生序號(hào)123456789101112X202021222323232425262627Y202121202323252526262729在使用重測(cè)法計(jì)算信度值時(shí),應(yīng)注意以下問(wèn)題:1、信度的取值范圍為[0,1],當(dāng)信度值較大時(shí),說(shuō)明前后兩次測(cè)量結(jié)果比較一致;2、兩次測(cè)驗(yàn)之間的時(shí)間間隔要適宜。應(yīng)由測(cè)驗(yàn)的性質(zhì)、測(cè)題類(lèi)型、測(cè)題數(shù)量和被試特點(diǎn)所決定;3、重測(cè)法適用于速度測(cè)驗(yàn)而不適用于難度測(cè)驗(yàn);4、應(yīng)注意提高被試者的積極性。重測(cè)信度與時(shí)間間隔兩次測(cè)量之間的間隔時(shí)間不同,重測(cè)信度也不同。間隔時(shí)間太短,存在記憶效應(yīng);間隔時(shí)間太長(zhǎng),影響測(cè)量的干擾因素增加。一般而言,時(shí)間間隔越長(zhǎng),信度系數(shù)越低。適宜的間隔時(shí)間因測(cè)驗(yàn)性質(zhì)、被試特點(diǎn)而異。如:對(duì)兒童測(cè)量時(shí)間間隔相對(duì)短一些成人測(cè)量時(shí)間間隔可以長(zhǎng)一些。一般以2周到4周較宜,最好不超過(guò)6個(gè)月。報(bào)告重測(cè)信度時(shí)要明確說(shuō)明兩次測(cè)驗(yàn)之間的時(shí)間間隔,并且,一個(gè)經(jīng)過(guò)良好評(píng)估的測(cè)驗(yàn)應(yīng)當(dāng)具有多個(gè)時(shí)間間隔的重測(cè)信度。(二)復(fù)本信度——指兩個(gè)平等的測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。所謂復(fù)本測(cè)驗(yàn)是指在性質(zhì)、內(nèi)容、題型、題數(shù)、難度等方面都一致(或相等)的兩份或多份測(cè)驗(yàn)。施測(cè)A型施測(cè)B型相關(guān)系數(shù)連續(xù)施測(cè)或間隔施測(cè)例二以A、B兩型英語(yǔ)復(fù)本測(cè)驗(yàn)對(duì)初中三年級(jí)10個(gè)學(xué)生施測(cè),為避免由測(cè)驗(yàn)施測(cè)順序所造成的誤差,其中5個(gè)學(xué)生先做A型測(cè)驗(yàn),休息15分鐘后,再做B型測(cè)驗(yàn);而另5個(gè)學(xué)生先做B型測(cè)驗(yàn),休息15分鐘后,再做A型測(cè)驗(yàn)。10個(gè)學(xué)生A型測(cè)驗(yàn)結(jié)果記為X,B型測(cè)驗(yàn)結(jié)果記為Y,其測(cè)驗(yàn)的復(fù)本信度如何?學(xué)生序號(hào)12345678910X19191817161515141312Y20171818171513151212復(fù)本信度的優(yōu)缺點(diǎn)表現(xiàn):優(yōu)點(diǎn):1、測(cè)驗(yàn)的兩個(gè)復(fù)本,如果在不同的時(shí)間使用,其信度既可以反映在不同時(shí)間的穩(wěn)定性,又可以反映對(duì)于不同測(cè)題的一致性;2、兩個(gè)復(fù)本在同時(shí)使用時(shí),可以避免再測(cè)信息的一些缺點(diǎn),如首測(cè)時(shí)再測(cè)在記憶、練習(xí)、效果的影響,間隔期間獲得新知識(shí)的影響,兩次施測(cè)的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應(yīng)付測(cè)驗(yàn)所作訓(xùn)練的影響等。復(fù)本信度缺點(diǎn):1、編制兩個(gè)完全相等的測(cè)驗(yàn)是很困難的,如果兩個(gè)復(fù)本過(guò)分相似,則變成再測(cè)形式,而過(guò)分不相似,又使等值的條件不存在;2、兩個(gè)復(fù)本測(cè)驗(yàn)有可能在某種程度上測(cè)量了不同的性質(zhì),這就會(huì)低估測(cè)驗(yàn)的信度;3、被試同時(shí)接受性質(zhì)相似的兩個(gè)測(cè)驗(yàn),可能減少完成測(cè)驗(yàn)的積極性;4、雖然兩個(gè)復(fù)本測(cè)驗(yàn)的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類(lèi)旁通,有可能失去復(fù)本的意義。(三)同質(zhì)性信度同質(zhì)性信度
——也稱(chēng)內(nèi)部一致性信度,指測(cè)驗(yàn)內(nèi)部所有題目之間的一致性程度。兩層意思:①測(cè)驗(yàn)所有題目測(cè)的是否為同一種心理特質(zhì);②測(cè)驗(yàn)所有題目得分之間是否具有較高的正相關(guān)?;炯僭O(shè):當(dāng)一個(gè)測(cè)驗(yàn)具有較高的同質(zhì)性信度時(shí),說(shuō)明測(cè)驗(yàn)主要測(cè)的是某一個(gè)單一心理特質(zhì),由于眾多題目測(cè)試了同一心理特質(zhì),那么實(shí)測(cè)結(jié)果就是該特質(zhì)水平的反映。估計(jì)方法分半信度(p49)庫(kù)德-理查遜信度(p50)克龍巴赫系數(shù)(α系數(shù),p52)荷伊特信度(p52)分半信度——將測(cè)驗(yàn)分半,再求被試在每一半測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。首先根據(jù)內(nèi)容、形式、題數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、難度、測(cè)題間相關(guān)以及分布形態(tài)相等的原則,將試題分成兩半,或者將從易到難排列的測(cè)題,按照測(cè)題序號(hào),奇數(shù)測(cè)題為一組,偶數(shù)測(cè)題為一組,分成兩半;然后計(jì)算每個(gè)被試在兩個(gè)分半測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù),再用斯皮爾曼—布朗公式加以校正:p49分半信度只需要一種測(cè)驗(yàn)形式,實(shí)施一次測(cè)驗(yàn),它比重測(cè)信度和復(fù)本信度的操作更簡(jiǎn)便。注意:當(dāng)一個(gè)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半時(shí),不宜使用分半信度。分半信度的計(jì)算方法1、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差相等時(shí),計(jì)算兩個(gè)“半測(cè)驗(yàn)”之間的皮爾遜積差相關(guān)系數(shù),然后用斯皮爾曼-布朗公式校正。rxx=2rhh/(1+rhh)其中rxx是整個(gè)測(cè)驗(yàn)的分半信度,rhh是兩個(gè)半測(cè)驗(yàn)之間的相關(guān)系數(shù)。2、當(dāng)兩個(gè)半測(cè)驗(yàn)分?jǐn)?shù)的方差不相等時(shí),采用弗朗那根公式和盧侖公式。弗朗那根公式:rxx=2[1-(s2a+s2b)/s2x]盧侖公式:rxx=1-s2d/s2x其中:rxx:測(cè)驗(yàn)的分半信度,s2a、s2b:兩半測(cè)驗(yàn)上得分的方差,s2x:整個(gè)測(cè)驗(yàn)上得分的方差,s2d:兩半測(cè)驗(yàn)上得分之差的方差。例三對(duì)初中一年級(jí)學(xué)生進(jìn)行地理成績(jī)測(cè)驗(yàn),每答對(duì)1題得1分,答錯(cuò)1題得0分,其測(cè)驗(yàn)結(jié)果如下表,試估計(jì)該測(cè)驗(yàn)的分半信度?學(xué)生序號(hào)題序12345611000002000100310100041100105100100611101171111018110110901100110111111(四)評(píng)分者信度評(píng)分者信度——指多個(gè)評(píng)分者給同一批被試作答情況評(píng)分的一致性程度。它主要用于主觀性作品的評(píng)價(jià)過(guò)程中,如論述題評(píng)分,作文題評(píng)分、歌唱比賽的評(píng)分,設(shè)計(jì)作品的評(píng)分等。評(píng)分者信度的計(jì)算方法1、當(dāng)評(píng)分者人數(shù)=2時(shí),評(píng)分者信度等于兩者評(píng)分的相關(guān)系數(shù)。2、當(dāng)評(píng)分者人數(shù)大>2時(shí),評(píng)分者信度采用肯德?tīng)柡椭C系數(shù)計(jì)算。(五)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的信度分析1、百分比一致性指標(biāo)(PA,
p54)2、к一致性系數(shù)(p55)3、指數(shù)(p55)總結(jié)和比較1:五種信度的誤差來(lái)源信度種類(lèi)誤差來(lái)源重測(cè)信度復(fù)本信度(同時(shí)測(cè)試)復(fù)本信度(延時(shí)測(cè)試)分半信度Kuder-Richardson和Alpha系數(shù)評(píng)分者信度時(shí)間間隔題目?jī)?nèi)容時(shí)間間隔與題目?jī)?nèi)容題目?jī)?nèi)容題目?jī)?nèi)容與心理行為特質(zhì)的同質(zhì)性評(píng)分者間差異總結(jié)和比較2:
測(cè)試次數(shù)、測(cè)試卷份數(shù)與信度系數(shù)測(cè)試次數(shù)測(cè)試卷份數(shù)1份2份1次分半信度Kuder-Richardson信度Alpha系數(shù)復(fù)本信度(同時(shí)測(cè)試)2次重測(cè)信度復(fù)本信度(延時(shí)測(cè)試)作業(yè)1、用某量表測(cè)驗(yàn)10名學(xué)生,得分記為X,為了考察結(jié)果的可靠性,于15天后用原量表對(duì)這10個(gè)學(xué)生重測(cè)一次,得分記為Y,問(wèn)測(cè)驗(yàn)結(jié)果是否可靠?學(xué)生序號(hào)12345678910X810961075794Y91010610848942、對(duì)10名應(yīng)試者先進(jìn)行某種測(cè)驗(yàn)X,隔適當(dāng)時(shí)間后(半年),再進(jìn)行內(nèi)容、范圍、難度類(lèi)似的第二次測(cè)驗(yàn)Y,試求測(cè)驗(yàn)的復(fù)本信度?應(yīng)試者12345678910X9101061084894Y49794353243、有一個(gè)由100題構(gòu)成的量表施行于10個(gè)高三學(xué)生(分?jǐn)?shù)見(jiàn)下表)。測(cè)驗(yàn)一次后,學(xué)生即畢業(yè)離校,現(xiàn)怎樣評(píng)價(jià)測(cè)驗(yàn)結(jié)果的信度?學(xué)生序號(hào)12345678910奇X38373841403638394035偶Y37373639393438393936信度的作用1、信度是確定測(cè)驗(yàn)工具好壞的指標(biāo)之一。測(cè)驗(yàn)類(lèi)型
信度系數(shù)
低中高學(xué)業(yè)成就測(cè)驗(yàn)0.660.920.98學(xué)術(shù)能力測(cè)驗(yàn)0.560.900.97特殊能力傾向測(cè)驗(yàn)0.260.880.96人格測(cè)驗(yàn)0.460.850.97興趣測(cè)驗(yàn)0.420.840.93態(tài)度測(cè)驗(yàn)0.470.790.98注:表中數(shù)據(jù)來(lái)源,LewisR.Aiken:Psychologicaltestingandassessment(eighthedition),AllynandBacon,Inc,1994.判斷原則:多年的研究結(jié)果,一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)的信度系數(shù)都在0.90以上,有的可以達(dá)0.95;而人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn)的信度一般在0.80—0.85或更高些。R<0.70:測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)或預(yù)測(cè),而且不能作團(tuán)體比較;
0.70≤R<0.85:可用于團(tuán)體比較;
R≥0.85:才能用來(lái)鑒別或預(yù)測(cè)個(gè)人成績(jī)或作為。新編的測(cè)驗(yàn)信度應(yīng)>原有的同類(lèi)測(cè)驗(yàn)或相似測(cè)驗(yàn)。2、信度是測(cè)量過(guò)程中隨機(jī)誤差大小的反映。3、信度可以直接解釋真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)之間的關(guān)系,明確告知測(cè)驗(yàn)誤差的大?。y(cè)量標(biāo)準(zhǔn)誤可作為測(cè)量誤差大小的客觀指標(biāo))4、下結(jié)論說(shuō)某測(cè)驗(yàn)比較可靠,必須依據(jù)情境,并經(jīng)多次證實(shí)。5、信度可以解釋、預(yù)測(cè)個(gè)人分?jǐn)?shù)的意義。三、提高信度的方法(一)影響測(cè)量信度的主要因素1、被試方面2、主試方面3、施測(cè)情境方面4、測(cè)量工具方面5、兩次施測(cè)的間隔時(shí)間方面(二)提高測(cè)量信度的常用方法1、適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度2、測(cè)驗(yàn)的難度要適中3、測(cè)驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì)4、測(cè)驗(yàn)的程序應(yīng)統(tǒng)一5、測(cè)驗(yàn)的時(shí)間要充分6、測(cè)驗(yàn)的評(píng)分要盡量做到客觀化,減少評(píng)分誤差一、什么是效度——指測(cè)量結(jié)果的準(zhǔn)確性和有效性的程度。也可以說(shuō)是測(cè)量是否達(dá)到了預(yù)期的目的。1、效度是一個(gè)相對(duì)的概念。(1)測(cè)量的效度是相對(duì)一定的測(cè)量目的而言的(2)測(cè)量的效度是相對(duì)測(cè)量的結(jié)果而言的2、一種測(cè)量的效度只是高或低的問(wèn)題測(cè)量結(jié)果總是有一定效度的,只是效度高低不同罷了。第二節(jié)教育測(cè)量與評(píng)價(jià)的效度根據(jù)測(cè)量目標(biāo)的不同,對(duì)測(cè)量工具進(jìn)行效度驗(yàn)證的方法主要有三種:內(nèi)容效度(基于所測(cè)內(nèi)容的效度驗(yàn)證方法)結(jié)構(gòu)效度(基于所測(cè)心理結(jié)構(gòu)的效度驗(yàn)證方法)準(zhǔn)則關(guān)聯(lián)效度(基于效標(biāo)關(guān)聯(lián)性的效度驗(yàn)證方法)二、效度的估計(jì)1、什么是內(nèi)容效度——指測(cè)驗(yàn)題目樣本對(duì)應(yīng)測(cè)內(nèi)容及行為領(lǐng)域的代表性程度。如果是教學(xué)情境下的成就測(cè)驗(yàn),那么其內(nèi)容效度就是看測(cè)驗(yàn)題目樣本能體現(xiàn)教學(xué)目標(biāo)與教材要求的程度。例如,教師給學(xué)生做一份語(yǔ)文成就測(cè)驗(yàn),如果該測(cè)驗(yàn)的題目涵蓋了語(yǔ)文教學(xué)所達(dá)到的各項(xiàng)目標(biāo)及教材的重要內(nèi)容,那么我們便說(shuō)該測(cè)驗(yàn)具有較高的內(nèi)容效度。為了使測(cè)驗(yàn)的內(nèi)容具有有效性,成為所欲測(cè)量?jī)?nèi)容的一個(gè)具有代表性的行為樣本,在編制測(cè)驗(yàn)時(shí),就要考慮建立內(nèi)容效度的問(wèn)題。(一)內(nèi)容效度2、內(nèi)容效度的估計(jì)(1)邏輯分析法其工作思路是請(qǐng)有關(guān)專(zhuān)家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的吻合程度作出判斷。以考試內(nèi)容效度分析來(lái)說(shuō),就是依靠專(zhuān)家來(lái)分析一份試卷的所有題目,把所有題目按考試內(nèi)容分布和考查目標(biāo)分布進(jìn)行雙向分類(lèi),形成實(shí)際的“題目雙向分類(lèi)表”;基于這個(gè)“題目雙向分類(lèi)表”的分析,然后由專(zhuān)家對(duì)這次考試(測(cè)量)的內(nèi)容效度的滿(mǎn)意程度作出等級(jí)判斷或評(píng)語(yǔ)描述。這里不妨先提供一份測(cè)驗(yàn)的命題雙向細(xì)目表(參見(jiàn)表3-9,p62),以增加讀者的感性認(rèn)識(shí)。(2)量化分析法(p63)內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn)、學(xué)科測(cè)驗(yàn)、選拔和分類(lèi)職業(yè)測(cè)驗(yàn)。內(nèi)容效度不適合用于能力傾向和人格測(cè)驗(yàn)。(二)結(jié)構(gòu)效度結(jié)構(gòu)(Construct)——是指心理學(xué)或社會(huì)學(xué)上的一種理論構(gòu)想或特質(zhì)。它本身觀察不到、并且也無(wú)法直接測(cè)量到,但學(xué)術(shù)理論假設(shè)它是存在的,以便能夠來(lái)解釋和預(yù)測(cè)個(gè)人或團(tuán)體的行為表現(xiàn)。例如,智力就是心理學(xué)中的一種結(jié)構(gòu)結(jié)構(gòu)效度,指的就是測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上(通常是心理學(xué)或社會(huì)學(xué))所定義的某一心理結(jié)構(gòu)或特質(zhì)的程度。(二)結(jié)構(gòu)效度結(jié)構(gòu)效度——測(cè)驗(yàn)對(duì)于人的心理特性或理論概念測(cè)量到的程度。通常用某種操作來(lái)定義,并用測(cè)驗(yàn)來(lái)測(cè)量。例如:人的創(chuàng)造力可以分解為人的思維流暢性、靈活性和創(chuàng)造性三大特性,并根據(jù)這三大特性編制測(cè)驗(yàn),若有足夠的證據(jù)來(lái)證明該測(cè)驗(yàn)確實(shí)可以測(cè)到這些特性,則認(rèn)為該測(cè)驗(yàn)是個(gè)結(jié)構(gòu)效度較高的創(chuàng)造力測(cè)驗(yàn)。1、結(jié)構(gòu)效度的特點(diǎn)結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論,一旦人們對(duì)同一種心理特質(zhì)有著不同的定義或假設(shè),則會(huì)使得關(guān)于特質(zhì)測(cè)驗(yàn)的結(jié)構(gòu)效度的研究結(jié)果無(wú)法比較。當(dāng)實(shí)際測(cè)量的資料無(wú)法證實(shí)我們的理論假設(shè)時(shí),并不一定就表明該測(cè)驗(yàn)結(jié)構(gòu)效度高。因?yàn)檫€有可能出現(xiàn)理論假設(shè)不成立,或者該實(shí)驗(yàn)設(shè)計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z查等情況,這就使得結(jié)構(gòu)效度的獲取更為困難。2、建立結(jié)構(gòu)效度的步驟A、提出理論假設(shè);B、根據(jù)假定結(jié)構(gòu)擬定測(cè)題,編制測(cè)驗(yàn);C、以測(cè)驗(yàn)結(jié)果為根據(jù)來(lái)驗(yàn)證假設(shè)結(jié)構(gòu)中的各種因素是否成立。3、結(jié)構(gòu)效度的估計(jì)(1)因素分析法其目的是把一些具有錯(cuò)綜復(fù)雜關(guān)系的因素歸結(jié)為數(shù)量較少的幾個(gè)綜合因素或稱(chēng)共同因素,并以此測(cè)驗(yàn)所測(cè)之特質(zhì)對(duì)測(cè)驗(yàn)分?jǐn)?shù)作出解釋。(2)多元特質(zhì)多重方法矩陣法是由肯貝爾和菲斯克1959年提出的最受歡迎的一種結(jié)構(gòu)效度的評(píng)估方法。這種方法的設(shè)想:若采用兩種方法以上的方法去測(cè)量?jī)煞N以上的特質(zhì),那么這些測(cè)量結(jié)果之間可以形成一個(gè)多元特質(zhì)多重方法矩陣。從理論上說(shuō),以不同方法測(cè)量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高;以相同方法測(cè)量不同特質(zhì)的相關(guān)次之;以不同方法測(cè)量特質(zhì)的相關(guān)為最低。與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。(三)效標(biāo)關(guān)聯(lián)效度——是以測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來(lái)表示測(cè)驗(yàn)效度高低的方法。例如:某年全國(guó)高考物理學(xué)科的測(cè)驗(yàn)效度,可用大學(xué)一年級(jí)物理學(xué)科的測(cè)驗(yàn)分?jǐn)?shù)為效標(biāo),然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān),此相關(guān)系數(shù)就是該年高考物理測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度系數(shù)。當(dāng)這個(gè)相關(guān)系數(shù)與總體零相關(guān)有顯著性差異時(shí),相關(guān)系數(shù)的值(正值)越大,效度就越高;相關(guān)系數(shù)的值越小,效度就越低。效標(biāo)不僅隨測(cè)驗(yàn)的種類(lèi)不同而不同,而且可能隨時(shí)間而改變,現(xiàn)在是一個(gè)好的成功的效標(biāo),將來(lái)就不一定是。所以,為某個(gè)測(cè)驗(yàn)選擇一個(gè)最有效的效標(biāo),這是最重要的事情。教育測(cè)驗(yàn)的效標(biāo),可采用各學(xué)科成績(jī)和教師評(píng)定的結(jié)果;智力測(cè)驗(yàn)的效標(biāo),可采用學(xué)科成績(jī)、教師評(píng)判的結(jié)果、學(xué)生總成績(jī)、受教育年限、年齡以及其他事物;能力傾向測(cè)驗(yàn)的效標(biāo),可采用特殊課程或特殊訓(xùn)練的成績(jī);職業(yè)興趣測(cè)驗(yàn)的效標(biāo),可采用從業(yè)人員實(shí)際服務(wù)成績(jī)或記錄;人格測(cè)驗(yàn)的效標(biāo),可采用編制者的主觀標(biāo)準(zhǔn),或以被試以后行為或臨床資料。效標(biāo)關(guān)聯(lián)效度的估計(jì)方法1、相關(guān)法由于測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)這兩個(gè)變量的類(lèi)型不同,二者相關(guān)系數(shù)的計(jì)算方法也就不同。(1)積差相關(guān)法:適用于兩個(gè)變量為連續(xù)變量進(jìn)行顯著性檢驗(yàn):自由度df=N-2,檢驗(yàn)的是兩個(gè)變量,都減去2;置信度取0.05,查相關(guān)系數(shù)界值表,尋找臨界值;結(jié)論:r>臨界值,說(shuō)明顯著相關(guān),效度高;r<臨界值,說(shuō)明無(wú)相關(guān),效度低。例二用一套高中數(shù)學(xué)成就測(cè)驗(yàn)對(duì)某校高一10個(gè)學(xué)生施測(cè),其測(cè)驗(yàn)分?jǐn)?shù)X如下,并以這些學(xué)生的物理學(xué)科考試成績(jī)?yōu)樾?biāo),試估計(jì)高中數(shù)學(xué)成就測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度系數(shù),且檢驗(yàn)數(shù)學(xué)和物理兩成績(jī)變量是否相關(guān)?效度如何?學(xué)生序號(hào)12345678910數(shù)學(xué)X88806860963232646475物理Y94785648703862787082(2)等級(jí)相關(guān)法如找不到效標(biāo)分?jǐn)?shù),可用等級(jí)分?jǐn)?shù)(即排名的次數(shù))來(lái)替代適用于連續(xù)變量數(shù)據(jù)小于30,精確度稍差于積差相關(guān)例三高中一年級(jí)學(xué)生10個(gè)學(xué)生數(shù)學(xué)測(cè)驗(yàn)與物理學(xué)科成績(jī)?nèi)缦卤?,試?jì)算數(shù)學(xué)測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度系數(shù)?學(xué)生序號(hào)12345678910原始分X88806
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建省廈門(mén)市音樂(lè)學(xué)校2024-2025學(xué)年上學(xué)期八年級(jí)數(shù)學(xué)期中考試卷(無(wú)答案)
- 《沁園春長(zhǎng)沙》教案:2024年高考復(fù)習(xí)策略探討
- 古劍奇譚1詞條全攻略
- 2024年工程制圖教案:探索與創(chuàng)新
- 《接觸網(wǎng)施工》課件 1.1.1施工調(diào)查與準(zhǔn)備
- 《驛路梨花》課件應(yīng)用案例
- 第47屆世界技能大賽江蘇省選拔賽糖藝西點(diǎn)制作項(xiàng)目技術(shù)工作文件
- 2023年濟(jì)寧市“技能狀元”職業(yè)技能大賽“金大豐杯”全市鄉(xiāng)土人才技能競(jìng)賽面點(diǎn)(地方特色食品)技術(shù)文件
- 2024年課堂創(chuàng)新:《上學(xué)歌》教案設(shè)計(jì)探討
- 《工程策劃先行》課件
- 2023-2024學(xué)年南京地區(qū)五年級(jí)語(yǔ)文上冊(cè)期中自測(cè)(統(tǒng)編版)
- 船舶系固設(shè)備操作規(guī)程
- 新時(shí)代大中小學(xué)思政課一體化建設(shè)研究
- 工業(yè)自動(dòng)化系統(tǒng)集成項(xiàng)目驗(yàn)收方案
- 新教科版科學(xué)六年級(jí)上冊(cè)全冊(cè)實(shí)驗(yàn)匯總 (超全)
- 王洪圖黃帝內(nèi)經(jīng)80課時(shí)講稿
- 攤鋪機(jī)司機(jī)班組級(jí)安全教育試卷
- 重癥肌無(wú)力指南
- 限制被執(zhí)行人駕駛令申請(qǐng)書(shū)
- 項(xiàng)目主要施工管理人員情況
- 個(gè)人借條電子版模板
評(píng)論
0/150
提交評(píng)論