第九章-測驗(yàn)等值(戴海琦-暨南大學(xué)版)_第1頁
第九章-測驗(yàn)等值(戴海琦-暨南大學(xué)版)_第2頁
第九章-測驗(yàn)等值(戴海琦-暨南大學(xué)版)_第3頁
第九章-測驗(yàn)等值(戴海琦-暨南大學(xué)版)_第4頁
第九章-測驗(yàn)等值(戴海琦-暨南大學(xué)版)_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PSYCHOLOGICAL&EDUCATIONAL(第三版)八省師范大學(xué)合編心理學(xué)主干課程系列教材李金德主講廣西大學(xué)行建文理學(xué)院MEASUREMENT心理與教育測量第九章測驗(yàn)等值本章提要測驗(yàn)等值的實(shí)質(zhì)測驗(yàn)等值的條件測驗(yàn)等值的基本計(jì)算方法常用等值設(shè)計(jì)測驗(yàn)等值誤差及估計(jì)第一節(jié)測驗(yàn)等值概述一、測驗(yàn)等值來源于測量實(shí)踐的需要二、測驗(yàn)等值的實(shí)質(zhì)三、測驗(yàn)等值的條件四、測驗(yàn)等值的一些基本概念五、測驗(yàn)等值結(jié)果的表示方法一、測驗(yàn)等值來源于測驗(yàn)實(shí)踐的需要在我國考試實(shí)踐中,有許多大規(guī)模的考試需要進(jìn)行測驗(yàn)等值。例如,高等教育自學(xué)考試各專業(yè)的各門課程的考試,通常是在同一課程考試大綱下,每年重復(fù)測試所謂的平行試卷,人們有理由提出這樣的問題:某門課程今年考生所得的60分是否與去年同一課程考生所得的60分等值?因?yàn)橹挥性谒鼈兊戎档那闆r下,考試對這兩年參加同一門課程測驗(yàn)的考生才是公平的。第一節(jié)測驗(yàn)等值概述測驗(yàn)等值:將不同測驗(yàn)(考察同一特質(zhì))上的分?jǐn)?shù)(特質(zhì)水平值)和項(xiàng)目(試題)參數(shù)做出單位系統(tǒng)轉(zhuǎn)換,從而使之能相互比較的過程,叫做二、測驗(yàn)等值的實(shí)質(zhì)從本質(zhì)上說,測驗(yàn)等值就是通過對考核同一種心理品質(zhì)的多個(gè)測驗(yàn)形式作出測量分?jǐn)?shù)系統(tǒng)的轉(zhuǎn)換,進(jìn)而使得這些不同測驗(yàn)形式的測驗(yàn)分?jǐn)?shù)之間具有可比性。ABC8285801.測驗(yàn)等值中所說的測量分?jǐn)?shù)系統(tǒng)的轉(zhuǎn)換與測驗(yàn)原始分?jǐn)?shù)及導(dǎo)出分?jǐn)?shù)之間的轉(zhuǎn)換是不相同的。2.尋找測驗(yàn)等值關(guān)系與尋找兩測驗(yàn)之間預(yù)測關(guān)系也是不相同的。

三、測驗(yàn)等值的條件1.同質(zhì)性要求等值的兩個(gè)測驗(yàn)必須是測量同一心理特質(zhì)的。很難想象可以把數(shù)學(xué)測驗(yàn)的分?jǐn)?shù)等值轉(zhuǎn)換成語文測驗(yàn)的分?jǐn)?shù),但數(shù)學(xué)測驗(yàn)分?jǐn)?shù)卻可能等值轉(zhuǎn)換成另一次內(nèi)容難度近似的數(shù)學(xué)測驗(yàn)分?jǐn)?shù)。2.等信度3.公平性4.對稱性5.樣本不變性等值測驗(yàn)是兩個(gè)或多個(gè)測驗(yàn)之間客觀存在的實(shí)際關(guān)系。6.可遞推性如果f(x)=y,g(y)=z,那么h(x)=g[f(x)]=z四、測驗(yàn)等值的一些基本概念(一)成對出現(xiàn)的概念1.經(jīng)典測驗(yàn)理論與項(xiàng)目反應(yīng)理論等值經(jīng)典測驗(yàn)理論(CTT)、項(xiàng)目反應(yīng)理論(IRT)、概化理論(GT)。區(qū)別在于等值時(shí)以何種測驗(yàn)理論為指導(dǎo)。經(jīng)典測驗(yàn)理論(CTT)的缺陷:嚴(yán)重依賴樣本;兩測驗(yàn)被試分?jǐn)?shù)分布大體相同。2.測驗(yàn)分?jǐn)?shù)等值與項(xiàng)目參數(shù)等值根據(jù)測驗(yàn)等值的直接操作對象不同而構(gòu)成的一對概念。3.水平等值與垂直等值根據(jù)測驗(yàn)試卷的難度和被試能力分布是否有差異而區(qū)分的一對概念。進(jìn)行垂直等值化的原因:舉例:一套成就測驗(yàn)由不同水平的幾個(gè)測驗(yàn)構(gòu)成,每一水平適應(yīng)于某一年級范圍的學(xué)生。例如該測驗(yàn)的水平1正好適合二年級初的學(xué)生,水平2正好適合二年級末的學(xué)生。然而,對那些在二年級進(jìn)步較慢的學(xué)生而言,水平2可能太難而無法得到準(zhǔn)確的測驗(yàn)結(jié)果。一種可能的解決辦法就是對這些學(xué)生施測水平1。為了解釋這些學(xué)生的測驗(yàn)成績,就有必要知道這兩種水平的等值分?jǐn)?shù)。這個(gè)過程被稱為垂直等值化。五、測驗(yàn)等值中的一些專用技術(shù)名詞1.測驗(yàn)等值設(shè)計(jì)定義:為了尋找不同測驗(yàn)形式之間的等值關(guān)系而預(yù)先對數(shù)據(jù)的采集方法、等值實(shí)現(xiàn)的途徑、等值的計(jì)算方法進(jìn)行周密的設(shè)計(jì),稱為測驗(yàn)等值設(shè)計(jì)。等值設(shè)計(jì)的最主要原則是要使得所采集的數(shù)據(jù)能最有效提供不同測驗(yàn)形式的差異信息。2.錨測驗(yàn)定義:在測驗(yàn)等值設(shè)計(jì)中,有時(shí)會采用一組測驗(yàn)試題來關(guān)聯(lián)兩個(gè)待等值的測驗(yàn)形式,以便尋找兩形式的等值關(guān)系,這些測驗(yàn)試題被稱作為錨測驗(yàn)。要求:同質(zhì)性;等信度;長度不小于原測驗(yàn)的1/5。3.數(shù)據(jù)平滑法比較實(shí)用的兩種數(shù)據(jù)平滑法:一種叫對數(shù)線性平滑法一種叫β二項(xiàng)式平滑模式等值完成之后必須對等值結(jié)果進(jìn)行評價(jià)。評價(jià)的目標(biāo)是所估等值關(guān)系的可靠性與準(zhǔn)確性,其指標(biāo)是等值關(guān)系中所包含的等值誤差的大小。關(guān)于等值標(biāo)準(zhǔn)誤差、等值偏差:(1)理解的時(shí)候可以從隨機(jī)等值誤差(等值標(biāo)準(zhǔn)誤差)和系統(tǒng)等值誤差(等值偏差)的角度來理解。(2)注意:以上主要是在CTT的范圍內(nèi)對測驗(yàn)分?jǐn)?shù)等值所作的探討。4.等值標(biāo)準(zhǔn)誤差測量學(xué)把由抽樣而引起的等值誤差稱作等值標(biāo)準(zhǔn)誤差。像測驗(yàn)誤差不可避免一樣,等值誤差也是不可避免的。

等值標(biāo)準(zhǔn)誤差的操作定義:應(yīng)用樣本數(shù)據(jù)估計(jì)測驗(yàn)形式X與Y的等值關(guān)系時(shí),如果反復(fù)抽取等容量的樣本,可以求得許多個(gè)X與Y的等值關(guān)系,對于X的一個(gè)固定值X0,會有若干個(gè)不等的Y0與之對應(yīng),這若干個(gè)Y0的標(biāo)準(zhǔn)差就是對應(yīng)于X=X0的等值標(biāo)準(zhǔn)誤差。從這里可以看出等值標(biāo)準(zhǔn)誤差的大小是會隨著被等值的具體分?jǐn)?shù)而變化的。

從總的趨勢來說,隨機(jī)等值誤差的大小是會隨著樣本容量的增大而減小的??刂妻k法:數(shù)據(jù)平滑法測驗(yàn)等值誤差是一個(gè)變量,隨等值分?jǐn)?shù)的大小而變,其總趨勢是等值分?jǐn)?shù)越趨于分布的兩端,等值的標(biāo)準(zhǔn)誤差越大。5.等值偏差在等值測驗(yàn)中除了抽樣引起等值誤差之外,等值處理方法不當(dāng)也會引起等值誤差,測量學(xué)上把這種等值誤差稱為偏差。系統(tǒng)等值誤差在等值設(shè)計(jì)和等值關(guān)系估計(jì)過程中,必須作出若干假設(shè),具備若干等值條件,如果這些假設(shè)被違背或者條件不能被充分滿足,都會產(chǎn)生系統(tǒng)誤差。例如,設(shè)計(jì)一中的假設(shè)不能滿足的情況等值的系統(tǒng)誤差與隨機(jī)誤差不同,系統(tǒng)誤差難以量化、難以發(fā)現(xiàn),系統(tǒng)誤差的大小也不隨樣本容量的增大而變小。形成等值系統(tǒng)誤差的可能原因有四種:(1)當(dāng)應(yīng)用等值方法的統(tǒng)計(jì)假設(shè)不滿足時(shí),所估等值關(guān)系中就會出現(xiàn)系統(tǒng)誤差。(2)當(dāng)為估計(jì)等值關(guān)系所設(shè)計(jì)的數(shù)據(jù)采集規(guī)則未被嚴(yán)格遵循,所估等值關(guān)系中也會出現(xiàn)系統(tǒng)誤差。(3)估計(jì)等值關(guān)系時(shí)所用的被試組與實(shí)際使用這兩測驗(yàn)的被試組有實(shí)質(zhì)性的差異,此時(shí)將所估等值關(guān)系應(yīng)用于實(shí)測群體,系統(tǒng)誤差也就產(chǎn)生了。(4)某些等值數(shù)據(jù)處理技術(shù)的使用也可能引進(jìn)系統(tǒng)誤差。六、測驗(yàn)等值結(jié)果的表示方法1.表列法應(yīng)用最普遍的等值結(jié)果表示方法2.公式法常見的等值結(jié)果公式形式y(tǒng)=Ax+B式中x與y處于平等地位3.圖示法形象生動但精確度有限七、測驗(yàn)等值的工作過程大致包括:(1)確定等值目標(biāo)。(2)進(jìn)行等值設(shè)計(jì)。(3)施測并采集測驗(yàn)數(shù)據(jù)。(4)選擇一個(gè)等值的操作定義。(5)進(jìn)行等值計(jì)算,獲取結(jié)果。(6)評價(jià)等值結(jié)果。對可靠性和準(zhǔn)確性進(jìn)行論證。一、等百分位等值在單組設(shè)計(jì)或隨機(jī)等組設(shè)計(jì)下的兩個(gè)分?jǐn)?shù),一個(gè)在測驗(yàn)形式x上,另一個(gè)在測驗(yàn)形式y(tǒng)上,如果這兩個(gè)分?jǐn)?shù)有相同的百分等級,那么這兩個(gè)分?jǐn)?shù)就被認(rèn)為是等值的。按照這個(gè)原理,尋找與x

分?jǐn)?shù)等值的y

分?jǐn)?shù),只要找到與x

分?jǐn)?shù)有相等百分等級的y分?jǐn)?shù)就可以。

對于測驗(yàn)x的每個(gè)一分?jǐn)?shù),可根據(jù)公式在x測驗(yàn)分布中先求出與其對應(yīng)的百分等級,然后在y測驗(yàn)上求取具有該百分等級的分?jǐn)?shù)。即在兩個(gè)測驗(yàn)上就有相同百分等級的分?jǐn)?shù)就是等值分?jǐn)?shù)。第二節(jié)測驗(yàn)等值計(jì)算的基本方法一、等百分位等值百分等級計(jì)算公式為:根據(jù)百分等級計(jì)算測驗(yàn)分?jǐn)?shù)公式為:一、等百分位等值優(yōu)點(diǎn):定義直觀,也容易理解缺點(diǎn):(1)分?jǐn)?shù)等值轉(zhuǎn)換關(guān)系的求得依賴于所選用的樣本,當(dāng)抽取的樣本改變之后,具體的等值關(guān)系就會發(fā)生變化,因此樣本不變性要求沒有得到滿足;(2)百分位等值法通常要使用平滑化處理方法,這無疑增大了等值的誤差。

二、線形等值

在單組設(shè)計(jì)或隨機(jī)等組設(shè)計(jì)下的兩個(gè)分?jǐn)?shù),一個(gè)在測驗(yàn)形式x上,另一個(gè)在測驗(yàn)形式y(tǒng)上,如果它們的標(biāo)準(zhǔn)分?jǐn)?shù)相等,這兩個(gè)分?jǐn)?shù)就被認(rèn)為是等值的。

用數(shù)學(xué)公式表示,所謂測驗(yàn)分?jǐn)?shù)x等值于測驗(yàn)分?jǐn)?shù)y,即有下式成立:改寫為:改寫為:第三節(jié)常用測驗(yàn)等值設(shè)計(jì)介紹測驗(yàn)等值設(shè)計(jì)定義:為了尋找不同測驗(yàn)形式之間的等值關(guān)系而預(yù)先對數(shù)據(jù)的采集方法、等值實(shí)現(xiàn)的途徑、等值的計(jì)算方法進(jìn)行周密的設(shè)計(jì),稱為測驗(yàn)等值設(shè)計(jì)。第三節(jié)常用測驗(yàn)等值設(shè)計(jì)介紹回顧線形等值與等百分位等值的原理:等百分位等值依據(jù)的原理:兩個(gè)分?jǐn)?shù),一個(gè)在測驗(yàn)形式X上,另一個(gè)在測驗(yàn)形式Y(jié)上,如果這兩個(gè)分?jǐn)?shù)對于任何一個(gè)被試群體都有相同的百分等級,那么這兩個(gè)分?jǐn)?shù)就被認(rèn)為是等值的。線性等值所依據(jù)的原理:兩個(gè)分?jǐn)?shù),一個(gè)在測驗(yàn)形式X上,而另一個(gè)在測驗(yàn)形式Y(jié)上,如果對于任何一個(gè)被試群體,它們各自的標(biāo)準(zhǔn)分?jǐn)?shù)相等,這兩個(gè)分?jǐn)?shù)就被認(rèn)為是等值的。設(shè)計(jì)一隨機(jī)分組——每組實(shí)施一個(gè)測驗(yàn)這種數(shù)據(jù)采集設(shè)計(jì)有一個(gè)假設(shè),即兩被試樣本的總體分布是相同的。由于抽樣結(jié)果來自于同一總體,因此,不考慮其間的抽樣誤差,這一假設(shè)是很容易得到滿足的。一、隨機(jī)等組設(shè)計(jì)樣本測驗(yàn)XY

α√

β√1.線形等值法Y=Ax+BA=Syβ/SxαB=Myβ-AMxα注意:等值關(guān)系直線絕不是線性回歸直線,線性回歸直線中,直線的斜率還必須乘上兩變量的相關(guān)系數(shù)。另外,等值關(guān)系關(guān)于x和y是對稱的,而回歸關(guān)系中x和y是不對稱的,因此,回歸關(guān)系不是等值關(guān)系。2.等百分位等值法X→PR→YPR={Fb+[(x-Lb)f/i]}/N×100

y=Lb+(PR/100×N-Fb)/f×i設(shè)計(jì)一隨機(jī)分組——每組實(shí)施一個(gè)測驗(yàn)二、平衡單組設(shè)計(jì)樣本測驗(yàn)XY前后前后

α√√

β√√設(shè)計(jì)二隨機(jī)分組——各測驗(yàn)對每組都實(shí)施設(shè)計(jì)二隨機(jī)分組——各測驗(yàn)對每組都實(shí)施采用這種設(shè)計(jì)的目的是要防止兩個(gè)測驗(yàn)形式施測順序的改變可能引起的等值差異。采用這種設(shè)計(jì)的優(yōu)點(diǎn)是,如果測驗(yàn)順序?qū)Φ戎到Y(jié)果沒有影響,就可以只用一個(gè)樣本完成測驗(yàn)等值,使得一些被試難尋的測驗(yàn)有可能在較大樣本下完成測驗(yàn)的等值。無法克服練習(xí)效應(yīng)和測驗(yàn)時(shí)間太長的缺點(diǎn)。(1)線形等值法(2)等百分位等值法三、錨測驗(yàn)—隨機(jī)等組設(shè)計(jì)樣本測驗(yàn)XVY

α√√

β√√設(shè)計(jì)三隨機(jī)分組——每組各實(shí)施一個(gè)測驗(yàn),

錨測驗(yàn)向每組實(shí)施設(shè)計(jì)三隨機(jī)分組——每組各實(shí)施一個(gè)測驗(yàn),

錨測驗(yàn)向每組實(shí)施數(shù)據(jù)采集時(shí),錨測驗(yàn)既用于第一組被試,又用于第二組被試。雖然兩組被試總體分布不同,由于施用了一組共同試題,兩被試組能力的差異就可以被定量描寫,進(jìn)而可以排除被試組的能力差異而將兩待等值的測驗(yàn)形式的等值關(guān)系估計(jì)出來。要求錨測驗(yàn)必須是兩待等值測驗(yàn)的縮影,由錨測驗(yàn)作為橋梁,把測驗(yàn)X和Y連接起來,缺點(diǎn)是錨測驗(yàn)作為其縮影實(shí)際上是難以做到的。錨測驗(yàn)與待等值測驗(yàn)不論難度上的差異還是內(nèi)容上的差異都會對等值結(jié)果帶來誤差,尤其是難度上的影響較大。四、錨測驗(yàn)—非等組設(shè)計(jì)樣本測驗(yàn)XVY

α√√

β√√設(shè)計(jì)四非隨機(jī)分組——每組各實(shí)施一個(gè)測驗(yàn),錨測驗(yàn)向每組實(shí)施應(yīng)用背景:在實(shí)際工作中還會出現(xiàn)這樣的情況:既不可能采集一個(gè)樣本讓被試施測兩個(gè)不同形式的測驗(yàn),又不可能獲得兩個(gè)總分分布相同的樣本來分別接受兩個(gè)測驗(yàn)的施測。

例子:兩個(gè)年度的高考試卷等值關(guān)于錨測驗(yàn)實(shí)際工作中(1)錨題與原測題混合編制施測,操作比較方便,且錨題測試可能達(dá)到相當(dāng)可靠的程度,但是一旦試卷“曝光”,錨題就失去作用。(2)錨題獨(dú)立成卷,可以提高錨題的安全性,但是測試組織比較復(fù)雜,特別是要創(chuàng)設(shè)與正式測試相同的測試情境比較困難但是不管錨題是在卷外還是卷中,錨題部分都應(yīng)是原測驗(yàn)的一個(gè)平行簡縮本,也要保證有相當(dāng)?shù)念}量。設(shè)計(jì)四非隨機(jī)分組——每組各實(shí)施一個(gè)測驗(yàn),錨測驗(yàn)向每組實(shí)施1.線形等值方法2.頻數(shù)估計(jì)法(等百分位等值)頻數(shù)估計(jì)法的關(guān)鍵是要利用錨測驗(yàn)數(shù)據(jù)分別估出測驗(yàn)x和測驗(yàn)y在合成被試群體t上的次數(shù)分布。3.鏈等值法(等百分位等值)XC—〉PRa(XC)=PRa(VC)—〉VC—〉PRβ(VC)=PRβ(YC)—〉YC

鏈等值法不需要總分與錨測驗(yàn)分的聯(lián)合分布,也不需合成被試組,因此比起頻數(shù)估計(jì)法來顯得更簡單。但是,鏈等值法一個(gè)明顯的不足是往往將一個(gè)長測驗(yàn)等值于一個(gè)短測驗(yàn),從而增加了測驗(yàn)誤差。設(shè)計(jì)四非隨機(jī)分組——每組各實(shí)施一個(gè)測驗(yàn),錨測驗(yàn)向每組實(shí)施012345合計(jì)00100001100110022001210430002428合計(jì)01255215VX012345合計(jì)00200002100220042001.531.5063000121

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論