教育測量的質(zhì)量指標概述_第1頁
教育測量的質(zhì)量指標概述_第2頁
教育測量的質(zhì)量指標概述_第3頁
教育測量的質(zhì)量指標概述_第4頁
教育測量的質(zhì)量指標概述_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第二章教育測量的質(zhì)量指標第二節(jié)效度第二節(jié)效效度一、效度度的概念念二、效度度的統(tǒng)計計學原理理及其與與信度的的關系三、效度度的估計計四、提高高效度的的方法一、效度度的概念念效度(Validity)是指測量結果果的準確性和有效性的程度,亦即測測量是否否達到了了預期的的目的。第一,效效度是一一個相對對的概念念。1.測量量的效度度始終是是對一定定的測量量目的而而言的。2.測量量的效度度是相對對于測量量的結果果而言的的。第二,一一種測驗驗的效度度只是高高或低的的問題。第三,在在教育測測量中,效度問問題比在在其他領領域的測測量中更更為重要要。一、效度度的概念念這是因為為:教育測測量的對對象大多多是精神神現(xiàn)象

2、,只能通通過對其其具有可可測性的的外部表表現(xiàn)(如如語言或或動作等等)的測測量,以以間接認認識其心心理活動動、心理理特征或或知識水水平等。學生的的心理活活動、心心理特征征與其外外部表現(xiàn)現(xiàn)之間,一般僅僅具有相相關關系系而無函函數(shù)關系系,外部部行為并并不能準準確無誤誤地反映映某種心心理狀態(tài)態(tài)。教育測測量的對對象不是是物而是是有主觀觀能動性性的人。人能有有意識地地調(diào)節(jié)自自己的外外部行為為,掩蓋蓋自己的的內(nèi)心活活動,這這就增加加了認識識其精神神現(xiàn)象的的難度。二、效度度的統(tǒng)計計學原理理及其與與信度的的關系1、效度度的統(tǒng)計計學原理理在實際測測量中,影響效效度的主主要因素素是系統(tǒng)統(tǒng)誤差。因而在在討論效效度時,

3、還必須須把真分分數(shù)方差差分解為為兩個部部分,一一是潛在在真分數(shù)數(shù)方差(V2),另一一部分是是系統(tǒng)誤誤差分數(shù)數(shù)方差(I2) ,它它與由隨隨機誤差差引起的的變異(E2)不同。2、效度度與信度度的關系系V2I2E2V2I2E2V2I2E2根據(jù)公式式(2-2)和和(2-3),可將效效度與信信度的關關系圖解解于后:根據(jù)分析析,可得得結論如如下:1)高信度是是高效度度的必要要條件,而非充充分條件件。2)效度系系數(shù)不會會大于信信度系數(shù)數(shù)的平方方根??梢杂孟孪率奖硎臼荆焊咝Ф?、高信度度低效度、高信度度低效度、低信度度三、效度度的估計計效度估計計就是多多方尋找找證據(jù)來來證明一一個測驗驗的有效效性程度度的過程程。

4、1974年美國國心理學學會發(fā)行行的教教育和心心理測量量的標準準一書書將效度度分為三三大類:內(nèi)容效度度、效標標關聯(lián)效效度和結結構效度度。(一)內(nèi)內(nèi)容效度度(Contentvalidity)又稱合理理效度或或邏輯程程度,是是指測驗驗內(nèi)容或或行為取取樣的代代表性和和適當程程度;即測驗的內(nèi)內(nèi)容范圍圍、材料料與所要要測量的的內(nèi)容范范圍、教教育目標標是否相相符合;測驗中中測題所所引起的的行為是是否是所所要測量量的屬性性的明確確反應;測驗的的結果是是否是一一個有代代表性的的行為樣樣本。估計內(nèi)容容效度的的方法:估計內(nèi)容容效度的的方法:(1)邏邏輯分析析的方法法。其工作思思路是請請有關專專家對測測驗題目目與原定

5、定內(nèi)容范范圍的吻吻合程度度作出判判斷。(2)統(tǒng)計分析析法。從從同一個個教學內(nèi)內(nèi)容總體體中抽取取兩套獨獨立的平平行測驗驗,用這這兩個測測驗來測測同一批批被試,求其相相關。若若相關高高,表明明測驗內(nèi)內(nèi)容效度度較高;若相關關低,表表示測驗驗的內(nèi)容容效度較較低。采用求統(tǒng)統(tǒng)計量的的公式進進行計算算,其公公式有以以下三種種形式:內(nèi)容效度度主要應應用于成成就測驗驗、學科科測驗、選拔和和分類職職業(yè)測驗驗。內(nèi)容效度度不適合合用于能能力傾向向和人格格測驗。(二)效效標關聯(lián)聯(lián)效度又可稱為為經(jīng)驗效效度或統(tǒng)統(tǒng)計效度度,是以以測驗分分數(shù)和效效標之間間的相關關系數(shù)來來表示測測驗效度度的高低低的。效標就是足以以顯示測測驗所欲

6、欲測量的的特性的的變量或或足以顯顯示測驗驗所欲預預測的特特性的變變量。它它是用來來檢驗測測驗效度度的外在在的、客客觀的標標準和尺尺度。效標關聯(lián)聯(lián)效度又又可分為為同時效度度和預測效度度。(用全國國高考的的成績作作為效標標來檢驗驗高中畢畢業(yè)生會會考的成成績,計計算兩者者之間的的相關系系數(shù)就是是會考的的同時效效度;而而用大學學一年級級的成績績作為效效標來檢檢驗高考考的成績績,計算算兩者的的相關系系數(shù)就是是高考的的預測效效度。)估計效標標關聯(lián)效效度可采采用積差差相關、二列相相關或點點二列相相關、四四格相關關和多元元相關系系數(shù)等計計算各種種相關系系數(shù)。1、用積積差相關關系數(shù)的的方法估估計效度度積差相關關

7、,是計算算兩個變變量線性性相關的的一種方方法,由由英國統(tǒng)統(tǒng)計學家家皮爾遜提出,因因此也稱稱為皮爾爾遜(Pearson)相關關。要使使用積差差相關必必須同時時具備如下下幾個條條件:兩個變變量都是是由測量量獲得的的連續(xù)性性數(shù)據(jù),即等距距或等比比數(shù)據(jù)。兩個變變量的總總體都呈呈正態(tài)分分布,或或接近正正態(tài)分布布,至少少是單峰峰對稱分分布,當當然樣本本并不一一定要正正態(tài)。必須是是成對的的數(shù)據(jù),而且每每對數(shù)據(jù)據(jù)之間是是相互獨獨立的,即各自自互不影影響,本本條件是是難以檢檢驗的。兩個變變量之間間呈線性性關系。一般用用描繪散散點圖的的方式來來觀察,最好是是先各自自轉(zhuǎn)化為為Z分數(shù)數(shù),單位位會統(tǒng)一一些。例:某中學數(shù)

8、數(shù)學教研研組的教教師積多多年的教教學法經(jīng)經(jīng)驗,認認為剛?cè)肴敫咧械牡膶W生學學習立體體幾何感感到困難難的主要要原因是是空間想想像力弱弱。為了證明明這個論論點,他他們讓剛剛?cè)敫咧兄械?03名學學生作10道題題,測量量其空間間想像力力。為避避免知道道了某些些學生的的剛?cè)敫吒咧袝r的的成績影影響以后后考試的的評分,試卷暫暫不評閱閱。立體體幾何學學完后,進行考考試,按按得分多多少把成成績分為為五等(A、B、C、D、E)分別別得5、4、3、2、1分。這時才才評閱入入學時的的試卷,統(tǒng)計出出期末得得5、4、3、2、1分者在在入學測測驗中分分別答對對1道題題至10道題的的人數(shù)(見表2-1)。就現(xiàn)有資資料,用用什么方

9、方法可以以判斷教教師們的的意見是是否正確確?表2-1:(答對的題數(shù))1 2 3 4 5 6 7 8 9 10 所評的等級ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 11 3 2 1 11 1 2 1 1解:(1)設期末末考試的的等第為為y,空空間想像像力測驗驗答對的的題數(shù)為為x,列列出二重重交叉次次數(shù)分布布表:X(答對的題數(shù))1 2 3 4 5 6 7 8 9 10 Y所評的等級ABCDE54321 1 3 10 5 4 2 1 6 8 8 4 3 1 2 4 5 9 8 3 11 3 2 1 11 1 2 1 125313296合計2

10、4 10 14 20 20 17 9 5 2103(2)用用積差相相關系數(shù)數(shù)公式計計算效度度系數(shù):二列相關關適用于兩兩個變量量就其實實際含義義而言是是等距或或等比數(shù)數(shù)據(jù),它它們服從從正態(tài)分分布,其其中一列列人為地地劃分為為兩類。點二列相相關適用于一一列數(shù)據(jù)據(jù)為等距距或等比比且總體體服從正正態(tài)分布布(實際際上只需需要單峰峰對稱分分布,如如分布布),另另一列變變量是按按事物的的性質(zhì)劃劃分為兩兩類的變變量,也也可以是是一個雙雙峰分布布,人為為劃分為為兩類,如文盲盲與非文文盲。這這種相關關系數(shù)多多用于測測驗中評評價題目目的區(qū)分分度。對對選擇題題、判斷斷題在整整個測量量中作用用作出判判斷?;居嬎闼愎?/p>

11、:例:有一一位教師師自編了了一套測測驗題,用來預預測學生生一年后后的某科科成績,自編測測驗按百百分制評評分,一一年后考考試評分分只把學學生分為為及格者者和不及及格者。試就所所獲資料料估計自自編測驗驗的預測測效度。解:1)把兩次次測驗成成績成對對排列:被試者12345678910 11121314自編測驗的成績(X)67 10 20 44 60 43 61 10 26 23 30 18 35 23一年后考試成績(Y)1 1 1 0 0 1 1 0 1 0 0 1 1 12)計算出出二列相相關公式式所需統(tǒng)統(tǒng)計量:(三)結結構效度度(Construct validity)結構效度度是指一個個測量能能

12、實際測測量出理理論上的的構想或或心理特特性的程程度。它它的目的的在于從從心理學學的理論論觀點就就測驗的的結果加加以解釋釋和探討討。這里的結構的含義是是心理學學理論所所涉及的的抽象而而屬假設設性的概概念、構構想、特特性或變變量,如如智力、焦慮、機械能能力傾向向、成就就、動機機等。結構效度度主要用用于智力力測驗、人格測測驗等一一些心理理測驗方方面。例如:人人的創(chuàng)造造力可以以分解為為人的思思維流暢暢性、靈靈活性和和創(chuàng)造性性三大特特性,并并根據(jù)這這三大特特性編制制測驗,若有足足夠的證證據(jù)來證證明該測測驗確實實可以測測到這些些特性,則認為為該測驗驗是個結結構效度度較高的的創(chuàng)造力力測驗。(1)結結構效度度

13、的特點點結構效度度的大小小完全取取決于事事先假定定的心理理特質(zhì)理理論,一一旦人們們對同一一種心理理特質(zhì)有有著不同同的定義義或假設設,則會會使得關關于特質(zhì)質(zhì)測驗的的結構效效度的研研究結果果無法比比較。當實際測測量的資資料無法法證實我我們的理理論假設設時,并并不一定定就表明明該測驗驗結構效效度高。因為還還有可能能出現(xiàn)理理論假設設不成立立,或者者該實驗驗設計不不能對該該假設作作適當?shù)牡臋z查等等情況,這就使使得結構構效度的的獲取更更為困難難。(2)建建立結構構效度的的步驟A、提出出理論假假設;B、根據(jù)據(jù)假定結結構擬定定測題,編制測測驗;C、以測測驗結果果為根據(jù)據(jù)來驗證證假設結結構中的的各種因因素是否否

14、成立。(3)結結構效度度的估計計A、因素素分析法法其目的是是把一些些具有錯錯綜復雜雜關系的的因素歸歸結為數(shù)數(shù)量較少少的幾個個綜合因因素或稱稱共同因因素,并并以此測測驗所測測之特質(zhì)質(zhì)對測驗驗分數(shù)作作出解釋釋。B、多元元特質(zhì)多多重方法法矩陣法法是由肯貝貝爾和菲菲斯克1959年提出出的最受受歡迎的的一種結結構效度度的評估估方法。這種方法法的設想想:若采采用兩種種方法以以上的方方法去測測量兩種種以上的的特質(zhì),那么這這些測量量結果之之間可以以形成一一個多元元特質(zhì)多多重方法法矩陣。四、提高高效度的的方法(一)各各種效度度系數(shù)的的要求(二)影影響效度度的因素素測驗的構構成(要要素)測驗實施施方面(過程)被試

15、主觀觀狀態(tài)方方面估計效度度所依循循的效標標樣本方面面四、提高高效度的的方法(三)提提高效度度的方法法:1、控制制系統(tǒng)誤誤差2、精心心編制量量表3、妥善善組織測測驗4、擴充充樣本的的容量和和代表性性5、合理理處理效度和信信度的關關系6、適當增加加測驗的的長度表2.1 測驗驗長度與與信度和和效度的的關系題數(shù)與原測驗題數(shù)之比信度系數(shù)效度系數(shù)1020306012014048012361214480.3000.4620.5620.7200.8370.9110.9540.4000.4960.5480.6190.6680.6790.713第三節(jié)難難度及及其計算算一、難度度的概念念難度是指指測量試試題的難難易

16、程度度。一個題目目的難度度大小,除了所所測的內(nèi)內(nèi)容本身身的難易易程度有有關以外外,還與與測驗的的編制技技術和被被試的知知識經(jīng)驗驗有關。這就是說說測驗的的難度具具有相對對性,正正因為此此,必須須讓試題題通過實實踐來對對難度作作出檢驗驗。二、難度度的計算算(一)計計算難度度的基本本公式1、客觀觀題難度度的計算算2、主觀觀題難度度的計算算P表示難難度指標標,N表表示參加加考試的的總?cè)藬?shù)數(shù),R表表示答對對某道客客觀題的的人數(shù)。二、難度度的計算算例1:在在100個學生生中,答答對第一一題的30人,答對第第二題的的60人人,求第第一、二二道題的的難度?比較這這兩道題題誰比誰誰難?例2:某某道論述述題滿分分

17、12分分,所有有考生在在這道題題上的平平均得分分為3.6分,求該題題的難度度?例3:語語文測驗驗第五題題最高得得分為12分,這道題題考生的的平均得得分是8.5分分,求該該題難度度?例4:60人參參加考試試,某題題滿分為為12分分,正確確得分累累積是480分分,求該該題難度度?(二)用用極端分分組法計計算試題題的難度度1、用極極端分組組法計算算客觀題題的難度度具體步驟驟如下:1)先按按測驗總總分的高高低,按按由高到到低的順順序依次次排列試試卷。2)從得得分最高高的一份份試卷開開始依次次向下選選出全部部試卷的的27%作為高高分組;從得分分最低的的一份試試卷開始始依次向向上選出出全部試試卷的27%作

18、作為低分分組。3)按計計算公式式計算難難度例題5:某區(qū)域1000人參加加考試,試卷第第一題高高分組180人人答對,低分組組60人人答對,求該題題難度?(約為0.44)如果該題題滿分為為10分分,高分分組得分分總數(shù)為為2100分,低分組組得分總總數(shù)為830分分,求該該題難度度?2、用極極端分組組法計算算論文試試題難度度步驟如下下:1)按測測驗得分分排列試試卷,確確定高分分組與低低分組,各占總總?cè)藬?shù)的的25%(方法法同前)。2)分別別為高分分組、低低分組編編制每道道試題的的分析表表。3)按下下列公式式計算難難度,例:某道論文文題,高高分組得得分總和和為40分,低低分組得得分總和和為15分,有有40

19、人人參加考考試,這這道題最最高得分分為8分分,最低低得分為為2分,則此題題的難度度為多少少?(0.125)計算解:依據(jù)據(jù)主觀題題極端分分組法計計算公式式=0.125三、難度度的分析析與控制制1、難度度分析進行難度度分析的的主要目目的是為為了篩選選題目。A、測驗驗題目難難度水平平的確定定測驗題目目難度水水平的適適當與否否,取決決于測驗驗的目的的、性質(zhì)質(zhì)和題目目的形成成。當P值接接近于0或接近近于1時時,即被被試在該該題上全全部答對對或全部部答錯,則該題題無法提提供個體體的信息息。而只只當P值值接近于于0.50時,題目才才能把被被試做最最大的程程度的區(qū)區(qū)分。但在實際際工作中中,若每每一題的的難度值

20、值均為0.50,那么么此測驗驗很可能能只能區(qū)區(qū)分出好好與差兩兩種極端端被試的的差異,卻不能能對各種種被試作作更精確確的區(qū)分分。因此此,一般般各題的的難度可可在0.50+20之間間。B、測驗驗難度對對分數(shù)分分布的影影響1)測驗驗難度影影響分數(shù)數(shù)的分布布形態(tài)。難度值越越接近0,測驗驗的難度度就越大大,測驗驗分數(shù)就就越是集集中在低低分端,其分數(shù)數(shù)分布越越呈現(xiàn)正正偏態(tài);反之,難度值值越接近近1.00,其其難度就就越小,測驗分分數(shù)越集集中在高高分端,分數(shù)分分布呈負負偏態(tài)。2)測驗驗難度影影響測驗驗分數(shù)的的離散程程度測驗難度度過大過過小,都都會造成成測驗分分數(shù)偏離離正態(tài)分分布,從從而使分分數(shù)的全全距縮小小

21、,使測測驗分數(shù)數(shù)的離散散程度變變小。3)測驗驗難度影影響測驗驗的鑒別別能力在測驗中中,考生生之間相相互配對對比較的的可能性性越多,就越有有利于準準確地鑒鑒別考生生的不同同能力。2、難度度的控制制一般說來來,影響響題目難難度的主主要因素素有:考察知識識點的多多少;考察能力力的復雜雜程度或或?qū)哟蔚牡母叩?;考生對題題目的熟熟悉態(tài)度度;命題的技技巧。難度控制制:正確估計計考生水水平;弄清弄懂懂各知識識點;掌握命題題技巧。第四節(jié)區(qū)區(qū)分度度及其計計算一、區(qū)分分度的意意義(一)區(qū)區(qū)分度(Discrimination)是指測測驗對考考生實際際水平的的區(qū)分程程度,用用符號D表示。又叫鑒鑒別力,它是評評價試題題質(zhì)量,篩選試試題的主主要指標標與依據(jù)據(jù)。區(qū)分度(D)的的取值范范圍介于于-1.00+1.00之間,值越大大,區(qū)分分度的效效果越佳佳。區(qū)分度D0為為正區(qū)分分,D0為負負區(qū)分,D=0為零區(qū)區(qū)分。區(qū)分度的的高低直直接影響響到測驗驗的信度度和效度度。(二)區(qū)區(qū)分度與與測驗信信度、難難度的關關系1、區(qū)分分度與信信度的關關系(見見下表2.2)這里是假假定全部部試題的的難度均均為0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論