版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第九章測驗質量分析
[本章提要]通過本章的學習,掌握題目難度和區(qū)分度的概念和計算方法,了解題目難度和區(qū)分度的之間的關系,理解題目難度、區(qū)分度與測驗質量之間的關系。理解測驗信度與效度的含義,掌握測驗信度與效度的基本估計方法,了解影響測驗信度與效度的因素。?
第一節(jié)題目難度的概念和計算方法
一、題目難度的概念和意義(一)題目難度的含義題目難度是指被試完成試題的難易程度。(二)題目難度與測驗的關系題目難度影響測驗的難度分布和平均難度,從而影響測驗的信度、效度以及測驗結果區(qū)分被試水平高低的能力。?二、難度的計算(一)二值記分法題目的難度計算當題目分數(shù)是二分變量(即答對為1,答錯為0,如選擇題)時:式中:P為題目難度值,R為答對或通過該題的人數(shù),N為全體考生數(shù)。例題1:在一測驗的某道選擇題上,100名被試中選擇正確答案的有37名。則該題難度為:?
(二)非二值記分法題目的難度計算
當題目分數(shù)是多分值時,難度是全體被試在該題上的平均數(shù)與該題滿分的比例:式中:P題目難度值,為全體被試平均得分,Xmax是題目滿分。?例題2:一組被試在某道題上得分分別為2,5,9,10,4,8,7,5,3,0。該題滿分為10分。則該題難度為:?三、測驗難度的選擇一般常模參照測驗題目難度分布近似正態(tài)。特定的測驗題目難度的分布應該根據(jù)測量的任務而定。?第二節(jié)區(qū)分度的概念和計算方法一、區(qū)分度的含義區(qū)分度是指試題能區(qū)分被試水平能力的程度。二、區(qū)分度的計算(一)區(qū)分度的相關計算法它是求試題分數(shù)與總分的相關系數(shù)作為區(qū)分度的指標。?或?例如:根據(jù)下表數(shù)據(jù)求區(qū)分度。序號 XY Xp Xq 1 87 1 87
2 85 0
85 3 82 1 82
4 80 0 80 5 80 0 80 6 78 0 78 7 78 1 78 8 75 0 75 合計 645 3 247 398 平均
數(shù) 82.379.6 標準差3.67 ?解題步驟:..\區(qū)分度.xls?(二)區(qū)分度的分組計算法它是首先將全體被試按總分高低進行排隊;然后,將得分較高的27%的被試作為“高分組”,將得分較低的27%的被試作為“低分組”;最后求兩組在試題上得分率的差。即:D=PH-PL式中:D為區(qū)分度;PH為高分組的得分率;PL為低分組的得分率。?例如:某班40名學生,“高分組”做對第一題的有8人,“低分組”做對的有4人,那么,該題的區(qū)分度為:D=PH-PL=8/11-4/11≈0.36
?三、區(qū)分度的評價區(qū)分度的取值范圍–1≤D≤1。當用分組計算法得到的題目區(qū)分度大于0.4時,區(qū)分度的分組計算法被認為是性能良好的試題。?
第三節(jié)測驗的信度
一、信度的概念信度是指測驗結果的可靠程度。二、信度的統(tǒng)計學原理rxx=S2T/S2X式中:rxx表示信度系數(shù);S2T表示真分數(shù)方差;S2X表示實得分數(shù)方差。有關系式:X=T+E其中,X為實得分數(shù);T為真分數(shù)。?三、信度系數(shù)的估計方法1.穩(wěn)定性系數(shù)(再測信度)它是同一被試總體用同一試卷間隔一段時間后兩次測驗所得數(shù)據(jù)的一致性程度。通常用相關系數(shù)作為其估計值。?2.等值性系數(shù)(復本信度)它是同一被試總體用兩份等值的試卷,在間隔很短的時間內先后兩次測驗所得數(shù)據(jù)的一致性程度。通常用相關系數(shù)作為其估計值。?3.內部一致性系數(shù)(1)分半信度系數(shù)
在測驗沒有復本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據(jù)學生在這兩半測驗中所得的分數(shù)計算相關系數(shù)rhh,然后用斯皮爾曼-布朗(Spearman-Brown)公式對其值加以校正,即得分半信度。式中:rtt為分半信度系數(shù);rhh為兩個“半測驗”的相關系數(shù)。?例:用一個由100題構成的試卷測試10名學生,測試結果如下表,求測驗的分半信度系數(shù)。學號奇數(shù)題總分偶數(shù)題總分138372373733836441395403963634738388393994039103536?解題步驟如下:
1、先求兩分測驗的相關系數(shù)rhh
。
..\分半信度.xls
學號奇數(shù)題總分偶數(shù)題總分138372373733836441395403963634738388393994039103536
0.84?
2、然后求分半信度系數(shù)rtt。
?(2)α系數(shù)若測驗中各個題目得分相關較高時,不論題目的內容或形式有何差別,測驗都為同質;相反,即使所有題目看起來都好像是測量同一特性,但題目得分之間的相關很低,測驗仍然是異質的。測驗越同質,同質性信度的值也越大,則說明試題的內部一致性程度越高。因而,同質性信度又稱作內部一致性系數(shù)。計算同質性信度的方法可用克龍巴赫(Cronbach)所創(chuàng)的α系數(shù)公式:?式中,N為題目數(shù);Si2為各被試在第i題得分的方差;St2為各被試測驗總分的方差。?例:5名被試參加一個包含6道試題的測驗,測驗結果如下表,求該測驗的信度系數(shù)。題號被試Si2ABCDE1711811113.042697891.3636106892.5648116836.965711811113.046711811113.04合計416343575420
70.24?解題步驟如下:
1、求各被試在第i題得分的方差Si2
。2、求各被試各自的總分。3、求方差Si2的和ΣSi2,以及各被試總分的方差St2
。..\α系數(shù).xls4、求α系數(shù)?4.評分者信度系數(shù)對于無法完全客觀記分的測驗,評分者的主觀因素對測驗結果的影響是很大的,因此需要控制評分誤差和研究評分者信度。評分者信度的估計可以分為兩種情況:(1)2人同時評多份相同的試卷這種情況可以用2人評分的相關系數(shù)作為評分者信度的估計值。?例如:兩位教師評三份試卷,求其評分者信度系數(shù)試卷教師X教師YDD2112-112211133300合計
2??(2)多人同時評多份相同的試卷當由多個評分者同時評多份相同的試卷時,需用肯德爾和諧系數(shù)(Kendallcoefficientofconcordance)W作為評分者信度的估計值,其計算公式有兩個。①無重復評定等級的W系數(shù)?式中:S為各題等級之和的離差平方和,即或Ri為各試卷評定等級之和;K為評分者的人數(shù);N為試卷的份數(shù)。?②有重復評定等級的W系數(shù)式中:n是相同等級的個數(shù)。?例如:三位教師評四份試卷,所評等級如下表,問該測驗的評分者信度如何?教師試卷1234A3142B2141C2232Ri74115?解題步驟:
(1)先計算ΣRi和ΣRi2ΣRi=7+4+11+5=27ΣRi2=72+42+112+52=211(2)計算S?(3)計算ΣT?(4)代入公式W?(5)查表,檢驗W的顯著性因為,K=3,N=4時,臨界值S0.05≈64.4,由于S<S0.05,所以,W不顯著性,即表明三位教師的評分者信度較低。(K在3——20之間,N在3——7之間時,查附表5求臨界值S0.05或臨界值S0.01;若N>7,檢驗W的顯著性用χ2=K(N-1)W,按df=N-1查χ2值表進行比較。)參考書目:1.王漢瀾主編《教育測量學》2.宋嶺梅主編《教育測量學》?四、影響信度的因素被試樣本的影響。題目數(shù)量的影響。測驗難度的影響。測驗內容同質性的影響。評分客觀性的影響。?
第四節(jié)測驗的效度
一、效度的概念效度是測驗能實際測量出其所要測量特性的程度。二、效度的統(tǒng)計學原理rxy=S2v/S2X式中,S2v潛在真分數(shù)方差;S2x實得分數(shù)方差。有關系式:X=T+E=V+I+E其中,V為潛在真分數(shù);I為系統(tǒng)誤差。?三、估計效度的方法1.內容效度(Contentvalidity)
內容效度指的是測驗題目對有關內容或行為取樣的適當性。(1)專家判斷法采用專家判斷法可以按下面的步驟進行:①定義好內容總體的范圍;②確定考查內容或行為的細目;③列出雙向細目表;④制訂評定量表。?(2)統(tǒng)計分析法統(tǒng)計分析法又稱克龍巴赫估計法??她埌秃赵岢龉烙媰热菪Ф瓤梢詮耐唤虒W內容范圍的總體中抽取兩套獨立的測驗試題,這兩套測驗試題對同一組考生分別進行兩次測驗,如測驗得分求得的相關系數(shù)高,就可推論內容效度高;若相關系數(shù)低,這兩套試題中至少有一套測驗試題缺乏內容效度。
?(3)再測法這種方法是,先對一組考生進行先期測驗,這一組學生必須是對測驗的內容知之甚少,然后對這一組學生進行有關內容的教學與訓練活動,經(jīng)過一段學習時間后,再進行后期測驗,這樣可以看出測驗是否測量出深堂上所進行的教學與訓練的效果。如果后期測驗成績好,就說明該測驗對課程內容范圍是有效的。
?2.效標關聯(lián)效度(Criterionrelatedvalidity)
效標關聯(lián)效度指的是測驗分數(shù)與效標分數(shù)之間的一致性程度。效標(criterion)。效標實際上是指本測驗所想測量或要預測的特性和功能。
效標關聯(lián)效度分為兩種:效標與本測驗分數(shù)同時獲得的,稱為同時效度或并存效度(concurrentvalidity);效標在本測驗之后相當時間獲得的,稱為預測效度(predictivevalidity)。?預測效度和同時效度有兩點區(qū)別:(1)從進行本測驗到獲得效標的間隔時間不同。同時效度的效標測驗幾乎與本測驗同時舉行;預測效度的效標則在本測驗之后相當長的時間(幾個月,到幾年)才獲得。(2)目的和作用不同。同時效度主要用來查明自編測驗的效度,以便有效地研制和使用新測驗;預測效度主要用來評價本測驗的預測能力。?估計效標關聯(lián)效度的主要方法有:
(1)相關法它是以相關系數(shù)作為效度系數(shù)(validitycoefficient)的估計值。?(2)命中率法當測驗是用作決定取舍標準的根據(jù)時,其有效性的指標可以看作正確決定的比例,該比例越高,說明測驗越有效。①取舍的正確性一般各級學校的招生考試或各企事業(yè)單位選聘人員的錄取聘用,都可以采用這種方法。為了得到取舍正確性指標,必須將原測驗分數(shù)與效標資料都采用二值劃分,這是最簡單的一種劃分方法。
?例如,原測驗分數(shù)可以分成錄取和不錄取兩類,效標資料可分為成功與失敗兩類,這樣全部被試可分為四個組,如下表所示:
效標成績失敗成功測驗成績錄取失誤(A)命中(B)不錄取命中(C)失誤(D)?上表中,在測驗分數(shù)中錄取的正確決定為命中,不正確決定為失誤,取舍正確性的指標,可用以下公式求得:式中:PCT為取舍正確性比率,也稱總命中率。?例如:
效標成績失敗成功測驗成績錄取75(A)15(B)60不錄取175(C)152(D)23?將表中各數(shù)據(jù)代入公式:
取舍正確性比率為0.85,說明測驗有比較高的預測效度。?
②正命中率(錄取正確率)
一般情況,錄取單位所關心的是已被錄取的學生或工作人員,希望他們錄取后努力學習或工作,而對那些未錄取者并不關心,因而需要用正命中率指標來表示其有效性。其公式為:式中Ppc為正命中率。
?例如:將上表中各數(shù)據(jù)代入公式:
錄取學生的正命中率為0.8,說明入學測驗的預測度性較高。?3.結構效度結構效度指的是測驗分數(shù)能夠說明心理的某種結構或特征的程度。(1)邏輯推理法它是通過對心理某種結構或特性與測驗的吻合性進行邏輯分析的方法。例如比奈(A.Binet)首先應用邏輯分析方法研究智力行為的心理結構,認為智力不單純是智力行為的很多不同方面的總和,而是一種連鎖性的過程,其中包括判斷、解決問題和推理作用。如果根據(jù)這種理論編制的智力測驗,確實能測量出應試者的判斷、理解和推理能力,就可以認為所編制的測驗具有結構效度。?例如:以智力測驗來說。先要建立關于智力的一套理論,如智力的定義、結構、與遺傳環(huán)境的關系,與年齡的關系,與性別的關系……等等。根據(jù)這些理論,提出有關智力測驗的若干假設,如:(1)測驗分數(shù)在16歲以前隨年齡而增加;(2)一種智力測驗的分數(shù)與其他智力測驗的分數(shù)有正相關,(3)測驗分數(shù)能區(qū)別智力水平,(4)測驗分數(shù)受教學的直接影響不大等。然后收集材料(這里主要是通過智力測驗獲得)來驗證假設。如果假設得到支持,則可以認為所編制的智力測驗的結果與智力的理論結構符合,即有結構效度。如果假設沒有得到測驗結果的支持,則測驗結果缺乏結構效度,或者是智力結構的理論有缺陷。?(2)統(tǒng)計分析法把自己所編制的測驗的施測結果,與另一性質相同而被公認具有較高結構效度的測驗結果比較。例如把新編制的智力測驗的結果與斯坦福一一比奈智力量表的測驗結果相比較,若兩種測驗結果的相關高,可以認為新編測驗也具有較高的結構效度。?(3)考察實驗因素法因素分析的主要作用在于從相關的許多因素中,找出潛藏在其中的對某種現(xiàn)象起決定作用的基本因素。這種方法是利用實驗前后的結果變化,來說明測驗的結構效度。?四、影響效度的因素測驗難度的影響。題目數(shù)量的影響。測驗實施的影響。評分客觀性的影響。要求測驗標準化的其他因素的影響。被試樣本的影響。所選效標的影響。?五、效度與信度的關系1.高信度不一定又高效度S2XS2T2.高效度一定有高信度S2XS2TS2vS2IS2ES2vS2IS2E?難度、區(qū)分度、信度、效度估計方法一覽表公式名稱公式形式難度二分法計分公式p=r/n非二分法計分公式p=/Xmax區(qū)分度相關計算法r“高”、“低”分組法D=PH-PL信度分半信度系數(shù)α系數(shù)肯德爾和諧系數(shù)效度相關法r命中率法?練習題一、在一測驗的某道選擇題上,50名被試中選擇正確答案的有30名。該題難度為多少?
二、一組被試在某道題上得分分別為2,5,9,10,4,8,7,5。該題滿分為12分。則該題難度為多少?
?三、根據(jù)下表數(shù)據(jù)求區(qū)分度。
學號總分第二題得分17512650380046805791687078818901992110960?四、某班60名學生,“高分組”做對第一題的有16人,“低分組”做對的有4人,那么,該題的區(qū)分度為多少??五、根據(jù)下表數(shù)據(jù)求分半信度。被試奇數(shù)題總分偶數(shù)題總分1353523435333364323553233630307292882828?六、兩位教師評六份試卷,求其評分者信度系數(shù)。試卷教師A教師B112221333445554666?七、通過某項測驗從80名候選人中選出30名聘為學生助理,一年后進行考核表明,其中有24人勝任工作,6人不勝任。問原測驗的預測效度如何??生活中的辛苦阻撓不了我對生活的熱愛。10月-24
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版車輛租賃事故責任保險合同標準版3篇
- 2024年甲乙雙方關于新建住宅小區(qū)物業(yè)管理的合同
- 2024年砂石料專項運輸合同范本版B版
- 2024年離職員工競業(yè)限制協(xié)議樣本
- 二零二五年博物館大理石展品運輸安裝維護合同3篇
- 2025版敬業(yè)員工績效管理與評價合同3篇
- 電信系統(tǒng)文明單位創(chuàng)建工作方案范文(2篇)
- 值班管理制度模版(4篇)
- 備煤車間安全操作規(guī)程模版(2篇)
- 2024年版企業(yè)員工待崗安排協(xié)議版B版
- 初級消防設施操作員實操題庫 (一)
- CURTIS1232-1234-1236-SE-SERIES交流控制器手冊
- 2024年郵政系統(tǒng)招聘考試-郵政營業(yè)員考試近5年真題集錦(頻考類試題)帶答案
- 交接試驗合同模板
- 期末 (試題) -2024-2025學年人教PEP版英語四年級上冊
- 小流域水土保持綜合治理項目工程施工設計方案
- 國開2024年秋《國際經(jīng)濟法》形考任務1-4答案
- 2024年山東省臨沂蘭山法院招聘司法輔助人員56人歷年高頻500題難、易錯點模擬試題附帶答案詳解
- 10《吃飯有講究》(教學設計)-2024-2025學年道德與法治一年級上冊統(tǒng)編版
- 江蘇園林綠化工作計劃
- 部編版八年級語文上冊第22課《夢回繁華》精美課件
評論
0/150
提交評論