信度、效度、區(qū)分度、難度的使用_第1頁
信度、效度、區(qū)分度、難度的使用_第2頁
信度、效度、區(qū)分度、難度的使用_第3頁
信度、效度、區(qū)分度、難度的使用_第4頁
信度、效度、區(qū)分度、難度的使用_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、信度、效度、難度、區(qū)分度及其在試卷分析中的使用 教學(xué)測量(instructional measurement)是考核教學(xué)成效的一種方法。這是借助于一定的手段與方式,對學(xué)生的學(xué)習(xí)成績(簡稱學(xué)績)進(jìn)行探察,并以一定的數(shù)量來表示的考核辦法。2. 在教學(xué)測量中應(yīng)注意什么(1)教學(xué)測量的目的在于考核教學(xué)成效,也就是考察教學(xué)目標(biāo)的完成情況。因此,教學(xué)測量的目標(biāo)應(yīng)以教學(xué)目標(biāo)為依據(jù),測量目標(biāo)應(yīng)與教學(xué)目標(biāo)一致,而不能偏離教學(xué)目標(biāo)(2)教學(xué)測量的對象是學(xué)生內(nèi)在的能力與品德等的形成狀況,它不可能像物理測量那樣直接進(jìn)行,只能借助于一定的手段與方式間接進(jìn)行。(3)教學(xué)成效是通過量化的學(xué)績進(jìn)行考察的。也就是說,

2、教學(xué)成效是以學(xué)生的學(xué)習(xí)成績?yōu)橹苯涌疾煲罁?jù)的,而學(xué)績是以一定的數(shù)量來表示的,因此命題的合理性與評分的客觀性是有效教學(xué)測量的一個(gè)重要影響因素 教學(xué)評價(jià)(instructional evaluation)就是依據(jù)教學(xué)目標(biāo),對學(xué)績測驗(yàn)所得測量結(jié)果進(jìn)行分析及解釋。它主要包含以下兩個(gè)方面的工作。(1)教學(xué)評價(jià)必須對學(xué)績測驗(yàn)數(shù)據(jù)所表明的教學(xué)成效作出確切的診斷。(2)教學(xué)評價(jià)必須對教學(xué)的成敗原因進(jìn)行分析,并對今后教學(xué)工作的改進(jìn)方面作出明確的規(guī)定。評價(jià)(估)的功能:為家長提供信息,為選拔提供信息,為學(xué)生提供信息,為教師提供信息,為學(xué)校(間)提供信息教學(xué)目標(biāo),有時(shí)也稱為行為目標(biāo),是指對學(xué)生在一段時(shí)間教學(xué)后應(yīng)該掌握

3、的技能與概念的陳述。v信度信度指的是測量結(jié)果的穩(wěn)定性程度,信度是衡量一個(gè)量表質(zhì)量高低的重要指標(biāo)。信度不高的量表是不能使用的。3.常見的信度種類(1)重測信度(2)復(fù)本信度(3)分半信度(4)同質(zhì)信度(內(nèi)部一致性信度)(5)評分者信度影響信度的因素w 被試w 主試者w 施測情境w 測量工具信度是指考試的可靠性,即考試結(jié)果的可信程度。信度高的試題很少受到外部因素的影響,對任何學(xué)生的多次測定都會產(chǎn)生比較穩(wěn)定的、前后一致的結(jié)果。提高試卷信度的因素大致可包括以下幾種情況:(1)使用ABC卷隨機(jī)抽取試題。(2)教師考前沒有劃定考試范圍。(3)試題效度高,質(zhì)量可靠。(4)考試保密措施可靠。(5)嚴(yán)格執(zhí)行考試

4、紀(jì)律。(6)閱卷標(biāo)準(zhǔn)嚴(yán)格、規(guī)范、統(tǒng)一。(7)集體閱卷且實(shí)行流水作業(yè),復(fù)核認(rèn)真。 v效度測驗(yàn)的效度指的是測量的正確性和有效性,即它能夠測出所要測量的心理特質(zhì)與行為特征的程度。換言之,效度指測驗(yàn)?zāi)茉诙啻蟪潭壬线_(dá)到測量目的。2.效度的類型:內(nèi)容效度、構(gòu)想效度、實(shí)證效度效度指考試的準(zhǔn)確性,反映的是考試內(nèi)容與教學(xué)大綱或考試大綱的吻合程度。效度高的試卷,能夠較準(zhǔn)確地測試出學(xué)生掌握和運(yùn)用所學(xué)知識的真實(shí)度。根據(jù)教學(xué)大綱或考試大綱進(jìn)行命題,且各單元試題分?jǐn)?shù)分配與學(xué)時(shí)數(shù)分配基本保持一致,成正比關(guān)系,這是保證考試效度的基礎(chǔ)。其它影響效度的因素有:是否在命題的同時(shí)制訂了試題參考答案與評分標(biāo)準(zhǔn);是否集體閱卷且

5、實(shí)行流水作業(yè);復(fù)核是否認(rèn)真;分?jǐn)?shù)是否真實(shí)等。 v難度難度反映試題的難易程度,即考生在一個(gè)試題或一份試卷中的失分程度。一道試題,如果大部分被試都能答對,則該題的難度就??;如果大部分被試都不能答對,則該題的難度就大。一個(gè)題目的難度大小,除了所測的內(nèi)容本身的難易程度有關(guān)以外,還與測驗(yàn)的編制技術(shù)和被試的知識經(jīng)驗(yàn)有關(guān),由于學(xué)得不清楚或者因被試沒學(xué)過,一個(gè)本來容易的題可能變難。這就是說測驗(yàn)的難度具有相對性,正因?yàn)榇?,必須讓試題通過實(shí)踐來對難度作出檢驗(yàn)。(一)基本公式1、客觀題難度的計(jì)算(當(dāng)人數(shù)較少時(shí))P=R/N R為答對該試題人數(shù),N為參加測驗(yàn)總?cè)藬?shù)適用范圍:客觀題,只有答對與答錯兩種可能。(即

6、二分)w 例1:在100個(gè)學(xué)生中,答對第一題的30人,答對第二題的60人,求第一、二道題的難度?比較這兩道題誰比誰難?2.極端分組法當(dāng)被試人數(shù)較多時(shí),則可以先將被試依照測驗(yàn)總分從高到低排列,分成三組,總分最高的27%的為高分組(NH)總分最低的27%為低分組。分別計(jì)算出高分組與低分組的通過率,然后求項(xiàng)目的難度。公式為P=(PH+PL)/2w PH為高分組答對該題的百分比;w PL為低分組答對該題的百分比。某區(qū)域1000人參加考試,試卷第一題高分組180人答對,低分組60人答對,求該題難度?3.非二分法記分的項(xiàng)目的難度如論述題公式P某題平均得分/該題滿分如滿分100分的試題,考生平均得分76分,

7、平均失分24分,則難度系數(shù)為0.24。其計(jì)算公式為: L=1X/W 其中,L為難度系數(shù),X為分析組平均得分,W為試卷總分(一般為100分) v區(qū)分度w (一)區(qū)分度的含義w 指測驗(yàn)題目對考生實(shí)際水平的區(qū)分程度或鑒別能力。w 如一道題,學(xué)業(yè)水平、實(shí)際能力都較高的考生都答對了;而學(xué)業(yè)水平、實(shí)際能力都較低的考生都答錯了,則可認(rèn)為該題目有好的區(qū)分度。w 區(qū)分度分析主要以效能為依據(jù),考察考生在每個(gè)題目上反應(yīng)與其在效標(biāo)上的表現(xiàn)之間的相關(guān)程度。w 區(qū)分度(D)的取值范圍介于- 1.00+1.00之間,值越大,區(qū)分度的效果越佳。w 區(qū)分度D>0為正區(qū)分,D<0為負(fù)區(qū)分

8、,D=0為零區(qū)分(二)區(qū)分度的計(jì)算w 1、極端分組法w (1)客觀性試題D=PH-PLPh與pl分別為高分組與低分組在該項(xiàng)目上的通過率例6:有道試題,高分組有70%學(xué)生通過,低分組有30%的學(xué)生通過;而另一道題,高分組有40%學(xué)生通過,低分組有70%學(xué)生通過,求兩題的各自區(qū)分度?例7一次生物測試中,在100名學(xué)生中,高低分組各有27人,其中高分組答對第一題有20人,低分組答對第一題的有5人,這道題的區(qū)分度為多少?w 2)主觀題D=(XH-XL)/N(H-L)w XH為高分組得分的總分w XL為低分組得分的總分w H為該道題的最高分w L為該道題的最低分w N為應(yīng)試總?cè)藬?shù)的27%。區(qū)分度反映試題

9、區(qū)分不同水平受試者的程度,即考出學(xué)生的不同水平,把優(yōu)秀、一般、差三個(gè)層次的學(xué)生真正分別開。區(qū)分度高的考試,優(yōu)秀、一般、差三個(gè)層次的學(xué)生都有一定比例,如果某一分?jǐn)?shù)區(qū)間學(xué)生相對集中,高分太多或不及格太多的考試,區(qū)分度則低。如果把成績從高往低排序,前50%的考生為高分組,后50%為低分組,其計(jì)算公式為: D=2(XHXL)/W 其中,D為區(qū)分度,XH為高分組平均分,XL為低分組平均分,W為試卷總分(一般為100分)。 (三)現(xiàn)代學(xué)生評價(jià)制度的基本特征w 1、學(xué)生評價(jià)的功能重點(diǎn)逐步從總結(jié)性功能向形成性功能轉(zhuǎn)移;w 2、評價(jià)內(nèi)容從對學(xué)生的認(rèn)知評價(jià)擴(kuò)展為對學(xué)生全面綜合性的評價(jià);w 3、學(xué)生在評價(jià)過程中由被動等待評價(jià)向主動參與評價(jià)發(fā)展;w 4、學(xué)生評價(jià)從關(guān)注結(jié)果向重視過程發(fā)展;w 5、在評價(jià)方法上,從僅強(qiáng)調(diào)測驗(yàn)分?jǐn)?shù)向評價(jià)方法的主體、綜合、多層次、全方位發(fā)展。附: 試卷評估等級指標(biāo)    &#

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論