中學生物學教育評價課件_第1頁
中學生物學教育評價課件_第2頁
中學生物學教育評價課件_第3頁
中學生物學教育評價課件_第4頁
中學生物學教育評價課件_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第十章 中學生物學教育評價教育評價是指一系列系統(tǒng)的、科學的和專業(yè)的過程,在這個過程中,包括鑒別、獲取和提供教育或教學決策之需的資料、意見和價值判斷。教學決策是指在教學中所做的各種決定。資料不僅包括評價所獲得的學生成績或名次,還包括事實的描述、記錄和報告等;意見指看法、思想和觀點;價值判斷包括對某一事實或做法的批評、價值評估等;第一節(jié) 生物學教學評價概述在學科教育中,教育和教學是融為一體的,所以學科的教育評價也就是教學評價。生物學教學評價包括2種過程:生物學教學中的評價:評價對象是學習過程,即學習過程中學生的學習狀況。生物學教學的評價:評價的對象是教學過程,即教學過程中教師的工作狀況。評價在教學

2、中的地位一、教學評價的目的1.了解學生起點行為,適當配置學生2.規(guī)劃教學活動,調(diào)整教學進度3.診斷學習困難,激發(fā)學習動機4.評定學習成就,報告學業(yè)成績研究預(yù)測功能、反饋調(diào)節(jié)功能促進激勵功能、評定選拔功能二、教學評價的種類(一)根據(jù)實施評價時所使用的工具和形式來分,1.紙筆測驗指以書面形式的測驗工具,主要側(cè)重于評定學生在學科知識方面學習成就高低或在認知能力方面發(fā)展強弱的一種評價方式。 包括:傳統(tǒng)的考試、教師自編成就測驗以及標準化成就測驗或其他作為教學評價輔助工具用的各種心理測驗等。 共同特征是都使用紙張印刷品即測驗卷來呈現(xiàn)要學生回答的試題,并要求學生以各種書寫工具在該測驗卷上填寫適當?shù)拇鸢?,因?/p>

3、被稱為紙筆測驗。 2.實作評價 這是指使用多種工具或形式,評定學生在實際情景下應(yīng)用知識的能力,以及在情感態(tài)度和動作技能領(lǐng)域?qū)W習成就的一種評價方式。評價工具或形式包括:觀察與軼事記錄、表演、作品、評定量表、檢核表、檔案袋、社交測量或投射測驗等。 (二)從教學評價的直接目的來劃分 l.配置性評價旨在了解學生的背景、性格和學習興趣,以便根據(jù)學生的個別差異,安排適當?shù)膶W習過程,施予適當?shù)慕虒W和輔導(dǎo). 2.診斷性評價旨在發(fā)掘、鑒定學生的學習困難或教學缺失,供調(diào)整教學方案參考.3形成性評價旨在了解學生的學習進展狀況以及教學的可能缺失,作為調(diào)整課程、改進教學和學習的依據(jù). 4終結(jié)性評價旨在評定學習的進展和成

4、就,作為成績報告或教育決策的參考. (三)從教學評價的標準來劃分 1.效標參照評價(絕對評價) 指以預(yù)先設(shè)定的、期待的教育目標為評價基準,來衡量評價對象達到程度的一種評價。評價的重心是在于:學生能做些什么與不能做些什么,是否達到了教育目標。學校內(nèi)的教學評價多屬效標參照評價。 2.常模參照評價(相對評價) 是指在某一集團中(班級、學校、地區(qū)或國家),以這個集團的平均狀況為基準,來評價被評對象在這個集團中所處的相對位置的評價。評價的重心在于:學生之間的比較,而與教育目標沒有直接的關(guān)系。適用競爭性的選拔考試。 三、教學評價的基本原則1依據(jù)教學目標:根據(jù)行為目標決定2兼顧多重目標:不同種類、不同層次3

5、采用多元方法:重心是形成性評價4進行多次評價:減少誤差5重視反應(yīng)過程:分析反應(yīng)組型6善用評價結(jié)果:改進教學和學習的參考 第二節(jié) 教師自編成就測驗:命題 自編測驗多屬于成就測驗:隨堂測驗定期測驗終結(jié)測驗一、測驗編制計劃的制定 (一)明確測驗?zāi)康暮湍繕藴y驗?zāi)康氖且鉀Q測驗結(jié)果用來做什么的問題,是為了診斷教學缺失、學習困難還是評定學生等級? 教師一般所編制的紙筆測驗,多半僅能適用于認知目標的評價,對于情感態(tài)度與動作技能目標的評價,則多采用實作評價的方法。教學目標分類認知領(lǐng)域情感態(tài)度領(lǐng)域動作技能領(lǐng)域好的測驗?zāi)繕藨?yīng)該: 以學生為中心 表述一個結(jié)果,而不是一項活動具有可測性 明確、清晰布魯姆“教育目標分類

6、法” 1識記:這是最低等級的認知目標,它指對具體事物和普遍原理的回憶,對方法和過程的回憶,或者對一種模式、結(jié)構(gòu)或框架的回憶。 2理解:這是低層次的理解,以一種語言或一種。交流形式被譯述或轉(zhuǎn)化成另一種語言或另一種交流形式時的嚴謹性和準確性為依據(jù),對材料進行初步的重新整理與排列,指出材料包含的意義和趨勢。因此理解包括三個心理過程:轉(zhuǎn)譯、解釋和推斷。 3運用:指在某些特定的和具體的情景里使用抽象概念只是對所學知識的初步運用,而非綜合的、創(chuàng)造性的運用。 4分析:指將材料分解成各種組成要素或組成成分,弄清各種觀念的有關(guān)層次,或者明確所表達的各種觀念之間的關(guān)系,闡明材料各要素的組織原理即對材料內(nèi)容組合起來

7、的組織、系統(tǒng)和結(jié)構(gòu)的分析。 5綜合:指對各種要素或組成成分加工,形成新的結(jié)構(gòu)整體或新的模式;制定出合理的工作計劃或操作步驟;確定一套抽象關(guān)系,用以對特定的資料或現(xiàn)象進行分類或解釋;或者從一套基本命題或符號表達式中演繹出各種命題關(guān)系。 6評價:這是認知領(lǐng)域教育目標的最高層次,是指為了特定目的對材料和方法的價值及符合準則的程度作出定量的和定性的判斷。 (二)設(shè)計雙向細目表 教師根據(jù)測驗?zāi)康募敖虒W目標的需求,以教學目標為橫軸,而以教材內(nèi)容為縱軸,畫出一個二維度的分類表,且平均分配好試題比重或題數(shù)于表中的每個細目里,并盡量使試題的取材能夠充分涵蓋所要評價的教學目標和教材內(nèi)容的范圍,以作為編擬成就測驗試

8、題的設(shè)計藍圖,這樣的一個二維度分類表便叫做雙向細目表(two-way specification table)。雙向細目表是命題、編制試卷的藍圖,它具體規(guī)定了各部分教學內(nèi)容考核的目標和要求,規(guī)定了各部分考核內(nèi)容應(yīng)該占的權(quán)重或分值。教材內(nèi)容知識理解應(yīng)用分析綜合評價總計百分比細胞選擇842626%簡答42422新陳代謝選擇482424%簡答4233生殖發(fā)育選擇24332828%簡答4453生命活動調(diào)節(jié)選擇24643232%簡答33總計16311916108百分比100100%教學目標教師在設(shè)計雙向細目表時必須注意:第一,命題的范圍在教學過的教材內(nèi)容范圍之內(nèi);沒有教學過的教材內(nèi)容范圍,不應(yīng)該有試題被

9、命題出來。第二,雙向細目表邊緣小格中的數(shù)字,不可以為零,也就是說,雙向細目表中列出的教材內(nèi)容或教學目標不能沒有適當?shù)脑囶}。第三,教師可以針對自己的命題及評分的習慣,選定雙向細目表中所陳述的測驗題型,變化或增減所預(yù)擬的試題題數(shù)或分值。 (三)選定測驗的題型 客觀性試題(選擇型試題)選擇題 是非題配合題 填空題 解釋性習題主觀性試題(填充型試題)簡答題 限制反應(yīng)題 論述題客觀試題與主觀試題比較二、編擬測驗試題 (一)編擬試題的一般原則(P210)1試題取材均勻,并具有教材內(nèi)容的代表性。2試題的敘述應(yīng)力求簡明扼要,題意明確。3各個試題宜彼此獨立,互不牽涉,并避免含有暗示答案的線索。4試題宜有公認的正

10、確答案或相對較佳的答案。5試題中某些錯誤,雖不影響答案的選擇,也應(yīng)當避免。6凡具有爭議性的試題,應(yīng)該注明命題參考資料的來源。7若要測量學生的高層次認知能力,則試題不一定要有固定答案。8試題的敘述應(yīng)重新組織,避免直接抄課文或原來教材。9試題應(yīng)重視重要概念或原理原則的了解與應(yīng)用,要避免偏難瑣碎及零碎知識的記憶。10避免使用與測驗無關(guān)的敘述,增加作答困難。11命題不要超過單元教學的評價目標。12提早命題,以預(yù)留時間進行試題審查或修正。13命題數(shù)量盡量多一些,作為備用試題。(二)主觀型試題的命題原則(P211)1盡量使問題的預(yù)期答案在內(nèi)容和形式上都能明確界定,避免使用缺乏明確內(nèi)容要求的試題。2在問題中

11、明確指出學生應(yīng)回答的范圍。3預(yù)期答案不要太長。4在每一試題之后,注明回答該題所需的時間和該題的分數(shù),讓學生能夠根據(jù)命題者建議的時間和題分斟酌其答案的繁簡和內(nèi)容的深度。5命題完畢后,自己先試做一遍,以確定不會有題意不清或答案太繁的情況。6不提倡選題作答。(三)選擇題的命題原則(P211)1題干本身是一個具有完整意義的句子。請比較下列兩個例題。2題干要簡潔,但要將題意表達清楚,不要包含不必要的信息,造成費解。3除非擬評價非常重要的科學概念,一般情況下,題干不使用否定。必須使用否定時,應(yīng)在否定詞下劃線或加著重號,以提醒學生注意。否則學生因疏忽否定字眼而答錯該題,并不是評價成就的本意。4每一題的選項以

12、四或五個為宜,其中應(yīng)有而且最好只有一個正確的或最佳的答案。5每一選項在語法、語氣和句子長度等方面,盡可能保持一致。6所有的選項都應(yīng)合理,不可不合邏輯,否則便失去誘答效果,學生也就會很容易猜出何者是正確答案。7正確答案的出現(xiàn)次序應(yīng)是隨意的,不可為了閱卷方便而以一定次序排列。否則,學生很容易猜對答案。8可適當使用“以上都對”或“以上都錯”為選項。 選擇題適用于:應(yīng)用分析綜合評價優(yōu)點:效度較高適用于各種不同認知層次(通用性強)書寫量小猜測幾率降低知識覆蓋面廣不足編制較判斷題要有一定的困難編制似是而非的選項較為困難例題1例題:山楂果實中富含糖分和維生素C,常食用的功效主要是()消食健胃止咳化痰降血壓補

13、氣益血應(yīng)考查核心概念例題22003年,我國部分地區(qū)出現(xiàn)了較為嚴重的非典型肺炎疫情,經(jīng)過科研人員研究確認引起非典型肺炎的病原體是一種冠狀病毒,為了控制非典疫情的傳播,我國政府采取了一系列的措施。請問下列屬于非典傳播途徑的是( )A. 空氣傳播B. 血液傳播C. 水源傳播D. 接觸傳播題干應(yīng)簡捷明了避免套話空話例題3北方果樹由根系吸收的水分主要用于( )A 光合作用B 蒸騰作用C 植物的生長D 果實的形成避免無用信息的干擾例題4下列為成年人有關(guān)血液的正常生理數(shù)值,其中正確的是( )A 白細胞:500010000個/毫升血液B 紅細胞:男子平均為500萬個左右/毫升血液C 血紅蛋白:女子平均為12克

14、/10毫升血液D 血小板:1030萬個/毫升血液例題5例題:下列哪項是正常成年女子血液中紅細胞的數(shù)量( ) A 7109/升B 100109個/升 C 150109個/升D 4000109個/升題目之間不能前后提示 (self-contained)例題6以下說法正確的是哪項?A. 房室瓣位于心房與心室之間B. 條件反射的反射弧是固定不變的C. 寄生是一種生物生活在另一種生物體內(nèi)的現(xiàn)象D. 病毒通過不斷地分裂來繁殖后代題干意思明確一個題目應(yīng)圍繞一個主題或思想例題8_是人類的主要能源物質(zhì)。維生素脂肪蛋白質(zhì)糖類空格不應(yīng)放在句首例題9下列關(guān)于病毒的形態(tài)結(jié)構(gòu)和生命活動特點的描述錯誤的一項是_。病毒比細菌

15、小得多由蛋白質(zhì)外殼和核酸組成的核心構(gòu)成通過不斷分裂來繁殖后代離開寄主細胞后不能獨立生活盡量避免使用否定式題干,若一定使用,則需將否定詞用著重符凸出顯示例題10下列哪些能夠更準確地表示在降雨循環(huán)中水與太陽熱能之間的關(guān)系?B. C. D. 關(guān)照一杯冰紅茶 時,杯子外壁上 有水珠凝集 各選項應(yīng)保持格式一致例題11下列哪些能夠更準確地表示在降雨循環(huán)中水與太陽熱能之間的關(guān)系?關(guān)照用玻璃片覆蓋的 水槽時,玻璃的下表 面有水珠凝集B. 光照密封的紙盒,里面 的植物偏向照光的一側(cè)C. 陽光照在人的臉上, 當他運動時,他的 臉上會形成汗滴 D.關(guān)照一杯冰紅茶時, 杯子外壁上有水珠凝集 例題12研究人員測出玉米的

16、體細胞中有20條染色體,那么受精卵中染色體的條數(shù)是_條。 20 10 40 30選項應(yīng)按一定的順序排列(如時間先后,數(shù)字大小等)例題13下列有關(guān)寄生的敘述正確的是_。寄生是一種生物取食另一種生物的現(xiàn)象。寄生是一種生物生活在另一種生物體內(nèi)的現(xiàn)象。寄生是一種生物生活在另一種生物體內(nèi)、體表、或體外并獲取營養(yǎng)維持生活的現(xiàn)象。寄生是一種生物生活在另一種生物體表的現(xiàn)象。選項長度和復(fù)雜程度保持一致,避免提供暗示例題14雞的品種很多,但它們的祖先都是原雞。原雞被培育成現(xiàn)在各種良種雞的正確原因是_。原雞產(chǎn)生了多種不遺傳的變異,經(jīng)自然選擇變異逐代積累而形成各個品種。原雞產(chǎn)生了多種可遺傳的變異,經(jīng)自然選擇變異逐代積

17、累而形成各個品種。原雞產(chǎn)生了多種不遺傳的變異,經(jīng)人工選擇變異逐代積累而形成各個品種。原雞產(chǎn)生了多種可遺傳的變異,經(jīng)人工選擇變異逐代積累而形成各個品種。使用學生熟悉的詞語例題15下列結(jié)構(gòu)屬于植物細胞的是_。細胞壁細胞膜細胞核液泡以上都正確下列關(guān)于動物在自然界中的作用敘述正確的是( )A 可維持生態(tài)平衡B 可幫助植物傳粉和傳播種子C 可維持維持碳氧平衡D 以上都正確例題16盡量不要過多使用“都正確”“都不正確”作為選項例題17綠色植物合成有機物、貯存能量的生理過程是_。呼吸作用光合作用蒸騰作用同化作用避免選項之間相互包容(四)是非題的命題原則(P213)1避免使用一般性敘述來命題,而應(yīng)盡量詳細說明

18、題意,以免題意不明,學生無法明確判別。2避免零碎、不重要或純記憶性的命題。3避免使用否定,尤其是雙重否定的命題。4避免以冗長而復(fù)雜的敘述來命題。5除非有因果關(guān)系存在,在同一命題中,應(yīng)避免包括兩個或兩個以上的科學概念。6答案為是與非的命題應(yīng)約各占一半,否則相差太多時,有考試技巧的學生便可借助是與非出現(xiàn)的頻率來猜題,使評價結(jié)果信度偏低。 判斷題適用于:回憶和識記;有兩種選擇的概念(或?qū)蝈e)優(yōu)點量大答題速度快,每分鐘可完成3-4題不足容易作答區(qū)分度問題 猜測答案信度較低例題1蛇無四肢,體表有鱗片,能夠感受溫度的變化。應(yīng)考查核心概念(key concept)例題2養(yǎng)魚缸內(nèi)充滿了水,養(yǎng)了一些水生植物和

19、小魚,缸內(nèi)還加了一些浮游動物,將魚缸密封后放到有陽光的窗臺上,經(jīng)過一段時間,魚缸就成了一個平衡系統(tǒng)。其中水生植物是生產(chǎn)者。應(yīng)簡捷明了(concise)例題3出芽生殖是由母體生出形態(tài)結(jié)構(gòu)與母體相似的芽體,芽體長大后與母體脫離,形成新個體。不能從課本上直接引用原話例題4所有的變異都是有害的。只有綠色植物才是生產(chǎn)者。避免具體的限定詞例題5兩只雄盤羊為爭奪食物而發(fā)生的爭斗不屬于攻擊行為。蕨類不是無維管束植物。盡量避免否定式陳述,如果需要,應(yīng)將否定詞用著重符標示出來例題6轉(zhuǎn)基因食品對人類有害,我們應(yīng)該拒絕食用。 應(yīng)盡量避免有爭議的話題(controversial issues)例題7農(nóng)業(yè)上若施肥過多,易

20、造成燒苗現(xiàn)象,這是因為土壤溶液的濃度小于作物根毛細胞的細胞液的濃度。細菌的個體一般比真菌小。神經(jīng)元的基本結(jié)構(gòu)包括細胞體和軸突兩部分。靜脈血管的特點是管壁薄、彈性小,血流慢。生物的變異是定向的。一對夫婦生了一個色盲男孩,那么下一個孩子則不一定是色盲。應(yīng)避免答案的規(guī)律性(五)配合題的命題原則(P213)一組配合題,通??煞譃榍疤岷瓦x項兩個部分。是在要求學生尋求兩件事實或敘述之間的關(guān)系。1在一配合題中,前提與選項的內(nèi)容均應(yīng)是同質(zhì)的,不可將不相關(guān)的內(nèi)容勉強湊合。2前提與選項的數(shù)目應(yīng)不同,同時應(yīng)說明清楚選項可以使用的次數(shù),如:每一個選項只能使用一次或兩次或兩次以上或一次都不選。3前提的句子通常應(yīng)比選項長

21、,而且將選項置于右方。4選項應(yīng)依合理或合乎邏輯的方式排列,避免與前提之間有任何順序上的相關(guān)存在。5每一配合題應(yīng)附一作答說明,使學生對作答方式能一目了然。6同一配合題的所有前提和選項應(yīng)置于同一頁內(nèi),不要分開在兩頁上,以免增加學生答題時翻頁的麻煩,甚至因疏忽而造成錯誤。 匹配題適用于知識 理解優(yōu)點覆蓋面廣,占用空間小對事實性知識較為適用不足費時 不利于測查高階思維能力填空題優(yōu)點知識覆蓋面廣考查低階認知能力猜測幾率大大降低不足編制困難:讓學生清楚所要考查的內(nèi)容考查的能力低容易包含與答案相關(guān)的暗示評分耗時例題1鳥類有很多結(jié)構(gòu)適于飛翔,如胸肌_、直腸_,不能儲存糞便、前肢_等。以下屬于鳥類適于飛翔的結(jié)構(gòu)

22、特征有_胸肌發(fā)達前肢變?yōu)橐?長有絨羽長有爪身體呈流線型要考查核心概念例題2維生素_與_的代謝有關(guān),缺乏時,會產(chǎn)生_病。維生素D與人體內(nèi)_的代謝有關(guān)。留有足夠的答題信息例題:開始使用殺蟲劑時,對某種害蟲效果顯著,但隨著殺蟲劑的繼續(xù)使用,該害蟲表現(xiàn)出越來越強的抗藥性。實驗證明害蟲種群中原來就有存在具抗性的個體。這證明:(1)害蟲種群中個體抗藥性的_體現(xiàn)了生物的變異一般是_的。(2)殺蟲劑的使用對害蟲起了_作用。而這種作用是_的。設(shè)問不明確,限定不嚴密第一空有“作用”一詞限定,題意明確。而第二空則指令不強,缺少限定。(六)簡答題的命題原則(P214)1命題題意要明確,限定要嚴密。2不能從教科書上直接

23、摘錄一段句子來命題。3一般來說,問題型的命題比填空型的命題對答案的要求更明確。4假如期望的答案要帶有單位,應(yīng)將單位標示出來。5假如題干使用填空型,原則上以一題一空格為原則,盡量不要在一個題目內(nèi),要求學生填兩個或兩個以上的空格。因為空格愈多,通常題意愈模糊。(七)解釋題或?qū)嶒烆}的命題要領(lǐng)(P215)制作這類型試題時,應(yīng)先設(shè)計或轉(zhuǎn)錄一段科學概念、科學實驗結(jié)果或圖表等,再根據(jù)其內(nèi)容,設(shè)計一些客觀型試題綜合題適用于應(yīng)用綜合評價優(yōu)點不能猜測 可使學生展示能力以組織知識,表達觀點等可激勵進一步的學習不足考查的知識面窄,效度較低編制難度較大主觀性,評分的可信性評閱耗時三、試題與測驗的審查教師必須對試題進行審

24、查、剪輯,再匯編成正式的測驗卷。 邏輯的審查:評閱試題與教學內(nèi)涵(或教學目標)間的關(guān)聯(lián)性,又可稱作形式審查;實證的審查:評閱學生的反應(yīng)組型是否是所期望的,又可稱作客觀審查。 邏輯的審查(一)邏輯的審查 1測驗的一致性(試題與教學內(nèi)容是否一致)試題是否能代表所要測量的行為目標?試題是否與教學目標一致?試題是否與教學的呈現(xiàn)方式相一致? 請校內(nèi)任教相同科目的其他同仁過目,以學科專家的眼光去察看各試題是否與上述三項審查重點相符合。 邏輯的審查2測驗的適當性檢查重點在于查驗試題的格式、問題陳述的方式以及其他可能的影響因素,是否能夠適當?shù)胤从吵鲈囶}所要測量的行為目標。試題內(nèi)容、題數(shù)、范圍是否遵照雙向細目表

25、的計劃,試題類型是否符合應(yīng)有的命題原則?題意表達是否清楚?試題呈現(xiàn)方式與作答說明是否明確,試題是否代表所要測量的行為目標;問題的敘述有無前后矛盾、提供暗示答案的線索或重疊出題等等。 (二)實證的審查 以實證的方法審查測驗試題,主要是試題功能的分析和教學敏感度的分析。通過預(yù)試的方式進行實證的試題審查 1試題分析試題分析的目的在于審查試題品質(zhì)是否符合所要測量的學習領(lǐng)域和測量理論的要求,以一些量化的指標作為挑選試題的依據(jù)。 難度是指試題答對人數(shù)占總?cè)藬?shù)的百分比,亦即是指試題正確反應(yīng)的幾率。 區(qū)分度則是指試題能夠區(qū)別答對和答錯人數(shù)的百分比,也是指試題能夠區(qū)別高低不同能力組群的功能。 2教學敏感度分析教

26、學敏感度是指不同難度的試題具有代表教學效能的傾向,它可以用來判定教學是否有錯誤或試題本身是否有暇疵及不適當之處。 教學敏感度是評判試題鑒別功能好壞的參考指標。較常用教學敏感度指標是前后差異指數(shù)(pre-to-post difference index,簡稱PPDI),定義: PPDI=(后測的難度)-(前測的難度) 該指數(shù)的值域介于-1.0到1.0之間。在正常的教學情境里,PPDI指數(shù)值介于0.10到0.60之間。PPDI指標被用來幫助教師檢查每個試題與教學之間的品質(zhì)關(guān)系,以便作出下列三種決定之一:保留;刪除;修改該試題。 四、試題與測驗的分析 大規(guī)模的或正式的標準化成就測驗必須經(jīng)過嚴謹?shù)脑囶}

27、分析和測驗分析后才能使用。 試題分析是針對每一個試題的分析,其內(nèi)容主要包括:難度的分析;區(qū)分度的分析;誘答力的分析等。測驗分析是針對整個測驗試卷的分析,其內(nèi)容主要包括:信度的分析;效度的分析;差異度等基本描述性統(tǒng)計分析。 五、試卷的編輯 試卷編輯是依據(jù)測驗?zāi)康膶⑦m當?shù)膬?yōu)良試題編輯成一整份測驗試卷。 (一)試卷的長度試卷長度是針對測驗題數(shù)的多少而言??梢钥紤]下列六個因素。 1.測驗的目的:單元應(yīng)比整學期少;形成性評價比終結(jié)性評價多;效標參照測驗比常模參照測驗的多。2.試題的類型:客觀測驗應(yīng)比主觀測驗多;選擇型比補充型多。3. 信度的高低:宜增加復(fù)本試題的數(shù)目。4.學生的年齡:年齡愈小應(yīng)愈少。5.

28、學生的能力:適用于能力較低學生的比較高學生的少。6.作答的時限:速度測驗比難度測驗的題數(shù)多。 (二)試題的難度 測驗試題的難度選擇,取決于測驗的目的。常模參照測驗,使用難易適中的試題,而淘汰太難或太易的試題。效標參照測驗,決定試題的難度因素是學習材料與學習涵蓋的范圍。(三)試題的排列1根據(jù)試題難度來排列將簡單的試題排列在前,困難的試題排列在后,以符合作答的心理原則 2根據(jù)試題類型來排列3根據(jù)教材內(nèi)容來排列4根據(jù)教學目標或測量能力來排列(四)編制試卷指導(dǎo)語 說明包括:測驗?zāi)康?;作答時間;記分方法;答題要求;試題分數(shù)的分配,猜題是否扣分;是否可以攜帶及使用教科書、講義、筆記、尺、圓規(guī)、或計算器等;

29、答案紙與試題冊是否分開作答,分別交卷;是否允許學生在答案紙或試題冊上注記或補充說明事項;考試中途是否可以舉手發(fā)問等,以及其他需要特別說明的事項。 第三節(jié)教師自編成就測驗:閱卷和評價結(jié)果的統(tǒng)計分析 一、試卷的評閱 (一)評閱主觀題應(yīng)注意的原則(P221)確定明確的分值給分系統(tǒng):計點法、分級法閱卷中保持平行,減少誤差(二)評閱客觀題應(yīng)注意的原則(P222)客觀題是否倒扣二、試題分析 試題分析是對試卷中單個試題的測試結(jié)果進行分析,從而確定試題的品質(zhì)??梢宰鳛檎皆嚲泶_定前預(yù)試階段的一項基礎(chǔ)性工作,作為實證審查的組成部分,可以在正式測試后作為整個測試工作評價的一個方面。內(nèi)容包括:難度分析;區(qū)分度分析;

30、針對選擇題的誘答力分析。 (一)試題分析的步驟(P223) 1將試卷按得分的高低排列。2由最高分向下取全部試卷數(shù)的27%或1/3,稱為高分組。3再由最低分向上取與高分組相同份數(shù)的試卷,作為低分組。4分別計算高、低分組,選答各試題每一選項的人數(shù),記錄在試題卡上, 5計算各試題的難度(P),以百分比表示,其計算方法如下: 難度(P)=(RU + RL)/2N RU:高分組答對該題人數(shù) RL:低分組答對該題人數(shù) N:高分組或低分組人數(shù)6計算各試題的區(qū)分度(D),其計算方式如下: 區(qū)分度(D)=(RURL)/N7評價每一試題的選項的有效性或誘答力。作為選擇題中一個有效的選項,應(yīng)該做到:至少有一位低分組

31、學生選擇該不正確選項;選擇該不正確選項的低分組學生人數(shù)應(yīng)該比高分組學生人數(shù)要多。8將所有試題依其難度與區(qū)分度制作綜合分析表.(二)如何評價和改進試題 制作試題卡簡便方式三、試卷分析 試卷分析是對整個測驗的品質(zhì)作出分析。通過試卷分析確定本測驗是否達到測驗?zāi)康?,是否真實有效可信。試卷品質(zhì)的分析包括試題分析、基本的描述性統(tǒng)計(descriptive statistics)分析,以及信度和效度分析。 (一)試卷的綜合分析計算出測驗試卷的每個試題的難度(P值)和區(qū)分度(D值),然后分別以試題的P值和D值兩個維度作坐標,根據(jù)各試題的P、D值,將題號填人坐標內(nèi)的空格,形成一個綜合分析表。綜合分析表可以簡單明

32、了地了解在某一次測驗評價中,有多少試題和那些試題的P、D值達到理想,那些試題的P值或D值或兩者都沒有達到理想而需要改進。 1難度(P)分析 常模參照評價中,希望將受試者的得分盡量分散開來,以便比較學習成就的優(yōu)劣。難度以在50%左右為最好。實施學習成就評價時,希望學生的平均得分落在滿分與機遇得分的中間,理想的P值以“期望平均得分”為準。 P0.8 試題太易;P0.8 、P0.4、0.6的中等難度試題應(yīng)占60%。整套試卷平均難度在0.40.6之間。 2. 區(qū)分度(D)分析 D值是介于-1與1之間。理想的試題應(yīng)該是所有高分組的學生都答對,而低分組的學生都答錯,此時,D值為1;相反則D值為-1;常模參

33、照評價而言,D值愈大,學生得分便愈分散,相應(yīng)地,試卷標準差(SD)也比較大,試題品質(zhì)較高,信度也較大。在學習成就評價上,我們通常以一定的標準來評價(P227表10-5)。 鑒別指數(shù)題目性能0.4以上0.3-0.39很好良好,修改會更佳0.20-0.290.19以下尚可,仍需修改差,必須淘汰(二)試卷的基本描述統(tǒng)計分析 1平均數(shù)(mean) 2標準差(standard deviation) 3相關(guān)性分析(correiation Study) (三)試卷的信度分析 信度是指評價的結(jié)果(分數(shù))與其擬評測的學習成就的一致性。 評估信度的資料來自評價的結(jié)果而非評價工具本身。當我們要評估某一評價工具所測得

34、的結(jié)果(分數(shù))的信度有多大時,便往往通過觀察本次評價結(jié)果(分數(shù))是否與其他類似目標的評價結(jié)果,(即另一次評價的分數(shù))一致來判斷,若一致性頗高(即高分者仍得高分,低分者仍是低分),便可認為該評價結(jié)果(分數(shù))應(yīng)可測得學生的真正學習成就。影響評價結(jié)果信度的因素:試題的數(shù)量分數(shù)的分散度試題的難度試題的區(qū)分度評價工具的客觀性2信度系數(shù)的估算方法 (1)重測法 :以同一份試卷測一群學生兩次(2)對等法 :制作兩份在內(nèi)容、難度和題型上盡可能類似的試卷(3)分半法:在實施測驗之后,將每一份試卷的奇數(shù)和偶數(shù)題分別計分(4)庫李法 :KR20和KR21 提高測驗信度的方法適當增加測驗長度;與能力有關(guān)的測驗,其難易

35、程度要適中;測驗的內(nèi)容不應(yīng)過于復(fù)雜;測驗的實施和評分方法要標準化。(四)試卷的效度分析 效度(validity)是指測驗分數(shù)的正確性。就是指一個測驗?zāi)軌驕y量到它所想要測量的特質(zhì)的程度。就學習成就評價的范圍來說,所謂效度是指評價工具是否精確地測出了該工具期望評測的成就。評定內(nèi)容效度的方法首先,請所測學科的專家檢查雙向細目表是否符合課程大綱或課程標準的要求,各章節(jié)的內(nèi)容比例是否合理; 然后,然后對測驗題目與雙向細目表進行比較,如果吻合程度高,則內(nèi)容效度高。實際工作中需要注意下列事項(P230):1. 答題說明應(yīng)明確詳盡,使學生不至于有任何混淆或誤會。2編題所用的詞匯和句子不可艱澀深奧,以致學生因無

36、法看懂而無從下筆答題。3語意要清楚明確,不可稍有模糊。4試題數(shù)量不可太少。5編題時不可有意無意地在題目中提供任何與答題有關(guān)的線索,導(dǎo)致學生猜題。6試題難度應(yīng)適當。7試題應(yīng)盡可能評側(cè)重要的概念、思考過程、知識的理解、分析和綜合,而不宜故意設(shè)置陷階,評測一些瑣碎、零星的記憶性知識。8試題的排列次序應(yīng)先易后難,以免學生花大多時間在較難的題目上,以致時間不足而放棄了一些容易的試題。9信度是效度的必需條件,因此,效度高的評價、首先信度要夠。10同一試卷重復(fù)使用多次,效度會逐漸降低。 第四節(jié) 實作評價 實作評價可定義為:具相當評價專業(yè)素養(yǎng)的教師,編擬與學習成果應(yīng)用情境相類似的仿真測驗情境,或真實的測驗情景,讓學生表現(xiàn)所知、所能的學習成果的評價過程。 實作評價的重點,通常是放在實際表現(xiàn)的過程、作品或這兩者的組合上,具體情況視實際表現(xiàn)活動的性質(zhì)而定。在教學之初,教師會比較重視正確的表現(xiàn)過程;學生逐漸熟悉正確的表現(xiàn)過程后,則會將注意力逐漸轉(zhuǎn)移到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論