教育測量與評價_第1頁
教育測量與評價_第2頁
教育測量與評價_第3頁
教育測量與評價_第4頁
教育測量與評價_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Revisedasof23November2021第一章、教育測量與評價的學(xué)科開展教育測量與評價一.教育測量1、測量:根據(jù)法那么給事物賦予數(shù)量.史蒂文斯測量:客觀事物及其屬性;所依據(jù)的規(guī)那么或方法;數(shù)量化的結(jié)果.2、教育測量:廣義:對于教育領(lǐng)域內(nèi)的事物或現(xiàn)象,根據(jù)一定的客觀標(biāo)準(zhǔn),作縝密地考核,并依據(jù)一定的規(guī)那么將考核的結(jié)果予以數(shù)量的描述.狹義:是指對學(xué)生某些學(xué)科經(jīng)過學(xué)習(xí)和練習(xí)之后,所獲得的知識、技能的測量.又稱成就測量、學(xué)業(yè)成績測量或?qū)W科測量.3、教育測量的特點:O1.間接性和推斷性O(shè)2.測量對象的模糊性和測量誤差的不可防止性O(shè)3.量表具有多樣性,結(jié)果具有相對抽象性O(shè)4.測量目的的針對性二.教

2、育評價評價:評:評定;價:價值教育價值教育評價:注重效果:美國的泰勒;注重資料的獲得:美國的克龍巴赫、斯塔弗爾比姆;注重評價方法、手段:中國的張秀理、日本的長谷川容1、教育評價的概念:教育評價是評價者對教育活動或行為主客體價值關(guān)系、價值實現(xiàn)過程、結(jié)果及其意義的一種熟悉活動過程,其核心內(nèi)容是揭示教育活動或行為中的客體對主體的需要、目標(biāo)的價值意義.三.教育測量與評價的關(guān)系O聯(lián)系:教育測量就是指根據(jù)一定的理論、規(guī)那么,運用一定的測量工具對教育現(xiàn)象進(jìn)行數(shù)量化描述的過程教育評價是對教育現(xiàn)象狀態(tài)和價值的判斷,這一判斷是以對評價對象的客觀描述為前提的,沒有對評價對象的客觀描述,就不會有對評價對象價值的客觀判

3、斷O教育測量是教育評價的根底,教育評價要在教育測量所獲得的客觀信息的根底上進(jìn)行.同時,教育測量的結(jié)果要通過評價才能獲得實際意義.教育測量與評價的區(qū)別:O第一,測量是對事物數(shù)量特征的獲得.而教育評價那么是對教育現(xiàn)象客體的價值進(jìn)行判斷.O第二,教育測量是一種純客觀的過程,其突出特點是客觀性.而教育評價那么具有兩種屬性,即客觀性和主觀性O(shè)第三,測量的任務(wù)是對事物的量的熟悉,而評價作為一種熟悉活動,是人的意識對實踐活動及其結(jié)果的綜合反映,它反映的是活動的過程和終點,又是新的實踐活動的起點.教育測量與評價的產(chǎn)生與開展過程:一.教育測量的產(chǎn)生1904年以前教育測量的萌芽期中國的科舉制隋煬帝大業(yè)二年,公元6

4、06年科舉制的特征:逐級考核、制度完備、考場嚴(yán)格、命題標(biāo)準(zhǔn)科舉制的考核方法:口試、貼經(jīng)、墨義、策間、詩賦O產(chǎn)生在中國、開展在西方美國賀拉斯曼1845年將“筆試引入美國英國費舍在1864年?作業(yè)量表集?美國賴斯在1897年的?拼字實驗?19041915年教育測量的開拓期:O美國桑代克的巨著?精神與社會測量導(dǎo)論?問世.標(biāo)志著以科學(xué)理論為指導(dǎo)的教育測量理論的誕生.O桑代克在這本巨著中提出:無論什么東西,只要存在,總存在于數(shù)量之中O麥克爾提出:任何東西,存在于數(shù)量中的,都可以被測量O這就是后來人們說的“凡存在的東西必有數(shù)量;凡有數(shù)量的東西都可以測量O這兩句話,看成是構(gòu)成一切測驗和量化評價的公理.o19

5、09年,桑代克根據(jù)“等距原理創(chuàng)造了編制量表的單位,編制了標(biāo)準(zhǔn)化的測驗量表.年教育測量的興盛期:O在桑代克的影響下,教育測量的運動轟轟烈烈的開展O測驗品種有算術(shù)測驗、書法測驗、學(xué)科測臉、智力測驗、個性測驗、興趣測驗等,在數(shù)量上已有3000多種O標(biāo)準(zhǔn)化測驗的問世年教育測量的批判期:對教育測量批判的原因:O教育測量雖然能使教育成就定量化、客觀化、標(biāo)準(zhǔn)化;但畢竟不能測量出人的學(xué)力和人格的全部內(nèi)容.O第一次大戰(zhàn)以后,人們的教育觀點發(fā)生了很大的變化,不在將教育看成是單純的傳授知識,而是將人的全面開展作為教育目標(biāo).而人的全面的重要因素如:社會道德、人的情緒態(tài)度、動機(jī)興趣、鑒賞力等是不能光靠測量的.教育測量存

6、在的弊端:O為測量而測量,盲目追求量化,無視教育效勞對象的整體目標(biāo)與價值.O教育測量的理論根底只有心理學(xué)、統(tǒng)計學(xué)和測量學(xué),而沒有教育學(xué)原理.二.教育評價的產(chǎn)生1、教育評價產(chǎn)生的社會背景:O19291933年席卷美國、涉及全球的經(jīng)濟(jì)大蕭條O社會與教育危機(jī)四起O生產(chǎn)過剩、工廠倒閉、工人下崗O學(xué)校因經(jīng)濟(jì)不景氣,局部學(xué)校關(guān)閉,有些學(xué)校的班級減少.O整個社會和教育皆處于反省之中O1930年美國有25%的失業(yè),青年近乎100%找不到工作,1910年1417歲的青年17%上大學(xué),而到1930年上升到51%.O有相當(dāng)一局部人上高中并不想上大學(xué),而當(dāng)時的美國高中設(shè)課就是為了上大學(xué)效勞的,為此中學(xué)設(shè)課與失業(yè)青年的

7、需求就產(chǎn)生了鋒利的矛盾2、教育評價的起源:美國進(jìn)步主義聯(lián)盟負(fù)責(zé)人艾欽于1933-1940年領(lǐng)導(dǎo)了中學(xué)課程改革實驗研究,其中課程評價委員會由俄亥俄州的州立大學(xué)教授泰勒主持,這就是美國教育歷史上著名的“八年研究,也是教育評價問世的開始.八年研究的內(nèi)容:O泰勒教授選了30所參加實險的高中學(xué)生,對這些學(xué)生進(jìn)行了4年中學(xué)、4年大學(xué)學(xué)習(xí)的追蹤研究,歷時“八年,這也是“八年研究的由來.O當(dāng)時選進(jìn)步學(xué)校和和傳統(tǒng)學(xué)校學(xué)生各1475人,按性別、年齡、種族、學(xué)業(yè)水平傾向、家庭、社會環(huán)境、職業(yè)興趣和嗜好等根本原那么進(jìn)行一一配對,進(jìn)行比擬.評價是八年研究的有機(jī)組成局部,泰勒認(rèn)為課程方案和編制必須答復(fù)以下四個根本問題O1

8、、應(yīng)幫助學(xué)生到達(dá)什么目標(biāo)O2、為到達(dá)目標(biāo)應(yīng)幫助學(xué)生學(xué)習(xí)那些預(yù)期的知識O3、怎樣組織學(xué)習(xí)過程才能使學(xué)生的學(xué)習(xí)成效最大O4、怎樣評價教學(xué)方案結(jié)果發(fā)現(xiàn):O來自實驗的學(xué)生在大學(xué)四年中,每年獲學(xué)術(shù)性榮譽(yù)略多;O具有更強(qiáng)的理智、好奇心和學(xué)習(xí)動機(jī);O思維更精密、更系統(tǒng)、更客觀;O對教育的意義有更清楚的看法;O對新情況有更強(qiáng)的應(yīng)變水平;O具有更有效的解決問題的方法;O更多的參加有組織的學(xué)習(xí)團(tuán)體;O獲得非學(xué)術(shù)的榮譽(yù)更多些;O對職業(yè)的選擇有更好的定向;O更積極的關(guān)注全國和全世界的事物.新舊課程比擬結(jié)論:O前三項經(jīng)統(tǒng)計檢驗均存在顯著性差異O記憶活動傳統(tǒng)的高于進(jìn)步學(xué)校,但經(jīng)統(tǒng)計檢驗兩者沒有顯著性差異教育評價的問世:O

9、八年研究后泰勒等人的研究結(jié)論是:舊課程及其教育測驗是教科書主義,測驗內(nèi)容只是要求學(xué)生記誦教材中的知識,是片面的,不能反映學(xué)生的全面開展.O泰勒提出:以全面開展的教育目標(biāo)為核心和依據(jù)的兩條相互依存的原理,即課程編制原理和評價活動原理,也就是泰勒原理教育評價的創(chuàng)始人一泰勒:O在八年工作報告中第一次提出教育評價O這個報告被稱為“劃時代的教育評價宣言O(shè)宣布了教育評價的誕生O給出了教育評價的原理、方法和手段O奠定了泰勒一教育評價之父的地位O同時也迎來了美國教育史上“泰勒時期的到來3、評價的開展:19401957年教育評價的平穩(wěn)期:特點:O教育評價的理論在不斷的進(jìn)行深入研究O布魯姆完成教育目標(biāo)分類學(xué)O教育

10、評價活動沒有普及O這與當(dāng)時美國的歷史背景有關(guān),二戰(zhàn)后,美國處于“籌劃與享受生活的時代.O社會對教育的開展很少提出新的要求.19571972批判泰勒模式時期:特點:.1957年前蘇聯(lián)的人造衛(wèi)星上天O引發(fā)美國對教育的不滿O開始批判泰勒教育模式1972現(xiàn)在專業(yè)化時期特點:O高等學(xué)校出現(xiàn)了許多教育評價的碩士、博士、博士后專業(yè)點O各類教育評價研究中央紛紛建立O如:美國有西密執(zhí)安大學(xué)評價中央、洛杉磯加里福尼亞大學(xué)研究中央等O教育評價專著、雜志大量出版O如:?評價研究?評價評論?評價信息?等4、教育測量與評價的開展趨勢及特點O教育測量的政治性得到強(qiáng)化O教育測量的重心發(fā)生了變化O教育測量的理論得到飛躍開展O計

11、算機(jī)技術(shù)的開展提升了測驗的效率O測驗的統(tǒng)計模型為教育測量學(xué)科開展提供強(qiáng)有力的理論支持O更加重視測量結(jié)果的解釋教育測量內(nèi)容的開展:O評價方法由注重相對評價轉(zhuǎn)向重視絕對評價O重視教育目標(biāo)研究O教育評價研究中不斷引入新的研究方法O越來越重視開展性教育評價理念和被評價者的參與O越來越重視元評價O越來越重視對評價結(jié)果的全面解釋和慎重處理第二章、教育測量與評價的根本原理教育評價與測量的類型一、教育評價的分類1、根據(jù)評價對象的層次和內(nèi)容來劃分:宏觀評價:指對影響到全社會的那些指導(dǎo)、標(biāo)準(zhǔn)教育活動的各種因素進(jìn)行的評價.微觀評價:指對某項具體的教育活動過程,對實施、治理教育活動的組織與個人.對教育活動指向的具體對

12、象等內(nèi)容進(jìn)行的評價2、按評價內(nèi)容的復(fù)合程度來劃分:單項評價:指針對教育評價對象某一方面狀況進(jìn)行的評價.綜合評價:指對評價對象狀況的方方面面作整體評價.3、按評價的功能及用途來劃分:診斷性評價:為使教育活動的形式、內(nèi)容、過程等更適合活動對象的自身條件及需要而進(jìn)行的評價.如:摸底測試.形成性評價:在教育活動過程中為不斷了解活動進(jìn)行的狀況以便能及時對活動進(jìn)行調(diào)整,進(jìn)而提升活動質(zhì)量進(jìn)行的評價.如:單元測驗.終結(jié)性評價:指對教育活動的效果進(jìn)行的評價.如:期末測試4、按評價參照的標(biāo)準(zhǔn)來劃分:相對評價:根據(jù)評價對象的實際狀況設(shè)定評價標(biāo)準(zhǔn).評價標(biāo)準(zhǔn)在被評對象群體內(nèi)部產(chǎn)生.絕對評價:依據(jù)某種需要或要求設(shè)定評價標(biāo)

13、準(zhǔn).評價標(biāo)準(zhǔn)在被評對象群體外部產(chǎn)生,旦標(biāo)準(zhǔn)固定.個體內(nèi)差異評價:以評價對象某一狀況作為設(shè)定評價標(biāo)準(zhǔn)依據(jù)的評價.5、按評價主體來劃分:他人評價:由活動實施者以外的人作為評價主體進(jìn)行的評價.自我評價:由活動實施者作為評價主體進(jìn)行的評價.6、按評價方法來劃分:定性評價:采用開放的形式來獲取評價信息、對評價結(jié)果的性質(zhì)進(jìn)行說明的評價活動.定量評價:采用結(jié)構(gòu)式的方法,預(yù)先設(shè)定操作化的評價內(nèi)容,收集評價對象可以量化的信息,得出數(shù)量化結(jié)果的評價活動.二、教育測量的分類1、根據(jù)測驗?zāi)繕?biāo)來劃分成就測驗:目標(biāo)在于測量學(xué)生在各學(xué)習(xí)階段學(xué)到了什么,旨在檢測教育目標(biāo)希望學(xué)生能到達(dá)的具體行為.如:學(xué)科測驗如:教學(xué)階段測驗診

14、斷和總結(jié)性測驗水平測驗:旨在測量個體的不因外界環(huán)境影響而輕易改變的、較穩(wěn)定的、表現(xiàn)在認(rèn)知水平方面的心理特質(zhì).比方觀察力、記憶力、理解力、概括力、空間水平、判斷推理水平等等.也被稱為“智力測臉?biāo)絻A向測驗:目的在于測量學(xué)生的潛在學(xué)習(xí)水平及學(xué)術(shù)開展趨向.潛在水平是指個體從未來教育或練習(xí)中可能受益的水平.這類測驗主要用于預(yù)測學(xué)生的未來成就和水平,從而可以幫助決策者和學(xué)生自己選擇適宜的學(xué)校、專業(yè)及最正確職業(yè).水平傾向測驗分為:一般學(xué)習(xí)水平測驗、特殊水平傾向測驗.2、根據(jù)測驗分?jǐn)?shù)的解釋標(biāo)準(zhǔn)來劃分常模參照測驗:目的在于考查被試的個體差異,一般用于衡量被試相對水平的,以選拔為目的的大規(guī)模測驗.標(biāo)準(zhǔn)參照測驗:

15、目的在于考查被試是否已到達(dá)某種標(biāo)準(zhǔn).一般用于以教學(xué)目標(biāo)為標(biāo)準(zhǔn)考查學(xué)生實際水平的測驗.常模團(tuán)體 總體要明確 常模團(tuán)體必須是被試總體的一個代表性樣本 樣本的大小要適當(dāng) 注意常模團(tuán)體的更新 測驗手冊中必須詳盡描述取樣過程常模參照測驗與標(biāo)準(zhǔn)參照測驗的比擬:1、從測試的目的和用途來看,它們都通過測量學(xué)生的學(xué)習(xí)成績,考查其優(yōu)劣,但常模參照性測驗將考生成績做橫向比擬,著眼于個別差異,主要用于選拔性測驗和總結(jié)性測驗等.2、從考核目標(biāo)的陳述來看,都明確具體,為編制測驗提供依據(jù),但常模參照性測驗可采用一般目標(biāo)或具體目標(biāo),而標(biāo)準(zhǔn)參照性測驗必須采取非常具體且詳細(xì)的目標(biāo).3、從題型的選擇和題目的分配來看,都需采用各種不

16、同題型,試題必須是教學(xué)目標(biāo)的有代表性的樣本;常模參照性測驗多采用選擇題,題目分散在全學(xué)科的全部知識領(lǐng)域內(nèi),題目按從易到難的順序排列;標(biāo)準(zhǔn)參照性測驗較少依賴選擇題,題目分別分布在一定目標(biāo)中,題目按教學(xué)目標(biāo)順序排列即可.4、從測試及考題的質(zhì)量要求來看,它們都根據(jù)標(biāo)準(zhǔn)化測試的編制原那么,保證測試有較高的信度和效度;常模參照測驗題目要求難易適中,強(qiáng)調(diào)題目的鑒別力,測驗信度的估計適合用統(tǒng)計方法;標(biāo)準(zhǔn)參照測驗的題目和學(xué)習(xí)結(jié)果直接聯(lián)系,不強(qiáng)調(diào)題目的鑒別力,測驗信度的估計不適合用統(tǒng)計方法.5、從解釋測試結(jié)果的依據(jù)及分?jǐn)?shù)的意義來看,兩種測試各有其依據(jù);常模參照性測驗的常模是解釋分?jǐn)?shù)的標(biāo)準(zhǔn),用地位量數(shù)表示考生在團(tuán)

17、體中的相對位置;標(biāo)準(zhǔn)參照性測驗中教學(xué)目標(biāo)是解釋分?jǐn)?shù)的標(biāo)準(zhǔn),以考生完成題目數(shù)量的百分比來表示考生的學(xué)習(xí)效果.3、根據(jù)教育測量的標(biāo)準(zhǔn)化程度來劃分:標(biāo)準(zhǔn)化測驗:指測驗的編制、實施、記分、分?jǐn)?shù)的解釋有統(tǒng)一標(biāo)準(zhǔn)和嚴(yán)格規(guī)定的大規(guī)模的測驗標(biāo)準(zhǔn)化測驗的程序:確定測試目的;編制測試藍(lán)圖命題雙向細(xì)目表;命題、組卷、試測、入庫;實測;評分,統(tǒng)計分析;寫出指導(dǎo)書.教師自編測驗:教師根據(jù)教學(xué)情況自己編制測題對學(xué)生進(jìn)行的測險.4、以測量人數(shù)多少來劃分: 團(tuán)體測驗 個人測驗5、根據(jù)所使用的材料和形式來劃分: 語言文字測驗 非語言文字測驗教育測量與評價量表心理學(xué)家史蒂文斯根據(jù)測量的精確程度把量表從低級到高級分成名稱量表、順序

18、量表、等距量表和比率量表.名稱量表: 意義:依照某種法那么給事物及屬性指派名稱或類別的量表. 功能:區(qū)分性. 數(shù)量化結(jié)果的含義:不能比擬大小. 適用的統(tǒng)計方法:次數(shù)的統(tǒng)計,如次數(shù)、眾數(shù)、百分比、離散相關(guān)、卡方檢驗等.順序量表: 含義:依照某種法那么給事物或人的心理現(xiàn)象指派名稱或類別,還可以將分類結(jié)果按數(shù)量大小進(jìn)行排序. 功能:區(qū)分性、順序性 數(shù)量化結(jié)果的含義:比擬大小,不能進(jìn)行運算. 適用的統(tǒng)計方法:中位數(shù)、百分位數(shù)、等級相關(guān)系數(shù)、肯德爾和諧系數(shù)以及秩次的方差分析.等距量表區(qū)間量表: 含義:在給事物及屬性指派數(shù)字和符號時,要求各數(shù)字或等級之間的差距是相同的,即具有相等的單位. 功能:區(qū)分性、順

19、序性、等距性 數(shù)量化結(jié)果的含義:不僅能分類、排序,還可以進(jìn)行加減運算. 適用的統(tǒng)計方法:均數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù),t、F檢驗等比率量表: 含義:有相等單位和絕對零點的量表. 功能:區(qū)分性、順序性、等距性、絕對零點. 數(shù)量化結(jié)果的含義:可以進(jìn)行加減乘除四那么運算. 適用的統(tǒng)計方法:均數(shù)、幾何平均數(shù)、標(biāo)準(zhǔn)差、相關(guān)系數(shù),變異系數(shù)、t、F檢驗等.教育測量與評價的根本原那么1、教育測量與評價原那么的性質(zhì)(1)教育測量與評價原那么是在教育測量與評價實踐活動中總結(jié)出來的具有普遍性問題根底上提出的.(2)教育測量與評價原那么反映了人們對開展教育測量與評價活動的總體要求.(3)教育測量與評價原那么具有相對穩(wěn)定性.

20、2、根本原那么(1)方向性原那么:指通過評價內(nèi)容和標(biāo)準(zhǔn)等的制定、評價過程的側(cè)重、評價結(jié)果的肯定與否認(rèn)等推動教育活動貫徹國家的教育方針,進(jìn)而滿足社會需求,保持良性開展的方向.(2)客觀性原那么:指評價主體要以真實的資料為根底,對教育活動過程和成果作出客觀的價值判斷.(3)鼓勵性原那么:指教育評價應(yīng)促使評價對象形成繼續(xù)努力或在進(jìn)一步的活動中改善缺乏之處,提升活動效果的動機(jī)或期望.(4)方案性原那么:指教育評價活動的開展及教育評價活動過程應(yīng)根據(jù)教育活動的開展而有方案有序地進(jìn)行.(5)實效性原那么:指教育評價過程應(yīng)根據(jù)評價的目的與內(nèi)容、評價對象的具體情況、具體的社會環(huán)境背景等作出切合實際的評價方案,采

21、用適宜的評價方法使評價能有效地對教育活動提供指導(dǎo)與幫助.(6)平等性原那么:指教育評價實施者應(yīng)以與評價對象共同探討教育活動得失的平等身份進(jìn)入評價活動,使評價對象將評價者作為朋友接受其評價,采納其意見或建議.第三章、編制教育測驗的一般原理和方法布魯姆的教育目標(biāo)分類系統(tǒng)把教育目標(biāo)分成三個領(lǐng)域:1、認(rèn)知領(lǐng)域;2、情感領(lǐng)域;3、動作技能領(lǐng)域.1、認(rèn)知領(lǐng)域目標(biāo)分類:布盧姆把認(rèn)知領(lǐng)域的教育目標(biāo)分為六級:知道、領(lǐng)會、運用、分析、綜合、評價.1、知道:指對先前學(xué)習(xí)過的知識材料的簡單回憶“知道又叫“知識,是認(rèn)知領(lǐng)域中最低水平的認(rèn)知結(jié)果,它所要求的心理過程主要是記憶.2、領(lǐng)會領(lǐng)會亦稱理解或領(lǐng)悟,是指將一種語言準(zhǔn)確

22、地轉(zhuǎn)化成另一種語言.它又可分為轉(zhuǎn)化、解釋和推斷三種.3、運用指在具體的情境中使用抽象概念,是對所學(xué)知識的初步運用.運用代表了較高水平的理解,比方用二元一次方程解答工程性質(zhì)的應(yīng)用題,又如把其它文獻(xiàn)中已經(jīng)提出來的新論點用來引證自己類似的實驗結(jié)果.指將一種傳播內(nèi)容分解成為它的組成因素和組成局部,以便弄清各種觀念之間的關(guān)系.5、綜合指將各種要素及組成局部組成一個整體,以構(gòu)成更為清楚的模式或結(jié)構(gòu).綜合強(qiáng)調(diào)的是創(chuàng)造水平.6、評價指為了一定的目的,對某些觀念和方法等的價值作出判斷.包含根據(jù)內(nèi)部準(zhǔn)那么判斷和依據(jù)外部準(zhǔn)那么判斷兩方面的內(nèi)容.2、對布魯姆教育目標(biāo)分類的評價: 從教育目標(biāo)劃分標(biāo)準(zhǔn)來看,布魯姆所用的標(biāo)

23、準(zhǔn)是測量學(xué)的,無論是知識、領(lǐng)會、應(yīng)用、分析、綜合還是評價每一個教育目標(biāo)都是圍繞著如何測量或操作的角度提出的. 布魯姆的教育目標(biāo)分類便于全面描述教學(xué)目標(biāo)和評定教學(xué),但未揭示各級層次的智力技能的心理機(jī)制,因而無法指導(dǎo)教師用什么方法或提供什么學(xué)習(xí)條件來實現(xiàn)教學(xué)目標(biāo). 總結(jié):教育目標(biāo)分類系統(tǒng)對認(rèn)知領(lǐng)域中的教學(xué)目標(biāo)由低到高進(jìn)行劃分,符合水平由簡單到復(fù)雜開展原那么.認(rèn)知領(lǐng)域分類標(biāo)準(zhǔn)是測量學(xué)的,有利于指導(dǎo)學(xué)習(xí)結(jié)果的測量與評價.3、測驗題目類型與測量功能:測驗題目分類:選擇型和供答型.選擇型一般要求被試在幾個選項中選擇正確的答案,如是非題、匹配題、選擇題等,后者要求被試自己提供答案,如論文題、簡做題、填空題等

24、.假設(shè)根據(jù)被試作答的范圍和評分方法不同,又可分為主觀性試題和客觀性試題,客觀性試題主要是由于評分客觀而得名,它的正確答案在測驗前就已準(zhǔn)備好,不同評分者各自獨立評分,所得結(jié)果根本上是相同的.客觀性試題一般適用于測量知識的掌握、理解、應(yīng)用、分析幾個層次的教學(xué)目標(biāo).客觀性試題的答案明確,作答簡便,因而在限定的時間內(nèi)測驗可以包含足夠數(shù)量的試題,能保證對知識內(nèi)容的覆蓋.主觀性試題主要包括論述題、操作題和作文題等.它們適合于測量較高層次的教學(xué)目標(biāo),尤其適合于測量綜合、評價等目標(biāo)層次.主觀性試題鼓勵被試積極地組織所學(xué)的資料,表達(dá)自己的觀點.被試在作答時,消耗的時間較長,在限定的時間內(nèi),試題數(shù)量不可能太多,對

25、知識的覆蓋面較小.由于沒有明確統(tǒng)一的標(biāo)準(zhǔn)答案,評分易受評閱者的主觀因素影響,因而誤差較大.一、客觀性試題的類型及其編寫技巧一選擇題1 ,結(jié)構(gòu)選擇題是由一個題干和幾個選項組成.題干一般是問題或待完成的句子,選項是幾個真假不明的答案,讓被試從中選出正確的答案.以學(xué)生慣用的模糊性用語表達(dá)誘答項.在正確選項和誘答項中使用同樣“精確的、“重要性等詞語來表達(dá).誘答項的長度和措辭的復(fù)雜性與正確選項相似.在誘答項中使用額外的線索.如固定的用詞,具有科學(xué)味道的答案,以及和題干有語義上的聯(lián)系等.保持選項之間的同質(zhì)性.(5)不能對正確答案有任何暗示同一測驗中每一個測驗試題之間應(yīng)相互獨立防止?fàn)窟B選項的文字表述,力求簡

26、短精煉.(8)應(yīng)盡量防止“以上皆是、“以上皆非的選項(二)是非題是非題又叫做二項選擇題,它通常是給被試一個句子要被試作出正誤的判斷.1、優(yōu)點:編制容易.(2)記分客觀,取樣廣泛.缺點:(1)僅能測量知識層次中最根本的結(jié)果,無法測量高層次的學(xué)習(xí)結(jié)果.(2)受猜想因素的影響很大.2 .編寫原那么(1)考核的內(nèi)容應(yīng)是重要的知識,應(yīng)有考核價值.(2)題目應(yīng)多是測量理解水平,而不應(yīng)測驗記憶性的知識,更不要直接抄錄教科書中的句子.(3)一個題目中只能有一個中央問題,或一個重要概念,防止兩個以上的概念在同一題中出現(xiàn).(4)試題應(yīng)做到是非界限清楚,用詞準(zhǔn)確,防止模棱兩可的語句.(5)題目陳述應(yīng)簡單明了,防止使

27、用復(fù)雜的句子結(jié)構(gòu),以減少因被試的閱讀能力而對測量產(chǎn)生的不良影響,應(yīng)盡量采用正面表達(dá),防止用否認(rèn)和雙重否認(rèn)的語句.(三)填空題1、優(yōu)缺點:填空題可用來考查被試對知識的記憶和理解水平,在診斷性測驗中特別適用.受被試猜想的影響小,評分比擬客觀.但填空題偏重于測量被試的知識記憶程度,使用過多容易養(yǎng)成被試死記硬背的習(xí)慣.2、編制原那么:(1)題意要明確、限定要嚴(yán)密,使空白處應(yīng)填的答案是唯一的.空白中所填寫的應(yīng)是關(guān)鍵詞語,并且要和上下文有密切的關(guān)系(3)題目中空白地方不能太多,以免句子變得支離破碎,不利于被試?yán)斫忸}意.通常一個填空題不應(yīng)超過兩個空白.(4)盡量將空白放在句子的后面或中間,而不要放在句子開頭

28、.(5)所有空白處的線段長度應(yīng)當(dāng)一致,不能隨正確答案文字的多少而長短不一,以免產(chǎn)生暗示作用.假設(shè)答案是數(shù)字,應(yīng)指明單位和數(shù)字的精確程度.(四)簡做題簡做題適合測量被試對根本知識、概念和原理的掌握、記憶情況.編制較為簡單、靈活,可以從不同角度、不同方向考慮,增大對知識考核的準(zhǔn)確度和深度,并且不受猜想因素的影響.但其無法考核綜合、分析、評價等高層次的教學(xué)目標(biāo):且評分也不夠客觀,有不同程度的正確或局部正確的答案而影響評分的客觀性.2.編制原那么:(1)問題的表達(dá)要明確,要確實能使被試用簡單的語言來答復(fù).(2)問題的答案應(yīng)該只有一個,并且答案要簡短具體.(3)防止出只考機(jī)械記憶的題,應(yīng)注重知識的應(yīng)用.

29、(4)在考查某公式的應(yīng)用時,不要給太復(fù)雜的數(shù)字,以免給計算帶來麻煩.(5)盡可能使用直接問句來提出問題.二、主觀性試題的類型及其編寫要領(lǐng)(一)論述題論述題就是向被試提出問題,需要被試用自己的語言組成一份較長答案的試題.1、優(yōu)點:(1)可以用來進(jìn)行高層次的、復(fù)雜的學(xué)習(xí)結(jié)果的測量,可以用在各種學(xué)科領(lǐng)域,特別適用于社會科學(xué)、人文科學(xué)等.(2)可以增進(jìn)學(xué)生的思考、應(yīng)用及解決問題的水平,對于被試的學(xué)習(xí)態(tài)度和學(xué)習(xí)方式可以產(chǎn)生積極的影響.(3)可以促進(jìn)學(xué)生寫作水平的提升.試題的編制比擬容易,并且受猜想因素的影響很小.缺點:(1)由于論述題一般都比擬大,在一次測試中試題的數(shù)量不可能有很多,因此,其取樣范圍比擬

30、小且不均勻,影響測驗的效度.(2)評分的主觀性強(qiáng).(3)因被試答復(fù)過于自由,答復(fù)方向又不盡相同,難于測得預(yù)期結(jié)果,重點容易失控.(4)被試作答和評分閱卷都相當(dāng)費時.2.編制原那么:(1)試題應(yīng)該用來測量較高層次的教學(xué)目標(biāo).如要求學(xué)生提出理由、解釋變量間的關(guān)系、描述與評價資料、有系統(tǒng)地陳述結(jié)論等.(2)要明確而系統(tǒng)地陳述問題,使被試能清楚地了解題目的要求.(3)應(yīng)采用答案具有統(tǒng)一定論的試題.(4)一般不允許被試選擇問題答復(fù).(5)為防止被試將時間集中在某一個他所不會做的題目上而影響對其他題目的答復(fù),因此而影響測試成績的真實性,最好在題目中能給出答復(fù)此題所需的參考時間.(二)作文題作文是對人的邏輯

31、思維、形象思維、書面表達(dá)等多種水平的一種綜合考查.編制原那么:(1)根據(jù)測試的目的和需要確定測試作文的文體要求.根據(jù)社會的需要、現(xiàn)實生活和學(xué)生的實際設(shè)計命題.(3)要根據(jù)被試的特點確定選材范圍與寫作意圖,在確定選材和寫作意圖時,要考慮對所有被試都是公平的,并且試題應(yīng)符合被試的心理特征.(4)要給被試以發(fā)揮的余地.第四章試卷質(zhì)量分析與評價質(zhì)量分析:工程分析:難度、區(qū)分度整體分析:信度、效度1、難度的含義:指測題的難易程度,是指題目對學(xué)生知識和水平水平的適合程度的指標(biāo).用P表示.難度的計算:1、題目分?jǐn)?shù)為二分變量:正確率P=R/N答對人數(shù)/全體人數(shù)適用題型:選擇題、填空題、判斷題等.又二平均得分二

32、2、題目分?jǐn)?shù)為多分值:得分率4',皿丁丁總分值適用題型:填空題、簡做題、論述題、計算題、作文題等難度取值范圍:0-1之間卷面難度:試卷包含的所有試題難度的平均數(shù).常模參照測驗難度取值范圍:試題:之間;卷面:之間基于難度的題目分析:難度過低與過高的題目原那么上要淘汰,但屬于必考的知識點,需重新命題、提升命題的難度由于出現(xiàn)科學(xué)性錯誤而導(dǎo)致難度不符,需重新命題命題、內(nèi)容均無大問題但難度不符的題目需進(jìn)行詳細(xì)分析找出原因所在2、區(qū)分度的含義:是指測驗題目對學(xué)業(yè)水平不同的考生的區(qū)分程度或鑒別能力.區(qū)分度的計田,營二"1、點二列彳S,P為該題答對人數(shù)比例;q為該題未答對人數(shù)比例為該題答對者

33、總分的平均分為該題未答對者總分平均分為所有考生總分的標(biāo)準(zhǔn)差適用題型:選擇題、判斷題等例、一測驗中某選擇題的通過率為,答對者的測驗總分平均為76分,答錯者的測驗總分平均為63分,全體被試總分的標(biāo)準(zhǔn)差為16分,求該選擇題的區(qū)分度.rph=.?j0.5x(l-0.5)=7025=0.41對計算得到的區(qū)分度值應(yīng)該再進(jìn)行統(tǒng)計檢驗(根據(jù)測驗人數(shù),查相關(guān)系數(shù)顯著性臨界值表),才能說明試題區(qū)分度的上下.2、積差相3rSxSyX表示所有被試的測題得分Y表示所有被試的測驗得分填空題、簡做題、論述題、計算題、作文題等3、兩端分組法D=P-PD為鑒別指數(shù)H為高分組在該題的難度L為低分組在該題的難度高分組:總分排序前27%的人低分組:總分排序后27%的人適用范圍:被試人數(shù)太多時測驗的區(qū)分度的估計例、10000名,成績排序前2700名的學(xué)生在第三題答復(fù)正確的人數(shù)為2500人,%2500cqq名體0500答正確的人數(shù)為500人,根據(jù)兩端分ru=0.93匕=0.1927002700組法計算第三題的區(qū)分度.D=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論