教育測(cè)量與評(píng)價(jià)(期末復(fù)習(xí)重點(diǎn))_第1頁(yè)
教育測(cè)量與評(píng)價(jià)(期末復(fù)習(xí)重點(diǎn))_第2頁(yè)
教育測(cè)量與評(píng)價(jià)(期末復(fù)習(xí)重點(diǎn))_第3頁(yè)
教育測(cè)量與評(píng)價(jià)(期末復(fù)習(xí)重點(diǎn))_第4頁(yè)
教育測(cè)量與評(píng)價(jià)(期末復(fù)習(xí)重點(diǎn))_第5頁(yè)
已閱讀5頁(yè),還剩147頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 教育測(cè)量的質(zhì)量指標(biāo)衡量教育測(cè)量的質(zhì)量,可采用四個(gè)指標(biāo):信度 主要對(duì)整個(gè)測(cè)量而言。效度 難度 主要對(duì)測(cè)量的項(xiàng)目而言。區(qū)分度 第一節(jié) 信度一、信度概念信度是指測(cè)量結(jié)果結(jié)果的穩(wěn)定性或可靠性程度。用同一種工具反復(fù)測(cè)同一種特質(zhì)對(duì)象,結(jié)果的一致性程度就叫信度一般地說(shuō),一個(gè)好的測(cè)量必須具有較高的信度,也就是說(shuō),一個(gè)好的測(cè)量工具,只要遵守操作規(guī)則,其結(jié)果結(jié)果就不應(yīng)隨工具的使用者或使用時(shí)間等方面的變化而發(fā)生較大的變化。 或者說(shuō),測(cè)驗(yàn)的抗干擾能力強(qiáng),誤差因素控制得好,測(cè)值的一致性高,就叫信度高,人們感覺(jué)可靠。可以從以下三個(gè)方面去理解測(cè)量的信度P29:信度指實(shí)測(cè)值(X)和真值(T)相差的程度信度是指統(tǒng)計(jì)量與

2、參數(shù)之間的接近程度信度指兩次重復(fù)測(cè)量或等值測(cè)量之間的關(guān)聯(lián)程度。三、信度的估計(jì)方法(信度類型)1、重復(fù)信度(再測(cè)信度)指的是同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù),一般采用積差相關(guān)的公式來(lái)計(jì)算。(板書(shū)、推導(dǎo)該公式)積差相關(guān)的使用條件:兩個(gè)變量的總體都呈正態(tài)分布,至少是單峰對(duì)稱的分布。作此判斷需要總體分布的卡方檢驗(yàn)。必須是成對(duì)數(shù)據(jù),每對(duì)數(shù)據(jù)之間相互獨(dú)立兩個(gè)變量之間呈線性關(guān)系,可由散布圖的形狀來(lái)決定。例一用一個(gè)算術(shù)四則的速度測(cè)驗(yàn)12個(gè)小學(xué)生,得分記為X,為了考察測(cè)量結(jié)果的可靠性,于3個(gè)月后再測(cè)一次,得分記為Y,問(wèn)測(cè)驗(yàn)結(jié)果是否可靠?學(xué)生序

3、號(hào) 1 2 3 4 5 6 7 8 9 10 11 12X 20 20 21 22 23 23 232425262627Y 20 21 21 20 23 23 252526262729在使用重測(cè)法計(jì)算穩(wěn)定性系數(shù)時(shí),應(yīng)注意以下問(wèn)題:1、信度的取值范圍為0,1,當(dāng)信度值較大時(shí),說(shuō)明前后兩次測(cè)量結(jié)果比較一致;2、兩次測(cè)驗(yàn)之間的時(shí)間間隔要適宜。太長(zhǎng),身心發(fā)展、遺忘、環(huán)境改變等使信度降低;太短,練習(xí)與記憶等提高了成績(jī),信度降低。3、重測(cè)法適用于速度測(cè)驗(yàn)而不適用于難度測(cè)驗(yàn);因被試很難記憶第一次,而難度測(cè)驗(yàn)相反。還適用于運(yùn)動(dòng)技能的測(cè)驗(yàn)。4、適用于異質(zhì)測(cè)驗(yàn),即一個(gè)測(cè)驗(yàn)包含幾個(gè)不同的部分,分別測(cè)量不同的心理特質(zhì)

4、。因?yàn)檫@種測(cè)試不適于計(jì)算內(nèi)部一致性信度。4、應(yīng)注意提高被試者的積極性。2、復(fù)本信度指的是兩個(gè)平等的測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。所謂復(fù)本測(cè)驗(yàn)是指在格式、內(nèi)容、題型、題數(shù)、難度、指導(dǎo)語(yǔ)說(shuō)明、施測(cè)要求等方面都一致(或相等)的兩份或多份測(cè)驗(yàn)。例二以A、B兩型英語(yǔ)復(fù)本測(cè)驗(yàn)對(duì)初中三年級(jí)10個(gè)學(xué)生施測(cè),為避免由測(cè)驗(yàn)施測(cè)順序所造成的誤差,其中5個(gè)學(xué)生先做A型測(cè)驗(yàn),休息15分鐘后,再做B型測(cè)驗(yàn);而另5個(gè)學(xué)生先做B型測(cè)驗(yàn),休息15分鐘后,再做A型測(cè)驗(yàn)。10個(gè)學(xué)生A型測(cè)驗(yàn)結(jié)果記為X,B型測(cè)驗(yàn)結(jié)果記為Y,其測(cè)驗(yàn)的復(fù)本信度如何?學(xué)生序號(hào) 1 2 3 4

5、 5 6 7 8 9 10X 19 19 18 17 16 15 15 14 13 12Y 20 17 18 18 17 15 13 15 12 12復(fù)本信度的優(yōu)缺點(diǎn)表現(xiàn):優(yōu)點(diǎn):1、兩個(gè)復(fù)本在同時(shí)使用同時(shí)使用時(shí),可以避免再測(cè)信息的一些缺點(diǎn)如首測(cè)對(duì)再測(cè)在記憶、練習(xí)、效果的影響,間隔期間獲得新知識(shí)的影響,兩次施測(cè)的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應(yīng)付測(cè)驗(yàn)所作訓(xùn)練的影響等。反映究竟是不是真正的平行測(cè)驗(yàn);換言之,反映了測(cè)驗(yàn)內(nèi)容造成的誤差。2、測(cè)驗(yàn)的兩個(gè)復(fù)本,如果在不同的時(shí)間不同的時(shí)間使用,其信度既可以反映被試在不同時(shí)間的穩(wěn)定性,又可以反映測(cè)驗(yàn)內(nèi)容的一致性。換言之,既反映了時(shí)間影響,又反映了測(cè)

6、驗(yàn)內(nèi)容的抽樣誤差。 這種同時(shí)兼顧試題抽樣與時(shí)間影響的信度,稱為等值穩(wěn)定性系數(shù),與其他信度系數(shù)相比,該系數(shù)最小,也就是說(shuō),此種復(fù)本信度是對(duì)信度最嚴(yán)格的檢驗(yàn)。3、在追蹤研究或探討某些影響測(cè)驗(yàn)成績(jī)的因素時(shí),大多使用復(fù)本測(cè)驗(yàn),分析復(fù)本信度。缺點(diǎn):1、編制兩個(gè)完全相等的測(cè)驗(yàn)是很困難的,如果兩個(gè)復(fù)本過(guò)份相似,則變成再測(cè)形式,而過(guò)分不相似,又使等值的條件不存在;2、兩個(gè)復(fù)本測(cè)驗(yàn)有可能在某種程度上測(cè)量了不同的性質(zhì),這就會(huì)低估測(cè)驗(yàn)的信度;(因內(nèi)容造成的誤差)。3、被試同時(shí)接受性質(zhì)相似的兩個(gè)測(cè)驗(yàn),可能減少完成測(cè)驗(yàn)的積極性;4、雖然兩個(gè)復(fù)本測(cè)驗(yàn)的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類旁通,有可能失去

7、復(fù)本的意義。3.1、同質(zhì)信度之分半信度就是將測(cè)驗(yàn)分半,被試在每一半測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。反映了2半題目間的一致性。 分半的方法很多,如,按題號(hào)奇偶,按難度、按題目?jī)?nèi)容。無(wú)論如何分半,都要在分開(kāi)后做微調(diào),最終目的是分成對(duì)等的兩半。如果做不到對(duì)等,就不適合求分半信度。 在實(shí)際運(yùn)用中,由于題目一般是按難度大小排列,采用奇偶分半可以使兩半測(cè)驗(yàn)的題目在難度上基本相等,因此常被采納。 分半后,計(jì)算每個(gè)被試在兩個(gè)分半測(cè)驗(yàn)分?jǐn)?shù)的積差相關(guān)系數(shù),由于只是半個(gè)測(cè)驗(yàn)之間的信度,故,再用斯皮爾曼布朗公式加以校正。3.2 同質(zhì)信度之庫(kù)德?tīng)?理查森信度適合于全部二分計(jì)分題測(cè)驗(yàn)的內(nèi)部一致性信度分析。常用的兩個(gè)公式有:(板

8、書(shū),P33)例三對(duì)初中一年級(jí)學(xué)生進(jìn)行地理成績(jī)測(cè)驗(yàn),每答對(duì)1題得1分,答錯(cuò)1題得0分,其測(cè)驗(yàn)結(jié)果如下表,試估計(jì)該測(cè)驗(yàn)的庫(kù)德-理查森信度?學(xué)生序號(hào) 題 序 1 2 3 4 5 6 總分1 1 0 0 0 0 0 12 1 0 0 1 0 0 23 0 0 0 0 1 1 24 1 1 1 0 0 0 35 0 1 0 0 1 1 36 1 1 1 0 0 0 37 1 1 1 1 0 0 48 1 1 1 1 0 0 49 1 1 0 1 1 1 510 1 1 1 1 1 1 6pqpq 請(qǐng)比較兩個(gè)公式所算出來(lái)的值當(dāng)測(cè)驗(yàn)中所有的試題難度都一樣,或平均難度接近0.50時(shí),兩個(gè)公式所估計(jì)出來(lái)的信度值

9、將相等。但是,當(dāng)測(cè)驗(yàn)中所有試題難度值極不相同時(shí),差距將較大。一般KR21比KR20信度值小。4、論文式測(cè)驗(yàn)信度論文沒(méi)有嚴(yán)格評(píng)分標(biāo)準(zhǔn),同樣題目,不同應(yīng)試者回答與得分不一樣,可用克龍巴赫阿爾法系數(shù)公式。P34該公式適用于:測(cè)驗(yàn)題型多并非都是2分計(jì)分題時(shí)。板書(shū)公式請(qǐng)閱讀,并解釋公式含義。 例4用一個(gè)包含6個(gè)論文式試題的測(cè)驗(yàn),測(cè)5個(gè)被試,結(jié)果如下,試求該測(cè)驗(yàn)的信度?題序 學(xué)生序號(hào) 1 2 3 4 5 某題得分方差1 3 6 1 6 5 2 4 3 3 2 3 3 3 4 1 2 1 4 2 5 2 1 2 5 1 4 4 5 4 6 4 6 5 3 2 總分 17 28 16 19 17 四、提高信度

10、的方法(一)信度系數(shù)多大為宜?學(xué)科測(cè)驗(yàn)0.9以上;智力測(cè)驗(yàn)0.8以上;品德測(cè)驗(yàn),達(dá)到0.6就不錯(cuò)了。作業(yè)1、用某量表測(cè)驗(yàn)10名學(xué)生,得分記為X,為了考察結(jié)果的可靠性,于15天后用原量表對(duì)這10個(gè)學(xué)生重測(cè)一次,得分記為Y,問(wèn)測(cè)驗(yàn)結(jié)果是否可靠?學(xué)生序號(hào) 1 2 3 4 5 6 7 8 9 10X 8 10 9 6 10 7 5 7 9 4Y 9 10 10 6 10 8 4 8 9 42、對(duì)10名應(yīng)試者先進(jìn)行某種測(cè)驗(yàn)X,隔適當(dāng)時(shí)間后(半年),再進(jìn)行內(nèi)容、范圍、難度類似的第二次測(cè)驗(yàn)Y,試求測(cè)驗(yàn)的復(fù)本信度?應(yīng)試者 1 2 3 4 5 6 7 8 9 10X 9 10 10 6 10 8 4 8 9 4

11、Y 4 9 7 9 4 3 5 3 2 43、有一個(gè)由100題構(gòu)成的量表施行于10個(gè)高三學(xué)生(分?jǐn)?shù)見(jiàn)下表)。測(cè)驗(yàn)一次后,學(xué)生即畢業(yè)離校,現(xiàn)怎樣評(píng)價(jià)測(cè)驗(yàn)結(jié)果的信度?學(xué)生序號(hào) 1 2 3 4 5 6 7 8 9 10奇X 38 37 38 41 40 36 38 39 40 35偶Y 37 37 36 39 39 34 38 39 39 36四、提高信度的方法1、影響測(cè)量信度的主要因素自行閱讀P34-35,請(qǐng)同學(xué)們討論、解釋。(1)測(cè)量工具方面(對(duì)照教材重點(diǎn)解釋)(2)主試、施測(cè)情境方面(對(duì)照教材舉例)(3)被試方面(同上)(4)兩次施測(cè)的間隔時(shí)間方面2、提高測(cè)量信度的常用方法閱讀p36-37,請(qǐng)

12、學(xué)生解釋:(1)適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度(2)測(cè)驗(yàn)的難度要適中(3)測(cè)驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì)(不同質(zhì)是如何影響信度的?)(4)測(cè)驗(yàn)的程序應(yīng)統(tǒng)一(5)測(cè)驗(yàn)的時(shí)間要充分(6)測(cè)驗(yàn)的評(píng)分要盡量做到客觀化,減少評(píng)分誤差第二節(jié) 效度一 、什么是效度效度是指測(cè)量結(jié)果的準(zhǔn)確性和有效性的程度。也可以說(shuō)是測(cè)量是否達(dá)到了預(yù)期的目的。1、效度是一個(gè)相對(duì)的概念。 測(cè)量的效度是相對(duì)一定的測(cè)量目的而言的2、一種測(cè)量的效度只是高或低的問(wèn)題測(cè)量結(jié)果總是有一定效度的,只是效度高低不同罷了。3、教育領(lǐng)域的效度問(wèn)題比其他領(lǐng)域的測(cè)量更重要。二、效度的理論公式板書(shū)P39及參考書(shū)P58重申變量和的方差運(yùn)算公式目標(biāo)真分?jǐn)?shù)、非目標(biāo)真分?jǐn)?shù)根據(jù)理論公式,

13、怎樣才算測(cè)量效度高?請(qǐng)同學(xué)們回答。 三、效度的估計(jì)效度估計(jì)就是多方尋找證據(jù)來(lái)證明一個(gè)測(cè)驗(yàn)的有效性程度的過(guò)程。(一)內(nèi)容效度就是指測(cè)驗(yàn)題目樣本對(duì)于應(yīng)測(cè)內(nèi)容與行為領(lǐng)域的代表性程度。也就是說(shuō),測(cè)驗(yàn)的內(nèi)容范圍、材料與所要測(cè)量的內(nèi)容范圍、教育目標(biāo)是否相符合;測(cè)驗(yàn)中測(cè)題所引起的行為是否是所要測(cè)量的屬性的明確反應(yīng)。為了使測(cè)驗(yàn)的內(nèi)容具有有效性,成為所欲測(cè)量?jī)?nèi)容的一個(gè)具有代表性的行為樣本,在編制測(cè)驗(yàn)時(shí),就要考慮建立內(nèi)容效度的問(wèn)題。2、內(nèi)容效度的估計(jì)邏輯分析法其工作思路是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與應(yīng)測(cè)內(nèi)容范圍的吻合程度作出判斷。把所有題目按考試內(nèi)容和考查目標(biāo)分布進(jìn)行雙向分類,形成實(shí)際的“題目雙向分類表”。與事先預(yù)定的

14、“命題雙向分類表”作比較,看是否偏離了原命題計(jì)劃。內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn)、學(xué)科測(cè)驗(yàn)。內(nèi)容效度不適合用于能力傾向和人格測(cè)驗(yàn)。(二)結(jié)構(gòu)效度結(jié)構(gòu):心理學(xué)或社會(huì)學(xué)上的一種理論構(gòu)想或特質(zhì)。本身觀察不到,也無(wú)法直接測(cè)量,但學(xué)術(shù)理論假設(shè)它是存在的。舉例:結(jié)構(gòu)效度:測(cè)量能測(cè)出這種結(jié)構(gòu)的程度(1)結(jié)構(gòu)效度的特點(diǎn)結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論,一旦人們對(duì)同一種心理特質(zhì)有著不同的定義或假設(shè),則會(huì)使得關(guān)于特質(zhì)測(cè)驗(yàn)的結(jié)構(gòu)效度的研究結(jié)果無(wú)法比較。比如智力(2)建立結(jié)構(gòu)效度的步驟A、提出理論假設(shè);B、根據(jù)假定結(jié)構(gòu),導(dǎo)出各項(xiàng)關(guān)于心理功能或行為的基本假設(shè)。擬定測(cè)題,編制測(cè)驗(yàn);C、以測(cè)驗(yàn)結(jié)果為根據(jù)來(lái)驗(yàn)證假設(shè)

15、結(jié)構(gòu)中的各種因素是否成立。例如智力P42測(cè)量甲與其他理論上認(rèn)為應(yīng)該與之有關(guān)的其他測(cè)量有顯著相關(guān)。與其他理論上認(rèn)為不應(yīng)該與之有關(guān)的其他測(cè)量沒(méi)有顯著相關(guān)。與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心理測(cè)驗(yàn)方面。(三)效標(biāo)關(guān)聯(lián)效度是以測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來(lái)表示測(cè)驗(yàn)效度高低的方法。什么是效標(biāo)?例如:某年全國(guó)高考物理學(xué)科的測(cè)驗(yàn)效度,可用大學(xué)一年級(jí)物理學(xué)科的測(cè)驗(yàn)分?jǐn)?shù)為效標(biāo),然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān),此相關(guān)系數(shù)就是該年高考物理測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度系數(shù)。效標(biāo)不僅隨測(cè)驗(yàn)的種類不同而不同,而且可能隨時(shí)間而改變,現(xiàn)在是一個(gè)好的成功的效標(biāo),將來(lái)就不一定是。所以,為某個(gè)測(cè)

16、驗(yàn)選擇一個(gè)最有效的效標(biāo),這是最重要的事情。教育測(cè)驗(yàn)的效標(biāo),可采用各學(xué)科成績(jī)和教師評(píng)定的結(jié)果;智力測(cè)驗(yàn)的效標(biāo),可采用學(xué)科成績(jī)、教師評(píng)判的結(jié)果、學(xué)生總成績(jī)、受教育年限、年齡以及其他事物;能力傾向測(cè)驗(yàn)的效標(biāo),可采用特殊課程或特殊訓(xùn)練的成績(jī);職業(yè)興趣測(cè)驗(yàn)的效標(biāo),可采用從業(yè)人員實(shí)際服務(wù)成績(jī)或記錄;人格測(cè)驗(yàn)的效標(biāo),可采用被試以后行為或臨床資料。效標(biāo)關(guān)聯(lián)效度的種類同時(shí)效度預(yù)測(cè)效度效標(biāo)關(guān)聯(lián)的計(jì)算方法:計(jì)算相關(guān)系數(shù)(多采用積差相關(guān)法,略)P41,其他方法參閱教育統(tǒng)計(jì)學(xué)教材2、提高測(cè)量效度的方法P44對(duì)效度系數(shù)的要求:P42,閱讀1分鐘控制系統(tǒng)誤差精心編制測(cè)驗(yàn)量表擴(kuò)充樣本的容量(增加樣本對(duì)總體的代表性)合理處理效

17、度和信度的關(guān)系(信度是效度的前提,效度不大于信度的平方根)妥善組織測(cè)驗(yàn)適當(dāng)增加測(cè)驗(yàn)長(zhǎng)度三、難度難度是指試題的難易程度。一道試題,如果大部分被試都能答對(duì),則該題的難度就?。蝗绻蟛糠直辉嚩疾荒艽饘?duì),則該題的難度就大。難度由被試群體整體水平所確定。是相對(duì)概念。難度的計(jì)算(一)基本公式1、客觀題難度的計(jì)算P=R/N R為答對(duì)該試題人數(shù),N為參加測(cè)驗(yàn)總?cè)藬?shù)例1:在100個(gè)學(xué)生中,答對(duì)第一題的30人,答對(duì)第二題的60人,求第一、二道題的難度?比較這兩道題誰(shuí)比誰(shuí)難?2、主觀題難度的計(jì)算例2:某道論述題滿分12分,所有考生在這道題上的平均得分為3.6分,求該題的難度?例3:語(yǔ)文測(cè)驗(yàn)第五題最高得分為12分,這

18、道題考生的平均得分是8.5分,求該題難度?例4:60人參加考試,某題滿分為12分,正確得分累積是480分,求該題難度?(2)極端分組法客觀題步驟:將測(cè)驗(yàn)總分進(jìn)行高低排序(由高到低)進(jìn)行高低分組(各取27%),并計(jì)算某題的得分率求兩組的平均值公式:P=(PH+PL)/2PH為高分組答對(duì)該題的百分比;PL為低分組答對(duì)該題的百分比。例5某區(qū)域1000人參加考試,試卷第一題高分組180人答對(duì),低分組60人答對(duì),求該題難度?如果該題滿分為10分,高分組得分總數(shù)為2100分,低分組得分總數(shù)為830分,求該題難度?論文題的步驟:將測(cè)驗(yàn)總分進(jìn)行高低排序(由高到低)進(jìn)行高低分組(各取25%)分別為高分組、低分組

19、編制每道試題的分析表按下列公式計(jì)算難度:P=板書(shū)P48 例某道論文題,高分組得分總和40分,低分組得分總和15分,40人參加考試,此題最高得分為5分,最低得分為2分,則此題的難度為P48:2、難度的分析與控制(1)難度分析進(jìn)行難度分析的主要目的是為了篩選題目。A、測(cè)驗(yàn)題目難度水平的確定測(cè)驗(yàn)題目難度水平的適當(dāng)與否,取決于測(cè)驗(yàn)的目的、性質(zhì)和題目的形成。當(dāng)P值接近于0或接近于1時(shí),即被試在該題上全部答對(duì)或全部答錯(cuò),則該題無(wú)法提供個(gè)體的信息。而只當(dāng)P值接近于0.50時(shí),題目才能把被試作最大的程度的區(qū)分。(離散程度最大)對(duì)于常模參照性測(cè)驗(yàn),大多數(shù)難度在0.3-0.7之間,平均0.5。但對(duì)于奧林匹克競(jìng)賽或

20、補(bǔ)習(xí)功課的學(xué)生,例外。B、測(cè)驗(yàn)難度對(duì)分?jǐn)?shù)分布的影響測(cè)驗(yàn)的難度直接依賴于組成測(cè)驗(yàn)的題目的難度,通過(guò)考察測(cè)驗(yàn)分?jǐn)?shù)的分布,可以對(duì)測(cè)驗(yàn)的難度做出直觀檢查。由于人的心理特性值多數(shù)呈正態(tài)分布,因此當(dāng)測(cè)驗(yàn)?zāi)康脑谟跍y(cè)量個(gè)體差異時(shí),若被試樣本具有代表性,則其結(jié)果應(yīng)呈正態(tài)分布。測(cè)驗(yàn)分?jǐn)?shù)背離正態(tài)分布有兩種情況:其一是題目難度普遍較大,被試得分普遍較低,使得低分端出現(xiàn)高峰,呈正偏態(tài);其二是題目難度普遍較小,被試的得分普遍較高,使得高分端出現(xiàn)高峰,呈負(fù)偏態(tài)。(2)難度的控制一般說(shuō)來(lái),影響題目難度的主要因素有:考察知識(shí)點(diǎn)的多少;考察能力的復(fù)雜程度或?qū)哟蔚母叩停豢忌鷮?duì)題目的熟悉態(tài)度;命題的技巧。難度控制:正確估計(jì)考生水平與

21、否;弄清弄懂各知識(shí)點(diǎn)與否;掌握命題技巧與否。四、區(qū)分度(一)區(qū)分度的含義指測(cè)驗(yàn)題目對(duì)考生實(shí)際水平的區(qū)分程度或鑒別能力。如一道題,學(xué)業(yè)水平、實(shí)際能力都較高的考生都答對(duì)了;而學(xué)業(yè)水平、實(shí)際能力都較低的考生都答錯(cuò)了,則可認(rèn)為該題目有好的區(qū)分度。區(qū)分度分析主要以效能為依據(jù),考察考生在每個(gè)題目上反應(yīng)與其在效標(biāo)上的表現(xiàn)之間的相關(guān)程度。區(qū)分度(D)的取值范圍介于- 1.00+1.00之間,值越大,區(qū)分度的效果越佳。區(qū)分度D0為正區(qū)分,D0為負(fù)區(qū)分,D=0為零區(qū)分區(qū)分度與測(cè)驗(yàn)信度、難度的關(guān)系,請(qǐng)自行閱讀P51。(二)區(qū)分度的計(jì)算1、極端分組法(1)客觀性試題D=PH-PL例6:有道試題,高分組有70%學(xué)生通過(guò)

22、,低分組有30%的學(xué)生通過(guò);而另一道題,高分組有40%學(xué)生通過(guò),低分組有70%學(xué)生通過(guò),求兩題的各自區(qū)分度?P51(2)主觀題D=(XH-XL)/N(H-L)XH為高分組得分總數(shù)XL為低分組得分總數(shù)H為該道題的最高分L為該道題的最低分N為應(yīng)試總?cè)藬?shù)的25%。例7 高分組 低分組得分X 人次f 得分X 人次f 5 4 5 0 4 3 4 1 3 2 3 1 2 1 2 3 1 0 1 1 0 0 0 4此題最高得分5分,最低得分0分2、相關(guān)法點(diǎn)二列相關(guān)法例8:15個(gè)學(xué)生在數(shù)學(xué)測(cè)驗(yàn)中得分記錄如下,計(jì)算數(shù)學(xué)測(cè)驗(yàn)中第一題的區(qū)分度?學(xué)生 1 2 3 4 5 6 7 8 9 10 11 12 13 14

23、15測(cè)驗(yàn) 65 70 31 49 80 50 35 10 81 69 78 55 77 90 42第一題 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0二列相關(guān)例9:已知一測(cè)驗(yàn)中某選擇題的通過(guò)率為0.5,答對(duì)者的測(cè)驗(yàn)總分平均為76分,答錯(cuò)者的測(cè)驗(yàn)總分平均為63分,全體被試20人總分的標(biāo)準(zhǔn)差為16,求該題的區(qū)分度?(三)提高區(qū)分度的方法1、使題目的難度適中,使整個(gè)考試難度適中題目的難度適中可使區(qū)分度達(dá)到最大值,因此,使難度適中是提高區(qū)分度的重要方法。2、著重考察復(fù)雜的學(xué)習(xí)結(jié)果使高能學(xué)生得高分或低能學(xué)生得低分,使分?jǐn)?shù)盡量分布在整個(gè)分?jǐn)?shù)量尺上。3、掌握區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn)。P53,評(píng)價(jià)標(biāo)準(zhǔn)表

24、第三章測(cè)驗(yàn)?zāi)繕?biāo)定義1、深入分析課程教學(xué)目標(biāo);閱讀5分鐘后,請(qǐng)合上課本描繪教育目的、教學(xué)目標(biāo)、課程目標(biāo)、單元教學(xué)目標(biāo)、課時(shí)教學(xué)目標(biāo)、知識(shí)點(diǎn)教學(xué)目標(biāo)、行為目標(biāo)、學(xué)習(xí)目標(biāo)及程序教學(xué)諸概念之間的關(guān)系。雙向細(xì)目表的概念內(nèi)容類的概念 P76,認(rèn)真閱讀3分鐘。目標(biāo)層次的概念 第四章 教育評(píng)價(jià)方案的編制與實(shí)施第二節(jié) 教育評(píng)價(jià)方案的制定一、教育評(píng)價(jià)指標(biāo)體系的的構(gòu)建(一)教育評(píng)價(jià)指標(biāo)體系的結(jié)構(gòu)1、框架指標(biāo)體系的構(gòu)成:指標(biāo)集、評(píng)價(jià)標(biāo)準(zhǔn)、量化符號(hào)。板書(shū)解釋“評(píng)價(jià)對(duì)象”與“指標(biāo)”的相對(duì)性 2、模型一般模型:評(píng)價(jià)普遍現(xiàn)象分類模型:評(píng)價(jià)特殊現(xiàn)象舉例:“一間中學(xué),教師的教學(xué)工作”一般模型與分類模型的相對(duì)性,例如:“一間中學(xué),

25、教師的教學(xué)工作” “一間中學(xué),中學(xué)的全面工作”指標(biāo)體系由指標(biāo)、評(píng)價(jià)標(biāo)準(zhǔn)和量化符號(hào)組成3、指標(biāo)(與“評(píng)價(jià)對(duì)象”相對(duì))必達(dá)指標(biāo)與期望指標(biāo)對(duì)教師學(xué)歷、設(shè)備等設(shè)置;違紀(jì)犯罪率最低限度;表彰、獎(jiǎng)項(xiàng)穩(wěn)定性指標(biāo)與變動(dòng)性指標(biāo)“教學(xué)方法”/“德育”,“計(jì)算機(jī)輔助教學(xué)”軟指標(biāo)與硬指標(biāo)設(shè)備、場(chǎng)地/辦學(xué)特色,決策水平初擬評(píng)價(jià)指標(biāo)頭腦風(fēng)暴/因素分解/理論推演/篩選評(píng)價(jià)指標(biāo)(1)經(jīng)驗(yàn)法:理由充分否?/主次/指標(biāo)關(guān)系(近似、交叉、因果、矛盾等)/去難存易,刪繁就簡(jiǎn)(2)統(tǒng)計(jì)調(diào)查:按5檔給專家問(wèn)卷,統(tǒng)計(jì)“很重要”“重要”人數(shù)比例,按人數(shù)比例高低排列,刪除三分之二或四分之三。4、標(biāo)準(zhǔn)概念:達(dá)標(biāo)程度/末級(jí)指標(biāo)必須明確規(guī)定評(píng)價(jià)標(biāo)準(zhǔn)

26、從內(nèi)容上分:效能標(biāo)準(zhǔn):效果標(biāo)準(zhǔn)和效率標(biāo)準(zhǔn)職責(zé)標(biāo)準(zhǔn)素質(zhì)標(biāo)準(zhǔn)從參照點(diǎn)分:社會(huì)標(biāo)準(zhǔn);規(guī)范性法則,參照點(diǎn)在外部科學(xué)標(biāo)準(zhǔn):社會(huì)學(xué)或自然法則,參照點(diǎn)在內(nèi)部5、量化符號(hào)權(quán)數(shù):一般把同一級(jí)指標(biāo)群集視為整體,權(quán)值 1 分?jǐn)?shù):指標(biāo)賦分;等級(jí)賦分標(biāo)度:達(dá)到標(biāo)準(zhǔn)的程度,說(shuō)明什么樣的程度屬于什么 等級(jí)。表示方法有:描述性語(yǔ)言,如,好、中、差; 量化形式,如,用分?jǐn)?shù)閾劃分,100-90屬于優(yōu)秀, 89-75屬于良好。(二)教育評(píng)價(jià)指標(biāo)體系的建造1、信度和效度信度:a、同一評(píng)價(jià)者用同一指標(biāo)體系去重復(fù)評(píng)價(jià)某一對(duì)象,所得結(jié)果的一致程度;(再測(cè)信度)b、不同評(píng)價(jià)者用同一指標(biāo)體系在相隔較短的時(shí)間去評(píng)價(jià)同一對(duì)象,看一致性程度。(評(píng)分

27、者信度)c、同一評(píng)價(jià)者、使用多種指標(biāo)體系,幾乎同時(shí)評(píng)價(jià)同一對(duì)象,考察結(jié)果的真實(shí)程度(一致程度)(復(fù)份信度)一般來(lái)說(shuō),指標(biāo)內(nèi)涵客觀;指標(biāo)與指標(biāo)之間相互獨(dú)立;硬指標(biāo)比例大;評(píng)價(jià)標(biāo)準(zhǔn)的規(guī)定明確,等級(jí)間的界限分明,信度就高。如果軟指標(biāo)多;指標(biāo)、等級(jí)間界限模糊,評(píng)價(jià)者較難區(qū)分指標(biāo)之間的差異,難以掌握評(píng)判準(zhǔn)則,則會(huì)降低信度。效度:考察的是,我們所要評(píng)的,與指標(biāo)體系能評(píng)的之間的關(guān)系。越接近,說(shuō)明指標(biāo)體系各要素(指標(biāo)、標(biāo)準(zhǔn)、量化符號(hào))的設(shè)置越準(zhǔn)確,越有代表性。哪些做法影響效度?P1022、方法前人的啟示:量表與問(wèn)卷/泰勒的“教育目標(biāo)”以及目標(biāo)達(dá)到的評(píng)價(jià)模式/“行為目標(biāo)”的研究/教育目標(biāo)分類學(xué)及教育評(píng)價(jià)的研究成

28、果/我國(guó)的有關(guān)探索等。P103(1)掌握構(gòu)建教育評(píng)價(jià)指標(biāo)體系的依據(jù):理念問(wèn)題/實(shí)證問(wèn)題。P103 (2)掌握評(píng)價(jià)對(duì)象逐級(jí)分解的方法。對(duì)內(nèi)涵的理解正確、深刻。如“師德”指標(biāo)。/理解、分解的多路向性/抓大放小原則/實(shí)施評(píng)價(jià)指標(biāo)的可行性/(3)掌握評(píng)價(jià)等級(jí)和標(biāo)準(zhǔn)確定的方法。 等級(jí)數(shù)應(yīng)根據(jù)指標(biāo)的類型和性質(zhì)來(lái)確定。/四級(jí)分等,兩級(jí)定標(biāo)的簡(jiǎn)便方法。 標(biāo)準(zhǔn):根據(jù)不同類型指標(biāo)的不同特點(diǎn),綜合運(yùn)用,如“教改實(shí)驗(yàn)”、“教師隊(duì)伍結(jié)構(gòu)”/各等級(jí)規(guī)定的評(píng)價(jià)標(biāo)準(zhǔn),界限要清楚。(4)掌握指標(biāo)與等級(jí)數(shù)值分配的方法。集體討論、咨詢、同行專家意見(jiàn)、調(diào)查研究,注重程序。參與人員必須:a、知識(shí)經(jīng)驗(yàn)、判斷鑒別力;b、明確賦值依據(jù)和原則

29、;c、認(rèn)真嚴(yán)謹(jǐn)二、教育評(píng)價(jià)方案的編制以評(píng)價(jià)指標(biāo)體系的撰寫(xiě)為核心1、期望評(píng)語(yǔ)式編寫(xiě)法2、積分評(píng)語(yǔ)式編寫(xiě)法(1)等分積分評(píng)語(yǔ)式 (2)累計(jì)積分評(píng)語(yǔ)式復(fù)習(xí):設(shè)計(jì)教育評(píng)價(jià)指標(biāo)體系實(shí)操(一)確立目標(biāo)與指標(biāo)1、目標(biāo)目標(biāo)即目的,泛指人們從事活動(dòng)所達(dá)到的目的。2、指標(biāo)簡(jiǎn)單地說(shuō),指標(biāo)是用來(lái)反映、測(cè)量和說(shuō)明上一級(jí)項(xiàng)目的下一級(jí)項(xiàng)目。是目標(biāo)一個(gè)方面的規(guī)定,它是具體的、可測(cè)量的、行為化和操作化的目標(biāo)。(二)選擇指標(biāo)體系的結(jié)構(gòu)1、直線式結(jié)構(gòu) 二級(jí)指標(biāo)11一級(jí)指標(biāo)1 二級(jí)指標(biāo)12 二級(jí)指標(biāo)21一級(jí)指標(biāo)2 二級(jí)指標(biāo)22 二級(jí)指標(biāo)31一級(jí)指標(biāo)3 二級(jí)指標(biāo)32例1:小學(xué)生最優(yōu)發(fā)展的整體評(píng)價(jià)指標(biāo)體系 思想品德 思想素質(zhì) 科學(xué)素質(zhì)

30、性格 情趣愛(ài)好小 審美素質(zhì) 美的感受和鑒賞學(xué) 美的表達(dá)和創(chuàng)造生 學(xué)業(yè)成績(jī)最 知識(shí)素質(zhì) 知識(shí)結(jié)構(gòu)優(yōu) 百科知識(shí)面發(fā) 自學(xué)能力展 能力素質(zhì) 自理生活能力 人際交往和組織能力 體態(tài)和機(jī)能 身體素質(zhì) 運(yùn)動(dòng)能力 衛(wèi)生保健2、樹(shù)狀式結(jié)構(gòu)一級(jí)指標(biāo)一級(jí)指標(biāo)一級(jí)指標(biāo)總目標(biāo)二級(jí)指標(biāo)例2:學(xué)生主體性的基本結(jié)構(gòu)主體性自主性主動(dòng)性創(chuàng)造性自尊自信自我調(diào)控獨(dú)立判斷決斷自覺(jué)自理成就動(dòng)機(jī)競(jìng)爭(zhēng)意識(shí)興趣和求知欲主動(dòng)參與社會(huì)適應(yīng)性創(chuàng)新意識(shí)創(chuàng)造性思維能力動(dòng)手實(shí)踐能力(三)教育評(píng)價(jià)指標(biāo)體系建立的步驟和方法1、步驟:(1)分解目標(biāo),提出初擬指標(biāo)(2)歸類合并,進(jìn)行篩選(3)專家評(píng)判(4)預(yù)試修訂(1)分解目標(biāo),提出初擬指標(biāo)一般較為注意指標(biāo)的

31、科學(xué)性、完備性,唯恐掛一漏了或包羅不盡。這些指標(biāo)不僅是較為粗疏的,數(shù)量也可能是比較多的。方法(1)頭腦風(fēng)暴法是利用頭腦積極思維,進(jìn)行智力碰撞,激發(fā)智慧的靈感,從而提出評(píng)價(jià)指標(biāo)的一種常用方法。(2)因素分解法是一種將評(píng)價(jià)指標(biāo)按照評(píng)價(jià)對(duì)象本身的邏輯結(jié)構(gòu)逐級(jí)進(jìn)行分解,把分解出來(lái)的主要因素作為評(píng)價(jià)指標(biāo)的方法。應(yīng)當(dāng)注意:分解出來(lái)的因素,從高到低逐層縮小內(nèi)涵,越往下層次指標(biāo)越明確、越具體、范圍越小,越可以觀測(cè)。(3)理論推演法是根據(jù)有關(guān)學(xué)科的理論推演出評(píng)價(jià)指標(biāo)的方法。(4)典型研究法是通過(guò)少數(shù)典型事例進(jìn)行研究而設(shè)計(jì)評(píng)價(jià)指標(biāo)的方法。(2)歸類合并,進(jìn)行篩選在初擬指標(biāo)中,有的能反映評(píng)價(jià)對(duì)象的本質(zhì),有的則未必;

32、有的算得上主要因素,有的可能只是次要因素。各因素之間出現(xiàn)交叉、重復(fù)、包含、矛盾、因果等關(guān)系,也難以避免,必須對(duì)初擬指標(biāo)進(jìn)行歸類合并和篩選,以達(dá)到“少而精”的要求。篩選指標(biāo)的方法(1)經(jīng)驗(yàn)法一般遵循以下幾個(gè)要點(diǎn):A、理由是否充分或必要判斷每項(xiàng)指標(biāo)是否是必要的,缺了它有什么不好,保留它有什么理由,被保留的要有充分的依據(jù),在指標(biāo)體系中,屬于非要不可的因素。B、取主舍次區(qū)分每項(xiàng)指標(biāo)反映評(píng)價(jià)對(duì)象本質(zhì)的程度,保留能反映本質(zhì)的主要因素,舍棄不能充分反映本質(zhì)的次要因素。C、從各指標(biāo)之間的關(guān)系上進(jìn)行比較內(nèi)涵相同或近似的合并,內(nèi)涵交叉的保留其一;有因果關(guān)系的,保留“因”而去掉“果”;相互矛盾的保留既符合方針、政策

33、規(guī)定又切合當(dāng)?shù)貙?shí)際的指標(biāo)。D、去難存易,刪繁就簡(jiǎn)確實(shí)難測(cè)的指標(biāo)可以舍棄;指標(biāo)內(nèi)涵復(fù)雜的,盡量求其單一。(3)專家評(píng)判這是指標(biāo)設(shè)計(jì)從設(shè)計(jì)者手中走向管理實(shí)踐的重要步驟。專家通常包括評(píng)價(jià)理論研究者、上級(jí)領(lǐng)導(dǎo)、富有經(jīng)驗(yàn)的教育行政干部、教師等。專家評(píng)判可采用個(gè)別訪問(wèn)、座談、問(wèn)卷征詢、現(xiàn)場(chǎng)調(diào)查等方式,應(yīng)根據(jù)不同情況選擇。調(diào)查統(tǒng)計(jì)法是在調(diào)查獲取資料的基礎(chǔ)上進(jìn)行統(tǒng)計(jì)的方法。其具體的做法是:把初擬指標(biāo)制成問(wèn)卷,發(fā)給有關(guān)專家和有經(jīng)驗(yàn)的教育工作者,請(qǐng)他們對(duì)初擬指標(biāo)每一項(xiàng)作出判斷。一般分為五檔,即很重要、重要、一般、可要可不要、不要。答卷者在每項(xiàng)指標(biāo)后記上自己判斷該項(xiàng)指標(biāo)相比之下的重要程度(只能定一個(gè)檔次),然后,收

34、回問(wèn)卷,統(tǒng)計(jì)“很重要”、“重要”兩檔的人數(shù)比例,按評(píng)為“很重要”、“重要”人數(shù)比例由高到低順序排列,把低于某數(shù)值(一般低于三分之二或四分之三處作為劃界)的指標(biāo)刪除,就得到篩選的指標(biāo)。(4)預(yù)試修訂指標(biāo)體系經(jīng)過(guò)篩選、修訂,初步確定以后,可以同評(píng)定標(biāo)準(zhǔn)相匹配,選點(diǎn)在小范圍試驗(yàn),看是否可行,試驗(yàn)后對(duì)指標(biāo)體系再作修改,然后投入使用。例3:學(xué)校領(lǐng)導(dǎo)班子評(píng)價(jià)指標(biāo)體系的建立1、首先分4個(gè)層次提出了16項(xiàng)指標(biāo)(1)政治素質(zhì)(政治理論和政策水平、思想品德修養(yǎng)、事業(yè)心和責(zé)任感)(2)業(yè)務(wù)素質(zhì)(文化專業(yè)達(dá)標(biāo)、教育理論修養(yǎng)、管理實(shí)踐經(jīng)驗(yàn))(3)工作效能(職務(wù)與能力相稱、分工明確和各盡其責(zé)、團(tuán)結(jié)協(xié)作、指揮靈便、工作效率

35、高)(4)工作作風(fēng)(深入實(shí)際、發(fā)揚(yáng)民主、決策果斷、以身作則、開(kāi)拓精神)2、把以上16項(xiàng)指標(biāo),分為五檔(很重要、重要、一般、可要可不要、不要),分別征詢意見(jiàn),獲得以下結(jié)果:政治素質(zhì)(事業(yè)心和責(zé)任感1、政治理論和政策水平3、思想品德修養(yǎng)11)業(yè)務(wù)素質(zhì)(教育理論修養(yǎng)2、管理實(shí)踐經(jīng)驗(yàn)10)工作效能(團(tuán)結(jié)協(xié)作5、分工明確和各盡其責(zé)8、工作效率高9)工作作風(fēng)(決策果斷4、以身作則6、開(kāi)拓精神7、發(fā)揚(yáng)民主12)第五章 教育評(píng)價(jià)的方法第一節(jié) 教育評(píng)價(jià)方法概觀絕對(duì)評(píng)價(jià)法相對(duì)評(píng)價(jià)法個(gè)體內(nèi)差異評(píng)價(jià)法定性分析評(píng)價(jià)法定性綜合判斷法行為目標(biāo)評(píng)價(jià)法臨床督導(dǎo)評(píng)價(jià)法指標(biāo)評(píng)分法確定評(píng)價(jià)指標(biāo)權(quán)重的方法(1)關(guān)鍵特征調(diào)查法 (2)兩

36、兩比較法 (3)專家評(píng)判平均法 (4)倍數(shù)比較法等級(jí)換分法把具體項(xiàng)目的等級(jí)評(píng)定換算成分?jǐn)?shù),然后將各項(xiàng)分?jǐn)?shù)相加,滿分100.具體做法:1、大項(xiàng)目,分?jǐn)?shù)和(X+Y+Z):100;2、某個(gè)大項(xiàng)目(X)再細(xì)分若干具體項(xiàng)目(x1,x2,x3), 為x1,x2,x3分配分?jǐn)?shù);3、將x1(或x2、x3)分等級(jí)(評(píng)語(yǔ)論域v),每一等級(jí)需確定具體的評(píng)價(jià)標(biāo)準(zhǔn):合格/不合格;優(yōu)/中/劣;.4、將各等地折算成分?jǐn)?shù)。如x1滿分11分,則可將優(yōu)算成11分,良-9分,中-7分,差-5分。5、將各項(xiàng)目得分相加。加權(quán)平均法權(quán)重分配方法已經(jīng)介紹;自行閱讀3分鐘即可。模糊綜合評(píng)判法P137再介紹集體綜合評(píng)價(jià)法主要用于思想品德評(píng)價(jià)1

37、、確定德育評(píng)價(jià)的具體項(xiàng)目(X+Y+Z)2、對(duì)每一個(gè)具體如X項(xiàng)目評(píng)分(100分):自評(píng)、他評(píng)。3、板書(shū)公式S=(r1+r2+r3+.rn)/Nr為每一德育項(xiàng)目自評(píng)分?jǐn)?shù),N為項(xiàng)目數(shù)Fi=(Li-Si)/(R-1)Fi表示對(duì)思想品德的集體綜合評(píng)價(jià),表示對(duì)思想品德的集體綜合評(píng)價(jià),Li表示集體中每個(gè)成表示集體中每個(gè)成員對(duì)評(píng)價(jià)對(duì)象作出的評(píng)價(jià)(各個(gè)項(xiàng)目得分的平均數(shù))員對(duì)評(píng)價(jià)對(duì)象作出的評(píng)價(jià)(各個(gè)項(xiàng)目得分的平均數(shù));Si表示自表示自我總評(píng)價(jià)分,我總評(píng)價(jià)分,R表示被試人數(shù)。表示被試人數(shù)。 案例:先打分,再計(jì)算 同學(xué)甲分?jǐn)?shù) 同學(xué)乙分?jǐn)?shù) .尊敬師長(zhǎng)學(xué)習(xí)態(tài)度遵紀(jì)守法團(tuán)結(jié)互助集體觀念社會(huì)活動(dòng)勞動(dòng)態(tài)度 平均分 第三節(jié) 處理

38、教育評(píng)價(jià)信息的方法一、定性分析描述法(一)等級(jí)評(píng)定法 : 制定評(píng)分等級(jí)及評(píng)定標(biāo)準(zhǔn)。應(yīng)用到如操行、能力、職稱、學(xué)校等級(jí)等方面。(二)評(píng)語(yǔ)鑒定法:?jiǎn)畏矫?、多方面評(píng)語(yǔ)法/簡(jiǎn)易、結(jié)論明晰,能對(duì)一些模糊現(xiàn)象進(jìn)行描述鑒定,解決了一些定量研究不能解決的問(wèn)題,但難以客觀,信度和效度較低。(三)寫(xiě)實(shí)分析法:集事實(shí)資料/整理、描述資料,一般先概括描述一般情況,再描述典型事例/分析評(píng)價(jià):簡(jiǎn)要、中肯、抓住本質(zhì)。 寫(xiě)實(shí)法的優(yōu)點(diǎn)是有依據(jù),新都高。缺點(diǎn)是全面地收集資料很難,耗時(shí)多。二、定量分析評(píng)判法(一)統(tǒng)計(jì)分析評(píng)判法自行閱讀P135-137的平均數(shù)、加權(quán)平均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)內(nèi)容,8分鐘。(二)模糊綜合評(píng)判簡(jiǎn)介

39、補(bǔ)充概念:隸屬度 若對(duì)論域(研究的范圍)U中的任一元素x,都有一個(gè)數(shù)A(x)0,1與之對(duì)應(yīng),則稱A為U上的模糊集,A(x )稱為x對(duì)A的隸屬度。當(dāng)x在U中變動(dòng)時(shí),A( x)就是一個(gè)函數(shù),稱為A的隸屬函數(shù)。隸屬度A(x)越接近于1,表示x屬于A的程度越高,A(x)越接近于0表示x屬于A的程度越低。用取值于區(qū)間0,1的隸屬函數(shù)A(x)表征x 屬于A的程度高低,這樣描述模糊性問(wèn)題比起經(jīng)典集合論更為合理。舉例 例如,對(duì)于模糊集A = 高個(gè)子,如果論域是“成年男性”,則可構(gòu)造隸屬函數(shù)如圖所示:板書(shū)確定因素論域X=x1,x2,xn(如全班學(xué)生)和評(píng)語(yǔ)論域Y=y1(如侏儒),y2(矮子),ym(巨人),其中

40、xi表示問(wèn)題中所考慮的因素(i=1,2,n),yj表示要判斷的等級(jí)(j=1,2,m)。則稱X與Y之間的模糊關(guān)系矩陣為單因素評(píng)判(單單只是一個(gè)個(gè)因素,未涉及“綜合”之意,即,只有各行向量有意義,整個(gè)矩陣沒(méi)意義),其中行向量(ri1,ri2,rim)是考慮單因素xi在Y上的評(píng)判,rij稱為因素xi對(duì)評(píng)價(jià)等級(jí)yi的隸屬度,R為Y上模糊子集。設(shè)X上的模糊子集A表示因素xi在本問(wèn)題的加權(quán)數(shù)(也稱權(quán)重),則合成稱為對(duì)各因素的綜合評(píng)判,且 bj= 板書(shū)(四種之一) (j=1,2,.m)其中算符“”為取大,“”為取小,稱為扎德算子。與矩陣乘法運(yùn)算順序相同。舉例P57及A為1行m列矩陣的例子,請(qǐng)同學(xué)來(lái)算。當(dāng)b1

41、=b2=bm時(shí),稱綜合評(píng)判全同失效;當(dāng)b1,b2,bm中至少有兩個(gè)相等的最大分量時(shí),稱綜合評(píng)判義性失效。書(shū)上例題講解,P139例:根據(jù)某生測(cè)評(píng)表用1、4模型進(jìn)行模糊綜合評(píng)判 優(yōu)秀 良好一般較差 差道德觀念 0.250.540.180.030尊敬師長(zhǎng) 0.390.500.080.030學(xué)習(xí)態(tài)度 0.640.250.080.030尊紀(jì)守法 0.580.390.0300團(tuán)結(jié)互助 0.080.500.310.080.03集體觀念 0.100.640.180.050.03社會(huì)活動(dòng) 0.200.520.230.050勞動(dòng)態(tài)度 0.410.370.140.080權(quán)重分配:A=(0.18,0.14,0.14,

42、0.13,0.09, 0.12, 0.12, 0.08)教育評(píng)價(jià)結(jié)果的合成方法(1)單純普通數(shù)據(jù)的合成加權(quán)平均,逐級(jí)向上,直到在一級(jí)指標(biāo)上歸并為一個(gè)合成的分值。舉例(2)單純模糊數(shù)據(jù)的合成方法A、多級(jí)模糊綜合評(píng)判法1、對(duì)末級(jí)(二級(jí))指標(biāo)進(jìn)行第一次綜合評(píng)判:W、R合成。如上例“某課堂教學(xué)質(zhì)量”2、將二級(jí)指標(biāo)對(duì)一級(jí)指標(biāo)所形成的若干綜合評(píng)判結(jié)果(即第一次綜合評(píng)判結(jié)果)組成一個(gè)新的模糊矩陣。如“某課堂教學(xué)質(zhì)量”再加上.3、將新矩陣與一級(jí)指標(biāo)權(quán)重向量合成 計(jì)算綜合評(píng)判結(jié)果。B、二維加權(quán) 綜合合成法P143縱向加權(quán)/橫向加權(quán)板書(shū)畫(huà)圖:(3)混合數(shù)據(jù)的合成方法1、普通數(shù)據(jù)轉(zhuǎn)模糊數(shù)據(jù)2、模糊數(shù)據(jù)轉(zhuǎn)換成普通數(shù)據(jù)

43、第六章 教育測(cè)量結(jié)果的整理、轉(zhuǎn)換與組合第一節(jié) 教育測(cè)量數(shù)據(jù)的特點(diǎn)與種類數(shù)據(jù)的特點(diǎn):波動(dòng)性、規(guī)律性數(shù)據(jù)種類:點(diǎn)計(jì)數(shù)據(jù)、度量數(shù)據(jù)/間斷性數(shù)據(jù)、連續(xù)型數(shù)據(jù)/類別變量、等級(jí)變量、等距變量、比率變量教育測(cè)量數(shù)據(jù)的特點(diǎn):1、多屬等級(jí)變量;2、多屬主觀的;3、多屬隨機(jī)的(概率為1則為確定性);4、模糊性第二節(jié) 教育測(cè)量分?jǐn)?shù)的初步整理一、統(tǒng)計(jì)表的結(jié)構(gòu)(自學(xué)2分鐘)二、頻數(shù)分布表的編制由同學(xué)自習(xí)5分鐘后,上臺(tái)講解書(shū)本例題。第三節(jié) 教育測(cè)量分?jǐn)?shù)的轉(zhuǎn)換原始分(卷面分)的缺點(diǎn):意義模糊,不能直接比較導(dǎo)出分?jǐn)?shù):由原始分轉(zhuǎn)換而成,如標(biāo)準(zhǔn)分、T分?jǐn)?shù)、百分等級(jí)分?jǐn)?shù)等。一、標(biāo)準(zhǔn)分方差概念:隨機(jī)變量離差平方的數(shù)學(xué)期望樣本方差?計(jì)

44、算P153的方差公式例題P155,自學(xué)5分鐘例題:甲、乙、丙、丁四人在某次語(yǔ)文考試中分別得72、60、48、90,而全體學(xué)生的語(yǔ)文平均分60,標(biāo)準(zhǔn)差12分,求四人相應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。例題:對(duì)某校高二學(xué)生進(jìn)行期中學(xué)習(xí)質(zhì)量測(cè)驗(yàn),語(yǔ)文、數(shù)學(xué)和英語(yǔ)成績(jī)的平均分?jǐn)?shù)分別是80、70、85,標(biāo)準(zhǔn)差分別為10分、15分、12分。若某學(xué)生三科成績(jī)分別為85、82、90分,問(wèn)該生成績(jī)哪一科最好?標(biāo)準(zhǔn)分?jǐn)?shù)Z的性質(zhì)與特點(diǎn)1、均值0,標(biāo)準(zhǔn)差1。(補(bǔ)充證明,概率論P(yáng)97)Z=0表示成績(jī)與平均數(shù)相等;2、有相對(duì)0點(diǎn)作參照點(diǎn),有相等單位的導(dǎo)出分?jǐn)?shù),可加減;3、由于是對(duì)原始分?jǐn)?shù)的線性變換,所以不改變?cè)挤謹(jǐn)?shù)的分布形態(tài)(其證明同1)

45、;4、若原始分?jǐn)?shù)接近正態(tài)分布,則標(biāo)準(zhǔn)分范圍大致在-4+4之間。課后思考:常模團(tuán)體不服從正態(tài)分布則不能直接用標(biāo)準(zhǔn)分?jǐn)?shù),怎么辦?自行查找資料。標(biāo)準(zhǔn)分的進(jìn)一步轉(zhuǎn)換1、T分?jǐn)?shù):10Z+502、標(biāo)準(zhǔn)九:2Z+5標(biāo)準(zhǔn)9分與其他評(píng)分制的相互關(guān)系(P139)3、CEEB分?jǐn)?shù)(美國(guó)大學(xué)入學(xué)考試報(bào)告分?jǐn)?shù)):500+100Z4、TOEFL:500+70Z5、IQ=100+15Z三、百分等級(jí)分?jǐn)?shù)概念計(jì)算:100-(100R-50)/N例1、52名同學(xué)考試,甲第4名,求其百分等級(jí)分?jǐn)?shù)。例2、52名同學(xué)考試,甲、乙、丙、丁戊己庚辛壬癸共10人并列第4名,求其百分等級(jí)分?jǐn)?shù)。百分等級(jí)常模建立方法基本思想:把某個(gè)測(cè)驗(yàn)分?jǐn)?shù)分布的

46、全距劃分為100個(gè)等級(jí),建立原始分與百分等級(jí)間的一一對(duì)應(yīng)關(guān)系。步驟:1、從高到低排列2、逐個(gè)統(tǒng)計(jì)次數(shù)3、計(jì)算“以下累計(jì)次數(shù)”4、計(jì)算“以下累計(jì)相對(duì)次數(shù)”5、將第四步換成百分制以P154的36個(gè)分?jǐn)?shù)為例,示范1例,其余同學(xué)們自己算?;诜纸M歸類數(shù)據(jù)建立百分等級(jí)常模方法:編制“成績(jī)次數(shù)分布統(tǒng)計(jì)表”只不過(guò)是在P154頁(yè)的表的基礎(chǔ)上增加“相對(duì)次數(shù)”、“累計(jì)次數(shù)”、“累積相對(duì)次數(shù)”等條目。計(jì)算公式:(100/N)*Fb+f(X-Lb)/iN為常模團(tuán)體總?cè)藬?shù),X為原分?jǐn)?shù),Lb為X所在組別的組下限,F(xiàn)b為小于Lb的各組次數(shù)之和,f為X所在組的次數(shù),i為組距。請(qǐng)計(jì)算P154頁(yè)例子中,67分、89分的百分等級(jí)。

47、幾種標(biāo)準(zhǔn)分?jǐn)?shù)關(guān)系圖手繪,參考書(shū)P140P219第十六章 課程評(píng)價(jià)第二節(jié) 課程評(píng)價(jià)模式的演變課程評(píng)價(jià)模式:評(píng)價(jià)人員或研究人員依據(jù)某種教育思想、課程理念或特定的評(píng)價(jià)目的選取一種或幾種評(píng)價(jià)途徑所建立起的相對(duì)完整的評(píng)價(jià)體系。它介于評(píng)價(jià)理論與具體的評(píng)價(jià)方法之間,既涉及標(biāo)準(zhǔn)又涉及方法,既包含了評(píng)價(jià)者的評(píng)價(jià)取向,也規(guī)定了評(píng)價(jià)的具體操作方式。回顧P22 -23,“八年研究”。3分鐘目標(biāo)模式的觀點(diǎn):在課程與教學(xué)的基本原理一書(shū)中,泰勒認(rèn)為,一個(gè)有效的課程必須回答四個(gè)問(wèn)題:1、學(xué)校應(yīng)力求達(dá)到何種教育目標(biāo)。2、要為學(xué)生提供怎樣的教育經(jīng)驗(yàn)(學(xué)習(xí)經(jīng)驗(yàn)),才能達(dá)到這些目標(biāo)。3、如何有效地組織好這些教育經(jīng)驗(yàn);4、我們?nèi)绾未_定

48、這些教育目標(biāo)正在實(shí)現(xiàn)。泰勒的主要觀點(diǎn):評(píng)估的過(guò)程從本質(zhì)上說(shuō)就是判斷課程和教學(xué)計(jì)劃在多大程度上實(shí)現(xiàn)了教育目標(biāo)的過(guò)程。評(píng)價(jià)應(yīng)針對(duì)學(xué)生的行為而進(jìn)行,因?yàn)榻逃龑で蟮恼菍W(xué)生行為的改變。評(píng)價(jià)應(yīng)是任意一段時(shí)間內(nèi)做的一次以上的評(píng)價(jià),因?yàn)樵u(píng)價(jià)要反映的是行為的變化,而這種變化必須通過(guò)更多的評(píng)價(jià)對(duì)比才能反映出來(lái)。評(píng)價(jià)步驟:1、建立課程計(jì)劃的目的和目標(biāo);2、以具體行為和具體內(nèi)容的方式闡述每個(gè)目標(biāo);3、確定使用目標(biāo)的情景;4、確定情景呈現(xiàn)的方式;5、確定獲取信息的記錄方式;6、收集反映學(xué)生行為變化的信息;7、將收集到的信息與行為目標(biāo)作比較。有學(xué)者將其簡(jiǎn)化為四步:確定教育目標(biāo)、設(shè)計(jì)評(píng)價(jià)情景、選擇和編制評(píng)價(jià)工具、分析評(píng)價(jià)

49、結(jié)果。實(shí)例:目標(biāo)評(píng)價(jià)模式在體育專業(yè)背越式跳高教學(xué)中的應(yīng)用首先,確定教學(xué)目標(biāo):背越式跳高學(xué)習(xí)結(jié)束時(shí),學(xué)生獲得一定的技能和能力;其次,進(jìn)行任務(wù)分析:再次,設(shè)計(jì)和實(shí)施教學(xué)過(guò)程。進(jìn)行任務(wù)分析后,對(duì)不同的教學(xué)單元實(shí)施教學(xué),確認(rèn)學(xué)生在各個(gè)環(huán)節(jié)應(yīng)當(dāng)實(shí)現(xiàn)的目標(biāo)行為。最后,評(píng)價(jià)環(huán)節(jié):教學(xué)過(guò)程中對(duì)技能目標(biāo)進(jìn)行形成性評(píng)價(jià)至最終總結(jié)性評(píng)價(jià),確認(rèn)其實(shí)現(xiàn)課程目標(biāo)的程度。目標(biāo)模式的功能:1、修訂課程與教學(xué)計(jì)劃;2、進(jìn)一步明確教育目標(biāo);3、影響教學(xué)與學(xué)習(xí);4、可診斷出學(xué)生學(xué)習(xí)狀況。泰勒模式的特點(diǎn)及局限局限:1、對(duì)目標(biāo)自身的合理性缺乏評(píng)價(jià);2、只觀察了預(yù)期目標(biāo)是否達(dá)到,非預(yù)期效果沒(méi)有評(píng)價(jià);3、所定目標(biāo)多數(shù)為教育管理者提出的,沒(méi)

50、有考慮學(xué)生的需要;4、不應(yīng)用統(tǒng)一的目標(biāo)來(lái)評(píng)價(jià)自由發(fā)展的人;5、重結(jié)果輕過(guò)程。結(jié)論:泰勒模式第一次指出了教育目標(biāo)、課程設(shè)計(jì)和評(píng)價(jià)過(guò)程之間存在著密切聯(lián)系。泰勒認(rèn)為,評(píng)價(jià)的目的要比較全面地檢驗(yàn)學(xué)習(xí)經(jīng)驗(yàn)在實(shí)際上是否起作用,指導(dǎo)教師去引起所期望的那種結(jié)果。泰勒模式風(fēng)靡全球,即使在評(píng)價(jià)模式多樣化的今天,也有舉足輕重的地位。CIPP模式課程評(píng)價(jià)的CIPP模式即背景-輸入-過(guò)程-成果模式(context-input processproduct),是美國(guó)教育評(píng)價(jià)學(xué)家斯塔夫爾比姆倡導(dǎo)的課程評(píng)價(jià)模式。該模式于20世紀(jì)60年代后期發(fā)展起來(lái)。主要觀點(diǎn):評(píng)價(jià)不應(yīng)該局限于評(píng)定課程目標(biāo)的達(dá)成程度,而應(yīng)該是為課程決策者提供有

51、用的信息。如:“評(píng)價(jià)最重要的目的不是證明,而是改善。”“評(píng)價(jià)是提供有用資料以作決定的歷程”背景評(píng)價(jià):提供整個(gè)課程方案運(yùn)行的各種依據(jù)和信息,了解評(píng)價(jià)對(duì)象的需要與課程目標(biāo)之間的一致性程度,以調(diào)節(jié)現(xiàn)存的目的及其優(yōu)先秩序。輸入評(píng)價(jià):對(duì)可供選擇的各種課程計(jì)劃評(píng)價(jià)擇優(yōu),即可行性的評(píng)價(jià)。過(guò)程評(píng)價(jià):對(duì)計(jì)劃實(shí)施情況進(jìn)行不斷檢查,描述課程實(shí)施情況,為決策者的修正提供可靠信息。成果評(píng)價(jià):測(cè)量、解釋和判斷課程方案的實(shí)效,幫助決策者決定課程方案終止、修正還是繼續(xù)實(shí)施。優(yōu)點(diǎn):1、將目標(biāo)本身也列入評(píng)價(jià)對(duì)象范圍;2、重視形成性評(píng)價(jià),強(qiáng)調(diào)為決策提供信息,使評(píng)價(jià)活動(dòng)更具有方向性和實(shí)用性;3、評(píng)價(jià)教育的全過(guò)程,相對(duì)全面;4、目的不是簡(jiǎn)單評(píng)價(jià)一個(gè)方案的好壞,而是決策,所以研究者相對(duì)客觀。目標(biāo)游離模式斯里克文(M.Scriven)提出。它針對(duì)目標(biāo)模式忽視非預(yù)期效應(yīng)的弊端提出來(lái)的。他說(shuō),“對(duì)目的的考慮和評(píng)價(jià)是一個(gè)不必要的,而且很可能是有害的步驟”。因?yàn)槟繕?biāo)評(píng)價(jià)很容易使評(píng)價(jià)人受方案既定目的的約束,限制了評(píng)價(jià)的范圍,削弱了評(píng)價(jià)的意義。他建議把評(píng)價(jià)的重點(diǎn)由“方案想干什么”轉(zhuǎn)移到“方案實(shí)際干了什么”上來(lái),全面收集關(guān)于方案實(shí)際結(jié)果的各種信

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論