教育測量與評價(期末復(fù)習(xí)重點(diǎn))

上傳人：5*** IP屬地：湖北上傳時間：2021-10-25 格式：PPT 頁數(shù)：152 大?。?.69MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩147頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二章教育測量的質(zhì)量指標(biāo)衡量教育測量的質(zhì)量，可采用四個指標(biāo)：信度主要對整個測量而言。效度難度主要對測量的項(xiàng)目而言。區(qū)分度第一節(jié) 信度一、信度概念信度是指測量結(jié)果結(jié)果的穩(wěn)定性或可靠性程度。用同一種工具反復(fù)測同一種特質(zhì)對象，結(jié)果的一致性程度就叫信度一般地說，一個好的測量必須具有較高的信度，也就是說，一個好的測量工具，只要遵守操作規(guī)則，其結(jié)果結(jié)果就不應(yīng)隨工具的使用者或使用時間等方面的變化而發(fā)生較大的變化。或者說，測驗(yàn)的抗干擾能力強(qiáng)，誤差因素控制得好，測值的一致性高，就叫信度高，人們感覺可靠。可以從以下三個方面去理解測量的信度P29：信度指實(shí)測值（X）和真值（T）相差的程度信度是指統(tǒng)計(jì)量與

2、參數(shù)之間的接近程度信度指兩次重復(fù)測量或等值測量之間的關(guān)聯(lián)程度。三、信度的估計(jì)方法（信度類型）1、重復(fù)信度（再測信度）指的是同一個量表對同一組被試施測兩次所得結(jié)果的一致性程度。其大小等于同一組被試在兩次測驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)，一般采用積差相關(guān)的公式來計(jì)算。（板書、推導(dǎo)該公式）積差相關(guān)的使用條件：兩個變量的總體都呈正態(tài)分布，至少是單峰對稱的分布。作此判斷需要總體分布的卡方檢驗(yàn)。必須是成對數(shù)據(jù)，每對數(shù)據(jù)之間相互獨(dú)立兩個變量之間呈線性關(guān)系，可由散布圖的形狀來決定。例一用一個算術(shù)四則的速度測驗(yàn)12個小學(xué)生，得分記為X，為了考察測量結(jié)果的可靠性，于3個月后再測一次，得分記為Y，問測驗(yàn)結(jié)果是否可靠？學(xué)生序

3、號 1 2 3 4 5 6 7 8 9 10 11 12X 20 20 21 22 23 23 232425262627Y 20 21 21 20 23 23 252526262729在使用重測法計(jì)算穩(wěn)定性系數(shù)時，應(yīng)注意以下問題：1、信度的取值范圍為0，1，當(dāng)信度值較大時，說明前后兩次測量結(jié)果比較一致；2、兩次測驗(yàn)之間的時間間隔要適宜。太長，身心發(fā)展、遺忘、環(huán)境改變等使信度降低；太短，練習(xí)與記憶等提高了成績，信度降低。3、重測法適用于速度測驗(yàn)而不適用于難度測驗(yàn)；因被試很難記憶第一次，而難度測驗(yàn)相反。還適用于運(yùn)動技能的測驗(yàn)。4、適用于異質(zhì)測驗(yàn)，即一個測驗(yàn)包含幾個不同的部分，分別測量不同的心理特質(zhì)

4、。因?yàn)檫@種測試不適于計(jì)算內(nèi)部一致性信度。4、應(yīng)注意提高被試者的積極性。2、復(fù)本信度指的是兩個平等的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個復(fù)本測驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。所謂復(fù)本測驗(yàn)是指在格式、內(nèi)容、題型、題數(shù)、難度、指導(dǎo)語說明、施測要求等方面都一致（或相等）的兩份或多份測驗(yàn)。例二以A、B兩型英語復(fù)本測驗(yàn)對初中三年級10個學(xué)生施測，為避免由測驗(yàn)施測順序所造成的誤差，其中5個學(xué)生先做A型測驗(yàn)，休息15分鐘后，再做B型測驗(yàn)；而另5個學(xué)生先做B型測驗(yàn)，休息15分鐘后，再做A型測驗(yàn)。10個學(xué)生A型測驗(yàn)結(jié)果記為X，B型測驗(yàn)結(jié)果記為Y，其測驗(yàn)的復(fù)本信度如何？學(xué)生序號 1 2 3 4

5、 5 6 7 8 9 10X 19 19 18 17 16 15 15 14 13 12Y 20 17 18 18 17 15 13 15 12 12復(fù)本信度的優(yōu)缺點(diǎn)表現(xiàn)：優(yōu)點(diǎn)：1、兩個復(fù)本在同時使用同時使用時，可以避免再測信息的一些缺點(diǎn)如首測對再測在記憶、練習(xí)、效果的影響，間隔期間獲得新知識的影響，兩次施測的環(huán)境不同和被試主觀狀態(tài)不同的影響，以及為了應(yīng)付測驗(yàn)所作訓(xùn)練的影響等。反映究竟是不是真正的平行測驗(yàn)；換言之，反映了測驗(yàn)內(nèi)容造成的誤差。2、測驗(yàn)的兩個復(fù)本，如果在不同的時間不同的時間使用，其信度既可以反映被試在不同時間的穩(wěn)定性，又可以反映測驗(yàn)內(nèi)容的一致性。換言之，既反映了時間影響，又反映了測

6、驗(yàn)內(nèi)容的抽樣誤差。這種同時兼顧試題抽樣與時間影響的信度，稱為等值穩(wěn)定性系數(shù)，與其他信度系數(shù)相比，該系數(shù)最小，也就是說，此種復(fù)本信度是對信度最嚴(yán)格的檢驗(yàn)。3、在追蹤研究或探討某些影響測驗(yàn)成績的因素時，大多使用復(fù)本測驗(yàn)，分析復(fù)本信度。缺點(diǎn)：1、編制兩個完全相等的測驗(yàn)是很困難的，如果兩個復(fù)本過份相似，則變成再測形式，而過分不相似，又使等值的條件不存在；2、兩個復(fù)本測驗(yàn)有可能在某種程度上測量了不同的性質(zhì)，這就會低估測驗(yàn)的信度；（因內(nèi)容造成的誤差）。3、被試同時接受性質(zhì)相似的兩個測驗(yàn)，可能減少完成測驗(yàn)的積極性；4、雖然兩個復(fù)本測驗(yàn)的題目材料不同，但被試一旦掌握了解題的某一模式，就能觸類旁通，有可能失去

7、復(fù)本的意義。3.1、同質(zhì)信度之分半信度就是將測驗(yàn)分半，被試在每一半測驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。反映了2半題目間的一致性。分半的方法很多，如，按題號奇偶，按難度、按題目內(nèi)容。無論如何分半，都要在分開后做微調(diào)，最終目的是分成對等的兩半。如果做不到對等，就不適合求分半信度。在實(shí)際運(yùn)用中，由于題目一般是按難度大小排列，采用奇偶分半可以使兩半測驗(yàn)的題目在難度上基本相等，因此常被采納。分半后，計(jì)算每個被試在兩個分半測驗(yàn)分?jǐn)?shù)的積差相關(guān)系數(shù)，由于只是半個測驗(yàn)之間的信度，故，再用斯皮爾曼布朗公式加以校正。3.2 同質(zhì)信度之庫德爾-理查森信度適合于全部二分計(jì)分題測驗(yàn)的內(nèi)部一致性信度分析。常用的兩個公式有：（板

8、書，P33）例三對初中一年級學(xué)生進(jìn)行地理成績測驗(yàn)，每答對1題得1分，答錯1題得0分，其測驗(yàn)結(jié)果如下表，試估計(jì)該測驗(yàn)的庫德-理查森信度？學(xué)生序號題序 1 2 3 4 5 6 總分1 1 0 0 0 0 0 12 1 0 0 1 0 0 23 0 0 0 0 1 1 24 1 1 1 0 0 0 35 0 1 0 0 1 1 36 1 1 1 0 0 0 37 1 1 1 1 0 0 48 1 1 1 1 0 0 49 1 1 0 1 1 1 510 1 1 1 1 1 1 6pqpq 請比較兩個公式所算出來的值當(dāng)測驗(yàn)中所有的試題難度都一樣，或平均難度接近0.50時，兩個公式所估計(jì)出來的信度值

9、將相等。但是，當(dāng)測驗(yàn)中所有試題難度值極不相同時，差距將較大。一般KR21比KR20信度值小。4、論文式測驗(yàn)信度論文沒有嚴(yán)格評分標(biāo)準(zhǔn)，同樣題目，不同應(yīng)試者回答與得分不一樣，可用克龍巴赫阿爾法系數(shù)公式。P34該公式適用于：測驗(yàn)題型多并非都是2分計(jì)分題時。板書公式請閱讀，并解釋公式含義。例4用一個包含6個論文式試題的測驗(yàn)，測5個被試，結(jié)果如下，試求該測驗(yàn)的信度？題序學(xué)生序號 1 2 3 4 5 某題得分方差1 3 6 1 6 5 2 4 3 3 2 3 3 3 4 1 2 1 4 2 5 2 1 2 5 1 4 4 5 4 6 4 6 5 3 2 總分 17 28 16 19 17 四、提高信度

10、的方法（一）信度系數(shù)多大為宜？學(xué)科測驗(yàn)0.9以上；智力測驗(yàn)0.8以上；品德測驗(yàn)，達(dá)到0.6就不錯了。作業(yè)1、用某量表測驗(yàn)10名學(xué)生，得分記為X，為了考察結(jié)果的可靠性，于15天后用原量表對這10個學(xué)生重測一次，得分記為Y，問測驗(yàn)結(jié)果是否可靠？學(xué)生序號 1 2 3 4 5 6 7 8 9 10X 8 10 9 6 10 7 5 7 9 4Y 9 10 10 6 10 8 4 8 9 42、對10名應(yīng)試者先進(jìn)行某種測驗(yàn)X，隔適當(dāng)時間后（半年），再進(jìn)行內(nèi)容、范圍、難度類似的第二次測驗(yàn)Y，試求測驗(yàn)的復(fù)本信度？應(yīng)試者 1 2 3 4 5 6 7 8 9 10X 9 10 10 6 10 8 4 8 9 4

11、Y 4 9 7 9 4 3 5 3 2 43、有一個由100題構(gòu)成的量表施行于10個高三學(xué)生（分?jǐn)?shù)見下表）。測驗(yàn)一次后，學(xué)生即畢業(yè)離校，現(xiàn)怎樣評價測驗(yàn)結(jié)果的信度？學(xué)生序號 1 2 3 4 5 6 7 8 9 10奇X 38 37 38 41 40 36 38 39 40 35偶Y 37 37 36 39 39 34 38 39 39 36四、提高信度的方法1、影響測量信度的主要因素自行閱讀P34-35，請同學(xué)們討論、解釋。（1）測量工具方面（對照教材重點(diǎn)解釋）（2）主試、施測情境方面（對照教材舉例）（3）被試方面（同上）（4）兩次施測的間隔時間方面2、提高測量信度的常用方法閱讀p36-37，請

12、學(xué)生解釋：（1）適當(dāng)增加測驗(yàn)的長度（2）測驗(yàn)的難度要適中（3）測驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì)（不同質(zhì)是如何影響信度的？）（4）測驗(yàn)的程序應(yīng)統(tǒng)一（5）測驗(yàn)的時間要充分（6）測驗(yàn)的評分要盡量做到客觀化，減少評分誤差第二節(jié) 效度一、什么是效度效度是指測量結(jié)果的準(zhǔn)確性和有效性的程度。也可以說是測量是否達(dá)到了預(yù)期的目的。1、效度是一個相對的概念。測量的效度是相對一定的測量目的而言的2、一種測量的效度只是高或低的問題測量結(jié)果總是有一定效度的，只是效度高低不同罷了。3、教育領(lǐng)域的效度問題比其他領(lǐng)域的測量更重要。二、效度的理論公式板書P39及參考書P58重申變量和的方差運(yùn)算公式目標(biāo)真分?jǐn)?shù)、非目標(biāo)真分?jǐn)?shù)根據(jù)理論公式，

13、怎樣才算測量效度高？請同學(xué)們回答。三、效度的估計(jì)效度估計(jì)就是多方尋找證據(jù)來證明一個測驗(yàn)的有效性程度的過程。（一）內(nèi)容效度就是指測驗(yàn)題目樣本對于應(yīng)測內(nèi)容與行為領(lǐng)域的代表性程度。也就是說，測驗(yàn)的內(nèi)容范圍、材料與所要測量的內(nèi)容范圍、教育目標(biāo)是否相符合；測驗(yàn)中測題所引起的行為是否是所要測量的屬性的明確反應(yīng)。為了使測驗(yàn)的內(nèi)容具有有效性，成為所欲測量內(nèi)容的一個具有代表性的行為樣本，在編制測驗(yàn)時，就要考慮建立內(nèi)容效度的問題。2、內(nèi)容效度的估計(jì)邏輯分析法其工作思路是請有關(guān)專家對測驗(yàn)題目與應(yīng)測內(nèi)容范圍的吻合程度作出判斷。把所有題目按考試內(nèi)容和考查目標(biāo)分布進(jìn)行雙向分類，形成實(shí)際的“題目雙向分類表”。與事先預(yù)定的

14、“命題雙向分類表”作比較，看是否偏離了原命題計(jì)劃。內(nèi)容效度主要應(yīng)用于成就測驗(yàn)、學(xué)科測驗(yàn)。內(nèi)容效度不適合用于能力傾向和人格測驗(yàn)。（二）結(jié)構(gòu)效度結(jié)構(gòu)：心理學(xué)或社會學(xué)上的一種理論構(gòu)想或特質(zhì)。本身觀察不到，也無法直接測量，但學(xué)術(shù)理論假設(shè)它是存在的。舉例:結(jié)構(gòu)效度：測量能測出這種結(jié)構(gòu)的程度（1）結(jié)構(gòu)效度的特點(diǎn)結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論，一旦人們對同一種心理特質(zhì)有著不同的定義或假設(shè)，則會使得關(guān)于特質(zhì)測驗(yàn)的結(jié)構(gòu)效度的研究結(jié)果無法比較。比如智力（2）建立結(jié)構(gòu)效度的步驟A、提出理論假設(shè)；B、根據(jù)假定結(jié)構(gòu)，導(dǎo)出各項(xiàng)關(guān)于心理功能或行為的基本假設(shè)。擬定測題，編制測驗(yàn)；C、以測驗(yàn)結(jié)果為根據(jù)來驗(yàn)證假設(shè)

15、結(jié)構(gòu)中的各種因素是否成立。例如智力P42測量甲與其他理論上認(rèn)為應(yīng)該與之有關(guān)的其他測量有顯著相關(guān)。與其他理論上認(rèn)為不應(yīng)該與之有關(guān)的其他測量沒有顯著相關(guān)。與內(nèi)容效度不同，結(jié)構(gòu)效度主要用于智力測驗(yàn)、人格測驗(yàn)等一些心理測驗(yàn)方面。（三）效標(biāo)關(guān)聯(lián)效度是以測驗(yàn)分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來表示測驗(yàn)效度高低的方法。什么是效標(biāo)？例如：某年全國高考物理學(xué)科的測驗(yàn)效度，可用大學(xué)一年級物理學(xué)科的測驗(yàn)分?jǐn)?shù)為效標(biāo)，然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān)，此相關(guān)系數(shù)就是該年高考物理測驗(yàn)的效標(biāo)關(guān)聯(lián)效度系數(shù)。效標(biāo)不僅隨測驗(yàn)的種類不同而不同，而且可能隨時間而改變，現(xiàn)在是一個好的成功的效標(biāo)，將來就不一定是。所以，為某個測

16、驗(yàn)選擇一個最有效的效標(biāo)，這是最重要的事情。教育測驗(yàn)的效標(biāo)，可采用各學(xué)科成績和教師評定的結(jié)果；智力測驗(yàn)的效標(biāo)，可采用學(xué)科成績、教師評判的結(jié)果、學(xué)生總成績、受教育年限、年齡以及其他事物；能力傾向測驗(yàn)的效標(biāo)，可采用特殊課程或特殊訓(xùn)練的成績；職業(yè)興趣測驗(yàn)的效標(biāo)，可采用從業(yè)人員實(shí)際服務(wù)成績或記錄；人格測驗(yàn)的效標(biāo)，可采用被試以后行為或臨床資料。效標(biāo)關(guān)聯(lián)效度的種類同時效度預(yù)測效度效標(biāo)關(guān)聯(lián)的計(jì)算方法：計(jì)算相關(guān)系數(shù)（多采用積差相關(guān)法，略）P41，其他方法參閱教育統(tǒng)計(jì)學(xué)教材2、提高測量效度的方法P44對效度系數(shù)的要求：P42，閱讀1分鐘控制系統(tǒng)誤差精心編制測驗(yàn)量表擴(kuò)充樣本的容量（增加樣本對總體的代表性）合理處理效

17、度和信度的關(guān)系（信度是效度的前提，效度不大于信度的平方根）妥善組織測驗(yàn)適當(dāng)增加測驗(yàn)長度三、難度難度是指試題的難易程度。一道試題，如果大部分被試都能答對，則該題的難度就小；如果大部分被試都不能答對，則該題的難度就大。難度由被試群體整體水平所確定。是相對概念。難度的計(jì)算（一）基本公式1、客觀題難度的計(jì)算P=R/N R為答對該試題人數(shù)，N為參加測驗(yàn)總?cè)藬?shù)例1：在100個學(xué)生中，答對第一題的30人，答對第二題的60人，求第一、二道題的難度？比較這兩道題誰比誰難？2、主觀題難度的計(jì)算例2：某道論述題滿分12分，所有考生在這道題上的平均得分為3.6分，求該題的難度？例3：語文測驗(yàn)第五題最高得分為12分，這

18、道題考生的平均得分是8.5分，求該題難度？例4：60人參加考試，某題滿分為12分，正確得分累積是480分，求該題難度？（2）極端分組法客觀題步驟：將測驗(yàn)總分進(jìn)行高低排序（由高到低）進(jìn)行高低分組（各取27%），并計(jì)算某題的得分率求兩組的平均值公式：P=（PH+PL）/2PH為高分組答對該題的百分比；PL為低分組答對該題的百分比。例5某區(qū)域1000人參加考試，試卷第一題高分組180人答對，低分組60人答對，求該題難度？如果該題滿分為10分，高分組得分總數(shù)為2100分，低分組得分總數(shù)為830分，求該題難度？論文題的步驟：將測驗(yàn)總分進(jìn)行高低排序（由高到低）進(jìn)行高低分組（各取25%）分別為高分組、低分組

19、編制每道試題的分析表按下列公式計(jì)算難度：P=板書P48 例某道論文題，高分組得分總和40分，低分組得分總和15分，40人參加考試，此題最高得分為5分，最低得分為2分，則此題的難度為P48：2、難度的分析與控制（1）難度分析進(jìn)行難度分析的主要目的是為了篩選題目。A、測驗(yàn)題目難度水平的確定測驗(yàn)題目難度水平的適當(dāng)與否，取決于測驗(yàn)的目的、性質(zhì)和題目的形成。當(dāng)P值接近于0或接近于1時，即被試在該題上全部答對或全部答錯，則該題無法提供個體的信息。而只當(dāng)P值接近于0.50時，題目才能把被試作最大的程度的區(qū)分。（離散程度最大）對于常模參照性測驗(yàn)，大多數(shù)難度在0.3-0.7之間，平均0.5。但對于奧林匹克競賽或

20、補(bǔ)習(xí)功課的學(xué)生，例外。B、測驗(yàn)難度對分?jǐn)?shù)分布的影響測驗(yàn)的難度直接依賴于組成測驗(yàn)的題目的難度，通過考察測驗(yàn)分?jǐn)?shù)的分布，可以對測驗(yàn)的難度做出直觀檢查。由于人的心理特性值多數(shù)呈正態(tài)分布，因此當(dāng)測驗(yàn)?zāi)康脑谟跍y量個體差異時，若被試樣本具有代表性，則其結(jié)果應(yīng)呈正態(tài)分布。測驗(yàn)分?jǐn)?shù)背離正態(tài)分布有兩種情況：其一是題目難度普遍較大，被試得分普遍較低，使得低分端出現(xiàn)高峰，呈正偏態(tài)；其二是題目難度普遍較小，被試的得分普遍較高，使得高分端出現(xiàn)高峰，呈負(fù)偏態(tài)。（2）難度的控制一般說來，影響題目難度的主要因素有：考察知識點(diǎn)的多少；考察能力的復(fù)雜程度或?qū)哟蔚母叩?；考生對題目的熟悉態(tài)度；命題的技巧。難度控制：正確估計(jì)考生水平與

21、否；弄清弄懂各知識點(diǎn)與否；掌握命題技巧與否。四、區(qū)分度（一）區(qū)分度的含義指測驗(yàn)題目對考生實(shí)際水平的區(qū)分程度或鑒別能力。如一道題，學(xué)業(yè)水平、實(shí)際能力都較高的考生都答對了；而學(xué)業(yè)水平、實(shí)際能力都較低的考生都答錯了，則可認(rèn)為該題目有好的區(qū)分度。區(qū)分度分析主要以效能為依據(jù)，考察考生在每個題目上反應(yīng)與其在效標(biāo)上的表現(xiàn)之間的相關(guān)程度。區(qū)分度（D）的取值范圍介于- 1.00+1.00之間，值越大，區(qū)分度的效果越佳。區(qū)分度D0為正區(qū)分，D0為負(fù)區(qū)分，D=0為零區(qū)分區(qū)分度與測驗(yàn)信度、難度的關(guān)系，請自行閱讀P51。（二）區(qū)分度的計(jì)算1、極端分組法（1）客觀性試題D=PH-PL例6：有道試題，高分組有70%學(xué)生通過

22、，低分組有30%的學(xué)生通過；而另一道題，高分組有40%學(xué)生通過，低分組有70%學(xué)生通過，求兩題的各自區(qū)分度？P51（2）主觀題D=（XH-XL）/N（H-L）XH為高分組得分總數(shù)XL為低分組得分總數(shù)H為該道題的最高分L為該道題的最低分N為應(yīng)試總?cè)藬?shù)的25%。例7 高分組低分組得分X 人次f 得分X 人次f 5 4 5 0 4 3 4 1 3 2 3 1 2 1 2 3 1 0 1 1 0 0 0 4此題最高得分5分，最低得分0分2、相關(guān)法點(diǎn)二列相關(guān)法例8：15個學(xué)生在數(shù)學(xué)測驗(yàn)中得分記錄如下，計(jì)算數(shù)學(xué)測驗(yàn)中第一題的區(qū)分度？學(xué)生 1 2 3 4 5 6 7 8 9 10 11 12 13 14

23、15測驗(yàn) 65 70 31 49 80 50 35 10 81 69 78 55 77 90 42第一題 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0二列相關(guān)例9：已知一測驗(yàn)中某選擇題的通過率為0.5，答對者的測驗(yàn)總分平均為76分，答錯者的測驗(yàn)總分平均為63分，全體被試20人總分的標(biāo)準(zhǔn)差為16，求該題的區(qū)分度？（三）提高區(qū)分度的方法1、使題目的難度適中，使整個考試難度適中題目的難度適中可使區(qū)分度達(dá)到最大值，因此，使難度適中是提高區(qū)分度的重要方法。2、著重考察復(fù)雜的學(xué)習(xí)結(jié)果使高能學(xué)生得高分或低能學(xué)生得低分，使分?jǐn)?shù)盡量分布在整個分?jǐn)?shù)量尺上。3、掌握區(qū)分度的評價標(biāo)準(zhǔn)。P53，評價標(biāo)準(zhǔn)表

24、第三章測驗(yàn)?zāi)繕?biāo)定義1、深入分析課程教學(xué)目標(biāo)；閱讀5分鐘后，請合上課本描繪教育目的、教學(xué)目標(biāo)、課程目標(biāo)、單元教學(xué)目標(biāo)、課時教學(xué)目標(biāo)、知識點(diǎn)教學(xué)目標(biāo)、行為目標(biāo)、學(xué)習(xí)目標(biāo)及程序教學(xué)諸概念之間的關(guān)系。雙向細(xì)目表的概念內(nèi)容類的概念 P76，認(rèn)真閱讀3分鐘。目標(biāo)層次的概念第四章教育評價方案的編制與實(shí)施第二節(jié) 教育評價方案的制定一、教育評價指標(biāo)體系的的構(gòu)建（一)教育評價指標(biāo)體系的結(jié)構(gòu)1、框架指標(biāo)體系的構(gòu)成：指標(biāo)集、評價標(biāo)準(zhǔn)、量化符號。板書解釋“評價對象”與“指標(biāo)”的相對性 2、模型一般模型：評價普遍現(xiàn)象分類模型：評價特殊現(xiàn)象舉例：“一間中學(xué)，教師的教學(xué)工作”一般模型與分類模型的相對性，例如：“一間中學(xué)，

25、教師的教學(xué)工作” “一間中學(xué)，中學(xué)的全面工作”指標(biāo)體系由指標(biāo)、評價標(biāo)準(zhǔn)和量化符號組成3、指標(biāo)（與“評價對象”相對）必達(dá)指標(biāo)與期望指標(biāo)對教師學(xué)歷、設(shè)備等設(shè)置；違紀(jì)犯罪率最低限度;表彰、獎項(xiàng)穩(wěn)定性指標(biāo)與變動性指標(biāo)“教學(xué)方法”/“德育”，“計(jì)算機(jī)輔助教學(xué)”軟指標(biāo)與硬指標(biāo)設(shè)備、場地/辦學(xué)特色，決策水平初擬評價指標(biāo)頭腦風(fēng)暴/因素分解/理論推演/篩選評價指標(biāo)（1）經(jīng)驗(yàn)法：理由充分否？/主次/指標(biāo)關(guān)系(近似、交叉、因果、矛盾等）/去難存易，刪繁就簡（2）統(tǒng)計(jì)調(diào)查：按5檔給專家問卷，統(tǒng)計(jì)“很重要”“重要”人數(shù)比例，按人數(shù)比例高低排列，刪除三分之二或四分之三。4、標(biāo)準(zhǔn)概念：達(dá)標(biāo)程度/末級指標(biāo)必須明確規(guī)定評價標(biāo)準(zhǔn)

26、從內(nèi)容上分：效能標(biāo)準(zhǔn)：效果標(biāo)準(zhǔn)和效率標(biāo)準(zhǔn)職責(zé)標(biāo)準(zhǔn)素質(zhì)標(biāo)準(zhǔn)從參照點(diǎn)分：社會標(biāo)準(zhǔn);規(guī)范性法則，參照點(diǎn)在外部科學(xué)標(biāo)準(zhǔn)：社會學(xué)或自然法則，參照點(diǎn)在內(nèi)部5、量化符號權(quán)數(shù)：一般把同一級指標(biāo)群集視為整體，權(quán)值 1 分?jǐn)?shù)：指標(biāo)賦分；等級賦分標(biāo)度：達(dá)到標(biāo)準(zhǔn)的程度，說明什么樣的程度屬于什么等級。表示方法有：描述性語言，如，好、中、差；量化形式，如，用分?jǐn)?shù)閾劃分，100-90屬于優(yōu)秀， 89-75屬于良好。（二）教育評價指標(biāo)體系的建造1、信度和效度信度：a、同一評價者用同一指標(biāo)體系去重復(fù)評價某一對象，所得結(jié)果的一致程度；（再測信度）b、不同評價者用同一指標(biāo)體系在相隔較短的時間去評價同一對象，看一致性程度。（評分

27、者信度）c、同一評價者、使用多種指標(biāo)體系，幾乎同時評價同一對象，考察結(jié)果的真實(shí)程度（一致程度）（復(fù)份信度）一般來說，指標(biāo)內(nèi)涵客觀；指標(biāo)與指標(biāo)之間相互獨(dú)立；硬指標(biāo)比例大；評價標(biāo)準(zhǔn)的規(guī)定明確，等級間的界限分明，信度就高。如果軟指標(biāo)多；指標(biāo)、等級間界限模糊，評價者較難區(qū)分指標(biāo)之間的差異，難以掌握評判準(zhǔn)則，則會降低信度。效度：考察的是，我們所要評的，與指標(biāo)體系能評的之間的關(guān)系。越接近，說明指標(biāo)體系各要素（指標(biāo)、標(biāo)準(zhǔn)、量化符號）的設(shè)置越準(zhǔn)確，越有代表性。哪些做法影響效度？P1022、方法前人的啟示：量表與問卷/泰勒的“教育目標(biāo)”以及目標(biāo)達(dá)到的評價模式/“行為目標(biāo)”的研究/教育目標(biāo)分類學(xué)及教育評價的研究成

28、果/我國的有關(guān)探索等。P103（1）掌握構(gòu)建教育評價指標(biāo)體系的依據(jù)：理念問題/實(shí)證問題。P103 （2）掌握評價對象逐級分解的方法。對內(nèi)涵的理解正確、深刻。如“師德”指標(biāo)。/理解、分解的多路向性/抓大放小原則/實(shí)施評價指標(biāo)的可行性/（3）掌握評價等級和標(biāo)準(zhǔn)確定的方法。等級數(shù)應(yīng)根據(jù)指標(biāo)的類型和性質(zhì)來確定。/四級分等，兩級定標(biāo)的簡便方法。標(biāo)準(zhǔn)：根據(jù)不同類型指標(biāo)的不同特點(diǎn)，綜合運(yùn)用，如“教改實(shí)驗(yàn)”、“教師隊(duì)伍結(jié)構(gòu)”/各等級規(guī)定的評價標(biāo)準(zhǔn)，界限要清楚。（4）掌握指標(biāo)與等級數(shù)值分配的方法。集體討論、咨詢、同行專家意見、調(diào)查研究，注重程序。參與人員必須：a、知識經(jīng)驗(yàn)、判斷鑒別力；b、明確賦值依據(jù)和原則

29、；c、認(rèn)真嚴(yán)謹(jǐn)二、教育評價方案的編制以評價指標(biāo)體系的撰寫為核心1、期望評語式編寫法2、積分評語式編寫法（1）等分積分評語式（2）累計(jì)積分評語式復(fù)習(xí)：設(shè)計(jì)教育評價指標(biāo)體系實(shí)操（一）確立目標(biāo)與指標(biāo)1、目標(biāo)目標(biāo)即目的，泛指人們從事活動所達(dá)到的目的。2、指標(biāo)簡單地說，指標(biāo)是用來反映、測量和說明上一級項(xiàng)目的下一級項(xiàng)目。是目標(biāo)一個方面的規(guī)定，它是具體的、可測量的、行為化和操作化的目標(biāo)。（二）選擇指標(biāo)體系的結(jié)構(gòu)1、直線式結(jié)構(gòu) 二級指標(biāo)11一級指標(biāo)1 二級指標(biāo)12 二級指標(biāo)21一級指標(biāo)2 二級指標(biāo)22 二級指標(biāo)31一級指標(biāo)3 二級指標(biāo)32例1：小學(xué)生最優(yōu)發(fā)展的整體評價指標(biāo)體系思想品德思想素質(zhì) 科學(xué)素質(zhì)

30、性格情趣愛好小審美素質(zhì) 美的感受和鑒賞學(xué) 美的表達(dá)和創(chuàng)造生學(xué)業(yè)成績最知識素質(zhì) 知識結(jié)構(gòu)優(yōu) 百科知識面發(fā) 自學(xué)能力展能力素質(zhì) 自理生活能力人際交往和組織能力體態(tài)和機(jī)能身體素質(zhì) 運(yùn)動能力衛(wèi)生保健2、樹狀式結(jié)構(gòu)一級指標(biāo)一級指標(biāo)一級指標(biāo)總目標(biāo)二級指標(biāo)例2：學(xué)生主體性的基本結(jié)構(gòu)主體性自主性主動性創(chuàng)造性自尊自信自我調(diào)控獨(dú)立判斷決斷自覺自理成就動機(jī)競爭意識興趣和求知欲主動參與社會適應(yīng)性創(chuàng)新意識創(chuàng)造性思維能力動手實(shí)踐能力（三）教育評價指標(biāo)體系建立的步驟和方法1、步驟：（1）分解目標(biāo)，提出初擬指標(biāo)（2）歸類合并，進(jìn)行篩選（3）專家評判（4）預(yù)試修訂（1）分解目標(biāo)，提出初擬指標(biāo)一般較為注意指標(biāo)的

31、科學(xué)性、完備性，唯恐掛一漏了或包羅不盡。這些指標(biāo)不僅是較為粗疏的，數(shù)量也可能是比較多的。方法（1）頭腦風(fēng)暴法是利用頭腦積極思維，進(jìn)行智力碰撞，激發(fā)智慧的靈感，從而提出評價指標(biāo)的一種常用方法。（2）因素分解法是一種將評價指標(biāo)按照評價對象本身的邏輯結(jié)構(gòu)逐級進(jìn)行分解，把分解出來的主要因素作為評價指標(biāo)的方法。應(yīng)當(dāng)注意：分解出來的因素，從高到低逐層縮小內(nèi)涵，越往下層次指標(biāo)越明確、越具體、范圍越小，越可以觀測。（3）理論推演法是根據(jù)有關(guān)學(xué)科的理論推演出評價指標(biāo)的方法。（4）典型研究法是通過少數(shù)典型事例進(jìn)行研究而設(shè)計(jì)評價指標(biāo)的方法。（2）歸類合并，進(jìn)行篩選在初擬指標(biāo)中，有的能反映評價對象的本質(zhì)，有的則未必；

32、有的算得上主要因素，有的可能只是次要因素。各因素之間出現(xiàn)交叉、重復(fù)、包含、矛盾、因果等關(guān)系，也難以避免，必須對初擬指標(biāo)進(jìn)行歸類合并和篩選，以達(dá)到“少而精”的要求。篩選指標(biāo)的方法（1）經(jīng)驗(yàn)法一般遵循以下幾個要點(diǎn)：A、理由是否充分或必要判斷每項(xiàng)指標(biāo)是否是必要的，缺了它有什么不好，保留它有什么理由，被保留的要有充分的依據(jù)，在指標(biāo)體系中，屬于非要不可的因素。B、取主舍次區(qū)分每項(xiàng)指標(biāo)反映評價對象本質(zhì)的程度，保留能反映本質(zhì)的主要因素，舍棄不能充分反映本質(zhì)的次要因素。C、從各指標(biāo)之間的關(guān)系上進(jìn)行比較內(nèi)涵相同或近似的合并，內(nèi)涵交叉的保留其一；有因果關(guān)系的，保留“因”而去掉“果”；相互矛盾的保留既符合方針、政策

33、規(guī)定又切合當(dāng)?shù)貙?shí)際的指標(biāo)。D、去難存易，刪繁就簡確實(shí)難測的指標(biāo)可以舍棄；指標(biāo)內(nèi)涵復(fù)雜的，盡量求其單一。（3）專家評判這是指標(biāo)設(shè)計(jì)從設(shè)計(jì)者手中走向管理實(shí)踐的重要步驟。專家通常包括評價理論研究者、上級領(lǐng)導(dǎo)、富有經(jīng)驗(yàn)的教育行政干部、教師等。專家評判可采用個別訪問、座談、問卷征詢、現(xiàn)場調(diào)查等方式，應(yīng)根據(jù)不同情況選擇。調(diào)查統(tǒng)計(jì)法是在調(diào)查獲取資料的基礎(chǔ)上進(jìn)行統(tǒng)計(jì)的方法。其具體的做法是：把初擬指標(biāo)制成問卷，發(fā)給有關(guān)專家和有經(jīng)驗(yàn)的教育工作者，請他們對初擬指標(biāo)每一項(xiàng)作出判斷。一般分為五檔，即很重要、重要、一般、可要可不要、不要。答卷者在每項(xiàng)指標(biāo)后記上自己判斷該項(xiàng)指標(biāo)相比之下的重要程度（只能定一個檔次），然后，收

34、回問卷，統(tǒng)計(jì)“很重要”、“重要”兩檔的人數(shù)比例，按評為“很重要”、“重要”人數(shù)比例由高到低順序排列，把低于某數(shù)值（一般低于三分之二或四分之三處作為劃界）的指標(biāo)刪除，就得到篩選的指標(biāo)。（4）預(yù)試修訂指標(biāo)體系經(jīng)過篩選、修訂，初步確定以后，可以同評定標(biāo)準(zhǔn)相匹配，選點(diǎn)在小范圍試驗(yàn)，看是否可行，試驗(yàn)后對指標(biāo)體系再作修改，然后投入使用。例3：學(xué)校領(lǐng)導(dǎo)班子評價指標(biāo)體系的建立1、首先分4個層次提出了16項(xiàng)指標(biāo)（1）政治素質(zhì)（政治理論和政策水平、思想品德修養(yǎng)、事業(yè)心和責(zé)任感）（2）業(yè)務(wù)素質(zhì)（文化專業(yè)達(dá)標(biāo)、教育理論修養(yǎng)、管理實(shí)踐經(jīng)驗(yàn)）（3）工作效能（職務(wù)與能力相稱、分工明確和各盡其責(zé)、團(tuán)結(jié)協(xié)作、指揮靈便、工作效率

35、高）（4）工作作風(fēng)（深入實(shí)際、發(fā)揚(yáng)民主、決策果斷、以身作則、開拓精神）2、把以上16項(xiàng)指標(biāo)，分為五檔（很重要、重要、一般、可要可不要、不要），分別征詢意見，獲得以下結(jié)果：政治素質(zhì)（事業(yè)心和責(zé)任感1、政治理論和政策水平3、思想品德修養(yǎng)11）業(yè)務(wù)素質(zhì)（教育理論修養(yǎng)2、管理實(shí)踐經(jīng)驗(yàn)10）工作效能（團(tuán)結(jié)協(xié)作5、分工明確和各盡其責(zé)8、工作效率高9）工作作風(fēng)（決策果斷4、以身作則6、開拓精神7、發(fā)揚(yáng)民主12）第五章教育評價的方法第一節(jié) 教育評價方法概觀絕對評價法相對評價法個體內(nèi)差異評價法定性分析評價法定性綜合判斷法行為目標(biāo)評價法臨床督導(dǎo)評價法指標(biāo)評分法確定評價指標(biāo)權(quán)重的方法（1）關(guān)鍵特征調(diào)查法（2）兩

36、兩比較法（3）專家評判平均法（4）倍數(shù)比較法等級換分法把具體項(xiàng)目的等級評定換算成分?jǐn)?shù)，然后將各項(xiàng)分?jǐn)?shù)相加，滿分100.具體做法：1、大項(xiàng)目，分?jǐn)?shù)和（X+Y+Z):100;2、某個大項(xiàng)目(X)再細(xì)分若干具體項(xiàng)目（x1，x2，x3), 為x1,x2,x3分配分?jǐn)?shù)；3、將x1（或x2、x3)分等級（評語論域v)，每一等級需確定具體的評價標(biāo)準(zhǔn):合格/不合格；優(yōu)/中/劣；.4、將各等地折算成分?jǐn)?shù)。如x1滿分11分，則可將優(yōu)算成11分，良-9分，中-7分，差-5分。5、將各項(xiàng)目得分相加。加權(quán)平均法權(quán)重分配方法已經(jīng)介紹；自行閱讀3分鐘即可。模糊綜合評判法P137再介紹集體綜合評價法主要用于思想品德評價1

37、、確定德育評價的具體項(xiàng)目(X+Y+Z）2、對每一個具體如X項(xiàng)目評分（100分）：自評、他評。3、板書公式S=(r1+r2+r3+.rn)/Nr為每一德育項(xiàng)目自評分?jǐn)?shù)，N為項(xiàng)目數(shù)Fi=(Li-Si)/(R-1)Fi表示對思想品德的集體綜合評價，表示對思想品德的集體綜合評價，Li表示集體中每個成表示集體中每個成員對評價對象作出的評價（各個項(xiàng)目得分的平均數(shù)）員對評價對象作出的評價（各個項(xiàng)目得分的平均數(shù)）;Si表示自表示自我總評價分，我總評價分，R表示被試人數(shù)。表示被試人數(shù)。案例：先打分，再計(jì)算同學(xué)甲分?jǐn)?shù) 同學(xué)乙分?jǐn)?shù) .尊敬師長學(xué)習(xí)態(tài)度遵紀(jì)守法團(tuán)結(jié)互助集體觀念社會活動勞動態(tài)度平均分第三節(jié) 處理

38、教育評價信息的方法一、定性分析描述法（一）等級評定法：制定評分等級及評定標(biāo)準(zhǔn)。應(yīng)用到如操行、能力、職稱、學(xué)校等級等方面。（二）評語鑒定法：單方面、多方面評語法/簡易、結(jié)論明晰，能對一些模糊現(xiàn)象進(jìn)行描述鑒定，解決了一些定量研究不能解決的問題，但難以客觀，信度和效度較低。（三)寫實(shí)分析法:集事實(shí)資料/整理、描述資料，一般先概括描述一般情況，再描述典型事例/分析評價：簡要、中肯、抓住本質(zhì)。寫實(shí)法的優(yōu)點(diǎn)是有依據(jù)，新都高。缺點(diǎn)是全面地收集資料很難，耗時多。二、定量分析評判法（一）統(tǒng)計(jì)分析評判法自行閱讀P135-137的平均數(shù)、加權(quán)平均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)內(nèi)容，8分鐘。（二）模糊綜合評判簡介

39、補(bǔ)充概念：隸屬度若對論域（研究的范圍）U中的任一元素x，都有一個數(shù)A（x）0，1與之對應(yīng)，則稱A為U上的模糊集，A（x ）稱為x對A的隸屬度。當(dāng)x在U中變動時，A（ x）就是一個函數(shù)，稱為A的隸屬函數(shù)。隸屬度A（x）越接近于1，表示x屬于A的程度越高，A（x）越接近于0表示x屬于A的程度越低。用取值于區(qū)間0，1的隸屬函數(shù)A（x）表征x 屬于A的程度高低，這樣描述模糊性問題比起經(jīng)典集合論更為合理。舉例例如，對于模糊集A = 高個子，如果論域是“成年男性”，則可構(gòu)造隸屬函數(shù)如圖所示:板書確定因素論域X=x1,x2,xn（如全班學(xué)生）和評語論域Y=y1（如侏儒）,y2（矮子）,ym（巨人），其中

40、xi表示問題中所考慮的因素(i=1,2,n)，yj表示要判斷的等級(j=1,2,m)。則稱X與Y之間的模糊關(guān)系矩陣為單因素評判（單單只是一個個因素，未涉及“綜合”之意，即，只有各行向量有意義，整個矩陣沒意義），其中行向量(ri1,ri2,rim)是考慮單因素xi在Y上的評判，rij稱為因素xi對評價等級yi的隸屬度，R為Y上模糊子集。設(shè)X上的模糊子集A表示因素xi在本問題的加權(quán)數(shù)(也稱權(quán)重)，則合成稱為對各因素的綜合評判，且 bj= 板書（四種之一）（j=1,2，.m）其中算符“”為取大，“”為取小，稱為扎德算子。與矩陣乘法運(yùn)算順序相同。舉例P57及A為1行m列矩陣的例子，請同學(xué)來算。當(dāng)b1

41、=b2=bm時，稱綜合評判全同失效；當(dāng)b1,b2,bm中至少有兩個相等的最大分量時，稱綜合評判義性失效。書上例題講解，P139例：根據(jù)某生測評表用1、4模型進(jìn)行模糊綜合評判優(yōu)秀良好一般較差差道德觀念 0.250.540.180.030尊敬師長 0.390.500.080.030學(xué)習(xí)態(tài)度 0.640.250.080.030尊紀(jì)守法 0.580.390.0300團(tuán)結(jié)互助 0.080.500.310.080.03集體觀念 0.100.640.180.050.03社會活動 0.200.520.230.050勞動態(tài)度 0.410.370.140.080權(quán)重分配:A=(0.18，0.14，0.14,

42、0.13，0.09, 0.12, 0.12, 0.08）教育評價結(jié)果的合成方法（1）單純普通數(shù)據(jù)的合成加權(quán)平均，逐級向上，直到在一級指標(biāo)上歸并為一個合成的分值。舉例（2）單純模糊數(shù)據(jù)的合成方法A、多級模糊綜合評判法1、對末級（二級）指標(biāo)進(jìn)行第一次綜合評判：W、R合成。如上例“某課堂教學(xué)質(zhì)量”2、將二級指標(biāo)對一級指標(biāo)所形成的若干綜合評判結(jié)果（即第一次綜合評判結(jié)果）組成一個新的模糊矩陣。如“某課堂教學(xué)質(zhì)量”再加上.3、將新矩陣與一級指標(biāo)權(quán)重向量合成計(jì)算綜合評判結(jié)果。B、二維加權(quán) 綜合合成法P143縱向加權(quán)/橫向加權(quán)板書畫圖:（3）混合數(shù)據(jù)的合成方法1、普通數(shù)據(jù)轉(zhuǎn)模糊數(shù)據(jù)2、模糊數(shù)據(jù)轉(zhuǎn)換成普通數(shù)據(jù)

43、第六章教育測量結(jié)果的整理、轉(zhuǎn)換與組合第一節(jié) 教育測量數(shù)據(jù)的特點(diǎn)與種類數(shù)據(jù)的特點(diǎn)：波動性、規(guī)律性數(shù)據(jù)種類：點(diǎn)計(jì)數(shù)據(jù)、度量數(shù)據(jù)/間斷性數(shù)據(jù)、連續(xù)型數(shù)據(jù)/類別變量、等級變量、等距變量、比率變量教育測量數(shù)據(jù)的特點(diǎn)：1、多屬等級變量；2、多屬主觀的；3、多屬隨機(jī)的（概率為1則為確定性）；4、模糊性第二節(jié) 教育測量分?jǐn)?shù)的初步整理一、統(tǒng)計(jì)表的結(jié)構(gòu)（自學(xué)2分鐘）二、頻數(shù)分布表的編制由同學(xué)自習(xí)5分鐘后，上臺講解書本例題。第三節(jié) 教育測量分?jǐn)?shù)的轉(zhuǎn)換原始分（卷面分）的缺點(diǎn)：意義模糊，不能直接比較導(dǎo)出分?jǐn)?shù)：由原始分轉(zhuǎn)換而成，如標(biāo)準(zhǔn)分、T分?jǐn)?shù)、百分等級分?jǐn)?shù)等。一、標(biāo)準(zhǔn)分方差概念：隨機(jī)變量離差平方的數(shù)學(xué)期望樣本方差？計(jì)

44、算P153的方差公式例題P155，自學(xué)5分鐘例題：甲、乙、丙、丁四人在某次語文考試中分別得72、60、48、90，而全體學(xué)生的語文平均分60，標(biāo)準(zhǔn)差12分，求四人相應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。例題：對某校高二學(xué)生進(jìn)行期中學(xué)習(xí)質(zhì)量測驗(yàn)，語文、數(shù)學(xué)和英語成績的平均分?jǐn)?shù)分別是80、70、85，標(biāo)準(zhǔn)差分別為10分、15分、12分。若某學(xué)生三科成績分別為85、82、90分，問該生成績哪一科最好？標(biāo)準(zhǔn)分?jǐn)?shù)Z的性質(zhì)與特點(diǎn)1、均值0，標(biāo)準(zhǔn)差1。（補(bǔ)充證明，概率論P(yáng)97）Z=0表示成績與平均數(shù)相等；2、有相對0點(diǎn)作參照點(diǎn)，有相等單位的導(dǎo)出分?jǐn)?shù)，可加減；3、由于是對原始分?jǐn)?shù)的線性變換，所以不改變原始分?jǐn)?shù)的分布形態(tài)（其證明同1）

45、；4、若原始分?jǐn)?shù)接近正態(tài)分布，則標(biāo)準(zhǔn)分范圍大致在-4+4之間。課后思考：常模團(tuán)體不服從正態(tài)分布則不能直接用標(biāo)準(zhǔn)分?jǐn)?shù)，怎么辦？自行查找資料。標(biāo)準(zhǔn)分的進(jìn)一步轉(zhuǎn)換1、T分?jǐn)?shù)：10Z+502、標(biāo)準(zhǔn)九:2Z+5標(biāo)準(zhǔn)9分與其他評分制的相互關(guān)系（P139）3、CEEB分?jǐn)?shù)（美國大學(xué)入學(xué)考試報(bào)告分?jǐn)?shù)）：500+100Z4、TOEFL：500+70Z5、IQ=100+15Z三、百分等級分?jǐn)?shù)概念計(jì)算：100-（100R-50）/N例1、52名同學(xué)考試，甲第4名，求其百分等級分?jǐn)?shù)。例2、52名同學(xué)考試，甲、乙、丙、丁戊己庚辛壬癸共10人并列第4名，求其百分等級分?jǐn)?shù)。百分等級常模建立方法基本思想：把某個測驗(yàn)分?jǐn)?shù)分布的

46、全距劃分為100個等級，建立原始分與百分等級間的一一對應(yīng)關(guān)系。步驟：1、從高到低排列2、逐個統(tǒng)計(jì)次數(shù)3、計(jì)算“以下累計(jì)次數(shù)”4、計(jì)算“以下累計(jì)相對次數(shù)”5、將第四步換成百分制以P154的36個分?jǐn)?shù)為例，示范1例，其余同學(xué)們自己算。基于分組歸類數(shù)據(jù)建立百分等級常模方法：編制“成績次數(shù)分布統(tǒng)計(jì)表”只不過是在P154頁的表的基礎(chǔ)上增加“相對次數(shù)”、“累計(jì)次數(shù)”、“累積相對次數(shù)”等條目。計(jì)算公式：（100/N）*Fb+f(X-Lb)/iN為常模團(tuán)體總?cè)藬?shù)，X為原分?jǐn)?shù)，Lb為X所在組別的組下限，F(xiàn)b為小于Lb的各組次數(shù)之和，f為X所在組的次數(shù)，i為組距。請計(jì)算P154頁例子中，67分、89分的百分等級。

47、幾種標(biāo)準(zhǔn)分?jǐn)?shù)關(guān)系圖手繪，參考書P140P219第十六章課程評價第二節(jié) 課程評價模式的演變課程評價模式：評價人員或研究人員依據(jù)某種教育思想、課程理念或特定的評價目的選取一種或幾種評價途徑所建立起的相對完整的評價體系。它介于評價理論與具體的評價方法之間，既涉及標(biāo)準(zhǔn)又涉及方法，既包含了評價者的評價取向，也規(guī)定了評價的具體操作方式?；仡橮22 -23，“八年研究”。3分鐘目標(biāo)模式的觀點(diǎn)：在課程與教學(xué)的基本原理一書中，泰勒認(rèn)為，一個有效的課程必須回答四個問題：1、學(xué)校應(yīng)力求達(dá)到何種教育目標(biāo)。2、要為學(xué)生提供怎樣的教育經(jīng)驗(yàn)（學(xué)習(xí)經(jīng)驗(yàn)），才能達(dá)到這些目標(biāo)。3、如何有效地組織好這些教育經(jīng)驗(yàn)；4、我們?nèi)绾未_定

48、這些教育目標(biāo)正在實(shí)現(xiàn)。泰勒的主要觀點(diǎn)：評估的過程從本質(zhì)上說就是判斷課程和教學(xué)計(jì)劃在多大程度上實(shí)現(xiàn)了教育目標(biāo)的過程。評價應(yīng)針對學(xué)生的行為而進(jìn)行，因?yàn)榻逃龑で蟮恼菍W(xué)生行為的改變。評價應(yīng)是任意一段時間內(nèi)做的一次以上的評價，因?yàn)樵u價要反映的是行為的變化，而這種變化必須通過更多的評價對比才能反映出來。評價步驟：1、建立課程計(jì)劃的目的和目標(biāo)；2、以具體行為和具體內(nèi)容的方式闡述每個目標(biāo)；3、確定使用目標(biāo)的情景；4、確定情景呈現(xiàn)的方式；5、確定獲取信息的記錄方式；6、收集反映學(xué)生行為變化的信息；7、將收集到的信息與行為目標(biāo)作比較。有學(xué)者將其簡化為四步：確定教育目標(biāo)、設(shè)計(jì)評價情景、選擇和編制評價工具、分析評價

49、結(jié)果。實(shí)例：目標(biāo)評價模式在體育專業(yè)背越式跳高教學(xué)中的應(yīng)用首先，確定教學(xué)目標(biāo)：背越式跳高學(xué)習(xí)結(jié)束時，學(xué)生獲得一定的技能和能力；其次，進(jìn)行任務(wù)分析：再次，設(shè)計(jì)和實(shí)施教學(xué)過程。進(jìn)行任務(wù)分析后，對不同的教學(xué)單元實(shí)施教學(xué)，確認(rèn)學(xué)生在各個環(huán)節(jié)應(yīng)當(dāng)實(shí)現(xiàn)的目標(biāo)行為。最后，評價環(huán)節(jié)：教學(xué)過程中對技能目標(biāo)進(jìn)行形成性評價至最終總結(jié)性評價，確認(rèn)其實(shí)現(xiàn)課程目標(biāo)的程度。目標(biāo)模式的功能：1、修訂課程與教學(xué)計(jì)劃；2、進(jìn)一步明確教育目標(biāo)；3、影響教學(xué)與學(xué)習(xí)；4、可診斷出學(xué)生學(xué)習(xí)狀況。泰勒模式的特點(diǎn)及局限局限：1、對目標(biāo)自身的合理性缺乏評價；2、只觀察了預(yù)期目標(biāo)是否達(dá)到，非預(yù)期效果沒有評價；3、所定目標(biāo)多數(shù)為教育管理者提出的，沒

50、有考慮學(xué)生的需要；4、不應(yīng)用統(tǒng)一的目標(biāo)來評價自由發(fā)展的人；5、重結(jié)果輕過程。結(jié)論：泰勒模式第一次指出了教育目標(biāo)、課程設(shè)計(jì)和評價過程之間存在著密切聯(lián)系。泰勒認(rèn)為，評價的目的要比較全面地檢驗(yàn)學(xué)習(xí)經(jīng)驗(yàn)在實(shí)際上是否起作用，指導(dǎo)教師去引起所期望的那種結(jié)果。泰勒模式風(fēng)靡全球，即使在評價模式多樣化的今天，也有舉足輕重的地位。CIPP模式課程評價的CIPP模式即背景-輸入-過程-成果模式（context-input processproduct），是美國教育評價學(xué)家斯塔夫爾比姆倡導(dǎo)的課程評價模式。該模式于20世紀(jì)60年代后期發(fā)展起來。主要觀點(diǎn)：評價不應(yīng)該局限于評定課程目標(biāo)的達(dá)成程度，而應(yīng)該是為課程決策者提供有

51、用的信息。如：“評價最重要的目的不是證明，而是改善。”“評價是提供有用資料以作決定的歷程”背景評價：提供整個課程方案運(yùn)行的各種依據(jù)和信息，了解評價對象的需要與課程目標(biāo)之間的一致性程度，以調(diào)節(jié)現(xiàn)存的目的及其優(yōu)先秩序。輸入評價：對可供選擇的各種課程計(jì)劃評價擇優(yōu)，即可行性的評價。過程評價：對計(jì)劃實(shí)施情況進(jìn)行不斷檢查，描述課程實(shí)施情況，為決策者的修正提供可靠信息。成果評價：測量、解釋和判斷課程方案的實(shí)效，幫助決策者決定課程方案終止、修正還是繼續(xù)實(shí)施。優(yōu)點(diǎn)：1、將目標(biāo)本身也列入評價對象范圍；2、重視形成性評價，強(qiáng)調(diào)為決策提供信息，使評價活動更具有方向性和實(shí)用性；3、評價教育的全過程，相對全面；4、目的不是簡單評價一個方案的好壞，而是決策，所以研究者相對客觀。目標(biāo)游離模式斯里克文（M.Scriven）提出。它針對目標(biāo)模式忽視非預(yù)期效應(yīng)的弊端提出來的。他說，“對目的的考慮和評價是一個不必要的，而且很可能是有害的步驟”。因?yàn)槟繕?biāo)評價很容易使評價人受方案既定目的的約束，限制了評價的范圍，削弱了評價的意義。他建議把評價的重點(diǎn)由“方案想干什么”轉(zhuǎn)移到“方案實(shí)際干了什么”上來，全面收集關(guān)于方案實(shí)際結(jié)果的各種信

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

教育測量與評價(期末復(fù)習(xí)重點(diǎn))

文檔簡介

溫馨提示

最新文檔

評論

教育測量與評價(期末復(fù)習(xí)重點(diǎn))

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔