小學(xué)教育心理學(xué)第十六章學(xué)習(xí)結(jié)果的測量與評定_第1頁
小學(xué)教育心理學(xué)第十六章學(xué)習(xí)結(jié)果的測量與評定_第2頁
小學(xué)教育心理學(xué)第十六章學(xué)習(xí)結(jié)果的測量與評定_第3頁
小學(xué)教育心理學(xué)第十六章學(xué)習(xí)結(jié)果的測量與評定_第4頁
小學(xué)教育心理學(xué)第十六章學(xué)習(xí)結(jié)果的測量與評定_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

小學(xué)教育心理學(xué)第十六章學(xué)習(xí)結(jié)果的測量與評定1第一頁,共四十二頁,2022年,8月28日一、什么是學(xué)習(xí)測量與評定(一)什么是測量和測驗 測量是用數(shù)學(xué)方式對人的行為的描述。 教學(xué)過程中的測量是用數(shù)學(xué)的方式對學(xué)生學(xué)習(xí)行為的描述,主要是借助于測驗來進行。 測驗是通過一系列的科學(xué)程序(如編制題目、施測和評分等)對學(xué)生某一方面的學(xué)習(xí)行為進行測量。(二)什么是評定教學(xué)過程中的評定是根據(jù)一定的標(biāo)準(zhǔn)對學(xué)生的學(xué)習(xí)行為進行估價的過程。第一節(jié)學(xué)習(xí)評定概述2第二頁,共四十二頁,2022年,8月28日二、學(xué)習(xí)測量和評定的主要功能(一)診斷功能(二)反饋與鞭策功能

1.為教師的教學(xué)提供反饋信息

2.激發(fā)學(xué)生的的學(xué)習(xí)動機(三)管理功能

1.編班分組和升留級的依據(jù)

2.職業(yè)指導(dǎo)的作用

3.教育科學(xué)研究的工具(四)教育心理功能3第三頁,共四十二頁,2022年,8月28日4第四頁,共四十二頁,2022年,8月28日

三、教育工作者應(yīng)具備的測量與評定的知識和能力①理解與清楚地表述教學(xué)和管理目標(biāo),懂得怎樣通過教學(xué)和管理活動達到目標(biāo),全面了解測量與評定的涵義及評定對教學(xué)及管理的意義。②理解有效測量和評定條件,明確自己在編制、選擇和使用測量工具時所扮演的角色。③能自行編制日常教學(xué)使用的測驗,能適當(dāng)?shù)刂鞒譁y驗并有效地使用測驗的結(jié)果,以為改進教學(xué)和管理之用;能選擇適當(dāng)?shù)臉?biāo)準(zhǔn)化測驗。④能編制、選擇與使用非測驗式的測驗工具。⑤能綜合解釋測驗的分?jǐn)?shù)和非測驗式測量的結(jié)果,作出評定。明確各種測驗的用途及限制。⑥能根據(jù)評定的結(jié)果,改進自己的教學(xué)和管理工作。此外,對參與評價的人來說,還應(yīng)有高尚的人格,應(yīng)當(dāng)使自己參與的評定工作合乎道德規(guī)范,不應(yīng)使學(xué)生或教師感到高度焦慮,損傷他們的自尊心或引起惡性競爭。5第五頁,共四十二頁,2022年,8月28日

四、學(xué)習(xí)評定的分類布魯姆(Bloom,B.S)的分類:

(一)配置性評定一般在各學(xué)年、各學(xué)期開始時或開始前施行,其目的是要了解學(xué)生是否具有達到教學(xué)目標(biāo)所必需的基礎(chǔ)知識和技能——學(xué)生的準(zhǔn)備狀態(tài)。

(二)形成性評定一般是在教和學(xué)的過程中進行的,目的在于了解教學(xué)結(jié)果,探究教學(xué)中所存在的問題的缺陷,以便對教學(xué)工作進行調(diào)整。

(三)總結(jié)性評定一般在學(xué)期末進行,目的是了解學(xué)生通過—學(xué)期的學(xué)習(xí),是否達到教學(xué)目的的要求,以此作出較全面的總結(jié)性評定。6第六頁,共四十二頁,2022年,8月28日五、有效測驗的必要條件(一)效度測驗效度是指測量的真實性、正確性,即該測驗與所要測量的目標(biāo)特征相符合的程度。如果一致性高,說明這個測驗的效度高,反之則低。效度通常是利用該測驗的結(jié)果與一個反映測量目標(biāo)的參照標(biāo)準(zhǔn)(效標(biāo))之間的相關(guān)來表示,所求得的相關(guān)系數(shù)即為效度系數(shù)。相關(guān)系數(shù)越大,說明效度越高。—般要求這類測驗的效度值應(yīng)當(dāng)在0.35至0.60之間。

7第七頁,共四十二頁,2022年,8月28日(二)信度信度是反映測驗分?jǐn)?shù)的穩(wěn)定性的可靠性的指標(biāo),是指測量的前后一致性程度,只有信度高的測驗才能夠作為一個穩(wěn)定可靠的測量工具加以應(yīng)用。國外一般要求學(xué)科成績測驗的信度值要在0.90以上。信度值是用相關(guān)系數(shù)來表示的,又稱為信度系數(shù)。計算信度系數(shù)的方法主要有:①再測法:我們用某一個測驗對相同的學(xué)生前后施測兩次,計算出這兩次測驗成績的相關(guān)就可得到再測信度;②復(fù)本法:這種方法需要編制出兩套以上內(nèi)容、形式、數(shù)量、難度等方面都等值的測驗,然后根據(jù)同一組學(xué)生接受兩次復(fù)本測驗的得分計算出相關(guān)系數(shù),就可得到復(fù)本信度;③分半法:當(dāng)一種測驗沒有復(fù)本而且只能施測一次的情況下,通常采用分半法來估計信度。這種方法是將一套測驗分成對等的兩半,根據(jù)每個人在這兩半試題中的得分所求得的相關(guān)系數(shù)即為半分信度。在學(xué)科測驗中,較多的是應(yīng)用分半法和復(fù)本法來計算測驗題的信度。8第八頁,共四十二頁,2022年,8月28日

(三)難度難度是指—套測驗中試題的難易程度,這是用來進行題目分析和評價試題的主要指標(biāo)之一。難度的計算可依據(jù)試題形式的不同采用以下兩種方法,其公式為:9第九頁,共四十二頁,2022年,8月28日(四)區(qū)分度區(qū)分度是測驗題目對考生水平鑒別能力的指標(biāo),是測驗題目能夠鑒別受測者水平的程度。區(qū)分度的計算多采用相關(guān)法,即以考生在某個題目上的得分與總分的相關(guān)作為該題的區(qū)分度值,相關(guān)越高,區(qū)分度越好。國外應(yīng)用在教育上的標(biāo)準(zhǔn)化測驗要求優(yōu)秀題目的區(qū)分度在0.30以上,否則就需加以改進或淘汰。(五)可用性即測驗在解釋學(xué)生的能力、知識等方面有多大用處;測驗的形式與內(nèi)容是否適合學(xué)生的年齡特征;測驗所花的時間和人力是否合適;以及評分是否客觀,主持測驗是否通過過特殊訓(xùn)練等。如果在這些方面使人不能接受,測驗的可用性就低。10第十頁,共四十二頁,2022年,8月28日一、論文式測驗(一)論文式測驗的涵義及其試卷的編制和評分

所謂論文式測驗,是由教師根據(jù)教學(xué)內(nèi)容的要點,擇其較重要者出幾個試題,讓學(xué)生用論文的方式,自由地以書面解答問題。第二節(jié)常用的測驗方法

11第十一頁,共四十二頁,2022年,8月28日

(二)論文式測驗的利弊

1.論文式測驗的優(yōu)點:①命題省時容易②有利于測定學(xué)生的思維能力和寫作能力③了解學(xué)生的學(xué)習(xí)程度④減少學(xué)生情境壓力12第十二頁,共四十二頁,2022年,8月28日2.論文式測驗的缺點:①評分的主觀性②試題缺少代表性③問題涵義太廣泛④易受其他因素干擾13第十三頁,共四十二頁,2022年,8月28日(二)論文式測驗的改進①問題要明確。②采用一些可用較短篇幅回答的問題,以求取樣適當(dāng)。③事先擬好指導(dǎo)評分的規(guī)則和標(biāo)準(zhǔn),其中包括可以接受的答案,并規(guī)定出這些答案的比重。④不要因錯別字或語法有錯誤而扣分,除非考試是為測試這些方面而特別進行的。⑤先要閱看幾份考卷,以便對考查的性質(zhì)得到一個一般的觀念,并用來檢查與修改評分的規(guī)則和標(biāo)準(zhǔn)。⑥在評定一份考卷時不要知道答卷者的姓名,同時盡可能在幾乎相等的條件下評卷定分,或采取兩三個教師合評的方式14第十四頁,共四十二頁,2022年,8月28日

二、客觀測驗(一)客觀測驗的涵義及其與論文式測驗的區(qū)別

客觀測驗是用一些非常簡單或機械式反應(yīng)來回答的測驗。其中最為人們聽熟悉的是填充、正誤、多重選擇和配對等形式。論文式測驗與客觀測驗在學(xué)生學(xué)業(yè)的評定方面的比較:15第十五頁,共四十二頁,2022年,8月28日16第十六頁,共四十二頁,2022年,8月28日17第十七頁,共四十二頁,2022年,8月28日(二)客觀測驗項目的形式及其編制

1.編制客觀測驗的一般原則:①測驗要測試學(xué)科中的重要內(nèi)容。②要降低測驗項目的閱讀難度,除非測驗的目的在于測最閱讀能力。③一個項目不要為另一個項目的答案提供線索,回答某一特定項目的能力也不依靠前一項目的回答的能力。④必須避免引人上當(dāng)?shù)膯栴},詭詐性和欺騙性問題既可能損害測驗的真正目的,又可能影響學(xué)生的學(xué)習(xí)風(fēng)氣。⑤測驗項目的措詞應(yīng)適當(dāng),以便使學(xué)生回答問題的內(nèi)容而不回答問題的形式。18第十八頁,共四十二頁,2022年,8月28日

2.客觀測驗項目的形式及其編制①填充②正誤③選擇④配對19第十九頁,共四十二頁,2022年,8月28日

(三)客觀測驗的利弊

1.客觀測驗的優(yōu)點①試題涉及教學(xué)內(nèi)容的全部范圍。②試題簡明扼要,易于回答。③評分客觀迅速。

2.客觀測驗的缺點①命題費時且困難。②偏于零星知識的記憶。③不能確知學(xué)生的學(xué)習(xí)程度。

20第二十頁,共四十二頁,2022年,8月28日

三、標(biāo)準(zhǔn)測驗

標(biāo)準(zhǔn)測驗也稱標(biāo)準(zhǔn)化測驗或標(biāo)準(zhǔn)化考試,是目前國際上廣為流行的一種測驗方法。它是一種大規(guī)模的、具有統(tǒng)一標(biāo)準(zhǔn)的、按照系統(tǒng)的科學(xué)程序組織的、并對誤差作了嚴(yán)格控制的測驗。21第二十一頁,共四十二頁,2022年,8月28日

四、心理測驗

(一)智力測驗雖然學(xué)業(yè)成績測驗也可以測定一些學(xué)生的智力,但對學(xué)生智力水平的高低,通過教學(xué)后智力的發(fā)展變化情況的測量,更主要的還是依靠智力測驗。目前世界上最流行的兩種智力測驗是斯坦福一比奈智力測驗和韋克斯勒智力測驗。

1.斯坦福一比奈智力測驗斯坦福一比奈智力測驗包括下列各種問題:字義、語言類推問題、適應(yīng)問題、算術(shù)問題、記憶、一般常識、發(fā)現(xiàn)錯誤、圖畫、空間問題、理解等。智力商數(shù)(IQ):智商=智力年齡/實際年齡╳10022第二十二頁,共四十二頁,2022年,8月28日2.韋克斯勒智力測驗韋克斯勒智力測驗是美國心理學(xué)家韋克斯勒(D.Wechsler)創(chuàng)造的,它是另一個在世界上被廣為使用的標(biāo)準(zhǔn)智力測驗。它包括韋氏成人智力量表(WAIS)、韋氏兒童智力測驗表(WAIS)和韋氏學(xué)前兒童智力量表(WPPSI)3種。韋氏量表是運用統(tǒng)計學(xué)原理,根據(jù)對人的智力的統(tǒng)計規(guī)律遵循正態(tài)分布這一事實,計算離差智商來表示智力高低的。韋克斯勒假定,人們的智商是以平均數(shù)為100和標(biāo)準(zhǔn)差為15的正態(tài)形式分布的。因此,其計算智商的公式如下:23第二十三頁,共四十二頁,2022年,8月28日用這種離差智商,可以確定一個人的智力在同齡人當(dāng)中的相對位置;診斷出他是智力落后或超常。一般認(rèn)為智商在70以下屬智力落后;130以上可謂智力發(fā)展優(yōu)異。24第二十四頁,共四十二頁,2022年,8月28日3.綜合學(xué)業(yè)性向測驗[1]

綜合學(xué)業(yè)性向測驗的目的在于測量學(xué)生學(xué)習(xí)各門學(xué)科能力的真實程度。這種測驗不僅可以鑒別學(xué)生能力的高低,而且也可分析比較學(xué)生能力的偏向或在各方面的能力的高低。綜合學(xué)業(yè)性向測驗包括分類性向測驗(DAT)、美國大學(xué)入學(xué)測驗(ACT)、學(xué)業(yè)性向測驗(SAT)、米勒類推測驗(MAT)以及研究生性向測驗(GRE)等。[1]李小融、魏龍渝:〈教學(xué)評價〉,217頁,成都,四川教育出版社,1988。25第二十五頁,共四十二頁,2022年,8月28日

(二)人格測驗

1.自陳人格測驗自陳人格測驗也稱自陳問卷,是指被測者對自己的人格,按自己的意見予以評定的一種方法。最常見的自陳人格測驗有:明尼蘇達多相人格測驗;加利福尼亞人格測驗;莫尼問題調(diào)查表;卡姆溜人格測驗;內(nèi)外向人格調(diào)查表;瑟斯頓性格測驗等。

2.興趣測驗興趣是人對事物的特殊認(rèn)識傾向。所謂認(rèn)識傾向,即在認(rèn)識過程中帶有相對穩(wěn)定的指向、趨向,能夠維持較長的時間。較為著名的興趣量表有:愛德華個人興趣量表;斯特朗職業(yè)興趣量表;庫得職業(yè)興趣量表等。26第二十六頁,共四十二頁,2022年,8月28日

3.態(tài)度測驗態(tài)度是人們對人、事或物的喜好或厭惡的傾向,與其行為有著密切關(guān)系。①態(tài)度的傾向,如喜歡與否,肯定與否。

②態(tài)度的深度與強度,如喜歡、很喜歡、不喜歡、厭惡。

③態(tài)度的中心,指人格心理體系中重要的因素,包括情感、認(rèn)知和行為因素。

④態(tài)度的外顯性,態(tài)度不能直接測量,但可以通過對人們的言語、行為以及其他方面的表現(xiàn)的測量去推斷其態(tài)度。常見的與教學(xué)有關(guān)的態(tài)度測驗有明尼蘇達教師態(tài)度測驗、各學(xué)科態(tài)度測驗和學(xué)習(xí)習(xí)慣與態(tài)度測驗等。27第二十七頁,共四十二頁,2022年,8月28日4.價值測驗價值是人們對人、事或物所作的好壞判斷。這方面的測驗有價值測驗、人際價值測驗和工作價值測驗。

5.行為觀察

6.投射人格測驗投射人格測驗是在測驗時向被測者提供—些模棱兩可的刺激,讓他在不受限制的情況下,自由地做出自己的反應(yīng),使其不知不覺地表露出入格特征。即在沒有控制的情況下,個人內(nèi)在因素通過對某些刺激的反應(yīng)投射出來。作為刺激物的材料有內(nèi)容模糊的圖片、未完成的句子、沒有結(jié)尾的故事等。屬于投射人格測驗的有:羅夏墨跡測驗、主題統(tǒng)覺測驗、兒童統(tǒng)覺測驗、文字聯(lián)想測驗和名字完成測驗等。28第二十八頁,共四十二頁,2022年,8月28日一、圖示量表第三節(jié)常見的幾種學(xué)習(xí)評定量表

29第二十九頁,共四十二頁,2022年,8月28日

二、形容詞量表

這種量表在提出的問題之后,用一組序列化的形容詞或修飾短語的方式提供各種不同程度的答案,回答者在每個形容詞及短語上畫圈或做上記號,以表示自己的評定。例如:極好;很好;,好;尚好;不好。完全同意;同意(或贊成);無所謂;不同意(或反對);完全不同意(或極反對);無法回答。絕對正確;正確;較正確;不正確;極不正確;無法回答。很好;好;可以;不對;糟糕;無法回答。經(jīng)常;偶爾;完全不。極重要;重要;較重要;不重要;不知道。非常贊成;相當(dāng)贊成;稍許贊成;難說;稍許反對;相當(dāng)反對;非常反對。30第三十頁,共四十二頁,2022年,8月28日三、數(shù)值量表數(shù)值量表是為了克服形容詞量表不能數(shù)量化的缺點而出現(xiàn)的一種量表形式,這種量表只是簡單地把數(shù)字加在形容詞量表上,對每—個等級的答案都標(biāo)上分?jǐn)?shù)。例如:極好(5);很好(4);好(3);尚好(2);不好(1)。完全同意(5);同意或贊成(4);無所謂(3);不同意或反對(2);完全不同意或極反對(1)。絕對正確(5);正確(4);較正確(3);不正確(2);極不正確(1)。很好(5);好(4);可以(3);不對(2);糟糕(1)。經(jīng)常(3);偶爾(2);完全不(1)。極重要(5);重要(4);較重要(3);不重要(2);不知道(1)。31第三十一頁,共四十二頁,2022年,8月28日

四、行為量表設(shè)計行為量表可按下面的程序進行:首先要求評定者熟悉被評定的教學(xué)現(xiàn)象,而且要求他們描述其中的有效行為或無效行為。接著,研究者把這些描述分成相對來說內(nèi)容較少的種類并給它們命名。作為對分類的檢查,也可組織有豐富教學(xué)經(jīng)驗的教師或教學(xué)專家及教學(xué)評價專家再次把上述描述分配到已命名的種類中。然后,評定者把可以有效地分類和評定的那些描述歸人一個為各類描述而設(shè)置的量表,使用這些對教學(xué)行為的描述作為量表的標(biāo)度。32第三十二頁,共四十二頁,2022年,8月28日例如:通過教師與學(xué)生的接觸來評定教師對教學(xué)的態(tài)度:

——在教師家里召開研討會。一—愿意在正常的上班時間之外和學(xué)生一起活動。一一在辦公室和學(xué)校的其他地方會見學(xué)生。

——樂意占用辦公時間與學(xué)生交談。

——勉強安排最少可能的辦公時間與學(xué)生接觸。

——拒絕在課堂之外會見學(xué)生。行為量表通常分為3—7個單位或等級,每個等級代表某一教學(xué)行為的一個增量。評定者根據(jù)任課教師在教學(xué)的某一方面的行為的程度不同而在量表的相應(yīng)等級上做上記號。33第三十三頁,共四十二頁,2022年,8月28日課堂教學(xué)評定量表(一個例子)34第三十四頁,共四十二頁,2022年,8月28日35第三十五頁,共四十二頁,2022年,8月28日

五、常見的幾種量表形式的變體

(一)加涅1974年設(shè)計的“現(xiàn)實一滿意等級量表”

加涅等人1974年設(shè)計了一種雙重目的的“現(xiàn)實一滿意等級量表”,以使評定者回答有關(guān)每一教學(xué)評定項目的兩個問題。例如:

1.你如何評定任課教師的語言清晰度?(1)(2)(3)(4)(5)

從不幾乎不偶爾時常經(jīng)常

(問題)(問題)(問題)(問題)(問題)36第三十六頁,共四十二頁,2022年,8月28日

2.在這個項目中你認(rèn)為哪個評定是您滿意的?(1)(2)(3)(4)(5)

從不幾乎不偶爾時常經(jīng)常

(問題)(問題)(問題)(問題)(問題)

第二問旨在使評定達到某個標(biāo)準(zhǔn)或水平,并對照該標(biāo)準(zhǔn)或水平解釋評定者對第一問的回答。37第三十七頁,共四十二頁,2022年,8月28日(二)多伊爾在1975年提出了一種雙重的“評價一重要性量表”1.你怎樣評定任課教師對別人觀點的接受?(1)(2)(3)(4)(5)

不好尚好好很好很好2.該教師的品質(zhì)對你有怎樣的重要性?(1)(2)(3)

不太重要還算重要非常重要第二問旨在提供一種方法以區(qū)分問卷上各種提問的重要性。這種被項目重要性所強調(diào)的具體特征評定比起不被強調(diào)的評定來說,是全面評價更好的預(yù)言者,而且也可以提供—個對正在進行的教學(xué)評定項目的有效性的方便估計。38第三十八頁,共四十二頁,2022年,8月28日

(三)第三種變體與效果評定有關(guān)學(xué)生可以通過在一門課程開始時完成的一個評定和在該課程結(jié)束時的一個類似評定;也可以通過只是在該課程結(jié)束時作出的一個雙重前一后評定;還可以通過一個下列類型的單一評定,就能夠評定他們的學(xué)習(xí)收

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論