教育心理學學習結(jié)果的評價與測量_第1頁
教育心理學學習結(jié)果的評價與測量_第2頁
教育心理學學習結(jié)果的評價與測量_第3頁
教育心理學學習結(jié)果的評價與測量_第4頁
教育心理學學習結(jié)果的評價與測量_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

教育心理學學習結(jié)果的評價與測量第1頁,課件共26頁,創(chuàng)作于2023年2月本章學習目標定義測量、測評和評價指出測驗與其他測量工具的區(qū)別指出信度和效度的區(qū)別定義檔案袋定義真實測驗什么是常模參照測驗與標準參照測驗測驗選擇的原則評定測量信度的方法效度的類型有哪些說明客觀測驗與主觀測驗對傳統(tǒng)測驗的革新第2頁,課件共26頁,創(chuàng)作于2023年2月測量和評價測量指收集信息,并用數(shù)字表示的過程。如表示距離,我們用3米,5公里,1光年。表示時間,用15秒,30分鐘等。測評是包含測量的更大的概念。即它要用數(shù)字表示,還要形成判斷和決策。前者是指測量(measurement),后者指評價(evaluation)。測量的結(jié)果是測評的依據(jù),測評過程就是依據(jù)測量的結(jié)果,對學生的反應行為及其原因進行分析和評價。測量、測評和測驗這三個過程解決了不同的問題:測量是用量化資料來描述學生的學習情況;測評是根據(jù)量化的資料作出判斷。測驗(test)是指測量的活動或工具。

第3頁,課件共26頁,創(chuàng)作于2023年2月常模參照測驗與標準參照測驗常模是指有代表性的被試樣本在測驗上的分數(shù)模式。大多數(shù)的測驗常模就用平均數(shù)和標準差來描述。常模參照性測驗(Norm-referencedtest

)是將測驗分數(shù)參照常模加以解釋,也就是將每一個人的分數(shù)同團體中的其他人進行比較,這是一種相對的比較。標準參照性測驗(Criterion-referencedtesting

)是將測驗結(jié)果同事先規(guī)定的標準進行比較,對被試個體的分數(shù)作出解釋。

第4頁,課件共26頁,創(chuàng)作于2023年2月測驗的類型2.

情感測驗AffectiveInstruments3.

投射測驗ProjectiveInstruments1.

認知測驗CognitiveInstruments第5頁,課件共26頁,創(chuàng)作于2023年2月認知測驗測驗學生在學業(yè)方面達到的程度。學業(yè)成績測驗(achievementtests)能力測驗(aptitudetests)第6頁,課件共26頁,創(chuàng)作于2023年2月測驗的選擇2.需要具體哪種測驗

1.需要哪種類型的測驗

3.對測驗分析、比較

4.選擇最好的測驗

第7頁,課件共26頁,創(chuàng)作于2023年2月測驗選擇的原則2.要有最好的效度1.

要有最好的信度3.

施測、計分、解釋分數(shù)方便

4.

被測者沒有做過該測驗

第8頁,課件共26頁,創(chuàng)作于2023年2月測驗的施測2.

確保良好的測驗環(huán)境

1.

事先做好安排

3.

準備所有可能的費用

第9頁,課件共26頁,創(chuàng)作于2023年2月一個好的測驗的兩個特性1.

效度:指能否測出所要測量內(nèi)容的程度。

Validity:thedegreetowhichtheinstrumentmeasureswhatitpurportstomeasure。2.

信度:指測驗的一致性程度。

Reliability:thedegreetowhichtheinstrumentconsistentlymeasureswhatitpurportstomeasure。第10頁,課件共26頁,創(chuàng)作于2023年2月評定測量信度的方法重測信度Test-retestreliability等值復本信度Equivalentformsreliability內(nèi)部一致信度Internalreliability折半信度/分半信度Split-halfmethod評分者信度(inter-scorer)Inter-raterreliability第11頁,課件共26頁,創(chuàng)作于2023年2月重測信度/再測信度

(test-retestreliability)用同一種測驗,對同一組受試者,前后施測兩次,再根據(jù)受試者兩次測驗分數(shù)計算其相關系數(shù),即得再測信度。兩次測驗分數(shù)的誤差變異主要來自測驗條件和受試者身心狀況的改變。再測信度高,說明分數(shù)受被試狀況和測驗情境變化的影響小。初測與再測的間隔最好不超過6

個月。第12頁,課件共26頁,創(chuàng)作于2023年2月等值復本信度

(equivalentformsreliability)任何測驗只是所有可能題目中的一份取樣,所以編制許多平行的等值測驗,叫做復本。等值:題目內(nèi)容,數(shù)量,形式,難度,區(qū)分度,指導語,時限,所用的例題、公式,測驗的其他方面都應該相同或相似。一種測驗有兩個以上的復本,根據(jù)一群受試者接受兩個復本測驗的得分計算相關系數(shù),即得等值復本信度。兩個等值測驗可同時連續(xù)施測或相距一段時間分兩次施測。第13頁,課件共26頁,創(chuàng)作于2023年2月折半信度/分半信度

(split-halfmethod)折半信度是在測試以后對測驗項目按奇項、偶項或其他標準分成兩半,分別記分,以兩半分數(shù)之間的相關系數(shù)作為信度系數(shù)。折半信度split-halfreliability斯皮爾曼—布朗公式Spearman-Browncorrectionformula。第14頁,課件共26頁,創(chuàng)作于2023年2月內(nèi)部一致信度

(internalconsistentreliability)構(gòu)成測驗的各測題間的相互關系,即測驗內(nèi)部一致性。不是題目內(nèi)容或形式的一致,是指分數(shù)的一致。測驗的各個題目得分有較高的正相關,不論題目內(nèi)容和形式如何,測驗的內(nèi)部一致性高。測驗題目看來好象一致,但相關為零或復值,測驗的內(nèi)部一致性低。內(nèi)部一致性的測量:庫德—理查森(Kuder-Richardson

)公式20克勞伯克(Cronback’sAlpha

)系數(shù)第15頁,課件共26頁,創(chuàng)作于2023年2月評分者信度

(inter-scorer/inter-raterreliability)心理測驗一般都有一套標準化的評分程序,采用客觀性題目,由評分引起的誤差變異是可以忽略的。對一些無法完全客觀記分的測驗來說,評分者之間的變異會帶來誤差。如創(chuàng)造性思維測驗,人格測量投射測驗。方法:隨機抽取相當份數(shù)的試卷,由兩位評分者按記分規(guī)則分別給分。然后根據(jù)每份試卷的兩個分數(shù)計算其相關系數(shù),即得評分者信度。評分者之間平均一致性達到.90以上,才認為評分是客觀的。第16頁,課件共26頁,創(chuàng)作于2023年2月效度類型2.

效標關聯(lián)效度

Criterion-relatedvalidity3.

構(gòu)思效度

Constructvalidity1.

內(nèi)容效度

Contentvalidity第17頁,課件共26頁,創(chuàng)作于2023年2月內(nèi)容效度:指測驗項目在多大程度上表示了所要測定的特征范疇。要決定學生某一學科學的怎樣,首先要知道學科的內(nèi)容是什么?如果把學科內(nèi)容理解為是有知識和技能組成的話,學業(yè)成就測驗就是編制一些項目,這些項目是所覆蓋的全部知識和技能的一系列樣本。內(nèi)容效度第18頁,課件共26頁,創(chuàng)作于2023年2月例:“電”這個單元包括的主題有:導體(10%),電阻(5%),電流(20%)、電極(10%),電磁(5%)、電解質(zhì)(20%),絕緣材料(15%)發(fā)電方法(15%)。編制這部分學業(yè)成就測驗,就要按比例編制測驗項目。如果能按比例編制,你所編項目是所覆蓋內(nèi)容的樣本,那么具有內(nèi)容效度。

第19頁,課件共26頁,創(chuàng)作于2023年2月預測效度(predictivevalidity)指測驗分數(shù)對于未來的行為或作業(yè)測量能夠預測得多么好。如用學習能力測驗預測大學生的平均成績。這種預測的準確性的指標就是測驗的效度。與預測效度有關的最重要方面是標準,因而又稱為效標關聯(lián)效度。效標關聯(lián)效度第20頁,課件共26頁,創(chuàng)作于2023年2月構(gòu)思效度:涉及的是一個測驗所測量的心理特質(zhì)或?qū)傩?。?gòu)思效度就是要檢驗是不是測量了人們提出的理論構(gòu)思。如智力測驗的編制。理論認為:智力隨年齡而增長;與學業(yè)成績密切相關;智商相對穩(wěn)定;受遺傳影響。如果測驗的分數(shù)隨年齡而增加;智力與學業(yè)成績有正相關,智商在一定時間保持相對穩(wěn)定,同卵雙生子的智力的相關高于一般兄弟姐妹,這些材料成為肯定測驗構(gòu)思效度的證據(jù)。構(gòu)思效度第21頁,課件共26頁,創(chuàng)作于2023年2月客觀測驗與主觀測驗多項選擇題,匹配題,判斷題,簡答題和填空題都屬于客觀測驗(ObjectiveTesting),其特點是答案確定,評分不需要解釋。論述題屬于主觀測驗(SubjectiveTesting),其特點是要求學生創(chuàng)造性地寫出自己的答案。第22頁,課件共26頁,創(chuàng)作于2023年2月客觀測驗項目的編制題干要明確、簡潔題干中的問題用肯定表述不要寫明顯錯誤的選項避免使用一些具有絕對意義的詞避免出現(xiàn)兩個相同意義的干擾項避免按原樣使用課本中的表達詞第23頁,課件共26頁,創(chuàng)作于2023年2月主觀測驗的編制適合對復雜學習成果的評估測驗要有足夠的答題時間主觀題和客觀題相結(jié)合第24頁,課件共26頁,創(chuàng)作于2023年2月對傳統(tǒng)測驗的革新真實測驗(Authentictests)檔案袋(Portfo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論