項目反應(yīng)理論簡介_第1頁
項目反應(yīng)理論簡介_第2頁
項目反應(yīng)理論簡介_第3頁
項目反應(yīng)理論簡介_第4頁
項目反應(yīng)理論簡介_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

心理測量學(xué)第十八講項目反應(yīng)理論簡介內(nèi)容提要:項目反應(yīng)理論的發(fā)展:IRT的基本理論體系項目反應(yīng)模型計算機程序IRT的應(yīng)用、優(yōu)點與不足(一)、經(jīng)典測驗理論一、項目反應(yīng)理論的發(fā)展:(二)、項目反應(yīng)理論的發(fā)展1、CTT的理論體系很完善,是其他測驗理論賴以產(chǎn)生的基石。優(yōu)點有:理論方法體系相對完整前提假設(shè)比較弱所涉及到的數(shù)學(xué)模型以及參數(shù)的概念和估計方法易理解和掌握標(biāo)準(zhǔn)化技術(shù)在控制測驗誤差等方面有明顯的效果(一)、經(jīng)典測驗理論基本假設(shè)難以成立:①真分?jǐn)?shù)與觀測分?jǐn)?shù)間存在線性關(guān)系的假定不合理;②平行測驗的假設(shè)難以成立;③誤差與真分?jǐn)?shù)獨立的假設(shè)難以滿足。2、CTT在理論體系和方法體系方面存在許多其本身難以克服的缺點,具體表現(xiàn)為:項目統(tǒng)計量嚴(yán)重依賴于測驗所實施的被試樣組。被試測驗分?jǐn)?shù)依賴于所施測項目的難度。

測驗信度觀存在嚴(yán)重問題。CTT的信度是針對被試全體的,只代表平均測量精度,假設(shè)所有被試測量標(biāo)準(zhǔn)誤相等,而實際上,不同能力水平的被試不可能具有同樣的測量標(biāo)準(zhǔn)誤。缺乏預(yù)測力對測驗等值、適應(yīng)性測驗、標(biāo)準(zhǔn)參照性測驗的編制等問題不能給以滿意的解決。盡管存在以上缺點,CTT仍在廣泛地應(yīng)用。CTT、IRT和概化理論是當(dāng)今最有影響的三種測驗理論。簡單地說,IRT在處理微觀問題(即被試水平與答題目之間的實質(zhì)性關(guān)系)時優(yōu)勢明顯,CTT在處理中觀問題(如處理常見的標(biāo)準(zhǔn)化考試等)時方便易懂,GT則在處理宏觀問題(如對結(jié)果作推論)時更顯出色。三種測驗理論體系有內(nèi)在聯(lián)系,各有長短,應(yīng)相互促進,互相補充。(二)、項目反應(yīng)理論的發(fā)展由于項目特征曲線(ICC)對項目反應(yīng)理論的產(chǎn)生具有重要意義,所以在講項目反應(yīng)理論的產(chǎn)生和發(fā)展問題時,一般都追溯到1905年比奈和西蒙編制第一個智力量表時的工作,他們當(dāng)時所使用的作業(yè)成績隨年齡增長而提高的散點圖與現(xiàn)在的ICC曲線十分類似。IRT的真正創(chuàng)立者是美國心理測量學(xué)家洛德(Lord)。1952年,洛德發(fā)表博士論文《一個測驗分?jǐn)?shù)的理論》,提出了IRT的第一個數(shù)學(xué)模型(Two-parameterNormalOgiveModel,雙參數(shù)正態(tài)卵形曲線模型)及其參數(shù)的估計方法,并把該模型應(yīng)用到了學(xué)業(yè)成績和態(tài)度測量工作之中。(一)、概念(二)、基本思想及基本思路(三)、基本理論假設(shè)二、IRT的基本理論體系(一)、概念項目反應(yīng)理論(ItemResponseTheory,簡稱IRT),又稱潛在特質(zhì)理論(LatentTraitTheory)或項目特征曲線理論(ItemCharacteristicCurseTheory),是為了克服經(jīng)典測驗理論(CTT)的局限而提出的現(xiàn)代測驗理論。從測驗的內(nèi)部或微觀方面入手,采取數(shù)學(xué)建模和統(tǒng)計調(diào)整的方法,重點討論被試的能力水平與測驗項目之間的實質(zhì)性關(guān)系,測驗的每一個項目都有自己的項目特征曲線,描述了每一個特定能力水平的被試答對或答錯該項目的概率。它包括5層意思,詳見戴海崎等《心理與教育測量》第三章第一節(jié)。(二)、基本思想及基本思路潛在特質(zhì):把表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式稱為心理特質(zhì)(trait),由于這種心理特質(zhì)是隱含于其行為之中的,所以也稱做潛在特質(zhì)。與CTT一樣,IRT也認(rèn)為被試的潛在特質(zhì)是不能被觀察和測量的,但卻可以通過其外顯行為表現(xiàn)出來。不同的是,CTT是以被試對所有測驗項目的反應(yīng)總和(測驗總分)為顯變量來預(yù)測被試的潛在特質(zhì)的,并不認(rèn)為被試對單個項目的反應(yīng)與其特質(zhì)間有任何有意義的聯(lián)系。IRT則認(rèn)為被試的能力與其對某一特定項目的反應(yīng)(以正確或錯誤反應(yīng)概率表示)有某種函數(shù)關(guān)系存在,確定這種關(guān)系就是IRT的基本思想和出發(fā)點。所以IRT可以被理解為一種探討被試對項目的反應(yīng)與其潛在特質(zhì)間關(guān)系的概率性方法。用θ(theta)表示被試的潛在特質(zhì)或能力,用Pi(θ)表示其對項目i正確反應(yīng)概率,項目反應(yīng)理論的關(guān)鍵就是確定θ與Pi(θ)間的函數(shù)關(guān)系。表1某個項目假設(shè)的項目特征曲線1.000.000.50潛在特質(zhì):θ正確反應(yīng)的概率:Pi(θ)潛在特質(zhì)空間(LatentTraitSpace)對于某一特殊行為的發(fā)展起作用的所有潛在特質(zhì)的集合。維度在潛在特質(zhì)空間中互相獨立的潛在特質(zhì)的個數(shù)。一個K維的潛在特質(zhì)空間可以表示為:H=(θ1,θ2,θ3,...,θk)總之,潛在特質(zhì)理論是一切心理測量理論研究的基礎(chǔ)。1、潛在特質(zhì)空間的單維性假設(shè)2、局部獨立性假設(shè)3、項目特征曲線假設(shè)4、非速度性假設(shè)(三)、基本理論假設(shè)1、潛在特質(zhì)空間的單維性假設(shè)(unidimensionality)潛在特質(zhì)空間單維性指測驗測量的是單一的特質(zhì)而非多元特質(zhì),即被試對測驗中任一項目的反應(yīng)是其單一特質(zhì)θ的函數(shù)。如何判斷是否滿足單維性假設(shè)?因素分析的方法當(dāng)因素分析抽取的第一個公共因素解釋的變異遠(yuǎn)大于第二個公共因素時,就可認(rèn)為測驗是單維的。但嚴(yán)格的單維性是大多數(shù)測量工具都難以滿足的,這也是IRT受到批評的主要原因。所以,解決測驗的單維性問題及建立多維反應(yīng)模型是IRT將要研究的任務(wù)之一。在項目反應(yīng)理論中,常用一般的統(tǒng)計依存性和統(tǒng)計獨立性概念來討論項目間關(guān)系。2、局部獨立性假設(shè)(localindependence)Pi(+):表示正確回答第i個項目的概率Pi(-):表示答錯第個i項目的概率Pj(+):表示正確回答第j個項目的概率Pj(-):表示答錯第j個項目的概率P(+,+)表示正確回答第i和第j個項目的概率同理,其它的見課本。根據(jù)以上定義,在下列條件下,兩個項目得分在統(tǒng)計上是獨立的。P(+,+)=Pi(+)Pj(+)P(+,-)=Pi(+)Pj(-)P(-,+)=Pi(-)Pj(+)P(-,-)=Pi(-)Pj(-)如果四個等式中的任何一個不成立,則這兩個項目在統(tǒng)計上就是依存的。例:如果Pi(+)=.8Pi(-)=.2

Pj(+)=.6Pj(-)=.4那么當(dāng)且僅當(dāng)P(+,+)=.48P(+,-)=.32P(-,+)=.12P(-,-)=.08時兩個項目才獨立。實際就是指,如果兩個項目的每種反應(yīng)模式的概率,僅僅根據(jù)對每個項目正確與不正確反應(yīng)的概率就能計算出來,那么項目之間便是獨立的。如何理解局部獨立性假設(shè)呢?由于這種獨立性是針對特定的θ值的被試而言的,所以稱為“局部”。例:假設(shè)1000名能力相同的被試參加某一能力測驗,600名被試答對了項目i,400名答錯了;這1000名被試對項目j的正確反應(yīng)概率與對項目i的正確反應(yīng)概率統(tǒng)計上是獨立的。總之,同一特質(zhì)水平的被試回答某一項目時不受其他項目的影響。3、項目特征曲線假設(shè)IRT假定正確反應(yīng)概率Pi(θ)與θ間存在規(guī)律性的變化關(guān)系,這種關(guān)系可以用一個數(shù)學(xué)函數(shù)的形式表示出來,這一函數(shù)稱為項目反應(yīng)函數(shù)(ItemResponseFunction),項目特征曲線就是這一函數(shù)的圖像。大量事實證明,對兩級記分的項目,被試的能力水平與他對項目的反應(yīng)之間呈S型的曲線關(guān)系,而且這一關(guān)系具有相當(dāng)?shù)钠毡樾?。S型ICC具有一些共同點,即都有一條Y=1的上漸近線和一條Y=c(c≥0)的下漸進線,且是嚴(yán)格單調(diào)上升的,一條ICC的形狀取決于三個變量:下漸近線的高度,曲線拐點的位置及拐點處的斜率。這三個變量恰好相當(dāng)于三個項目參數(shù):猜測參數(shù)ci,難度參數(shù)bi和區(qū)分度參數(shù)ai。1.000.000.50θPi(θ)上漸近線下漸近線c拐點切線b(1)難度參數(shù)bi在一條ICC中,bi等于曲線在拐點處的θ值。當(dāng)猜測參數(shù)ci=0(曲線的下漸近線為0)時,bi等于Pi(θ)=0.50時的θ值,因為對一條完整的ICC,拐點恰好是曲線的中點和對稱點。當(dāng)ci>0時,P(θ)=(1+c)/2在IRT中,bi表示一個項目的難度,其取值范圍一般在-3.0到+3.0之間。bi越大,表示項目的難度越大。1.000.000.50θPi(θ)b1b2項目1項目2從上圖可以看出,項目2比項目1更難些,因為能力相同的同一組被試對項目1的正確反應(yīng)概率要大于對項目2的正確反應(yīng)概率。在其他條件不變的情況下,增大項目的難度會使ICC向右平移。(2)區(qū)分度參數(shù)ai在一條ICC中,ai的大小決定曲線在拐點bi處的陡度。ai很大時,在bi附近能力θ的增加會導(dǎo)致正確反應(yīng)概率Pi(θ)有很快的增長;ai很小時,在bi附近能力θ的等量增加不會導(dǎo)致正確反應(yīng)概率Pi(θ)有明顯的增長。ai的取值范圍通常在0.30~2之間。圖區(qū)分度參數(shù)ai對正確反應(yīng)概率的影響1.000.000.50θPi(θ)b項目1項目2ai越大,曲線在bi附近就會越陡,項目在bi附近的區(qū)分能力就越大,但在遠(yuǎn)離bi的區(qū)域,曲線就會變得越平坦,項目的區(qū)分能力就越低。也就是說,區(qū)分度參數(shù)ai大的項目對能力水平接近b

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論