心理測量理論與技術(shù)的新發(fā)展_第1頁
心理測量理論與技術(shù)的新發(fā)展_第2頁
心理測量理論與技術(shù)的新發(fā)展_第3頁
心理測量理論與技術(shù)的新發(fā)展_第4頁
心理測量理論與技術(shù)的新發(fā)展_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第第14講講 心理測量理論與技術(shù)的新發(fā)展心理測量理論與技術(shù)的新發(fā)展概化概化理論理論第第一一節(jié)節(jié)項目反應(yīng)項目反應(yīng)理論理論第第二二節(jié)節(jié) 概化理論簡介概化理論簡介 第第一一節(jié)節(jié)v一、概化理論的發(fā)展一、概化理論的發(fā)展v(一)概化理論的發(fā)展思路(一)概化理論的發(fā)展思路v概化理論(概化理論(Generalizability Theory,GT)是經(jīng)典理論宏觀發(fā)展,重在研究誤差控制、研究測是經(jīng)典理論宏觀發(fā)展,重在研究誤差控制、研究測驗整體設(shè)計。驗整體設(shè)計。 (一)概化理論的發(fā)展思路(一)概化理論的發(fā)展思路v1、測驗分?jǐn)?shù)方差的測量學(xué)意義、測驗分?jǐn)?shù)方差的測量學(xué)意義v測驗分?jǐn)?shù)方差有目標(biāo)分?jǐn)?shù)方差和誤差分?jǐn)?shù)方差之區(qū)測

2、驗分?jǐn)?shù)方差有目標(biāo)分?jǐn)?shù)方差和誤差分?jǐn)?shù)方差之區(qū)別。如:別。如:v被試真正能力水平間的分?jǐn)?shù)方差是目標(biāo)分?jǐn)?shù)方差。被試真正能力水平間的分?jǐn)?shù)方差是目標(biāo)分?jǐn)?shù)方差。v同一被試不同次測驗分?jǐn)?shù)間的方差是誤差方差。同一被試不同次測驗分?jǐn)?shù)間的方差是誤差方差。v同一作品多個評分間的方差也是誤差方差。同一作品多個評分間的方差也是誤差方差。 (一)概化理論的發(fā)展思路(一)概化理論的發(fā)展思路v、誤差來源的多樣性與總分方差結(jié)構(gòu)、誤差來源的多樣性與總分方差結(jié)構(gòu) 的復(fù)雜性的復(fù)雜性v測量誤差的原因多方面,誤差方差的種類多種。測量誤差的原因多方面,誤差方差的種類多種。v總分方差結(jié)構(gòu)復(fù)雜:不同來源的誤差方差與目標(biāo)分總分方差結(jié)構(gòu)復(fù)雜:不同

3、來源的誤差方差與目標(biāo)分?jǐn)?shù)方差共存。數(shù)方差共存。 (一)概化理論的發(fā)展思路(一)概化理論的發(fā)展思路v3、經(jīng)典測驗理論處理分?jǐn)?shù)方差的辦法、經(jīng)典測驗理論處理分?jǐn)?shù)方差的辦法v 假定假定X = T + E,v 然后有:然后有:v 再定義信度為:再定義信度為: 222ETX22/TX(一)概化理論的發(fā)展思路(一)概化理論的發(fā)展思路v3、經(jīng)典測驗理論處理分?jǐn)?shù)方差的辦法、經(jīng)典測驗理論處理分?jǐn)?shù)方差的辦法v優(yōu)點(diǎn):優(yōu)點(diǎn):定義了隨機(jī)誤差,可設(shè)法估計其大小。定義了隨機(jī)誤差,可設(shè)法估計其大小。v缺點(diǎn):缺點(diǎn):沒有能告訴我們誤差由哪些原因造成,各種沒有能告訴我們誤差由哪些原因造成,各種原因造成的誤差各有多大。原因造成的誤差各

4、有多大。 (一)概化理論的發(fā)展思路(一)概化理論的發(fā)展思路v 4、概化理論的研究目的、概化理論的研究目的v探清總分方差結(jié)構(gòu)、探清總分方差結(jié)構(gòu)、v區(qū)分誤差原因,區(qū)分誤差原因,v明確各種誤差大小,明確各種誤差大小,v找到最優(yōu)設(shè)計方案。找到最優(yōu)設(shè)計方案。 v(二)概化理論發(fā)展的理論與技術(shù)基礎(chǔ)(二)概化理論發(fā)展的理論與技術(shù)基礎(chǔ)v1、經(jīng)典測驗理論、經(jīng)典測驗理論 概化理論與經(jīng)典測驗理論相比,不同之處多于相同概化理論與經(jīng)典測驗理論相比,不同之處多于相同之處。之處。v2、方差分量分析、方差分量分析 依靠方差分量分析將總分方差分解、定性。依靠方差分量分析將總分方差分解、定性。 v(三)概化理論發(fā)展史(三)概化理

5、論發(fā)展史v用方差分量分析研究測量誤差的歷史可以追溯到用方差分量分析研究測量誤差的歷史可以追溯到20世紀(jì)上半葉。世紀(jì)上半葉。v公認(rèn)的公認(rèn)的GT正式誕生的標(biāo)志物是克朗巴赫等的專著正式誕生的標(biāo)志物是克朗巴赫等的專著行為測量的可靠性行為測量的可靠性的正式出版。的正式出版。 v二、概化理論基本框架二、概化理論基本框架v(一)概化理論的測驗情境關(guān)系說(一)概化理論的測驗情境關(guān)系說v為了探清測驗誤差的來源、類型、大小,必須建立為了探清測驗誤差的來源、類型、大小,必須建立一個理論模型。一個理論模型。v二、概化理論基本框架二、概化理論基本框架v(一)概化理論的測驗情境關(guān)系說(續(xù))(一)概化理論的測驗情境關(guān)系說(

6、續(xù))v概化理論模型的建立依賴于對測驗情境關(guān)系的詳細(xì)概化理論模型的建立依賴于對測驗情境關(guān)系的詳細(xì)調(diào)查。調(diào)查。v測驗情境關(guān)系是指測量目標(biāo)與各測量側(cè)面所組成的測驗情境關(guān)系是指測量目標(biāo)與各測量側(cè)面所組成的一種關(guān)系結(jié)構(gòu)。一種關(guān)系結(jié)構(gòu)。 (一)概化理論的測驗情境關(guān)系說(一)概化理論的測驗情境關(guān)系說v1、測量目標(biāo)、測量目標(biāo)v測量目標(biāo):測量者希望通過測量用測量值描繪的心測量目標(biāo):測量者希望通過測量用測量值描繪的心理品質(zhì)。理品質(zhì)。v確定測量目標(biāo)的方法:問確定測量目標(biāo)的方法:問“測誰測誰”和和“測什么測什么”。v一般一場測量目標(biāo)只能一個一般一場測量目標(biāo)只能一個v研究同一測量問題測量目標(biāo)一經(jīng)確定不能改變。研究同一測

7、量問題測量目標(biāo)一經(jīng)確定不能改變。 (一)概化理論的測驗情境關(guān)系說(一)概化理論的測驗情境關(guān)系說v2、測量側(cè)面、測量側(cè)面v測量側(cè)面:測量的條件。測量側(cè)面:測量的條件。v測量側(cè)面水平:測量條件的不同水平。測量側(cè)面水平:測量條件的不同水平。v測量側(cè)面類型:隨機(jī)側(cè)面測量側(cè)面類型:隨機(jī)側(cè)面 固定側(cè)面固定側(cè)面(一)概化理論的測驗情境關(guān)系說(一)概化理論的測驗情境關(guān)系說v2、測量側(cè)面(續(xù))、測量側(cè)面(續(xù))v固定側(cè)面的優(yōu)點(diǎn):固定側(cè)面的優(yōu)點(diǎn): 測量的誤差會減小,測量的信度會提高。測量的誤差會減小,測量的信度會提高。v固定側(cè)面的缺點(diǎn):固定側(cè)面的缺點(diǎn): 固定側(cè)面成目標(biāo)的一部分,測量結(jié)果拓廣受限。固定側(cè)面成目標(biāo)的一部

8、分,測量結(jié)果拓廣受限。 (一)概化理論的測驗情境關(guān)系說(一)概化理論的測驗情境關(guān)系說v3、概化理論下的真分?jǐn)?shù)概念、概化理論下的真分?jǐn)?shù)概念v經(jīng)典測驗理論認(rèn)為個體真分?jǐn)?shù)只能有一個。經(jīng)典測驗理論認(rèn)為個體真分?jǐn)?shù)只能有一個。v概化理論認(rèn)為在不同測量條件下會有不同的真分?jǐn)?shù)。概化理論認(rèn)為在不同測量條件下會有不同的真分?jǐn)?shù)。 (一)概化理論的測驗情境關(guān)系說(一)概化理論的測驗情境關(guān)系說v測驗情境關(guān)系說結(jié)論:測驗情境關(guān)系說結(jié)論:v情境關(guān)系中的測量目標(biāo)、測量側(cè)面、側(cè)面的水平變情境關(guān)系中的測量目標(biāo)、測量側(cè)面、側(cè)面的水平變化,會引起測驗誤差的來源,誤差的大小、真分?jǐn)?shù)化,會引起測驗誤差的來源,誤差的大小、真分?jǐn)?shù)的種類以及

9、測驗信度的變化,進(jìn)而引起測驗分?jǐn)?shù)的的種類以及測驗信度的變化,進(jìn)而引起測驗分?jǐn)?shù)的解釋范圍發(fā)生變化。解釋范圍發(fā)生變化。 v(二)測驗設(shè)計的模型與種類(二)測驗設(shè)計的模型與種類v測驗設(shè)計的任務(wù)(兩個方面):測驗設(shè)計的任務(wù)(兩個方面):v(1)界定測量目標(biāo)和測量側(cè)面的個數(shù)及名稱、意)界定測量目標(biāo)和測量側(cè)面的個數(shù)及名稱、意義,確定各側(cè)面的水平數(shù)。義,確定各側(cè)面的水平數(shù)。v(2)設(shè)計數(shù)據(jù)采集方法。)設(shè)計數(shù)據(jù)采集方法。 (二)測驗設(shè)計的模型與種類(二)測驗設(shè)計的模型與種類v數(shù)據(jù)采集方法類型:數(shù)據(jù)采集方法類型:v以側(cè)面數(shù)分:以側(cè)面數(shù)分: 單側(cè)面設(shè)計、單側(cè)面設(shè)計、 雙側(cè)面設(shè)計、雙側(cè)面設(shè)計、 多側(cè)面設(shè)計多側(cè)面設(shè)計

10、(二)測驗設(shè)計的模型與種類(二)測驗設(shè)計的模型與種類v數(shù)據(jù)采集方法類型(續(xù)):數(shù)據(jù)采集方法類型(續(xù)):v以數(shù)據(jù)結(jié)構(gòu)分:以數(shù)據(jù)結(jié)構(gòu)分:v交叉設(shè)計:交叉設(shè)計: 測量目標(biāo)在所有側(cè)面的各個水平上被測量。測量目標(biāo)在所有側(cè)面的各個水平上被測量。v如如 pI 、pir (二)測驗設(shè)計的模型與種類(二)測驗設(shè)計的模型與種類v數(shù)據(jù)采集方法類型(續(xù)):數(shù)據(jù)采集方法類型(續(xù)):v嵌套設(shè)計:嵌套設(shè)計:測量目標(biāo)在一個或多個側(cè)面的部分水平測量目標(biāo)在一個或多個側(cè)面的部分水平以下被測量。以下被測量。v如如 p:r 、p:r:sv混合設(shè)計:混合設(shè)計:既有交叉,又有嵌套的測驗設(shè)計。既有交叉,又有嵌套的測驗設(shè)計。v如如 i(p:r

11、) (二)測驗設(shè)計的模型與種類(二)測驗設(shè)計的模型與種類v數(shù)據(jù)采集設(shè)計原則:數(shù)據(jù)采集設(shè)計原則:v數(shù)據(jù)充分體現(xiàn)測量目標(biāo)與各個測量側(cè)面及各側(cè)面相數(shù)據(jù)充分體現(xiàn)測量目標(biāo)與各個測量側(cè)面及各側(cè)面相互之間關(guān)系互之間關(guān)系v側(cè)面數(shù)、水平數(shù)的設(shè)置要符合客觀的測驗情境;側(cè)面數(shù)、水平數(shù)的設(shè)置要符合客觀的測驗情境;v能獲得充分的數(shù)據(jù)信息;能獲得充分的數(shù)據(jù)信息;v簡化模型、節(jié)約投入。簡化模型、節(jié)約投入。v施測時要控制設(shè)計之外的各種無關(guān)變量。施測時要控制設(shè)計之外的各種無關(guān)變量。 v(三)(三)G研究研究 G研究目的:用方差分量分析,定量估計觀察領(lǐng)域研究目的:用方差分量分析,定量估計觀察領(lǐng)域中測量目標(biāo)方差和各個測量側(cè)面方差,

12、以及其間的中測量目標(biāo)方差和各個測量側(cè)面方差,以及其間的交互作用的方差。交互作用的方差。 v方差分量分析(二步):方差分量分析(二步):v1、分解總體方差為測量目標(biāo)主效應(yīng)方差、分解總體方差為測量目標(biāo)主效應(yīng)方差、各測量側(cè)面主效應(yīng)方差和各種交互效應(yīng)方各測量側(cè)面主效應(yīng)方差和各種交互效應(yīng)方差。差。v2、應(yīng)用樣本方差估計各種效應(yīng)的期望均方、應(yīng)用樣本方差估計各種效應(yīng)的期望均方差。差。 (三)(三)G G研究研究v各種期望均方差性質(zhì):各種期望均方差性質(zhì):v測量目標(biāo)效應(yīng)期望均方差:測量目標(biāo)個體差異的描測量目標(biāo)效應(yīng)期望均方差:測量目標(biāo)個體差異的描寫量;寫量;v各測量側(cè)面效應(yīng)期望均方差:各側(cè)面對目標(biāo)干擾程各測量側(cè)面

13、效應(yīng)期望均方差:各側(cè)面對目標(biāo)干擾程度描寫量,就是誤差;度描寫量,就是誤差;v各交互效應(yīng)期望均方差:各側(cè)面對目標(biāo)的交互干擾各交互效應(yīng)期望均方差:各側(cè)面對目標(biāo)的交互干擾程度描寫量,也是誤差。程度描寫量,也是誤差。二、概化理論基本框架二、概化理論基本框架v(四)(四)D研究研究vD研究的目的:在研究的目的:在G研究的基礎(chǔ)上,在原設(shè)計的測研究的基礎(chǔ)上,在原設(shè)計的測驗情境關(guān)系范圍之內(nèi),分析比較各種可能的測驗方驗情境關(guān)系范圍之內(nèi),分析比較各種可能的測驗方案,由研究者結(jié)合實(shí)際,優(yōu)選實(shí)施方案。案,由研究者結(jié)合實(shí)際,優(yōu)選實(shí)施方案。 (四)(四)D研究研究vD研究調(diào)整原方案獲取新方案的方法:研究調(diào)整原方案獲取新方

14、案的方法:v1、固定原測驗情境關(guān)系中的某一個或某幾個、固定原測驗情境關(guān)系中的某一個或某幾個側(cè)面。側(cè)面。v2、改變原測驗情境關(guān)系中的一個或某幾個測、改變原測驗情境關(guān)系中的一個或某幾個測量側(cè)面的水平數(shù)。量側(cè)面的水平數(shù)。v3、改變原測驗情境關(guān)系中某些測量側(cè)面的結(jié)、改變原測驗情境關(guān)系中某些測量側(cè)面的結(jié)構(gòu)關(guān)系。構(gòu)關(guān)系。(四)(四)D研究研究vD研究的統(tǒng)計分析步驟(兩步)研究的統(tǒng)計分析步驟(兩步)v1、估計拓廣領(lǐng)域(新測驗方案)下各種效應(yīng)期望、估計拓廣領(lǐng)域(新測驗方案)下各種效應(yīng)期望方差。方差。v2、估計新方案下測驗誤差的總體指標(biāo)和測驗質(zhì)量、估計新方案下測驗誤差的總體指標(biāo)和測驗質(zhì)量指標(biāo),以提供比較依據(jù)。指

15、標(biāo),以提供比較依據(jù)。 (四)(四)D研究研究v測驗誤差指標(biāo):測驗誤差指標(biāo):v1、相對誤差指標(biāo):、相對誤差指標(biāo): 所有與測量目標(biāo)有關(guān)的交互效應(yīng)方差之和,所有與測量目標(biāo)有關(guān)的交互效應(yīng)方差之和,v2、絕對誤差指標(biāo):、絕對誤差指標(biāo): 除目標(biāo)主效應(yīng)方差之外的所有效應(yīng)方差之和。除目標(biāo)主效應(yīng)方差之外的所有效應(yīng)方差之和。 (四)(四)D研究研究v測驗質(zhì)量綜合指標(biāo):測驗質(zhì)量綜合指標(biāo):v1、概化系數(shù)、概化系數(shù)G;目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加;目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加相對誤差方差之和的比。相對誤差方差之和的比。v2、相依系數(shù):目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加絕、相依系數(shù):目標(biāo)效應(yīng)方差與目標(biāo)效應(yīng)方差加絕對誤差方差之和

16、的比。對誤差方差之和的比。(四)(四)D研究研究vD研究的最后工作:研究的最后工作:v根據(jù)綜合指標(biāo),找出最優(yōu)測根據(jù)綜合指標(biāo),找出最優(yōu)測驗設(shè)計方案。驗設(shè)計方案。 v概化理論分析常用軟件:概化理論分析常用軟件:v GENOVAv 或或mGENOVA。 v三、概化理論評價三、概化理論評價v優(yōu)點(diǎn):優(yōu)點(diǎn):v1、概化理論是一套全新的測驗誤差分析方法,而、概化理論是一套全新的測驗誤差分析方法,而且非常精細(xì)。且非常精細(xì)。v2、概化理論引進(jìn)了測驗設(shè)計的思想和方法。、概化理論引進(jìn)了測驗設(shè)計的思想和方法。v3、概化理論具有嚴(yán)謹(jǐn)?shù)目茖W(xué)理論體系。、概化理論具有嚴(yán)謹(jǐn)?shù)目茖W(xué)理論體系。v三、概化理論評價三、概化理論評價v缺點(diǎn)

17、:缺點(diǎn):v1、概化理論本質(zhì)上還是抽樣,研究本身會有誤差。、概化理論本質(zhì)上還是抽樣,研究本身會有誤差。v2、計算方法相對復(fù)雜,給應(yīng)用帶來一定困難。、計算方法相對復(fù)雜,給應(yīng)用帶來一定困難。 項目反應(yīng)理論簡介項目反應(yīng)理論簡介 第第二二節(jié)節(jié)v一、經(jīng)典測驗理論回顧一、經(jīng)典測驗理論回顧v巨大貢獻(xiàn)、重要地位、繼續(xù)發(fā)揮作用巨大貢獻(xiàn)、重要地位、繼續(xù)發(fā)揮作用v歷史原因、先天不足、四個方面局限歷史原因、先天不足、四個方面局限 一、經(jīng)典測驗理論回顧一、經(jīng)典測驗理論回顧v(一)測驗對被試的評價依賴于測驗項目的(一)測驗對被試的評價依賴于測驗項目的具體組合和項目數(shù)量具體組合和項目數(shù)量v評價指標(biāo):測驗原始總分評價指標(biāo):測驗

18、原始總分v局限:分?jǐn)?shù)的解釋依賴于測驗的具體內(nèi)容。局限:分?jǐn)?shù)的解釋依賴于測驗的具體內(nèi)容。v對被試的比較被迫限制在同一份試卷上對被試的比較被迫限制在同一份試卷上 一、經(jīng)典測驗理論回顧一、經(jīng)典測驗理論回顧v(二)測驗性能指標(biāo)的估計依賴于被試樣本(二)測驗性能指標(biāo)的估計依賴于被試樣本v項目難度估計值會隨被試水平的變化而變化。項目難度估計值會隨被試水平的變化而變化。v區(qū)分度、信度和效度,本質(zhì)上是相關(guān)系數(shù),也都依區(qū)分度、信度和效度,本質(zhì)上是相關(guān)系數(shù),也都依賴于被試樣本。賴于被試樣本。v同一測驗在不同被試樣本上施測所估性能指標(biāo)不一同一測驗在不同被試樣本上施測所估性能指標(biāo)不一樣。樣。一、經(jīng)典測驗理論回顧一、經(jīng)

19、典測驗理論回顧v(三)被試能力與項目難度兩指標(biāo)的(三)被試能力與項目難度兩指標(biāo)的 不一致性不一致性v測驗總分的參照系是測驗項目全體。測驗總分的參照系是測驗項目全體。v項目難度的參照系是被試全體例。項目難度的參照系是被試全體例。v兩個指標(biāo)的參照系不相同,被試能力分?jǐn)?shù)與項目難兩個指標(biāo)的參照系不相同,被試能力分?jǐn)?shù)與項目難度兩指標(biāo)不匹配。度兩指標(biāo)不匹配。 一、經(jīng)典測驗理論回顧一、經(jīng)典測驗理論回顧v(四)測驗誤差估計的不精確性(四)測驗誤差估計的不精確性v經(jīng)典理論中測驗的信度估值是不精確的、籠統(tǒng)的。經(jīng)典理論中測驗的信度估值是不精確的、籠統(tǒng)的。v信度不是按定義公式求取而是借助于信度不是按定義公式求取而是借

20、助于“平行測驗平行測驗”假設(shè)估計得到的。假設(shè)估計得到的。v經(jīng)典理論以同一誤差估計值評價所有被試測值非常經(jīng)典理論以同一誤差估計值評價所有被試測值非常籠統(tǒng),很不精確?;\統(tǒng),很不精確。一、經(jīng)典測驗理論回顧一、經(jīng)典測驗理論回顧v結(jié)論:結(jié)論:v經(jīng)典測量理論的這些局限性限制了測量在實(shí)踐中的經(jīng)典測量理論的這些局限性限制了測量在實(shí)踐中的應(yīng)用。應(yīng)用。v項目反應(yīng)理論(項目反應(yīng)理論(IRT)是在這背景上發(fā)展起來的一)是在這背景上發(fā)展起來的一種全新的現(xiàn)代測驗理論。種全新的現(xiàn)代測驗理論。 v二、項目反應(yīng)理論基礎(chǔ)二、項目反應(yīng)理論基礎(chǔ)v (一)潛在特質(zhì)理論(一)潛在特質(zhì)理論(Latent Trait Theory)v 潛在

21、特質(zhì)潛在特質(zhì):制約行為的心理特質(zhì),沒有明確其物理與生理屬性制約行為的心理特質(zhì),沒有明確其物理與生理屬性v 測量學(xué)研究測量學(xué)研究“潛在特質(zhì)潛在特質(zhì)” 的目的:的目的: 探清結(jié)構(gòu)和性質(zhì),將其數(shù)量化,探清結(jié)構(gòu)和性質(zhì),將其數(shù)量化, 測量個體特質(zhì)變量值,預(yù)測個體行為。測量個體特質(zhì)變量值,預(yù)測個體行為。 (一)潛在特質(zhì)理論潛在特質(zhì)理論 v潛在特質(zhì)空間定義:潛在特質(zhì)空間定義: 對于人的某種任務(wù)行為起制約作用的若干潛在對于人的某種任務(wù)行為起制約作用的若干潛在特質(zhì)的集合稱為潛在特質(zhì)空間,相互獨(dú)立的潛在特質(zhì)的集合稱為潛在特質(zhì)空間,相互獨(dú)立的潛在特質(zhì)的個數(shù)稱為空間的維度。特質(zhì)的個數(shù)稱為空間的維度。 (一)潛在特質(zhì)理

22、論潛在特質(zhì)理論 vK維潛在特質(zhì)空間表示:維潛在特質(zhì)空間表示:v v 其中的每一個稱為一個潛在分量。其中的每一個稱為一個潛在分量。 12.(,)k (一)潛在特質(zhì)理論潛在特質(zhì)理論v完備的潛在特質(zhì)空間定義:完備的潛在特質(zhì)空間定義:v如果一個如果一個K維潛在特質(zhì)空間包含了制約人某種任務(wù)維潛在特質(zhì)空間包含了制約人某種任務(wù)行為的所有潛在特質(zhì),稱其為一個完備的潛在特質(zhì)行為的所有潛在特質(zhì),稱其為一個完備的潛在特質(zhì)空間,簡稱全特質(zhì)空間。空間,簡稱全特質(zhì)空間。 (一)潛在特質(zhì)理論潛在特質(zhì)理論v測量單維性定義:測量單維性定義:v如果制約某種任務(wù)行為的空間既是一維的,又是完如果制約某種任務(wù)行為的空間既是一維的,又是

23、完備的,則稱這一任務(wù)行為的測量具有單維性。單維備的,則稱這一任務(wù)行為的測量具有單維性。單維IRT模型是最為人們熟悉的。模型是最為人們熟悉的。 v(二)項目特征曲線(二)項目特征曲線 (Item Characteristic Curve, ICCItem Characteristic Curve, ICC)v項目特征曲線原理:項目特征曲線原理: 編制質(zhì)量良好的試題,隨著被試水平的提高,其編制質(zhì)量良好的試題,隨著被試水平的提高,其正確作答的概率會越來越大。正確作答的概率會越來越大。 (二)項目特征曲線(二)項目特征曲線 v經(jīng)典測量理論項目特征曲線實(shí)質(zhì):經(jīng)典測量理論項目特征曲線實(shí)質(zhì): 被試正確作答概

24、率對測驗總分的回歸曲線被試正確作答概率對測驗總分的回歸曲線v項目反應(yīng)理論項目特征曲線實(shí)質(zhì):項目反應(yīng)理論項目特征曲線實(shí)質(zhì): 被試在項目上正確作答概率對被試潛在特質(zhì)的回歸被試在項目上正確作答概率對被試潛在特質(zhì)的回歸曲線。曲線。(二)項目特征曲線(二)項目特征曲線v項目特征曲線項目特征曲線在正常情況下與漸變式的在正常情況下與漸變式的S形中形中心對稱曲線擬合。心對稱曲線擬合。v項目特征曲線的解析式被稱為項目特征函數(shù),項目特征曲線的解析式被稱為項目特征函數(shù),也即通常所說模型。也即通常所說模型。 (二)項目特征曲線(二)項目特征曲線 圖圖 項目特征曲線項目特征曲線 v(三)項目反應(yīng)理論的基礎(chǔ)模型(三)項目

25、反應(yīng)理論的基礎(chǔ)模型v1.雙參數(shù)正態(tài)肩形曲線模型(雙參數(shù)正態(tài)肩形曲線模型( 1952年洛德給出)年洛德給出) (Normal Ogive Model)v 2()21( )2iZabiiPedz1.1.雙參數(shù)正態(tài)肩形曲線模型雙參數(shù)正態(tài)肩形曲線模型vb的意義:的意義:v將將 代入模型,即可得代入模型,即可得:vb是對稱曲線的中心與拐點(diǎn),是曲線的是對稱曲線的中心與拐點(diǎn),是曲線的定位參數(shù)定位參數(shù)。vIRT難度定義:難度定義: 在項目上恰有在項目上恰有0.5正確作答概率的正確作答概率的那些個體的能力值那些個體的能力值b為該項目難度值。為該項目難度值。b0.5p1.1.雙參數(shù)正態(tài)肩形曲線模型雙參數(shù)正態(tài)肩形曲

26、線模型va的意義:的意義:v將模型對將模型對 求導(dǎo),將求導(dǎo),將 代入,代入, 可得可得 。 va是曲線拐點(diǎn)(難度點(diǎn))的是曲線拐點(diǎn)(難度點(diǎn))的斜率斜率。v曲線越陡峭,難度點(diǎn)附近不同被試正確作答概率的曲線越陡峭,難度點(diǎn)附近不同被試正確作答概率的差異越大差異越大v a 定義為區(qū)分度定義為區(qū)分度 b2atgA1 1、雙參數(shù)項目特征曲線雙參數(shù)項目特征曲線 1 1 1/21/2 0 0 b b 圖圖 雙參數(shù)模型的雙參數(shù)模型的項目特征曲線項目特征曲線 (三)項目反應(yīng)理論的基礎(chǔ)模型(續(xù))(三)項目反應(yīng)理論的基礎(chǔ)模型(續(xù))v2.Rasch2.Rasch模型模型v丹麥學(xué)者拉希建丹麥學(xué)者拉希建 RaschRasch

27、 模型模型 RaschRasch模型的最大特點(diǎn)是它的項目參數(shù)只有難度。模型的最大特點(diǎn)是它的項目參數(shù)只有難度。 )exp(1/)exp()(iiibbP(三)項目反應(yīng)理論的基礎(chǔ)模型(續(xù))(三)項目反應(yīng)理論的基礎(chǔ)模型(續(xù))v3.Logistic模型模型v伯恩鮑姆(伯恩鮑姆(Birnbaum,1958)雙參數(shù))雙參數(shù)Logistic模型:模型: v其中其中D一般取一般取1.7 v令令a=1,成單參數(shù),成單參數(shù)Logistic模型。模型。)(exp1)(exp)(iiiiibDabDaP(三)項目反應(yīng)理論的基礎(chǔ)模型(續(xù))(三)項目反應(yīng)理論的基礎(chǔ)模型(續(xù))v增加一個參數(shù)增加一個參數(shù)c c成為成為三參數(shù)三

28、參數(shù)LogisticLogistic模型模型: v參數(shù)參數(shù)c c是是S S曲線的下漸近線,稱為曲線的下漸近線,稱為“偽機(jī)遇參數(shù)偽機(jī)遇參數(shù)” ( )(1) 1 exp()iiiiiPccDab三參數(shù)項目特征曲線三參數(shù)項目特征曲線v P P( )( ) 1 (1+c)/2 c v 三參數(shù)模型的項目特征曲線三參數(shù)模型的項目特征曲線 v(四)項目反應(yīng)理論的優(yōu)良性質(zhì)(四)項目反應(yīng)理論的優(yōu)良性質(zhì)v1.被試能力估計獨(dú)立于測驗項目的選擇被試能力估計獨(dú)立于測驗項目的選擇v 項目反應(yīng)理論生成獨(dú)立于項目內(nèi)容的被試水平測量。項目反應(yīng)理論生成獨(dú)立于項目內(nèi)容的被試水平測量。v這一優(yōu)點(diǎn)為發(fā)展自適應(yīng)測驗提供了理論基礎(chǔ)。這一優(yōu)

29、點(diǎn)為發(fā)展自適應(yīng)測驗提供了理論基礎(chǔ)。 (四)項目反應(yīng)理論的優(yōu)良性質(zhì)(四)項目反應(yīng)理論的優(yōu)良性質(zhì)v2.項目參數(shù)估計獨(dú)立于被試樣本項目參數(shù)估計獨(dú)立于被試樣本v項目特征曲線的本質(zhì):被試作答正確率對能力的回項目特征曲線的本質(zhì):被試作答正確率對能力的回歸。歸。v刻畫回歸曲線形態(tài)的參數(shù),即刻畫回歸曲線形態(tài)的參數(shù),即a、b、c與被試分布與被試分布無關(guān)。無關(guān)。v這一性質(zhì)為建設(shè)大型題庫提供了保證。這一性質(zhì)為建設(shè)大型題庫提供了保證。 (四)項目反應(yīng)理論的優(yōu)良性質(zhì)(四)項目反應(yīng)理論的優(yōu)良性質(zhì)v3.被試能力參數(shù)量表與項目難度參數(shù)量表的被試能力參數(shù)量表與項目難度參數(shù)量表的一致性一致性v1、可準(zhǔn)確預(yù)估被試的正確作答概率。、

30、可準(zhǔn)確預(yù)估被試的正確作答概率。v2、可針對被試能力選擇試題,是進(jìn)行自適應(yīng)測驗、可針對被試能力選擇試題,是進(jìn)行自適應(yīng)測驗的技術(shù)保證。的技術(shù)保證。 (四)項目反應(yīng)理論的優(yōu)良性質(zhì)(四)項目反應(yīng)理論的優(yōu)良性質(zhì)v4.可以精確估計每一測試項目以及測驗針對可以精確估計每一測試項目以及測驗針對每一個被試施測的測量誤差每一個被試施測的測量誤差v項目信息函數(shù):項目信息函數(shù):v v測驗信息函數(shù):測驗信息函數(shù): v 2( )( ( ) /( )( )iiiiIPPQniiII1)()((四)項目反應(yīng)理論的優(yōu)良性質(zhì)(四)項目反應(yīng)理論的優(yōu)良性質(zhì)v4.可以精確估計每一測試項目以及測驗針對可以精確估計每一測試項目以及測驗針對

31、每一個被試施測的測量誤差(續(xù))每一個被試施測的測量誤差(續(xù))v針對每一個被試施測的測量標(biāo)準(zhǔn)誤:針對每一個被試施測的測量標(biāo)準(zhǔn)誤:( )1/( )MEI二、項目反應(yīng)理論基礎(chǔ)(續(xù))二、項目反應(yīng)理論基礎(chǔ)(續(xù))v(五)(五) 項目反應(yīng)理論模型的參數(shù)估計和模項目反應(yīng)理論模型的參數(shù)估計和模型型數(shù)據(jù)資料擬合檢驗數(shù)據(jù)資料擬合檢驗v1、根據(jù)測試數(shù)據(jù)估計出所有的參數(shù)、根據(jù)測試數(shù)據(jù)估計出所有的參數(shù) 應(yīng)用軟件如:應(yīng)用軟件如:BILOG、PASCAL、 MULTILOG, ANOTEv2、通過模型、通過模型數(shù)據(jù)資料擬合檢驗,證明模型可用數(shù)據(jù)資料擬合檢驗,證明模型可用v商業(yè)軟件中同時提供擬合檢驗程序。商業(yè)軟件中同時提供擬合

32、檢驗程序。 v三、項目反應(yīng)理論的部分特色應(yīng)用簡介三、項目反應(yīng)理論的部分特色應(yīng)用簡介v(一)用信息函數(shù)評價項目和測驗質(zhì)量(一)用信息函數(shù)評價項目和測驗質(zhì)量 (一)用信息函數(shù)評價項目和測驗質(zhì)量(一)用信息函數(shù)評價項目和測驗質(zhì)量 v項目信息函數(shù)是項目質(zhì)量綜合指標(biāo)。項目信息函數(shù)是項目質(zhì)量綜合指標(biāo)。 某項目信息函數(shù)圖(某項目信息函數(shù)圖(a=1.0064 b=-1.6972 c=0.2526a=1.0064 b=-1.6972 c=0.2526)v這是一個中上質(zhì)量項目這是一個中上質(zhì)量項目(一)用信息函數(shù)評價項目和測驗質(zhì)量(一)用信息函數(shù)評價項目和測驗質(zhì)量v根據(jù)測驗信息函數(shù)從總體上評價測驗質(zhì)量。根據(jù)測驗信息

33、函數(shù)從總體上評價測驗質(zhì)量。 v 圖圖 某測驗信息函數(shù)圖某測驗信息函數(shù)圖v這是一個質(zhì)量較高的測驗。這是一個質(zhì)量較高的測驗。 三、項目反應(yīng)理論的部分特色應(yīng)用簡介三、項目反應(yīng)理論的部分特色應(yīng)用簡介v(二)實(shí)現(xiàn)大型題庫項目參數(shù)等值(二)實(shí)現(xiàn)大型題庫項目參數(shù)等值v項目反應(yīng)理論證明,兩個不同樣本所估同一項目兩項目反應(yīng)理論證明,兩個不同樣本所估同一項目兩套參數(shù)之間存在如下關(guān)系:套參數(shù)之間存在如下關(guān)系:v , , v采用錨測驗采用錨測驗-非等組設(shè)計,計算參數(shù)轉(zhuǎn)換系數(shù)非等組設(shè)計,計算參數(shù)轉(zhuǎn)換系數(shù)A和和B,完成參數(shù)轉(zhuǎn)換。完成參數(shù)轉(zhuǎn)換。 BbAbAaabcc三、項目反應(yīng)理論的部分特色應(yīng)用簡介三、項目反應(yīng)理論的部分特色應(yīng)用簡介v(三)測驗編制中用目標(biāo)信息函數(shù)控制測驗(三)測驗編制中用目標(biāo)信息函數(shù)控制測驗精度精度v1、確定目標(biāo)信息函數(shù):對不同能力被試提出不同、確定目標(biāo)信息函數(shù):對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論