戴海崎舊版:心理與教育測量理論_第1頁
戴海崎舊版:心理與教育測量理論_第2頁
戴海崎舊版:心理與教育測量理論_第3頁
戴海崎舊版:心理與教育測量理論_第4頁
戴海崎舊版:心理與教育測量理論_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

戴海崎舊版:心理與教育測量理論第一節(jié)心理特質(zhì)及其可測性假設(shè)心理特質(zhì)表現(xiàn)在一個人身上所特有的相對穩(wěn)定的行為方式一組內(nèi)部相關(guān)的行為的概括,如善良、聰明;比較穩(wěn)定,對不同的刺激做相同的反應(yīng);特質(zhì)可以分為多個層次,智力可以分語言和操作,語言可以分為詞匯和文法。通過特質(zhì)可以對人的行為作出預(yù)測;心理特質(zhì)的可測性Thorndike“凡客觀存在的事物都有其數(shù)量。”McCall“凡有數(shù)量的東西都可以測量?!贝骱F榕f版:心理與教育測量理論第二節(jié)測量誤差及其來源測量誤差在測量過程中由那些與測量目的無關(guān)的變化因素所產(chǎn)生的一種不準(zhǔn)確或不一致的測量效應(yīng)種類系統(tǒng)誤差:由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)隨機(jī)誤差:由與測量目的無關(guān)的、偶然因素引起而又不易控制的誤差戴海崎舊版:心理與教育測量理論測量誤差的來源測量工具題目取樣指導(dǎo)語難度時限測驗復(fù)本不等值被測對象測驗的經(jīng)驗練習(xí)因素應(yīng)試動機(jī)測驗焦慮生理因素戴海崎舊版:心理與教育測量理論施測過程物理環(huán)境主試者方面意外干擾評分計分戴海崎舊版:心理與教育測量理論第三節(jié)真分?jǐn)?shù)及其有關(guān)的假設(shè)真分?jǐn)?shù)的含義真分?jǐn)?shù)(TrueScore,T分?jǐn)?shù))反映被試某種心理特質(zhì)真正水平的那個數(shù)值,一個測量工具在沒有測量誤差時,所得到的純正值。操作定義:經(jīng)過無數(shù)次測量所得到的平均值。觀測分?jǐn)?shù)(ObservedScore)實測分?jǐn)?shù)戴海崎舊版:心理與教育測量理論二、數(shù)學(xué)模型及其假設(shè)

X=T+E觀測分?jǐn)?shù)=真分?jǐn)?shù)+隨機(jī)誤差戴海崎舊版:心理與教育測量理論

測量誤差的假設(shè):1.如果一個人的某種心理特質(zhì)可以用平行的測驗反復(fù)測量足夠多次,則其觀測分?jǐn)?shù)的平均值會接近于真分?jǐn)?shù)。

即ε(X)=T

或ε(E)=0戴海崎舊版:心理與教育測量理論2.真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。

即ρ(T,E)=0戴海崎舊版:心理與教育測量理論3.各平行測驗上的誤差分?jǐn)?shù)之間的相關(guān)為零。即ρ(E1,E2)=0戴海崎舊版:心理與教育測量理論第條假設(shè)意在說明E是一個隨機(jī)誤差,沒有包含系統(tǒng)誤差在內(nèi),第1條假設(shè)則在于說明E是個服從均值為零的正態(tài)分布的隨機(jī)變量。戴海崎舊版:心理與教育測量理論

對于經(jīng)典真分?jǐn)?shù)理論(CTT)的理解:(1)在問題的研究范圍之內(nèi),反應(yīng)個體某種心理特質(zhì)水平的真分?jǐn)?shù)是假定不會變的,測量的任務(wù)就是估計這一真分?jǐn)?shù)的大小。(2)觀測分?jǐn)?shù)被假定等于真分?jǐn)?shù)與誤差分?jǐn)?shù)之和,即假定觀測分?jǐn)?shù)與真分?jǐn)?shù)之間是線性關(guān)系,而不是其他關(guān)系。(3)測量誤差是完全隨機(jī)的,并服從均值為零的正態(tài)分布。

戴海崎舊版:心理與教育測量理論平行測驗:如果兩個題目不同的測驗測的是同一特質(zhì),并且題目形式、數(shù)量、難度、區(qū)分度以及測查等值團(tuán)體后所得分?jǐn)?shù)的分布都是一致的,則這兩個測驗稱作彼此平行的測驗。戴海崎舊版:心理與教育測量理論根據(jù)CTT模型和假設(shè),推導(dǎo)如下關(guān)系:(1)在一次測量中,被試觀測分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分?jǐn)?shù)方差之和即

SX2=ST2+SE2(2)真分?jǐn)?shù)分為兩部分:與測量目的有關(guān)變異和與測驗?zāi)康臒o關(guān)的變異即ST2=SV2+SI2(3)由(2)帶入(1)得SX2=SV2+SI2+SE2

在一次測驗中,一個團(tuán)體的實測分?jǐn)?shù)之間的變異性是由與測驗?zāi)康挠嘘P(guān)的變異數(shù)、穩(wěn)定的但出自無關(guān)來源的變異數(shù)和測量誤差的變異數(shù)所決定的。戴海崎舊版:心理與教育測量理論第四章測量信度戴海崎舊版:心理與教育測量理論第一節(jié)信度概述什么是信度?信度(reliability)是指測量結(jié)果的穩(wěn)定性程度,也叫測量的可靠性。操作定義:rxx=ST2/Sx2

rXX=ρTX2

rXX=ρXX’注意:信度指的是一組測驗分?jǐn)?shù)或一系列測量的特性,而不是個人分?jǐn)?shù)的特性;真分?jǐn)?shù)的變異數(shù)是不能直接測量的,因此信度是一個理論上構(gòu)想的概念,只能根據(jù)一組實得分?jǐn)?shù)作出估計。戴海崎舊版:心理與教育測量理論信度系數(shù)與信度指數(shù)信度指數(shù):相關(guān)系數(shù)信度系數(shù):相關(guān)系數(shù)的平方注意:信度系數(shù)有多種。同一種信度系數(shù)也會因樣本、測查時間不同而有多個。信度系數(shù)只是對測量分?jǐn)?shù)一致性的估計,但并沒有指出不一致的原因。獲得較高的信度只是測驗有效的必要條件。戴海崎舊版:心理與教育測量理論三、信度的作用信度是測量過程中所存在的隨機(jī)誤差大小的反映

信度可以用來解釋個人測驗分?jǐn)?shù)的意義SE=SX√1-rXX真分?jǐn)?shù)的置信區(qū)間(95%)信度可以幫助進(jìn)行不同測驗分?jǐn)?shù)的比較戴海崎舊版:心理與教育測量理論假設(shè)在一個智力測驗中,某個被試的IQ為100,這是否反映了他的真實水平?如果再測一次他的分?jǐn)?shù)將改變多少?已知該測驗的標(biāo)準(zhǔn)差為15,信度系數(shù)為、某被試在韋氏成人智力測驗中言語智商為102,操作智商為110.已知兩個分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗和操作測驗的分半信度分別是和0.88.問其操作智商是否顯著高于言語智商呢?戴海崎舊版:心理與教育測量理論一個測驗可以有多個信度估計值,因而其誤差估計值也會有多個,在實際工作者要注意選擇。本理論假定同一個團(tuán)體中所有人的測量誤差都是相同的,但實際上水平高的人與水平低的人在做測量時會有不同的隨機(jī)誤差。測量的結(jié)果不能僵硬地看成一個點,而應(yīng)看成是一個以該點為中心,以SE的某個倍數(shù)為半徑上下波動的一個范圍(區(qū)間估計)戴海崎舊版:心理與教育測量理論第二節(jié)信度的估計方法一、重測信度含義和計算重測信度(test-retestreliability)是指用同一量表對同一組被試施測兩次所得結(jié)果的一致性程度。皮爾遜積差相關(guān)系數(shù)(教材p48)使用的前提條件

所測量的心理特質(zhì)必須是穩(wěn)定的;練習(xí)和遺忘的效果基本上相互抵消;在兩次施測的間隔時期內(nèi),被試在所要測查的心理特質(zhì)方面沒有獲得更多的學(xué)習(xí)和訓(xùn)練。戴海崎舊版:心理與教育測量理論使用重測信度時應(yīng)注意兩次測驗的時間間隔要適當(dāng)(研究報告中需要說明)。再測信度適用于速度測驗或人格測驗,不適用于難度測驗。重測時應(yīng)注意提高被試的積極性。優(yōu)缺點用再測法估計信度的優(yōu)點是能提供測驗結(jié)果是否隨時間而變化的資料,可作為預(yù)測被試將來行為的依據(jù)。其缺點是易受練習(xí)和記憶的影響。戴海崎舊版:心理與教育測量理論SPSS計算求出兩次測量的總分Analyze-Correlate-Bivariate戴海崎舊版:心理與教育測量理論二、復(fù)本信度1.含義和計算復(fù)本信度(Alternate-formreliability)指的是兩個平行的測驗測量同一批被試所得結(jié)果的一致性程度,其值等于同一批被試在兩個復(fù)本測驗上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。復(fù)本信度又稱為等值性系數(shù)。

測驗實施的時間不同,復(fù)本信度所表達(dá)的含義略有不同。如果兩個復(fù)本測驗是同時連續(xù)施測的,則稱這種復(fù)本信度為等值性系數(shù)。如果兩個復(fù)本測驗是相距一段時間分兩次施測的,則稱這種復(fù)本信度為穩(wěn)定性與等值性系數(shù)。戴海崎舊版:心理與教育測量理論使用的前提條件兩測驗真正平行;被試要有條件接受兩個測驗。優(yōu)點避免記憶效果和學(xué)習(xí)效應(yīng)戴海崎舊版:心理與教育測量理論復(fù)本信度的局限性如果所考慮的行為機(jī)能受到練習(xí)的影響很大,那么使用復(fù)本只能減少但不能消除這種影響。測驗的性質(zhì)會由于重復(fù)而有所改變,比如遷移的影響編制真正的等值測驗實際困難重重,因此許多測驗沒有復(fù)本。戴海崎舊版:心理與教育測量理論內(nèi)部一致性信度(1)三、分半信度含義和計算分半信度(split-halfreliability)是指將一個測驗分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。由于分半信度描述的是兩半題目間的一致性,所以有時也被稱作內(nèi)部一致性系數(shù)。計算方法:皮爾遜積差相關(guān)校正公式:斯皮爾曼-布朗公式rxx=2rhh/(1+rhh)戴海崎舊版:心理與教育測量理論斯-布公式只有在兩半測驗分?jǐn)?shù)的方差相等時才能使用,否則,應(yīng)選擇下面兩個等價的公式之一:弗郎那根(Flanagan)公式:rxx=2[1-(Sa2+Sb2)/Sx2],

Sa2

,Sb2

,Sx2

分別為分半測驗的方差和總分的方差盧侖(Rulon)公式rxx=1-Sd2/Sx2

Sd2

是兩分半測驗之差的方差戴海崎舊版:心理與教育測量理論應(yīng)用前提及范圍分半信度通常是在只能施測一次或沒有復(fù)本的情況下使用。試卷存在任選題或試卷為速度測驗時,不宜采用分半法。戴海崎舊版:心理與教育測量理論常見的分半方法是按測題序號奇偶分半:測驗題目按某種順序(如難度)排列;如果是隨機(jī)排列的題目,則必須是所有題目是平等的(要么難度相等,要么性質(zhì)一致,是測同一個心理特質(zhì)的);如果測驗有多個分量表,應(yīng)在分量表內(nèi)部排好順序,再把各分量表的兩半組合起來求相關(guān)。戴海崎舊版:心理與教育測量理論SPSS計算第一種算法題目排序,分半求積差相關(guān)

進(jìn)行斯-布公式校正第二章算法直接求分半系數(shù)戴海崎舊版:心理與教育測量理論內(nèi)部一致性信度(2)四、同質(zhì)性信度含義同質(zhì)性信度(homogeneityreliability)也叫內(nèi)部一致性系數(shù),它是指測驗內(nèi)部所有題目間的一致性程度。同質(zhì)性信度是指一個測驗所測內(nèi)容或特質(zhì)的相同程度。戴海崎舊版:心理與教育測量理論題目間的一致性含有兩層意思:其一是指所有題目都測的是同一種心理特質(zhì),其二是指所有題目得分之間都具有較高的正相關(guān)。值得注意的是,一些表面上看起來是測量同一種心理特質(zhì)的題目,如果其題目間不具有較高的正相關(guān),則不能認(rèn)為它們具有同質(zhì)性。戴海崎舊版:心理與教育測量理論計算及適用范圍rxx=Krij/[1+(K-1)rij],其中K為一個測驗的題目個數(shù),rij

為項目間相關(guān)系數(shù)的平均數(shù)(1)KR20公式:

rxx=[K/(K-1)][1-(Σpiqi)/Sx2]pi為答對第i題的人數(shù)的比例;qi為答錯第i題的人數(shù)的比例。K為題目數(shù),Sx2為測驗總分的變異。僅適用于(0,1)記分的測驗。(2)KR21公式:

rxx=[K/(K-1)][1-(Kpq)/Sx2]只有當(dāng)所有題目的難度接近時才適用戴海崎舊版:心理與教育測量理論(3)克龍巴赫α系數(shù):

α=[K/(K-1)][1-(ΣSi2)/Sx2]克倫巴赫系數(shù)可以處理任何測驗的內(nèi)部一致性系數(shù)的計算問題。實際上,K-R

20和K-R

21只是α系數(shù)的特例。α系數(shù)是所有可能的分半信度的平均值。α是測量信度的下界的一個估計值。即α值大,必有測量信度高,但α值小時,卻不能斷定測量信度不高。戴海崎舊版:心理與教育測量理論計算步驟:按一定要求抽取n個被試的試卷,計算幾個人測驗總分的方差這幾個人在每一個題上都會有一個得分,分別求出這幾個人在每道題上得分的方差。代入公式,最后求出α。戴海崎舊版:心理與教育測量理論SPSS計算Analyze-Scale-ReliabilityAnalysis單擊“Statistics”出現(xiàn)reliabilityAnalysis:Statistics在Descriptivesfor方框中選取“item”、“scale”、“scaleifitemdeleted”在“inter-item”,單擊“correlations”,單擊“continue”按鈕回到“reliabilityAnalysis”對話框,單擊“ok”按鈕。戴海崎舊版:心理與教育測量理論當(dāng)研究者采用試題的標(biāo)準(zhǔn)分?jǐn)?shù)總和作為量表分?jǐn)?shù)時,此情況應(yīng)該選用標(biāo)準(zhǔn)化α系數(shù);當(dāng)研究者采用試題的標(biāo)準(zhǔn)分?jǐn)?shù)總和作為量表分?jǐn)?shù)時,則不選用標(biāo)準(zhǔn)化α系數(shù)戴海崎舊版:心理與教育測量理論(4)荷伊特信度測試分?jǐn)?shù)的總變異可分解為被試間變異、項目間變異和人與試題交互作用三部分。荷伊特認(rèn)為可用MS人作為被試方差估計值,用MS人×題作為誤差方差估計值。Rxx=1-MS人×題/MS人一般用于預(yù)測的測驗或?qū)W績測驗可不考慮同質(zhì)性。而驗證理論構(gòu)想時必須考慮同質(zhì)性。因此,同質(zhì)性不但與信度有關(guān),還與效度有關(guān)。戴海崎舊版:心理與教育測量理論五、評分者信度含義評分者信度(scorerreliability)是指多個評分者給同一批人的答卷進(jìn)行評分的一致性程度。

計算2人時:相關(guān)系數(shù)多人時:肯德爾和諧系數(shù)W=12[ΣRi2-(ΣRi)2/N]/[K2(N3-N)](K=3~20;N=3~7時,查W表檢驗)

K是評分者人數(shù),N是被評的對象數(shù),RI為第i個被試被評的水平等級之和戴海崎舊版:心理與教育測量理論將數(shù)據(jù)導(dǎo)入到SPSS中,點擊:analyse--nonparametricstests--Krelatedsamples把所有變量選中(所有作品的列)再選中Kendall'sW,Ok結(jié)果出來了,主要看最下面一個表的數(shù)據(jù),一個是Kendall'sWa,這個數(shù)字應(yīng)該在以上,另一個是Asymp,這個數(shù)字應(yīng)該小于0.05,如果結(jié)果不是符合這兩個規(guī)則的話,一致辭性檢驗不通過,成績要重新打分。戴海崎舊版:心理與教育測量理論重測信度在兩個時間點上對同一群人實施測驗皮爾遜積差相關(guān)復(fù)本信度對同一群人實施一個測驗的兩個版本皮爾遜積差相關(guān)內(nèi)部一致性(分半)一次性施測,然后分為兩半計分皮爾遜積差相關(guān),用斯皮爾曼-布朗公式校正內(nèi)部一致性(同質(zhì)性)一次施測,然后比較所有可能的分半法а系數(shù)或KR-20評判間信度一次施測,由兩個評分者或兩種方法評分皮爾遜積差相關(guān)評判間信度一次施測,由多個評分者或兩種方法評分肯德爾和諧系數(shù)戴海崎舊版:心理與教育測量理論評判間一致性系數(shù)給出一個評分說明,讓兩個或更多人來打分,分?jǐn)?shù)是順序或者稱名(等級或者是/否)公式Cohen‘skappa參考《心理測量》駱方孫曉敏譯中國輕工業(yè)出版社評分者內(nèi)部一致性系數(shù)計算一個評分者在給不同測驗打分時分?jǐn)?shù)的一致性α系數(shù)或KR-20戴海崎舊版:心理與教育測量理論各種信度系數(shù)相應(yīng)誤差變異的來源信度誤差變異來源重測信度時間取樣復(fù)本信度(連續(xù)施測)內(nèi)容取樣復(fù)本信度(間隔施測)時間與內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)性信度內(nèi)容取樣和內(nèi)容的異質(zhì)性評分者信度評分者間的差異戴海崎舊版:心理與教育測量理論幾種心理測驗的信度系數(shù)測驗類型低信度中信度高信度成套成就測驗0.660.920.98學(xué)術(shù)能力測驗0.560.900.97成套傾向性測驗0.260.880.96客觀人格測驗0.460.850.97興趣測驗0.420.840.93態(tài)度量表0.470.790.98戴海崎舊版:心理與教育測量理論第三節(jié)提高測量信度的方法影響測量信度的主要因素被試方面被試團(tuán)體同質(zhì)性越高(個體差異越?。?,所得相關(guān)系數(shù)(信度)就越低。被試團(tuán)體異質(zhì)性越高(個體差異越大),所得相關(guān)系數(shù)(信度)就越高。主試方面

指導(dǎo)語、態(tài)度、期望等施測情境戴海崎舊版:心理與教育測量理論四)測量工具測驗長度:測驗越長,信度越高。測驗難度:過難或過易都會使個體間得分差異減小,降低信度。顯然只有當(dāng)測驗難度水平可以使測驗分?jǐn)?shù)的分布范圍最大時,測驗的信度才會最高。通常這個難度水平為。

測驗內(nèi)容:試題取樣不當(dāng),內(nèi)部一致性低,題意模糊,信度則低。(五)兩次施測的間隔時間間隔時間越短,信度越高;間隔時間越長,信度越低。戴海崎舊版:心理與教育測量理論斯皮爾曼-布郎公式公式中,K為改變后長度與原長度之比

rxx為原測驗的信度

rkk為測驗長度是原來K倍時的信度估計

戴海崎舊版:心理與教育測量理論例:某一測驗有10個項目,信度是,問測驗應(yīng)增加到多少個項目,才能使信度達(dá)到?戴海崎舊版:心理與教育測量理論解:即,應(yīng)擴(kuò)大為原來的6倍,才能滿足要求。調(diào)整后的測驗長度應(yīng)是60個項目。戴海崎舊版:心理與教育測量理論提高測量信度的常用方法適當(dāng)增加測驗的長度使測驗中所有試題的難度接近正態(tài)分布,并控制在中等水平努力提高測驗試題的區(qū)分度選取恰當(dāng)?shù)谋辉噲F(tuán)體,提高測驗在各同質(zhì)性較強(qiáng)的亞團(tuán)體上的信度主試者嚴(yán)格執(zhí)行施測規(guī)程,評分者嚴(yán)格按照標(biāo)準(zhǔn)給分,施測場地按測驗手冊的要求進(jìn)行布置,減少無關(guān)因素的干擾戴海崎舊版:心理與教育測量理論洛德(Lord)提出學(xué)績測驗難度題型難度五選一0.70四選一0.74三選一0.77是非題0.85簡答題0.5戴海崎舊版:心理與教育測量理論幾點說明提高測量信度的方法還有很多。本章所討論的各種信度計算方法僅適用于常模參照性測驗。目標(biāo)參照性測驗的信度必須以測量的概化理論為基礎(chǔ)才能進(jìn)行很好的處理。信度的標(biāo)準(zhǔn)信度高低的標(biāo)準(zhǔn):標(biāo)準(zhǔn)化能力或?qū)W績測驗:;人格測驗:;教師自編學(xué)績測驗:測驗解釋的標(biāo)準(zhǔn):一般來說,當(dāng)信度,測驗不能用于對個人作出評價與預(yù)測,而且不能作團(tuán)體間比較;當(dāng)0.70≤信度時,可用于團(tuán)體比較;當(dāng)信度≥時,才能用來鑒別或預(yù)測個人成績。戴海崎舊版:心理與教育測量理論速度測驗的信度對于速度測驗,不存在評分者信度,也無法計算同質(zhì)性信度,而重測信度和復(fù)本信度均可按傳統(tǒng)的方法求得,只有分半信度不能按傳統(tǒng)方法估計要估計速度測驗的分半信度,不能按題目的奇偶項來劃分測驗,而應(yīng)按測驗時間劃分相等的兩部分,再求出兩部分測驗的相關(guān),才是分半信度。將測驗分成兩部分,然后以總測驗的一半時間分別進(jìn)行施測,計算兩部分得分的相關(guān)系數(shù)。整個時限分為四部分,并求出在每個時限內(nèi)的得分。計算第一部分和第四部分的總分?jǐn)?shù);第二部分和第三部分的總分?jǐn)?shù),然后計算相關(guān)。戴海崎舊版:心理與教育測量理論第五章測量效度戴海崎舊版:心理與教育測量理論效度

效度(validity)是指一個測驗或量表實際能測出其所要測的心理特質(zhì)的程度。在測驗的眾多質(zhì)量指標(biāo)中,效度是一個最重要的指標(biāo)。戴海崎舊版:心理與教育測量理論效度是一個相對的概念:每個測量工具都有自己的目的;內(nèi)隱特質(zhì)是通過外顯行為間接測得的。效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。判斷一個測量是否有效要從多方面收集證據(jù)戴海崎舊版:心理與教育測量理論

在測量理論中,效度被定義為:在一列測量中,與測量目的有關(guān)的真實變異數(shù)(由所要測量的變因引起的有效變異)與總變異數(shù)(實得變異數(shù))的比率。即:公式中,rxy表示測量的效度系數(shù);SV2表示有效變異數(shù),SX2

表示總變異數(shù)戴海崎舊版:心理與教育測量理論效度與信度的關(guān)系信度高是效度高的必要而非充分的條件測驗的效度受它的信度制約

信度高,效度未必高,信度低,效度必然低;效度高,信度必然高,效度低,信度未必低。戴海崎舊版:心理與教育測量理論第二節(jié)效度的估計測量效度是就測量結(jié)果達(dá)到測量目的的程度而言的,所以測量效度的估計在很大程度上取決于人們對測量目的的解釋。常見的解釋角度主要有三種:測驗內(nèi)容——

內(nèi)容效度理論結(jié)構(gòu)——

構(gòu)想效度工作實效——

實證效度戴海崎舊版:心理與教育測量理論內(nèi)容效度1.含義及應(yīng)用范圍內(nèi)容效度(contentvalidity)是指測驗題目對有關(guān)內(nèi)容或行為取樣的適當(dāng)程度,即一個測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。因此,一個測驗要有內(nèi)容效度必須具備兩個條件:(1)要有定義完好的內(nèi)容范圍(2)測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。戴海崎舊版:心理與教育測量理論內(nèi)容效度主要應(yīng)用于成就測驗。因為成就測驗主要是測量被試掌握某種技能或?qū)W習(xí)某門課程所達(dá)到的程度。在這種測驗中,題目取樣的代表性問題是內(nèi)容效度的主要考察方面。

編制雙向細(xì)目表就是為了提高內(nèi)容效度。戴海崎舊版:心理與教育測量理論內(nèi)容效度也適合于某些用于選拔和分類的職業(yè)測驗。這種測驗所要測的內(nèi)容就是實際工作中所需的知識和技能,編制這種測驗應(yīng)首先對實際工作做較細(xì)的分析,否則,題目取樣的代表性就難以令人滿意。戴海崎舊版:心理與教育測量理論內(nèi)容效度不適合用于能力傾向測驗和人格測驗。此外,在使用內(nèi)容效度時,要避免與表面效度(surfacevalidity)相混淆。表面效度是外行人對某個測驗從表面上看好像是測某種心理特質(zhì)的一種現(xiàn)象。表面效度可以取得被試者的合作最佳行為測驗往往表明效度高;典型行為測驗表面效度低職業(yè)興趣測驗;成就測驗人格測驗戴海崎舊版:心理與教育測量理論2.內(nèi)容效度的確定方法(1)邏輯分析法:專家判斷根據(jù)自己的知識經(jīng)驗對量表的有效性(邏輯性)作出判斷,也稱邏輯效度。為使內(nèi)容效度的判斷過程更客觀,一般采用下列步驟:①確定測驗內(nèi)容的總體范圍;②編制雙向細(xì)目表;③編制評定量表,從測驗內(nèi)容所測的技能、題目對所定義的范圍的覆蓋率、各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式的適當(dāng)性等方面,對測驗作出總的評價。戴海崎舊版:心理與教育測量理論(2)統(tǒng)計方法:用兩個測驗復(fù)本來測同一批被試,若相關(guān)高,則內(nèi)容效度可能高,但若相關(guān)低,則說明必有一個測驗缺乏內(nèi)容效度。

(3)再測法:前測→教學(xué)→后測如果后測成績優(yōu)于前測成績,說明該測驗具有一定的內(nèi)容效度。戴海崎舊版:心理與教育測量理論內(nèi)容效度既具有一定的優(yōu)點,也有一定的局限。其主要缺點是缺乏可靠的數(shù)量指標(biāo),因而妨礙了各測驗間的相互比較。戴海崎舊版:心理與教育測量理論結(jié)構(gòu)效度含義、特點與應(yīng)用范圍結(jié)構(gòu)效度(structurevalidity)是指一個測驗實際測到所要測量的理論結(jié)構(gòu)或特質(zhì)的程度,或者說測驗分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。

特點:構(gòu)想效度的大小首先取決于事先假定的心理特質(zhì)理論。當(dāng)實際測量的資料無法證實我們的理論假設(shè)時,并不一定就表明該測驗構(gòu)想效度不高。不可能有單一的數(shù)量指標(biāo)來描述構(gòu)想效度。構(gòu)想效度主要用于智力測驗、人格測驗等。戴海崎舊版:心理與教育測量理論結(jié)構(gòu)效度的確定方法(1)提出理論框架;(2)依據(jù)理論框架推演出有關(guān)測驗成績的假設(shè);(3)用邏輯或?qū)嵶C的方法來證明假設(shè)。戴海崎舊版:心理與教育測量理論確定構(gòu)想效度的基本方法(1)測驗內(nèi)部尋找證據(jù)法分析測驗的內(nèi)容效度:若內(nèi)容效度高,說明其結(jié)構(gòu)效度也高;分析被試對題目反應(yīng)的特點:有無社會稱許性的題目,如“當(dāng)事情不順我意時,我時常動怒?!睂υ擃}的回答,也許反映不了要測的性格。計算測驗的同質(zhì)性信度:分半信度、α系數(shù)、KR20、KR21戴海崎舊版:心理與教育測量理論(2)測驗之間尋找證據(jù)法相容效度:新老測驗之間的相關(guān)(兩測驗測的是同一心理特質(zhì))。若相關(guān)高,則說明新測驗可能有較高的效度。區(qū)分效度:新老測驗之間的相關(guān)(兩測驗測的不是同一心理特質(zhì)),若相關(guān)低,則說明新測驗可能有較高的效度。因素分析法:得出的因素符合理論的構(gòu)思,說明效度高。戴海崎舊版:心理與教育測量理論(3)考察測驗的實證效度法根據(jù)效標(biāo)把被試分組,考察其得分差異。根據(jù)測驗得分差異把被試分組,考察其所測特質(zhì)(行為表現(xiàn))的差異。成就測驗:分為高分組和低分組人格測驗:分為不同類型的效標(biāo)組戴海崎舊版:心理與教育測量理論(4)多種特質(zhì)-多種方法矩陣法方法:1、2、3特質(zhì):A、B、C戴海崎舊版:心理與教育測量理論A1B1C1A2B2C2A3B3C3A10.90B10.500.89C10.350.410.81A20.580.250.100.95B20.210.590.090.630.91C20.140.130.500.570.530.85A30.550.200.130.690.320.300.93B30.110.600.190.200.680.290.500.96C30.150.200.700.210.190.670.530.510.92戴海崎舊版:心理與教育測量理論(5)驗證性因素分析

(confirmatoryfactoranalysis)驗證性因素分析是目前心理學(xué)研究中應(yīng)用的一種重要統(tǒng)計分析方法,是在研究的范圍內(nèi),對已有的理論結(jié)構(gòu)進(jìn)行驗證性分析的方法。在研究中,這一方法可以幫助我們討論測驗研究是否具有構(gòu)想效度。戴海崎舊版:心理與教育測量理論對構(gòu)想效度的評價總的來說,構(gòu)想效度促使研究者把著眼點放在提出假設(shè)、檢驗假設(shè)上,使得測驗成為理論研究的重要工具,而不再只是實際決策的輔助工具,從而使測驗有了更廣闊的發(fā)展前景。

戴海崎舊版:心理與教育測量理論三、實證效度1.含義、種類及作用實證效度是指一個測驗對處于特定情境中的個體的行為進(jìn)行估計的有效性。被估計的行為是檢驗測驗效度的標(biāo)準(zhǔn),簡稱效標(biāo)。所以,實證效度又稱效標(biāo)關(guān)聯(lián)效度(criterion-relatedvalidity)。

同時效度:測驗分?jǐn)?shù)與效標(biāo)資料是同時收集的。預(yù)測效度:先獲得測驗分?jǐn)?shù),隔一段時間后,再收集效標(biāo)資料。戴海崎舊版:心理與教育測量理論例:某大學(xué)研究生入學(xué)考試要求達(dá)到一定的分?jǐn)?shù)線,但偶爾也會錄取一名沒有達(dá)到分?jǐn)?shù)線的學(xué)生,但要求這名學(xué)生在獲得學(xué)位之前必須達(dá)到研究生入學(xué)的最低分?jǐn)?shù)線。你怎樣看這個問題?戴海崎舊版:心理與教育測量理論2.效標(biāo)(1)效標(biāo)與效標(biāo)測量效標(biāo)(criterion)就是衡量一個測驗是否有效的外在標(biāo)準(zhǔn),獨立于測驗并可以從實踐中直接獲得我們所感興趣的行為。

常用的效標(biāo):學(xué)業(yè)成就、臨床診斷、實際工作表現(xiàn)、特殊訓(xùn)練成績、不同團(tuán)體的總體表現(xiàn)、先前有效的測驗、等級評定。

觀念效標(biāo):理論定義,如“大學(xué)的成功”效標(biāo)測量:操作定義,如“大學(xué)成績”

戴海崎舊版:心理與教育測量理論(2)效標(biāo)的特性a.多樣性:一個測驗可能有不同的觀念效標(biāo),同一個觀念效標(biāo)又可能有不同的效標(biāo)測量。b.復(fù)雜性:幾乎每一種效標(biāo)行為都由多種特質(zhì)構(gòu)成,包含復(fù)雜的成分。c.特殊性:即使一個普通的效標(biāo),在應(yīng)用時也有特殊性。d.時間性:近期效標(biāo)與最后效標(biāo)戴海崎舊版:心理與教育測量理論(3)效標(biāo)測量的條件a.有效性:效標(biāo)測量能真正反映觀念效標(biāo)。b.可靠性:有較高的信度c.客觀性:效標(biāo)測量必須能真正反映觀念效標(biāo),防止效標(biāo)污染。

效標(biāo)污染(criterioncontamination)是指評定者知道被試的測驗分?jǐn)?shù),因而影響

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論