測量的信效度_第1頁
測量的信效度_第2頁
測量的信效度_第3頁
測量的信效度_第4頁
測量的信效度_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

測量的信度和效度你如何解釋下述現象?

一個很聰明的孩子,測得智商是80分一個學習很好的學生,考試成績?yōu)?0分一個人緣很好的人,人際關系測量低于常模值誤差的含義在測量中與目的無關的因素所引起的不準確或不一致效應。不準確、不一致不準確、一致準確、一致測量的誤差系統誤差(systemerror)由與測量無關的變量引起的一種恒定而有規(guī)律的誤差。測量誤差的種類

隨機誤差(randomerror)由與測量無關的變量引起的一種無規(guī)律的誤差,不易控制心理測量誤差的來源測驗本身測驗題目取樣不當;測驗題目格式不妥;測題的難度過高或過低;測題的指導語用詞不當;測驗時限過短。測驗實施

物理環(huán)境;主試方面;意外干擾;評分不客觀,計算、登記分數出錯。被試應試動機;焦慮;生理因素;學習、發(fā)展和教育;測驗經驗;反應傾向;生理變因。兩種誤差的關系系統誤差只影響測值的準確性,與效度有關隨機誤差既影響準確性,又影響一致性。與效度和信度都有關。測量誤差的關系經典測量理論:真分數理論測驗分數=真分數+誤差(X=T+E)

真分數T:被試不受任何因素影響的條件下應該得到的測驗分數,不可直接測量;在統計上用無數次測量的平均值代替。誤差E:引起測量結果不一致的偶然誤差,可正可負。例:學績測驗得分=真實掌握程度或能力+隨機誤差(猜測、身體狀況、動機水平、考試焦慮、環(huán)境影響、手表看錯等)信度的概念信度(可靠性):測量的一致性程度

一個好的測量工具必須穩(wěn)定可靠,即多次測量的結果要保持一致。信度只受隨機誤差影響,系統誤差產生恒定效應,不影響測量工具的信度。信度的操作性定義測量理論中,信度被定義為:一組測量分數的真變異數與總變異數(實得變異數)的比率,即:ST2:真分數的變異數;SX2:測驗分數的變異數。SX2=ST2+SE2

ST2=SV2+SI2

(與測量目的有關的變異,與測量目的無關的變異)

SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2

信度的性質信度:一組測驗分數或一列測量的特性,不是個人分數的特性;真分數的變異數不能直接測量,是理論上構想的概念,只能根據一組實得分數得出估計。估計信度的方法重測信度復本信度內在一致性信度(同質性信度)評分者信度重測信度(Test-RetestReliability)定義:同一量表,同一被試群體,在不同時間,兩次施測,求其相關。實質:表示測驗結果的穩(wěn)定性。故稱之為穩(wěn)定性系數(CoefficientofStability)

形式:施測—適當時間—再施測時間間隔的把握間隔時間越長,穩(wěn)定性系數越低。適宜時間間隔依照測驗目的、性質及被試特點而定。幾分鐘至幾年。年幼兒童,間隔要??;年長群體,間隔可大。智力測驗的間隔不能太短,成就測驗的間隔不能太長。一般間隔時間不超過六個月。(即不能讓被試記住上一次測驗的內容,又不能讓其特質發(fā)生變化,或對所學知識產生遺忘)復本信度(Alternate-formraliability)因為任何測驗只是所有可能題目中的一份取樣(行為樣本),所以可編制許多平行的等值測驗,叫做復本。復本等值要符合下列條件:各份測驗測量的是同一種心理特性。各份測驗具有相同的內容和形式。各份測驗的題目不應重復。各份測驗題目數量相等,難度和區(qū)分度大體相同。各份測驗的分數分布(平均數和標準差)大致相等。復本編好后,應再測一次,以確保各份測驗的等值。A卷:你是一個喜歡熱鬧的人嗎?1=絕對是2=是3=不一定4=不是5=絕對不是B卷:你是一個喜歡安靜的人嗎?1=絕對是2=是3=不一定4=不是5=絕對不是定義:兩個復本施測同一被試群體,求其相關。等值性系數:同時連續(xù)施測,反映內容變異。形式:復本A—最短時間—復本B穩(wěn)定性與等值性系數:時間間隔施測,內容變異+重測信度誤差形式:復本A—適當時間—復本B

分半信度(Split-HalfReliability)定義:在測驗沒有復本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據被試在這兩半測驗中所得的分數計算相關系數,即得分半信度。計算分半信度先要對測驗分半。不同的分半法可能會得到不同的信度值。分半信度(Split-HalfReliability)為了使兩半基本等值,可將項目按由易到難的順序排列編號,然后按奇數和偶數序號將項目分半。要注意使那些性質相同、聯系緊密的項目分在相同的一半,否則會使信度值偏高。由于分半信度實際上只是半個測驗的信度,測驗越長、項目越多,兩半分數的相關就越高。因此,對長度不同的測驗,要用校正公式。斯皮爾曼-布朗校正公式

rx1x2表示兩半測驗分數的相關系數分半信度的估計如果兩半測驗不等值,亦即兩半測驗分數沒有相同的平均數和標準差弗朗那根公式:

Sa2

和Sb2

:兩個半測驗分數的變異數;Sx2:測驗總分的變異數。盧龍公式:

Sd2:兩半測驗分數之差的變異數,

Sx2:測驗總分的變異數。同質性信度(HomogeneityReliability)同質性指測驗的所有題目測量的是同一種心理特質,表現為各個題目得分之間有較高的相關,相關越高則同質性越強。同質性信度的估計(1)測量同質性信度基本公式

K:構成測驗項目數,:相關系數平均數,

Rkk:同質性信度值。同質性信度的估計(2)庫德-理查遜公式(K-R20公式)

K:構成測驗的題目數;

pi:通過第i題的人數比例;

qi:未通過第i題的人數比例;

Sx2:測驗總分的方差。

同質性信度的估計(3)庫德-理查遜公式(K-R21公式)K-R20/21公式僅適用于答對一題得一分、答錯無分的測驗;

同質性信度的估計(4)克倫巴赫系數對于多重記分的測驗,用Alpha系數估計:

K:測驗的題目數;

Si2:某一題目分數的變異數;

Sx2:測驗總分的變異數。

評分者信度(ScorerReliability)評分者信度是指不同評分者之間在測驗結果計分上的一致性。在心理測驗中,評分者信度的計算,通常是隨機抽取若干份試卷,由至少兩位受過訓練的評分者按計分規(guī)則分別判分,然后計算它們的相關。幾個評分者的評分越一致,評分者信度越高。

評分者信度(ScorerReliability)最簡單的估計方法就是隨機抽取若干份答卷,由兩個獨立的評分者打分,再求每份答卷兩個評判分數的相關系數。這種相關系數的計算可以用積差相關方法,也可以采用斯皮爾曼等級相關方法。如果評分者在三人以上,而且又采用等級記分時,就需要用肯德爾和諧系數來求評分者信度。評分者信度:K個評價者對N件被評價的事物評定一致性程度的度量(肯德爾W系數):Ri:每一件被評價事物的K個等級之和;N:被評價事物的件數即等級數;K:評價者的數目或等級變量的列數。評分者信度(ScorerReliability)信度系數的類型誤差變異的來源計算公式施測次數所需復本數目重測信度時間取樣積差相關系數21復本信度(連續(xù)施測)內容取樣積差相關系數12復本信度(間隔施測)時間取樣、內容取樣積差相關系數22分半信度內容取樣積差相關系數(需校正,常用斯-布公式)11同質性信度內容的異質性α系數(非二分法)11評分者信度評分者間的差異積差相關系數斯皮爾曼等級相關系數,肯德爾和諧系數11在一般情況下,間隔施測的復本信度最低,因為很多因素有機會影響到分數。相反,校正過的分半相關,因為影響的因素少,所得的信度估計為最高。樣本團體的性質相關系數受到團體中分數分布的影響信度系數受到團體異質性的影響不同團體間能力水平的影響

測驗的長度測驗越長,則試題取樣或內容取樣越恰當測驗越長,測驗結果越不易受猜測的影響測驗的難度信度影響因素被試的同質性信度系數的應用信度系數主要用途:(一)評價測驗

一般能力和學績測驗0.9

個性、價值觀.75-.85<.7時,不能用測驗來對個人做評價,也不能在團體間做比較。

>.75時,可用于團體間的比較。

>.85時,可用于鑒別個人。信度系數的應用信度系數主要用途:(二)解釋分數

1.解釋個人測驗分數:謹防過分重視單一的數字分數

SE為測量標準誤:一個人無數次重復施測一個測驗所得到的標準差rXX為測驗的信度,SX為測驗分數的方差信度系數的應用若某智力測驗信度為0.95,標準差為15,某兒童得分為120分,就可以估計其真分數的范圍了。

SE=15×1-0.95=3.35

則他的真實智力測驗分數的95%的置信區(qū)間為(113.4T126.6)。即他的智力測驗分數有95%的可能是在113.4和126.6之間。如果要提高估計的把握度,則可求出99%的置信區(qū)間。效度的定義效度指的是測量的有效性,即一個測驗對它所要測量特質準確測量的程度。在測量學中,效度被定義為與測量目的有關的變異(有效變異)與實測變異之比(Sv2/Sx2)。測量的效度除受隨機誤差影響外,還受系統誤差影響??尚诺臏y驗未必有效,而有效測驗必定可信。信度是效度的必要條件。SX2=ST2+SE2

ST2=SV2+SI2

(與測量目的有關的變異,與測量目的無關的變異)

SX2=SV2+SI2+SE2SV2SI2SE2SX2ST2

系統誤差的影響系統誤差可能是由以下幾方面原因造成的:1)所要測量的特質有多方面的含義,而量表本身未能全部包含這些方面;2)測驗題目中包含了與所測特質無關的題目;3)計分方面的問題,如選擇題的備選答案是不全面的,即沒有完全體現被試情況的差異,因此答案就不是足夠準確的,而且各題目得分是簡單累加而未經加權處理,不同題目的重要性程度就沒有得到區(qū)分。效度的分類弗蘭士和米希爾提出的分類方法:(1)內容效度(2)構想效度(3)效標效度內容效度(專家效度)-效度1定義內容效度是指項目對欲測的內容或行為范圍取樣的適當程度。條件:(1)確定好內容范圍,并使測驗的全部項目均在此范圍內;(2)測驗項目應是已界定的內容范圍的代表性樣本,即選出的項目能包含所測的內容范圍的主要方面,并使各部分項目所占比例適當。內容效度-效度1內容效度的應用適合于測驗所要測量的內容總體能夠明確界定的情況:評價教育成就測驗和職業(yè)選拔測驗主要缺點缺乏可靠的數量指標妨礙各測驗間的相互比較構想效度-效度2定義構念:心理學家為更好地描述人的具有內在一致性的行為和心理現象而構想出的抽象概念。比如,智力、創(chuàng)造力、內外向、成就動機、抑郁、焦慮等心理學的構念都是非常抽象的,但通過對一些外顯行為的觀察,將其擁有這種特質的程度數量化。對同一心理構念有不同有測量方法。但無論怎樣去測量,對一種特質的測量結果必須與該特質的理論解釋相符合。測驗對理論上的構想或特質的測量程度;測驗結果能夠反映所要測量的心理構念的程度例子:智力測驗的構想效度檢驗對智力的構念,目前較為流行的觀點認為智力代表了一個人獲得、保持知識的能力,推理能力及適應環(huán)境的能力

根據智力的定義,可以推演出以下幾點假設,1)智力不同于后天獲得的知識,因此與遺傳因素有關,且更為穩(wěn)定,2)智力會隨著人的生理變化而發(fā)展變化,3)智力會影響人的學習成績和事業(yè)成功。為驗證以上假設,可以從三方面著手:1)計算同卵雙生子、異卵雙生子、其他同胞、非同胞間智商的相關,看相關系數是否依次降低;2)看智商與學業(yè)成績間是否有高相關;3)智商是否隨著年齡的增長而逐漸提高,在某一個階段又是相對穩(wěn)定的。如果以上假設都得到了證實,則說明所編的智力測驗是有效的,如果假設得不到證實,則說明測驗的效度不高。構想效度的評價優(yōu)勢:促使研究者把著眼點放在提出假設、檢驗假設上,使得測驗成為理論研究的重要工具;主要缺點:有些構想概念模糊,沒有一致的定義;確定效度時沒有明確的操作步驟;沒有單一的數量指標來描述有效程度。效標效度-效度3衡量測驗有效性的一個重要方法:根據測驗所作出的預測能否證實效標:被預測的行為,衡量測驗是否有效的標準效標效度:考察測驗分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論