版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三章測量的誤差及其檢驗
一、心理測量誤差及其來源二、心理心理測驗的基本指標三、心理測量的信度四、心理測量的效度請列舉一些你所使用過或接觸過的量表思考:量表的作用是什么?你如何解釋下述現象?一個很聰明的孩子,測得智商是80分。一個學習很好的學生,考試成績?yōu)?0分。一個人緣很好的人,人際關系測量低于常模值。
尺子的數據與我們的目測更一致,而秤盤的數據則與我們的目測不一致。因此,尺子是測量身高的有效工具——效度。什么材料的尺子?——鋼鐵(熱脹冷縮)涉及到一致性的問題?!哦瓤偨Y:量表是我們用來了解心理特質的工具,但這個工具是有誤差的。誤差要控制在一個許可的范圍內。第一節(jié)測量的誤差一、誤差種類及其含義系統(tǒng)誤差:與測量目的無關的因素所引起的恒定的有規(guī)律的誤差,穩(wěn)定地存在與每一次測量之中,這種誤差就叫做系統(tǒng)誤差。隨機誤差:與測量目的無關的偶然因素所引起的變化無規(guī)律的誤差,使得多次的測量結果不一致,其誤差的大小和方向是隨機的。這種誤差叫隨機誤差。系統(tǒng)誤差只影響測量的準確性,而隨機誤差既影響準確性,又影響一致性。
二、誤差的來源1、測量工具:項目取樣;表述的清晰與準確,及其可操作性;信度與效度的問題。2、測量對象——被試:情緒、動機、疲勞、經驗(技能與技巧)、學習效應、反應傾向等;3、實測過程:由于一些恒定因素容易控制,故主要指一些偶然因素:如物理環(huán)境、時間安排、主試因素、意外干擾、評分等。
三、真分數真分數是一個理論上構想的概念,指測量沒有誤差時的所得到的值。任何一個測驗分數都是真分數與測量誤差的和,即:X=T+E
這里的誤差E只是隨機誤差,而系統(tǒng)誤差則包含在真分數T中。E可以是正的,也可能是負的。對團體來說,實得分數的變異數(方差)等于真分數的變異數加上誤差的變異數,即SX2=ST2+SE2
而系統(tǒng)誤差的變異數包含在真分數的變異數之中,所以真分數的變異數是由兩部分組成:與測量目的有關的變異數,與測量目的無關的變異數。即:ST2=SV2+SI2
這樣,一組分數的變異性就由三部分組成:與測量目的有關的變異數,與測量目的無關的變異數,以及隨機誤差變異數,即:SX2=SV2+SI2+SE2。SX2ST2
SE2SI2SV2四、心理測驗的基本指標1、行為樣本(behaviorsample):測查的是部分心理特質與特定的行為,而非全部,這與質檢、水檢、血檢一樣涉及抽樣問題(根據心理理論抽樣)。2、標準化3、信度(reliability):測驗的可靠性,表示測量結果的一致性,通常用同一測驗多次測量同一團體或個體的結果之間的一致程度來表示。4、效度(validity):有效性,實際測出所要測的心理特質的程度。5、難度或應答率難度:成就測驗或能力測驗要求項目難度值(天花板效應和地板效應),題目應由簡到難、由易到繁排列——難度控制。第二節(jié)心理測量的信度一、什么是信度:穩(wěn)定性、可靠性、一致性
1.信度指實測值和真值相差的程度
2.信度指統(tǒng)計量與參數之間的接近程度
3.信度是指一種測驗對相同的應試者再次測驗時引起同樣反應的程度一個良好的心理測量,多次進行測量,其結果應該的是始終保持不變。
通常,心理測量的信度通過信度系數來衡量:
1、信度乃是一個被測團體真分數的變異數與實得分數的變異數之比。
rXX=ST2/SX2
2、信度乃是一個被測團體真分數與實得分數的相關系數的平方。
rXX=P2TX
3、信度乃是一個測驗X與它的任意一個平行測驗X’的相關系數。
rXX=PXX'二、信度的種類:
1、重測信度(test-retestreliability):也叫穩(wěn)定系數,是一組被試在不同時間用同一測驗測量兩次(間隔一段時距)所得分數的相關系數。實質:表示測驗結果的穩(wěn)定性。故稱之為穩(wěn)定性系數(CoefficientofStability)形式:施測—適當時間—再施測重測信度的計算方法是積差相關法,因而rxx就是皮爾遜的積差相關系數。時間間隔的把握:間隔時間越長,穩(wěn)定性系數越低。適宜時間間隔依照測驗目的、性質及被試特點而定。幾分鐘至幾年。年幼兒童,間隔要?。荒觊L群體,間隔可大。智力測驗的間隔不能太短,成就測驗的間隔不能太長。
一般間隔時間不超過六個月。(即不能讓被試記住上一次測驗的內容,又不能讓其特質發(fā)生變化,或對所學知識產生遺忘)。在一般情況下,間隔施測的副本信度最低,因為很多因素有機會影響到分數。相反,校正過的分半相關,因為影響的因素少,所得的信度估計為最高。使用重測信度應注意:不是所有測驗都可以計算重測信度。并且重測信度只是反映了隨機誤差的影響,而不是反映被試心理特點的長期變化。
2、復本信度(alternate-formreliability):
兩個平行測驗,也叫等值系數,估計的是兩個假定相等的復份測驗之間的一致性,是兩個平行測驗分數的相關。當一個測驗不能用來實施兩次時,就需要給同一個測驗編制兩份平行的測驗。定義:兩個復本施測同一被試群體,求其相關。等值性系數:同時連續(xù)施測,反映內容變異。形式:復本A—最短時間—復本B穩(wěn)定性與等值性系數:時間間隔施測,內容變異+重測信度誤差形式:復本A—適當時間—復本B
復本等值要符合下列條件:各份測驗測量的是同一種心理特性。各份測驗具有相同的內容、形式、數量、難度、區(qū)分度、時限、指導語等。各份測驗的題目不應重復。前后測驗的時間間隔要適當,太長和太短都不好。各份測驗的分數分布(平均數和標準差)大致相等。復本編好后,應再測一次,以確保各份測驗的等值。優(yōu)點:避免了重測帶來的記憶效應和練習效應;可用于長期追蹤研究前后測量;減少了作弊的可能性。缺陷:1、有些測驗因正遷移效應使測驗性質改變;如測量的內容很容易受練習的影響,復本信度也無法清除這種練習效應。
2、對許多測驗來說,難以編制合適的復本。重測復本信度:即在不同的時間里施測兩個等值的測驗(復本),得到的相關就是重測復本信度,也叫穩(wěn)定等值系數。它比單一的重測信度或復本信度都要嚴格、全面一些。
3、折半信度(split-halfreliability):
在測驗沒有復本且只能實施一次的情況下,可將測驗項目分成對等的兩半,根據被試在這兩半測驗中所得的分數計算相關系數,即得分半信度。
計算分半信度先要對測驗分半。不同的分半法可能會得到不同的信度值。為了使兩半基本等值,可將項目按由易到難的順序排列編號,然后按奇數和偶數序號將項目分半。要注意使那些性質相同、聯系緊密的項目分在相同的一半,否則會使信度值偏高。也不要出現前后直接分段.由于分半信度實際上只是半個測驗的信度,測驗越長、項目越多,兩半分數的相關就越高。因此,對長度不同的測驗,要用校正公式。當試卷中存在任選題或試卷為速度測驗時,不宜采用分半法.
4、同質性信度(homogeneityreliability):所有題目間的一致性程度。同質性指測驗的所有題目測量的是同一種心理特質,表現為各個題目得分之間有較高的相關,相關越高則同質性越強,如果相關很低或是呈負相關,則題目為異質。
因素分析的思路
分半信度是求測驗兩半之間的一致性或同質性,而同質性是求所有題目間的一致性。因此分半信度實際上是同質性信度的一種,可以作為測驗同質性評價的粗略估計指標。因為可以根據測驗得分來推論或驗證某種概念或理論構思,因此同質性信度也是一種構思效度,或叫結構效度,它實際上介于信度與效度之間。
5、評分者信度:多個評分者對同一測驗結果評分所得分數之間的一致性。評分者信度是指不同評分者之間在測驗結果計分上的一致性。在心理測驗中,評分者信度的計算,通常是隨機抽取若干份試卷,由至少兩位受過訓練的評分者按計分規(guī)則分別判分,然后計算它們的相關。幾個評分者的評分越一致,評分者信度越高.
估計信度的方法與測驗復本的數目
以及施測次數的關系被試所需要施測的次數所需要復本的數目一二一分半信度同質性信度評分者信度復本信度(連續(xù)施測)二再測信度復本信度(間隔施測)在一般情況下,間隔施測的復本信度最低,因為很多因素有機會影響到分數。相反,校正過的分半信度,因為影響的因素少,所得的信度估計為最高。各種信度系數相應誤差變異的來源信度系數的類型誤差變異的來源再測信度復本信度(連續(xù)施測)復本信度(間隔施測)分半信度同質性信度評分者信度時間取樣內容取樣時間與內容取樣內容取樣內容的異質性評分者間的差異三、信度系數的應用
1、解釋預測個人分數的意義。
2、解釋真實分數與實得分數間的關系,明確告訴我們測驗誤差大小。
3、新編的測驗信度應高于原有的同類測驗或相似測驗。
4、下結論說某測驗比較可靠,必須是依據情境的,經多次證實的。
5、它是確定測驗好壞的一個指標。一般的原則是:
當rxx<0.70時,測驗不能用于對個人作出評價或預測,而且不能做團體間比較。
當0.70≤rxx<0.85時,可用于團體比較。
當rxx≥0.85時,才可以用來鑒別或預測個人成績
實際上,有多少種誤差來源,便有多少種估計信度的方法。一個測驗哪種誤差大,便應該用哪種誤差估計。有時一個測驗需要有幾種信度系數,這樣我們就把總分數的變異數分成不同的分支。假設對100個六年級學生以兩個月的時間間隔先后施測一個創(chuàng)造力測驗的A、B兩個復本,所得的等值性與穩(wěn)定性系數為0.70。我們還根據被試對每個復本的反應計算出分半信度為0.80(先計算每個復本的分半相關系數。將二者平均后再用斯皮爾曼-布朗公式校正)。同時,我們讓另一個評分者隨機抽取50份卷子另外評分,得到評分者信度為0.92。然后,我們對這三種方法所產生的誤差變異進行分析。一個假想測驗的誤差變異來源分析信度類型誤差變異量誤差變異來源復本信度(間隔施測)1-0.70=0.30時間與內容取樣分半信度1-0.80=0.20內容取樣上述二者差異0.30-0.20=0.10時間取樣評分者信度1-0.92=0.08評分者差異誤差變異總和0.20+0.10+0.08=0.38真實變異1-0.38=0.62一個假想測驗的誤差變異來源分析真實變異誤差變異時間上的穩(wěn)定性,復本之間的一致性,評分者之間的一致性內容取樣誤差時間取樣誤差評分者間差異62%20%10%8%
四、影響信度的因素:
1、被試樣本與同質程度:個體身心狀況,如應試動機、注意力、耐心、求勝心、作答態(tài)度等會影響測量的誤差。團體被試:團體內部的離散程度以及團體的平均水平;被試的樣本。
(1)樣本團體得分分布的影響:求信度的樣本團體得分分布如果比較窄小的話信度就低。
(2)樣本團體異質性的影響:樣本團體異質的話,測驗分數的分布就比同質樣本的要廣,分數的離差就大,樣本的方差就大,信度就高。實際上,高信度可能是假性高信度,是由樣本團體的異質造成的。但如果常模總體要求各種各樣的人,則異質的信度樣本求得的信度就是真信度。這時,相反的情況就需要校正信度。(3)樣本團體平均能力水平的影響。由于信度也會因樣本間團體平均能力水平的不同而不同,因此在求信度時,一定要注意信度樣本與常??傮w間是否一致。
2、測驗的長度:在其他條件均等的情況下,測驗越長,信度越高。原因在于:(1)測驗越長,即題目越多,測驗的內容取樣就越有可能有代表性。(2)測驗越長,被試的猜測因素影響就越小。增加的項目須與原項目同質;增加的數目適當,過多——疲勞、反感,從而降低信度。3、測驗的難度:難度對信度的影響只存在于某些測驗中,如智力測驗、成就測驗、能力傾向測驗、教育測驗等。測驗的難度對信度有間接影響,因為如果測驗過難,被試的得分會集中在低分區(qū)。過于容易,分數則集中在高分區(qū)。兩種情況都使信度樣本的得分范圍變窄,變異量降低,從而低估測驗信度。因此,當難度為0.5時信度最高。4、測驗的時間間隔:這一因素之對重測信度和不同時測量時的復本信度有影響,對其余的信度來說不存在時間間隔問題。
第四節(jié)心理測量的效度效度要回答的基本問題:要測量的是什么東西?或者說是否測到了它所要測的東西?測驗對它所測量的東西測到什么程度?一. 效度的一般定義及其內涵效度是指測驗的準確性,即測驗能夠測出他們所欲測的特質的程度。1、效度的性質:效度的真實含義是指測驗結果的效度,也就是測驗結果的準確程度。(1)效度具有相對性。(2)效度具有連續(xù)性。測驗的有效性只有程度上的差別。(3)效度也不是直接就可以測量到的,它是從已有的證據推理而來的。2. 效度的統(tǒng)計與原理:P523. 效度和信度關系:兩者所涉及的誤差不同:信度僅考慮偶然的隨機誤差占測驗總變異的比例,效度則還包括與測驗無關的但穩(wěn)定的測量誤差。
(1)信度是效度的必要而非充分條件。(2)效度是受信度制約的。高效度,高信度高信度,低效度低信度,低效度
二、 效度的估計
1966年美國心理學會在《教育心理測驗值標準》中將效度分為三大類:(一)內容效度(ContentValidity)內容效度指測驗實際測到的內容與所要測量的內容之間的吻合程度。1、滿足條件:要確定好內容范圍,并使測驗的全部項目均在此范圍內;測驗項目應是已界定內容范圍的代表性樣本。2、確定內容效度的方法:專家判斷法定義好內容總體,并描繪出有關知識與技能的輪廓;劃分細綱目,并根據重要性規(guī)劃好各個綱目的加權比例,作出盡可能詳細的描述;確定每道題目所測的知識與技能,將自己的分類與測驗編制的綱目做比較;指定判定量表,從各方面對測驗作出評定。
復本法再測法經驗法3、內容效度應用:內容效度—表面效度(二)構想效度(ConstructValidity)構想效度是指測驗對于被稱作構想的某一理論概念或特質測量的程度。研究構想效度就是要搞清楚:測驗測量的是什么構想(概念或特質)?測驗分數的變異中有多少來自于測驗的理論構想?構想效度是沒有單一指標的,它是由各方面證據累積起來作出評價的。
1、構想效度的基本步驟:確定結構效度的基本步驟:建立理論框架、根據理論框架推演出有關測驗成績的假設、用邏輯或實證的方法來證明假設。
相關、因素分析2、確定構想效度的方法:測驗內法:是通過研究測驗內部結構來界定理論構想,從而為構想效度提供證據。確定測驗的內容效度分析被試對項目作反應的過程考察測驗的同質性測驗間法:通過分析幾個測驗間的相關關系,找出其共同之處,進行推斷這些測驗測量的特質是什么,也可以確定這些測驗構想效度如何。相容效度區(qū)分效度因素效度
效標關聯法實驗操作法(三)效標效度:指一個測驗對處于特定情景中的個體的行為進行估計的有效性。1、預測效度與同時性效度2、效標和效標測量:
效標:指衡量測驗有效性的外在標準,通常指我們所要預測的行為。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年二手房買賣合同中的違約責任認定
- 2024年不銹鋼水箱購入協(xié)議示例
- 2024年市場調研及銷售戰(zhàn)略合作協(xié)議
- 2024企業(yè)間游戲開發(fā)與運營合同詳細規(guī)定
- 2024年全球電商平臺技術服務合同
- 2024年企業(yè)廢氣處理與回收利用合同
- 2024年化工設備及配件買賣合同
- 2024醫(yī)療軟件開發(fā)商與醫(yī)院就電子病歷系統(tǒng)開發(fā)的合同
- 2024年東莞市分手協(xié)議標準文本
- 2024土地使用權抵押反擔保合同
- 計算思維與程序設計課件
- 【核心素養(yǎng)目標】浙教版五上《勞動》項目二 任務二《制作七巧板》教學設計
- 云南省保山市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細
- 沃爾瑪山姆會員店管理層結構
- 承臺基礎模板施工方案完整
- 高考議論文寫作指導:議論文主體段落的寫法 課件60張
- 小學二年級上冊《道德與法治》教材解讀分析
- 我不生氣了-完整版課件
- 區(qū)域經濟發(fā)展戰(zhàn)略課件
- 2022屆高考語文專題復習 專題04 文言文閱讀(原卷版+解析版)
- DB32T 3957-2020 化工企業(yè)安全生產信息化管理平臺數據規(guī)范
評論
0/150
提交評論