第三章 測(cè)量的誤差及其檢驗(yàn)_第1頁(yè)
第三章 測(cè)量的誤差及其檢驗(yàn)_第2頁(yè)
第三章 測(cè)量的誤差及其檢驗(yàn)_第3頁(yè)
第三章 測(cè)量的誤差及其檢驗(yàn)_第4頁(yè)
第三章 測(cè)量的誤差及其檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章測(cè)量的誤差及其檢驗(yàn)

一、心理測(cè)量誤差及其來源二、心理心理測(cè)驗(yàn)的基本指標(biāo)三、心理測(cè)量的信度四、心理測(cè)量的效度請(qǐng)列舉一些你所使用過或接觸過的量表思考:量表的作用是什么?你如何解釋下述現(xiàn)象?一個(gè)很聰明的孩子,測(cè)得智商是80分。一個(gè)學(xué)習(xí)很好的學(xué)生,考試成績(jī)?yōu)?0分。一個(gè)人緣很好的人,人際關(guān)系測(cè)量低于常模值。

尺子的數(shù)據(jù)與我們的目測(cè)更一致,而秤盤的數(shù)據(jù)則與我們的目測(cè)不一致。因此,尺子是測(cè)量身高的有效工具——效度。什么材料的尺子?——鋼鐵(熱脹冷縮)涉及到一致性的問題?!哦瓤偨Y(jié):量表是我們用來了解心理特質(zhì)的工具,但這個(gè)工具是有誤差的。誤差要控制在一個(gè)許可的范圍內(nèi)。第一節(jié)測(cè)量的誤差一、誤差種類及其含義系統(tǒng)誤差:與測(cè)量目的無關(guān)的因素所引起的恒定的有規(guī)律的誤差,穩(wěn)定地存在與每一次測(cè)量之中,這種誤差就叫做系統(tǒng)誤差。隨機(jī)誤差:與測(cè)量目的無關(guān)的偶然因素所引起的變化無規(guī)律的誤差,使得多次的測(cè)量結(jié)果不一致,其誤差的大小和方向是隨機(jī)的。這種誤差叫隨機(jī)誤差。系統(tǒng)誤差只影響測(cè)量的準(zhǔn)確性,而隨機(jī)誤差既影響準(zhǔn)確性,又影響一致性。

二、誤差的來源1、測(cè)量工具:項(xiàng)目取樣;表述的清晰與準(zhǔn)確,及其可操作性;信度與效度的問題。2、測(cè)量對(duì)象——被試:情緒、動(dòng)機(jī)、疲勞、經(jīng)驗(yàn)(技能與技巧)、學(xué)習(xí)效應(yīng)、反應(yīng)傾向等;3、實(shí)測(cè)過程:由于一些恒定因素容易控制,故主要指一些偶然因素:如物理環(huán)境、時(shí)間安排、主試因素、意外干擾、評(píng)分等。

三、真分?jǐn)?shù)真分?jǐn)?shù)是一個(gè)理論上構(gòu)想的概念,指測(cè)量沒有誤差時(shí)的所得到的值。任何一個(gè)測(cè)驗(yàn)分?jǐn)?shù)都是真分?jǐn)?shù)與測(cè)量誤差的和,即:X=T+E這里的誤差E只是隨機(jī)誤差,而系統(tǒng)誤差則包含在真分?jǐn)?shù)T中。E可以是正的,也可能是負(fù)的。對(duì)團(tuán)體來說,實(shí)得分?jǐn)?shù)的變異數(shù)(方差)等于真分?jǐn)?shù)的變異數(shù)加上誤差的變異數(shù),即SX2=ST2+SE2

而系統(tǒng)誤差的變異數(shù)包含在真分?jǐn)?shù)的變異數(shù)之中,所以真分?jǐn)?shù)的變異數(shù)是由兩部分組成:與測(cè)量目的有關(guān)的變異數(shù),與測(cè)量目的無關(guān)的變異數(shù)。即:ST2=SV2+SI2這樣,一組分?jǐn)?shù)的變異性就由三部分組成:與測(cè)量目的有關(guān)的變異數(shù),與測(cè)量目的無關(guān)的變異數(shù),以及隨機(jī)誤差變異數(shù),即:SX2=SV2+SI2+SE2。SX2ST2

SE2SI2SV2四、心理測(cè)驗(yàn)的基本指標(biāo)1、行為樣本(behaviorsample):測(cè)查的是部分心理特質(zhì)與特定的行為,而非全部,這與質(zhì)檢、水檢、血檢一樣涉及抽樣問題(根據(jù)心理理論抽樣)。2、標(biāo)準(zhǔn)化3、信度(reliability):測(cè)驗(yàn)的可靠性,表示測(cè)量結(jié)果的一致性,通常用同一測(cè)驗(yàn)多次測(cè)量同一團(tuán)體或個(gè)體的結(jié)果之間的一致程度來表示。4、效度(validity):有效性,實(shí)際測(cè)出所要測(cè)的心理特質(zhì)的程度。5、難度或應(yīng)答率難度:成就測(cè)驗(yàn)或能力測(cè)驗(yàn)要求項(xiàng)目難度值(天花板效應(yīng)和地板效應(yīng)),題目應(yīng)由簡(jiǎn)到難、由易到繁排列——難度控制。第二節(jié)心理測(cè)量的信度一、什么是信度:穩(wěn)定性、可靠性、一致性1.信度指實(shí)測(cè)值和真值相差的程度2.信度指統(tǒng)計(jì)量與參數(shù)之間的接近程度3.信度是指一種測(cè)驗(yàn)對(duì)相同的應(yīng)試者再次測(cè)驗(yàn)時(shí)引起同樣反應(yīng)的程度一個(gè)良好的心理測(cè)量,多次進(jìn)行測(cè)量,其結(jié)果應(yīng)該的是始終保持不變。

通常,心理測(cè)量的信度通過信度系數(shù)來衡量:1、信度乃是一個(gè)被測(cè)團(tuán)體真分?jǐn)?shù)的變異數(shù)與實(shí)得分?jǐn)?shù)的變異數(shù)之比。

rXX=ST2/SX2

2、信度乃是一個(gè)被測(cè)團(tuán)體真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平方。

rXX=P2TX

3、信度乃是一個(gè)測(cè)驗(yàn)X與它的任意一個(gè)平行測(cè)驗(yàn)X’的相關(guān)系數(shù)。

rXX=PXX'二、信度的種類:

1、重測(cè)信度(test-retestreliability):也叫穩(wěn)定系數(shù),是一組被試在不同時(shí)間用同一測(cè)驗(yàn)測(cè)量?jī)纱危ㄩg隔一段時(shí)距)所得分?jǐn)?shù)的相關(guān)系數(shù)。實(shí)質(zhì):表示測(cè)驗(yàn)結(jié)果的穩(wěn)定性。故稱之為穩(wěn)定性系數(shù)(CoefficientofStability)形式:施測(cè)—適當(dāng)時(shí)間—再施測(cè)重測(cè)信度的計(jì)算方法是積差相關(guān)法,因而rxx就是皮爾遜的積差相關(guān)系數(shù)。時(shí)間間隔的把握:間隔時(shí)間越長(zhǎng),穩(wěn)定性系數(shù)越低。適宜時(shí)間間隔依照測(cè)驗(yàn)?zāi)康?、性質(zhì)及被試特點(diǎn)而定。幾分鐘至幾年。年幼兒童,間隔要??;年長(zhǎng)群體,間隔可大。智力測(cè)驗(yàn)的間隔不能太短,成就測(cè)驗(yàn)的間隔不能太長(zhǎng)。

一般間隔時(shí)間不超過六個(gè)月。(即不能讓被試記住上一次測(cè)驗(yàn)的內(nèi)容,又不能讓其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識(shí)產(chǎn)生遺忘)。在一般情況下,間隔施測(cè)的副本信度最低,因?yàn)楹芏嘁蛩赜袡C(jī)會(huì)影響到分?jǐn)?shù)。相反,校正過的分半相關(guān),因?yàn)橛绊懙囊蛩厣?,所得的信度估?jì)為最高。使用重測(cè)信度應(yīng)注意:不是所有測(cè)驗(yàn)都可以計(jì)算重測(cè)信度。并且重測(cè)信度只是反映了隨機(jī)誤差的影響,而不是反映被試心理特點(diǎn)的長(zhǎng)期變化。2、復(fù)本信度(alternate-formreliability):

兩個(gè)平行測(cè)驗(yàn),也叫等值系數(shù),估計(jì)的是兩個(gè)假定相等的復(fù)份測(cè)驗(yàn)之間的一致性,是兩個(gè)平行測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)。當(dāng)一個(gè)測(cè)驗(yàn)不能用來實(shí)施兩次時(shí),就需要給同一個(gè)測(cè)驗(yàn)編制兩份平行的測(cè)驗(yàn)。定義:兩個(gè)復(fù)本施測(cè)同一被試群體,求其相關(guān)。等值性系數(shù):同時(shí)連續(xù)施測(cè),反映內(nèi)容變異。形式:復(fù)本A—最短時(shí)間—復(fù)本B穩(wěn)定性與等值性系數(shù):時(shí)間間隔施測(cè),內(nèi)容變異+重測(cè)信度誤差形式:復(fù)本A—適當(dāng)時(shí)間—復(fù)本B

復(fù)本等值要符合下列條件:各份測(cè)驗(yàn)測(cè)量的是同一種心理特性。各份測(cè)驗(yàn)具有相同的內(nèi)容、形式、數(shù)量、難度、區(qū)分度、時(shí)限、指導(dǎo)語(yǔ)等。各份測(cè)驗(yàn)的題目不應(yīng)重復(fù)。前后測(cè)驗(yàn)的時(shí)間間隔要適當(dāng),太長(zhǎng)和太短都不好。各份測(cè)驗(yàn)的分?jǐn)?shù)分布(平均數(shù)和標(biāo)準(zhǔn)差)大致相等。復(fù)本編好后,應(yīng)再測(cè)一次,以確保各份測(cè)驗(yàn)的等值。優(yōu)點(diǎn):避免了重測(cè)帶來的記憶效應(yīng)和練習(xí)效應(yīng);可用于長(zhǎng)期追蹤研究前后測(cè)量;減少了作弊的可能性。缺陷:1、有些測(cè)驗(yàn)因正遷移效應(yīng)使測(cè)驗(yàn)性質(zhì)改變;如測(cè)量的內(nèi)容很容易受練習(xí)的影響,復(fù)本信度也無法清除這種練習(xí)效應(yīng)。2、對(duì)許多測(cè)驗(yàn)來說,難以編制合適的復(fù)本。重測(cè)復(fù)本信度:即在不同的時(shí)間里施測(cè)兩個(gè)等值的測(cè)驗(yàn)(復(fù)本),得到的相關(guān)就是重測(cè)復(fù)本信度,也叫穩(wěn)定等值系數(shù)。它比單一的重測(cè)信度或復(fù)本信度都要嚴(yán)格、全面一些。3、折半信度(split-halfreliability):

在測(cè)驗(yàn)沒有復(fù)本且只能實(shí)施一次的情況下,可將測(cè)驗(yàn)項(xiàng)目分成對(duì)等的兩半,根據(jù)被試在這兩半測(cè)驗(yàn)中所得的分?jǐn)?shù)計(jì)算相關(guān)系數(shù),即得分半信度。

計(jì)算分半信度先要對(duì)測(cè)驗(yàn)分半。不同的分半法可能會(huì)得到不同的信度值。為了使兩半基本等值,可將項(xiàng)目按由易到難的順序排列編號(hào),然后按奇數(shù)和偶數(shù)序號(hào)將項(xiàng)目分半。要注意使那些性質(zhì)相同、聯(lián)系緊密的項(xiàng)目分在相同的一半,否則會(huì)使信度值偏高。也不要出現(xiàn)前后直接分段.由于分半信度實(shí)際上只是半個(gè)測(cè)驗(yàn)的信度,測(cè)驗(yàn)越長(zhǎng)、項(xiàng)目越多,兩半分?jǐn)?shù)的相關(guān)就越高。因此,對(duì)長(zhǎng)度不同的測(cè)驗(yàn),要用校正公式。當(dāng)試卷中存在任選題或試卷為速度測(cè)驗(yàn)時(shí),不宜采用分半法.4、同質(zhì)性信度(homogeneityreliability):所有題目間的一致性程度。同質(zhì)性指測(cè)驗(yàn)的所有題目測(cè)量的是同一種心理特質(zhì),表現(xiàn)為各個(gè)題目得分之間有較高的相關(guān),相關(guān)越高則同質(zhì)性越強(qiáng),如果相關(guān)很低或是呈負(fù)相關(guān),則題目為異質(zhì)。

因素分析的思路

分半信度是求測(cè)驗(yàn)兩半之間的一致性或同質(zhì)性,而同質(zhì)性是求所有題目間的一致性。因此分半信度實(shí)際上是同質(zhì)性信度的一種,可以作為測(cè)驗(yàn)同質(zhì)性評(píng)價(jià)的粗略估計(jì)指標(biāo)。因?yàn)榭梢愿鶕?jù)測(cè)驗(yàn)得分來推論或驗(yàn)證某種概念或理論構(gòu)思,因此同質(zhì)性信度也是一種構(gòu)思效度,或叫結(jié)構(gòu)效度,它實(shí)際上介于信度與效度之間。

5、評(píng)分者信度:多個(gè)評(píng)分者對(duì)同一測(cè)驗(yàn)結(jié)果評(píng)分所得分?jǐn)?shù)之間的一致性。評(píng)分者信度是指不同評(píng)分者之間在測(cè)驗(yàn)結(jié)果計(jì)分上的一致性。在心理測(cè)驗(yàn)中,評(píng)分者信度的計(jì)算,通常是隨機(jī)抽取若干份試卷,由至少兩位受過訓(xùn)練的評(píng)分者按計(jì)分規(guī)則分別判分,然后計(jì)算它們的相關(guān)。幾個(gè)評(píng)分者的評(píng)分越一致,評(píng)分者信度越高.

估計(jì)信度的方法與測(cè)驗(yàn)復(fù)本的數(shù)目

以及施測(cè)次數(shù)的關(guān)系被試所需要施測(cè)的次數(shù)所需要復(fù)本的數(shù)目一二一分半信度同質(zhì)性信度評(píng)分者信度復(fù)本信度(連續(xù)施測(cè))二再測(cè)信度復(fù)本信度(間隔施測(cè))在一般情況下,間隔施測(cè)的復(fù)本信度最低,因?yàn)楹芏嘁蛩赜袡C(jī)會(huì)影響到分?jǐn)?shù)。相反,校正過的分半信度,因?yàn)橛绊懙囊蛩厣?,所得的信度估?jì)為最高。各種信度系數(shù)相應(yīng)誤差變異的來源信度系數(shù)的類型誤差變異的來源再測(cè)信度復(fù)本信度(連續(xù)施測(cè))復(fù)本信度(間隔施測(cè))分半信度同質(zhì)性信度評(píng)分者信度時(shí)間取樣內(nèi)容取樣時(shí)間與內(nèi)容取樣內(nèi)容取樣內(nèi)容的異質(zhì)性評(píng)分者間的差異三、信度系數(shù)的應(yīng)用1、解釋預(yù)測(cè)個(gè)人分?jǐn)?shù)的意義。2、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)間的關(guān)系,明確告訴我們測(cè)驗(yàn)誤差大小。3、新編的測(cè)驗(yàn)信度應(yīng)高于原有的同類測(cè)驗(yàn)或相似測(cè)驗(yàn)。4、下結(jié)論說某測(cè)驗(yàn)比較可靠,必須是依據(jù)情境的,經(jīng)多次證實(shí)的。5、它是確定測(cè)驗(yàn)好壞的一個(gè)指標(biāo)。一般的原則是:當(dāng)rxx<0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)或預(yù)測(cè),而且不能做團(tuán)體間比較。當(dāng)0.70≤rxx<0.85時(shí),可用于團(tuán)體比較。當(dāng)rxx≥0.85時(shí),才可以用來鑒別或預(yù)測(cè)個(gè)人成績(jī)

實(shí)際上,有多少種誤差來源,便有多少種估計(jì)信度的方法。一個(gè)測(cè)驗(yàn)?zāi)姆N誤差大,便應(yīng)該用哪種誤差估計(jì)。有時(shí)一個(gè)測(cè)驗(yàn)需要有幾種信度系數(shù),這樣我們就把總分?jǐn)?shù)的變異數(shù)分成不同的分支。假設(shè)對(duì)100個(gè)六年級(jí)學(xué)生以兩個(gè)月的時(shí)間間隔先后施測(cè)一個(gè)創(chuàng)造力測(cè)驗(yàn)的A、B兩個(gè)復(fù)本,所得的等值性與穩(wěn)定性系數(shù)為0.70。我們還根據(jù)被試對(duì)每個(gè)復(fù)本的反應(yīng)計(jì)算出分半信度為0.80(先計(jì)算每個(gè)復(fù)本的分半相關(guān)系數(shù)。將二者平均后再用斯皮爾曼-布朗公式校正)。同時(shí),我們讓另一個(gè)評(píng)分者隨機(jī)抽取50份卷子另外評(píng)分,得到評(píng)分者信度為0.92。然后,我們對(duì)這三種方法所產(chǎn)生的誤差變異進(jìn)行分析。一個(gè)假想測(cè)驗(yàn)的誤差變異來源分析信度類型誤差變異量誤差變異來源復(fù)本信度(間隔施測(cè))1-0.70=0.30時(shí)間與內(nèi)容取樣分半信度1-0.80=0.20內(nèi)容取樣上述二者差異0.30-0.20=0.10時(shí)間取樣評(píng)分者信度1-0.92=0.08評(píng)分者差異誤差變異總和0.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論