




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
心理測驗技能
〔心理咨詢師〕1第一節(jié)
測驗量表的分?jǐn)?shù)與常模2統(tǒng)計學(xué)根本知識總體、樣本與個體總體具有某種特征的一類事物的全體〔母體〕總體的特征無法進(jìn)行一一測量,只能通過樣本來推測。個體構(gòu)成總體的每一個單元個體特征可以測量,但因其隨機性太大,常常不能準(zhǔn)確地反映總體的特征。樣本構(gòu)成總體的一個部份,常用“n〞或“N〞來表示??梢员粶y量,常將其特征來代表總體特征。樣本從總體中抽出,存在抽樣誤差,某些抽樣誤差可以控制,但隨機誤差不能控制。。在心理統(tǒng)計中,n≤30稱為小樣本,n>30稱為大樣本。3次數(shù)、頻率和概率次數(shù)〔頻數(shù)〕指某一事件出現(xiàn)的回〔次〕數(shù)簡單計數(shù),常用f來表示。頻率指相對次數(shù),所觀察發(fā)生某一事件與總體事件的比率,常用%來表示。概率又稱機〔會〕率,用P來表示。估計概率和真實概率估計概率:由一定數(shù)量的觀察中得到頻率真實概率:事物真實發(fā)生的頻率當(dāng)觀察數(shù)量無限增大時,估計概率越接近真實概率。概率〔P〕=f/N4統(tǒng)計量〔特征數(shù)〕反映一組數(shù)據(jù)統(tǒng)計特征的數(shù)字例:3組20歲男性的體重〔公斤〕1組:45、50、55、58、60、60、62、65、70、752組:50、55、55、60、60、60、60、65、65、703組:40、45、50、55、60、60、65、70、75、80常用的統(tǒng)計量反映數(shù)據(jù)集中性質(zhì)或集中程度〔平均數(shù)、中位數(shù)等〕反映數(shù)據(jù)離中〔離散〕性質(zhì)或離中〔離散〕程度〔標(biāo)準(zhǔn)差、方差、全距等〕反映兩種特征之間的關(guān)系〔相關(guān)系數(shù)〕56方差和標(biāo)準(zhǔn)差反映數(shù)據(jù)離中〔離散〕趨勢的兩種指標(biāo)。英文variance〔方差〕用S2或σ2來表示;standarddeviation〔標(biāo)準(zhǔn)差〕,用S或SD來表示,亦可用σ表示。對離中趨勢進(jìn)行度量的意義全面反映事物的面貌:平均值只反映了事物的典型情況,標(biāo)準(zhǔn)差可反映事物的特殊性。判斷集中量數(shù)〔如平均值〕的代表性:在一組數(shù)據(jù)中,離中趨勢越小,集中趨勢量數(shù)的代表性就越好,相反就越差。7根本公式方差計算公式S2=∑(Xi-X)2/NXi為每個數(shù)據(jù),從X1、X2……Xn(Xi-X)為離均差(Xi-X)2為離均差平方∑(Xi-X)2為離均差平方和N為數(shù)據(jù)的個數(shù)標(biāo)準(zhǔn)差計算公式S=√S28計算舉例〔上例1組〕S12=[(45-60)2+(50-60)2+(55-60)2+(58-60)2+(60-60)2+(60-60)2+(62-60)2+(65-60)2+(70-60)2+(75-60)2]/10=70.8S1=√70.8=8.41例:3組20歲男性的體重〔公斤〕MSD1組:45、50、55、58、60、60、62、65、70、7560?2組:50、55、55、60、60、60、60、65、65、7060?3組:40、45、50、55、60、60、65、70、75、8060?9例:3組20歲男性的體重〔公斤〕計算結(jié)果〔平均值與標(biāo)準(zhǔn)差〕 MSD1組:45、50、55、58、60、60、62、65、70、75608.412組:50、55、55、60、60、60、60、65、65、70605.483組:40、45、50、55、60、60、65、70、75、806012.251011正態(tài)分布正態(tài)分布又稱常態(tài)分布,統(tǒng)計學(xué)中一種重要的理論分布,在自然界、人類社會、心理與教育中大量的現(xiàn)象和特征均按正態(tài)的形式分布,如能力、人格特征、學(xué)習(xí)成績、社會態(tài)度、行為表現(xiàn)以及身高、體重等。正態(tài)分布曲線1213正態(tài)分布的特點正態(tài)分布的形式是對稱的正態(tài)分布曲線的兩端與基線趨于無窮遠(yuǎn),但不會相交。正態(tài)分布曲線與基線之間的面積等于1〔100%〕,代表了總體事件。從正態(tài)分布曲線的最高點作垂直線,形成正態(tài)分布的中軸,將面積分為相等的兩半,各占50%。平均值位于正態(tài)分布的中軸上。正態(tài)分布曲線下各對應(yīng)的橫坐標(biāo)〔即標(biāo)準(zhǔn)差〕處與平均數(shù)之間的面積可用積分公式計算,也可查正態(tài)分布表獲得。正態(tài)分布曲線下,標(biāo)準(zhǔn)差與概率〔面積〕之間的關(guān)系舉例:平均值±〔加減〕Z個SD,包含A%的面積〔概率〕平均值±〔加減〕1個SD,包含68.26%的面積〔概率〕平均值±〔加減〕1.96個SD,包含95%的面積〔概率〕平均值±〔加減〕2.58個SD,包含99%的面積〔概率〕平均值±〔加減〕2個SD,包含95.45%的面積〔概率〕平均值±〔加減〕3個SD,包含99.73%的面積〔概率〕14正態(tài)分布理論在心理測驗的應(yīng)用化等級評定為測量數(shù)據(jù)測定題目的難易度利用正態(tài)分布將原始分轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)分在評定時確定人數(shù)〔概率〕15量表分?jǐn)?shù)的轉(zhuǎn)換開展常模分?jǐn)?shù)的計算及解釋許多心理特質(zhì)是隨時間〔年齡〕變化而開展的。將被測者的成績與各種開展水平人群平均表現(xiàn)相比較,這種常模即開展常模,該量表亦稱年齡量表。開展順序量表測驗條目〔能力或行為〕按出現(xiàn)的早晚排列,完成該條目說明到達(dá)相應(yīng)的年齡水平。葛塞爾嬰幼兒發(fā)育量表:包括運動水平、適應(yīng)性、語言、社會性四個方面。16智力年齡一個人在采用年齡量表方式編制的智力測驗上得到的分?jǐn)?shù),簡稱智齡。計算方法每個條目代表一定的年〔月〕齡,將所通過的條目折算出月齡,然后相加計算出智力年齡。如比內(nèi)量表。以標(biāo)準(zhǔn)化樣本每個年齡組平均原始分?jǐn)?shù)作為常模,被試者從測驗中得到原始分?jǐn)?shù)與其比較,從而確定智齡。比內(nèi)量表智齡計算舉例計算公式IQ=MA〔心理年齡〕/CA〔實足年齡〕×100計算舉例〔例1〕17心理年齡的分?jǐn)?shù)計算確定起始年齡起點:從實際年齡低1歲組開始測驗回頭測試原那么:假設(shè)被試在某類型條目失敗時,需回頭做低年齡組的類似條目,直至成功通過為止。確定最高年齡:某年齡組6個條目均失敗時停止繼續(xù)原那么:盡管已確定止點,但該年齡段不含某類型條目,此時應(yīng)繼續(xù)做高年齡組的類似條目,直至失敗為止。確定心理年齡2~5歲組的條目,每通過1條獲得1個月心理年齡;6~SAⅠ組的條目,每通過1條獲得2個月心理年齡;SAⅡ組的條目,每通過1條獲得5個月心理年齡;SAⅢ組的條目,每通過1條獲得6個月心理年齡;起始年齡以下的條目,假定被試完全通過,獲得相應(yīng)的心理年齡。18舉例〔例1〕:某10歲兒童心理年齡的計算年齡水平通過的測驗數(shù)目每項測驗得到的月數(shù)全部得分年月8歲6(起始年齡)—8—9歲521010歲621211歲521012歲3(在5個測驗中)2.47.213歲22414歲122AA122SAⅠ00SAⅡ155SAⅢ0(最高年齡)60總分852.2心理年齡(MA)12歲4月2天19百分位常模分?jǐn)?shù)的計算及解釋百分位常模包括百分等級、百分點、四分位數(shù)和十分位數(shù)。百分等級百分等級是應(yīng)用最廣泛的表示測驗分?jǐn)?shù)的方法百分等級指出的是個體在常模團(tuán)體中所處的位置百分等級的計算未分組資料
PR=100-(100R-50)/NR指某人原始分排列的順序數(shù)N指樣本總?cè)藬?shù)舉例:小東在30名同學(xué)中語文成績是80分,排列第5名,其百分等級多少?
PR=100-(100×5-50)/30=8520分組的資料PR=100/N[(x-l)fp/h+cf]x指任意原始分?jǐn)?shù)l指該原始分?jǐn)?shù)所在組的精確下限fp指該分?jǐn)?shù)所在組的頻數(shù)cf指以下的累計頻數(shù)h指分組的組間距舉例〔例2〕現(xiàn)有164人患某種沙門氏菌食物中毒潛伏期的資料〔見表〕,某人出現(xiàn)中毒病癥的潛伏期是38小時,求其所處百分等級?21頻數(shù)表〔例2〕潛伏期(小時)頻數(shù)累計頻數(shù)累計百分?jǐn)?shù)72~1164100.0060~516399.3948~1215896.3436~2314689.0224~4012375.0012~588350.610~252515.2422計算步驟公式:PR=100/N[(x-l)fp/h+cf]N=164x=38l=36fp=23h=12cf=123PR=100/164[(38-36)23/12+123]PR=100/164×126.83PR=77.3423百分點百分點用于計算處于某一百分比例的人相對應(yīng)的測驗分?jǐn)?shù)是多少計算方法〔直線內(nèi)插法〕舉例:高考的最高分為695,其百分等級為100,最低分為103分,百分等級為1,求百分等級80所對應(yīng)的分?jǐn)?shù)是多少?公式:C指上限百分等級SC上限百分等級對應(yīng)的分?jǐn)?shù)F指下限百分等級SF下限百分等級對應(yīng)的分?jǐn)?shù)X百分等級PP根據(jù)百分等級,要求的對應(yīng)分?jǐn)?shù)24計算部驟〔因式分解〕20/(695-PP)=79/(PP-103)79(695-PP)=20(PP-103)〔等號兩側(cè)交叉相乘〕54905-79PP=20PP-206054905+2060=20PP+79PP56965=99PPPP=56965/99PP=575.425四分位數(shù)和十分位數(shù)四分位數(shù)和十分位數(shù)只是百分位數(shù)〔百分等級〕的兩個變式。舉例百分位數(shù)〔百分等級〕:將量表分成100等份四分位數(shù):將量表分4等份,1~25%、26~50%、51~75%和76~100%四段。十分位數(shù):將量表分成10份,1~10%為第一段,91~100%為第十段。26標(biāo)準(zhǔn)分的計算及解釋標(biāo)準(zhǔn)分是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。標(biāo)準(zhǔn)分的根本單位是標(biāo)準(zhǔn)差。常見的標(biāo)準(zhǔn)分?jǐn)?shù)有z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商〔IQ〕等。根據(jù)轉(zhuǎn)換方式的不同,標(biāo)準(zhǔn)分可分為:線性轉(zhuǎn)換的標(biāo)準(zhǔn)分:z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分:z’分?jǐn)?shù)當(dāng)原始分不成常態(tài)分布,需進(jìn)行轉(zhuǎn)換使之成為常態(tài)分布轉(zhuǎn)換方法〔百分等級法〕對每個原始分計算累計百分比在常態(tài)曲線面積表中,求出對應(yīng)于該百分比的z分?jǐn)?shù)轉(zhuǎn)換后的z分?jǐn)?shù)稱為z’分?jǐn)?shù)27常見的標(biāo)準(zhǔn)分形式根本形式z分:z=(X–X)/SDX為任一原始分X為樣本平均數(shù)SD為樣本標(biāo)準(zhǔn)差常用標(biāo)準(zhǔn)分Z分?jǐn)?shù)Z=A+BzA為量表的平均數(shù)〔根據(jù)需要指定的常數(shù)〕B為量表的標(biāo)準(zhǔn)差〔根據(jù)需要指定的常數(shù)〕z為根本形式的z分舉例:韋氏智力量表智商的平均值為100(A),標(biāo)準(zhǔn)差為15(B)。某人的全量表分高于常模1個標(biāo)準(zhǔn)差,問其FIQ應(yīng)為多少?115(IQ)=100+15×128T分?jǐn)?shù)T分?jǐn)?shù)由麥克爾于1939年提出,有紀(jì)念推孟和桑代克之意T分?jǐn)?shù)目前表示任何常態(tài)化和非常態(tài)化的轉(zhuǎn)換標(biāo)準(zhǔn)系統(tǒng),量表分平均值固定為50,量表分標(biāo)準(zhǔn)差固定為10。許多人格問卷均采用T分量表,如MMPI、EPQT=50+10(X–X)/SD或T=50+10z50(A)為T分?jǐn)?shù)〔量表分〕的平均值10(B)為T分?jǐn)?shù)〔量表分〕的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)九分1~9分的九級分?jǐn)?shù)量表,平均值為5、標(biāo)準(zhǔn)差為2。標(biāo)準(zhǔn)9分=5+2(X–X)/SD或標(biāo)準(zhǔn)9分=5+2z29標(biāo)準(zhǔn)九分和常態(tài)曲線面積的關(guān)系以及與平均數(shù)的距離標(biāo)準(zhǔn)九分本段面積累加面積本段中值與平均點距離94%100%大于2.0SD87%96%1.5SD712%89%1.0SD617%77%0.5SD520%60%0SD417%40%0.5SD312%23%1.0SD27%11%1.5SD14%4%大于2.0SD3031智商的計算及其意義最早的比內(nèi)–西蒙量表用心理年齡來表示智力的上下測驗題目的安排完全按難度排列,某條目在某年齡組中50%能通過,該條目就被當(dāng)成該年齡組的題目。比率智商比率IQ=MA〔心理年齡〕/CA〔實足年齡〕×100比率智商的缺乏之處個體智力的增長與年齡的關(guān)系并非一直呈直線關(guān)系,因此不適合于成人。比率智商的分?jǐn)?shù)在不同年齡組具有不同的意義。32離差智商是一種以年齡組為樣本計算而得的標(biāo)準(zhǔn)分?jǐn)?shù),為了使其與傳統(tǒng)的比率智商根本一致,一般研究者將離差智商的平均值定為100。韋克斯勒智力量表的標(biāo)準(zhǔn)差定在15IQ=100+15(X–X)/SD或IQ=100+15z斯坦福-比內(nèi)量表的標(biāo)準(zhǔn)差定在16IQ=100+16(X–X)/SD或IQ=100+16z常模標(biāo)準(zhǔn)分轉(zhuǎn)換表在實際工作中,測驗編制者會采用某種標(biāo)準(zhǔn)分公式計算出與原始分相對應(yīng)的標(biāo)準(zhǔn)分,并編制成原始分轉(zhuǎn)換標(biāo)準(zhǔn)分等值表,附在手冊上方便使用。每個測驗采用何種標(biāo)準(zhǔn)分,以及量表分的平均值和標(biāo)準(zhǔn)差均可從測驗手冊中查到。舉例〔C-WYCSI〕4歲城市兒童,言語分量表得分42分,常模平均值為49.94、標(biāo)準(zhǔn)差11.58,其言語IQ是多少?33以100為平均數(shù)不同標(biāo)準(zhǔn)差條件下每一組距正態(tài)曲線下個案百分比分組分?jǐn)?shù)百分?jǐn)?shù)分布SD=12SD=14SD=16SD=18130以上0.71.63.15.1120~1294.36.37.58.5110~11915.216.015.815.4100~10929.826.123.621.090~9929.826.123.621.080~8915.216.015.815.470~794.36.37.58.570以下0.71.63.15.1總計100.0100.0100.0100.034本卷須知開展常模換算及解釋時需要注意的問題只適用于所測特質(zhì)隨年齡發(fā)生系統(tǒng)變化的情況只適用于在典型環(huán)境下生長的兒童開展量表的單位在各年齡并不相等,因為各年齡開展速度不同百分位常模換算及解釋時需要注意的問題各百分位單位不相等,不能加、減、乘、除原始分轉(zhuǎn)換為百分等級時,靠近中央的分?jǐn)?shù)其差異被夸大,靠近兩極的分?jǐn)?shù)其差異被縮小?!惨姾蟾奖怼巢煌辉囍g不能精確比較標(biāo)準(zhǔn)分常模換算及解釋時需要注意的問題計算非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)時,要求所測特質(zhì)本質(zhì)上應(yīng)是常態(tài)分布。來自不同測驗的離差智商,只有標(biāo)準(zhǔn)差相同或相近時,才可進(jìn)行比較35WAIS-RC智商和百分位的關(guān)系〔城市〕
〔摘自?修訂韋氏成人智力量表手冊?〕百分位IQ百分位IQ百分位IQ9913370109208898129651071584971286010510809612755103573951255010047293123459937190120409726885117359516480114309275112259136建立常模的過程常模團(tuán)體的界定常模團(tuán)體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。一個測驗可能有多個常模團(tuán)體WAIS-RC:分城鄉(xiāng)、分年齡共16個常模團(tuán)體MMPI:分男、女性別兩個常模團(tuán)體EPQ〔成人〕:分性別、分年齡12個常模團(tuán)體37常模團(tuán)體對于編制測驗時的意義常模的選擇基于對實測對象的總體認(rèn)識一般程序:確定一般總體→確定目標(biāo)總體→確定樣本一般總體:準(zhǔn)備評價的對象群體目標(biāo)總體:準(zhǔn)備采樣的范圍人群常模樣本:根據(jù)總體性質(zhì)〔如性別、年齡、文化程度等〕確定的、有代表性的樣本常模樣本應(yīng)能夠代表一般總體,即具有充分的代表性。常模團(tuán)體對于使用測驗時的意義準(zhǔn)備測評的對象的性質(zhì)最近似哪個常模樣本的特征〔例:職業(yè)測評〕哪個常模分?jǐn)?shù)最適合被測評對象〔例:WAIS-RC或C-WISC〕38取樣的方法取樣即從目標(biāo)人群中選擇有代表性的樣本隨機取樣根據(jù)隨機的原那么選擇樣本,在該范圍內(nèi)每個人被抽到的時機相等。常用的抽樣方法簡單隨機抽樣:利用隨機數(shù)字表抽樣、抽簽系統(tǒng)抽樣在總體工程為N的情況下,選擇K分之一的作為樣本。K=N/nK為組距N為總樣本人數(shù)n擬抽取樣本量舉例:K為2:兩個中抽1個,隨機確定首個是誰,隔一個抽1個K為20:每隔20位抽1個從121名學(xué)生中抽40人作為調(diào)查樣本K=121÷40≈3假設(shè)首位是第8號,那么每隔3位抽一個,即8、11、14……39分組抽樣當(dāng)總體數(shù)目較大,無法進(jìn)行編號,而群體又具多樣性時采樣先分組,再在組內(nèi)隨機抽樣分層抽樣制定常模是最常用的方法先按某種〔或幾種〕變量分層,然后在每層中隨機抽取一定樣本,組合成常模樣本。分層比例抽樣ni=Ni/N×nni為第i層應(yīng)抽取的人數(shù)Ni為目標(biāo)總體中第i層人數(shù)N為目標(biāo)總體人數(shù)n為樣本容量40舉例方案在30萬人群體中抽取1000人構(gòu)成某測驗常模,總體人群中約80000人為初中文化程度者,試問建立常模時應(yīng)抽取多少初中文化程度者?公式:ni=Ni/N×nni=80000/300000×1000≈267上式中Ni/N實際是某類特征人群在目標(biāo)總體重的比例,即80000/300000≈0.27,因此上式可改為:ni=n×某類特征人群比例41分層非比例抽樣當(dāng)各層次差異很大時,有些層次的重要性大于其它層次,這時應(yīng)采用非比例抽樣,以降低各層的標(biāo)準(zhǔn)差。ni=n×NiSi/∑(NiSi)ni為各層應(yīng)抽個案數(shù)n為樣本個案數(shù)〔樣本容量〕Ni為各層個案數(shù)〔原方案〕Si為各層調(diào)查單位〔預(yù)試驗時〕的標(biāo)準(zhǔn)差舉例:原方案某測驗常模取樣時對3個人群各取300人,共900人,預(yù)備實驗時〔各組N=30〕發(fā)現(xiàn)3個人群測驗成績的標(biāo)準(zhǔn)差變化較大,S1=15、S2=10、S3=5,問實際取樣時如何分配樣本為好?42公式:ni=n×NiSi/∑(NiSi)n=900N1=N2=N3=300S1=15,S2=10,S3=5計算N1=900(300×15)/(300×15+300×10+300×5)=900(4500)/9000=450N2=900(300×10)/(300×15+300×10+300×5)=900(3000)/9000=300N3=900(300×5)/(300×15+300×10+300×5)=900(1500)/9000=150由于增加了預(yù)實驗時標(biāo)準(zhǔn)差較大組的樣本例數(shù),減少標(biāo)準(zhǔn)差較小組的樣本例數(shù),使得平均數(shù)估計較為準(zhǔn)確。43常模分?jǐn)?shù)表示法轉(zhuǎn)換表表示法又稱常模表,最簡單、根本的表示方法。將測驗的原始分轉(zhuǎn)換成相對應(yīng)的常模分?jǐn)?shù)〔如百分位、標(biāo)準(zhǔn)分、T分等〕舉例簡單轉(zhuǎn)換表:將單一測驗原始分轉(zhuǎn)換成一種或幾種分?jǐn)?shù)。如:p.223頁表13-3、瑞文推理測驗、全量表IQ復(fù)雜轉(zhuǎn)換表:包括幾個分測驗或幾種常模團(tuán)體的原始分與導(dǎo)出分?jǐn)?shù)的對應(yīng)關(guān)系。如:p.224頁表13-4、韋氏智力測驗粗分等值量表分轉(zhuǎn)換表、MMPIT分轉(zhuǎn)換表等。44剖面圖表示法剖面圖是將分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來剖面圖能直觀地表示出被試在各分測驗上的表現(xiàn)及相對位置有的剖面圖直接可作為粗分等值量表分轉(zhuǎn)換表用,如韋氏成人智力測驗記錄紙的剖面圖WISC-R剖面圖舉例總智商在平均值以上言語智商相當(dāng)高,操作智商一般。45建立常模時的本卷須知制定常模時,須清楚地說明所要測量群體的性質(zhì)與特征,依據(jù)不同的性質(zhì)〔變量〕確定群體,便可得到不同的常模。樣本的大小適當(dāng)。因為抽樣誤差與樣本大小成反比,理論上樣本越大越好,但也要考慮具體條件的允許。樣本的數(shù)量總體數(shù)目小,全部作為樣本??傮w數(shù)目較大,樣本也要大,30~100人。全國常模2000~3000人。樣本的代表性系統(tǒng)抽樣要求目標(biāo)總體無序可排,也無等級結(jié)構(gòu)存在。一般常模和特殊常模46第二節(jié)
測量的信度、效度與工程分析47信度分析定義信度〔reliability〕是指同一被試在不同時間內(nèi)用同一測驗〔或另一套相等的測驗〕重復(fù)測量所得結(jié)果的一致程度?!脖窘滩摹承哦戎笢y驗或量表的可靠性〔可靠程度〕?!昌徱取承哦染褪菍y量一致性程度的估計?!步鹩鳌吃诰幹苹蛐抻喰睦頊y驗時,信度研究是必須的環(huán)節(jié),信度資料是測驗手冊里必備的測量學(xué)指標(biāo)。在使用心理測驗時,沒有信度資料的測驗不能使用。48測量誤差與真分?jǐn)?shù)測量誤差是由與測驗?zāi)康臒o關(guān)的偶然因素引起,使得幾次測量結(jié)果不一致,且這種不一致是非系統(tǒng)的、隨機的。真分?jǐn)?shù)指測量中不存在測量誤差時的真值或客觀值。真分?jǐn)?shù)的操作定義就是無數(shù)次測量的平均值,常用X∞來表示。表示真分?jǐn)?shù)的公式:
Xi=X∞+XeXi指實測分?jǐn)?shù)X∞指真實分?jǐn)?shù)Xe指誤差分?jǐn)?shù)實測分?jǐn)?shù)是真分?jǐn)?shù)與誤差分?jǐn)?shù)的函數(shù)。在進(jìn)行心理測量時,X∞被視為是穩(wěn)定不變的,因此Xi的變化由Xe所引起。據(jù)此,Si2
=S∞2+Se2由于測量誤差的隨機性,誤差分?jǐn)?shù)的平均數(shù)為0。49實測分?jǐn)?shù)、真分?jǐn)?shù)、誤差的分布實測分?jǐn)?shù)Xi真分?jǐn)?shù)X∞誤差Xe實測分?jǐn)?shù)Xi真分?jǐn)?shù)X∞誤差Xe1718-1181433537-21618-22828038335373162327-444422282623636034340151142225-32732-52827125241∑X520520014131X262601421-7S277.667.310.32122-150信度的表達(dá)式信度的定義可以理解為一組測驗分?jǐn)?shù)中真分?jǐn)?shù)方差與實測分?jǐn)?shù)方差的比率
在實際工作中,“真分?jǐn)?shù)〔X∞〕〞是很難獲得的,我們通常將實測分?jǐn)?shù)〔Xi〕作為真分?jǐn)?shù)的“估計值〞。由于真分?jǐn)?shù)〔X∞〕難以獲得,因此S∞2也很難獲得,但后者可以通過其與實測分?jǐn)?shù)方差和誤差的關(guān)系推出來。根據(jù)rxx=rx∞2=S∞2/Si2和Si2=S∞2+Se2兩式信度〔rxx〕那么作為反映實測分?jǐn)?shù)作為“真分?jǐn)?shù)〞估計值的準(zhǔn)確程度指標(biāo)。例:如果某測驗的信度為0.9,其誤差那么為0.1。51測驗誤差的來源測驗本身引起的測量誤差測驗題目抽樣誤差測驗題目的形式測驗題目的難度過高或過低測題或指導(dǎo)語用詞不當(dāng)測驗時限過短測驗實施引起的測量誤差物理環(huán)境主試方面意外干擾評分不客觀,計算、登記、轉(zhuǎn)換出錯被試引起的測量誤差動機的影響測驗的焦慮生理因素學(xué)習(xí)、發(fā)育和教育測驗經(jīng)驗52信度的類型及估計方法重測信度(test-retestreliability)又稱穩(wěn)定性系數(shù)(stability),主要用于評價時間誤差。方法:皮爾遜積差相關(guān)公式:
rxx
相關(guān)系數(shù)X1、X2同一被試的兩個分?jǐn)?shù)N樣本例數(shù)X1、
X2兩次測驗組平均數(shù)S1、
S2兩次測驗組標(biāo)準(zhǔn)差舉例:10名學(xué)生兩次考試的成績?nèi)缦?,求它們之間的相關(guān)?53第1次成績:86587964914855823275第2次成績:83528978856847762556計算公式:計算兩組平均值:X1=67X2=65.9計算兩組標(biāo)準(zhǔn)差:S1=17.86S2=19.40計算兩次成績的積和:∑X1X2∑X1X2=86×83+58×52+79×89+64×78+91×85+48×68+55×47+82×76+32×25+75×56=46993樣本例數(shù):N=10計算相關(guān)系數(shù)相關(guān)系數(shù)的統(tǒng)計學(xué)意義判斷確定自由度〔df〕:df=N-2查表:上例df=10-2=8,r0.05(8)=0.632、r0.01(8)=0.765判斷:r=0.819∵r>0.765∴p<0.0154相關(guān)分析計算兩種具有相關(guān)關(guān)系的不同現(xiàn)象之間關(guān)系程度的統(tǒng)計學(xué)方法直線相關(guān)與曲線相關(guān)〔見圖〕直線相關(guān)的關(guān)系分三種情況正相關(guān):兩列變量變動方向相同負(fù)相關(guān):兩列變量變動方向相反零相關(guān):兩列變量之間無相關(guān)相關(guān)分析的方法計量資料的相關(guān)分析方法:積差相關(guān)〔皮爾遜相關(guān)〕等級資料的相關(guān)分析方法:肯德爾和諧系數(shù)質(zhì)與量的相關(guān)分析方法:點二列相關(guān)、二列相關(guān)相關(guān)系數(shù):表示相關(guān)程度的統(tǒng)計學(xué)指標(biāo)相關(guān)系數(shù)取值于–1.00~+1.00之間。負(fù)值表示負(fù)相關(guān),正值表示正相關(guān)?!?〞表示兩個變量之間完全沒有關(guān)系,“1〞表示兩個變量之間呈現(xiàn)一對一的關(guān)系。相關(guān)系數(shù)不是等距的度量值,因此在比較時只能說絕對值大者比絕對值小者相關(guān)更密切一些。相關(guān)系數(shù)與其他統(tǒng)計量一樣也存在抽樣誤差,因此其統(tǒng)計學(xué)意義也應(yīng)進(jìn)行顯著性檢驗。555657復(fù)本信度〔alternate-formreliability〕又稱等值性系數(shù),以兩個等值但題目不同的測驗〔復(fù)本〕來測量同一群體,然后求被試者在兩個測驗得分的相關(guān),用于評價兩個測驗內(nèi)容的一致性。實施兩個測驗的間隔時間長短可能影響復(fù)本信度復(fù)本信度的計算方法同重測信度內(nèi)部一致性信度〔internalconsistencyreliability〕分半信度〔split-halfreliability〕用于評價同一測驗內(nèi)部條目抽樣的誤差。方法:將測驗條目按單雙號分為兩組,計算出兩組的得分,然后進(jìn)行相關(guān)。在同樣的情況下,信度的上下與條目數(shù)量成正比,分半信度只計算了一半條目的信度,因此要用斯皮爾曼—布朗的公式進(jìn)行校正。校正公式:rhh為兩半分?jǐn)?shù)的相關(guān)系數(shù)rxx為校正后〔原測驗長度時〕信度的估計值58舉例〔例3〕:
10名被試者在一個有10個條目的測驗中得分如下,求該測驗的分半信度?被試測驗題目得分單號得分雙號得分單雙之差1234567891012221221001761221121001004403222212111178-1410010000001105120100000013-2622122111107617221211000045-18222201101065192222211000752102211211001651合計1817131511963335048259計算計算平均值:標(biāo)準(zhǔn)差:計算分半信度〔積差相關(guān)法〕:判斷相關(guān)〔查表〕計算校正分半信度
60其它計算分半信度方法斯皮爾曼–布朗校正分半信度的公式假設(shè)兩半測驗分?jǐn)?shù)的變異相等,如實際情況不符合這一假設(shè),應(yīng)采用以下公式計算。弗朗那根〔Flanagan〕公式
Sa2和Sb2分別表示兩半測驗分?jǐn)?shù)的方差Sx2為測驗總分的方差舉例〔仍用上例〕計算Sa2=[(7-5)2+(4-5)2+(7-5)2+(1-5)2+(1-5)2+(7-5)2+(4-5)2+(6-5)2+(7-5)2+(6-5)2]/10=5.2計算Sb2=[(6-4.8)2+(4-4.8)2+(8-4.8)2+(1-4.8)2+(6-4.8)2+(6-4.8)2+(5-4.8)2+(5-4.8)2+(5-4.8)2+(5-4.8)2]/10=3.16計算Sx2=[(13-9.8)2+(8-9.8)2+(15-9.8)2+(2-9.8)2+(4-9.8)2+(13-9.8)2+(9-9.8)2+(11-9.8)2+(12-9.8)2+(11-9.8)2]/10=15.3661盧倫〔Kulon〕公式
Sd2表示兩半測驗分?jǐn)?shù)之差的方差Sx2表示測驗總分的方差舉例〔仍用上例〕計算單雙號差值〔d〕計算∑d=1計算d=∑d/N=1/10=0.2計算Sd2=[(1-0.2)2+(0-0.2)2+(-1-0.2)2+(0-0.2)2+(-2-0.2)2+(1-0.2)2+(-1-0.2)2+(1-0.2)2+(2-0.2)2+(1-0.2)2/10]=1.3662同質(zhì)性信度〔homogeneityreliability〕評價測驗內(nèi)題目間一致性〔內(nèi)容抽樣誤差〕庫德–理查遜公式〔K-R20公式〕:適用于0、1記分的測驗N為測驗題目數(shù)Pi通過某題目的人數(shù)比例qi未通過該題目的人數(shù)比例Sx2測驗總分?jǐn)?shù)的變異〔方差〕舉例〔例4〕63舉例〔例4〕:
10名被試在一個有8個條目的測驗中得分如下,求其信度?被試測驗題目得分12345678總分10000000002100000001310100000241100100035010100103611101010571111110068111111006911110101610111111118合計8765543240Pi0.80.70.60.50.50.40.30.2piqi0.160.210.240.250.250.240.210.161.7264公式:N=8p1=8/10=0.8qi=1-0.8=0.2p1q1=0.8×0.2=0.16∑piqi=p1q1+p2q2+…+pnqn=1.72Sx2=[(0-4)2+(1-4)2+(2-4)2+(3-4)2+(3-4)2+(3-4)2+(5-4)2+(6-4)2+(6-4)2+(6-4)2+(8-4)2]/10
=6.065庫德–理查遜公式〔K-R21公式〕X為測驗總分平均值Sx2測驗總分?jǐn)?shù)的變異〔方差〕舉例〔上例〕:平均值=466克倫巴赫α系數(shù):適用于各種分?jǐn)?shù)形式N為測驗題目數(shù)Si2為某一題目分?jǐn)?shù)的變異〔方差〕,∑Si2為所有題目方差之和當(dāng)題目以1、0記分時,∑Si2=∑piqi,所以rKR20公式可以當(dāng)作α系數(shù)的特例Sx2測驗總分?jǐn)?shù)的變異〔方差〕舉例〔例5〕:67舉例〔例5〕:10名被試者在一個有10個條目的測驗中得分如下,求該測驗的α系數(shù)?被試測驗題目得分得分123456789101222122100113221121001008322221211111541001000000251201000000462212211110137221211000098222201101011922222110001210221121100111平均值1.81.71.31.51.10.90.60.30.30.39.8Si20.160.410.410.450.690.490.240.210.210.213.4868公式:N=10S12=[(2-1.8)2+(2-1.8)2+(2-1.8)2+(1-1.8)2+(1-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2]/10=0.16∑Si2=3.48M=∑X/N=98/10=9.8Sx2=[(13-9.8)2+(8-9.8)2+(15-9.8)2+(2-9.8)2+(4-9.8)2+(13-9.8)2+(9-9.8)2+(11-9.8)2+(12-9.8)2+(11-9.8)2]/10=15.3669評分者信度〔scorerreliability〕評價不同評分者之間的一致性指標(biāo)〔不同評分者之間的誤差〕方法:隨機抽取假設(shè)干份測驗卷,有兩位或多位評分者按標(biāo)準(zhǔn)評分,計算每兩個評分者對同一被試答卷所評分?jǐn)?shù)之間的相關(guān)一般要求評分者之間一致性達(dá)0.9以上計算方法兩個評分者之間的一致性用皮爾遜積差相關(guān)方法或等級相關(guān)方法計算多個評分者之間的一致性:等級資料時用肯德爾和諧系數(shù)來評價公式
Ri為每一對象被評等級的總和N被評對象的人數(shù)或答卷數(shù)K評分者人數(shù)舉例〔例6〕三位專家給6篇論文評等級,結(jié)果見表,求評分者信度?70三位專家給6篇論文的評定〔例6〕專家123456124156223415523341462Ri81231417671計算公式:N=6K=3∑Ri=8+12+3+14+17+6=60∑Ri2=82+122+32+142+172+62=73872信度與測驗分?jǐn)?shù)的解釋解釋真實分?jǐn)?shù)與實得〔測驗〕分?jǐn)?shù)的關(guān)系信度系數(shù)可以用于解釋總方差中有多少比例是由真實分?jǐn)?shù)決定的。因為:Si2=S∞2+Se2,并且如果我們將總方差看成是1〔100%〕的話所以:Se2=1-rxx例如當(dāng)rxx=0.9時,我們可以說實得分?jǐn)?shù)中有90%的變異是真分?jǐn)?shù)造成,近10%的來自誤差。各種信度的可接受水平一般原那么當(dāng)信度≥0.85時,可用于對個人作評價當(dāng)0.70≤信度<0.85時,可用于對團(tuán)體作評價,但不能對個人作評價當(dāng)信度<0.7時,不能用作評價因測驗類型而異一般能力測驗要求0.9以上人格、興趣、態(tài)度等測驗要求0.80以上〔見表〕73幾種心理測驗的信度系數(shù)測驗類型信度低中高成套成就測驗0.660.920.98學(xué)術(shù)能力測驗0.560.900.97成套傾向性測驗0.460.880.96客觀人格測驗0.460.850.97興趣測驗0.420.840.93態(tài)度量表0.470.790.9874解釋個人分?jǐn)?shù)的意義測量標(biāo)準(zhǔn)誤〔SEm,SE〕測量誤差分布的標(biāo)準(zhǔn)差,用來表示誤差的大小。公式:SE=Sx√1-rxxSx分?jǐn)?shù)的標(biāo)準(zhǔn)差rxx測驗的信度舉例:WAIS-RC城市20歲組FIQ的信度為0.95,求其測量標(biāo)準(zhǔn)誤。SE=15√1-0.95=15×0.224=3.3575測量標(biāo)準(zhǔn)誤的用途確定真分?jǐn)?shù)的置信區(qū)間〔可信區(qū)間〕公式:XT=X±ZSEX為某人的具體得分Z置信區(qū)間的概率水平SE測量標(biāo)準(zhǔn)誤舉例:20歲城市男性在WAIS-RC全量表IQ為105,問95%的置信區(qū)間是多少?從上例20歲組FIQ的測量標(biāo)準(zhǔn)誤為3.35當(dāng)置信區(qū)間概率水平為95%時,Z為1.96IQ=105±1.96×3.25≈99~111比較不同測驗分?jǐn)?shù)的差異〔離散分析〕測量標(biāo)準(zhǔn)誤在評價兩個不同測驗分?jǐn)?shù)的差異是否具有統(tǒng)計學(xué)意義上的顯著性時非常重要這種比較可以是兩個人的分?jǐn)?shù)是否存在差異,也可以是同一被試的兩個測驗分?jǐn)?shù)該內(nèi)容留在智力測驗結(jié)果分析時講76有關(guān)信度評估的一些問題重測信度的間隔時間兩次測驗間隔時間的長短影響重測信度間隔多久適宜因測驗的目的、性質(zhì)和被試特點而異,一般為2~4周,最好不超過6個月。復(fù)本信度計算復(fù)本信度時,一半被試先做A本再做B本,另一半被試那么相反,由此抵消測驗順序效應(yīng)。副本的兩個測驗必須在工程的內(nèi)容、形式、數(shù)量、難度、時限、指導(dǎo)語等方面相同或相似。分半信度測量的其它方法77異質(zhì)心理學(xué)變量的測量問題對于某些復(fù)雜的、異質(zhì)的心理學(xué)變量〔如智力、人格〕,單一的測驗無法解決,可用幾個異質(zhì)的分測驗來分別測量各個方面,保持分測驗內(nèi)部的同質(zhì)性。影響信度〔相關(guān)系數(shù)〕的因素樣本團(tuán)體的異質(zhì)性假設(shè)計算信度的樣本較常模團(tuán)體樣本異質(zhì),往往會高估測驗的信度,相反那么會低估測驗的信度。這種情況可計算校正信度〔r’xx〕公式:r’xx為校正后信度系數(shù)rxx為校正前信度系數(shù)S’x為常模團(tuán)體標(biāo)準(zhǔn)差Sx為計算信度樣本的標(biāo)準(zhǔn)差78舉例:中國–韋氏幼兒智力量表VIQ重測信度為0.81,重測樣本〔N=120〕VIQ的標(biāo)準(zhǔn)差是12.72,常模團(tuán)體標(biāo)準(zhǔn)差15,求校正重測信度?79測驗的長度測驗的長度,亦即測驗條目數(shù),也是影響信度系數(shù)的一個因素。一般說來,增加同質(zhì)的條目可以提高測驗的信度。如果我們在預(yù)備試驗中道某測驗的信度,希望提高至某一水平,可以運用斯皮爾曼–布朗的公式計算出至少應(yīng)增加多少條目。公式:K指改變后長度為原長度的倍數(shù)rkk指期望到達(dá)的信度水平rxx指原信度系數(shù)舉例:中國–韋氏幼兒智力量表〔城市版〕領(lǐng)悟力分測驗有18個條目,平均分半信度為0.69。期望將其信度提高至0.80,問需要多少條目?需要條目=18×1.797≈3280效度分析定義效度〔validity〕,在心理測驗中是指所測量的與所要測量的心理特點之間吻合的程度。心理測驗的準(zhǔn)確性心理測驗的有效性〔龔耀先〕在編制或修訂心理測驗時,效度研究是必須的環(huán)節(jié),效度資料是測驗手冊里必備的測量學(xué)指標(biāo)。在使用心理測驗時,沒有效度資料的測驗也不能使用。81效度的類型與估計方法內(nèi)容效度〔content–relatedvalidity〕指測驗條目對有關(guān)內(nèi)容或行為取樣的實用性。換句話說,所選用的條目是否能測到想要測量的行為。估計方法專家判斷法請有關(guān)專家對條目進(jìn)行審定審定步驟①定義測驗總體范圍,描述相關(guān)知識與技能及所用材料的來源。②編制雙向細(xì)目表,確定各種內(nèi)容所占比例,標(biāo)出每個條目設(shè)計所測內(nèi)容?!惨姳怼尝壑贫ㄒ粋€相應(yīng)的評定量表來評價效度,如測驗包括的內(nèi)容、技能、材料的重要程度、條目對內(nèi)容的實用性等。請每位評定者對各方面進(jìn)行評價,然后總合所有評定者的評價。82高中化學(xué)標(biāo)準(zhǔn)測驗雙向細(xì)目表識記了解應(yīng)用分析綜合評估合計第一章8210第二章10621028第三章3624722第四章291265640合計525281422610083統(tǒng)計分析法計算兩個評審者之間一致性克倫巴赫推薦的方法:先編出兩個測驗復(fù)本〔取自同樣內(nèi)容范圍〕,在同一組被試中實測,然后計算其相關(guān)。再測法:學(xué)習(xí)前先測驗一次,學(xué)習(xí)后在測試一次,計算兩次相關(guān)。經(jīng)驗推測法通過實踐來檢驗如檢驗兒童開展量表的效度,觀察不同年齡階段兒童通過率是否隨年齡的增長而增加。8485測驗間的相互比較與經(jīng)典、成熟的同類測驗相比較:計算新測驗與經(jīng)典測驗之間分?jǐn)?shù)的相關(guān)。相關(guān)系數(shù)的平方即兩測驗分?jǐn)?shù)共同解釋的變異大小,又稱為相容效度〔congruentvalidity〕。區(qū)分效度〔discriminatevalidity〕:一個有效的測驗不僅應(yīng)與其他測量同一構(gòu)思的測驗成績有相關(guān),還必須與測量不同構(gòu)思的測驗成績無相關(guān),后者就是區(qū)分效度。因素分析方法〔factoranalysis〕:對一組測驗進(jìn)行因素分析,找出影響測驗分?jǐn)?shù)的共同因子,這種因素可能就是我們要測量的心理特征。用效標(biāo)效度做證明根據(jù)效標(biāo)選擇不同的被試群體,比較不同組測驗成績的差異利用心理素質(zhì)的變化關(guān)系,如兒童年齡增長與能力開展的關(guān)系。實驗法和觀察法觀察實驗前和實驗后測驗分?jǐn)?shù)的差異86效標(biāo)效度〔criterion–relatedvalidity〕效標(biāo)效度又稱實證效度,反映的是測驗預(yù)測個體在某種情景下行為表現(xiàn)的有效性程度。被預(yù)測的行為是檢驗效度的標(biāo)準(zhǔn),簡稱效標(biāo)。估計方法相關(guān)法求測驗分?jǐn)?shù)與效標(biāo)資料間的相關(guān)最常用的是積差相關(guān),根據(jù)資料的特征也可用等級相關(guān)、二列相關(guān)等方法。87區(qū)分法區(qū)分法是檢驗測驗分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法公式〔t檢驗公式〕
t檢驗統(tǒng)計量XH高分組平均值XL低分組平均值SH2高分組方差SL2低分組方差NH高分組樣本人數(shù)NL低分組樣本人數(shù)88舉例〔例7〕:用能力傾向測驗給工作成功〔N=60〕和工作失敗〔N=40〕兩組工人測試,工作成功組平均得分6.05,方差為3.31;工作失敗組平均得分4.25,方差為1.69,問兩組得分差異是否具有顯著意義?無效假設(shè):假設(shè)兩組得分的差異是由抽樣誤差所造成自由度(df)=NH+NL-2=60+40-2=98查t值表:t(0.01)=2.66,本例5.79>2.66,所以p<0.01結(jié)論:無效假設(shè)成立的概率<0.01,差異有非常顯著意義。89能力傾向測驗與工作成績的分布〔例7〕工作成績能力傾向測驗得分12345678910合計工作成功101190812375121961252411552633216413524116工作失敗314692123252231211214011合計人數(shù)1313172123965210090從t檢驗方法中可以發(fā)現(xiàn)差異顯著性與樣本大小有密切關(guān)系,當(dāng)樣本較大時,平均數(shù)之間的小差異也有顯著性,但這種差異用于區(qū)分團(tuán)體時實際價值很小。重疊計算法如果t檢驗有顯著差異,進(jìn)一步求兩個分部的重疊量,以解決上述缺點。一組〔A組〕內(nèi)被試超出另一組〔B組〕平均值的人數(shù)與該組〔B組〕內(nèi)部平均值以上人數(shù)之比。如果該比例越低,說明兩組差異越大。舉例:前例中以6分為界,失敗組有7人≥6分,而成功組有38人≥6分,其比例為7/38。計算兩組分布共同區(qū)的百分比,重疊量越大,說明分?jǐn)?shù)差異越小,測驗效度越差。舉例:前例中兩組分布重疊范圍從2~7分,共86%的人分布在此區(qū)域。91命中率法用測驗結(jié)果作為取舍依據(jù)時,用其正確決定的比例作為效度指標(biāo)的一種方法。計算命中率時除有測驗分?jǐn)?shù)外,還需具備某種效標(biāo)資料。效標(biāo)成績測驗預(yù)測失敗〔-〕成功〔+〕成功〔+〕〔A〕失誤〔B〕命中失敗〔-〕〔C〕命中〔D〕失誤命中率計算總命中率(PCT)=命中/(命中+失誤)=(B+C)/(A+B+C+D)正命中率(PCP)=測驗與效標(biāo)皆成功人數(shù)/測驗成功人數(shù)=B/(A+B)舉例:上例測驗成績以≥6分為界,工作成績以≥4分為界。A=22,B=38,C=33,D=7總命中率(PCT)=(38+33)/(22+38+33+7)=71%正命中率(PCP)=38/(22+38)=63%92效度意義確實定預(yù)測誤差決定性系數(shù)效度系數(shù)的實際意義常常以決定性系數(shù)來表示,即相關(guān)系數(shù)的平方,它表示測驗正確預(yù)測或解釋的效標(biāo)的方差占總方差的比例。舉例:高考英語成績與入大學(xué)后第1學(xué)年英語課考試成績的相關(guān)為0.6。估計的標(biāo)準(zhǔn)誤〔Sest〕:指預(yù)測效度分?jǐn)?shù)時預(yù)測誤差大小的估計值。Sest=SDy√1-r2xySDy效標(biāo)成績的標(biāo)準(zhǔn)差r2xy效度系數(shù)的平方,即決定性系數(shù)預(yù)測誤差的判斷與信度一樣,當(dāng)r2xy=1.0時,效度完美,估計標(biāo)準(zhǔn)誤也為0,測驗分?jǐn)?shù)可完全代表效標(biāo)。當(dāng)r2xy=0時,測驗分?jǐn)?shù)完全不能代表效標(biāo)。93預(yù)測效標(biāo)分?jǐn)?shù)的可信區(qū)間估計標(biāo)準(zhǔn)誤可用于估計真正效標(biāo)分?jǐn)?shù)的可信區(qū)間。公式:YT=Y±ZSestY為某人的具體得分Z置信區(qū)間的概率水平Sest估計標(biāo)準(zhǔn)誤舉例:某腦外傷病人在WAIS-RC中的事前智力〔全量表〕為105,該計算〔回歸〕方法的效度系數(shù)為0.625,問該病人病前全量表智商的95%可信區(qū)間是多少?計算估計標(biāo)準(zhǔn)誤〔Sest〕Sest=SDy√1-r2xy計算病前智力的可信區(qū)間94預(yù)測效標(biāo)分?jǐn)?shù)如果X與Y兩變量呈直線相關(guān),只要確定出二者的回歸方程,就可以從一個變量推估出另一個變量。一般常從測驗分?jǐn)?shù)來預(yù)測效標(biāo)成績公式〔回歸方程〕:為預(yù)測的效標(biāo)分?jǐn)?shù)A為縱軸的截距,用來糾正平均數(shù)的差異Byx為斜率,Y向X回歸的系數(shù)X為測驗分?jǐn)?shù)計算byx和a的公式byx=rxy×Sy/Sxrxy為測驗分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)Sy和Sx為效標(biāo)分?jǐn)?shù)與測驗分?jǐn)?shù)的標(biāo)準(zhǔn)差a=Y-byxXY為效標(biāo)分?jǐn)?shù)的平均值,X為測驗分?jǐn)?shù)的平均值95舉例〔前例〕:用能力傾向測驗預(yù)測工作績效,該組平均測驗分?jǐn)?shù)為5.35分,標(biāo)準(zhǔn)差1.80分;平均績效分?jǐn)?shù)為4.28分,標(biāo)準(zhǔn)差1.89分;測驗分與績效分的相關(guān)系數(shù)為0.68,計算其回歸方程?計算byx=rxy×Sy/Sxrxy=0.68Sy=1.89Sx=1.80byx=0.68×1.89/1.80=0.714計算a=Y-byxXY=4.28X=5.35a=4.28-0.714×5.35=0.46回歸方程:應(yīng)用舉例:某人能力傾向測驗得分為6分,求績效分?96預(yù)測效率指數(shù)前面公式-25中的稱作無關(guān)系數(shù),以K表示。K值大小說明預(yù)測源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無關(guān)的程度無關(guān)系數(shù)公式:預(yù)測效率指數(shù)〔E〕=100(1-K)E值的大小說明使用測驗比盲目猜測能減少多少誤差舉例:一個測驗的效度系數(shù)為0.80,其預(yù)測效率指數(shù)為多少?說明使用測驗比盲目猜測減少40%的誤差也說明測驗預(yù)測誤差僅為隨機誤差的60%97信度和效度的關(guān)系信度和效度的差異在于所涉及的誤差不同信度考慮的是隨機誤差的影響效度那么還包括測驗穩(wěn)定的測量誤差〔系統(tǒng)誤差〕信度是效度的必要條件而非充分條件〔見圖〕一個高效度的測驗,其信度必然也高;一個高信度的測驗,其效度不一定高。效度受信度的制約效度與信度的關(guān)系式:rxy≤√rxxrxy效度系數(shù)rxx信度系數(shù)98效度分析的本卷須知要求內(nèi)容效度的測驗,不一定要求測驗為同質(zhì)的。測量單一心理特質(zhì)的測驗要求測驗條目有高度的同質(zhì)性測量一組不同心理特質(zhì)的成套量表,不要求各分測驗之間具有同質(zhì)性。不同類型的測驗對外表效度的要求是不同的外表效度是指測驗使用者或被試在主觀認(rèn)識上覺得有效需要被試者在測驗中盡最大努力的測驗要求較高的外表效度需要被試這盡可能按自己實際情況答復(fù)的測驗要求較低的外表效度99設(shè)想效度的建立先從某一理論出發(fā),設(shè)計相應(yīng)的分測驗和條目,然后要驗證測驗結(jié)果與假設(shè)的符合程度。設(shè)想效度常用相關(guān)和因素分析方法來驗證以人格測驗為例:人格包括幾個特質(zhì),內(nèi)容是什么?人格特質(zhì)是相對穩(wěn)定的兒童時期的遭遇對人格的形成有著巨大的影響檢驗效標(biāo)效度的難點在于找到適宜的效標(biāo)效標(biāo)能夠最有效地反映測驗的目標(biāo)效標(biāo)具有較高的信度,穩(wěn)定可靠效標(biāo)可以被客觀地測量效標(biāo)測量的方法簡單、實用。100影響測驗效度的因素測驗取材必須具有代表性設(shè)計題目時盡量防止容易引起誤差的題型〔如是非題〕題目難度適中,具有較高的區(qū)分度;測驗長度恰當(dāng),具有一定的題量;測題的排列按先易后難的次序。使用積差相關(guān)評估效度時,應(yīng)注意測驗分?jǐn)?shù)與效標(biāo)之間是否為線性關(guān)系。101工程分析測驗的工程分析定性分析和定量分析定性分析:測驗的內(nèi)容效度、題目編寫的恰當(dāng)性和有效性定量分析:對題目的難度和區(qū)分度進(jìn)行分析工程分析的目的是:通過選擇和修改測驗題目,提高測驗的信度和效度。102工程的難度分析難度〔difficulty〕,指工程的難易程度,能力測驗中一個重要的指標(biāo)。在人格測驗中,類似的指標(biāo)是“通俗性〞。即取自相同總體樣本中,能在答案方向上答復(fù)該題的人數(shù)。兩種指標(biāo)的計算方法是相同的103難度的計算二分法記分的工程〔1、0記分〕公式〔通過率〕:P=R/N×100%P指工程的難度〔通過率〕R答對或通過該工程的人數(shù)N全體被試人數(shù)舉例〔前例4〕:第一題10名被試中8人答對,其難度為:P1=8/10×100%=80%104舉例〔例4〕:
10名被試在一個有8個條目的測驗中得分如下,求各題難度?被試測驗題目得分12345678總分10000000002100000001310100000241100100035010100103611101010571111110068111111006911110101610111111118合計8765543240Pi(%)807060505040302040105樣本例數(shù)較大時的計算方法根據(jù)測驗總成績將被試分為三組高分組〔NH〕:分?jǐn)?shù)最高的27%中間組:分?jǐn)?shù)居中的46%低分組〔NL〕:分?jǐn)?shù)最低的27%計算高分和低分組的通過率計算兩組平均通過率作為難度指標(biāo)公式:P=(PH+PL)/2P指難度〔通過率〕PH指高分組通過率PL指低分組通過率舉例:某測驗條目高分組通過率為85%,中間組通過率為52%,低分組通過率為35%,問平均通過率是多少?106吉爾福特的難度校正公式因為選擇題易受到猜測的影響,備選答案越少,機遇的作用越大,越不能反映真實難度,吉爾福特的校正公式用于對此進(jìn)行校正。公式:CP校正后通過率P校正前通過率K備選答案數(shù)目舉例:上題假設(shè)為5選1的題型,請計算校正后的通過率?
107非二分記分工程的難度計算公式:X指全體被試在該題上的平均得分Xmax為該題的總分值舉例〔前例5〕:計算難度〔通過率〕第一題平均得分1.8分,最高分2分,通過率:P1=1.8/2.0×100%=90108舉例〔例5〕:10名被試者在一個有10個條目的測驗中得分如下,求該測驗各條目的難度?被試測驗題目得分得分123456789101222122100113221121001008322221211111541001000000251201000000462212211110137221211000098222201101011922222110001210221121100111平均1.81.71.31.51.10.90.60.30.30.39.8難度0.90.850.650.750.550.450.30.150.150.150.49109難度水平確實定進(jìn)行難度分析的目的是為了篩選條目,工程難度多高適宜,取決于測驗的目的、性質(zhì)及工程的形式。一般而言,難度〔通過率〕在0.5時,區(qū)別力最高,對信度和效度影響最好。在能力測驗中,為了使盡可能少的人在測驗中得0分或得總分值,因此必須安排很容易的工程和很難的工程,但測驗的平均通過率最好控制在0.5水平。110測驗的難度測驗的難度取決于組成測驗工程的難度通過觀察測驗分?jǐn)?shù)的分布,可以進(jìn)行直觀檢驗。如果測驗難度適中,分?jǐn)?shù)的分布應(yīng)當(dāng)接近常態(tài)分布;如果測驗偏難,分布呈正偏態(tài)〔圖13-4,A〕如果測驗偏容易,分布呈負(fù)偏態(tài)〔圖13-4,B〕測驗偏難或便容易時,可以通過增加或減少不同難易程度的條目來解決。某些測驗〔如標(biāo)準(zhǔn)參照測驗〕允許測驗分?jǐn)?shù)呈偏態(tài)分布。111工程的區(qū)分度工程區(qū)分度〔itemdiscrimination〕也叫鑒別力,是指測驗工程對被試者的心理特征的區(qū)分能力。高區(qū)分度條目:實際水平高者能通過,實際水平低者不能通過。區(qū)分度的計算方法鑒別指數(shù)相關(guān)法112鑒別指數(shù)鑒別指數(shù)計算步驟按測驗總分依次排列確定高分組和低分組高分組:排序最高的27%的被試低分組:排序最低的27%的被試分別計算高分組與低分組在每個工程上的通過率公式:D=PH-PLD指鑒別指數(shù)PH高分組在某工程上的通過率PL低分組在某工程上的通過率舉例〔例8〕113例8:32名被試在4個工程的得分被試題1題2題3題4總分被試題1題2題3題4總分11111417110022111141810102311114191100241111420011025101132111002611103221000171110323010018110132410001911103250100110110132600101111110327100011211002280100113101022900000141001230000001511002310000016011023200000114計算鑒別指數(shù)按總分排序確定高、低分組分組人數(shù)=32×0.27≈9人高分組:1~9號低分組:24~32號分別計算高、低分組在1~4題的通過率P1H=9÷9=1.00P1L=2÷9=0.22P2H=8÷9=0.89P2L=2÷9=0.22P3H=8÷9=0.89P3L=1÷9=0.11P4H=6÷9=0.67P4L=0÷9=0.00分別計算各題鑒別指數(shù)D1=1.00-0.22=0.78D2=0.89-0.22=0.67D3=0.89-0.11=0.78D4=0.67-0.00=0.67115鑒別指數(shù)的判斷因為高分組條目總得分上高于低分組,理論上他們每個條目的通過率也要高于低分組。D>0時,D越大,說明該條目區(qū)分兩種水平〔組〕的能力越強D<0那么反映高分組的得分反而低于低分組,說明該條目有問題。伊貝爾〔L.Ebel,1965〕關(guān)于鑒別指數(shù)評價工程性能的標(biāo)準(zhǔn):鑒別指數(shù)〔D〕工程評價0.40以上很好0.30~0.39良好,修改后會更佳0.20~0.29尚可,但需修改0.19及以下差,必須淘汰116相關(guān)法計算區(qū)分度常用的方法是相關(guān)法,即以某一條目得分與效標(biāo)成績或測驗總分進(jìn)行相關(guān)運算。相關(guān)系數(shù)越高,說明該條目越具有區(qū)分功能。常用于工程分析的相關(guān)方法點二列相關(guān)二列相關(guān)Ф相關(guān)117點二列相關(guān)適用于一類變量為二分變量,另一類變量為連續(xù)變量的相關(guān)計算。公式:rpq點二列相關(guān)系數(shù)為與二分變量通過組相對應(yīng)的連續(xù)變量的平均數(shù)為與二分變量未通過組相對應(yīng)的連續(xù)變量的平均數(shù)St為連續(xù)變量的標(biāo)準(zhǔn)差p通過組人數(shù)與總?cè)藬?shù)之比〔通過率〕q未通過組人數(shù)與總?cè)藬?shù)之比〔未通過率〕舉例〔例9〕:118例9:15名學(xué)生的測驗情況學(xué)生總分項目分學(xué)生總分項目分190195502810105003801114914781124205771133516701143107691151008650∑X88258.8119公式:計算p=8/15=0.53計算Xp=(90+80+78+77+70+69+49+35)/8=68.5計算q=1-p=0.47計算Xq=(81+65+55+50+42+31+10)/7=47.7計算St=22.48計算df=N-2=15-2=13查表:當(dāng)df=13時,r0.05(13)=0.514判斷:r=0.462∵r<0.514∴p>0.05120二列相關(guān)適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類。公式:rb為二列相關(guān)系數(shù)y為p與q交界處正態(tài)曲線的高度Xp、Xq、St、p、q的意義與點二列相關(guān)公式相同當(dāng)兩個變量均為連續(xù)變量時,也可使用皮爾遜積差相關(guān)方法計算。舉例:〔例9〕121公式:二列相關(guān)系數(shù)的顯著性檢驗公式:N為總?cè)藬?shù)舉例〔上例〕:Z值小于1.96,p大于0.05,無顯著相關(guān)。122Ф相關(guān)此種相關(guān)適用于兩個變量均為二分稱名變量〔計數(shù)資料〕公式:式中a、b、c、d分別代表四格表中第一、二、三、四項中所包含的次數(shù)。舉例〔例10〕:求成功通過能力傾向測驗〔以6分為界〕與工作成功與否之間的相關(guān)?a=22、b=38、c=33、d=7顯著性檢驗:用卡方〔X2〕檢驗方法123能力傾向測驗與工作成績的分布〔例10〕工作成績能力傾向測驗得分12345678910合計工作成功101190812375121961252411552633216413524116工作失敗314692123252231211214011合計人數(shù)13131721239652100124區(qū)分度與難度的關(guān)系區(qū)分度與難度呈現(xiàn)的是一種曲線〔倒“U〞的關(guān)系〕。難度為0.5時,區(qū)分度最高難度較高或較低時,區(qū)分度中等非常高或非常低的難度時,區(qū)分度也很低不同水平被試中區(qū)分度與難度的關(guān)系較難的題目對高水平被試有較高的區(qū)分度中等難度的題目對中水平被試有較高的區(qū)分度較容易的題目對低水平被試有較高的區(qū)分度平均難度0.5左右,能保持整體較好的區(qū)分度。125D的最大值與工程難度的關(guān)系項目通過率理論上最大區(qū)分度(以總分對半劃分高、低分組時)高分組通過率低分組通過率D的最大值1.001.01.00.000.901.00.80.200.801.00.60.400.701.00.40.600.601.00.20.800.501.00.01.000.400.80.00.800.300.60.00.600.200.40.00.400.100.20.00.200.000.00.00.00126本卷須知當(dāng)測驗用于選拔或診斷時,應(yīng)該多項選擇擇難度值接近錄取率的工程。測驗為選擇題時,難度值應(yīng)大于隨機猜測概率水平。難度等于概率水平,說明題目可能太難;或題意不清,被試憑猜測作答。難度〔通過率〕低于概率水平,說明題目有系統(tǒng)偏差。是非題難度值0.75時最適宜,四選一題目0.63時最適宜。127題目難度在0.3~0.7之間,平均難度0.5時,測驗具有較理想的區(qū)分度。理論上講每個單題難度在0.5時具有最好的鑒別效率。同質(zhì)的題目難度在0.5時,相關(guān)有偏高的趨勢。在極端的例子中,如果相關(guān)為1.0,難度均為0.5,那么50%的人全通過,另50%的人全不通過,區(qū)分效率反而下降。區(qū)分度取值在-1.0~+1.0之間。區(qū)分度為負(fù)值:題目不行區(qū)分度為正值:越接近1說明區(qū)分度越好,越接近0說明區(qū)分度越差。128工程分析實例4個四選一的題目,給370例有代表性的被試實施。分析步驟總分排序:取高分者27%〔100人〕為高分組,取低分者27%〔100人〕為低分組。計算高分組和低分組各題的通過率,以PH和PL表示。求出各題的難度和區(qū)分度〔鑒別指數(shù)和相關(guān)〕比較各種指標(biāo)根據(jù)工程分析結(jié)果剔除、修改或增加題目。129工程分析實例題號組別選答人數(shù)正確答案難度P區(qū)分度ABCD未答rbD1高分組592120B0.710.520.42低分組2250121602高分組581015161A0.420.330.32低分組2621153623高分組1715282812D0.31-0.04-0.06低分組25111934114高分組14414365C0.120.080.04低分度總體偏難,但根本可以接受區(qū)分度第一題最好第二題可以第三題二列相關(guān)系數(shù)和鑒別指數(shù)均為負(fù),不行第四題二列相關(guān)系數(shù)和鑒別指數(shù)均偏低答復(fù)選擇第一、二題根本可以,后者答案C無鑒別力。第三題未做人數(shù)多,且B、C、D均為負(fù)相,差。第四題選A人少,可能答案缺乏似真性,D項也有負(fù)相,不理想。結(jié)論第一、二題保存第三題剔除第四題可以修改后再用131第三節(jié)
測驗結(jié)果的解釋132智力測驗的一般原那么及解釋舉例分析的內(nèi)容測驗中行為的分析判斷測驗有效與否測驗過程中特殊行為的含義測驗分?jǐn)?shù)的分析133測驗分?jǐn)?shù)的分析步驟〔提綱〕與常??傮w的比較分測驗量表分與常模的比較IQ的功能和百分位IQ的分等測驗分?jǐn)?shù)的可信區(qū)間與其他人的測驗結(jié)果比較被試自身強弱點分析分量表的平衡性〔V–P差異〕各分測驗的差異分測驗與平均分的差異134測驗結(jié)果與常??傮w的比較分測驗量表分與常模的比較各分測驗單獨測量的能力多個分測驗聯(lián)合測量的能力135136137138WAIS-RC三因子模型言語理解因子知覺
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國電火花石墨市場調(diào)查研究報告
- 2025━2030年中國機繡睡袍項目投資可行性研究報告
- 2025屆山東省聊城市高三一模數(shù)學(xué)試題(原卷版+解析版)
- 2024年中國有源電纜(AECs)行業(yè)市場規(guī)模及發(fā)展前景研究報告(智研咨詢)
- 中職高考數(shù)學(xué)二輪復(fù)習(xí)專項突破練習(xí)專題21 向量的幾何運算和坐標(biāo)運算(含答案)
- 頸椎病護(hù)理個案匯報
- 自行車等代步設(shè)備零售企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 未來家園拖拉夢行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 陜西省咸陽市2024-2025學(xué)年高一下學(xué)期開學(xué)檢測語文試題
- 智能照明產(chǎn)品行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 加強物料提升機施工現(xiàn)場安全管理
- 第15課《我是記憶小能手》課件
- 重癥肺炎護(hù)理查房文獻(xiàn)參考
- 小紅書經(jīng)典營銷案例分析
- 企業(yè)戰(zhàn)略與績效管理
- 虛擬貨幣交易合同
- 操作系統(tǒng)課程設(shè)計報告
- 靜脈輸液的不良反應(yīng)及處理原則考核試題及答案
- 檔案袋密封條格式范本(可直接打印,可自行編輯)
- 2022年深圳市南山區(qū)教育系統(tǒng)招聘公辦幼兒園園長考試真題
- 2023年全國《軍事理論》教育知識競賽試題與答案
評論
0/150
提交評論