版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
心理測(cè)驗(yàn)技能
〔心理咨詢師〕1第一節(jié)
測(cè)驗(yàn)量表的分?jǐn)?shù)與常模2統(tǒng)計(jì)學(xué)根本知識(shí)總體、樣本與個(gè)體總體具有某種特征的一類事物的全體〔母體〕總體的特征無(wú)法進(jìn)行一一測(cè)量,只能通過(guò)樣本來(lái)推測(cè)。個(gè)體構(gòu)成總體的每一個(gè)單元個(gè)體特征可以測(cè)量,但因其隨機(jī)性太大,常常不能準(zhǔn)確地反映總體的特征。樣本構(gòu)成總體的一個(gè)部份,常用“n〞或“N〞來(lái)表示??梢员粶y(cè)量,常將其特征來(lái)代表總體特征。樣本從總體中抽出,存在抽樣誤差,某些抽樣誤差可以控制,但隨機(jī)誤差不能控制。。在心理統(tǒng)計(jì)中,n≤30稱為小樣本,n>30稱為大樣本。3次數(shù)、頻率和概率次數(shù)〔頻數(shù)〕指某一事件出現(xiàn)的回〔次〕數(shù)簡(jiǎn)單計(jì)數(shù),常用f來(lái)表示。頻率指相對(duì)次數(shù),所觀察發(fā)生某一事件與總體事件的比率,常用%來(lái)表示。概率又稱機(jī)〔會(huì)〕率,用P來(lái)表示。估計(jì)概率和真實(shí)概率估計(jì)概率:由一定數(shù)量的觀察中得到頻率真實(shí)概率:事物真實(shí)發(fā)生的頻率當(dāng)觀察數(shù)量無(wú)限增大時(shí),估計(jì)概率越接近真實(shí)概率。概率〔P〕=f/N4統(tǒng)計(jì)量〔特征數(shù)〕反映一組數(shù)據(jù)統(tǒng)計(jì)特征的數(shù)字例:3組20歲男性的體重〔公斤〕1組:45、50、55、58、60、60、62、65、70、752組:50、55、55、60、60、60、60、65、65、703組:40、45、50、55、60、60、65、70、75、80常用的統(tǒng)計(jì)量反映數(shù)據(jù)集中性質(zhì)或集中程度〔平均數(shù)、中位數(shù)等〕反映數(shù)據(jù)離中〔離散〕性質(zhì)或離中〔離散〕程度〔標(biāo)準(zhǔn)差、方差、全距等〕反映兩種特征之間的關(guān)系〔相關(guān)系數(shù)〕56方差和標(biāo)準(zhǔn)差反映數(shù)據(jù)離中〔離散〕趨勢(shì)的兩種指標(biāo)。英文variance〔方差〕用S2或σ2來(lái)表示;standarddeviation〔標(biāo)準(zhǔn)差〕,用S或SD來(lái)表示,亦可用σ表示。對(duì)離中趨勢(shì)進(jìn)行度量的意義全面反映事物的面貌:平均值只反映了事物的典型情況,標(biāo)準(zhǔn)差可反映事物的特殊性。判斷集中量數(shù)〔如平均值〕的代表性:在一組數(shù)據(jù)中,離中趨勢(shì)越小,集中趨勢(shì)量數(shù)的代表性就越好,相反就越差。7根本公式方差計(jì)算公式S2=∑(Xi-X)2/NXi為每個(gè)數(shù)據(jù),從X1、X2……Xn(Xi-X)為離均差(Xi-X)2為離均差平方∑(Xi-X)2為離均差平方和N為數(shù)據(jù)的個(gè)數(shù)標(biāo)準(zhǔn)差計(jì)算公式S=√S28計(jì)算舉例〔上例1組〕S12=[(45-60)2+(50-60)2+(55-60)2+(58-60)2+(60-60)2+(60-60)2+(62-60)2+(65-60)2+(70-60)2+(75-60)2]/10=70.8S1=√70.8=8.41例:3組20歲男性的體重〔公斤〕MSD1組:45、50、55、58、60、60、62、65、70、7560?2組:50、55、55、60、60、60、60、65、65、7060?3組:40、45、50、55、60、60、65、70、75、8060?9例:3組20歲男性的體重〔公斤〕計(jì)算結(jié)果〔平均值與標(biāo)準(zhǔn)差〕 MSD1組:45、50、55、58、60、60、62、65、70、75608.412組:50、55、55、60、60、60、60、65、65、70605.483組:40、45、50、55、60、60、65、70、75、806012.251011正態(tài)分布正態(tài)分布又稱常態(tài)分布,統(tǒng)計(jì)學(xué)中一種重要的理論分布,在自然界、人類社會(huì)、心理與教育中大量的現(xiàn)象和特征均按正態(tài)的形式分布,如能力、人格特征、學(xué)習(xí)成績(jī)、社會(huì)態(tài)度、行為表現(xiàn)以及身高、體重等。正態(tài)分布曲線1213正態(tài)分布的特點(diǎn)正態(tài)分布的形式是對(duì)稱的正態(tài)分布曲線的兩端與基線趨于無(wú)窮遠(yuǎn),但不會(huì)相交。正態(tài)分布曲線與基線之間的面積等于1〔100%〕,代表了總體事件。從正態(tài)分布曲線的最高點(diǎn)作垂直線,形成正態(tài)分布的中軸,將面積分為相等的兩半,各占50%。平均值位于正態(tài)分布的中軸上。正態(tài)分布曲線下各對(duì)應(yīng)的橫坐標(biāo)〔即標(biāo)準(zhǔn)差〕處與平均數(shù)之間的面積可用積分公式計(jì)算,也可查正態(tài)分布表獲得。正態(tài)分布曲線下,標(biāo)準(zhǔn)差與概率〔面積〕之間的關(guān)系舉例:平均值±〔加減〕Z個(gè)SD,包含A%的面積〔概率〕平均值±〔加減〕1個(gè)SD,包含68.26%的面積〔概率〕平均值±〔加減〕1.96個(gè)SD,包含95%的面積〔概率〕平均值±〔加減〕2.58個(gè)SD,包含99%的面積〔概率〕平均值±〔加減〕2個(gè)SD,包含95.45%的面積〔概率〕平均值±〔加減〕3個(gè)SD,包含99.73%的面積〔概率〕14正態(tài)分布理論在心理測(cè)驗(yàn)的應(yīng)用化等級(jí)評(píng)定為測(cè)量數(shù)據(jù)測(cè)定題目的難易度利用正態(tài)分布將原始分轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)分在評(píng)定時(shí)確定人數(shù)〔概率〕15量表分?jǐn)?shù)的轉(zhuǎn)換開(kāi)展常模分?jǐn)?shù)的計(jì)算及解釋許多心理特質(zhì)是隨時(shí)間〔年齡〕變化而開(kāi)展的。將被測(cè)者的成績(jī)與各種開(kāi)展水平人群平均表現(xiàn)相比較,這種常模即開(kāi)展常模,該量表亦稱年齡量表。開(kāi)展順序量表測(cè)驗(yàn)條目〔能力或行為〕按出現(xiàn)的早晚排列,完成該條目說(shuō)明到達(dá)相應(yīng)的年齡水平。葛塞爾嬰幼兒發(fā)育量表:包括運(yùn)動(dòng)水平、適應(yīng)性、語(yǔ)言、社會(huì)性四個(gè)方面。16智力年齡一個(gè)人在采用年齡量表方式編制的智力測(cè)驗(yàn)上得到的分?jǐn)?shù),簡(jiǎn)稱智齡。計(jì)算方法每個(gè)條目代表一定的年〔月〕齡,將所通過(guò)的條目折算出月齡,然后相加計(jì)算出智力年齡。如比內(nèi)量表。以標(biāo)準(zhǔn)化樣本每個(gè)年齡組平均原始分?jǐn)?shù)作為常模,被試者從測(cè)驗(yàn)中得到原始分?jǐn)?shù)與其比較,從而確定智齡。比內(nèi)量表智齡計(jì)算舉例計(jì)算公式IQ=MA〔心理年齡〕/CA〔實(shí)足年齡〕×100計(jì)算舉例〔例1〕17心理年齡的分?jǐn)?shù)計(jì)算確定起始年齡起點(diǎn):從實(shí)際年齡低1歲組開(kāi)始測(cè)驗(yàn)回頭測(cè)試原那么:假設(shè)被試在某類型條目失敗時(shí),需回頭做低年齡組的類似條目,直至成功通過(guò)為止。確定最高年齡:某年齡組6個(gè)條目均失敗時(shí)停止繼續(xù)原那么:盡管已確定止點(diǎn),但該年齡段不含某類型條目,此時(shí)應(yīng)繼續(xù)做高年齡組的類似條目,直至失敗為止。確定心理年齡2~5歲組的條目,每通過(guò)1條獲得1個(gè)月心理年齡;6~SAⅠ組的條目,每通過(guò)1條獲得2個(gè)月心理年齡;SAⅡ組的條目,每通過(guò)1條獲得5個(gè)月心理年齡;SAⅢ組的條目,每通過(guò)1條獲得6個(gè)月心理年齡;起始年齡以下的條目,假定被試完全通過(guò),獲得相應(yīng)的心理年齡。18舉例〔例1〕:某10歲兒童心理年齡的計(jì)算年齡水平通過(guò)的測(cè)驗(yàn)數(shù)目每項(xiàng)測(cè)驗(yàn)得到的月數(shù)全部得分年月8歲6(起始年齡)—8—9歲521010歲621211歲521012歲3(在5個(gè)測(cè)驗(yàn)中)2.47.213歲22414歲122AA122SAⅠ00SAⅡ155SAⅢ0(最高年齡)60總分852.2心理年齡(MA)12歲4月2天19百分位常模分?jǐn)?shù)的計(jì)算及解釋百分位常模包括百分等級(jí)、百分點(diǎn)、四分位數(shù)和十分位數(shù)。百分等級(jí)百分等級(jí)是應(yīng)用最廣泛的表示測(cè)驗(yàn)分?jǐn)?shù)的方法百分等級(jí)指出的是個(gè)體在常模團(tuán)體中所處的位置百分等級(jí)的計(jì)算未分組資料
PR=100-(100R-50)/NR指某人原始分排列的順序數(shù)N指樣本總?cè)藬?shù)舉例:小東在30名同學(xué)中語(yǔ)文成績(jī)是80分,排列第5名,其百分等級(jí)多少?
PR=100-(100×5-50)/30=8520分組的資料PR=100/N[(x-l)fp/h+cf]x指任意原始分?jǐn)?shù)l指該原始分?jǐn)?shù)所在組的精確下限fp指該分?jǐn)?shù)所在組的頻數(shù)cf指以下的累計(jì)頻數(shù)h指分組的組間距舉例〔例2〕現(xiàn)有164人患某種沙門氏菌食物中毒潛伏期的資料〔見(jiàn)表〕,某人出現(xiàn)中毒病癥的潛伏期是38小時(shí),求其所處百分等級(jí)?21頻數(shù)表〔例2〕潛伏期(小時(shí))頻數(shù)累計(jì)頻數(shù)累計(jì)百分?jǐn)?shù)72~1164100.0060~516399.3948~1215896.3436~2314689.0224~4012375.0012~588350.610~252515.2422計(jì)算步驟公式:PR=100/N[(x-l)fp/h+cf]N=164x=38l=36fp=23h=12cf=123PR=100/164[(38-36)23/12+123]PR=100/164×126.83PR=77.3423百分點(diǎn)百分點(diǎn)用于計(jì)算處于某一百分比例的人相對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)是多少計(jì)算方法〔直線內(nèi)插法〕舉例:高考的最高分為695,其百分等級(jí)為100,最低分為103分,百分等級(jí)為1,求百分等級(jí)80所對(duì)應(yīng)的分?jǐn)?shù)是多少?公式:C指上限百分等級(jí)SC上限百分等級(jí)對(duì)應(yīng)的分?jǐn)?shù)F指下限百分等級(jí)SF下限百分等級(jí)對(duì)應(yīng)的分?jǐn)?shù)X百分等級(jí)PP根據(jù)百分等級(jí),要求的對(duì)應(yīng)分?jǐn)?shù)24計(jì)算部驟〔因式分解〕20/(695-PP)=79/(PP-103)79(695-PP)=20(PP-103)〔等號(hào)兩側(cè)交叉相乘〕54905-79PP=20PP-206054905+2060=20PP+79PP56965=99PPPP=56965/99PP=575.425四分位數(shù)和十分位數(shù)四分位數(shù)和十分位數(shù)只是百分位數(shù)〔百分等級(jí)〕的兩個(gè)變式。舉例百分位數(shù)〔百分等級(jí)〕:將量表分成100等份四分位數(shù):將量表分4等份,1~25%、26~50%、51~75%和76~100%四段。十分位數(shù):將量表分成10份,1~10%為第一段,91~100%為第十段。26標(biāo)準(zhǔn)分的計(jì)算及解釋標(biāo)準(zhǔn)分是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來(lái)的量表。標(biāo)準(zhǔn)分的根本單位是標(biāo)準(zhǔn)差。常見(jiàn)的標(biāo)準(zhǔn)分?jǐn)?shù)有z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商〔IQ〕等。根據(jù)轉(zhuǎn)換方式的不同,標(biāo)準(zhǔn)分可分為:線性轉(zhuǎn)換的標(biāo)準(zhǔn)分:z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分:z’分?jǐn)?shù)當(dāng)原始分不成常態(tài)分布,需進(jìn)行轉(zhuǎn)換使之成為常態(tài)分布轉(zhuǎn)換方法〔百分等級(jí)法〕對(duì)每個(gè)原始分計(jì)算累計(jì)百分比在常態(tài)曲線面積表中,求出對(duì)應(yīng)于該百分比的z分?jǐn)?shù)轉(zhuǎn)換后的z分?jǐn)?shù)稱為z’分?jǐn)?shù)27常見(jiàn)的標(biāo)準(zhǔn)分形式根本形式z分:z=(X–X)/SDX為任一原始分X為樣本平均數(shù)SD為樣本標(biāo)準(zhǔn)差常用標(biāo)準(zhǔn)分Z分?jǐn)?shù)Z=A+BzA為量表的平均數(shù)〔根據(jù)需要指定的常數(shù)〕B為量表的標(biāo)準(zhǔn)差〔根據(jù)需要指定的常數(shù)〕z為根本形式的z分舉例:韋氏智力量表智商的平均值為100(A),標(biāo)準(zhǔn)差為15(B)。某人的全量表分高于常模1個(gè)標(biāo)準(zhǔn)差,問(wèn)其FIQ應(yīng)為多少?115(IQ)=100+15×128T分?jǐn)?shù)T分?jǐn)?shù)由麥克爾于1939年提出,有紀(jì)念推孟和桑代克之意T分?jǐn)?shù)目前表示任何常態(tài)化和非常態(tài)化的轉(zhuǎn)換標(biāo)準(zhǔn)系統(tǒng),量表分平均值固定為50,量表分標(biāo)準(zhǔn)差固定為10。許多人格問(wèn)卷均采用T分量表,如MMPI、EPQT=50+10(X–X)/SD或T=50+10z50(A)為T分?jǐn)?shù)〔量表分〕的平均值10(B)為T分?jǐn)?shù)〔量表分〕的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)九分1~9分的九級(jí)分?jǐn)?shù)量表,平均值為5、標(biāo)準(zhǔn)差為2。標(biāo)準(zhǔn)9分=5+2(X–X)/SD或標(biāo)準(zhǔn)9分=5+2z29標(biāo)準(zhǔn)九分和常態(tài)曲線面積的關(guān)系以及與平均數(shù)的距離標(biāo)準(zhǔn)九分本段面積累加面積本段中值與平均點(diǎn)距離94%100%大于2.0SD87%96%1.5SD712%89%1.0SD617%77%0.5SD520%60%0SD417%40%0.5SD312%23%1.0SD27%11%1.5SD14%4%大于2.0SD3031智商的計(jì)算及其意義最早的比內(nèi)–西蒙量表用心理年齡來(lái)表示智力的上下測(cè)驗(yàn)題目的安排完全按難度排列,某條目在某年齡組中50%能通過(guò),該條目就被當(dāng)成該年齡組的題目。比率智商比率IQ=MA〔心理年齡〕/CA〔實(shí)足年齡〕×100比率智商的缺乏之處個(gè)體智力的增長(zhǎng)與年齡的關(guān)系并非一直呈直線關(guān)系,因此不適合于成人。比率智商的分?jǐn)?shù)在不同年齡組具有不同的意義。32離差智商是一種以年齡組為樣本計(jì)算而得的標(biāo)準(zhǔn)分?jǐn)?shù),為了使其與傳統(tǒng)的比率智商根本一致,一般研究者將離差智商的平均值定為100。韋克斯勒智力量表的標(biāo)準(zhǔn)差定在15IQ=100+15(X–X)/SD或IQ=100+15z斯坦福-比內(nèi)量表的標(biāo)準(zhǔn)差定在16IQ=100+16(X–X)/SD或IQ=100+16z常模標(biāo)準(zhǔn)分轉(zhuǎn)換表在實(shí)際工作中,測(cè)驗(yàn)編制者會(huì)采用某種標(biāo)準(zhǔn)分公式計(jì)算出與原始分相對(duì)應(yīng)的標(biāo)準(zhǔn)分,并編制成原始分轉(zhuǎn)換標(biāo)準(zhǔn)分等值表,附在手冊(cè)上方便使用。每個(gè)測(cè)驗(yàn)采用何種標(biāo)準(zhǔn)分,以及量表分的平均值和標(biāo)準(zhǔn)差均可從測(cè)驗(yàn)手冊(cè)中查到。舉例〔C-WYCSI〕4歲城市兒童,言語(yǔ)分量表得分42分,常模平均值為49.94、標(biāo)準(zhǔn)差11.58,其言語(yǔ)IQ是多少?33以100為平均數(shù)不同標(biāo)準(zhǔn)差條件下每一組距正態(tài)曲線下個(gè)案百分比分組分?jǐn)?shù)百分?jǐn)?shù)分布SD=12SD=14SD=16SD=18130以上0.71.63.15.1120~1294.36.37.58.5110~11915.216.015.815.4100~10929.826.123.621.090~9929.826.123.621.080~8915.216.015.815.470~794.36.37.58.570以下0.71.63.15.1總計(jì)100.0100.0100.0100.034本卷須知開(kāi)展常模換算及解釋時(shí)需要注意的問(wèn)題只適用于所測(cè)特質(zhì)隨年齡發(fā)生系統(tǒng)變化的情況只適用于在典型環(huán)境下生長(zhǎng)的兒童開(kāi)展量表的單位在各年齡并不相等,因?yàn)楦髂挲g開(kāi)展速度不同百分位常模換算及解釋時(shí)需要注意的問(wèn)題各百分位單位不相等,不能加、減、乘、除原始分轉(zhuǎn)換為百分等級(jí)時(shí),靠近中央的分?jǐn)?shù)其差異被夸大,靠近兩極的分?jǐn)?shù)其差異被縮小?!惨?jiàn)后附表〕不同被試之間不能精確比較標(biāo)準(zhǔn)分常模換算及解釋時(shí)需要注意的問(wèn)題計(jì)算非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)時(shí),要求所測(cè)特質(zhì)本質(zhì)上應(yīng)是常態(tài)分布。來(lái)自不同測(cè)驗(yàn)的離差智商,只有標(biāo)準(zhǔn)差相同或相近時(shí),才可進(jìn)行比較35WAIS-RC智商和百分位的關(guān)系〔城市〕
〔摘自?修訂韋氏成人智力量表手冊(cè)?〕百分位IQ百分位IQ百分位IQ9913370109208898129651071584971286010510809612755103573951255010047293123459937190120409726885117359516480114309275112259136建立常模的過(guò)程常模團(tuán)體的界定常模團(tuán)體是由具有某種共同特征的人所組成的一個(gè)群體,或者是該群體的一個(gè)樣本。一個(gè)測(cè)驗(yàn)可能有多個(gè)常模團(tuán)體WAIS-RC:分城鄉(xiāng)、分年齡共16個(gè)常模團(tuán)體MMPI:分男、女性別兩個(gè)常模團(tuán)體EPQ〔成人〕:分性別、分年齡12個(gè)常模團(tuán)體37常模團(tuán)體對(duì)于編制測(cè)驗(yàn)時(shí)的意義常模的選擇基于對(duì)實(shí)測(cè)對(duì)象的總體認(rèn)識(shí)一般程序:確定一般總體→確定目標(biāo)總體→確定樣本一般總體:準(zhǔn)備評(píng)價(jià)的對(duì)象群體目標(biāo)總體:準(zhǔn)備采樣的范圍人群常模樣本:根據(jù)總體性質(zhì)〔如性別、年齡、文化程度等〕確定的、有代表性的樣本常模樣本應(yīng)能夠代表一般總體,即具有充分的代表性。常模團(tuán)體對(duì)于使用測(cè)驗(yàn)時(shí)的意義準(zhǔn)備測(cè)評(píng)的對(duì)象的性質(zhì)最近似哪個(gè)常模樣本的特征〔例:職業(yè)測(cè)評(píng)〕哪個(gè)常模分?jǐn)?shù)最適合被測(cè)評(píng)對(duì)象〔例:WAIS-RC或C-WISC〕38取樣的方法取樣即從目標(biāo)人群中選擇有代表性的樣本隨機(jī)取樣根據(jù)隨機(jī)的原那么選擇樣本,在該范圍內(nèi)每個(gè)人被抽到的時(shí)機(jī)相等。常用的抽樣方法簡(jiǎn)單隨機(jī)抽樣:利用隨機(jī)數(shù)字表抽樣、抽簽系統(tǒng)抽樣在總體工程為N的情況下,選擇K分之一的作為樣本。K=N/nK為組距N為總樣本人數(shù)n擬抽取樣本量舉例:K為2:兩個(gè)中抽1個(gè),隨機(jī)確定首個(gè)是誰(shuí),隔一個(gè)抽1個(gè)K為20:每隔20位抽1個(gè)從121名學(xué)生中抽40人作為調(diào)查樣本K=121÷40≈3假設(shè)首位是第8號(hào),那么每隔3位抽一個(gè),即8、11、14……39分組抽樣當(dāng)總體數(shù)目較大,無(wú)法進(jìn)行編號(hào),而群體又具多樣性時(shí)采樣先分組,再在組內(nèi)隨機(jī)抽樣分層抽樣制定常模是最常用的方法先按某種〔或幾種〕變量分層,然后在每層中隨機(jī)抽取一定樣本,組合成常模樣本。分層比例抽樣ni=Ni/N×nni為第i層應(yīng)抽取的人數(shù)Ni為目標(biāo)總體中第i層人數(shù)N為目標(biāo)總體人數(shù)n為樣本容量40舉例方案在30萬(wàn)人群體中抽取1000人構(gòu)成某測(cè)驗(yàn)常模,總體人群中約80000人為初中文化程度者,試問(wèn)建立常模時(shí)應(yīng)抽取多少初中文化程度者?公式:ni=Ni/N×nni=80000/300000×1000≈267上式中Ni/N實(shí)際是某類特征人群在目標(biāo)總體重的比例,即80000/300000≈0.27,因此上式可改為:ni=n×某類特征人群比例41分層非比例抽樣當(dāng)各層次差異很大時(shí),有些層次的重要性大于其它層次,這時(shí)應(yīng)采用非比例抽樣,以降低各層的標(biāo)準(zhǔn)差。ni=n×NiSi/∑(NiSi)ni為各層應(yīng)抽個(gè)案數(shù)n為樣本個(gè)案數(shù)〔樣本容量〕Ni為各層個(gè)案數(shù)〔原方案〕Si為各層調(diào)查單位〔預(yù)試驗(yàn)時(shí)〕的標(biāo)準(zhǔn)差舉例:原方案某測(cè)驗(yàn)常模取樣時(shí)對(duì)3個(gè)人群各取300人,共900人,預(yù)備實(shí)驗(yàn)時(shí)〔各組N=30〕發(fā)現(xiàn)3個(gè)人群測(cè)驗(yàn)成績(jī)的標(biāo)準(zhǔn)差變化較大,S1=15、S2=10、S3=5,問(wèn)實(shí)際取樣時(shí)如何分配樣本為好?42公式:ni=n×NiSi/∑(NiSi)n=900N1=N2=N3=300S1=15,S2=10,S3=5計(jì)算N1=900(300×15)/(300×15+300×10+300×5)=900(4500)/9000=450N2=900(300×10)/(300×15+300×10+300×5)=900(3000)/9000=300N3=900(300×5)/(300×15+300×10+300×5)=900(1500)/9000=150由于增加了預(yù)實(shí)驗(yàn)時(shí)標(biāo)準(zhǔn)差較大組的樣本例數(shù),減少標(biāo)準(zhǔn)差較小組的樣本例數(shù),使得平均數(shù)估計(jì)較為準(zhǔn)確。43常模分?jǐn)?shù)表示法轉(zhuǎn)換表表示法又稱常模表,最簡(jiǎn)單、根本的表示方法。將測(cè)驗(yàn)的原始分轉(zhuǎn)換成相對(duì)應(yīng)的常模分?jǐn)?shù)〔如百分位、標(biāo)準(zhǔn)分、T分等〕舉例簡(jiǎn)單轉(zhuǎn)換表:將單一測(cè)驗(yàn)原始分轉(zhuǎn)換成一種或幾種分?jǐn)?shù)。如:p.223頁(yè)表13-3、瑞文推理測(cè)驗(yàn)、全量表IQ復(fù)雜轉(zhuǎn)換表:包括幾個(gè)分測(cè)驗(yàn)或幾種常模團(tuán)體的原始分與導(dǎo)出分?jǐn)?shù)的對(duì)應(yīng)關(guān)系。如:p.224頁(yè)表13-4、韋氏智力測(cè)驗(yàn)粗分等值量表分轉(zhuǎn)換表、MMPIT分轉(zhuǎn)換表等。44剖面圖表示法剖面圖是將分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來(lái)剖面圖能直觀地表示出被試在各分測(cè)驗(yàn)上的表現(xiàn)及相對(duì)位置有的剖面圖直接可作為粗分等值量表分轉(zhuǎn)換表用,如韋氏成人智力測(cè)驗(yàn)記錄紙的剖面圖WISC-R剖面圖舉例總智商在平均值以上言語(yǔ)智商相當(dāng)高,操作智商一般。45建立常模時(shí)的本卷須知制定常模時(shí),須清楚地說(shuō)明所要測(cè)量群體的性質(zhì)與特征,依據(jù)不同的性質(zhì)〔變量〕確定群體,便可得到不同的常模。樣本的大小適當(dāng)。因?yàn)槌闃诱`差與樣本大小成反比,理論上樣本越大越好,但也要考慮具體條件的允許。樣本的數(shù)量總體數(shù)目小,全部作為樣本??傮w數(shù)目較大,樣本也要大,30~100人。全國(guó)常模2000~3000人。樣本的代表性系統(tǒng)抽樣要求目標(biāo)總體無(wú)序可排,也無(wú)等級(jí)結(jié)構(gòu)存在。一般常模和特殊常模46第二節(jié)
測(cè)量的信度、效度與工程分析47信度分析定義信度〔reliability〕是指同一被試在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)〔或另一套相等的測(cè)驗(yàn)〕重復(fù)測(cè)量所得結(jié)果的一致程度?!脖窘滩摹承哦戎笢y(cè)驗(yàn)或量表的可靠性〔可靠程度〕?!昌徱取承哦染褪菍?duì)測(cè)量一致性程度的估計(jì)?!步鹩鳌吃诰幹苹蛐抻喰睦頊y(cè)驗(yàn)時(shí),信度研究是必須的環(huán)節(jié),信度資料是測(cè)驗(yàn)手冊(cè)里必備的測(cè)量學(xué)指標(biāo)。在使用心理測(cè)驗(yàn)時(shí),沒(méi)有信度資料的測(cè)驗(yàn)不能使用。48測(cè)量誤差與真分?jǐn)?shù)測(cè)量誤差是由與測(cè)驗(yàn)?zāi)康臒o(wú)關(guān)的偶然因素引起,使得幾次測(cè)量結(jié)果不一致,且這種不一致是非系統(tǒng)的、隨機(jī)的。真分?jǐn)?shù)指測(cè)量中不存在測(cè)量誤差時(shí)的真值或客觀值。真分?jǐn)?shù)的操作定義就是無(wú)數(shù)次測(cè)量的平均值,常用X∞來(lái)表示。表示真分?jǐn)?shù)的公式:
Xi=X∞+XeXi指實(shí)測(cè)分?jǐn)?shù)X∞指真實(shí)分?jǐn)?shù)Xe指誤差分?jǐn)?shù)實(shí)測(cè)分?jǐn)?shù)是真分?jǐn)?shù)與誤差分?jǐn)?shù)的函數(shù)。在進(jìn)行心理測(cè)量時(shí),X∞被視為是穩(wěn)定不變的,因此Xi的變化由Xe所引起。據(jù)此,Si2
=S∞2+Se2由于測(cè)量誤差的隨機(jī)性,誤差分?jǐn)?shù)的平均數(shù)為0。49實(shí)測(cè)分?jǐn)?shù)、真分?jǐn)?shù)、誤差的分布實(shí)測(cè)分?jǐn)?shù)Xi真分?jǐn)?shù)X∞誤差Xe實(shí)測(cè)分?jǐn)?shù)Xi真分?jǐn)?shù)X∞誤差Xe1718-1181433537-21618-22828038335373162327-444422282623636034340151142225-32732-52827125241∑X520520014131X262601421-7S277.667.310.32122-150信度的表達(dá)式信度的定義可以理解為一組測(cè)驗(yàn)分?jǐn)?shù)中真分?jǐn)?shù)方差與實(shí)測(cè)分?jǐn)?shù)方差的比率
在實(shí)際工作中,“真分?jǐn)?shù)〔X∞〕〞是很難獲得的,我們通常將實(shí)測(cè)分?jǐn)?shù)〔Xi〕作為真分?jǐn)?shù)的“估計(jì)值〞。由于真分?jǐn)?shù)〔X∞〕難以獲得,因此S∞2也很難獲得,但后者可以通過(guò)其與實(shí)測(cè)分?jǐn)?shù)方差和誤差的關(guān)系推出來(lái)。根據(jù)rxx=rx∞2=S∞2/Si2和Si2=S∞2+Se2兩式信度〔rxx〕那么作為反映實(shí)測(cè)分?jǐn)?shù)作為“真分?jǐn)?shù)〞估計(jì)值的準(zhǔn)確程度指標(biāo)。例:如果某測(cè)驗(yàn)的信度為0.9,其誤差那么為0.1。51測(cè)驗(yàn)誤差的來(lái)源測(cè)驗(yàn)本身引起的測(cè)量誤差測(cè)驗(yàn)題目抽樣誤差測(cè)驗(yàn)題目的形式測(cè)驗(yàn)題目的難度過(guò)高或過(guò)低測(cè)題或指導(dǎo)語(yǔ)用詞不當(dāng)測(cè)驗(yàn)時(shí)限過(guò)短測(cè)驗(yàn)實(shí)施引起的測(cè)量誤差物理環(huán)境主試方面意外干擾評(píng)分不客觀,計(jì)算、登記、轉(zhuǎn)換出錯(cuò)被試引起的測(cè)量誤差動(dòng)機(jī)的影響測(cè)驗(yàn)的焦慮生理因素學(xué)習(xí)、發(fā)育和教育測(cè)驗(yàn)經(jīng)驗(yàn)52信度的類型及估計(jì)方法重測(cè)信度(test-retestreliability)又稱穩(wěn)定性系數(shù)(stability),主要用于評(píng)價(jià)時(shí)間誤差。方法:皮爾遜積差相關(guān)公式:
rxx
相關(guān)系數(shù)X1、X2同一被試的兩個(gè)分?jǐn)?shù)N樣本例數(shù)X1、
X2兩次測(cè)驗(yàn)組平均數(shù)S1、
S2兩次測(cè)驗(yàn)組標(biāo)準(zhǔn)差舉例:10名學(xué)生兩次考試的成績(jī)?nèi)缦拢笏鼈冎g的相關(guān)?53第1次成績(jī):86587964914855823275第2次成績(jī):83528978856847762556計(jì)算公式:計(jì)算兩組平均值:X1=67X2=65.9計(jì)算兩組標(biāo)準(zhǔn)差:S1=17.86S2=19.40計(jì)算兩次成績(jī)的積和:∑X1X2∑X1X2=86×83+58×52+79×89+64×78+91×85+48×68+55×47+82×76+32×25+75×56=46993樣本例數(shù):N=10計(jì)算相關(guān)系數(shù)相關(guān)系數(shù)的統(tǒng)計(jì)學(xué)意義判斷確定自由度〔df〕:df=N-2查表:上例df=10-2=8,r0.05(8)=0.632、r0.01(8)=0.765判斷:r=0.819∵r>0.765∴p<0.0154相關(guān)分析計(jì)算兩種具有相關(guān)關(guān)系的不同現(xiàn)象之間關(guān)系程度的統(tǒng)計(jì)學(xué)方法直線相關(guān)與曲線相關(guān)〔見(jiàn)圖〕直線相關(guān)的關(guān)系分三種情況正相關(guān):兩列變量變動(dòng)方向相同負(fù)相關(guān):兩列變量變動(dòng)方向相反零相關(guān):兩列變量之間無(wú)相關(guān)相關(guān)分析的方法計(jì)量資料的相關(guān)分析方法:積差相關(guān)〔皮爾遜相關(guān)〕等級(jí)資料的相關(guān)分析方法:肯德?tīng)柡椭C系數(shù)質(zhì)與量的相關(guān)分析方法:點(diǎn)二列相關(guān)、二列相關(guān)相關(guān)系數(shù):表示相關(guān)程度的統(tǒng)計(jì)學(xué)指標(biāo)相關(guān)系數(shù)取值于–1.00~+1.00之間。負(fù)值表示負(fù)相關(guān),正值表示正相關(guān)?!?〞表示兩個(gè)變量之間完全沒(méi)有關(guān)系,“1〞表示兩個(gè)變量之間呈現(xiàn)一對(duì)一的關(guān)系。相關(guān)系數(shù)不是等距的度量值,因此在比較時(shí)只能說(shuō)絕對(duì)值大者比絕對(duì)值小者相關(guān)更密切一些。相關(guān)系數(shù)與其他統(tǒng)計(jì)量一樣也存在抽樣誤差,因此其統(tǒng)計(jì)學(xué)意義也應(yīng)進(jìn)行顯著性檢驗(yàn)。555657復(fù)本信度〔alternate-formreliability〕又稱等值性系數(shù),以兩個(gè)等值但題目不同的測(cè)驗(yàn)〔復(fù)本〕來(lái)測(cè)量同一群體,然后求被試者在兩個(gè)測(cè)驗(yàn)得分的相關(guān),用于評(píng)價(jià)兩個(gè)測(cè)驗(yàn)內(nèi)容的一致性。實(shí)施兩個(gè)測(cè)驗(yàn)的間隔時(shí)間長(zhǎng)短可能影響復(fù)本信度復(fù)本信度的計(jì)算方法同重測(cè)信度內(nèi)部一致性信度〔internalconsistencyreliability〕分半信度〔split-halfreliability〕用于評(píng)價(jià)同一測(cè)驗(yàn)內(nèi)部條目抽樣的誤差。方法:將測(cè)驗(yàn)條目按單雙號(hào)分為兩組,計(jì)算出兩組的得分,然后進(jìn)行相關(guān)。在同樣的情況下,信度的上下與條目數(shù)量成正比,分半信度只計(jì)算了一半條目的信度,因此要用斯皮爾曼—布朗的公式進(jìn)行校正。校正公式:rhh為兩半分?jǐn)?shù)的相關(guān)系數(shù)rxx為校正后〔原測(cè)驗(yàn)長(zhǎng)度時(shí)〕信度的估計(jì)值58舉例〔例3〕:
10名被試者在一個(gè)有10個(gè)條目的測(cè)驗(yàn)中得分如下,求該測(cè)驗(yàn)的分半信度?被試測(cè)驗(yàn)題目得分單號(hào)得分雙號(hào)得分單雙之差1234567891012221221001761221121001004403222212111178-1410010000001105120100000013-2622122111107617221211000045-18222201101065192222211000752102211211001651合計(jì)1817131511963335048259計(jì)算計(jì)算平均值:標(biāo)準(zhǔn)差:計(jì)算分半信度〔積差相關(guān)法〕:判斷相關(guān)〔查表〕計(jì)算校正分半信度
60其它計(jì)算分半信度方法斯皮爾曼–布朗校正分半信度的公式假設(shè)兩半測(cè)驗(yàn)分?jǐn)?shù)的變異相等,如實(shí)際情況不符合這一假設(shè),應(yīng)采用以下公式計(jì)算。弗朗那根〔Flanagan〕公式
Sa2和Sb2分別表示兩半測(cè)驗(yàn)分?jǐn)?shù)的方差Sx2為測(cè)驗(yàn)總分的方差舉例〔仍用上例〕計(jì)算Sa2=[(7-5)2+(4-5)2+(7-5)2+(1-5)2+(1-5)2+(7-5)2+(4-5)2+(6-5)2+(7-5)2+(6-5)2]/10=5.2計(jì)算Sb2=[(6-4.8)2+(4-4.8)2+(8-4.8)2+(1-4.8)2+(6-4.8)2+(6-4.8)2+(5-4.8)2+(5-4.8)2+(5-4.8)2+(5-4.8)2]/10=3.16計(jì)算Sx2=[(13-9.8)2+(8-9.8)2+(15-9.8)2+(2-9.8)2+(4-9.8)2+(13-9.8)2+(9-9.8)2+(11-9.8)2+(12-9.8)2+(11-9.8)2]/10=15.3661盧倫〔Kulon〕公式
Sd2表示兩半測(cè)驗(yàn)分?jǐn)?shù)之差的方差Sx2表示測(cè)驗(yàn)總分的方差舉例〔仍用上例〕計(jì)算單雙號(hào)差值〔d〕計(jì)算∑d=1計(jì)算d=∑d/N=1/10=0.2計(jì)算Sd2=[(1-0.2)2+(0-0.2)2+(-1-0.2)2+(0-0.2)2+(-2-0.2)2+(1-0.2)2+(-1-0.2)2+(1-0.2)2+(2-0.2)2+(1-0.2)2/10]=1.3662同質(zhì)性信度〔homogeneityreliability〕評(píng)價(jià)測(cè)驗(yàn)內(nèi)題目間一致性〔內(nèi)容抽樣誤差〕庫(kù)德–理查遜公式〔K-R20公式〕:適用于0、1記分的測(cè)驗(yàn)N為測(cè)驗(yàn)題目數(shù)Pi通過(guò)某題目的人數(shù)比例qi未通過(guò)該題目的人數(shù)比例Sx2測(cè)驗(yàn)總分?jǐn)?shù)的變異〔方差〕舉例〔例4〕63舉例〔例4〕:
10名被試在一個(gè)有8個(gè)條目的測(cè)驗(yàn)中得分如下,求其信度?被試測(cè)驗(yàn)題目得分12345678總分10000000002100000001310100000241100100035010100103611101010571111110068111111006911110101610111111118合計(jì)8765543240Pi0.80.70.60.50.50.40.30.2piqi0.160.210.240.250.250.240.210.161.7264公式:N=8p1=8/10=0.8qi=1-0.8=0.2p1q1=0.8×0.2=0.16∑piqi=p1q1+p2q2+…+pnqn=1.72Sx2=[(0-4)2+(1-4)2+(2-4)2+(3-4)2+(3-4)2+(3-4)2+(5-4)2+(6-4)2+(6-4)2+(6-4)2+(8-4)2]/10
=6.065庫(kù)德–理查遜公式〔K-R21公式〕X為測(cè)驗(yàn)總分平均值Sx2測(cè)驗(yàn)總分?jǐn)?shù)的變異〔方差〕舉例〔上例〕:平均值=466克倫巴赫α系數(shù):適用于各種分?jǐn)?shù)形式N為測(cè)驗(yàn)題目數(shù)Si2為某一題目分?jǐn)?shù)的變異〔方差〕,∑Si2為所有題目方差之和當(dāng)題目以1、0記分時(shí),∑Si2=∑piqi,所以rKR20公式可以當(dāng)作α系數(shù)的特例Sx2測(cè)驗(yàn)總分?jǐn)?shù)的變異〔方差〕舉例〔例5〕:67舉例〔例5〕:10名被試者在一個(gè)有10個(gè)條目的測(cè)驗(yàn)中得分如下,求該測(cè)驗(yàn)的α系數(shù)?被試測(cè)驗(yàn)題目得分得分123456789101222122100113221121001008322221211111541001000000251201000000462212211110137221211000098222201101011922222110001210221121100111平均值1.81.71.31.51.10.90.60.30.30.39.8Si20.160.410.410.450.690.490.240.210.210.213.4868公式:N=10S12=[(2-1.8)2+(2-1.8)2+(2-1.8)2+(1-1.8)2+(1-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2+(2-1.8)2]/10=0.16∑Si2=3.48M=∑X/N=98/10=9.8Sx2=[(13-9.8)2+(8-9.8)2+(15-9.8)2+(2-9.8)2+(4-9.8)2+(13-9.8)2+(9-9.8)2+(11-9.8)2+(12-9.8)2+(11-9.8)2]/10=15.3669評(píng)分者信度〔scorerreliability〕評(píng)價(jià)不同評(píng)分者之間的一致性指標(biāo)〔不同評(píng)分者之間的誤差〕方法:隨機(jī)抽取假設(shè)干份測(cè)驗(yàn)卷,有兩位或多位評(píng)分者按標(biāo)準(zhǔn)評(píng)分,計(jì)算每?jī)蓚€(gè)評(píng)分者對(duì)同一被試答卷所評(píng)分?jǐn)?shù)之間的相關(guān)一般要求評(píng)分者之間一致性達(dá)0.9以上計(jì)算方法兩個(gè)評(píng)分者之間的一致性用皮爾遜積差相關(guān)方法或等級(jí)相關(guān)方法計(jì)算多個(gè)評(píng)分者之間的一致性:等級(jí)資料時(shí)用肯德?tīng)柡椭C系數(shù)來(lái)評(píng)價(jià)公式
Ri為每一對(duì)象被評(píng)等級(jí)的總和N被評(píng)對(duì)象的人數(shù)或答卷數(shù)K評(píng)分者人數(shù)舉例〔例6〕三位專家給6篇論文評(píng)等級(jí),結(jié)果見(jiàn)表,求評(píng)分者信度?70三位專家給6篇論文的評(píng)定〔例6〕專家123456124156223415523341462Ri81231417671計(jì)算公式:N=6K=3∑Ri=8+12+3+14+17+6=60∑Ri2=82+122+32+142+172+62=73872信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋解釋真實(shí)分?jǐn)?shù)與實(shí)得〔測(cè)驗(yàn)〕分?jǐn)?shù)的關(guān)系信度系數(shù)可以用于解釋總方差中有多少比例是由真實(shí)分?jǐn)?shù)決定的。因?yàn)椋篠i2=S∞2+Se2,并且如果我們將總方差看成是1〔100%〕的話所以:Se2=1-rxx例如當(dāng)rxx=0.9時(shí),我們可以說(shuō)實(shí)得分?jǐn)?shù)中有90%的變異是真分?jǐn)?shù)造成,近10%的來(lái)自誤差。各種信度的可接受水平一般原那么當(dāng)信度≥0.85時(shí),可用于對(duì)個(gè)人作評(píng)價(jià)當(dāng)0.70≤信度<0.85時(shí),可用于對(duì)團(tuán)體作評(píng)價(jià),但不能對(duì)個(gè)人作評(píng)價(jià)當(dāng)信度<0.7時(shí),不能用作評(píng)價(jià)因測(cè)驗(yàn)類型而異一般能力測(cè)驗(yàn)要求0.9以上人格、興趣、態(tài)度等測(cè)驗(yàn)要求0.80以上〔見(jiàn)表〕73幾種心理測(cè)驗(yàn)的信度系數(shù)測(cè)驗(yàn)類型信度低中高成套成就測(cè)驗(yàn)0.660.920.98學(xué)術(shù)能力測(cè)驗(yàn)0.560.900.97成套傾向性測(cè)驗(yàn)0.460.880.96客觀人格測(cè)驗(yàn)0.460.850.97興趣測(cè)驗(yàn)0.420.840.93態(tài)度量表0.470.790.9874解釋個(gè)人分?jǐn)?shù)的意義測(cè)量標(biāo)準(zhǔn)誤〔SEm,SE〕測(cè)量誤差分布的標(biāo)準(zhǔn)差,用來(lái)表示誤差的大小。公式:SE=Sx√1-rxxSx分?jǐn)?shù)的標(biāo)準(zhǔn)差rxx測(cè)驗(yàn)的信度舉例:WAIS-RC城市20歲組FIQ的信度為0.95,求其測(cè)量標(biāo)準(zhǔn)誤。SE=15√1-0.95=15×0.224=3.3575測(cè)量標(biāo)準(zhǔn)誤的用途確定真分?jǐn)?shù)的置信區(qū)間〔可信區(qū)間〕公式:XT=X±ZSEX為某人的具體得分Z置信區(qū)間的概率水平SE測(cè)量標(biāo)準(zhǔn)誤舉例:20歲城市男性在WAIS-RC全量表IQ為105,問(wèn)95%的置信區(qū)間是多少?從上例20歲組FIQ的測(cè)量標(biāo)準(zhǔn)誤為3.35當(dāng)置信區(qū)間概率水平為95%時(shí),Z為1.96IQ=105±1.96×3.25≈99~111比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異〔離散分析〕測(cè)量標(biāo)準(zhǔn)誤在評(píng)價(jià)兩個(gè)不同測(cè)驗(yàn)分?jǐn)?shù)的差異是否具有統(tǒng)計(jì)學(xué)意義上的顯著性時(shí)非常重要這種比較可以是兩個(gè)人的分?jǐn)?shù)是否存在差異,也可以是同一被試的兩個(gè)測(cè)驗(yàn)分?jǐn)?shù)該內(nèi)容留在智力測(cè)驗(yàn)結(jié)果分析時(shí)講76有關(guān)信度評(píng)估的一些問(wèn)題重測(cè)信度的間隔時(shí)間兩次測(cè)驗(yàn)間隔時(shí)間的長(zhǎng)短影響重測(cè)信度間隔多久適宜因測(cè)驗(yàn)的目的、性質(zhì)和被試特點(diǎn)而異,一般為2~4周,最好不超過(guò)6個(gè)月。復(fù)本信度計(jì)算復(fù)本信度時(shí),一半被試先做A本再做B本,另一半被試那么相反,由此抵消測(cè)驗(yàn)順序效應(yīng)。副本的兩個(gè)測(cè)驗(yàn)必須在工程的內(nèi)容、形式、數(shù)量、難度、時(shí)限、指導(dǎo)語(yǔ)等方面相同或相似。分半信度測(cè)量的其它方法77異質(zhì)心理學(xué)變量的測(cè)量問(wèn)題對(duì)于某些復(fù)雜的、異質(zhì)的心理學(xué)變量〔如智力、人格〕,單一的測(cè)驗(yàn)無(wú)法解決,可用幾個(gè)異質(zhì)的分測(cè)驗(yàn)來(lái)分別測(cè)量各個(gè)方面,保持分測(cè)驗(yàn)內(nèi)部的同質(zhì)性。影響信度〔相關(guān)系數(shù)〕的因素樣本團(tuán)體的異質(zhì)性假設(shè)計(jì)算信度的樣本較常模團(tuán)體樣本異質(zhì),往往會(huì)高估測(cè)驗(yàn)的信度,相反那么會(huì)低估測(cè)驗(yàn)的信度。這種情況可計(jì)算校正信度〔r’xx〕公式:r’xx為校正后信度系數(shù)rxx為校正前信度系數(shù)S’x為常模團(tuán)體標(biāo)準(zhǔn)差Sx為計(jì)算信度樣本的標(biāo)準(zhǔn)差78舉例:中國(guó)–韋氏幼兒智力量表VIQ重測(cè)信度為0.81,重測(cè)樣本〔N=120〕VIQ的標(biāo)準(zhǔn)差是12.72,常模團(tuán)體標(biāo)準(zhǔn)差15,求校正重測(cè)信度?79測(cè)驗(yàn)的長(zhǎng)度測(cè)驗(yàn)的長(zhǎng)度,亦即測(cè)驗(yàn)條目數(shù),也是影響信度系數(shù)的一個(gè)因素。一般說(shuō)來(lái),增加同質(zhì)的條目可以提高測(cè)驗(yàn)的信度。如果我們?cè)陬A(yù)備試驗(yàn)中道某測(cè)驗(yàn)的信度,希望提高至某一水平,可以運(yùn)用斯皮爾曼–布朗的公式計(jì)算出至少應(yīng)增加多少條目。公式:K指改變后長(zhǎng)度為原長(zhǎng)度的倍數(shù)rkk指期望到達(dá)的信度水平rxx指原信度系數(shù)舉例:中國(guó)–韋氏幼兒智力量表〔城市版〕領(lǐng)悟力分測(cè)驗(yàn)有18個(gè)條目,平均分半信度為0.69。期望將其信度提高至0.80,問(wèn)需要多少條目?需要條目=18×1.797≈3280效度分析定義效度〔validity〕,在心理測(cè)驗(yàn)中是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間吻合的程度。心理測(cè)驗(yàn)的準(zhǔn)確性心理測(cè)驗(yàn)的有效性〔龔耀先〕在編制或修訂心理測(cè)驗(yàn)時(shí),效度研究是必須的環(huán)節(jié),效度資料是測(cè)驗(yàn)手冊(cè)里必備的測(cè)量學(xué)指標(biāo)。在使用心理測(cè)驗(yàn)時(shí),沒(méi)有效度資料的測(cè)驗(yàn)也不能使用。81效度的類型與估計(jì)方法內(nèi)容效度〔content–relatedvalidity〕指測(cè)驗(yàn)條目對(duì)有關(guān)內(nèi)容或行為取樣的實(shí)用性。換句話說(shuō),所選用的條目是否能測(cè)到想要測(cè)量的行為。估計(jì)方法專家判斷法請(qǐng)有關(guān)專家對(duì)條目進(jìn)行審定審定步驟①定義測(cè)驗(yàn)總體范圍,描述相關(guān)知識(shí)與技能及所用材料的來(lái)源。②編制雙向細(xì)目表,確定各種內(nèi)容所占比例,標(biāo)出每個(gè)條目設(shè)計(jì)所測(cè)內(nèi)容。〔見(jiàn)表〕③制定一個(gè)相應(yīng)的評(píng)定量表來(lái)評(píng)價(jià)效度,如測(cè)驗(yàn)包括的內(nèi)容、技能、材料的重要程度、條目對(duì)內(nèi)容的實(shí)用性等。請(qǐng)每位評(píng)定者對(duì)各方面進(jìn)行評(píng)價(jià),然后總合所有評(píng)定者的評(píng)價(jià)。82高中化學(xué)標(biāo)準(zhǔn)測(cè)驗(yàn)雙向細(xì)目表識(shí)記了解應(yīng)用分析綜合評(píng)估合計(jì)第一章8210第二章10621028第三章3624722第四章291265640合計(jì)525281422610083統(tǒng)計(jì)分析法計(jì)算兩個(gè)評(píng)審者之間一致性克倫巴赫推薦的方法:先編出兩個(gè)測(cè)驗(yàn)復(fù)本〔取自同樣內(nèi)容范圍〕,在同一組被試中實(shí)測(cè),然后計(jì)算其相關(guān)。再測(cè)法:學(xué)習(xí)前先測(cè)驗(yàn)一次,學(xué)習(xí)后在測(cè)試一次,計(jì)算兩次相關(guān)。經(jīng)驗(yàn)推測(cè)法通過(guò)實(shí)踐來(lái)檢驗(yàn)如檢驗(yàn)兒童開(kāi)展量表的效度,觀察不同年齡階段兒童通過(guò)率是否隨年齡的增長(zhǎng)而增加。8485測(cè)驗(yàn)間的相互比較與經(jīng)典、成熟的同類測(cè)驗(yàn)相比較:計(jì)算新測(cè)驗(yàn)與經(jīng)典測(cè)驗(yàn)之間分?jǐn)?shù)的相關(guān)。相關(guān)系數(shù)的平方即兩測(cè)驗(yàn)分?jǐn)?shù)共同解釋的變異大小,又稱為相容效度〔congruentvalidity〕。區(qū)分效度〔discriminatevalidity〕:一個(gè)有效的測(cè)驗(yàn)不僅應(yīng)與其他測(cè)量同一構(gòu)思的測(cè)驗(yàn)成績(jī)有相關(guān),還必須與測(cè)量不同構(gòu)思的測(cè)驗(yàn)成績(jī)無(wú)相關(guān),后者就是區(qū)分效度。因素分析方法〔factoranalysis〕:對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,找出影響測(cè)驗(yàn)分?jǐn)?shù)的共同因子,這種因素可能就是我們要測(cè)量的心理特征。用效標(biāo)效度做證明根據(jù)效標(biāo)選擇不同的被試群體,比較不同組測(cè)驗(yàn)成績(jī)的差異利用心理素質(zhì)的變化關(guān)系,如兒童年齡增長(zhǎng)與能力開(kāi)展的關(guān)系。實(shí)驗(yàn)法和觀察法觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后測(cè)驗(yàn)分?jǐn)?shù)的差異86效標(biāo)效度〔criterion–relatedvalidity〕效標(biāo)效度又稱實(shí)證效度,反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情景下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。估計(jì)方法相關(guān)法求測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān)最常用的是積差相關(guān),根據(jù)資料的特征也可用等級(jí)相關(guān)、二列相關(guān)等方法。87區(qū)分法區(qū)分法是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法公式〔t檢驗(yàn)公式〕
t檢驗(yàn)統(tǒng)計(jì)量XH高分組平均值XL低分組平均值SH2高分組方差SL2低分組方差NH高分組樣本人數(shù)NL低分組樣本人數(shù)88舉例〔例7〕:用能力傾向測(cè)驗(yàn)給工作成功〔N=60〕和工作失敗〔N=40〕兩組工人測(cè)試,工作成功組平均得分6.05,方差為3.31;工作失敗組平均得分4.25,方差為1.69,問(wèn)兩組得分差異是否具有顯著意義?無(wú)效假設(shè):假設(shè)兩組得分的差異是由抽樣誤差所造成自由度(df)=NH+NL-2=60+40-2=98查t值表:t(0.01)=2.66,本例5.79>2.66,所以p<0.01結(jié)論:無(wú)效假設(shè)成立的概率<0.01,差異有非常顯著意義。89能力傾向測(cè)驗(yàn)與工作成績(jī)的分布〔例7〕工作成績(jī)能力傾向測(cè)驗(yàn)得分12345678910合計(jì)工作成功101190812375121961252411552633216413524116工作失敗314692123252231211214011合計(jì)人數(shù)1313172123965210090從t檢驗(yàn)方法中可以發(fā)現(xiàn)差異顯著性與樣本大小有密切關(guān)系,當(dāng)樣本較大時(shí),平均數(shù)之間的小差異也有顯著性,但這種差異用于區(qū)分團(tuán)體時(shí)實(shí)際價(jià)值很小。重疊計(jì)算法如果t檢驗(yàn)有顯著差異,進(jìn)一步求兩個(gè)分部的重疊量,以解決上述缺點(diǎn)。一組〔A組〕內(nèi)被試超出另一組〔B組〕平均值的人數(shù)與該組〔B組〕內(nèi)部平均值以上人數(shù)之比。如果該比例越低,說(shuō)明兩組差異越大。舉例:前例中以6分為界,失敗組有7人≥6分,而成功組有38人≥6分,其比例為7/38。計(jì)算兩組分布共同區(qū)的百分比,重疊量越大,說(shuō)明分?jǐn)?shù)差異越小,測(cè)驗(yàn)效度越差。舉例:前例中兩組分布重疊范圍從2~7分,共86%的人分布在此區(qū)域。91命中率法用測(cè)驗(yàn)結(jié)果作為取舍依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。計(jì)算命中率時(shí)除有測(cè)驗(yàn)分?jǐn)?shù)外,還需具備某種效標(biāo)資料。效標(biāo)成績(jī)測(cè)驗(yàn)預(yù)測(cè)失敗〔-〕成功〔+〕成功〔+〕〔A〕失誤〔B〕命中失敗〔-〕〔C〕命中〔D〕失誤命中率計(jì)算總命中率(PCT)=命中/(命中+失誤)=(B+C)/(A+B+C+D)正命中率(PCP)=測(cè)驗(yàn)與效標(biāo)皆成功人數(shù)/測(cè)驗(yàn)成功人數(shù)=B/(A+B)舉例:上例測(cè)驗(yàn)成績(jī)以≥6分為界,工作成績(jī)以≥4分為界。A=22,B=38,C=33,D=7總命中率(PCT)=(38+33)/(22+38+33+7)=71%正命中率(PCP)=38/(22+38)=63%92效度意義確實(shí)定預(yù)測(cè)誤差決定性系數(shù)效度系數(shù)的實(shí)際意義常常以決定性系數(shù)來(lái)表示,即相關(guān)系數(shù)的平方,它表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。舉例:高考英語(yǔ)成績(jī)與入大學(xué)后第1學(xué)年英語(yǔ)課考試成績(jī)的相關(guān)為0.6。估計(jì)的標(biāo)準(zhǔn)誤〔Sest〕:指預(yù)測(cè)效度分?jǐn)?shù)時(shí)預(yù)測(cè)誤差大小的估計(jì)值。Sest=SDy√1-r2xySDy效標(biāo)成績(jī)的標(biāo)準(zhǔn)差r2xy效度系數(shù)的平方,即決定性系數(shù)預(yù)測(cè)誤差的判斷與信度一樣,當(dāng)r2xy=1.0時(shí),效度完美,估計(jì)標(biāo)準(zhǔn)誤也為0,測(cè)驗(yàn)分?jǐn)?shù)可完全代表效標(biāo)。當(dāng)r2xy=0時(shí),測(cè)驗(yàn)分?jǐn)?shù)完全不能代表效標(biāo)。93預(yù)測(cè)效標(biāo)分?jǐn)?shù)的可信區(qū)間估計(jì)標(biāo)準(zhǔn)誤可用于估計(jì)真正效標(biāo)分?jǐn)?shù)的可信區(qū)間。公式:YT=Y±ZSestY為某人的具體得分Z置信區(qū)間的概率水平Sest估計(jì)標(biāo)準(zhǔn)誤舉例:某腦外傷病人在WAIS-RC中的事前智力〔全量表〕為105,該計(jì)算〔回歸〕方法的效度系數(shù)為0.625,問(wèn)該病人病前全量表智商的95%可信區(qū)間是多少?計(jì)算估計(jì)標(biāo)準(zhǔn)誤〔Sest〕Sest=SDy√1-r2xy計(jì)算病前智力的可信區(qū)間94預(yù)測(cè)效標(biāo)分?jǐn)?shù)如果X與Y兩變量呈直線相關(guān),只要確定出二者的回歸方程,就可以從一個(gè)變量推估出另一個(gè)變量。一般常從測(cè)驗(yàn)分?jǐn)?shù)來(lái)預(yù)測(cè)效標(biāo)成績(jī)公式〔回歸方程〕:為預(yù)測(cè)的效標(biāo)分?jǐn)?shù)A為縱軸的截距,用來(lái)糾正平均數(shù)的差異Byx為斜率,Y向X回歸的系數(shù)X為測(cè)驗(yàn)分?jǐn)?shù)計(jì)算byx和a的公式byx=rxy×Sy/Sxrxy為測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的相關(guān)Sy和Sx為效標(biāo)分?jǐn)?shù)與測(cè)驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)差a=Y-byxXY為效標(biāo)分?jǐn)?shù)的平均值,X為測(cè)驗(yàn)分?jǐn)?shù)的平均值95舉例〔前例〕:用能力傾向測(cè)驗(yàn)預(yù)測(cè)工作績(jī)效,該組平均測(cè)驗(yàn)分?jǐn)?shù)為5.35分,標(biāo)準(zhǔn)差1.80分;平均績(jī)效分?jǐn)?shù)為4.28分,標(biāo)準(zhǔn)差1.89分;測(cè)驗(yàn)分與績(jī)效分的相關(guān)系數(shù)為0.68,計(jì)算其回歸方程?計(jì)算byx=rxy×Sy/Sxrxy=0.68Sy=1.89Sx=1.80byx=0.68×1.89/1.80=0.714計(jì)算a=Y-byxXY=4.28X=5.35a=4.28-0.714×5.35=0.46回歸方程:應(yīng)用舉例:某人能力傾向測(cè)驗(yàn)得分為6分,求績(jī)效分?96預(yù)測(cè)效率指數(shù)前面公式-25中的稱作無(wú)關(guān)系數(shù),以K表示。K值大小說(shuō)明預(yù)測(cè)源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無(wú)關(guān)的程度無(wú)關(guān)系數(shù)公式:預(yù)測(cè)效率指數(shù)〔E〕=100(1-K)E值的大小說(shuō)明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差舉例:一個(gè)測(cè)驗(yàn)的效度系數(shù)為0.80,其預(yù)測(cè)效率指數(shù)為多少?說(shuō)明使用測(cè)驗(yàn)比盲目猜測(cè)減少40%的誤差也說(shuō)明測(cè)驗(yàn)預(yù)測(cè)誤差僅為隨機(jī)誤差的60%97信度和效度的關(guān)系信度和效度的差異在于所涉及的誤差不同信度考慮的是隨機(jī)誤差的影響效度那么還包括測(cè)驗(yàn)穩(wěn)定的測(cè)量誤差〔系統(tǒng)誤差〕信度是效度的必要條件而非充分條件〔見(jiàn)圖〕一個(gè)高效度的測(cè)驗(yàn),其信度必然也高;一個(gè)高信度的測(cè)驗(yàn),其效度不一定高。效度受信度的制約效度與信度的關(guān)系式:rxy≤√rxxrxy效度系數(shù)rxx信度系數(shù)98效度分析的本卷須知要求內(nèi)容效度的測(cè)驗(yàn),不一定要求測(cè)驗(yàn)為同質(zhì)的。測(cè)量單一心理特質(zhì)的測(cè)驗(yàn)要求測(cè)驗(yàn)條目有高度的同質(zhì)性測(cè)量一組不同心理特質(zhì)的成套量表,不要求各分測(cè)驗(yàn)之間具有同質(zhì)性。不同類型的測(cè)驗(yàn)對(duì)外表效度的要求是不同的外表效度是指測(cè)驗(yàn)使用者或被試在主觀認(rèn)識(shí)上覺(jué)得有效需要被試者在測(cè)驗(yàn)中盡最大努力的測(cè)驗(yàn)要求較高的外表效度需要被試這盡可能按自己實(shí)際情況答復(fù)的測(cè)驗(yàn)要求較低的外表效度99設(shè)想效度的建立先從某一理論出發(fā),設(shè)計(jì)相應(yīng)的分測(cè)驗(yàn)和條目,然后要驗(yàn)證測(cè)驗(yàn)結(jié)果與假設(shè)的符合程度。設(shè)想效度常用相關(guān)和因素分析方法來(lái)驗(yàn)證以人格測(cè)驗(yàn)為例:人格包括幾個(gè)特質(zhì),內(nèi)容是什么?人格特質(zhì)是相對(duì)穩(wěn)定的兒童時(shí)期的遭遇對(duì)人格的形成有著巨大的影響檢驗(yàn)效標(biāo)效度的難點(diǎn)在于找到適宜的效標(biāo)效標(biāo)能夠最有效地反映測(cè)驗(yàn)的目標(biāo)效標(biāo)具有較高的信度,穩(wěn)定可靠效標(biāo)可以被客觀地測(cè)量效標(biāo)測(cè)量的方法簡(jiǎn)單、實(shí)用。100影響測(cè)驗(yàn)效度的因素測(cè)驗(yàn)取材必須具有代表性設(shè)計(jì)題目時(shí)盡量防止容易引起誤差的題型〔如是非題〕題目難度適中,具有較高的區(qū)分度;測(cè)驗(yàn)長(zhǎng)度恰當(dāng),具有一定的題量;測(cè)題的排列按先易后難的次序。使用積差相關(guān)評(píng)估效度時(shí),應(yīng)注意測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)之間是否為線性關(guān)系。101工程分析測(cè)驗(yàn)的工程分析定性分析和定量分析定性分析:測(cè)驗(yàn)的內(nèi)容效度、題目編寫的恰當(dāng)性和有效性定量分析:對(duì)題目的難度和區(qū)分度進(jìn)行分析工程分析的目的是:通過(guò)選擇和修改測(cè)驗(yàn)題目,提高測(cè)驗(yàn)的信度和效度。102工程的難度分析難度〔difficulty〕,指工程的難易程度,能力測(cè)驗(yàn)中一個(gè)重要的指標(biāo)。在人格測(cè)驗(yàn)中,類似的指標(biāo)是“通俗性〞。即取自相同總體樣本中,能在答案方向上答復(fù)該題的人數(shù)。兩種指標(biāo)的計(jì)算方法是相同的103難度的計(jì)算二分法記分的工程〔1、0記分〕公式〔通過(guò)率〕:P=R/N×100%P指工程的難度〔通過(guò)率〕R答對(duì)或通過(guò)該工程的人數(shù)N全體被試人數(shù)舉例〔前例4〕:第一題10名被試中8人答對(duì),其難度為:P1=8/10×100%=80%104舉例〔例4〕:
10名被試在一個(gè)有8個(gè)條目的測(cè)驗(yàn)中得分如下,求各題難度?被試測(cè)驗(yàn)題目得分12345678總分10000000002100000001310100000241100100035010100103611101010571111110068111111006911110101610111111118合計(jì)8765543240Pi(%)807060505040302040105樣本例數(shù)較大時(shí)的計(jì)算方法根據(jù)測(cè)驗(yàn)總成績(jī)將被試分為三組高分組〔NH〕:分?jǐn)?shù)最高的27%中間組:分?jǐn)?shù)居中的46%低分組〔NL〕:分?jǐn)?shù)最低的27%計(jì)算高分和低分組的通過(guò)率計(jì)算兩組平均通過(guò)率作為難度指標(biāo)公式:P=(PH+PL)/2P指難度〔通過(guò)率〕PH指高分組通過(guò)率PL指低分組通過(guò)率舉例:某測(cè)驗(yàn)條目高分組通過(guò)率為85%,中間組通過(guò)率為52%,低分組通過(guò)率為35%,問(wèn)平均通過(guò)率是多少?106吉爾福特的難度校正公式因?yàn)檫x擇題易受到猜測(cè)的影響,備選答案越少,機(jī)遇的作用越大,越不能反映真實(shí)難度,吉爾福特的校正公式用于對(duì)此進(jìn)行校正。公式:CP校正后通過(guò)率P校正前通過(guò)率K備選答案數(shù)目舉例:上題假設(shè)為5選1的題型,請(qǐng)計(jì)算校正后的通過(guò)率?
107非二分記分工程的難度計(jì)算公式:X指全體被試在該題上的平均得分Xmax為該題的總分值舉例〔前例5〕:計(jì)算難度〔通過(guò)率〕第一題平均得分1.8分,最高分2分,通過(guò)率:P1=1.8/2.0×100%=90108舉例〔例5〕:10名被試者在一個(gè)有10個(gè)條目的測(cè)驗(yàn)中得分如下,求該測(cè)驗(yàn)各條目的難度?被試測(cè)驗(yàn)題目得分得分123456789101222122100113221121001008322221211111541001000000251201000000462212211110137221211000098222201101011922222110001210221121100111平均1.81.71.31.51.10.90.60.30.30.39.8難度0.90.850.650.750.550.450.30.150.150.150.49109難度水平確實(shí)定進(jìn)行難度分析的目的是為了篩選條目,工程難度多高適宜,取決于測(cè)驗(yàn)的目的、性質(zhì)及工程的形式。一般而言,難度〔通過(guò)率〕在0.5時(shí),區(qū)別力最高,對(duì)信度和效度影響最好。在能力測(cè)驗(yàn)中,為了使盡可能少的人在測(cè)驗(yàn)中得0分或得總分值,因此必須安排很容易的工程和很難的工程,但測(cè)驗(yàn)的平均通過(guò)率最好控制在0.5水平。110測(cè)驗(yàn)的難度測(cè)驗(yàn)的難度取決于組成測(cè)驗(yàn)工程的難度通過(guò)觀察測(cè)驗(yàn)分?jǐn)?shù)的分布,可以進(jìn)行直觀檢驗(yàn)。如果測(cè)驗(yàn)難度適中,分?jǐn)?shù)的分布應(yīng)當(dāng)接近常態(tài)分布;如果測(cè)驗(yàn)偏難,分布呈正偏態(tài)〔圖13-4,A〕如果測(cè)驗(yàn)偏容易,分布呈負(fù)偏態(tài)〔圖13-4,B〕測(cè)驗(yàn)偏難或便容易時(shí),可以通過(guò)增加或減少不同難易程度的條目來(lái)解決。某些測(cè)驗(yàn)〔如標(biāo)準(zhǔn)參照測(cè)驗(yàn)〕允許測(cè)驗(yàn)分?jǐn)?shù)呈偏態(tài)分布。111工程的區(qū)分度工程區(qū)分度〔itemdiscrimination〕也叫鑒別力,是指測(cè)驗(yàn)工程對(duì)被試者的心理特征的區(qū)分能力。高區(qū)分度條目:實(shí)際水平高者能通過(guò),實(shí)際水平低者不能通過(guò)。區(qū)分度的計(jì)算方法鑒別指數(shù)相關(guān)法112鑒別指數(shù)鑒別指數(shù)計(jì)算步驟按測(cè)驗(yàn)總分依次排列確定高分組和低分組高分組:排序最高的27%的被試低分組:排序最低的27%的被試分別計(jì)算高分組與低分組在每個(gè)工程上的通過(guò)率公式:D=PH-PLD指鑒別指數(shù)PH高分組在某工程上的通過(guò)率PL低分組在某工程上的通過(guò)率舉例〔例8〕113例8:32名被試在4個(gè)工程的得分被試題1題2題3題4總分被試題1題2題3題4總分11111417110022111141810102311114191100241111420011025101132111002611103221000171110323010018110132410001911103250100110110132600101111110327100011211002280100113101022900000141001230000001511002310000016011023200000114計(jì)算鑒別指數(shù)按總分排序確定高、低分組分組人數(shù)=32×0.27≈9人高分組:1~9號(hào)低分組:24~32號(hào)分別計(jì)算高、低分組在1~4題的通過(guò)率P1H=9÷9=1.00P1L=2÷9=0.22P2H=8÷9=0.89P2L=2÷9=0.22P3H=8÷9=0.89P3L=1÷9=0.11P4H=6÷9=0.67P4L=0÷9=0.00分別計(jì)算各題鑒別指數(shù)D1=1.00-0.22=0.78D2=0.89-0.22=0.67D3=0.89-0.11=0.78D4=0.67-0.00=0.67115鑒別指數(shù)的判斷因?yàn)楦叻纸M條目總得分上高于低分組,理論上他們每個(gè)條目的通過(guò)率也要高于低分組。D>0時(shí),D越大,說(shuō)明該條目區(qū)分兩種水平〔組〕的能力越強(qiáng)D<0那么反映高分組的得分反而低于低分組,說(shuō)明該條目有問(wèn)題。伊貝爾〔L.Ebel,1965〕關(guān)于鑒別指數(shù)評(píng)價(jià)工程性能的標(biāo)準(zhǔn):鑒別指數(shù)〔D〕工程評(píng)價(jià)0.40以上很好0.30~0.39良好,修改后會(huì)更佳0.20~0.29尚可,但需修改0.19及以下差,必須淘汰116相關(guān)法計(jì)算區(qū)分度常用的方法是相關(guān)法,即以某一條目得分與效標(biāo)成績(jī)或測(cè)驗(yàn)總分進(jìn)行相關(guān)運(yùn)算。相關(guān)系數(shù)越高,說(shuō)明該條目越具有區(qū)分功能。常用于工程分析的相關(guān)方法點(diǎn)二列相關(guān)二列相關(guān)Ф相關(guān)117點(diǎn)二列相關(guān)適用于一類變量為二分變量,另一類變量為連續(xù)變量的相關(guān)計(jì)算。公式:rpq點(diǎn)二列相關(guān)系數(shù)為與二分變量通過(guò)組相對(duì)應(yīng)的連續(xù)變量的平均數(shù)為與二分變量未通過(guò)組相對(duì)應(yīng)的連續(xù)變量的平均數(shù)St為連續(xù)變量的標(biāo)準(zhǔn)差p通過(guò)組人數(shù)與總?cè)藬?shù)之比〔通過(guò)率〕q未通過(guò)組人數(shù)與總?cè)藬?shù)之比〔未通過(guò)率〕舉例〔例9〕:118例9:15名學(xué)生的測(cè)驗(yàn)情況學(xué)生總分項(xiàng)目分學(xué)生總分項(xiàng)目分190195502810105003801114914781124205771133516701143107691151008650∑X88258.8119公式:計(jì)算p=8/15=0.53計(jì)算Xp=(90+80+78+77+70+69+49+35)/8=68.5計(jì)算q=1-p=0.47計(jì)算Xq=(81+65+55+50+42+31+10)/7=47.7計(jì)算St=22.48計(jì)算df=N-2=15-2=13查表:當(dāng)df=13時(shí),r0.05(13)=0.514判斷:r=0.462∵r<0.514∴p>0.05120二列相關(guān)適用于兩個(gè)連續(xù)變量,但其中一個(gè)變量被人為分成兩類。公式:rb為二列相關(guān)系數(shù)y為p與q交界處正態(tài)曲線的高度Xp、Xq、St、p、q的意義與點(diǎn)二列相關(guān)公式相同當(dāng)兩個(gè)變量均為連續(xù)變量時(shí),也可使用皮爾遜積差相關(guān)方法計(jì)算。舉例:〔例9〕121公式:二列相關(guān)系數(shù)的顯著性檢驗(yàn)公式:N為總?cè)藬?shù)舉例〔上例〕:Z值小于1.96,p大于0.05,無(wú)顯著相關(guān)。122Ф相關(guān)此種相關(guān)適用于兩個(gè)變量均為二分稱名變量〔計(jì)數(shù)資料〕公式:式中a、b、c、d分別代表四格表中第一、二、三、四項(xiàng)中所包含的次數(shù)。舉例〔例10〕:求成功通過(guò)能力傾向測(cè)驗(yàn)〔以6分為界〕與工作成功與否之間的相關(guān)?a=22、b=38、c=33、d=7顯著性檢驗(yàn):用卡方〔X2〕檢驗(yàn)方法123能力傾向測(cè)驗(yàn)與工作成績(jī)的分布〔例10〕工作成績(jī)能力傾向測(cè)驗(yàn)得分12345678910合計(jì)工作成功101190812375121961252411552633216413524116工作失敗314692123252231211214011合計(jì)人數(shù)13131721239652100124區(qū)分度與難度的關(guān)系區(qū)分度與難度呈現(xiàn)的是一種曲線〔倒“U〞的關(guān)系〕。難度為0.5時(shí),區(qū)分度最高難度較高或較低時(shí),區(qū)分度中等非常高或非常低的難度時(shí),區(qū)分度也很低不同水平被試中區(qū)分度與難度的關(guān)系較難的題目對(duì)高水平被試有較高的區(qū)分度中等難度的題目對(duì)中水平被試有較高的區(qū)分度較容易的題目對(duì)低水平被試有較高的區(qū)分度平均難度0.5左右,能保持整體較好的區(qū)分度。125D的最大值與工程難度的關(guān)系項(xiàng)目通過(guò)率理論上最大區(qū)分度(以總分對(duì)半劃分高、低分組時(shí))高分組通過(guò)率低分組通過(guò)率D的最大值1.001.01.00.000.901.00.80.200.801.00.60.400.701.00.40.600.601.00.20.800.501.00.01.000.400.80.00.800.300.60.00.600.200.40.00.400.100.20.00.200.000.00.00.00126本卷須知當(dāng)測(cè)驗(yàn)用于選拔或診斷時(shí),應(yīng)該多項(xiàng)選擇擇難度值接近錄取率的工程。測(cè)驗(yàn)為選擇題時(shí),難度值應(yīng)大于隨機(jī)猜測(cè)概率水平。難度等于概率水平,說(shuō)明題目可能太難;或題意不清,被試憑猜測(cè)作答。難度〔通過(guò)率〕低于概率水平,說(shuō)明題目有系統(tǒng)偏差。是非題難度值0.75時(shí)最適宜,四選一題目0.63時(shí)最適宜。127題目難度在0.3~0.7之間,平均難度0.5時(shí),測(cè)驗(yàn)具有較理想的區(qū)分度。理論上講每個(gè)單題難度在0.5時(shí)具有最好的鑒別效率。同質(zhì)的題目難度在0.5時(shí),相關(guān)有偏高的趨勢(shì)。在極端的例子中,如果相關(guān)為1.0,難度均為0.5,那么50%的人全通過(guò),另50%的人全不通過(guò),區(qū)分效率反而下降。區(qū)分度取值在-1.0~+1.0之間。區(qū)分度為負(fù)值:題目不行區(qū)分度為正值:越接近1說(shuō)明區(qū)分度越好,越接近0說(shuō)明區(qū)分度越差。128工程分析實(shí)例4個(gè)四選一的題目,給370例有代表性的被試實(shí)施。分析步驟總分排序:取高分者27%〔100人〕為高分組,取低分者27%〔100人〕為低分組。計(jì)算高分組和低分組各題的通過(guò)率,以PH和PL表示。求出各題的難度和區(qū)分度〔鑒別指數(shù)和相關(guān)〕比較各種指標(biāo)根據(jù)工程分析結(jié)果剔除、修改或增加題目。129工程分析實(shí)例題號(hào)組別選答人數(shù)正確答案難度P區(qū)分度ABCD未答rbD1高分組592120B0.710.520.42低分組2250121602高分組581015161A0.420.330.32低分組2621153623高分組1715282812D0.31-0.04-0.06低分組25111934114高分組14414365C0.120.080.04低分度總體偏難,但根本可以接受區(qū)分度第一題最好第二題可以第三題二列相關(guān)系數(shù)和鑒別指數(shù)均為負(fù),不行第四題二列相關(guān)系數(shù)和鑒別指數(shù)均偏低答復(fù)選擇第一、二題根本可以,后者答案C無(wú)鑒別力。第三題未做人數(shù)多,且B、C、D均為負(fù)相,差。第四題選A人少,可能答案缺乏似真性,D項(xiàng)也有負(fù)相,不理想。結(jié)論第一、二題保存第三題剔除第四題可以修改后再用131第三節(jié)
測(cè)驗(yàn)結(jié)果的解釋132智力測(cè)驗(yàn)的一般原那么及解釋舉例分析的內(nèi)容測(cè)驗(yàn)中行為的分析判斷測(cè)驗(yàn)有效與否測(cè)驗(yàn)過(guò)程中特殊行為的含義測(cè)驗(yàn)分?jǐn)?shù)的分析133測(cè)驗(yàn)分?jǐn)?shù)的分析步驟〔提綱〕與常模總體的比較分測(cè)驗(yàn)量表分與常模的比較IQ的功能和百分位IQ的分等測(cè)驗(yàn)分?jǐn)?shù)的可信區(qū)間與其他人的測(cè)驗(yàn)結(jié)果比較被試自身強(qiáng)弱點(diǎn)分析分量表的平衡性〔V–P差異〕各分測(cè)驗(yàn)的差異分測(cè)驗(yàn)與平均分的差異134測(cè)驗(yàn)結(jié)果與常??傮w的比較分測(cè)驗(yàn)量表分與常模的比較各分測(cè)驗(yàn)單獨(dú)測(cè)量的能力多個(gè)分測(cè)驗(yàn)聯(lián)合測(cè)量的能力135136137138WAIS-RC三因子模型言語(yǔ)理解因子知覺(jué)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版拆遷安置房產(chǎn)權(quán)分割及交易協(xié)議4篇
- 專業(yè)平面視覺(jué)創(chuàng)作協(xié)議版
- 2025年度文化展覽場(chǎng)地租賃保證金三方執(zhí)行協(xié)議4篇
- 專業(yè)樹(shù)木銷售協(xié)議2024年版細(xì)化范本版A版
- 2025年度高端醫(yī)療設(shè)備采購(gòu)合同模板4篇
- 2025年度拆遷項(xiàng)目資金監(jiān)管與居間服務(wù)協(xié)議4篇
- 二零二五年度農(nóng)家樂(lè)合伙人合作協(xié)議3篇
- 2025年廠區(qū)公共區(qū)域清潔與物業(yè)管理合作協(xié)議范本4篇
- 2025年度商業(yè)綜合體室內(nèi)外裝修一體化合同4篇
- 專業(yè)羽毛球場(chǎng)租借合同(2024年)版B版
- 2023社會(huì)責(zé)任報(bào)告培訓(xùn)講稿
- 2023核電廠常規(guī)島及輔助配套設(shè)施建設(shè)施工技術(shù)規(guī)范 第8部分 保溫及油漆
- 2025年蛇年春聯(lián)帶橫批-蛇年對(duì)聯(lián)大全新春對(duì)聯(lián)集錦
- 表B. 0 .11工程款支付報(bào)審表
- 警務(wù)航空無(wú)人機(jī)考試題庫(kù)及答案
- 空氣自動(dòng)站儀器運(yùn)營(yíng)維護(hù)項(xiàng)目操作說(shuō)明以及簡(jiǎn)單故障處理
- 新生兒窒息復(fù)蘇正壓通氣課件
- 法律顧問(wèn)投標(biāo)書
- 班主任培訓(xùn)簡(jiǎn)報(bào)4篇(一)
- 成都市數(shù)學(xué)八年級(jí)上冊(cè)期末試卷含答案
- T-CHSA 020-2023 上頜骨缺損手術(shù)功能修復(fù)重建的專家共識(shí)
評(píng)論
0/150
提交評(píng)論