




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、北京大學(xué)心理測量串講筆記(三)第5章信度1、信度是指:測量結(jié)果的可靠性和一致性。因?yàn)樾睦?測驗(yàn)通常測量人的行為,行為會(huì)由于各種各樣的原因,因 時(shí)、因事、因地而產(chǎn)生變動(dòng),這些因素有些是偶然的,有 些是固有的,人在完成心理測驗(yàn)時(shí)的行為也會(huì)受上述因素 的影響,從而使測驗(yàn)結(jié)果與真實(shí)結(jié)果不完全一致,所以我 們要用信度來衡量測驗(yàn)的可靠性和一致性。2、信度的操作化定義:(1)誤差理論認(rèn)為:一個(gè)人的測驗(yàn)分?jǐn)?shù)x是由真實(shí)分 數(shù)(t)和誤差(e)兩部分構(gòu)成的,公式是x=t+e.(2)因此信度就被定義為:一組測量分?jǐn)?shù)的真實(shí)方差 與實(shí)得方差的比,或者是指真實(shí)方差占總方差的百分比。 公式為:rxx=l-se2/sx2(3
2、)根據(jù)統(tǒng)計(jì)學(xué)理論,真實(shí)方差與實(shí)得方差的比是一 個(gè)相關(guān)系數(shù)的平方,所以我們把這種相關(guān)系數(shù)的平方叫做 信度系數(shù)。(4)計(jì)算公式為:rxx=st2 / sx 23、由于誤差的來源信度的可分為:這種分類是基于信 度的傳統(tǒng)定義-真分?jǐn)?shù)理論。(1 )重測信度:考慮的誤差來源是時(shí)間取樣。(2)復(fù)本信度:考慮的誤差來源是內(nèi)容取樣。(3)分半信度:它考慮的誤差來源也是內(nèi)容取樣,它 與復(fù)本信度的差別是:分半信度考查一個(gè)測驗(yàn)內(nèi)容的兩半 題目測量的是否是同一個(gè)心理特點(diǎn)行為。(4)同質(zhì)性信度(內(nèi)部一致性系數(shù)):考慮的是測驗(yàn) 內(nèi)容是否異質(zhì)。(5)評分者信度:考慮的誤差來源是評分者間的差別。4、信度的表示方法:(1)信度系
3、數(shù)和信度指數(shù):1 信度系數(shù):rxx=rx2 t=s2t / s22信度指數(shù):rxt=st / s x(2)測量標(biāo)準(zhǔn)誤:s e=sx1rxx5、信度的意義:(1)信度系數(shù)可以解釋為樣本測驗(yàn)分?jǐn)?shù)的總方差中有 多少比例是真分?jǐn)?shù)方差,也就是測驗(yàn)的總變異中真分?jǐn)?shù)造 成的變異占百分之幾。它直接告訴我們測量的誤差有多大。(2)測量的標(biāo)準(zhǔn)誤可以告訴我們有多大可能性真實(shí)分 數(shù)在某一分?jǐn)?shù)范圍內(nèi),并且可以預(yù)測實(shí)得分?jǐn)?shù)再測時(shí)可能 的變化情況。6、信度的作用:(1)解釋預(yù)測個(gè)人分?jǐn)?shù)的意義。(2)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)間的關(guān)系,明確告訴我們測驗(yàn)誤差大小。(3) 新編的測驗(yàn)信度應(yīng)高于原有的同類測驗(yàn)或相似測驗(yàn)。(4) 下結(jié)論
4、說某測驗(yàn)比較可靠,必須是依據(jù)情境的, 經(jīng)多次證實(shí)的。(5) 它是確定測驗(yàn)好壞的一個(gè)指標(biāo)。一般的原則是:1當(dāng)rxxvo. 70時(shí),測驗(yàn)不能用于對個(gè)人作出評價(jià)或預(yù) 測,而且不能做團(tuán)體間比較。2當(dāng)0. 70wrxx<0. 85時(shí),可用于團(tuán)體比較。3當(dāng)rxx$0.85時(shí),才可以用來鑒別或預(yù)測個(gè)人成績或 作用7、重測信度:有時(shí)也叫穩(wěn)定性,主要針對時(shí)間變量。(1) 重測信度采集數(shù)據(jù)得方法是:對同一組被試間隔 一定的時(shí)間重復(fù)測試一次。(4)重測信度的計(jì)算方法是積差相關(guān)法,因而rx x就 是皮爾遜的積差相關(guān)系數(shù)。(7)重測信度的時(shí)間間隔選擇依測驗(yàn)性質(zhì)和目的而定, 如果測驗(yàn)是用于長期預(yù)測,則測量間隔長一些
5、。對兒童的 智力測驗(yàn)一般是兩周到四周為宜。對成年人,間隔可到半 年,很少超過6個(gè)月。(13)使用重測信度應(yīng)注意:不是所有測驗(yàn)都可以計(jì) 算重測信度。并且重測信度只是反映了隨機(jī)誤差的影響, 而不是反映被試心理特點(diǎn)的長期變化。8、復(fù)本信度:又叫等值性系數(shù)。(1) 數(shù)據(jù)采集方法是:給被試施測兩個(gè)內(nèi)容等值但題 目不同的測驗(yàn),求兩組數(shù)值的相關(guān)。計(jì)算方法常見的也是 積差相關(guān)法。(2) 復(fù)本信度的高低反映了兩個(gè)互為復(fù)本的測驗(yàn)等價(jià) 的程度,而不是反映一個(gè)測驗(yàn)本身受隨機(jī)誤差影響的大小。 復(fù)本信度的高低關(guān)鍵取決于復(fù)本測驗(yàn)的選擇,因而施題目 取樣問題,或者說是測驗(yàn)的內(nèi)容取樣問題。(3 )復(fù)本信度優(yōu)于重測信度的地方是:
6、避免了重測帶 來的記憶效應(yīng)和練習(xí)效應(yīng);可用于長期追蹤研究前后測量; 減少了作弊的可能性。(4) 復(fù)本信度的缺點(diǎn):有些測驗(yàn)的復(fù)本很難找到;有 些測驗(yàn)因正遷移效應(yīng)使測驗(yàn)性質(zhì)改變;如測量的內(nèi)容很容 易受練習(xí)的影響,復(fù)本信度也無法清除這種練習(xí)效應(yīng)。(5) 重測復(fù)本信度,即再不同的時(shí)間里施測兩個(gè)等值 的測驗(yàn)(復(fù)本),得到的相關(guān)就是重測復(fù)本信度,也叫穩(wěn)定 等值系數(shù)。它比單一的重測信度或復(fù)本信度都要嚴(yán)格、全 面一些。9、斯皮爾曼-布朗公式:rnn =nrtt / 1+ (n13、1) rtt, 14、rnn是校正以后的相關(guān)系數(shù),15、rtt是實(shí)得的 相關(guān)系數(shù),16、n為rnn對應(yīng)的測驗(yàn)長度與rtt對應(yīng)的測驗(yàn)
7、 長度之比。分半時(shí),17、n=n/ (n/ 2) =2 (n為測驗(yàn)全 長),18、所以分半法信度的校正公式是:rxx=2rn n / 1+rhh其中rh h為兩半測驗(yàn)的相關(guān)系數(shù)。(1)盧倫公式:rxx=lsd2 / s x2其中sd2是兩半測 驗(yàn)分?jǐn)?shù)之差的方差,sx 2為總方差。(2)從理論上分析,分半信度反映的實(shí)際上是兩半測 驗(yàn)?zāi)軌驕y量相同內(nèi)容或心理特點(diǎn)的程度。10、內(nèi)部一致性信度(同質(zhì)性信度):同質(zhì)性是指測驗(yàn) 的所有題目間性質(zhì)的一致性,即測的是同一種心理特質(zhì)或 行為。同質(zhì)性是測量單一特質(zhì)的必要條件。這里講的同質(zhì) 性是指測驗(yàn)題目得分反映的心理特質(zhì)一致,同質(zhì)性的判別 標(biāo)準(zhǔn)是:題目間呈高正相關(guān),
8、如果相關(guān)很低或是呈負(fù)相關(guān), 則題目為異質(zhì)。(1)庫德和里查德森提出的k-r20公式只適合預(yù)測題 目是二分法計(jì)分的??藗惏秃誥系數(shù)適合于非二分法計(jì)分 的測驗(yàn)的內(nèi)部一致性信度估計(jì)法。(2)從同質(zhì)性信度的含義我們不難看出,分半信度是 求測驗(yàn)兩半之間的一致性或同質(zhì)性,而同質(zhì)性是求所有題 目間的一致性。因此分半信度實(shí)際上是同質(zhì)性信度的一 種,可以作為測驗(yàn)同質(zhì)性評價(jià)的粗略估計(jì)指標(biāo)。因?yàn)榭梢?根據(jù)測驗(yàn)得分來推論或驗(yàn)證某種概念或理論構(gòu)思,因此同 質(zhì)性信度也是一種構(gòu)思效度,或叫結(jié)構(gòu)效度,它實(shí)際上介 于信度與效度之間。11、評分者信度:有些心理測驗(yàn)的得分不是根據(jù)客觀的計(jì)分系統(tǒng)計(jì)分的, 是由評分者來給被試打分,因此
9、,這樣的測驗(yàn)的可靠性如 何取決于評分者評分的一致性和穩(wěn)定性如何。評分者信度 因評分者人數(shù)不同而估計(jì)方法不一樣。如果是兩個(gè)評分者,獨(dú)立對被試的反應(yīng)評分,則可以用積差相關(guān)來計(jì)算,或用斯皮爾曼等級相關(guān)法計(jì)算。如果評分者在三人以上,而且 是等級評分,則可以用"肯德爾和諧系數(shù)”(w )來求評分 者信度。12、以測量標(biāo)準(zhǔn)誤表示信度的好處是:(1) 信度的單位與測驗(yàn)分?jǐn)?shù)的單位相同,因此解釋個(gè) 人分?jǐn)?shù)時(shí)非常直接,能直接指出允許測驗(yàn)分?jǐn)?shù)變化的范圍。(2) 測驗(yàn)同質(zhì)與否并不影響測量標(biāo)準(zhǔn)誤的大小。測量 標(biāo)準(zhǔn)誤的不足之處時(shí):無法比較不同測驗(yàn)間的信度高低。 比較不同測驗(yàn)的信度用信度系數(shù)(rxx)解釋個(gè)人分?jǐn)?shù)時(shí)
10、用 測量標(biāo)準(zhǔn)誤(se )。13、常見的影響信度的因素有:樣本特征、測驗(yàn)的長 度、測驗(yàn)的難度、測量的時(shí)間間隔等。14、我們做信度考驗(yàn)時(shí),常常選取一個(gè)與常模樣本性質(zhì)相同的樣本施測,根據(jù)被試得分求出信度系數(shù)。(1) 樣本團(tuán)體得分分布的影響:求信度的樣本團(tuán)體得 分分布如果比較窄小的話信度就低。(2) 樣本團(tuán)體異質(zhì)性的影響:樣本團(tuán)體異質(zhì)的話,測 驗(yàn)分?jǐn)?shù)的分布就比同質(zhì)樣本的要廣,分?jǐn)?shù)的離差就大,樣 本的方差就大,信度就高。實(shí)際上,高信度可能是假性高 信度,是由樣本團(tuán)體的異質(zhì)造成的。但如果常模總體要求 各種各樣的人,則異質(zhì)的信度樣本求得的信度就是真信度。 這時(shí),相反的情況就需要校正信度。(3) 樣本團(tuán)體平均
11、能力水平的影響。由于信度也會(huì)因 樣本間團(tuán)體平均能力水平的不同而不同,因此在求信度 時(shí),一定要注意信度樣本與常??傮w間是否一致。15、測驗(yàn)的長度:在其他條件均等的情況下,測驗(yàn)越 長,信度越高。原因在于:(1) 測驗(yàn)越長,即題目越多,測驗(yàn)的內(nèi)容取樣就越有 可能有代表性。(2) 測驗(yàn)越長,被試的猜測因素影響就越小。16、測驗(yàn)的難度:難度對信度的影響之存在于某些測 驗(yàn)中,如智力測驗(yàn)、成就測驗(yàn)、能力傾向測驗(yàn)、教育測驗(yàn) 等。測驗(yàn)的難度對信度有間接影響,因?yàn)槿绻麥y驗(yàn)過難, 被試的得分會(huì)集中在低分區(qū)。過于容易,分?jǐn)?shù)則集中在高 分區(qū)。兩種情況都使信度樣本的得分范圍變窄,變異量降 低,從而低估測驗(yàn)信度。17、測驗(yàn)
12、的時(shí)間間隔:這一因素之對重測信度和不同 時(shí)測量時(shí)的復(fù)本信度有影響,對其余的信度來說不存在時(shí) 間間隔問題。第6章效度1、效度是指:測驗(yàn)?zāi)軠y量到所要測量的對象的程度。 這一定義包含著兩層含義:測驗(yàn)測量什么?測驗(yàn)對測量目 標(biāo)的測量精確度和真實(shí)性是多少?2、效度的公式為:rxy=sv 2 / sx2它是與測量目標(biāo)有 關(guān)的真實(shí)分?jǐn)?shù)方差與總方差的比率。其中rx y是常用的效 度表示法;sv2是“有關(guān)的真實(shí)方差”,也就是由測驗(yàn)所要 測量的心理變量引起的方差,也叫有效方差;sx 2是總方 差。3、信度和效度的差別是:兩者所涉及的誤差不同:信 度僅考慮偶然的隨機(jī)誤差占測驗(yàn)總變異的比例,效度則還 包括與測驗(yàn)無關(guān)的
13、但穩(wěn)定的測量誤差。(1) 信度是效度的必要而非充分條件。(2) 效度是受信度制約的。4、效度的性質(zhì):效度的真實(shí)含義是指測驗(yàn)結(jié)果的效 度,也就是測驗(yàn)結(jié)果的準(zhǔn)確程度。(1)效度具有相對性。(2)效度具有連續(xù)性。測驗(yàn)的有效性只有程度上的差(3)效度也不是直接就可以測量到的,它是從已有的 證據(jù)推理而來的。5、效度的種類:內(nèi)容效度、構(gòu)思效度和效標(biāo)關(guān)聯(lián)效度。6、效標(biāo)關(guān)聯(lián)效度是指:測驗(yàn)總分?jǐn)?shù)與外在標(biāo)20、準(zhǔn)(效標(biāo))之間的相關(guān)程度,反映的是用測驗(yàn)預(yù)測個(gè)體在某 種情境下行為的表現(xiàn)如何的有效性程度。由于外在標(biāo)準(zhǔn)成 了考察測驗(yàn)有效性的參照標(biāo)準(zhǔn),因此簡稱為效標(biāo)。7、阿斯丁把效標(biāo)分為兩個(gè)層次:一是理論描述水平的“觀念效
14、標(biāo)”,二是操作定義水平的“效標(biāo)測量”。(1 )觀念效標(biāo)是效標(biāo)的理論定義,效標(biāo)測量是效標(biāo)的 操作定義,效標(biāo)測量必須能真正反映觀念效標(biāo)。(2)效標(biāo)測量的一個(gè)重要特征是客觀性。為此因做到: 1避免偏見影響效標(biāo)測量,特別是以等級評定為效標(biāo)4 測量時(shí),評分者的主觀偏見會(huì)有很大影響。2防止效標(biāo)污染,即指個(gè)人的效標(biāo)因評定者知道個(gè)體的 測驗(yàn)分?jǐn)?shù)(也叫預(yù)測源分?jǐn)?shù))而受到影響。8、常用的效標(biāo):學(xué)業(yè)成就、臨床診斷、實(shí)際工作表 現(xiàn)、特殊訓(xùn)練成績、效標(biāo)團(tuán)體比較、先前有效的測驗(yàn)、等 級評定。9、同時(shí)效度:它的效標(biāo)資料是和測驗(yàn)分?jǐn)?shù)差不多同時(shí) 搜集的。一般情況下,它可以代替預(yù)測效度。10、預(yù)測效度的效標(biāo)是經(jīng)過一段時(shí)間以后才獲
15、得的, 預(yù)測效度反映的是從測驗(yàn)分?jǐn)?shù)預(yù)測任何效標(biāo)情境或一段時(shí) 間后被試的行為表現(xiàn)的程度。11、構(gòu)思效度就是:心理測驗(yàn)對某一理論概念或特質(zhì) 測量的程度。因此,研究構(gòu)思效度就是要搞清楚:測驗(yàn)測 量的是什么構(gòu)思(概念或特質(zhì))?測驗(yàn)分?jǐn)?shù)的變異中有多 少來自于測驗(yàn)的理論構(gòu)思?構(gòu)思效度是沒有單一指標(biāo)的, 它是由各方面證據(jù)累積起來作出評價(jià)的。12、確定構(gòu)思效度的基本步驟:建立理論框架、根據(jù) 理論框架推演出有關(guān)測驗(yàn)成績的假設(shè)、用邏輯或?qū)嵶C的方 法來證明假設(shè)。13、確定構(gòu)思效度的方法:測驗(yàn)內(nèi)部的方法、測驗(yàn)間 的方法、效標(biāo)效度的研究、實(shí)驗(yàn)和觀察法驗(yàn)證。(1) 測驗(yàn)內(nèi)方法:這類方法是通過研究測驗(yàn)內(nèi)部結(jié)構(gòu) 來界定理論構(gòu)
16、思,從而為構(gòu)思效度提供證據(jù)。(2) 確定方法是:分析測驗(yàn)的內(nèi)容效度和測驗(yàn)的內(nèi)部 一致性分析。測驗(yàn)的內(nèi)部一致性可以由分半信度、a系數(shù)、 kr2 0或kr21等指標(biāo)來衡量,它們考察的是測驗(yàn)題目是否 同質(zhì),分測驗(yàn)與總測驗(yàn)是否一致或同質(zhì),這些都可以證明 測驗(yàn)所測量的構(gòu)思是否合理,因而構(gòu)成了證實(shí)構(gòu)思效度高 低的證據(jù)。(3) 有時(shí)分析被試對題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。(4) 測驗(yàn)間的方法:通過分析幾個(gè)測驗(yàn)間的相關(guān)關(guān)系, 找出其共同之處,進(jìn)行推斷這些測驗(yàn)測量的特質(zhì)是什么, 也可以確定這些測驗(yàn)構(gòu)思效度如何。最簡單的方法是計(jì)算 兩種測驗(yàn)之間得分的相關(guān)。區(qū)分效度是構(gòu)思效度的又一個(gè) 證據(jù)。因素分析法也是
17、建立構(gòu)思效度的常用方法。(5) 實(shí)驗(yàn)法和觀察法證實(shí):觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù) 的差異也是驗(yàn)證構(gòu)思效度的方法之一。14、內(nèi)容效度是指:測驗(yàn)題目對有關(guān)內(nèi)容或行為總體 取樣的適當(dāng)性程度。因?yàn)檫@種效度主要是考察測驗(yàn)的內(nèi)容, 因此叫內(nèi)容效度。(1)要想使測驗(yàn)的內(nèi)容效度高,必須又兩個(gè)條件:內(nèi) 容的范圍或行為總體必須界定名確;測驗(yàn)題目應(yīng)該是所界 定的內(nèi)容范圍的代表性樣本。(2 )內(nèi)容效度的確定方法:專家判斷、經(jīng)驗(yàn)判斷、統(tǒng) 計(jì)分析法。15、表面效度是指:一個(gè)測驗(yàn)看起來好象是測量所要 測的東西的程度。換句話說,當(dāng)那些未經(jīng)過訓(xùn)練的被試或 測驗(yàn)應(yīng)用者認(rèn)為某測驗(yàn)是有效的測驗(yàn)時(shí),該測驗(yàn)就有表面 效度。16、效度的指標(biāo)是指:效標(biāo)關(guān)聯(lián)效度和構(gòu)思效度的的 指標(biāo)。效度指標(biāo)一般有:效度系數(shù)、統(tǒng)計(jì)推斷參數(shù)、預(yù)期 表等。17、效度系數(shù):它是最常用的效度指標(biāo),尤其是效標(biāo) 關(guān)聯(lián)效度。它是以皮爾遜積差相關(guān)系數(shù)來表示的。效度系 數(shù)的實(shí)際意義常以決定性系數(shù)來表示,表達(dá)式是rx2y,效 度系數(shù)的平方就是決定性系數(shù),測驗(yàn)正確預(yù)測或解釋的效 標(biāo)的方差占總方差的比例。18、效度的其他指標(biāo):一些描述不同團(tuán)體的差異的統(tǒng) 計(jì)指標(biāo)(參數(shù))也可以作為效度的指標(biāo),比如:t考驗(yàn)、f 考驗(yàn)、重疊百分比等。19、效度的影響因素:測驗(yàn)本身的因素、測
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)藥銷售代理合同全文
- 化工原料進(jìn)口代理合同(范本)
- 夫妻和諧共處合同書
- 員工合同樣本集錦
- 國內(nèi)快遞運(yùn)輸服務(wù)合同細(xì)則
- 單位公益捐贈(zèng)合同協(xié)議
- 合資公司成立的投資合同范本
- 合成氣生產(chǎn)中的催化劑考核試卷
- 寵物友好公共設(shè)施清潔保養(yǎng)質(zhì)量監(jiān)管考核試卷
- 康復(fù)輔具適配與物理治療結(jié)合考核試卷
- 幼兒園百科常識100題
- 創(chuàng)意美術(shù)課3歲-12歲大師課《彼埃.蒙德里安》課件
- 哲學(xué)與人生(中職)PPT完整全套教學(xué)課件
- 社區(qū)免費(fèi)使用房屋協(xié)議書
- 一年級語文下冊《我多想去看看》教案
- 工程EPC總承包項(xiàng)目安全生產(chǎn)管理辦法
- 05臨水臨電臨時(shí)設(shè)施安全監(jiān)理細(xì)則
- 國家煙草行業(yè)物流管理
- “小學(xué)品德與生活教學(xué)關(guān)鍵問題實(shí)踐研究”課題研究中期報(bào)告
- 采購入庫單模板
- GB/T 15566.6-2007公共信息導(dǎo)向系統(tǒng)設(shè)置原則與要求第6部分:醫(yī)療場所
評論
0/150
提交評論