心理測(cè)量的信度測(cè)試_第1頁(yè)
心理測(cè)量的信度測(cè)試_第2頁(yè)
心理測(cè)量的信度測(cè)試_第3頁(yè)
心理測(cè)量的信度測(cè)試_第4頁(yè)
心理測(cè)量的信度測(cè)試_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

心理測(cè)量的信度測(cè)試第一節(jié)信度概述

一、什么是信度

信度又叫可靠性,是指測(cè)量結(jié)果的穩(wěn)定性程度或一致性程度。一個(gè)好的測(cè)驗(yàn)必須穩(wěn)定可靠,即多次測(cè)量的結(jié)果保持一致,否則便不可信。心理測(cè)量的信度測(cè)試任何一種測(cè)量,總有或多或少的誤差,信度受隨機(jī)誤差的影響。隨機(jī)誤差越大,信度也就越低;隨機(jī)誤差越小,信度就越高。信度也可看作測(cè)量結(jié)果受機(jī)遇影響的程度。心理測(cè)量的信度測(cè)試信度的含義可以從兩個(gè)層面加以分析:(1)當(dāng)我們以同樣的測(cè)量工具重復(fù)測(cè)量某項(xiàng)持久性的特質(zhì)時(shí),是否得到相同的結(jié)果?由此可知此一測(cè)量工具的穩(wěn)定性。(2)測(cè)量工具能否減少隨機(jī)誤差的影響,提供某項(xiàng)特質(zhì)個(gè)別差異程度的真實(shí)量數(shù)?由此可知測(cè)量結(jié)果的精確性。心理測(cè)量的信度測(cè)試準(zhǔn)確性與一致性的關(guān)系一致但不準(zhǔn)確不一致也不準(zhǔn)確一致且準(zhǔn)確心理測(cè)量的信度測(cè)試在測(cè)量理論中,信度被定義為:一組測(cè)量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實(shí)得分?jǐn)?shù)的變異數(shù))的比率。即:XX=ST2/SX2式中XX代表測(cè)量的信度,ST2代表真分?jǐn)?shù)變異數(shù),SX2代表總變異數(shù),即實(shí)得分?jǐn)?shù)的變異數(shù)。心理測(cè)量的信度測(cè)試由于SX2=ST2+SE2,所以信度還可表示為:XX=(SX2-SE2)/SX2=1-SE2/SX2信度在1(完全可信)與0(不可信)之間由于真分?jǐn)?shù)的變異數(shù)是不能直接測(cè)量的,因此信度是一個(gè)理論上構(gòu)想的概念,由于我們無(wú)法得到測(cè)驗(yàn)的真正信度,我們只能用一些指標(biāo)對(duì)它進(jìn)行估計(jì)。心理測(cè)量的信度測(cè)試二、信度系數(shù)大部分的信度指標(biāo)都以相關(guān)系數(shù)表示,即用同一被試樣本所得的兩組資料的相關(guān)作為測(cè)量一致性的指標(biāo),稱作信度系數(shù)。要注意三點(diǎn):(1)在不同的情況下,對(duì)不同樣本,采用不同方法會(huì)得到不同的信度系數(shù),因此一個(gè)測(cè)驗(yàn)可能不止一個(gè)信度系數(shù)。(2)信度系數(shù)只是對(duì)測(cè)量分?jǐn)?shù)不一致程度的估計(jì),并沒(méi)有指出不一致的原因。(3)獲得較高的信度系數(shù)并不是心理測(cè)量追求的最終目標(biāo),它只是邁向目標(biāo)的一步,是使測(cè)驗(yàn)有效的一個(gè)必要條件。心理測(cè)量的信度測(cè)試信度系數(shù)達(dá)到多高才可以接受呢?最理想的情況是XX=1,但這是辦不到的。一般能力與成就測(cè)驗(yàn)的信度系數(shù)要求在以上,有的可以達(dá)到;至于性格、興趣、價(jià)值觀等人格測(cè)驗(yàn)的信度系數(shù),通常在080到085或更高些。當(dāng)XX時(shí),不能用測(cè)驗(yàn)來(lái)對(duì)個(gè)人作評(píng)價(jià),也不能在團(tuán)體間作比較;當(dāng)XX大于或等于時(shí),可用于團(tuán)體間比較;當(dāng)XX大于或等于時(shí),可用于鑒別個(gè)人。心理測(cè)量的信度測(cè)試任何測(cè)驗(yàn)只有包含特定樣本的題目,由特定的施測(cè)者,對(duì)特定的被試,在特定的時(shí)間、地點(diǎn)施測(cè),情況不同便會(huì)得到不同的分?jǐn)?shù)。由于信度系數(shù)總是在特定情況下獲得的,因此,只有當(dāng)一個(gè)測(cè)驗(yàn)在很多情況下被證實(shí)具有較高的信度時(shí),才可以說(shuō)它是比較可靠的測(cè)驗(yàn)。心理測(cè)量的信度測(cè)試三、信度的作用信度系數(shù)有兩個(gè)實(shí)際用處:一是用來(lái)解釋個(gè)人分?jǐn)?shù)的意義二是用來(lái)比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異心理測(cè)量的信度測(cè)試1.信度可以用來(lái)解釋個(gè)人測(cè)驗(yàn)分?jǐn)?shù)的意義由于存在測(cè)量誤差,一個(gè)人所得分?jǐn)?shù)有時(shí)比真分?jǐn)?shù)高,有時(shí)比真分?jǐn)?shù)低,有時(shí)二者相等。理論上我們可對(duì)一個(gè)人施測(cè)無(wú)限多次,然后求所得分?jǐn)?shù)的平均數(shù)與標(biāo)準(zhǔn)差,這樣平均數(shù)就是這個(gè)人的真分?jǐn)?shù),標(biāo)準(zhǔn)差就是測(cè)量誤差大小的指標(biāo)。但這在實(shí)際上是行不通的。然而,我們可以用一組被試(人數(shù)足夠多)兩次施測(cè)的結(jié)果來(lái)代替對(duì)同一個(gè)人反復(fù)施測(cè),以估計(jì)測(cè)量誤差的變異數(shù)。此時(shí),每個(gè)人在兩次測(cè)驗(yàn)中的分?jǐn)?shù)之差可以構(gòu)成一個(gè)新的分布,這個(gè)分布的標(biāo)準(zhǔn)差就是測(cè)量的標(biāo)準(zhǔn)誤,是表示測(cè)量誤差大小的指標(biāo)。心理測(cè)量的信度測(cè)試測(cè)量的標(biāo)準(zhǔn)誤可用下式計(jì)算:SE=SX√(1-XX)

這里SE為測(cè)量的標(biāo)準(zhǔn)誤,SX為所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,XX為測(cè)量的信度。從式中可以看出,測(cè)量的標(biāo)準(zhǔn)誤與信度之間有互為消長(zhǎng)的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越??;信度越低,標(biāo)準(zhǔn)誤越大。心理測(cè)量的信度測(cè)試根據(jù)上公式,知道了一組測(cè)量的標(biāo)準(zhǔn)差和信度系數(shù),就可以求出測(cè)量的標(biāo)準(zhǔn)誤。進(jìn)一步我們就可以從每個(gè)人的實(shí)得分?jǐn)?shù)估計(jì)出真分?jǐn)?shù)的可能范圍,即確定出在不同或然率水準(zhǔn)上真分?jǐn)?shù)的置信區(qū)間。人們一般采用95%的或然率水準(zhǔn),其置信區(qū)間為:()

T(X+1.96SE)這就是說(shuō),大約有95%的可能性真正分?jǐn)?shù)落在所得分?jǐn)?shù)的范圍內(nèi),或者5%的可能性落在這范圍之外。這實(shí)際上也表明了再測(cè)時(shí)分?jǐn)?shù)改變的可能范圍。心理測(cè)量的信度測(cè)試?yán)}在一次測(cè)驗(yàn)中有一學(xué)生得80分,這是否反映了他們的真實(shí)水平?如果再測(cè)一次他的分?jǐn)?shù)將改變多少?已知該次測(cè)驗(yàn)的標(biāo)準(zhǔn)差為5,信度系數(shù)為。首先計(jì)算SE:SE=5

()=2T=801.96我們可以說(shuō)該學(xué)生的真正分?jǐn)?shù)有95%的可能性落在76與84分之間。心理測(cè)量的信度測(cè)試2.信度可以幫助進(jìn)行不同測(cè)驗(yàn)分?jǐn)?shù)的比較來(lái)自不同測(cè)驗(yàn)的原始分?jǐn)?shù)是無(wú)法直接比較的,而必須將它們轉(zhuǎn)換成相同尺度的標(biāo)準(zhǔn)分?jǐn)?shù)才能進(jìn)行比較。例:某班期末考試,張生語(yǔ)文、數(shù)學(xué)的成績(jī)轉(zhuǎn)換成T分?jǐn)?shù)(平均數(shù)為50、標(biāo)準(zhǔn)差為10)分別為65和70,由此我們可以知道張生的數(shù)學(xué)比語(yǔ)文考得稍好些,但二者差異是否有意義,仍不清楚。心理測(cè)量的信度測(cè)試為了說(shuō)明個(gè)人在兩種測(cè)驗(yàn)上表現(xiàn)的優(yōu)劣,我們可以用“差異的標(biāo)準(zhǔn)誤”來(lái)檢驗(yàn)其差異的顯著性,常用的公式為:SEd=S√(2-XX-YY)公式中SEd為差異的標(biāo)準(zhǔn)誤,S為標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差(如T分?jǐn)?shù)的S=10),XX和YY分別是兩個(gè)測(cè)驗(yàn)的信度系數(shù)。心理測(cè)量的信度測(cè)試如上例中,假定此次語(yǔ)文、數(shù)學(xué)考試的信度分別為和,張生的兩個(gè)分?jǐn)?shù)差異的標(biāo)準(zhǔn)誤為:SEd=10√()=5若采用95%的置信區(qū)間(即.05顯著水平),則張生在這兩門課上T分?jǐn)?shù)的差異必須達(dá)到或超過(guò)SEd=1.965=9.8,才能認(rèn)為二者真有差異。因?yàn)閿?shù)學(xué)的T分?jǐn)?shù)只比語(yǔ)文高5分,所以差異并不顯著。心理測(cè)量的信度測(cè)試用SE估計(jì)個(gè)人分?jǐn)?shù)的誤差

要注意四點(diǎn):(1)一個(gè)測(cè)驗(yàn)有很多可能的信度估計(jì),因而也有同樣多的標(biāo)準(zhǔn)誤估計(jì),在實(shí)際工作中要注意選擇最適合某一特殊情況的信度估計(jì)來(lái)解決問(wèn)題。(2)理論假定SE在所有分?jǐn)?shù)水平都一樣,但有時(shí)高分段與低分段其標(biāo)準(zhǔn)誤并不相同。水平高的人與水平低的人在做測(cè)量時(shí)會(huì)有不同的隨機(jī)誤差,受隨機(jī)誤差的影響也不一樣。心理測(cè)量的信度測(cè)試(3)測(cè)驗(yàn)分?jǐn)?shù)是一個(gè)人真正分?jǐn)?shù)的最佳估計(jì),但由于存在測(cè)量誤差,所以必須將測(cè)驗(yàn)分?jǐn)?shù)看成以該點(diǎn)為中心上下波動(dòng)的范圍,而不要看成確切的點(diǎn)。這一范圍有多寬將取決于測(cè)量標(biāo)準(zhǔn)誤的大小,最終取決于信度系數(shù)。(4)測(cè)量標(biāo)準(zhǔn)誤是對(duì)測(cè)量誤差的描繪,用它能對(duì)個(gè)人真正分?jǐn)?shù)的置信區(qū)間作出估計(jì),但用它來(lái)估計(jì)個(gè)人真正水平則可能導(dǎo)致嚴(yán)重錯(cuò)誤,因?yàn)樗鼪](méi)有考慮到系統(tǒng)誤差的影響。心理測(cè)量的信度測(cè)試第二節(jié)信度的估計(jì)方法信度是反映測(cè)量中隨機(jī)誤差大小的指標(biāo)。由于造成測(cè)量的隨機(jī)誤差的方式或來(lái)源多種多樣,所以信度的估計(jì)方法也多種多樣。下面所介紹的信度估計(jì)方法是分別考察信度的某一方面的,使用時(shí)要特別注意它的含義及適用范圍。心理測(cè)量的信度測(cè)試信度與誤差來(lái)源

誤差來(lái)源信度類型時(shí)間再測(cè)信度(穩(wěn)定性)內(nèi)容復(fù)本信度,分半信度(等值性),Alpha系數(shù)(同質(zhì)性)時(shí)間和內(nèi)容先后施測(cè)兩個(gè)復(fù)本評(píng)價(jià)者/觀察者評(píng)分者信度心理測(cè)量的信度測(cè)試一、重測(cè)信度1.含義和計(jì)算重測(cè)信度(test-retestreliability)指的是用同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致性程度。重測(cè)信度能表示兩次測(cè)驗(yàn)結(jié)果有無(wú)變動(dòng),反映測(cè)驗(yàn)分?jǐn)?shù)的穩(wěn)定程度,所以又叫穩(wěn)定性系數(shù)。其計(jì)算公式即皮爾遜積差相關(guān)公式:XX=[(XX)(YY)]/√(XX)2.(YY)2公式中,XX是重測(cè)信度,X及X是第一次測(cè)量的實(shí)得分?jǐn)?shù)及實(shí)得分?jǐn)?shù)的平均值,Y及Y是第二次測(cè)量的實(shí)得分?jǐn)?shù)及實(shí)得分?jǐn)?shù)的平均值。心理測(cè)量的信度測(cè)試什么樣的測(cè)量要考慮重測(cè)信度?人的多數(shù)心理特質(zhì)如智力、性格等,具有相對(duì)的穩(wěn)定性,因此對(duì)這些心理特質(zhì)的測(cè)量,應(yīng)該前后一致。因此,我們希望得到測(cè)驗(yàn)穩(wěn)定性的證據(jù)。另外,我們還經(jīng)常要用測(cè)驗(yàn)分?jǐn)?shù)對(duì)人做預(yù)測(cè),此時(shí)測(cè)驗(yàn)分?jǐn)?shù)的跨時(shí)間的穩(wěn)定性更加重要。心理測(cè)量的信度測(cè)試重測(cè)信度的優(yōu)點(diǎn)在于提供有關(guān)測(cè)驗(yàn)結(jié)果是否隨時(shí)間而變異的資料,作為預(yù)測(cè)受試者將來(lái)行為表現(xiàn)的依據(jù)。其缺點(diǎn)是易受學(xué)習(xí)和記憶的影響。如果相隔時(shí)間太短,則記憶猶在,練習(xí)的影響很大,往往造成假性的高相關(guān);如果相隔時(shí)間太長(zhǎng),那么身心特質(zhì)的發(fā)展與學(xué)習(xí)經(jīng)驗(yàn)的累積等均足以改變測(cè)驗(yàn)分?jǐn)?shù)的意義,使相關(guān)降低。一般來(lái)說(shuō),最適宜的相隔時(shí)間隨測(cè)驗(yàn)的目的和性質(zhì)而異,少者兩周,多者半年。心理測(cè)量的信度測(cè)試2.使用的前提條件(3個(gè)條件)(1)該測(cè)驗(yàn)測(cè)量的心理特性必須相當(dāng)穩(wěn)定。(2)遺忘和練習(xí)的效果基本上相互抵消。(3)兩次測(cè)驗(yàn)期間的學(xué)習(xí)效果沒(méi)有差異。學(xué)校的各種測(cè)驗(yàn)或標(biāo)準(zhǔn)化考試,上面三個(gè)假設(shè)幾乎是無(wú)法滿足的。因此,一般標(biāo)準(zhǔn)化考試很少用重測(cè)法來(lái)估計(jì)測(cè)驗(yàn)的信度。成人的人格特質(zhì)一般是穩(wěn)定的,并且不容易受遺忘、練習(xí)、學(xué)習(xí)的影響,較多用重測(cè)法估計(jì)信度。心理測(cè)量的信度測(cè)試二、復(fù)本信度1.含義與計(jì)算任何測(cè)驗(yàn)都只是所有可能題目中的一份取樣,所以可能編制許多平行的等值測(cè)驗(yàn),叫做復(fù)本。復(fù)本信度(alternate-formreliability)就是指用兩個(gè)復(fù)本測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的積差相關(guān)系數(shù)。心理測(cè)量的信度測(cè)試兩個(gè)等值測(cè)驗(yàn)可同時(shí)連續(xù)施測(cè)或相距一段時(shí)間分兩次施測(cè)。前者的復(fù)本信度又稱等值性系數(shù),其分?jǐn)?shù)的不一致主要來(lái)自題目取樣的差別,因?yàn)閮纱螠y(cè)驗(yàn)的間隔極短,所以沒(méi)有時(shí)間造成的誤差。后一種復(fù)本信度又稱穩(wěn)定性與等值性系數(shù)。因?yàn)樗褟?fù)本法與重測(cè)法結(jié)合起來(lái),所有影響施測(cè)和再施測(cè)不一致的因素以及影響平行型不一致的因素都將對(duì)它發(fā)生影響,因此分?jǐn)?shù)的不一致性最高。可見(jiàn)與穩(wěn)定性系數(shù)和等值性系數(shù)相比,穩(wěn)定性與等值性系數(shù)是對(duì)信度的最嚴(yán)格的檢驗(yàn),其值最低。心理測(cè)量的信度測(cè)試2.使用前提條件首先要有兩份或兩份以上真正平行的測(cè)驗(yàn)。即兩測(cè)驗(yàn)在題目?jī)?nèi)容、數(shù)量、形式、難度、區(qū)分度、指導(dǎo)語(yǔ)、時(shí)限、以及所用的例題、公式和測(cè)驗(yàn)的其它所有方面都應(yīng)該相同或相似。若不一致,所得的信度就成了歪曲的估計(jì)。事實(shí)上,要編制兩份完全等值的測(cè)驗(yàn)是不大可能的,即使是很有經(jīng)驗(yàn)的測(cè)驗(yàn)編制者,也只能編制出基本等值的測(cè)驗(yàn)。用復(fù)本法估計(jì)測(cè)驗(yàn)的信度的條件之二便是被試要有條件接受兩個(gè)測(cè)驗(yàn)。這種條件主要取決于時(shí)間和經(jīng)費(fèi)等幾個(gè)方面。對(duì)于穩(wěn)定性與等值性系數(shù),還需要滿足重測(cè)信度的基本條件。心理測(cè)量的信度測(cè)試三、分半信度分半信度(split-halfreliability)指的是將一個(gè)測(cè)驗(yàn)分成對(duì)等的兩半,根據(jù)所有被試在這兩半測(cè)驗(yàn)上所得分?jǐn)?shù)的一致性程度。分半信度系數(shù)可以和等值性系數(shù)一樣解釋。因?yàn)檫@兩半測(cè)驗(yàn)基本上相當(dāng)于最短時(shí)距施測(cè)的兩個(gè)平行的復(fù)本,由于只需要對(duì)一個(gè)測(cè)驗(yàn)進(jìn)行一次施測(cè),考察的是兩半題目之間的一致性,所以這種信度系數(shù)有時(shí)也被稱為內(nèi)部一致系數(shù)。雖然分半信度也可當(dāng)作內(nèi)部一致性的測(cè)量,但我們將歸類為等值的特例,與其它等值性測(cè)量唯一不同之處是在測(cè)驗(yàn)施測(cè)后才分成兩個(gè)。心理測(cè)量的信度測(cè)試分半信度的計(jì)算:和等值復(fù)本信度的計(jì)算方法類似,只不過(guò)被試在兩半測(cè)驗(yàn)上得分的相關(guān)系數(shù)只是半個(gè)測(cè)驗(yàn)的信度。由于在其它條件相等的情況下,測(cè)驗(yàn)越長(zhǎng),信度越高,因此必須用“斯皮爾曼——布朗公式”進(jìn)行校正:XX=2hh/(1

hh)式中XX為整個(gè)測(cè)驗(yàn)的信度,hh為兩半測(cè)驗(yàn)分?jǐn)?shù)間的相關(guān)系數(shù)。心理測(cè)量的信度測(cè)試弗朗那根(Flanagan)公式:XX=2[1(Sa2+Sb2)/Sx2]公式中Sa2和Sb2分別表示所有被試在兩半測(cè)驗(yàn)上得分的變異數(shù),Sx2表示全體被試在整個(gè)測(cè)驗(yàn)上的總得分的變異數(shù)。心理測(cè)量的信度測(cè)試盧倫(Rulon)公式:XX=1Sd2/Sx2公式中Sd2表示同一組被試在兩半測(cè)驗(yàn)上得分之差的變異數(shù),其它符號(hào)與上公式一樣。心理測(cè)量的信度測(cè)試2.使用的前提條件及范圍分半信度通常是在只能施測(cè)一次或沒(méi)有復(fù)本的情況下使用。而且,在使用斯—布公式時(shí)要求全體被試在兩半測(cè)驗(yàn)上得分的變異數(shù)要相等。當(dāng)一個(gè)測(cè)驗(yàn)無(wú)法分成對(duì)等的兩半時(shí),分半信度不宜使用。由于將一個(gè)測(cè)驗(yàn)分成兩半的方法很多(如:按題號(hào)的奇偶性分半、或按題目的難度分半、或按題目的內(nèi)容分半等),所以,同一個(gè)測(cè)驗(yàn)通常會(huì)有多個(gè)分半信度值。心理測(cè)量的信度測(cè)試四、同質(zhì)性信度1.含義同質(zhì)性信度(homogeneityreliability)也叫內(nèi)部一致性系數(shù),它是指測(cè)驗(yàn)內(nèi)部所有題目間的一致性程度。這里的一致性是指題目分?jǐn)?shù)的一致,而不是題目?jī)?nèi)容或形式的一致。題目?jī)?nèi)部的一致性主要受兩方面變異的影響:內(nèi)容的同質(zhì)性與所研究的行為的同質(zhì)性。所以同質(zhì)性信度就是一個(gè)測(cè)驗(yàn)所測(cè)內(nèi)容或特質(zhì)的相同程度。心理測(cè)量的信度測(cè)試當(dāng)一個(gè)測(cè)驗(yàn)具有較高的同質(zhì)性信度時(shí),說(shuō)明測(cè)驗(yàn)主要測(cè)的是某一單個(gè)心理特質(zhì),實(shí)測(cè)結(jié)果就是該特質(zhì)水平的反映。如果一個(gè)測(cè)驗(yàn)同質(zhì)性信度不高,則說(shuō)明測(cè)驗(yàn)結(jié)果可能是幾種心理特質(zhì)的綜合反映,這時(shí),測(cè)驗(yàn)的結(jié)果不好解釋。一種好的辦法是把一個(gè)異質(zhì)的測(cè)驗(yàn)分解成多個(gè)具有同質(zhì)性的分測(cè)驗(yàn),再根據(jù)被試在分測(cè)驗(yàn)上的得分分別作出解釋。心理測(cè)量的信度測(cè)試什么情況下需要考察題目的同質(zhì)性?這取決于測(cè)量目的一般用于預(yù)測(cè)的測(cè)驗(yàn)或?qū)W績(jī)測(cè)驗(yàn)可不考慮同質(zhì)性。而在提出或驗(yàn)證某種心理學(xué)理論的構(gòu)想和假設(shè)時(shí),卻要求對(duì)所研究的心理特質(zhì)或構(gòu)想作出“純粹”的測(cè)量,否則便不能由測(cè)驗(yàn)分?jǐn)?shù)作出意義明確的推論??梢?jiàn),同質(zhì)性測(cè)驗(yàn)是發(fā)展心理學(xué)理論所必需的。心理測(cè)量的信度測(cè)試2.計(jì)算及適用范圍對(duì)同質(zhì)性信度的估計(jì),主要有庫(kù)——理信度、克倫巴赫系數(shù)和荷伊特信度。(1)庫(kù)德——理查遜公式庫(kù)德()和理查遜()提出一種分析題目間一致性以估計(jì)信度的方法,最常用的是K-R20公式:XX=[K/(K1)][1(

piqi)/Sx2]式中K表示整個(gè)測(cè)驗(yàn)的題數(shù),pi為通過(guò)一題目的人數(shù)比例,qi為未通過(guò)一題目的人數(shù)比例,Sx2為測(cè)驗(yàn)總分的變異數(shù)。心理測(cè)量的信度測(cè)試K-R20公式僅適用于題目是二分記分(0、1)的測(cè)驗(yàn),即答對(duì)一題很一分,答錯(cuò)無(wú)分的測(cè)驗(yàn)。當(dāng)各題難度相近的情況下,可用公式K-R21。K-R21公式:XX=[K/(K1)][1(Kpiqi)]/Sx2=[KSx2

X(KX)]/[(K1)Sx2]式中

pi為題目的平均通過(guò)率,qi為未通過(guò)率,X為測(cè)驗(yàn)總分的平均數(shù),其它字母的意義與K-R20相同。心理測(cè)量的信度測(cè)試[例]張老師在任教班級(jí)施測(cè)50題的測(cè)驗(yàn)(每題對(duì)得1分,錯(cuò)為0分),并求出平均分為40分,標(biāo)準(zhǔn)差為6分。該測(cè)驗(yàn)的信度是多少?K-R21公式雖然計(jì)算較為簡(jiǎn)單,但求得的信度系數(shù)有低估的傾向,當(dāng)題目難度相差較大時(shí),偏差更大。心理測(cè)量的信度測(cè)試(2)克倫巴赫系數(shù)庫(kù)德—理查遜公式只適用于答對(duì)一題得一分,答錯(cuò)無(wú)分的測(cè)驗(yàn),不適用于多重記分的測(cè)驗(yàn)。針對(duì)這一需要,克倫巴赫(L.J.Cronbach)另創(chuàng)系數(shù),其公式如下:

=[K/(K1)][1(

Si2)/Sx2]式中為某一項(xiàng)目分?jǐn)?shù)的變異數(shù),其它字母意義與K-R20公式相同。當(dāng)題目與二分法計(jì)分時(shí),

Si2=piqi,所以K-R20公式可以當(dāng)作系數(shù)的特例。心理測(cè)量的信度測(cè)試[例](見(jiàn)教材P79)某態(tài)度量表共7題,100個(gè)被試在各題上得分的方差分別是、、、、、、,測(cè)驗(yàn)總分的方差為,則此測(cè)驗(yàn)的信度是多少?心理測(cè)量的信度測(cè)試(3)荷伊特信度1941年荷伊特(C.Hoyt)提出用方差分析來(lái)衡量測(cè)驗(yàn)內(nèi)部一致性的方法。一組測(cè)驗(yàn)分?jǐn)?shù)的總變異數(shù)可劃分為三個(gè)來(lái)源:人與人之間的差別,題目間的差別以及人與題目交互作用的差別。真正變異數(shù)可以從人與人之間的差別來(lái)估計(jì),測(cè)量誤差變異數(shù)可從人與題目之間的交互作用來(lái)估計(jì)。荷伊特信度的估計(jì)公式為:XX=1MS人題/MS人式中MS人是同人與人間差別有關(guān)的均方,MS人題是同人與題目交互作用有關(guān)的均方。心理測(cè)量的信度測(cè)試(4)因素分析有些測(cè)量學(xué)家認(rèn)為因素分析是決定測(cè)驗(yàn)同質(zhì)性的最好方法。在測(cè)驗(yàn)上,如果一個(gè)因素就足以解釋所有題目分?jǐn)?shù)的變異時(shí),這個(gè)測(cè)驗(yàn)就是同質(zhì)的,假如需要一個(gè)以上的因素時(shí),則測(cè)驗(yàn)的組成是異質(zhì)的。心理測(cè)量的信度測(cè)試五、評(píng)分者信度1.含義及計(jì)算心理測(cè)驗(yàn)一般都有一套標(biāo)準(zhǔn)化的評(píng)分程序,尤其是客觀題,由評(píng)分引起的誤差變異是可以忽略的。但在教育測(cè)量中,有很多測(cè)驗(yàn)是無(wú)法完全客觀記分的。對(duì)這些無(wú)法進(jìn)行完全客觀記分的測(cè)量工具而言,評(píng)分者之間的變異也是誤差的重要來(lái)源之一。如高考的作文題的評(píng)分,必然會(huì)涉及到評(píng)分者的主觀判斷,受評(píng)分者的喜好與水平等的影響。因此,有必要考察這些測(cè)驗(yàn)的評(píng)分者之間評(píng)分的一致性程度,即評(píng)分者信度(scorerreliability)。心理測(cè)量的信度測(cè)試考察評(píng)分者信度的方法:隨機(jī)抽取相當(dāng)份數(shù)的試卷,由兩位評(píng)分者按記分要點(diǎn)分別給分,然后根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算其相關(guān)系數(shù),即評(píng)分者信度。一般要求在成對(duì)的受過(guò)訓(xùn)練的評(píng)分者之間平均一致性達(dá)到以上,才認(rèn)為評(píng)分是客觀的。心理測(cè)量的信度測(cè)試第三節(jié)提高測(cè)量信度的方法一、影響測(cè)量信度的因素在測(cè)量過(guò)程中凡是能引起測(cè)量誤差的因素都會(huì)影響測(cè)量信度。1.被試因素:被試的身心健康狀況、應(yīng)試動(dòng)機(jī)、注意力、求勝心、作答態(tài)度等。2.主試因素:不按規(guī)定實(shí)施測(cè)驗(yàn),制造緊張氣氛,給予特殊的協(xié)助,評(píng)分主觀等。3.測(cè)驗(yàn)內(nèi)容因素:試題取樣不當(dāng),內(nèi)部一致性低,題數(shù)過(guò)少,題意模糊等。4.測(cè)驗(yàn)情境因素:通風(fēng)、溫度、光線、噪音、桌面好壞等。心理測(cè)量的信度測(cè)試除外,以下幾個(gè)因素會(huì)影響信度系數(shù)的大?。?.被試樣本(1)整個(gè)團(tuán)體內(nèi)成員的異質(zhì)性影響測(cè)驗(yàn)信度。成員特質(zhì)分布范圍越廣(即越異質(zhì)),其信度系數(shù)也越大。

團(tuán)體異質(zhì)性不同,分?jǐn)?shù)的標(biāo)準(zhǔn)差也不同。當(dāng)將測(cè)驗(yàn)用于標(biāo)準(zhǔn)差不同的團(tuán)體時(shí),可用下面的公式推算出新的信度系數(shù):nn=1So2(1

oo)/Sn2So為信度系數(shù)已知的分布的標(biāo)準(zhǔn)差,Sn2為信度系數(shù)未知的分布的標(biāo)準(zhǔn)差,oo為用于原團(tuán)體的信度,nn為用于異質(zhì)程度不同的團(tuán)體時(shí)的信度。心理測(cè)量的信度測(cè)試[例]一個(gè)測(cè)驗(yàn)應(yīng)用于全體小學(xué)生的樣本(常模樣本),其分?jǐn)?shù)的標(biāo)準(zhǔn)差為10,信度系數(shù)為,假如將此測(cè)驗(yàn)應(yīng)用于小學(xué)五年級(jí),其分?jǐn)?shù)標(biāo)準(zhǔn)為5。其信度系數(shù)估計(jì)值為多少?心理測(cè)量的信度測(cè)試(2)團(tuán)體的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論