第五章:心理測(cè)量學(xué)知識(shí)_第1頁(yè)
第五章:心理測(cè)量學(xué)知識(shí)_第2頁(yè)
第五章:心理測(cè)量學(xué)知識(shí)_第3頁(yè)
第五章:心理測(cè)量學(xué)知識(shí)_第4頁(yè)
第五章:心理測(cè)量學(xué)知識(shí)_第5頁(yè)
已閱讀5頁(yè),還剩155頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章:心理測(cè)量學(xué)知識(shí)第一節(jié):概述第一單元:測(cè)量與測(cè)量量表一、什么是測(cè)量測(cè)量就是依據(jù)一定的法則用數(shù)字對(duì)事物加以確定。包括三個(gè)主要的元素:(1)事物;(2)數(shù)字:(3)法則“事物”指的是我們要測(cè)量的對(duì)象;“數(shù)字”是代表某一事物或事物某一屬性的量;“法則”是測(cè)量所依據(jù)的規(guī)則和方法;有好壞之分。絲綢、體重、智力;氣味、標(biāo)準(zhǔn)物、視力和聽(tīng)力。真假多重多聰明(一)參照點(diǎn),即確定事物量的計(jì)算起點(diǎn)有兩種參照點(diǎn),即絕對(duì)零點(diǎn)(理想)、相對(duì)零點(diǎn)(二)單位,即測(cè)量的基本要求好的單位必須具備兩個(gè)條件:一為有確定的意義;二為有相同的價(jià)值心理測(cè)量的單位,一般無(wú)統(tǒng)一單位,也不符合等距的要求二、測(cè)量要素:即參照點(diǎn)和單位50元人民幣與10美元相比,那個(gè)多?1公里與1英里相比,那個(gè)長(zhǎng)(0.6214)?三、測(cè)量量表在一個(gè)定有單位和參照點(diǎn)的連續(xù)體上把事物的屬性表現(xiàn)出來(lái),這個(gè)連續(xù)體稱(chēng)為量表。

根據(jù)量表的精確程度,測(cè)量從低級(jí)到高級(jí)分成四種水平:(一)命名量表用數(shù)字來(lái)代表事物或把事物歸類(lèi)。1、代號(hào);2、類(lèi)別白人黑人黃人男人女人類(lèi)別代號(hào)(二)順序量表包含類(lèi)別和大??;用于分等或排出順序。如:“<“、”>”名次名次胖瘦高矮(三)等距量表不但有大小而且數(shù)字有相等的單位,可以做加、減運(yùn)算(四)等比量表有相等單位又有絕對(duì)零點(diǎn),數(shù)值可做加、減、乘、除運(yùn)算

統(tǒng)計(jì)心理測(cè)量:順序量表---------〉等距量表方法長(zhǎng)度體積第二單元:心理測(cè)驗(yàn)的基本概念一、心理測(cè)驗(yàn)的定義所謂心理測(cè)驗(yàn),就是依據(jù)心理學(xué)理論,使用一定的操作程序,通過(guò)觀察人的少數(shù)有代表性的行為,對(duì)于貫穿在人的全部行為活動(dòng)中的心理特點(diǎn)做出推論和數(shù)量化分析的一種科學(xué)手段。測(cè)量行為、行為樣本、標(biāo)準(zhǔn)化、常模二、心理測(cè)驗(yàn)的性質(zhì)間接性(外顯行為----〉心理特質(zhì))相對(duì)性(沒(méi)有絕對(duì)的標(biāo)準(zhǔn),只是確定個(gè)人在序列的位置)客觀性(標(biāo)準(zhǔn)化:過(guò)程、評(píng)分、轉(zhuǎn)換和解釋等)第三單元:心理測(cè)驗(yàn)的分類(lèi)一、按測(cè)驗(yàn)的功能分類(lèi):智力測(cè)驗(yàn)、特殊能力測(cè)驗(yàn)、人格測(cè)驗(yàn)韋氏兒童智力量表:言語(yǔ)測(cè)驗(yàn)和操作測(cè)驗(yàn).言語(yǔ)測(cè)驗(yàn)包括理解測(cè)驗(yàn).其中的題目是:如果你把小朋友的皮球弄丟了,你應(yīng)該怎么辦?為什么政府要派人到肉食加工廠去檢驗(yàn)肉類(lèi)產(chǎn)品?

國(guó)家設(shè)立人民代表大會(huì)有哪些好處?職業(yè)指導(dǎo)的測(cè)驗(yàn)中有個(gè)尋找字、符差異的測(cè)驗(yàn):長(zhǎng)江——長(zhǎng)工BOOK——BOOT

756246——756346

愛(ài)德華個(gè)人偏好量表里的題目:A我喜歡問(wèn)些明知?jiǎng)e人回答不出來(lái)的問(wèn)題。B我喜歡告訴別人怎樣做他們的工作。二、按測(cè)驗(yàn)材料的性質(zhì)分類(lèi):文字測(cè)驗(yàn)、操作測(cè)驗(yàn)在中小學(xué)生團(tuán)體智力測(cè)驗(yàn)中的文字測(cè)驗(yàn)題目:下面五樣?xùn)|西中哪一樣最不象其他四樣?A襪子B衣服C鞋子D皮包E帽子中國(guó)比奈測(cè)驗(yàn)中的操作測(cè)驗(yàn)題目:三、按測(cè)驗(yàn)材料的嚴(yán)謹(jǐn)程度分類(lèi):客觀測(cè)驗(yàn)、投射測(cè)驗(yàn)艾森克個(gè)性問(wèn)卷中的題目:你喜歡跳降落傘嗎?是否兒童主體統(tǒng)覺(jué)測(cè)驗(yàn)中的題目:四、按測(cè)驗(yàn)的方式分類(lèi):個(gè)別測(cè)驗(yàn)、團(tuán)體測(cè)驗(yàn)五、按測(cè)驗(yàn)的要求分類(lèi):最高作為測(cè)驗(yàn)、典型行為測(cè)驗(yàn)韋氏兒童智力測(cè)驗(yàn)中的背數(shù)測(cè)驗(yàn)題目:順背3-8-6

6-1-23-4-1-7

6-1-5-88-4-2-3-9

5-2-1-8-63-8-9-1-7-4

7-9-6-4-8-35-1-7-4-2-3-8

9-8-5-2-1-6-31-6-4-5-9-7-6-3

2-9-7-6-3-1-5-45-3-8-7-1-2-4-6-9

4-2-6-9-1-7-8-3-57-5-1-3-2-6-9-1-8-7-

4-1-9-2-4-7-8-3-1-5韋氏兒童智力測(cè)驗(yàn)中的背數(shù)測(cè)驗(yàn)題目倒背2-5

6-35-7-4

2-5-97-2-9-6-

8-4-9-34-1-3-5-7

9-7-8-5-21-6-5-2-9-8

3-6-7-1-9-48-5-9-2-3-4-2

4-5-7-9-2-8-16-9-1-6-3-2-5-8-8

3-1-7-9-5-4-8-2MMPI里的題目:有時(shí)我會(huì)哭一陣,笑一陣,連自己也不能控制。是否假如不是有人和我作對(duì),我一定會(huì)有更大的成就。是否第四單元:糾正錯(cuò)誤的測(cè)驗(yàn)觀一、錯(cuò)誤的測(cè)驗(yàn)觀(一)測(cè)驗(yàn)萬(wàn)能論(二)測(cè)驗(yàn)無(wú)用論其一,某些人格測(cè)驗(yàn)侵犯了個(gè)人隱私,違背民主原則。其二,測(cè)驗(yàn)為宿命論和種族歧視提供了心理學(xué)依據(jù)(三)心理測(cè)驗(yàn)即智力測(cè)驗(yàn)二、正確的測(cè)驗(yàn)觀(一)心理測(cè)驗(yàn)是重要的心理學(xué)研究方法之一,是決策的輔助工具(二)心理測(cè)驗(yàn)作為研究方法和測(cè)量工具尚不完善心理測(cè)驗(yàn)的最大問(wèn)題是理論基礎(chǔ)不夠堅(jiān)實(shí)

-------既要承認(rèn)心理測(cè)驗(yàn)的不完善,又要科學(xué)的自信的使用心理測(cè)驗(yàn)。第五單元心理測(cè)驗(yàn)在心理咨詢(xún)中的應(yīng)用3類(lèi)常用心理測(cè)驗(yàn):一、智力測(cè)驗(yàn)中國(guó)比內(nèi)量表(吳天敏)、WAIS-RC、C-WISC、C-WYCSI(龔耀先)、WISC-CR(林傳鼎)、SPM(張厚粲)、CRT(李丹)等二、人格測(cè)驗(yàn)

EPQ、16PF、MMPI等三、心理評(píng)定量表精神病評(píng)定量表、躁狂狀態(tài)評(píng)定量表、抑郁量表、焦慮量表、恐怖量表等。心理測(cè)驗(yàn)在咨詢(xún)和治療中并不是必不可少的環(huán)節(jié)。一般來(lái)講,心理測(cè)驗(yàn)應(yīng)在咨詢(xún)關(guān)系尚未建立之前實(shí)施,進(jìn)入正式的心理咨詢(xún)程序之后,要盡量避免心理測(cè)驗(yàn)。也有例外。第六單元心理測(cè)驗(yàn)的發(fā)展史

始于漢代、興于隋唐的科舉取士制度一、科學(xué)心理測(cè)驗(yàn)的產(chǎn)生與發(fā)展心理測(cè)驗(yàn)的開(kāi)端---19世紀(jì)80年代,英國(guó)

F.Galton

為了研究差異的遺傳性,便設(shè)計(jì)了測(cè)量差異的方法。為心理測(cè)量,奠定統(tǒng)計(jì)學(xué)基礎(chǔ)。心理測(cè)驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中---1890年,美國(guó)J.M.Cattell在《心理》雜志上發(fā)表《心理測(cè)驗(yàn)與測(cè)量》

世界上第一個(gè)正式的心理測(cè)驗(yàn)----1905年,法國(guó)A.Binet在《心理學(xué)年報(bào)》上發(fā)表了一篇文章,題為《診斷異常兒童智力的新方法》

在此以后,心理測(cè)驗(yàn)主要有以下幾個(gè)方面的發(fā)展:

1、操作測(cè)驗(yàn)的發(fā)展

2、團(tuán)體智力測(cè)驗(yàn)的發(fā)展如陸軍甲種和乙種智力測(cè)驗(yàn)

3、能力傾向測(cè)驗(yàn)的發(fā)展如D.Wechsler所編的智力量表

4、人格測(cè)驗(yàn)的發(fā)展二、現(xiàn)代心理測(cè)驗(yàn)在我國(guó)的發(fā)展第二節(jié)測(cè)驗(yàn)的常模(常模的定義)

第一單元常模團(tuán)體一、常模團(tuán)體的性質(zhì)(一個(gè)人是否胖、內(nèi)向、聰明等與其常模團(tuán)體有關(guān)。)常模團(tuán)體是由具有某種共同特征的人所組成的一個(gè)群體,或者是該群體的一個(gè)樣本。常模團(tuán)體用一個(gè)標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來(lái),以提供比較的基礎(chǔ)。任何一個(gè)測(cè)驗(yàn)都有許多可能的常模團(tuán)體。制訂和解釋?xiě)?yīng)考慮。如智力測(cè)驗(yàn)有各年齡常模。常模團(tuán)體必須能夠代表該總體,包括:確定一般總體、確定目標(biāo)總體、確定樣本。無(wú)論是測(cè)驗(yàn)的編制者還是使用者,主要關(guān)心的是常模團(tuán)體的成員。(大學(xué)生的家長(zhǎng)給孩子每月400元的生活費(fèi)是高還是低?)二、常模團(tuán)體的條件(一)群體的構(gòu)成必須明確界定必須清楚說(shuō)明所要測(cè)量的群體的性質(zhì)與特征(二)常模團(tuán)體必須是所測(cè)群體的代表性樣本小團(tuán)體:全選,平均分作為常模;大團(tuán)體:用隨機(jī)取樣或分層取樣的方法。(三)樣本的大小要適當(dāng)(關(guān)鍵是要有代表性)幾十個(gè)人的團(tuán)體:全部;總體數(shù)目大:不小于30或100個(gè)的樣本數(shù)目;全國(guó)性常模:2000—3000人(四)標(biāo)準(zhǔn)化樣組是一定時(shí)空的產(chǎn)物注意選擇較為新近的常模三、取樣的方法

取樣即從目標(biāo)人群中選擇有代表性的樣本。隨機(jī)抽樣:每個(gè)個(gè)案被抽取的機(jī)會(huì)均等非隨機(jī)抽樣抽樣方法:(一)簡(jiǎn)單隨機(jī)抽樣

a按隨機(jī)表順序,b先編號(hào)再隨機(jī)選擇(二)系統(tǒng)抽樣總體數(shù)目為N,選擇K分之一(組距)作為樣本。要求目標(biāo)總體無(wú)序可排,也無(wú)等級(jí)結(jié)構(gòu)存在(三)分組抽樣:總體數(shù)目大,群體有多樣性,分組

---組內(nèi)隨機(jī)取樣。(四)分層抽樣:目標(biāo)總體按某種變量分層---層內(nèi)隨機(jī)取樣。分層比例抽樣、分層非比例抽樣四、常模分?jǐn)?shù)與常模(一)常模分?jǐn)?shù)常模分?jǐn)?shù)就是施測(cè)常模樣本被試后,將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來(lái)的導(dǎo)出分?jǐn)?shù)。通過(guò)將被試的反應(yīng)與標(biāo)準(zhǔn)答案相比較而獲得的測(cè)驗(yàn)分?jǐn)?shù)叫原始分?jǐn)?shù)。

導(dǎo)出分?jǐn)?shù)具有一定的參照點(diǎn)和單位,它實(shí)際上是一個(gè)有意義的測(cè)驗(yàn)量表,它與原始分?jǐn)?shù)等值,可以進(jìn)行比較(二)常模常模分?jǐn)?shù)構(gòu)成的分布,就是常模(norm),是解釋心理測(cè)驗(yàn)分?jǐn)?shù)的基礎(chǔ)。一般常模、特殊常模第二單元常模的類(lèi)型一、發(fā)展常模(年齡量表)(縱向比較)將個(gè)人的成績(jī)與各種發(fā)展水平的人的平均表現(xiàn)相比較,根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模。(一)發(fā)展順序量表它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常,相應(yīng)能力或行為早于某年齡出現(xiàn),說(shuō)明發(fā)育超前,否則即為發(fā)育滯后。葛塞爾發(fā)展程序表(按月份顯示兒童各方面的大致發(fā)展水平)瑞士皮亞杰的發(fā)展理論16周28周40周48周(二)智力年齡一個(gè)兒童在年齡量表上所得的分?jǐn)?shù),代表他的智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡,簡(jiǎn)稱(chēng)智齡。比內(nèi)—西蒙一個(gè)人的智齡并不一定和他的實(shí)齡相符。

年齡量表的基本要素(三)年級(jí)當(dāng)量即年級(jí)量表,測(cè)驗(yàn)結(jié)果說(shuō)明屬哪一年級(jí)的水平。在教育成就測(cè)驗(yàn)中最常用二、百分位常模(橫向比較)

百分位常模包括百分等級(jí)和百分點(diǎn)、四分位數(shù)和十分位數(shù)。(一)、百分等級(jí)

是指在常模樣本中低于這個(gè)分?jǐn)?shù)的人數(shù)百分比。未分組資料的百分等級(jí)計(jì)算:

PR=100-(100*R-50)/N

其中R是原始分?jǐn)?shù)排列順序數(shù),N是指總?cè)藬?shù)(樣本的總?cè)藬?shù))。例題見(jiàn)341頁(yè)。百分等級(jí)

(二)百分點(diǎn)也稱(chēng)百分位數(shù),計(jì)算處于某一百分比例的人對(duì)應(yīng)的測(cè)驗(yàn)分?jǐn)?shù)是多少。在分?jǐn)?shù)量表上,相對(duì)于某一百分等級(jí)的分?jǐn)?shù)點(diǎn)就叫百分點(diǎn)或百分位數(shù)。計(jì)算根據(jù)直線內(nèi)插法進(jìn)行。見(jiàn)341頁(yè)。(三)四分位數(shù)和十分位數(shù)四分位數(shù)是將量表分成四等分,相當(dāng)于百分等級(jí)的25%、50%和75%對(duì)應(yīng)的三個(gè)百分分成的四段。十分位數(shù)也可以依此類(lèi)推出,1%~10%為第一段,91%一100%為第十段。三、標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來(lái)的量表。如z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)九分?jǐn)?shù)、離差智商(IQ)等。常態(tài)化(一)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù):

z分?jǐn)?shù)的另一種形式:Z=A+Bz

(二)非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)(略)當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時(shí),也可以使之常態(tài)化,這一轉(zhuǎn)換過(guò)程就是非線性的。計(jì)算步驟如下:

1.對(duì)每個(gè)原始分?jǐn)?shù)值計(jì)算累積百分比;

2.在常態(tài)曲線面積表中,求出對(duì)應(yīng)于該百分比的z分?jǐn)?shù)。所得的z分?jǐn)?shù)可將分布分成幾部分,我們稱(chēng)之為z`分?jǐn)?shù),以區(qū)別由線性轉(zhuǎn)換所求得的z分?jǐn)?shù)。例如:T分?jǐn)?shù)=50+10z`四、智商及其意義

比內(nèi)—西蒙智力測(cè)驗(yàn)中用“心理年齡”(mentalage,簡(jiǎn)稱(chēng)MA)來(lái)表示被試智力的高低。

計(jì)算方法例如:實(shí)際年齡7歲,心理年齡10歲實(shí)際年齡13歲,心理年齡10歲缺點(diǎn):不同年齡兒童間無(wú)法比較。(一)比率智商

1916年,美國(guó)斯坦福大學(xué)推孟教授以比率智商(IQ)來(lái)表示測(cè)驗(yàn)的結(jié)果:

IQ=(MA/CA)*100例如:IQ=10歲/7歲*100=143IQ=10歲/13歲*100=77

缺點(diǎn):

1、個(gè)體智力增長(zhǎng)是一個(gè)由快到慢再到停止的過(guò)程,即心理年領(lǐng)與實(shí)足年齡并不同步增長(zhǎng)。

2、不同年齡組兒童的比率智商分布情況不一樣,相同比率智商分?jǐn)?shù)在不同年齡就具有不同意義。(二)離差智商是一種以年齡組為樣本計(jì)算而得到的標(biāo)準(zhǔn)分?jǐn)?shù),表示的是個(gè)體智力在年齡組中所處的位置。具體公式如下:

IQ=100+15z`=100+15(X-)/SD

在實(shí)際中,通常根據(jù)原始分?jǐn)?shù)在常模表上按其年齡直接查出智商。從不同測(cè)驗(yàn)獲得的離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時(shí)才可以比較。

以100為平均數(shù)不同標(biāo)準(zhǔn)差下每一IQ組距正態(tài)曲線下個(gè)案百分比:

百分?jǐn)?shù)分布分組分?jǐn)?shù)SD=12SD=14SD=15SD=16SD=18130以上0.71.62.23.15.1120-1294.36.36.77.58.5110-11915.21616.115.815.4100-10929.826.12523.62190-9929.826.12523.62180-8915.21616.115.815.470-794.36.36.77.58.570以下0.71.62.23.15.1總

計(jì)100100100100100

幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系第三單元常模分?jǐn)?shù)的表示方法一、轉(zhuǎn)換表法(常模表)一個(gè)轉(zhuǎn)換表顯示出一個(gè)特定的標(biāo)準(zhǔn)化樣組的原始分?jǐn)?shù)與其相對(duì)應(yīng)的一個(gè)等值分?jǐn)?shù)—百分位、標(biāo)準(zhǔn)分?jǐn)?shù)、T分?jǐn)?shù)或者其它任何分?jǐn)?shù)。簡(jiǎn)單的轉(zhuǎn)換表,如表5-2。復(fù)雜的轉(zhuǎn)換表,如表5-3。二、剖面圖法剖面圖是將測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來(lái)。第三節(jié)測(cè)驗(yàn)的信度第一單元信度的概念一、信度的定義信度是指同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn)(或用另一套相等的測(cè)驗(yàn))重復(fù)測(cè)量,所得結(jié)果的一致程度。

信度只受隨機(jī)誤差的影響。系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。隨機(jī)誤差:情緒、身體、環(huán)境等

系統(tǒng)誤差:測(cè)驗(yàn)等

X(實(shí)得分?jǐn)?shù))=T(真實(shí)分?jǐn)?shù))+E(誤差)

S2X(實(shí)得分?jǐn)?shù)的方差)

=S2T(真分?jǐn)?shù)的方差)+S2E(誤差的方差)信度的理論定義:

rxx=S2T/

S2X

信度的操作定義:

rxx=(S2X-S2E)/S2X=1-S2E/S2X

二、信度的指標(biāo)(一)信度系數(shù)與信度指數(shù)信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。常常是同一被試樣本所得的兩組資料的相關(guān),理論上說(shuō)就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值。

信度系數(shù)

信度指數(shù)(二)測(cè)量標(biāo)準(zhǔn)誤理論上,無(wú)數(shù)次測(cè)驗(yàn),平均數(shù)就是這個(gè)人的真分?jǐn)?shù),而標(biāo)準(zhǔn)差則為測(cè)量誤差的指標(biāo)。用一組被試兩次測(cè)量結(jié)果來(lái)代替同一個(gè)人的反復(fù)施測(cè)。信度的另一個(gè)指標(biāo),測(cè)量的標(biāo)準(zhǔn)誤公式是:

SE為測(cè)量標(biāo)準(zhǔn)誤;Sx為所得分?jǐn)?shù)的標(biāo)準(zhǔn)差;rxx為相關(guān)系數(shù)第二單元信度評(píng)估的方法不同的信度反映測(cè)驗(yàn)誤差的不同來(lái)源一、重測(cè)信度(test—retestreliability),又稱(chēng)穩(wěn)定性系數(shù)

間隔時(shí)間:2-4周,最好小于6個(gè)月優(yōu)點(diǎn):能提供有關(guān)測(cè)驗(yàn)是否隨時(shí)間而變異的資料,可作為被試將來(lái)行為表現(xiàn)的依據(jù)。缺點(diǎn):易受練習(xí)和記憶的影響二、復(fù)本信度(alternate-formreliability),又稱(chēng)等值性系數(shù)如果兩個(gè)復(fù)本的施測(cè)相隔一段時(shí)間,則稱(chēng)重測(cè)復(fù)本信度或穩(wěn)定與等值系數(shù)。優(yōu)點(diǎn):能夠避免重測(cè)信度的一些問(wèn)題,如記憶效果、學(xué)習(xí)效應(yīng)等。缺點(diǎn):

1、如果測(cè)量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能完全消除這種影響;

2、已掌握的解題原則,可以遷移到同類(lèi)問(wèn)題中;

3、對(duì)于許多測(cè)驗(yàn)來(lái)說(shuō),建立副復(fù)本是十分困難的。三、內(nèi)部一致性信度(internalconsistencyreliability)主要反映的是題目之間的關(guān)系,表示測(cè)驗(yàn)?zāi)軌驕y(cè)量相同內(nèi)容或特質(zhì)的程度。

(一)分半信度(split—halfreliability)

計(jì)算分半信度常采用積差相關(guān)方法計(jì)算。分半法經(jīng)常會(huì)低估信度(在其他條件相同的情況下,測(cè)驗(yàn)越長(zhǎng),信度越高),常采用斯皮爾曼—布朗公式修正:

斯皮爾曼一布朗公式為經(jīng)驗(yàn)公式,它的假設(shè)條件是兩半測(cè)驗(yàn)分?jǐn)?shù)的變異數(shù)相等。當(dāng)假設(shè)不成立時(shí),可采用弗朗那根(Flanagan)或盧倫(Kulon)公式直接求得測(cè)驗(yàn)的信度系數(shù)。(二)同質(zhì)性信度(homogeneityreliability)

同質(zhì)性主要代表測(cè)驗(yàn)內(nèi)部所有題目間的一致性。

1、庫(kù)德一理查遜公式:適用于答對(duì)一題記一分,答錯(cuò)無(wú)分的測(cè)題。常用的是K—R20公式,在各測(cè)題難度相同或近似的情況下,還可采用計(jì)算更為簡(jiǎn)便的K—R21公式。

2、克倫巴赫系數(shù):適用于多重記分的測(cè)題。四、評(píng)分者信度(scorerreliability)用于測(cè)量不同評(píng)分者之間所產(chǎn)生的誤差。抽取若干份測(cè)驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。

一般要求在成對(duì)的受過(guò)訓(xùn)練的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。當(dāng)多個(gè)評(píng)分者評(píng)定多個(gè)對(duì)象,并以等級(jí)法紀(jì)分時(shí),可采用肯德?tīng)柡椭C系數(shù)(w)作為評(píng)分者信度的估計(jì)。

第三單元信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)信度系數(shù)可以解釋為總的方差中有多少比例是由真實(shí)分?jǐn)?shù)的方差決定的,也就是測(cè)量的總變異中真分?jǐn)?shù)造成的變異占百分之幾,同時(shí)也告訴我們,測(cè)量的誤差比例是多少。二、確定信度可以接受的水平能力測(cè)驗(yàn)、成就測(cè)驗(yàn)信度系數(shù)可達(dá)到0.9—0.95;人格測(cè)驗(yàn)、興趣、態(tài)度、價(jià)值觀等測(cè)驗(yàn)的信度可達(dá)到0.8—0.85或更高一些。當(dāng)rxx<0.70時(shí),測(cè)驗(yàn)不能用于對(duì)個(gè)人作出評(píng)價(jià)或預(yù)測(cè),不能做團(tuán)體比較;當(dāng)0.70≤rxx<0.85時(shí),可用于團(tuán)體比較;當(dāng)rxx≥0.85時(shí),才能用來(lái)鑒別或預(yù)測(cè)個(gè)人成績(jī)或作為。新編的測(cè)驗(yàn)信度應(yīng)高于原有的同類(lèi)測(cè)驗(yàn)或相似測(cè)驗(yàn)。三、解釋個(gè)人分?jǐn)?shù)的意義

信度有兩個(gè)作用:

1.估計(jì)真實(shí)分?jǐn)?shù)的范圍;

2.了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形。測(cè)量標(biāo)準(zhǔn)誤可以通過(guò)第一次測(cè)驗(yàn)的結(jié)果及信度估計(jì)得到:

人們一般采用95%的或然水平,其置信區(qū)間為:例題:見(jiàn)353頁(yè)。

四、比較不同測(cè)驗(yàn)分?jǐn)?shù)的差異比較:兩個(gè)人不同分?jǐn)?shù)的差別同一被試在兩個(gè)測(cè)驗(yàn)上的差別

兩個(gè)測(cè)驗(yàn)的標(biāo)準(zhǔn)差要求相同。第四單元影響信度的因素一、樣本特征

(一)樣本團(tuán)體異質(zhì)性的影響若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往往會(huì)高估測(cè)驗(yàn)的信度,相反則會(huì)低估測(cè)驗(yàn)的信度。(二)樣本團(tuán)體平均能力水平的影響對(duì)于不同水平的團(tuán)體,題目具有不同的難度,每個(gè)題目在難度上的微小差異累積起來(lái)便會(huì)影響信度。二、測(cè)驗(yàn)長(zhǎng)度在一個(gè)測(cè)驗(yàn)中增加同質(zhì)的題目,可以使信度提高。第一,測(cè)驗(yàn)越長(zhǎng),測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣就越有代表性。第二,測(cè)驗(yàn)越長(zhǎng),被試的猜測(cè)因素影響就越小。假若我們希望用增加測(cè)驗(yàn)的方式提高測(cè)驗(yàn)的信度以達(dá)到某種理想值,通過(guò)斯皮爾曼—布朗公式的導(dǎo)出公式就可計(jì)算出最少應(yīng)增加的題數(shù)。例題見(jiàn)355頁(yè)三、測(cè)驗(yàn)難度難度對(duì)信度的影響,只存在于某些測(cè)驗(yàn)中。若測(cè)驗(yàn)對(duì)某團(tuán)體太難或太易,則分?jǐn)?shù)范圍將縮小,從而使信度降低。從理論上說(shuō),只有平均難度水平為50%時(shí),才能使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大,求得的信度也最高。洛德(Lord)提出在學(xué)績(jī)測(cè)驗(yàn)中,為了保證其可靠性,各類(lèi)選擇題的理想平均難度為:五擇一測(cè)題,0.70;四擇一測(cè)題,0.74;三擇一測(cè)題,0.77;是非題,0.85;四、時(shí)間間隔時(shí)間間隔只對(duì)重測(cè)信度和不同時(shí)測(cè)量時(shí)的復(fù)本信度(重測(cè)復(fù)本信度)有影響,對(duì)其余的信度來(lái)說(shuō)不存在時(shí)間間隔問(wèn)題。以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大;間隔時(shí)間越久,其他變因介入的可能性越大,受外界的影響也越大,信度系數(shù)便越低。第四節(jié)測(cè)驗(yàn)的效度第一單元效度的概念一、效度的定義在心理測(cè)驗(yàn)中,效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者簡(jiǎn)單地說(shuō),是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。效度的定義也可以通過(guò)真分?jǐn)?shù)的概念和方差分析方法加以說(shuō)明。

效度被定義二、效度的性質(zhì)(一)效度具有相對(duì)性任何測(cè)驗(yàn)的效度是對(duì)一定的目標(biāo)來(lái)說(shuō)的,或者說(shuō)測(cè)驗(yàn)只有用于與測(cè)驗(yàn)?zāi)繕?biāo)一致的目的和場(chǎng)合才會(huì)有效。

(二)效度具有連續(xù)性測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒(méi)有“全有”或“全無(wú)”的區(qū)別。效度是針對(duì)測(cè)驗(yàn)結(jié)果而言的。第二單元效度評(píng)估的方法一、內(nèi)容效度(content—relatedvalidity)(一)什么是內(nèi)容效度內(nèi)容效度指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所預(yù)測(cè)量的行為領(lǐng)域的代表性取樣。編制有較高內(nèi)容效度的心理測(cè)驗(yàn),1.明確所測(cè)量的心理特性的概念,并劃定出與這種心理特性有關(guān)的行為。2.測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。3.要求內(nèi)容效度的測(cè)驗(yàn),并不一定要求測(cè)驗(yàn)為同質(zhì)的。如智力測(cè)驗(yàn)。(二)內(nèi)容效度的評(píng)估方法1、專(zhuān)家判斷法內(nèi)容效度有時(shí)又稱(chēng)“邏輯效度”(logicalvalidity)。使不同專(zhuān)家對(duì)測(cè)驗(yàn)的判斷一致的步驟:(1)定義好測(cè)驗(yàn)內(nèi)容的總體范圍,描述有關(guān)的知識(shí)與技能及所用材料的來(lái)源;(2)編制雙向細(xì)目表,確定內(nèi)容和技能各自所占的比例,并由測(cè)驗(yàn)編制者確定各題所測(cè)的是何種內(nèi)容與技能;(3)制定評(píng)定量表來(lái)測(cè)量測(cè)驗(yàn)的整個(gè)效度。2、統(tǒng)計(jì)分析法兩個(gè)評(píng)分者之間評(píng)定的一致性。內(nèi)容效度可由一組被試在獨(dú)立取自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)副本上得分之相關(guān)來(lái)做估計(jì)。再測(cè)法也可用于內(nèi)容效度的評(píng)估。3、經(jīng)驗(yàn)推測(cè)法通過(guò)實(shí)踐來(lái)檢驗(yàn)效度(如對(duì)兒童發(fā)展量表的檢驗(yàn))。(三)內(nèi)容效度的特性與所有效度的性質(zhì)一樣,不是普遍適用的,而是根據(jù)具體情況分析得來(lái)。與測(cè)驗(yàn)定義的使用者有關(guān)有時(shí)間上的特定性要區(qū)分內(nèi)容效度和表面效度;

最高行為的測(cè)驗(yàn)要求有較高的表面效度,典型行為測(cè)驗(yàn)卻要求較低的表面效度。二、構(gòu)想效度(construct-relatedvalidity)(一)什么是構(gòu)想效度(構(gòu)思效度、結(jié)構(gòu)效度)指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想或特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語(yǔ)或構(gòu)想,解釋的程度如何。某一構(gòu)想的理論某一心理特質(zhì)的假設(shè)設(shè)計(jì)和編制測(cè)驗(yàn),施測(cè)相關(guān)或因素分析,驗(yàn)證與理論假設(shè)的符合程度(二)構(gòu)想效度的估計(jì)方法1、對(duì)測(cè)驗(yàn)本身的分析這類(lèi)方法是通過(guò)研究測(cè)驗(yàn)內(nèi)部結(jié)構(gòu)來(lái)界定理論構(gòu)想,從而為構(gòu)思效度提供證據(jù)。內(nèi)容效度可以作為構(gòu)思效度的證據(jù)。內(nèi)部一致性指標(biāo):推斷測(cè)驗(yàn)是測(cè)量單一特制還是測(cè)量多種特質(zhì)。有時(shí)分析被試者對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。如果對(duì)測(cè)題的反應(yīng)包括了社會(huì)贊許和道德評(píng)判,不一定能反映被試者的行為,則影響構(gòu)思效度。2、測(cè)驗(yàn)間的相互比較通過(guò)分析幾個(gè)測(cè)驗(yàn)間的相互關(guān)系,找出其共同之處,進(jìn)而推斷這些測(cè)驗(yàn)測(cè)量的特質(zhì),以確定這些測(cè)驗(yàn)構(gòu)思效度。相容效度(congruentvalidity)

:與其他測(cè)量同一構(gòu)思的測(cè)驗(yàn)有相關(guān)。其中一個(gè)是新測(cè)驗(yàn),另一個(gè)是已有效度證據(jù)的成熟測(cè)驗(yàn),兩者測(cè)量的是同一種心理特質(zhì)。假如相關(guān)高,說(shuō)明新測(cè)驗(yàn)所測(cè)量的特質(zhì)確實(shí)是老測(cè)驗(yàn)所反映的特質(zhì)或行為。因?yàn)閮蓽y(cè)驗(yàn)的相關(guān)系數(shù)的平方即是兩組測(cè)驗(yàn)分?jǐn)?shù)所共同解釋的變異大小,所以稱(chēng)這一相關(guān)為相容效度。

區(qū)分效度(discriminatevalidity):必須與測(cè)量不同構(gòu)思的測(cè)驗(yàn)無(wú)相關(guān)。

因素分析法(factoranalysis):可以找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素。3、效標(biāo)效度的研究證明

一個(gè)測(cè)驗(yàn)若效標(biāo)效度理想,那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類(lèi)就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo)??梢愿鶕?jù)效標(biāo)選取不同的被試形成相對(duì)照的兩組;也可以根據(jù)測(cè)驗(yàn)分?jǐn)?shù)分成高分組與低分組。另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。4、實(shí)驗(yàn)法和觀察法證實(shí)觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異也是驗(yàn)證構(gòu)思效度的方法。三、效標(biāo)效度(criterion—relatedvalidity)(一)什么是效標(biāo)效度(實(shí)證效度)效標(biāo)效度反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱(chēng)效標(biāo)。根據(jù)效標(biāo)資料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度和預(yù)測(cè)效度。前者與用來(lái)診斷現(xiàn)狀的測(cè)驗(yàn)有關(guān)(如心理特征的評(píng)估及診斷),后者與預(yù)測(cè)將來(lái)結(jié)果的測(cè)驗(yàn)有關(guān)(如用于選拔、分組的)。一個(gè)好的效標(biāo)必須具備以下條件(略)效標(biāo)必須能最有效地反映測(cè)驗(yàn)的目標(biāo),即效標(biāo)測(cè)量本身必須有效;效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素而變化;效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來(lái)表示;效標(biāo)測(cè)量的方法簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。例如:GRE的成績(jī)能預(yù)測(cè)將來(lái)能否取得學(xué)位,說(shuō)明GRE能測(cè)量大學(xué)畢業(yè)生的專(zhuān)業(yè)基礎(chǔ)和能力。(二)效標(biāo)效度的評(píng)估方法效標(biāo)效度有多種評(píng)估方法,下面介紹3種常用的方法:1、相關(guān)法:測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān)系數(shù),稱(chēng)為效度系數(shù)。

a.積差相關(guān)法:前者和后者都為連續(xù)變量

b.點(diǎn)二列相關(guān)法:連續(xù)變量和真正的二分變量二列相關(guān)法:連續(xù)變量和人為的二分變量

c.賈斯朋(Juspen)多系列相關(guān)法:連續(xù)變量和等級(jí)評(píng)定變量2、區(qū)分法:檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效的區(qū)分有效標(biāo)所定義的團(tuán)體的一種方法。計(jì)算公式如下:

問(wèn)題:組間平均數(shù)差異在統(tǒng)計(jì)上的顯著性取決于團(tuán)體的大小。3、命中率法:當(dāng)測(cè)驗(yàn)用來(lái)做取舍的依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。測(cè)驗(yàn)分?jǐn)?shù):確定一個(gè)臨界分?jǐn)?shù)(即分?jǐn)?shù)線)。效標(biāo)資料:根據(jù)實(shí)際的工作或?qū)W習(xí)成績(jī),確定一合格標(biāo)準(zhǔn)。

效標(biāo)成績(jī)

測(cè)驗(yàn)預(yù)測(cè)失?。ā┏晒Γ?)成功(+)(A)失誤(B)命中失?。ā–)命中(D)失誤

命中率的計(jì)算有兩種方法:

總命中率

正命中率第三單元效度的功能一、預(yù)測(cè)誤差效度系數(shù)的實(shí)際意義常常以決定性系數(shù)來(lái)表示,意旨相關(guān)系數(shù)的平方。它表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。估計(jì)的標(biāo)準(zhǔn)誤。是指所有具有某一測(cè)驗(yàn)分?jǐn)?shù)的被試其效度分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差,也即預(yù)測(cè)誤差大小的估計(jì)值,是對(duì)真正分?jǐn)?shù)估計(jì)的誤差大小。二、預(yù)測(cè)效標(biāo)分?jǐn)?shù)在測(cè)驗(yàn)工作中,人們感興趣的是從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)成績(jī),最常用的是Y對(duì)X的回歸方程:三、預(yù)測(cè)效率指數(shù)無(wú)關(guān)系數(shù)K值大小表明預(yù)測(cè)源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無(wú)關(guān)的程度。預(yù)測(cè)效率的指數(shù)E=100(1-K)

E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。

例題見(jiàn)366頁(yè)。第四單元影響效度的因素

影響效度的因素很多,凡能產(chǎn)生隨機(jī)誤差和系統(tǒng)誤差的因素都會(huì)降低測(cè)驗(yàn)的效度。一、測(cè)驗(yàn)本身的因素

測(cè)驗(yàn)取材的代表性、測(cè)驗(yàn)長(zhǎng)度、試題類(lèi)型、難度、區(qū)分度以及編排方式等都會(huì)影響效度。保證測(cè)驗(yàn)較高效度要點(diǎn):測(cè)驗(yàn)材料必須對(duì)整個(gè)內(nèi)容具有代表性;測(cè)題設(shè)計(jì)時(shí)應(yīng)盡量避免容易引起誤差的題型(如是非題);測(cè)題難度要適中,具有較高的區(qū)分度;測(cè)驗(yàn)長(zhǎng)度要恰當(dāng),即要有一定的測(cè)題量;測(cè)題的排列按先易后難順序。二、測(cè)驗(yàn)實(shí)施中的干擾因素

(一)主試的影響因素測(cè)驗(yàn)實(shí)施過(guò)程中主試的因素會(huì)影響效度。必須按標(biāo)準(zhǔn)化的規(guī)定實(shí)施測(cè)驗(yàn)。效標(biāo)效度,測(cè)驗(yàn)與效標(biāo)二者實(shí)施時(shí)間間隔越長(zhǎng),測(cè)驗(yàn)與效標(biāo)越容易受到很多機(jī)遇因素的影響。測(cè)驗(yàn)情境,如場(chǎng)地的布置、材料的準(zhǔn)備、測(cè)驗(yàn)場(chǎng)所有無(wú)噪音和其他干擾因素等也會(huì)影響到測(cè)驗(yàn)的效度。

(二)被試的影響因素

被試在測(cè)驗(yàn)時(shí)的興趣、動(dòng)機(jī)、情緒、態(tài)度和身心狀況、健康狀態(tài)以及是否充分合作與盡力而為等,都會(huì)影響被試在測(cè)驗(yàn)情境中的反應(yīng),因而影響測(cè)驗(yàn)結(jié)果的效度。被試的反應(yīng)定勢(shì)也會(huì)降低測(cè)驗(yàn)的效度。三、樣本團(tuán)體的性質(zhì)測(cè)驗(yàn)的效度和樣本團(tuán)體的特點(diǎn)具有很大的關(guān)系。同一測(cè)驗(yàn)對(duì)于不同的樣本團(tuán)體其效度有很大的不同,因此在作效度分析時(shí),必須選擇具有代表性的被試團(tuán)體。(一)樣本團(tuán)體的異質(zhì)性.與信度系數(shù)一樣,如果其他條件相同,樣本團(tuán)體越同質(zhì),分?jǐn)?shù)分布范圍越小,測(cè)驗(yàn)效度就越低;樣本團(tuán)體越越異質(zhì),分?jǐn)?shù)分布范圍越大,測(cè)驗(yàn)效度就越高。其中有兩種情況會(huì)影響樣本團(tuán)體的異質(zhì)性:

只以選拔上的被試為樣本團(tuán)體參加效度研究,降低了測(cè)驗(yàn)的效度。

選拔標(biāo)準(zhǔn)太高,樣本團(tuán)體的同質(zhì)性增加,降低了測(cè)驗(yàn)的效度。(二)干涉變量對(duì)于不同性質(zhì)的團(tuán)體,同一測(cè)驗(yàn)的效度會(huì)有很大的不同。這些性質(zhì)包括年齡、性別、教育水平、智力、動(dòng)機(jī)、興趣、職業(yè)和任何有關(guān)的特征。測(cè)量學(xué)上稱(chēng)這些特征為干涉變量(moderatorvariable)。

美國(guó)心理學(xué)家吉賽利(E.E.Ghiselli)提出的如何找出干涉變量的方法:用回歸方程求得每個(gè)人的預(yù)測(cè)效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實(shí)際效標(biāo)分?jǐn)?shù)相比較,獲得分?jǐn)?shù)D。如果D的絕對(duì)值很大,說(shuō)明測(cè)驗(yàn)中可能存在干涉變量。根據(jù)本團(tuán)體的組成分析,找出對(duì)照組,分別計(jì)算效度,找出干涉變量。對(duì)于預(yù)測(cè)團(tuán)體,根據(jù)某些易見(jiàn)的干涉變量將其區(qū)分為預(yù)測(cè)性高和預(yù)測(cè)性低的兩個(gè)亞團(tuán)體。對(duì)于預(yù)測(cè)性高的團(tuán)體,獲得的測(cè)驗(yàn)效度會(huì)有所提高。

四、效標(biāo)的性質(zhì)

效標(biāo)效度是以測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)系數(shù)來(lái)表示的。效標(biāo)的性質(zhì)需要考慮:效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)之間的關(guān)系是否是線性關(guān)系效標(biāo)測(cè)量本身有可靠性第五節(jié)項(xiàng)目分析測(cè)驗(yàn)的項(xiàng)目分析:定性分析,包括考慮內(nèi)容效度,題目編寫(xiě)的恰當(dāng)性和有效性等;定量分析,主要是對(duì)題目難度和區(qū)分度等進(jìn)行分析。通過(guò)項(xiàng)目分析,可以選擇和修改測(cè)驗(yàn)題目,以提高測(cè)驗(yàn)的信度和效度。第一單元項(xiàng)目的難度一、定義難度(difficulty),是指項(xiàng)目的難易程度。能力測(cè)驗(yàn)---反映難度水平的指標(biāo)非能力測(cè)驗(yàn)---類(lèi)似的指標(biāo)是“通俗性”難度的指標(biāo):以答對(duì)或通過(guò)該題的人數(shù)百分比來(lái)表示:也稱(chēng)易度:P值大小與難度高低成反比。難度的指標(biāo):被試者未通過(guò)每個(gè)項(xiàng)目的人數(shù)百分比二、計(jì)算方法(一)二分法記分的項(xiàng)目選擇題,通過(guò)記1分,錯(cuò)誤記0分??芍苯佑霉?—31計(jì)算難度。當(dāng)被試人數(shù)較多時(shí),則可根據(jù)測(cè)驗(yàn)總成績(jī)將被試分成三組:分?jǐn)?shù)最高的27%被試為高分組,分?jǐn)?shù)最低的27%被試為低分組,中間46%的被試為中間組。分別計(jì)算高分組和低分組的通過(guò)率,以?xún)山M通過(guò)率的平均值作為每一題的難度。其公式為:

為了平衡機(jī)遇對(duì)難度的影響,吉爾福特提出了一個(gè)難度的校正公式:(二)非二分記分的項(xiàng)目當(dāng)測(cè)驗(yàn)項(xiàng)目為問(wèn)答題或不能用二分法記分的形式時(shí),一般用下面的公式計(jì)算難度。三、難度水平的確定(一)項(xiàng)目的難度進(jìn)行難度分析的主要目的是為了篩選項(xiàng)目,項(xiàng)目的難度多高合適,取決于測(cè)驗(yàn)的目的、性質(zhì)以及項(xiàng)目的形式。當(dāng)測(cè)驗(yàn)用于選拔或診斷時(shí),應(yīng)該比較多地選擇難度值接近錄取率的項(xiàng)目。選擇題P值一般應(yīng)大于概率水平,是非題難度為0.73,四選一為0.63較合適。(二)測(cè)驗(yàn)的難度測(cè)驗(yàn)的難度直接依賴(lài)于組成測(cè)驗(yàn)的項(xiàng)目的難度。通過(guò)考察測(cè)驗(yàn)分?jǐn)?shù)的分布,可以對(duì)測(cè)驗(yàn)的難度做出直觀檢驗(yàn)。A為正偏態(tài)分布,即大多數(shù)得分集中在低端,說(shuō)明編制的測(cè)驗(yàn)對(duì)于所要研究的樣本團(tuán)夠來(lái)說(shuō)偏難,因此必須增加較低難度的項(xiàng)目;B為負(fù)偏態(tài)分布,測(cè)驗(yàn)過(guò)易,必須增加有較高難度的項(xiàng)目。第二單元項(xiàng)目的區(qū)分度一、定義

項(xiàng)目區(qū)分度(itemdiscrimination),也叫鑒別力,是指測(cè)驗(yàn)項(xiàng)目對(duì)被試的心理特性的區(qū)分能力。如果一個(gè)項(xiàng)目,實(shí)際水平高的被試能順利通過(guò),而實(shí)際水平低的被試不能通過(guò).那么我們就可以認(rèn)為該項(xiàng)目有較高的區(qū)分度。項(xiàng)目區(qū)分度是評(píng)價(jià)項(xiàng)目質(zhì)量和篩選項(xiàng)目的主要指標(biāo),也是影響測(cè)驗(yàn)效度的重要因素。區(qū)分度取值范圍介于-1.00至+1.00之間。二、計(jì)算方法

在估計(jì)項(xiàng)目區(qū)分度時(shí),常用其他指標(biāo)替代實(shí)際能力水平,其中用的最多的時(shí)測(cè)驗(yàn)總分。

(一)鑒別指數(shù)按測(cè)驗(yàn)總分高低排列答卷;確定高分組與低分組,每一組取答卷總數(shù)的27%分別計(jì)算高分組與低分組在該項(xiàng)目上的通過(guò)率或得分率按下列公式估計(jì)出項(xiàng)目的鑒別指數(shù):

美國(guó)測(cè)驗(yàn)專(zhuān)家伊貝爾(L.Ebel)提出用鑒別指數(shù)評(píng)價(jià)項(xiàng)目性能的標(biāo)準(zhǔn)。如下表:(二)相關(guān)法計(jì)算區(qū)分度最常用的方法是相關(guān)法,即以某一項(xiàng)目分?jǐn)?shù)與效標(biāo)成績(jī)或測(cè)驗(yàn)總分的相關(guān)作為該項(xiàng)目區(qū)分度的指標(biāo)。點(diǎn)二列相關(guān):適用與一類(lèi)變量為二分稱(chēng)名變量,另一類(lèi)變量為連續(xù)變量的成對(duì)變量的相關(guān)計(jì)算。二列相關(guān):適用于兩個(gè)連續(xù)變量,但其中一個(gè)變量被人為分成兩類(lèi)。Φ相關(guān)法:適用于兩個(gè)變量均為二分稱(chēng)名變量。三、區(qū)分度與難度的關(guān)系

如果每一個(gè)項(xiàng)目的難度均處于0.50,有可能大多趨向于有關(guān)的內(nèi)容或技能,結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端的情況下,有可能50%的被試全部通過(guò)各項(xiàng)目得滿(mǎn)分,另外50%的被試全部為0分,形成U形分布,這樣反而降低總分的區(qū)分能力。如果測(cè)驗(yàn)的所有項(xiàng)目都是中等難度,只有項(xiàng)目的內(nèi)在相關(guān)為0時(shí),整個(gè)測(cè)驗(yàn)才能產(chǎn)生常態(tài)分布??紤]到一般測(cè)驗(yàn)項(xiàng)目之間具有某種程度的相關(guān),難度的分布廣一些,梯度多一些,是合乎需要的。難度和區(qū)分度都是相對(duì)的,較難的項(xiàng)目對(duì)高水平的被試區(qū)分度高,較易的項(xiàng)目對(duì)水平低的被試區(qū)分度高,中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高。對(duì)被試總體較難或較易的項(xiàng)目,對(duì)水平高或水平低的被試便成了中等難度。

人的大多數(shù)心理特性呈常態(tài)分布,項(xiàng)目難度的分布也以常態(tài)分布為好,即特別難與特別易的項(xiàng)目少些,接近中等難度的項(xiàng)目多些,而所有項(xiàng)目的平均難度為0.50。這樣不僅能保證多數(shù)項(xiàng)目具有較高的區(qū)分度,而且可以保證整個(gè)測(cè)驗(yàn)對(duì)被試具有較高的區(qū)分能力。第六節(jié)測(cè)驗(yàn)的編制的一般程序第一單元測(cè)驗(yàn)的目標(biāo)分析一、測(cè)驗(yàn)的對(duì)象明確測(cè)驗(yàn)編成后要用于的團(tuán)體。應(yīng)了解受測(cè)者的年齡、受教育程度和社會(huì)經(jīng)濟(jì)以及閱讀水平等。在測(cè)驗(yàn)編制及建立常模過(guò)程中還應(yīng)考慮文化背景的影響。如韋氏智力測(cè)驗(yàn),分城市式和農(nóng)村式。二、測(cè)驗(yàn)的用途明確測(cè)驗(yàn)的用途:描述、診斷,或是選拔和預(yù)測(cè)。用途不同,編制測(cè)驗(yàn)時(shí)的取材范圍以及試題難度等也不盡相同。根據(jù)測(cè)驗(yàn)的用途分類(lèi):顯示和預(yù)測(cè)。測(cè)驗(yàn)就有顯示性測(cè)驗(yàn)和預(yù)測(cè)性測(cè)驗(yàn)。(一)顯示性測(cè)驗(yàn)顯示性測(cè)驗(yàn)是指測(cè)驗(yàn)題目和所要測(cè)量的心理特征相似的測(cè)驗(yàn)。例如成就測(cè)驗(yàn)。顯示性測(cè)驗(yàn)(古德納夫):樣本測(cè)驗(yàn)和標(biāo)記測(cè)驗(yàn)。題目取自一個(gè)很明確的總體的測(cè)驗(yàn)即是樣本測(cè)驗(yàn),例如測(cè)量學(xué)生的四則混合運(yùn)算能力題目取自一個(gè)全開(kāi)放的總體的測(cè)驗(yàn)即是標(biāo)記測(cè)驗(yàn),例如智力測(cè)驗(yàn)。如果被試在智力測(cè)驗(yàn)上得分高,而且在實(shí)際生活中確實(shí)也很聰明,那么這個(gè)測(cè)驗(yàn)就算是智力的比較好的標(biāo)記,因?yàn)樗赋隽嘶驑?biāo)記了所取樣總體的性質(zhì)。(二)預(yù)測(cè)性測(cè)驗(yàn)預(yù)測(cè)性測(cè)驗(yàn)是指預(yù)測(cè)一些沒(méi)被測(cè)量的行為的測(cè)驗(yàn)。例如GRE中的詞匯測(cè)驗(yàn),能預(yù)測(cè)被試將來(lái)在大學(xué)里的學(xué)業(yè)表現(xiàn)。編制預(yù)測(cè)性測(cè)驗(yàn)最關(guān)心的是測(cè)驗(yàn)分?jǐn)?shù)與預(yù)測(cè)行為之間的關(guān)系,要搞清楚哪些因素可以預(yù)測(cè)。顯示性測(cè)驗(yàn)和預(yù)測(cè)性測(cè)驗(yàn)的區(qū)分并不是絕對(duì)的,有時(shí)是統(tǒng)一的。如高考,是樣本測(cè)驗(yàn),又是預(yù)測(cè)測(cè)驗(yàn)。三、測(cè)驗(yàn)的目標(biāo)心理測(cè)驗(yàn)的目標(biāo)是指編制的測(cè)驗(yàn)測(cè)量什么樣的心理變量或行為特征。目標(biāo)分析過(guò)程:測(cè)驗(yàn)編制者對(duì)測(cè)驗(yàn)?zāi)繕?biāo)加以分析,將其目標(biāo)轉(zhuǎn)換成可操作的術(shù)語(yǔ)。

目標(biāo)分析以測(cè)驗(yàn)不同而異,一般可分為三種情況:(一)工作分析對(duì)于選拔和預(yù)測(cè)功用的預(yù)測(cè)性測(cè)驗(yàn),它的主要任務(wù)就是要對(duì)所預(yù)測(cè)的行為活動(dòng)作具體分析,我們稱(chēng)之為任務(wù)分析或工作分析。這種分析包括兩個(gè)步驟:第一是確定:心理特征和行為-------要預(yù)測(cè)的活動(dòng)達(dá)到成功,如職業(yè)興趣測(cè)驗(yàn)中的打字項(xiàng)目,假定手指的靈活性、手眼協(xié)調(diào)等能力是打字必需的;證卷公司選錄入員。通過(guò)參閱前人的工作從理論上分析通過(guò)對(duì)已經(jīng)錄用或已經(jīng)成功的人員的行為分析確定測(cè)驗(yàn)的能力、技能或特質(zhì)--------選擇測(cè)量的題目。第二是建立衡量被試是否成功的標(biāo)準(zhǔn),即效標(biāo)。是鑒別測(cè)驗(yàn)的預(yù)測(cè)能力是否有效的重要指標(biāo)。好經(jīng)理的標(biāo)準(zhǔn):每天洗頭、刮胡子、衣著整齊、出門(mén)總開(kāi)汽車(chē),還是思路清晰、頭腦清醒、IQ為140?(二)對(duì)特定概念下定義定義要測(cè)量的心理或行為特質(zhì)-----包含的維量(行為表現(xiàn)或測(cè)量)。例如創(chuàng)造力的測(cè)量,有人將創(chuàng)造力定義為發(fā)散思維的能力,即對(duì)規(guī)定的刺激產(chǎn)生大量的、變化的、獨(dú)特的反應(yīng)。根據(jù)此操作定義,創(chuàng)造力則應(yīng)該從反應(yīng)的流暢性、靈活性、獨(dú)創(chuàng)性和詳盡性四個(gè)方面來(lái)測(cè)量。(三)確定測(cè)驗(yàn)的具體內(nèi)容顯示測(cè)驗(yàn)的目標(biāo)分析的主要任務(wù)是確定顯示的內(nèi)容和技能,從中取樣。成就測(cè)驗(yàn)的內(nèi)容分析過(guò)程主要體現(xiàn)在雙向細(xì)目表的編制過(guò)程中。這是一個(gè)由測(cè)量的內(nèi)容材料維度和行為目標(biāo)維度所構(gòu)成的表格,它能幫助成就測(cè)驗(yàn)的編制者決定應(yīng)該選擇哪些方面的題目以及各題目所占的比例。表5—8小學(xué)自然常識(shí)測(cè)驗(yàn)雙向細(xì)目表

行為目標(biāo)教材內(nèi)容獲得基本知識(shí)了解原理原則應(yīng)用原理原則分析因果關(guān)系綜合成有系統(tǒng)見(jiàn)解建立評(píng)價(jià)標(biāo)準(zhǔn)合計(jì)生物世界資源利用動(dòng)力和機(jī)械物質(zhì)特性與能量氣象宇宙地球3225222533645263483423123211210220110110002010122513128合計(jì)1828301383100第二單元測(cè)題的編寫(xiě)編制測(cè)驗(yàn)題目涉及到從寫(xiě)出、編輯,到預(yù)試、修改等這樣一個(gè)循環(huán)過(guò)程。在得到一套令人滿(mǎn)意的測(cè)題之前,這些步驟是不斷重復(fù)的。一、搜集資料測(cè)驗(yàn)計(jì)劃編好后,就要搜集有關(guān)資料作為命題取材的依據(jù),一個(gè)測(cè)驗(yàn)的好壞和測(cè)驗(yàn)材料的選擇適當(dāng)與否有密切關(guān)系。題目的來(lái)源可分為三個(gè)方面:(一)已出版的標(biāo)準(zhǔn)測(cè)驗(yàn)從已經(jīng)出版的各種標(biāo)準(zhǔn)測(cè)驗(yàn)中選擇合適的題目。比如MMPI的簡(jiǎn)本;敵意量表,來(lái)自于MMPI;成就測(cè)驗(yàn),題目可來(lái)源于課本、參考書(shū)、講義和課題討論等素材。(二)理論和專(zhuān)家的經(jīng)驗(yàn)理論和專(zhuān)家經(jīng)驗(yàn)有時(shí)也可以作為題目的來(lái)源之一,比如要編制態(tài)度量表,那么理論上不少對(duì)態(tài)度的類(lèi)型、性質(zhì)維度、定義等等的描述就可以轉(zhuǎn)換成題目,或用具體的例子。(三)臨床觀察和記錄臨床觀察也可以作為題目的來(lái)源,各種觀察量表或檢核表很多都是來(lái)源于觀察到的行為表現(xiàn),對(duì)于人格測(cè)驗(yàn)而言,其題目就是臨床上描述人格的術(shù)語(yǔ)或詞匯。比如MMPI的題目就是從病歷記錄中篩選出來(lái)的。二、命題的一般原則編制測(cè)驗(yàn)題目,類(lèi)型繁多、功能各異、性質(zhì)不一,詳細(xì)說(shuō)明每一種題目的具體編制方法實(shí)屬不能,但一般原則還是有的。這些原則可以從內(nèi)容、文字、理解和社會(huì)敏感性四個(gè)方面來(lái)考慮。(一)內(nèi)容方面要求題目的內(nèi)容符合測(cè)驗(yàn)的目的,避免貪多而亂出題目;內(nèi)容取樣要有代表性,符合測(cè)驗(yàn)計(jì)劃的內(nèi)容,比例適當(dāng);題目間內(nèi)容相互獨(dú)立,互不牽連,切忌一個(gè)題目的答案影響對(duì)另一個(gè)題目的回答。(二)文字方面使用準(zhǔn)確的當(dāng)代語(yǔ)言,避免使用生僻的字句或詞匯;語(yǔ)句要簡(jiǎn)明扼要,既排除與答案無(wú)關(guān)的因素,又不要遺漏答題所依據(jù)的必要條件;一句話說(shuō)明一個(gè)概念,不要使用兩個(gè)或兩個(gè)以上的觀念,意義必須明確,不得暖昧或含糊,盡量少使用雙重否定句。(三)理解方面題目應(yīng)有確切的答案,除創(chuàng)造力測(cè)驗(yàn)和人格測(cè)驗(yàn)外不應(yīng)具有引起爭(zhēng)議的可能;題目的內(nèi)容不要超出受測(cè)團(tuán)體的知識(shí)水平和理解能力;題目的格式要不被人誤解。(四)社會(huì)敏感性方面應(yīng)盡量避開(kāi)社會(huì)敏感性問(wèn)題(性關(guān)系、性觀念及自殺等),如涉及社會(huì)禁忌或個(gè)人隱私的題目不應(yīng)使用。編制涉及這類(lèi)社會(huì)敏感性問(wèn)題測(cè)驗(yàn)的策略(Phillips,D.L.):1.命題時(shí)假定被試具有某種行為,使他不得不在確實(shí)沒(méi)有該行為時(shí)才否定,可避免否定答案過(guò)多的傾向。如:“你平均多久才手淫一次,每月一次?每周一次?每天一次?從不?”2.命題時(shí)假定規(guī)范不一致,如“有些醫(yī)生認(rèn)為吸煙有害,而另一些醫(yī)生則認(rèn)為吸煙有益,你認(rèn)為呢?”3.指出該行為是常見(jiàn)的,雖然是違規(guī)的,如“多數(shù)人在看色情電影時(shí)有性沖動(dòng),你呢?”三、測(cè)題的編制要領(lǐng)根據(jù)對(duì)被試的要求不同對(duì)心理測(cè)驗(yàn)的題目進(jìn)行分類(lèi):提供型和選擇型題目。提供型題目給出正確答案,如論文提、問(wèn)答題、填充題。選擇型題目要求在有限的幾個(gè)答案中選擇正確的答案,如選擇題、是非題、匹配題等。(一)選擇題題干就是呈現(xiàn)一個(gè)問(wèn)題的情境,一般由直接問(wèn)句或不完全的陳述句構(gòu)成。選項(xiàng)就是問(wèn)題的多種可能答案,常常是包含一個(gè)正確答案,若干(一般是1-5個(gè))錯(cuò)誤答案,其中錯(cuò)誤的答案叫“誘答”,是為了迷惑那些無(wú)法確定答案的被試。1.題干所提的問(wèn)題必須明確,盡量使用簡(jiǎn)單而且明晰的詞語(yǔ)。做到題干意義完整,即使被試不看選項(xiàng)亦能完全理解。不要在題干中夾有選項(xiàng),或者摻有不切題的內(nèi)容。2.選項(xiàng)切忌冗長(zhǎng),要簡(jiǎn)明扼要。選項(xiàng)中共同用到的詞語(yǔ)刪掉,放到題干中去,可使題意更明確,同時(shí)減少被試看題時(shí)間。3.每題只給一個(gè)正確答案,其他屬誘答。若是找最合適的答案,則應(yīng)用這樣的問(wèn)句:“下列答案中哪個(gè)最合適?”以免引起困惑。4.各選項(xiàng)長(zhǎng)度應(yīng)相等,盡量不要有長(zhǎng)有短。同時(shí),選項(xiàng)與題干的聯(lián)系要非常密切。誘答也必須一致,以免被試很容易就排除了誘答項(xiàng)目。5.避免題干用詞與選項(xiàng)用詞一致,否則成了選擇答案的線索。正確答案有修飾用語(yǔ)或用正規(guī)的詞語(yǔ),而誘答選項(xiàng)均沒(méi)有,也會(huì)給被試提供線索,應(yīng)避免?!皼Q不”、“從來(lái)”、“所有”、“惟一”、“絕對(duì)”等詞,不適用于選項(xiàng)中。6.選項(xiàng)最好用同一形式。如同是人名,同是日期,同是物理現(xiàn)象等等,長(zhǎng)度最好相等。選項(xiàng)的排列最好隨機(jī),除非本身有邏輯順序。(二)是非題是非題又叫正誤題,是指出一個(gè)論點(diǎn)要被試判斷是否正確,或是從是非兩個(gè)答案做出選擇,因此可以把是非題看作是兩個(gè)備選答案的選擇題。例:(1)你常常會(huì)主動(dòng)地去做一些有意義的習(xí)題嗎?是□否□

(2)你常常主動(dòng)給朋友寫(xiě)信或打電話嗎?是□否□編制是非題應(yīng)注意:1.內(nèi)容應(yīng)以有意義的概念、事實(shí)或基本原則為基礎(chǔ),不要在敘述中出現(xiàn)瑣碎的細(xì)節(jié)或無(wú)關(guān)的話語(yǔ),不要照抄原文。2.每道題只能包含一個(gè)概念,避免兩個(gè)或兩個(gè)以上的概念出現(xiàn)在同一個(gè)題目中,造成“半對(duì)半錯(cuò)”或“似是而非”的情況。3.盡量避免否定的敘述,尤其是要避免用雙重否定的敘述。因?yàn)榉穸ǖ臄⑹龀?huì)被人誤認(rèn)為是肯定的敘述,將“不”字忽略,雙重否定尤其容易使人困惑,不如直接采用肯定的敘述為佳。4.若是表達(dá)意見(jiàn)的題目,最好說(shuō)明意見(jiàn)的來(lái)源和根據(jù),以便測(cè)出被試是否了解某個(gè)人或某些人的意見(jiàn)、信念或價(jià)值觀念等。5.“是”、“非”題的數(shù)目應(yīng)有適應(yīng)比例,基本相等,且要隨機(jī)排列?!笆恰?、“非”題目的編寫(xiě)在長(zhǎng)度和復(fù)雜性上應(yīng)盡量保持一致。(三)簡(jiǎn)答題簡(jiǎn)答題是提供型題目,它要求被試用一個(gè)正確的詞或句子來(lái)完成或填充一個(gè)未完成句子的空白,或者是提供一個(gè)正確的答案。有時(shí)將前者稱(chēng)之為填充題,后者稱(chēng)之為簡(jiǎn)答題。例:世界上第一個(gè)智力測(cè)驗(yàn)是由

編制的。(填充題)夏天為什么要穿淺顏色的衣服,不穿深顏色的衣服?(簡(jiǎn)答題)編制簡(jiǎn)答題有三條原則:1.宜用問(wèn)句形式。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論