zal心理測量學(xué)理論_第1頁
zal心理測量學(xué)理論_第2頁
zal心理測量學(xué)理論_第3頁
zal心理測量學(xué)理論_第4頁
zal心理測量學(xué)理論_第5頁
已閱讀5頁,還剩159頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Psychology Measurement 心理(xnl)測量學(xué)山東理工大學(xué) 張愛蓮2022/7/23共一百六十四頁關(guān)于(guny)測量物理測量:長度、重量、面積、速度等。生理測量:生化成分、生理機(jī)能等。社會測量:人口普查、經(jīng)濟(jì)(jngj)統(tǒng)計、民意調(diào)查等。心理測量:智力、人格、成就、職業(yè)興趣、態(tài)度等。2022/7/23共一百六十四頁在心理咨詢與治療過程中,無論是臨床診斷,還是療效評估,心理測量都是重要的手段。因此,心理咨詢師有必要了解(lioji)心理測量的理論與技術(shù)。2022/7/23共一百六十四頁第一節(jié) 概述第二節(jié) 測驗的常模 第三節(jié) 測驗的信度第四節(jié) 測驗的效度第五節(jié) 項目分析第六節(jié)

2、 測驗編制的一般(ybn)程序第七節(jié) 心理測驗的使用2022/7/23共一百六十四頁第一節(jié) 概 述第1單元(dnyun) 測量與測量量表 第2單元 心理測量的基本概念 第3單元 心理測驗的分類 第4單元 糾正錯誤的測驗觀第5單元 心理測驗在心理咨詢中的應(yīng)用 第6單元心理測量的發(fā)展史2022/7/23共一百六十四頁第一(dy)單元 測量與測量量表一、什么是測量測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。測量包括3個元素:事物、數(shù)字與法則。事物:就是我們要測量的對象。數(shù)字:代表某一事物或該事物某一屬性的量。數(shù)字具有(jyu)區(qū)分性、序列性、等距性和可加性。法則:是指測量所依據(jù)的規(guī)則和方法。2022

3、/7/23共一百六十四頁二、測量要素任何測量都具有兩個要素:參照點(diǎn)和單位(一)參照點(diǎn)要確定事物的量,必須有一個計算的起點(diǎn),這個起點(diǎn)就叫參照點(diǎn)。參照點(diǎn)有兩種:一是絕對零點(diǎn)(重量、長度);二是相對零點(diǎn)(人為確定的參照點(diǎn),如溫度、海拔高度)。(二)單位單位是測量的基本(jbn)要求,沒單位就無法進(jìn)行測量。好的單位必須具備兩個條件:一是有確定的意義(cm、kg);二是有相同的價值(1cm-2cm-3cm)。2022/7/23共一百六十四頁2009年5月多選題:任何(rnh)測量都應(yīng)該具備的要素是( )(A)量表 (B)參照點(diǎn) (C)等級 (D)單位(BD)2022/7/23共一百六十四頁三、測量量表

4、斯蒂文斯將測量從低級到高級(goj)分成四種水平,即命名量表、順序量表、等距量表和等比量表。2022/7/23共一百六十四頁(一)命名量表 命名量表是測量水平最低的一種量表,只是用數(shù)字來代表事物或把事物歸類??煞譃閮煞N:代號:用數(shù)字來代表個別事物,如學(xué)生和運(yùn)動員的編號等。類別:用數(shù)字來代表具有某種屬性的事物的全體,如用1代表男、用2代表女,或用不同數(shù)字代表不同職業(yè)等。 命名量表的特點(diǎn):無大小之分、無零點(diǎn)、無單位(dnwi)、不能運(yùn)算2022/7/23共一百六十四頁(二)順序量表順序量表比命名量表水平高,其中的數(shù)字不僅指明類別,同時(tngsh)也指明類別的大小或含有某種屬性的程度。如:考試名次

5、、工資級別等,主要用于分等級或排出順序。特點(diǎn):無相等單位、無絕對零點(diǎn)、數(shù)字僅表示等級、不能運(yùn)算。2022/7/23共一百六十四頁(三)等距量表特點(diǎn):有大小關(guān)系、有相等單位,數(shù)值可以進(jìn)行加減運(yùn)算,由于沒有(mi yu)絕對零點(diǎn),不能做乘除運(yùn)算。比如,0C溫度并不意味著沒有溫度。2022/7/23共一百六十四頁(四)等比量表等比量表是最高水平的量表。 特點(diǎn):有相等的單位,有絕對零點(diǎn)、其數(shù)值可以進(jìn)行加、減、乘、除運(yùn)算。 如:長度、重量(zhngling)、時間等。2022/7/23共一百六十四頁一般來說,心理測量是在順序量表上進(jìn)行的,因為(yn wi)對于人的智力、性格、興趣、態(tài)度等來說,絕對零點(diǎn)是

6、難以確定的。2022/7/23共一百六十四頁第二單元 心理(xnl)測量的基本概念一、心理測量的定義所謂心理測量,就是依據(jù)心理學(xué)理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為(xngwi),對于貫穿在人的全部行為活動中的心理特點(diǎn)做出推論和數(shù)量化分析的一種科學(xué)手段。(應(yīng)對問卷:10.常常喜歡找人聊天以減輕煩惱 )2022/7/23共一百六十四頁2012年5月單選題:心理(xnl)測驗的行為樣本必須具有( )。A、全國性B、區(qū)域性C、代表性D、整群性 ( C )2022/7/23共一百六十四頁二、心理測驗的性質(zhì)(一)間接性(通過外顯行為推論心理特質(zhì))(二)相對性(如智力高低、興趣大?。?/p>

7、三)客觀性 心理測量(cling)的客觀性實(shí)際上就是測驗的標(biāo)準(zhǔn)化問題,包括:測驗的刺激是客觀的對反應(yīng)的量化是客觀的對結(jié)果的推論是客觀的2022/7/23共一百六十四頁 第三單元 心理(xnl)測驗的分類 一、按測驗(cyn)的功能分類(一)智力測驗 是對一般能力的測驗(觀察力、記憶力、想象力、思維力、注意力),比如:比內(nèi)-西蒙智力測驗、韋克斯勒智力量表。(二)特殊能力測驗 如音樂、繪畫等才能的測驗。(三)人格測驗 用于測量性格、氣質(zhì)、興趣、情緒、動機(jī)、信念等,如16PF。 21.我對于人或物的興趣都很容易改變: A.是的 B.介乎A與C之間 C.不是的2022/7/23共一百六十四頁二、按測驗

8、材料的性質(zhì)(xngzh)分類(一)文字測驗(二)操作測驗(非文字測驗)2022/7/23共一百六十四頁2022/7/23共一百六十四頁三、按測驗材料的嚴(yán)謹(jǐn)程度分類(一)客觀測驗(二)投射測驗 包括羅夏墨跡測驗、主題統(tǒng)覺測驗、自由聯(lián)想(linxing)測驗、句子完成測驗等。2022/7/23共一百六十四頁夏墨跡測驗2022/7/23共一百六十四頁主題(zht)統(tǒng)覺測驗2022/7/23共一百六十四頁2022/7/23共一百六十四頁2022/7/23共一百六十四頁四、按測驗的方式(fngsh)分類(一)個別測驗(二)團(tuán)體測驗2022/7/23共一百六十四頁五、按測驗的要求分類(fn li)(一)最

9、高行為測驗(智力測驗、成就測驗)(二)典型行為測驗(人格測驗)2022/7/23共一百六十四頁第四單元(dnyun) 糾正錯誤的測驗觀一、錯誤的測驗(cyn)觀(一)測驗萬能論(二)測驗無用論(三)心理測驗即智力測驗2022/7/23共一百六十四頁二、正確的測驗觀(一)心理測驗是重要的心理學(xué)研究方法之一,是決策的輔助工具。(二)心理測驗作為(zuwi)研究方法和測量工具尚不完善。2022/7/23共一百六十四頁第五單元(dnyun) 心理測驗在心理咨詢中的應(yīng)用 目前,在我國心理門診中運(yùn)用較多的大致(dzh)有3類心理測驗:智力測驗人格測驗心理評定量表(精神病評定量表、抑郁量表等)心理測驗在心理

10、咨詢與治療過程中并不是必不可少的,如果通過與來訪者的交談,對其問題已形成明確的看法,就應(yīng)放棄不必要的心理測驗。2022/7/23共一百六十四頁第六單元心理(xnl)測驗的發(fā)展史一、科學(xué)心理測驗的產(chǎn)生與發(fā)展首先(shuxin)倡導(dǎo)科學(xué)心理測驗的學(xué)者是英國生物學(xué)家和心理學(xué)家高爾頓,他提出人的不同氣質(zhì)特點(diǎn)和智能是按身體特點(diǎn)的不同而遺傳的。為了研究個體差異的遺傳性,他設(shè)計了測量差異的方法,為心理測驗奠定了統(tǒng)計學(xué)基礎(chǔ)。他第一個提出了相關(guān)的概念。(價值觀與幸福感的關(guān)系)2022/7/23共一百六十四頁2012年11月單選題:首先倡導(dǎo)科學(xué)心理測驗(cyn)的學(xué)者是( )。A、比內(nèi)B、高爾頓C、卡特爾D、皮爾

11、遜 ( B )2022/7/23共一百六十四頁另一位對促進(jìn)心理測驗發(fā)展做出巨大貢獻(xiàn)的是美國心理學(xué)家卡特爾,他于1890年在心理雜志上發(fā)表“心理測驗與測量”一文,這是心理測驗第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。他強(qiáng)調(diào):“心理學(xué)若不立足于實(shí)驗與測量上,絕不能夠有自然科學(xué)(kxu)之準(zhǔn)確性?!薄ⅰ靶睦頊y驗如果有一個普遍的標(biāo)準(zhǔn),則其科學(xué)(kxu)的與實(shí)用的價值都可以增加?!?022/7/23共一百六十四頁法國心理學(xué)家比內(nèi)與助手西蒙于1905年發(fā)表了題為“診斷兒童智力的新方法”的文章,介紹了一個包括30個項目的量表,這個(zh ge)量表是世界上第一個正式的心理測驗。2022/7/23共一百六十四頁20世紀(jì)以后,

12、心理測驗主要有四個方面(fngmin)的發(fā)展:1、操作測驗的發(fā)展(尤其適用于不識字者)2、團(tuán)體智力測驗的發(fā)展(用于官兵選拔和分派兵種)3、能力傾向測驗的發(fā)展(韋克斯勒智力量表)4、人格測驗的發(fā)展(MMPI、16PF、EPQ等)2022/7/23共一百六十四頁二、現(xiàn)代心理測驗在我國的發(fā)展 我國近代心理測驗大約(dyu)源于1914年前后。 近年來,我國心理學(xué)家正在致力于心理測驗的本土化,編制適合我國文化背景的智力測驗、適應(yīng)行為量表等。 (王登峰:大七人格)2022/7/23共一百六十四頁 第二節(jié) 測驗(cyn)的常模第一單元 常模團(tuán)體第二(d r)單元 常模的類型第三單元 常模分?jǐn)?shù)的表示方法 2

13、022/7/23共一百六十四頁什么是常模?常模是指一定人群在測驗所測特性上的普遍水平(shupng)。 常模,就是常人的樣子。2022/7/23共一百六十四頁補(bǔ)充:常模參照(cnzho)與標(biāo)準(zhǔn)參照(cnzho)采用常模參照分?jǐn)?shù)解釋的測驗:如律師資格考試,即使大家考試都考得特別好,也只取前面的百分之幾。采用標(biāo)準(zhǔn)參照分?jǐn)?shù)解釋的測驗:如心理咨詢師資格的考試,包括基礎(chǔ)理論和操作技能,滿分都是一百,六十分及格。兩科都滿60,就能通過。通過與不通過,參照一個事先設(shè)定好的標(biāo)準(zhǔn)來解釋分?jǐn)?shù),就叫做標(biāo)準(zhǔn)參照分?jǐn)?shù)解釋。2022/7/23共一百六十四頁 第一單元(dnyun) 常模團(tuán)體一、常模團(tuán)體的性質(zhì)常模團(tuán)體是由具

14、有某種共同特征的人所組成(z chn)的一個群體,或者是該群體的一個樣本。對測驗編制者而言,在確定常模團(tuán)體時,需要先確定一般總體,再確定目標(biāo)總體,最后確定樣本。2022/7/23共一百六十四頁二、常模團(tuán)體的條件(一)群體的構(gòu)成必須明確界定(性別、年齡、職業(yè))(二)常模團(tuán)體必須是所測群體的代表性樣本(三)樣本的大小要適當(dāng)(shdng) 在實(shí)際工作中,應(yīng)從經(jīng)濟(jì)、實(shí)用和減少誤差兩方面來綜合考慮樣本的大小。如果總體數(shù)目大,樣本一般最低不小于30或100個。全國性常模,一般應(yīng)有2000-3000人為宜。(四)標(biāo)準(zhǔn)化樣組是一定時空的產(chǎn)物/具有新近性2022/7/23共一百六十四頁 2012年11月多選題:

15、 常模團(tuán)體的條件有( )。 A、群體構(gòu)成明確(mngqu)B、樣本具有代表性C、樣本大小適當(dāng)D、具有新近性 ( ABCD )2022/7/23共一百六十四頁三、取樣的方法取樣就是從目標(biāo)人群中選擇(xunz)有代表性的樣本。 取樣方法有:(一)簡單隨機(jī)抽樣(二)系統(tǒng)抽樣(三)分組抽樣(四)分層抽樣2022/7/23共一百六十四頁簡單隨機(jī)抽樣就是按照隨機(jī)表順序(shnx)選擇受測者構(gòu)成樣本,或者將抽樣范圍內(nèi)的每個人或每個抽樣單位進(jìn)行編號,再隨機(jī)選擇。(隨機(jī)表=亂數(shù)表)系統(tǒng)抽樣又稱等距抽樣,就是將已編好號碼的個體排成順序,然后每隔若干個號碼抽取一個。分組抽樣是先將群體進(jìn)行分組,再在組內(nèi)進(jìn)行隨機(jī)取樣。

16、分層抽樣是先將目標(biāo)總體按某種變量(如年齡、性別等)分成若干層次,再從各層次中抽取若干受測者,最后把各層的受測者組合成常模樣本。2022/7/23共一百六十四頁四、常模與常模分?jǐn)?shù)(一)常模常模是一種供比較的標(biāo)準(zhǔn)量數(shù),是心理測驗時用于比較和解釋測驗結(jié)果的參照分?jǐn)?shù)標(biāo)準(zhǔn)。按照樣本大小和來源,常??煞譃槿珖D?、區(qū)域常模和特殊常模。(二)常模分?jǐn)?shù)常模分?jǐn)?shù)就是施測常模樣本后,將受測者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。導(dǎo)出分?jǐn)?shù)具有一定的參照點(diǎn)和單位,是一個(y )有意義的測驗量表,與原始分?jǐn)?shù)等值,可以進(jìn)行比較。2022/7/23共一百六十四頁一、發(fā)展常模 人的許多心理特質(zhì),如智力、技能等,是隨著(su

17、 zhe)時間有規(guī)律地發(fā)展的,因此可以將個人的成績與各種發(fā)展水平的人的平均表現(xiàn)相比較。根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模,亦稱年齡量表。在年齡量表中,個人的分?jǐn)?shù)表明他的行為按正常途徑發(fā)展處于什么樣的發(fā)展水平。 第二單元(dnyun) 常模的類型2022/7/23共一百六十四頁(一)發(fā)展順序量表發(fā)展順序量表告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育(fy)正常,相應(yīng)能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。 (三翻六坐九爬)2022/7/23共一百六十四頁2022/7/23共一百六十四頁發(fā)展順序量表最早的一個范例是格塞爾發(fā)展程序表,按月份顯示兒童在運(yùn)動水平、適應(yīng)性、語

18、言、社會性四個方面的大致發(fā)展水平。在兒童發(fā)展方面,瑞士心理學(xué)家皮亞杰最著名的工作就是對守恒概念的研究。皮亞杰發(fā)現(xiàn),兒童在不同時期出現(xiàn)不同的守恒概念,通常(tngchng)兒童到5歲時才會理解質(zhì)量守恒(橡皮泥);6歲時才會掌握重量守恒(杯中水);7歲時才具有容量守恒概念。2022/7/23共一百六十四頁(二)智力年齡比內(nèi)-西蒙量表中首先使用智力年齡的概念。一個兒童在年齡量表上所得的分?jǐn)?shù),就是最能代表(dibio)他智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡,簡稱智齡。計算方法: 在吳天敏修訂的比內(nèi)-西蒙量表中,每個年齡都有6個測題,答對每題則得智齡2個月。假如某兒童6歲組的題目全部通過,7歲組通過4題

19、,8歲組通過3題,9歲組通過2題,其智齡為:6(歲)+42(月)+32(月)+22(月)=6歲+18月=7歲6個月。2022/7/23共一百六十四頁(三)年級當(dāng)量年級當(dāng)量實(shí)際上就是年級量表,測驗結(jié)果說明屬哪一年級的水平,在教育成就測驗中最常用。其表達(dá)方式常是:某學(xué)生(xu sheng)的算術(shù)是6年級水平,閱讀是4年級水平、理解是5年級的水平。如常模樣本中6年級的算術(shù)平均分為35,某兒童在算術(shù)測驗中也得35分,那么,該兒童的算術(shù)能力是6年級水平。2022/7/23共一百六十四頁二、百分位常模百分位常模包括(boku)百分等級和百分點(diǎn)、四分位數(shù)和十分位數(shù)。 2022/7/23共一百六十四頁(一)百

20、分等級是應(yīng)用最廣的表示測驗分?jǐn)?shù)的方法。 一個測驗分?jǐn)?shù)的百分等級是指在常模樣(myng)本中低于這個分?jǐn)?shù)的人的百分比。因此,85的百分等級表示在常模樣本中有85%的人比這個分?jǐn)?shù)要低。 2022/7/23共一百六十四頁(二)百分點(diǎn)也叫百分位數(shù),是計算處于某一百分比例的人對應(yīng)的測驗分?jǐn)?shù)是多少。在分?jǐn)?shù)量表上,相對于某一百分等級(dngj)的分?jǐn)?shù)點(diǎn)就叫百分點(diǎn)或百分位數(shù)。在實(shí)際應(yīng)用中,一般既可以由原始分?jǐn)?shù)計算百分等級,也可以由百分等級確定原始分?jǐn)?shù)。通過這樣的雙向方式編制的原始分?jǐn)?shù)與百分等級對照表,就是百分位常模。 2022/7/23共一百六十四頁(三)四分位數(shù)和十分位數(shù)四分位數(shù)和十分位數(shù)只是百分位數(shù)的兩個

21、變式,其含義相似。百分位數(shù)是將量表分成100份,而四分位數(shù)是將量分成四等(s dn)份,相當(dāng)于百分等級的25%、50%和75%對應(yīng)的三個百分點(diǎn)分成的四段。十分位數(shù)也可以依此類推出,1%-10%為第一段,91%-100%為第十段。2022/7/23共一百六十四頁三、標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。因為它的基本單位是標(biāo)準(zhǔn)差,所以叫標(biāo)準(zhǔn)分?jǐn)?shù)。 (標(biāo)準(zhǔn)差:各數(shù)據(jù)(shj)偏離平均數(shù)的距離的平均數(shù)。)標(biāo)準(zhǔn)分?jǐn)?shù)可通過線性轉(zhuǎn)換,也可通過非線性轉(zhuǎn)換得到。 2022/7/23共一百六十四頁(一)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)z分?jǐn)?shù)是典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù),原始分轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)的

22、公式: z=(X-X)/SD 其中,X為任一原始分?jǐn)?shù),X為樣本平均數(shù),SD為樣本標(biāo)準(zhǔn)差。 由于z分?jǐn)?shù)中經(jīng)常出現(xiàn)小數(shù)點(diǎn)和負(fù)數(shù),且單位過大,計算和使用不方便,因此通常將z分?jǐn)?shù)轉(zhuǎn)換為: Z=A+Bz 其中,Z為轉(zhuǎn)換后的標(biāo)準(zhǔn)分?jǐn)?shù),A、B為根據(jù)需要指定的常數(shù)。加上一個常數(shù)是為了去掉負(fù)值,乘以一個常數(shù)是為了使單位變小(bin xio)從而去掉小數(shù)點(diǎn)。 2022/7/23共一百六十四頁常見的標(biāo)準(zhǔn)分?jǐn)?shù)有: T分?jǐn)?shù)(fnsh)、標(biāo)準(zhǔn)九分、標(biāo)準(zhǔn)十分、標(biāo)準(zhǔn)二十分、離差智商等。T 分?jǐn)?shù)是以50為平均數(shù),以10為標(biāo)準(zhǔn)差;標(biāo)準(zhǔn)九分是以5為平均數(shù),以2為標(biāo)準(zhǔn)差;標(biāo)準(zhǔn)十分是以5.5為平均數(shù),以1.5為標(biāo)準(zhǔn)差;標(biāo)準(zhǔn)二十分是以1

23、0為平均數(shù),以3為標(biāo)準(zhǔn)差;使用最廣、影響最大的離差智商是以100為平均數(shù),以15為標(biāo)準(zhǔn)差。 2022/7/23共一百六十四頁(二)非線性轉(zhuǎn)換(zhunhun)的標(biāo)準(zhǔn)分?jǐn)?shù) 當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時,也可以通過非線性轉(zhuǎn)換使之常態(tài)化。常態(tài)化過程主要是將原始分?jǐn)?shù)轉(zhuǎn)化為百分等級,再將百分等級轉(zhuǎn)化為常態(tài)分布上相應(yīng)的標(biāo)準(zhǔn)分?jǐn)?shù)。 2022/7/23共一百六十四頁四、智商及其意義在比內(nèi)-西蒙智力測驗中,是用“心理年齡” 來表示智力高低。若一個兒童心理年齡高于其生理年齡,則智力較一般兒童高;如果心理年齡低于其生理年齡, 則智力較一般兒童低。但在使用(shyng)中發(fā)現(xiàn),單純用心理年齡來表示智力高低的方法缺乏不同年

24、齡兒童間的可比性。于是提出了比率智商和離差智商。2022/7/23共一百六十四頁(一)比率智商(IQ)比率智商被定義為心理年齡(ninlng)(MA)與實(shí)足年齡(CA)之比。為避免小數(shù),將商數(shù)乘以100,公式為:IQ=MA/CA100由于個體智力增長是一個由快到慢再到停止的過程,即心理年齡與實(shí)足年齡并不同步增長,所以比率智商并不適合于年齡較大的被試。 (IQ=MA/CA100=20/40100=50)2022/7/23共一百六十四頁(二)離差智商離差智商是一種以年齡組為樣本計算而得到的標(biāo)準(zhǔn)分?jǐn)?shù),為使其與傳統(tǒng)的比率智商基本一致,韋克斯勒將離差智商的平均數(shù)定為100,標(biāo)準(zhǔn)差定為15。所以離差智商建

25、立在統(tǒng)計學(xué)的基礎(chǔ)上,表示的是個體(gt)智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標(biāo), 公式為: IQ=100+15(X-X)/SD 注意:從不同的測驗獲得的離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時才可以比較。2022/7/23共一百六十四頁專欄(zhunln)5-2 幾種導(dǎo)出分?jǐn)?shù)間的相互關(guān)系 1.00的z分?jǐn)?shù),60分的T分?jǐn)?shù),在韋氏測驗中115分的離差智商分?jǐn)?shù),相當(dāng)于84的百分等級。 (見P368圖)2022/7/23共一百六十四頁第三單元 常模分?jǐn)?shù)(fnsh)的表示方法一、轉(zhuǎn)換表法最簡單(jindn)而且最基本的表示常模的方法就是轉(zhuǎn)換表,也叫常模表。測驗的使用者利用轉(zhuǎn)換表可將原始分

26、數(shù)轉(zhuǎn)換為與其對應(yīng)的導(dǎo)出分?jǐn)?shù),從而對測驗的分?jǐn)?shù)作出有意義的解釋。簡單的轉(zhuǎn)換表/常模表就是將單項測驗的原始分?jǐn)?shù)轉(zhuǎn)換成一種或幾種導(dǎo)出分?jǐn)?shù);復(fù)雜的轉(zhuǎn)換表/常模表通常包括幾個分測驗或幾種常模團(tuán)體的原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)的對應(yīng)關(guān)系。 2022/7/23共一百六十四頁二、剖面圖法 剖面圖就是將測驗分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來,從剖面圖上可以很直觀(zhgun)地看出被試在各個分測驗上的表現(xiàn)及其相對的位置。2022/7/23共一百六十四頁 16PF:樂群性(A)、聰慧性(B)、穩(wěn)定性(C)、恃強(qiáng)性(E)、興奮性(F)、有恒性(G)、敢為性(H)、敏感性(I)、懷疑(huiy)性(L)、幻想性(M)、世故性(N)、

27、憂慮性(O)、實(shí)驗性(Q1)、獨(dú)立性(Q2)、自律性(Q3)、緊張性(Q4)。2022/7/23共一百六十四頁 第三節(jié) 測驗(cyn)的信度信度的概念1信度評估的方法2信度與測驗分?jǐn)?shù)的解釋3影響信度的因素42022/7/23共一百六十四頁 第一單元(dnyun) 信度的概念一、信度的定義 信度是指同一被試者在不同時間(shjin)內(nèi)用同一測驗(或用另一套相等的測驗)重復(fù)測量,所得結(jié)果的一致程度。 信度只受隨機(jī)誤差的影響。隨機(jī)誤差越大,信度越低。 系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。隨機(jī)誤差:由與測量目的無關(guān)的、偶然的因素引起,而又不易控制誤差,使多次測量產(chǎn)生了不一致的結(jié)果,其方向和大小變化是完全

28、隨機(jī)的。 系統(tǒng)誤差:由與測量目的無關(guān)的變因引起的一種恒定而有規(guī)律的效應(yīng)。這種誤差穩(wěn)定地存在于每一次測量之中,此時盡管多次測量的結(jié)果非常一致,但實(shí)測結(jié)果仍舊與真實(shí)數(shù)值有所差異,是不正確的。2022/7/23共一百六十四頁二、信度的指標(biāo)1.信度系數(shù)與信度指數(shù) 大部分情況下,信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。 有時也用信度指數(shù)作為信度的指標(biāo)。信度指數(shù)的平方就是信度系數(shù)。2.測量標(biāo)準(zhǔn)誤 在測量標(biāo)準(zhǔn)誤的公式中(公式5-5),rxx是測驗的信度系數(shù)。測量的標(biāo)準(zhǔn)誤與信度之間有互為消長的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越?。恍哦仍降?,標(biāo)準(zhǔn)誤越大。 不同(b tn)的信度反映測驗誤差的不同來源。2022/7/23

29、共一百六十四頁 第二單元 信度評估(pn )的方法一、重測信度重測信度又稱穩(wěn)定性系數(shù)。它的計算方法是采用重測法,即使用同一(tngy)測驗,在同樣條件下對同一(tngy)組被試前后施測兩次,求兩次得分間的相關(guān)系數(shù)。人的多數(shù)心理特征,如智力、性格、興趣等,具有相對的穩(wěn)定性,間隔一段時間不會有很大變化。重測最適宜的時距隨測驗的目的、性質(zhì)和被試的特點(diǎn)而異,一般是兩周到四周較宜,間隔時間最好不超過六個月。2022/7/23共一百六十四頁二、復(fù)本信度復(fù)本信度又稱等值性系數(shù),是以兩個等值但題目不同的測驗來測量同一群體,然后(rnhu)求得被試者在兩個測驗上得分的相關(guān)系數(shù)。復(fù)本信度反映的是測驗在內(nèi)容上的等值

30、性。復(fù)本信度也要考慮兩個復(fù)本實(shí)施的時間間隔。如果兩個復(fù)本幾乎是在同一時間內(nèi)施測的,相關(guān)系數(shù)反映的才是不同復(fù)本的關(guān)系。如果兩個復(fù)本的施測相隔一段時間,則稱重測復(fù)本信度或穩(wěn)定與等值系數(shù)。2022/7/23共一百六十四頁2009年5月多選題: 如果(rgu)兩個復(fù)本的施測相隔一段時間,則其信度稱為( ) (A)重測復(fù)本信度 (B)重測信度 (C)復(fù)本信度 (D)穩(wěn)定與等值系數(shù) (AD)2022/7/23共一百六十四頁復(fù)本信度的優(yōu)點(diǎn)是能夠避免重測信度的一些問題,如記憶效果、學(xué)習(xí)效應(yīng)等,但也有其局限性:其一,如果測量的行為易受練習(xí)的影響,則復(fù)本信度只能減少(jinsho)而不能完全消除這種影響;其二,由

31、于第二個測驗只改變了題目的內(nèi)容,已經(jīng)掌握解題原則,可以很容易地遷移到同類問題上去;其三,對于許多測驗來說,建立復(fù)本是十分困難的。2022/7/23共一百六十四頁三、內(nèi)部一致性信度(一)分半信度分半信度指采用分半法估計所得的信度系數(shù)。通常是在測驗實(shí)施后將測驗按項目編號的奇數(shù)、偶數(shù)分為等值的兩半,并分別計算每位受測者在兩半測驗上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。這個相關(guān)系數(shù)就代表了兩半測驗內(nèi)容取樣的一致程度。(二)同質(zhì)性信度同質(zhì)性主要代表測驗內(nèi)部所有題目間的一致性。當(dāng)各個測題的得分有較高的正相關(guān)(xinggun)時,不論題目的內(nèi)容和形式如何,其測驗為同質(zhì)的。相反,即使所有題目看起來好像測量同一特質(zhì)

32、,但相關(guān)很低或為負(fù)相關(guān)時,其測驗為異質(zhì)的。 2022/7/23共一百六十四頁四、評分者信度 評分者信度用于測量不同評分者之間所產(chǎn)生的誤差。通常是隨機(jī)抽取若干份測驗卷,由兩位評分者按評分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測驗卷的兩個分?jǐn)?shù)計算相關(guān),即得評分者信度。一般要求在成對的受過訓(xùn)練的評分者之間平均(pngjn)一致性達(dá)0.90以上,才認(rèn)為評分是客觀的。 2022/7/23共一百六十四頁第三單元(dnyun) 信度與測驗分?jǐn)?shù)的解釋一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān) 在極端的情況(qngkung)下,如有rxx1.00,則表示完全沒有測量誤差,所有的變異均來自真實(shí)分?jǐn)?shù);若有rxx0,則所有的變異和差別都

33、反映的是測量誤差。 2022/7/23共一百六十四頁二、確定信度可以接受的水平 一個測驗究竟信度多高才適合,一般原則是:當(dāng)rxx 0.70時,測驗因不可靠而不能用;當(dāng)0.70 rxx 0.85時,可用于團(tuán)體比較;當(dāng)rxx 0.85時,才能用來鑒別或預(yù)測個人(grn)成績或作為。2022/7/23共一百六十四頁三、解釋個人分?jǐn)?shù)的意義信度在解釋個人分?jǐn)?shù)上的意義,是通過測量標(biāo)準(zhǔn)誤這一概念去體現(xiàn)的。主要體現(xiàn)在兩方面:一是估計真實(shí)分?jǐn)?shù)的范圍;二是了解實(shí)得分?jǐn)?shù)再測時可能(knng)的變化情形。人們一般采用95%的概率水平,其置信區(qū)間為: X-1.96SEXTX+1.96SE 這就是說,大約有95%的可能性

34、真分?jǐn)?shù)落在所得分?jǐn)?shù)1.96SE的范圍內(nèi),或有5%的可能性落在范圍之外。2022/7/23共一百六十四頁四、比較不同測驗分?jǐn)?shù)的差異測量標(biāo)準(zhǔn)誤和測驗信度在評價兩個不同測驗的分?jǐn)?shù)是否有明顯差異時也非常重要。這種比較包括兩個人不同分?jǐn)?shù)的差別和同一被試在兩個測驗上的差別。這就是差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤問題(公式5-8)。如果某被試在韋氏成人(chng rn)智力測驗中言語智商為102,操作智商為110。已知兩個分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗和操作測驗的分半信度分別為0.87和0.88。不能認(rèn)為其操作智商顯著高于言語智商。2022/7/23共一百六十四頁第四單元 影響(yngxin

35、g)信度的因素一、樣本特征(一)樣本團(tuán)體異質(zhì)性的影響 一般而言,若獲得信度的取樣團(tuán)體較為異質(zhì)的話(dehu),往往會高估測驗的信度,相反則會低估測驗信度。(二)樣本團(tuán)體平均能力水平的影響 對于不同水平的團(tuán)體,題目具有不同的難度,每個題目在難度上的微小差異累計起來便會影響信度。 2022/7/23共一百六十四頁二、測驗長度 一般來說,在一個測驗中增加同質(zhì)的題目,可以使信度提高。 測驗越長,測驗的測題取樣或內(nèi)容取樣越有代表性。測驗越長,被試的猜測(cic)因素影響就越小。 但是,測驗過長有時反而會引起被試的疲勞和反感而降低可靠性。(MMPI,566) 2022/7/23共一百六十四頁三、測驗難度難

36、度對信度的影響,只存在于某種測驗中,如智力測驗、成就測驗、能力傾向測驗等,對于人格測驗、興趣測驗、態(tài)度量表等不存在難度問題,因為這些測驗的題目沒有正確或錯誤(cuw)答案之分。2022/7/23共一百六十四頁四、時間間隔 以再測法或復(fù)本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大;間隔時間越久,其他變因介入的可能性越大,受外界(wiji)的影響也越大,信度系數(shù)就越低。2022/7/23共一百六十四頁專欄5-3 信度的特殊問題對于速度測驗,不存在評分者信度,也無法計算同質(zhì)性信度,而重測信度和復(fù)本信度均可按傳統(tǒng)的方法求得,只有分半信度不可用傳統(tǒng)方法估計。 由于信度與測驗長度有關(guān),當(dāng)一個測驗有幾個

37、(j )分測驗時,分測驗的分?jǐn)?shù)與合成分?jǐn)?shù)相比不如合成分?jǐn)?shù)可靠。 2022/7/23共一百六十四頁第四節(jié) 測驗(cyn)的效度效度的概念1效度評估的方法2效度的功能3影響效度的因素42022/7/23共一百六十四頁第一單元(dnyun) 效度的概念一、效度的定義在心理測驗中,效度是指所測量的與所要測量的心理特點(diǎn)之間符合的程度(chngd),或者簡單地說是指一個心理測驗的準(zhǔn)確性。測量的效度除受隨機(jī)誤差影響外,還受系統(tǒng)誤差的影響??尚诺臏y驗未必有效,有效的測驗必定可信。2022/7/23共一百六十四頁二、效度的性質(zhì)(一)相對性 任何(rnh)測驗的效度都是對一定的目標(biāo)來說的,或者說測驗只有用于和測驗

38、目標(biāo)一致的目的與場合才會有效。在評鑒測驗的效度時,必須考慮其目的與功能。(二)連續(xù)性 測驗效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。2022/7/23共一百六十四頁專欄5-4 信度與效度的關(guān)系一、信度是效度的必要而非充分條件(chn fn tio jin)二、效度受信度制約2022/7/23共一百六十四頁第二(d r)單元 效度的評估方法美國心理學(xué)會于1974年所發(fā)行的教育與心理測量之標(biāo)準(zhǔn)(biozhn)一書中將效度分三大類:內(nèi)容效度、構(gòu)想效度、效標(biāo)效度。 2022/7/23共一百六十四頁一、內(nèi)容效度(一)什么是內(nèi)容效度 內(nèi)容(nirng)效度指的是測驗題目對

39、有關(guān)內(nèi)容(nirng)或行為取樣的適用性,即該測驗是否是所要測量的行為領(lǐng)域的代表性取樣。(勝任特征)2022/7/23共一百六十四頁(二)內(nèi)容效度的評估方法1、專家判斷法 最常用的方法是請有關(guān)專家對測驗題目與原定內(nèi)容的符合性做出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測驗題目恰當(dāng)?shù)卮砹怂鶞y的內(nèi)容,則測驗具有內(nèi)容效度。由于這種估計效度的方法,是一個(y )邏輯分析的過程,所以內(nèi)容效度有時又稱“邏輯效度”。 2022/7/23共一百六十四頁 為了使內(nèi)容效度的確定(qudng)過程更為客觀,彌補(bǔ)不同專家對同一測驗的判斷可能出現(xiàn)的不一致,可采用以下幾個步驟: 定義好測驗內(nèi)容的總體范圍 編制

40、雙向細(xì)目表 制定評定量表來測量測驗的整個效度2022/7/23共一百六十四頁2009年5月多選題: 為了使內(nèi)容效度的確定過程更為客觀,彌補(bǔ)不同專家對同一測驗(cyn)的判斷可能的不一致,可采用的步驟是( ) (A)定義好測驗內(nèi)容的總體范圍 (B)編制雙向細(xì)目表 (C)制定評定量表來測量測驗的整體效度 (D)進(jìn)行統(tǒng)計分析 (ABC)2022/7/23共一百六十四頁2、統(tǒng)計分析法 除了描述性語言外,內(nèi)容效度的確定也可采用一些統(tǒng)計分析方法。例如計算兩個評分者之間的評定的一致性;還可以通過計算復(fù)本(fbn)相關(guān)和再測法來評估內(nèi)容效度。 3、經(jīng)驗推測法 通過實(shí)踐來檢驗效度。2022/7/23共一百六十四

41、頁(三)內(nèi)容效度的特性 內(nèi)容效度經(jīng)常與表面效度混淆。表面效度是由外行對測驗作表面上的檢查確定的,它不反映測驗實(shí)際測量的東西(dngx),只是指測驗表面上看來好像是測量所要測的東西(dngx);而內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價而建立的。 在編制測驗時,表面效度是一個必須考慮的特性。比如最高行為測驗就要求有較高的表面效度。2022/7/23共一百六十四頁二、構(gòu)想效度(一)什么是構(gòu)想效度 構(gòu)想效度也叫構(gòu)思效度或結(jié)構(gòu)效度,是指測驗?zāi)軌驕y量到理論上的構(gòu)想或特質(zhì)的程度(chngd),即測驗的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度(chngd)如何。2022

42、/7/23共一百六十四頁(二)構(gòu)想效度的評估方法 1.對測驗本身的分析 可作為構(gòu)想效度的測驗內(nèi)部證據(jù)包括(boku):測驗的內(nèi)容效度、測驗的內(nèi)部一致性指標(biāo)、分析受測者對題目的反應(yīng)特點(diǎn)。2022/7/23共一百六十四頁2.測驗間的相互比較 最簡單的是計算兩種測驗之間得分的相關(guān),其中一個測驗是研究效度的,另一個是已有效度證據(jù)的成熟的測驗,但兩者測量的是同一種心理特質(zhì)。假如相關(guān)高,說明新測驗所測量的特質(zhì)確實(shí)是老測驗所反映的特質(zhì)或行為。兩測驗的相關(guān)系數(shù)稱為相容(xin rn)效度。(1)相容效度是構(gòu)思效度的一個證據(jù)。(2)區(qū)分效度是構(gòu)思效度的又一個證據(jù)。(3)因素分析法是建立構(gòu)思效度的常用方法。3.效

43、標(biāo)效度的研究證明(智力測驗分?jǐn)?shù)是否隨年齡增長而增高)4.實(shí)驗法和觀察法證實(shí)(共情能力在訓(xùn)練前后是否有變化)2022/7/23共一百六十四頁三、效標(biāo)效度(一)什么是效標(biāo)效度 效標(biāo)效度又稱實(shí)證效度,反映的是測驗預(yù)測個體在某種情境下行為表現(xiàn)的有效性程度??煞譃?fn wi)同時效度和預(yù)測效度兩類。 被預(yù)測的行為是檢驗效度的標(biāo)準(zhǔn),簡稱效標(biāo)。 2022/7/23共一百六十四頁常用效標(biāo) 學(xué)業(yè)成就常用作智力測驗(cyn)和標(biāo)準(zhǔn)化成就測驗(cyn)的效標(biāo)主要有在校成績、學(xué)歷、獲獎情況、教師評定等工作表現(xiàn)常用作特殊能力測驗及部分智力和人格測驗的效標(biāo)主要用工作評定,操作有一定難度團(tuán)體差異以測驗是否能夠區(qū)分團(tuán)體差別

44、作為效標(biāo)2022/7/23共一百六十四頁臨床診斷常用作人格測驗的效標(biāo)特殊訓(xùn)練成績常用作特殊能力(nngl)測驗的中間效標(biāo)主要是特殊訓(xùn)練的表現(xiàn)等級評定常用作人格測驗的效標(biāo)由被試的家長、同學(xué)、老師、同事對其心理進(jìn)行評價現(xiàn)有測驗現(xiàn)有的效度得到公認(rèn)的同類測驗可以作為新測驗的效標(biāo)2022/7/23共一百六十四頁一個好的效標(biāo)必須具備以下條件(tiojin): 效標(biāo)必須能最有效地反映測驗的目標(biāo),即效標(biāo)測量本身必須有效; 效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素而變化; 效標(biāo)可以客觀地加以測量,可用數(shù)據(jù)或等級來表示; 效標(biāo)測量的方法簡單,省時省力,經(jīng)濟(jì)實(shí)用。2022/7/23共一百六十四頁(二)效標(biāo)效

45、度的評估方法(fngf) 1、相關(guān)法 相關(guān)法是評估效標(biāo)效度最常用的方法,是求測驗分?jǐn)?shù)與效標(biāo)資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。 計算效度系數(shù)最常用的是積差相關(guān)法,在特殊情況下可采用點(diǎn)二列相關(guān)公式或二列相關(guān)公式 、賈期朋多系列相關(guān)公式 。2022/7/23共一百六十四頁2、區(qū)分法 區(qū)分法是檢驗測驗分?jǐn)?shù)能否(nn fu)有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。3、命中率法 命中率法是當(dāng)測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標(biāo)的一種方法。 用某個測驗(量表)來做預(yù)測(決定)可能出現(xiàn)四種情況:預(yù)測成功而且實(shí)際也成功;預(yù)測成功但實(shí)際上失??;預(yù)測失敗實(shí)際上成功;預(yù)測失敗實(shí)際也失敗。正確的

46、預(yù)測(決定)就稱為“命中”,不正確的預(yù)測(決定)就是失誤。2022/7/23共一百六十四頁2011年11月單選題: 當(dāng)測驗(cyn)用來做取舍的依據(jù)時,用其正確的比例作為效度指標(biāo)的方法是( )。(A)相關(guān)法(B)區(qū)分法(C)命中率法(D)因素分析法 (C)2022/7/23共一百六十四頁第三單元(dnyun) 效度的功能一、預(yù)測誤差效度系數(shù)的實(shí)際意義通常以決定性系數(shù)來表示。決定性系數(shù)是效度系數(shù)的平方,例如:測驗的效度是0.80,決定性系數(shù)是0.64,即測驗分?jǐn)?shù)正確預(yù)測效標(biāo)的比例(bl)是64%,其余36%無法做出正確的預(yù)測。在公式5-11中,rxy2代表效度系數(shù)的平方,即決定系數(shù)。 二、預(yù)測效

47、標(biāo)分?jǐn)?shù)(公式5-12)三、預(yù)測效率指數(shù)(公式5-14)2022/7/23共一百六十四頁一、測驗本身的因素 測驗取材的代表性、測驗長度、試題類型、難度、區(qū)分度以及編排方式等都會影響效度。 要保證測驗具有較高的效度,要做好以下幾點(diǎn): 1、測驗材料必須對整個內(nèi)容具有代表性 2、測題設(shè)計(shj)時應(yīng)盡量避免容易引起誤差的題型(如是非題) 3、測題難度要適中,具有較高的區(qū)分度 4、測驗長度要恰當(dāng),要有一定的測題量 5、測題的排列按先易后難的順序第四單元(dnyun) 影響效度的因素2022/7/23共一百六十四頁二、測驗實(shí)施中的干擾因素主測者/主試的影響受測者/被試的影響三、樣本團(tuán)體的性質(zhì)(一)樣本團(tuán)

48、體的異質(zhì)性 如果其他條件(tiojin)相同,樣本團(tuán)體越同質(zhì),分?jǐn)?shù)分布范圍越小,測驗效度就越低;樣本團(tuán)體越異質(zhì),分?jǐn)?shù)分布范圍越大,測驗效度就越高。2022/7/23共一百六十四頁(二)干涉變量 對于不同性質(zhì)的團(tuán)體,同一測驗的效度會有很大的不同。這些性質(zhì)包括:年齡、性別、教育水平、智力、動機(jī)(dngj)、興趣、職業(yè)和任何其他有關(guān)特征。由于這些特征的影響,使得測驗對于不同的團(tuán)體具有不同的預(yù)測能力,故測量學(xué)上稱這些特征為干涉變量。 美國心理學(xué)家吉賽利提出了一套確定干涉變量的方法: 用回歸方程求得每個人的預(yù)測效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實(shí)際效標(biāo)分?jǐn)?shù)比較,獲得差異分?jǐn)?shù)D。如果D的絕對值很大,說明測驗中可能存在干

49、涉變量。 根據(jù)樣本團(tuán)體的組成分析,找出對照組,分別計算效度,找出干涉變量。 對于欲測團(tuán)體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測性高和預(yù)測性低的兩個亞團(tuán)體。對于預(yù)測性高的團(tuán)體,獲得的測驗效度會有所提高 。 2022/7/23共一百六十四頁四、效標(biāo)的性質(zhì) 效標(biāo)測量本身(bnshn)的可靠性如何是一個值得考慮的問題。效標(biāo)測量的可靠性就是效標(biāo)測量的信度。2022/7/23共一百六十四頁 一般來說,測驗的項目分析包括定性分析和定量分析兩個方面。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)(qidng)性和有效性等;定量分析主要指對題目難度和區(qū)分度等進(jìn)行分析。通過項目分析,可以選擇和修改測驗題目,以提高測驗的

50、信度和效度。第五節(jié) 項目分析2022/7/23共一百六十四頁第一單元(dnyun) 項目的難度一、項目難度的定義難度就是指項目的難易程度。在能力測驗中通常需要一個反映難度水平的指標(biāo)(zhbio),在非能力測驗(如人格測驗)中,類似的指標(biāo)是“通俗性”。難度的指標(biāo)通常以通過率表示,即以答對或通過該題的人數(shù)百分比來表示: 其中,P代表項目的難度,N為全體被試者人數(shù),R為答對或通過該項目的人數(shù)。以通過率表示難度時,通過人數(shù)越多(即P值越大),難度越低;P值越小,難度越高。2022/7/23共一百六十四頁二、項目難度的計算方法(一)二分法記分的項目心理(xnl)測驗的項目大多為選擇題,通過記1分,錯誤記

51、0分。 當(dāng)受測人數(shù)較多時,可根據(jù)測驗總成績將被試分成三組:分?jǐn)?shù)最高的27被試為高分組,分?jǐn)?shù)最低的27被試為低分組,中間46的被試為中間組。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。公式為: 其中,P代表難度,PH和PL分別代表高分組和低分組通過率。2022/7/23共一百六十四頁(二)非二分記分的項目 當(dāng)測驗項目為問答題或不能用二分法記分的形式時,一般用下面的公式(gngsh)計算難度: 其中,X為全體受測者在該題上的平均分,Xmax為該題的滿分。2022/7/23共一百六十四頁三、難度水平的確定(一)項目的難度進(jìn)行難度分析的主要目的是為了篩選項目,項目的難度多高合

52、適,取決于測驗的目的、性質(zhì)(xngzh)以及項目的形式。大多數(shù)的標(biāo)準(zhǔn)測驗,都希望能準(zhǔn)確測量個體的差異。P值(項目的難度)越接近于0.50,區(qū)別力越高。對于選擇題來說,P值一般應(yīng)大于概率水平。2022/7/23共一百六十四頁(二)測驗的難度 由于人的心理特質(zhì)基本上是呈常態(tài)分布的,因此(ync)大多數(shù)測驗在設(shè)計時希望分?jǐn)?shù)呈現(xiàn)常態(tài)分布的模型。如果受測者樣本具有代表性,對于中等難度的測驗,其測驗總分應(yīng)該接近常態(tài)分布。 2022/7/23共一百六十四頁第二單元(dnyun) 項目的區(qū)分度一、項目區(qū)分度的定義項目區(qū)分度也叫鑒別力,是指測驗項目對受測者的心理特性的區(qū)分能力(nngl)。如果一個項目(測驗題目

53、),實(shí)際水平高的受測者能順利通過,而實(shí)際水平低的受測者不能通過,就可以認(rèn)為該項目有較高的區(qū)分度。區(qū)分度是評價項目質(zhì)量和篩選項目的重要指標(biāo),也是影響測驗效度的重要因素。2022/7/23共一百六十四頁二、項目區(qū)分度的計算方法(一)鑒別指數(shù) 計算(j sun)的主要步驟如下: 1按測驗總分高低排列答卷; 2確定高分組與低分組,每一組取答卷總數(shù)的27; 3分別計算高分組與低分組在該項目上的通過率或得分率; 4按下列公式估計出項目的鑒別指數(shù):D=PH-PL 其中,D為鑒別指數(shù),PH為高分組在該項目上的通過率或得分率,PL為低分組在該項目上的通過率或得分率。 2022/7/23共一百六十四頁1965年,

54、美國測驗專家(zhunji)伊貝爾根據(jù)長期的經(jīng)驗提出了用鑒別指數(shù)評價項目性能的標(biāo)準(zhǔn),如下表:鑒別指數(shù)(D)項目評價0.40以上很好0.30-0.39良好,修改后會更佳0.20-0.29尚可,但需修改0.19以下差,必須淘汰2022/7/23共一百六十四頁(二)相關(guān)(xinggun)法計算區(qū)分度最常用的方法是相關(guān)法。常用的有:點(diǎn)二列相關(guān)、二列相關(guān)和相關(guān)等。相關(guān)越高,表明項目越具有區(qū)分的功能。區(qū)分度取值范圍介于-1至+1之間,假如項目得分與實(shí)際能力水平之間呈負(fù)相關(guān),則區(qū)分度為負(fù)值;若呈正相關(guān),則區(qū)分度為正值;相關(guān)系數(shù)越大,區(qū)分度越高。 2022/7/23共一百六十四頁三、區(qū)分度與難度的關(guān)系區(qū)分度與

55、難度之間有密切的關(guān)系。為了使測驗具有更大的區(qū)別力,應(yīng)選擇難度在0.50左右的試題比較合適。一般來說,較難的項目對高水平的受測者區(qū)分度高,較易的項目對水平低的受測者區(qū)分度高,中等難度的項目對中等水平的受測者區(qū)分度高。由于人的大多數(shù)心理特性呈常態(tài)分布,所以項目難度的分布也以常態(tài)分布為好,即特別難與特別易的項目少些,接近中等難度的項目多些,使所有項目的平均難度為050。這樣不僅能保證(bozhng)多數(shù)項目具有較高的區(qū)分度,而且可以保證(bozhng)整個測驗對受測者具有較高的區(qū)分力。2022/7/23共一百六十四頁第六節(jié) 測驗編制的一般(ybn)程序測驗的目標(biāo)分析1測題的編寫2測驗的編排和組織32

56、022/7/23共一百六十四頁第一(dy)單元 測驗的目標(biāo)分析一、測驗的對象在編制測驗前,首先要明確測量的對象,也就是該測驗編成后要用于哪些團(tuán)體。只有對受測者的年齡、受教育程度和社會經(jīng)濟(jì)狀況(zhungkung)以及閱讀水平等做到心中有數(shù),編制測驗時才能有的放矢。2022/7/23共一百六十四頁二、測驗的用途所編出的測驗是要對受測者做描述還是預(yù)測,是用于選拔還是診斷,這一點(diǎn)在測驗編制前就應(yīng)明確。用途不同,編制測驗時的取材范圍(fnwi)以及題目難度等也不盡相同。一般地說,測驗的用途可分兩類:顯示和預(yù)測,由此可將心理測驗分為兩類:顯示性測驗和預(yù)測性測驗。 (一)顯示性測驗:指測驗題目和所要測量的

57、心理特征相似的測驗。古德納夫又將顯示性測驗分為樣本測驗和標(biāo)記測驗。(二)預(yù)測性測驗:指預(yù)測一些沒被測量的行為的測驗。它最關(guān)心的是測驗分?jǐn)?shù)與預(yù)測行為之間的關(guān)系。2022/7/23共一百六十四頁三、測驗的目標(biāo)心理測驗的目標(biāo)是指編制(binzh)的測驗是測什么的,即用來測量什么樣的心理變量或行為特征。在實(shí)際工作中,測驗編制者不但要明確測驗的目標(biāo),還要對測驗?zāi)繕?biāo)加以分析。目標(biāo)分析因測驗不同而異,一般可分為三種情況: (一)工作分析 對于選拔和預(yù)測功用的預(yù)測性測驗,它的主要任務(wù)就是要對所預(yù)測的行為活動作具體分析,稱之為任務(wù)分析或工作分析。這種分析包括兩個步驟: 第一是確定哪些心理特征和行為可以使要預(yù)測的

58、活動達(dá)到成功。 第二是建立衡量受測者是否成功的標(biāo)準(zhǔn),這個標(biāo)準(zhǔn)稱為效標(biāo)。2022/7/23共一百六十四頁(二)對特定(tdng)概念下定義 如果測驗是為了測量某種特殊的心理品質(zhì)或特點(diǎn),那么測驗編制者就必須給所要測量的心理特質(zhì)下定義,然后必須發(fā)現(xiàn)該特質(zhì)所包含的維度將通過什么行為表現(xiàn)出來或怎樣進(jìn)行測量。(三)確定測驗的具體內(nèi)容 如果測驗是描述性的顯示測驗,目標(biāo)分析的主要任務(wù)則是確定顯示的內(nèi)容和技能,從中取樣。成就測驗就是典型的描述性顯示測驗。2022/7/23共一百六十四頁 第二(d r)單元 測題的編寫 測驗題目的編寫是心理測驗編制過程中最重要的一環(huán),涉及到從寫出、編輯到預(yù)試、修改等一個循環(huán)的過程

59、。在得到一套令人滿意(ln rn mn y)的測驗題目之前,這些步驟是不斷重復(fù)的。2022/7/23共一百六十四頁一、搜集資料 測驗題目的來源可分為三方面(fngmin):(一)已出版的標(biāo)準(zhǔn)測驗(二)理論和專家的經(jīng)驗(三)臨床觀察和記錄2022/7/23共一百六十四頁二、命題原則 編制測驗題目的一般原則可以從內(nèi)容、文字、理解和社會敏感性四個方面來考慮。(一)內(nèi)容方面 首先,要求題目的內(nèi)容符合測驗的目的,避免貪多而亂出題目。 其次,內(nèi)容取樣要有代表性,符合測驗計劃的內(nèi)容,比例適當(dāng)。 第三,題目之間的內(nèi)容要相互獨(dú)立,互不牽連,切忌一個題目的答案影響對另一個題目的回答。(二)文字方面 要使用準(zhǔn)確(z

60、hnqu)的當(dāng)代語言;語句要簡明扼要,排除與答案無關(guān)的因素;最好是一句話說明一個概念,不要使用兩個或兩個以上的觀念;盡量少使用雙重否定句。2022/7/23共一百六十四頁(三)理解方面 題目應(yīng)有確切的答案;題目的內(nèi)容不要超出受測團(tuán)體的知識水平和理解能力;題目不可令人費(fèi)解,更不能有歧義。(四)社會敏感性方面 有些測驗必須涉及一些社會敏感性問題,對于如何鼓勵受測者作出真實(shí)的回答,菲力普列舉了以下幾條策略: 1命題(mng t)時假定受測者具有某種行為。 2命題時假定規(guī)范不一致。 3指出該行為雖然是違規(guī)的,但卻是常見的。2022/7/23共一百六十四頁三、測題的編制要領(lǐng)(一)選擇題 對于選擇題,既要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論