評(píng)價(jià)心理測(cè)評(píng)量表的標(biāo)準(zhǔn)_第1頁
評(píng)價(jià)心理測(cè)評(píng)量表的標(biāo)準(zhǔn)_第2頁
評(píng)價(jià)心理測(cè)評(píng)量表的標(biāo)準(zhǔn)_第3頁
評(píng)價(jià)心理測(cè)評(píng)量表的標(biāo)準(zhǔn)_第4頁
評(píng)價(jià)心理測(cè)評(píng)量表的標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Running head:CRiTERiA for ev aluation of psychological testing scale評(píng)估心理測(cè)評(píng)量表的標(biāo)準(zhǔn)Running head:CRiTERiA for ev aluation of psychological testing scale評(píng)估心理測(cè)評(píng)量表的標(biāo)準(zhǔn)摘要量表是心理測(cè)評(píng)用來度量人的心理特征的測(cè)量工具,評(píng)價(jià)量表好壞的標(biāo)準(zhǔn)應(yīng)該受到人們的重視,其重要性自然不言而喻。在系統(tǒng)地介紹評(píng)價(jià)心理測(cè)驗(yàn)量表的標(biāo)準(zhǔn)的基礎(chǔ)上,詳細(xì)介紹了信度和效度的分析方法,包括重測(cè)信度法、復(fù)本信度法、分半信度法、“信度系數(shù)法、 內(nèi)容效度分析、校標(biāo)效度分析和結(jié)構(gòu)效度分析。

2、 根據(jù)量表用于判別、預(yù)測(cè)或評(píng)定等不同用途, 需要選取不同的檢驗(yàn)方法。一個(gè)好的量表應(yīng)該具有客觀性、定量性、可交流性和經(jīng)濟(jì)性的特點(diǎn)關(guān)鍵詞 量表;信度;效度;評(píng)價(jià)標(biāo)準(zhǔn)1前言測(cè)量是人們?nèi)粘Ia(chǎn)和生活中的一種普遍現(xiàn)象。從與人們平時(shí)生活緊密相連的衣、食、住、行四個(gè)方面來講,穿什么尺寸的衣服和褲子需要對(duì)人的身體進(jìn)行身高臂長和三圍的測(cè)量;到市場(chǎng)買菜需要對(duì)蔬菜或者肉類進(jìn)行稱重的測(cè)量;蓋樓建房或者裝修需要對(duì)土地或者房間進(jìn)行面積的測(cè)量;修建鐵路或者搭建橋梁需要對(duì)地面進(jìn)行長度和高度的測(cè)量。以上提到的測(cè)量均屬于物理測(cè)量,人們能夠?qū)崒?shí)在在地測(cè)出需要的數(shù)據(jù)或者指標(biāo)。除物理測(cè)量以外,根據(jù)測(cè)量的對(duì)象和性質(zhì)還有生理測(cè)量,即對(duì)有機(jī)

3、體生理特征的測(cè)量;社會(huì)測(cè)量,即對(duì)社會(huì)現(xiàn)象的測(cè)量;心理測(cè)量,即對(duì)人類的心理特征的測(cè)量。心理測(cè)量又叫心理測(cè)評(píng), 現(xiàn)今被人們普遍認(rèn)同的含義是指依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的能力、人格以及心理健康等心理特征和行為確定出一種數(shù)量化的價(jià)值。現(xiàn)階段的心理測(cè)評(píng)是以心理測(cè)評(píng)量表為主要測(cè)評(píng)手段。心理測(cè)評(píng)是通過科學(xué)、客觀、標(biāo) 準(zhǔn)的測(cè)量手段對(duì)人的特定素質(zhì)進(jìn)行測(cè)量、分析、評(píng)價(jià)。量表指的是能夠使事物特征數(shù)量化的數(shù)字的連續(xù)體。制定量表的單位和參照點(diǎn)不同,編制出的量表就不同;不同的量表具有不同的測(cè)量水平,因此其測(cè)量的精度也不盡相同。目前用于心理測(cè)量的各種心理測(cè)驗(yàn)和心理量表有二三百個(gè),但是臨床上和心理咨詢工作

4、中常用的只有一二十多種。這些常用量表中許多不對(duì)非專業(yè)人員公開,通常需要花費(fèi)幾百甚至上千元購買。針對(duì)非專業(yè)人員研究和學(xué)習(xí)心理學(xué),對(duì)國內(nèi)外常用的100多種心理測(cè)驗(yàn)量表和測(cè)量工具進(jìn)行優(yōu)化選擇,并將其中在心理咨詢工作中經(jīng)常用到的一些測(cè)驗(yàn)和量表編制成計(jì)算機(jī)軟件 或測(cè)量表,這就是人們說的常用心理測(cè)評(píng)量表。通俗來講,就好像物理測(cè)量是用測(cè)量工具丈Running head:CRiTERiA for ev aluation of psychological testing scale3量客觀事物具體的看得見的屬性;而心理測(cè)評(píng)就是用尺子測(cè)量人類看不見的各種屬性,而這把尺子就是量表。自從上世紀(jì)九十年代中期以來,我國的

5、心理學(xué)工作者自行編制和修訂了許多心理測(cè)評(píng)量表,為臨床工作者、企業(yè)、教育工作者和研究人員等提供了有效又實(shí)用的心理測(cè)量和行為測(cè) 量的測(cè)量工具,為人們治病救人、選拔人才、培育后代、探索知識(shí)做出了極大的貢獻(xiàn)。可是 這些量表到底有沒有效,到底適不適合相對(duì)應(yīng)的群體就有待商榷了。大家都知道,如果用尺子丈量桌子的高度,讀出尺子的刻度就能知道桌子的高度,并且進(jìn)行多次測(cè)量之后取讀數(shù)的平均值就可以知道桌子的準(zhǔn)確高度。那么對(duì)于心理測(cè)評(píng)的尺子而言,我們?nèi)绾芜x擇尺子并判斷它測(cè)得準(zhǔn)不準(zhǔn)呢?要回答這個(gè)問題,先要回答另外的問題,即這把尺子要用來測(cè)量什么?心理測(cè)評(píng)的施測(cè)者首先要明確的問題是,他想用量表來測(cè)量什么心理特征,而這種心

6、理特征有什么外顯行為特征,也就是說可以從什么方面對(duì)這種心理特征進(jìn)行客觀評(píng)估,這些方面構(gòu)成了量表的測(cè)量維度。美國的認(rèn)知心理測(cè)量學(xué)家Embretson認(rèn)為:首先要確定測(cè)驗(yàn)的結(jié)構(gòu),提出測(cè)驗(yàn)的認(rèn)知模型,這種認(rèn)知模型的詳細(xì)特征為量表中的每一項(xiàng)條目進(jìn)行了具體的說明。例如,兒童社交自我知覺量表( The Self-Perceived Social Competence Scale for Children )是Harter (1982)根據(jù)兒童的知覺能力是通過不同領(lǐng)域的感覺評(píng)估的,而不是通過單一的認(rèn)知 結(jié)構(gòu)來評(píng)估的這個(gè)理論進(jìn)行編制的,量表包含的四個(gè)維度分別是:社交自我知覺、認(rèn)知自我知覺、運(yùn)動(dòng)技能自我知覺和一

7、般自我知覺。其次要確定量表的適用人群??偛荒馨褱y(cè)量精神病人的精神疾病量表給在校大學(xué)生做吧,也不可以把測(cè)量?jī)和橇Φ闹橇α勘斫o成年人進(jìn)行測(cè)驗(yàn),這都是不合理的。另外,分析量表中的條目?jī)?nèi)容一致性也是有必要的,這就要提到內(nèi) 容效度的分析,這點(diǎn)將在下文詳細(xì)探討?;氐阶畛跆岢龅膯栴},我們應(yīng)該怎樣判斷一把尺子測(cè)量得準(zhǔn)不準(zhǔn)確?針對(duì)這個(gè)問題,首先,施測(cè)者要懂得正確使用這把尺子的方法,例如,要測(cè)量一個(gè)人的身高, 應(yīng)該從頭量到腳,而不能從頭量到膝蓋;尺子不能拿歪了,否則會(huì)產(chǎn)生誤差;測(cè)量另一個(gè)人的身高時(shí),如果前一個(gè)人脫了鞋,那這個(gè)人就不能穿著鞋測(cè)量;如果施測(cè)者前一分鐘是睜著右眼讀數(shù)的,那后一分鐘就不能睜左眼讀數(shù),當(dāng)然

8、睜著一只眼睛讀數(shù)也是不允許的,這就是所謂的測(cè)驗(yàn)標(biāo)準(zhǔn)化。還有如果測(cè)得了一個(gè)人的身高,想知道他算高個(gè)子還是矮個(gè)子,就要把數(shù)據(jù)放在一群有代表 性的數(shù)據(jù)中進(jìn)行比較,而且每個(gè)人都要與此群體進(jìn)行比較,這就是所謂的常模。當(dāng)然,難度與應(yīng)答率也會(huì)影響心理測(cè)評(píng)量表的測(cè)量。信度與效度的測(cè)量在評(píng)估心理測(cè)評(píng)量表中也是十分重要的。Running head:CRiTERiA for ev aluation of psychological testing scale2方法2.1標(biāo)準(zhǔn)化心理測(cè)量這把尺子需要通過規(guī)范的方式來使用,而這規(guī)范的方式就是標(biāo)準(zhǔn)化。測(cè)驗(yàn)的標(biāo)準(zhǔn)化普遍被人所接受的定義就是指測(cè)驗(yàn)的編制、實(shí)施、計(jì)分以及測(cè)量分?jǐn)?shù)的

9、解釋的程序的一致性。測(cè)驗(yàn)標(biāo)準(zhǔn)化需要具備的條件是(1)測(cè)驗(yàn)內(nèi)容的標(biāo)準(zhǔn)化:指向所有接受測(cè)量的個(gè)人實(shí)施相同的或等值的測(cè)驗(yàn)內(nèi)容,這是標(biāo)準(zhǔn)化的首要前提;(2)施測(cè)條件的標(biāo)準(zhǔn)化:指所有接受測(cè)量的個(gè)人必須在相同的施測(cè)條件下接受測(cè)驗(yàn),包括相同的測(cè)驗(yàn)情景、 相同的指導(dǎo)語和相同的受測(cè)時(shí)限;(3)評(píng)分規(guī)則的標(biāo)準(zhǔn)化: 指所制定的評(píng)分規(guī)則要足以使不同的評(píng)分人的評(píng)分結(jié) 果保持最大程度的一致,這要求評(píng)分結(jié)果具有客觀性;(4)測(cè)驗(yàn)常模的標(biāo)準(zhǔn)化。常模常模是一組有代表性的群體的平均測(cè)驗(yàn)分?jǐn)?shù)。它表示的是普通人的一般狀況。常模不同于標(biāo)準(zhǔn),標(biāo)準(zhǔn)指的是理想上達(dá)到的程度,而常模指的是代表性群體實(shí)際達(dá)到的程度。以常模為參照進(jìn)行的測(cè)驗(yàn)叫常模參

10、照測(cè)驗(yàn),以標(biāo)準(zhǔn)為參照進(jìn)行的測(cè)驗(yàn)叫目標(biāo)測(cè)驗(yàn)或者標(biāo)準(zhǔn)參照測(cè) 驗(yàn)。簡(jiǎn)單來說,常模是具有代表性的群體參與測(cè)驗(yàn)得到的測(cè)驗(yàn)分?jǐn)?shù)的分布,平均數(shù)和標(biāo)準(zhǔn)差是兩個(gè)極為重要的指標(biāo)。利用一個(gè)人的原始測(cè)驗(yàn)分?jǐn)?shù),參照常模中的分?jǐn)?shù)分布,就能知道個(gè) 體在總體中大概處于什么水平。因此,常模參照通常用來進(jìn)行選拔性測(cè)驗(yàn);而為了彌補(bǔ)常模參照的不足,只能知道個(gè)體在總體中的水平,卻不清楚個(gè)體對(duì)測(cè)驗(yàn)領(lǐng)域的掌握情況,就有必要進(jìn)行目標(biāo)參照測(cè)驗(yàn)。 在同一個(gè)測(cè)驗(yàn)中,施測(cè)者應(yīng)當(dāng)選用相同的常模來進(jìn)行比較,這樣有利于測(cè)驗(yàn)的準(zhǔn)確性。難度心理測(cè)評(píng)量表中,條目的難度是通過計(jì)算被試答對(duì)某一條目的人數(shù)比例來確定的。這是在編制教育成就測(cè)驗(yàn)和其他形式的能力測(cè)驗(yàn)時(shí)一個(gè)

11、很重要的指標(biāo)。如果一個(gè)測(cè)評(píng)量表的難度太高或太低,導(dǎo)致受試者難以完成測(cè)驗(yàn)或非常輕易地完成測(cè)驗(yàn),都不能達(dá)到施測(cè)者想要測(cè)量的結(jié)果,那這樣的量表是不合格的量表。應(yīng)答率應(yīng)答率是通過客觀地統(tǒng)計(jì)被試對(duì)某一條目的回答數(shù)來確定的。它針對(duì)的是例如態(tài)度測(cè)驗(yàn)、興趣測(cè)驗(yàn)、性格測(cè)驗(yàn)等不存在難度問題的測(cè)驗(yàn)。信度分析信度,指的是測(cè)量方法的質(zhì)量,即對(duì)同一現(xiàn)象進(jìn)行重復(fù)觀察之后是否可以得到相同資料 TOC o 1-5 h z Running head:CRiTERiA for ev aluation of psychological testing scale5的一種反映。簡(jiǎn)單來說,信度就是衡量心理測(cè)評(píng)量表的可靠性。例如,如果我們

12、用一個(gè)電子稱測(cè)量一個(gè)人的體重,第一次測(cè)得他重 100公斤,第二次測(cè)得 200公斤,第三次測(cè)得 150 公斤,那么用這個(gè)電子稱測(cè)量體重是極其不合適的,這就被稱作是一個(gè)不好的測(cè)量工具。一個(gè)標(biāo)準(zhǔn)的電子稱應(yīng)該是同一個(gè)人在相隔較短的時(shí)間內(nèi),站上電子稱,得到的體重讀數(shù)是基本一致的。物理測(cè)量相比于心理測(cè)量較容易,畢竟人的心理特征是看不見摸不著的。而且我們也不能用同一套測(cè)驗(yàn),例如同一套物理試題或者同一個(gè)孤獨(dú)感量表去反復(fù)測(cè)量同一個(gè)人,這樣受試者會(huì)產(chǎn)生練習(xí)效應(yīng),使得測(cè)驗(yàn)結(jié)果越來越好。因此,我們需要更有效的辦法進(jìn)行測(cè)量。信度指標(biāo)多以相關(guān)系數(shù)表示,大致可分為三類:穩(wěn)定系數(shù)(跨時(shí)間的一致性),等值系數(shù)(跨形式的一致性)

13、和內(nèi)在一致性系數(shù)(跨項(xiàng)目的一致性)。信度分析的方法主要有重測(cè)信度法, 復(fù)本信度法,分半信度法,”信度系數(shù)法。戴曉陽(2009)推薦0.8作為評(píng)價(jià)一個(gè)量表全量表內(nèi)部一致性的標(biāo)準(zhǔn),0.750.8作為評(píng)價(jià)量表的分量表內(nèi)部一致性的標(biāo)準(zhǔn)。重測(cè)信度法重測(cè)信度法是用同樣的量表對(duì)同一組受試者間隔一定的時(shí)間重復(fù)施測(cè),計(jì)算兩次施測(cè)結(jié)果的皮爾遜積差相關(guān)系數(shù)。很明顯,重測(cè)信度屬于穩(wěn)定系數(shù)。重測(cè)信度法適用于事實(shí)式量表, 如性別,出生年月等在兩次施測(cè)中不應(yīng)該有任何差異,大多數(shù)受測(cè)者的興趣、愛好、習(xí)慣等 在短時(shí)間內(nèi)也不會(huì)有明顯的變化。如果沒有突發(fā)性事件影響受測(cè)者的態(tài)度,意見,那么該方法也適用于對(duì)態(tài)度, 意見的測(cè)量。由于重測(cè)

14、信度法需要對(duì)同一組受試者測(cè)驗(yàn)兩次,期間受試者又不能受到突發(fā)性事件或他人的影響,而且間隔時(shí)間長短也有限制,因此在實(shí)際操作中略有難度。復(fù)本信度法復(fù)本信度法是讓同一組被試在兩個(gè)平行測(cè)驗(yàn)上進(jìn)行測(cè)試,計(jì)算兩次測(cè)驗(yàn)結(jié)果的皮爾遜積差相關(guān)系數(shù)。復(fù)本信度屬于等值系數(shù)。 所謂平行測(cè)驗(yàn)是指兩次測(cè)驗(yàn)的題目不同,但是測(cè)驗(yàn)的內(nèi)容、格式、難度、等要完全一致。更苛刻的是,兩次測(cè)驗(yàn)結(jié)果的平均值和標(biāo)準(zhǔn)差也要完全 相同。事實(shí)上在實(shí)際操作中,很難達(dá)到這種要求,因此用這種方法測(cè)量的人不多。分半信度法分半信度法是將測(cè)驗(yàn)條目分為兩半,計(jì)算兩半得分結(jié)果的相關(guān)系數(shù)。分半信度屬于內(nèi)在一致性系數(shù)。這種方法適用于態(tài)度、意見測(cè)驗(yàn)的信度分析,不適合測(cè)量

15、年齡與性別等事實(shí)性 的特征,因?yàn)槟挲g與性別沒法比較。再有,將測(cè)驗(yàn)條目分為兩半的方法并沒有規(guī)定,所以不 同的分半方法會(huì)產(chǎn)生不同的分半信度值,這點(diǎn)需要注意。Running head:CRiTERiA for ev aluation of psychological testing scalea信度系數(shù)法Cronbach ”系數(shù)是目前最常用的信度系數(shù),其公式為:_ K ;_2 r xx nK -11S2其中,K是題目數(shù),Pi為答對(duì)第題的人數(shù)的比例, qi為答錯(cuò)第題的人數(shù)的比例, Sx2為測(cè)驗(yàn) 總分的變異。由公式可以看出, a信度屬于內(nèi)在一致性系數(shù)。該方法僅適用于( 0, 1)記分 的測(cè)驗(yàn)。效度分析效

16、度,指的是測(cè)量工具或手段能夠準(zhǔn)確測(cè)出所需測(cè)量的事物的程度。簡(jiǎn)單來說,效度就是衡量測(cè)驗(yàn)或者量表的有效性,多大程度上達(dá)到了施測(cè)者想要通過測(cè)驗(yàn)獲得的心理特征指 標(biāo)。例如,如果用一個(gè)測(cè)量體重很有效的電子稱去測(cè)量人的身高,那肯定是無效的;如果用測(cè)量孤獨(dú)感很有效的量表去測(cè)量個(gè)體的睡眠質(zhì)量,那也一定是無效的。 判斷心理測(cè)評(píng)量表有沒有效,關(guān)鍵是看它有沒有達(dá)到測(cè)量目的。Anastasi指出:效度從一開始就融入了測(cè)驗(yàn),而不是在測(cè)驗(yàn)編制實(shí)施的最后幾個(gè)階段。因此,效度分析應(yīng)根據(jù)心理學(xué)的理論基礎(chǔ),前人研究,和對(duì)相關(guān)行為鄰域的觀察分析,提出詳細(xì)特征為量表中的每一項(xiàng)條目進(jìn)行具體說明。效度分析的主要方法有內(nèi)容效度分析,校標(biāo)效

17、度分析,結(jié)構(gòu)效度分析。內(nèi)容效度分析內(nèi)容效度是指測(cè)驗(yàn)中的條目能不能代表所要測(cè)量的內(nèi)容或者心理特征。成就測(cè)驗(yàn)和選拔測(cè)驗(yàn)特別注重這種效度。 例如,測(cè)驗(yàn)題目是根據(jù)教學(xué)大綱和教材內(nèi)容適當(dāng)抽出的,內(nèi)容效度就是判斷測(cè)驗(yàn)的內(nèi)容符不符合想要測(cè)驗(yàn)的目標(biāo),既不能超出大綱的范圍也不可能對(duì)每個(gè)知識(shí)點(diǎn)進(jìn)行考查,所以通常選出具有代表性的內(nèi)容,再進(jìn)行權(quán)重,隨機(jī)抽取。對(duì)內(nèi)容效度常采用邏輯分析與統(tǒng)計(jì)分析相結(jié)合的分析方法進(jìn)行評(píng)價(jià)。邏輯分析一般由研究者或?qū)<遗袛嗔勘碇械母黜?xiàng)條目是否有效滿足了測(cè)量的目的和要求。統(tǒng)計(jì)分析主要采用單項(xiàng)與總和相關(guān)分析的方法獲取評(píng)價(jià)結(jié)果,就是計(jì)算每個(gè)條目得分與測(cè)驗(yàn)總分的相關(guān)系數(shù),根據(jù)相關(guān)顯不顯著來判斷是不是有

18、效。如果量表中有反向條目,應(yīng)該將其逆向處理后再計(jì)算總分。校標(biāo)效度分析校標(biāo)效度是指考查測(cè)驗(yàn)分?jǐn)?shù)與校標(biāo)的關(guān)系,看測(cè)驗(yàn)對(duì)我們感興趣的行為預(yù)測(cè)得如何。所謂校標(biāo)指的是衡量測(cè)驗(yàn)有效性的外在標(biāo)準(zhǔn),通常指我們要預(yù)測(cè)的行為??梢杂脕碜鳛樾?biāo)的 變量有很多,校標(biāo)可以使連續(xù)變量,例如分?jǐn)?shù);也可以是離散變量,例如職業(yè);可以是現(xiàn)成 的指標(biāo),例如薪水;也可以是人為設(shè)計(jì)的指標(biāo),例如成績(jī)。將眾多校標(biāo)歸納起來,常見的校Running head:CRiTERiA for ev aluation of psychological testing scale7標(biāo)主要有學(xué)業(yè)成就、等級(jí)評(píng)定、臨床診斷、特殊訓(xùn)練成績(jī)、實(shí)際工作表現(xiàn)、對(duì)團(tuán)體的

19、區(qū)分能 力或其他的測(cè)驗(yàn)?zāi)芰?。校?biāo)效度分析是根據(jù)已經(jīng)得到確定的某種理論,選擇一種指標(biāo)作為校標(biāo),分析量表?xiàng)l目與校標(biāo)之間的聯(lián)系,如果兩者顯著相關(guān),那么就是有效的條目。評(píng)價(jià)校標(biāo)效度的方法是相關(guān)分析或差異顯著性檢驗(yàn)。然而,在實(shí)際操作中,選擇一個(gè)合適的受大家一致認(rèn)同的校標(biāo)是很困難的。結(jié)構(gòu)效度分析結(jié)構(gòu)效度現(xiàn)今被人們普遍接受的概念是指一個(gè)測(cè)驗(yàn)實(shí)際測(cè)到所要測(cè)量的理論結(jié)構(gòu)和特質(zhì)的程度,或者說它是指測(cè)驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。簡(jiǎn)單來講,結(jié)構(gòu)效度指測(cè)驗(yàn)結(jié)果能否證實(shí)某種理論,即實(shí)驗(yàn)與理論之間的一致性程度。目前運(yùn)用最廣泛的是用因素分析法分析量表的結(jié)構(gòu)效度。因素分析法的主要功能是從量表中提取一些公因

20、子,各公因子分別與某特定變量高度相關(guān),這些公因子就代表了量表的基本結(jié)構(gòu)。通過因素分析法可以考察量表是否有效測(cè)量出研究者假設(shè)的某種理論結(jié)構(gòu)。3討論近年來,我國心理學(xué)發(fā)展的腳步逐漸加快。許多研究者翻譯并使用了大量國外的心理測(cè)評(píng)量表,雖然這也在一方面為心理學(xué)這門不太成熟的學(xué)科做出了巨大的貢獻(xiàn);但是另一方面,研究者往往翻譯完外國的心理測(cè)評(píng)量表,就直接對(duì)受試者進(jìn)行施測(cè)。這種做法有點(diǎn)欠妥。 因?yàn)槲鞣降牧勘硎腔谖鞣轿幕碌奶囟ㄈ巳?,在生理因素,心理因素?社會(huì)結(jié)構(gòu),文化背景等方面都與我國存在極大的差異。要對(duì)國外引進(jìn)的量表進(jìn)行全面的評(píng)價(jià),就需要使用上述評(píng)價(jià)心理測(cè)驗(yàn)量表的標(biāo)準(zhǔn)。首先了解西方量表的發(fā)展,評(píng)價(jià)和使

21、用情況。在對(duì)翻譯完的量表進(jìn)行初試前,應(yīng)對(duì)條目進(jìn)行適當(dāng)?shù)男薷?。在不改變?cè)勘砘疽馑嫉那疤嵯?,使條目含義更加清楚, 簡(jiǎn)單地適合我國國情。然后對(duì)量表的真正用途應(yīng)該有個(gè)明確的概念:是用來判別,預(yù)測(cè)還是評(píng)定。因?yàn)檠?究的設(shè)計(jì),對(duì)量表性能的評(píng)價(jià)很大程度上取決于量表的用途。量表的評(píng)價(jià)包括信度分析與效度分析。信度分析應(yīng)分析條目與總分、條目?jī)?nèi)部一致性、量表信度系數(shù)、分半相關(guān)系數(shù)、重 測(cè)信度的穩(wěn)定性,評(píng)定者內(nèi)部的一致性, 從而全面了解評(píng)價(jià)引進(jìn)量表的各方面可靠程度。效度分析應(yīng)分析量表?xiàng)l目的內(nèi)容效度,結(jié)構(gòu)效度和實(shí)證效度。由于文化差異等影響因素,引進(jìn)的量表修訂過后,在內(nèi)容和形式方面會(huì)有很大的變化。這時(shí),仍然沿用西方的

22、常模來進(jìn)行比 較是不合理的,因此需要采用一個(gè)具有代表性的樣本對(duì)量表建立具有文化特異性的常模。Running head:CRiTERiA for ev aluation of psychological testing scale84結(jié)論為了完善測(cè)量工具呈現(xiàn)出來的結(jié)構(gòu),對(duì)心理測(cè)評(píng)量表評(píng)價(jià)的標(biāo)準(zhǔn)涉及到諸多方面。信度與效度的檢驗(yàn)是十分重要的。其次,評(píng)判測(cè)量工具的方法還包括:對(duì)測(cè)量的層次結(jié)構(gòu)或聚合 結(jié)構(gòu)的鑒定;同一測(cè)量維度內(nèi)部一致性的建立;內(nèi)容同質(zhì)性的檢驗(yàn);條目屬于想要測(cè)量的心理特征的范疇,條目能夠被區(qū)分開來的屬性強(qiáng)度;在獨(dú)立樣本中,測(cè)量工具的特質(zhì)的可重復(fù)性。一個(gè)好的測(cè)驗(yàn)量表應(yīng)當(dāng)具備客觀性,定量性,可

23、交流性和經(jīng)濟(jì)性的特點(diǎn)。事實(shí)上, 觀測(cè)者想要測(cè)量的心理特征是極其復(fù)雜的,因?yàn)椴煌^測(cè)者在不同時(shí)期所觀察的同一現(xiàn)象的觀察結(jié)果有可能是不同的,需要眾多觀測(cè)者長期觀察和積累經(jīng)驗(yàn)。一個(gè)好的量表是建立在科學(xué)的概括和總結(jié)的基礎(chǔ)之上,并且隨著人類對(duì)客觀現(xiàn)象的認(rèn)知不斷深入,一些心理特征被不斷完善,因而能更為客觀地反映現(xiàn)象的特征。量表通過定量的數(shù)字使得抽象的心理特征具象化, 使得統(tǒng)計(jì)分析能夠進(jìn)行,使得現(xiàn)象間的客觀規(guī)律被揭示和認(rèn)識(shí),使得某個(gè)假設(shè)能夠被證實(shí)或者證偽。由于量表的特點(diǎn),各國的觀察者們通過對(duì)同一現(xiàn)象的不同觀測(cè)結(jié)果進(jìn)行互相比較, 互相驗(yàn)證,互相交流,建立起了溝通的橋梁。再有,構(gòu)建一個(gè)心理測(cè)評(píng)量表不是一朝一夕就

24、能完成的,需要耗費(fèi)極大的人力,物力,財(cái)力。但是一旦量表成功地用于生產(chǎn)實(shí)踐,對(duì)個(gè)人,對(duì)集體,對(duì)國家,對(duì)社會(huì)產(chǎn)生的影響將是巨大的。綜上所述,規(guī)范心理測(cè)評(píng)量表評(píng)價(jià)的標(biāo)準(zhǔn)是極其重要的。參考文獻(xiàn)戴曉陽,曹亦薇.(2009).心理評(píng)定量表的編制和修訂中存在的一些問題.中國臨床心理學(xué)雜志.17(5), 562565.戴海崎,張鋒,陳雪楓.(2011).心理與教育測(cè)量(p.4979).暨南大學(xué)出版社.劉子龍,高北陵,袁尚賢.(2005).社會(huì)能力評(píng)定量表的編制及信效度檢驗(yàn).中國臨床心理學(xué)雜志.13(1), 1922.郭全,陳澤奇,劉小珍,申定珠.(2007).慢性乙型肝炎肝膽濕熱證評(píng)定量表的初步編制及考評(píng).中

25、國中醫(yī)藥信息雜志.14(7), 912.趙靖平.(1987).西方量表譯本的評(píng)價(jià)和修訂.國外醫(yī)學(xué)精神病學(xué)分冊(cè).3, 135144.鄭延平.(1987).量表研究的策略J.國際精神病學(xué)雜志.3, 144148.Andrea C. Psychological evaluations: what every principal should know. Literacy Education,Running head:CRiTERiA for ev aluation of psychological testing scale91013.Domenic V. Cicchetti. (1994). Gu

26、idelines, criteria, and rules of thumb for evaluating normed and standardized assessment instruments in psychology. Psychological Assessment 6(4), 284290.Harter S. (1982). The perceived competence scale for children. Child Development., 53(1), 8797.John P. Robinson, Phillip R. Shaver & Lawrence S. Wrightsman. (1991). Criteria for scale selection and evaluation(p.7). Academic Press, Inc.10Running head:CRiTERiA for ev aluation of psychologica

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論