西方量表譯本的評價和修訂_第1頁
西方量表譯本的評價和修訂_第2頁
西方量表譯本的評價和修訂_第3頁
西方量表譯本的評價和修訂_第4頁
西方量表譯本的評價和修訂_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

西方量表譯本的評價和修訂引言將西方的心理量表譯本匆促地用于中國的臨床和科研是不適當(dāng)?shù)摹σ粋€穩(wěn)定、有效的西方量表進(jìn)行準(zhǔn)確無誤的翻譯并不必然保證它在中國也是穩(wěn)定和有效的量表。在心理學(xué)和精神病學(xué)的跨文化研究中,經(jīng)常將西方量表翻譯后就在中國使用,包括生物心理測量或/社會心理測量的定式檢查量表和自我評定量表,其中很多量表繼而被應(yīng)用于臨床。但是,這樣使用量表譯本的研究,其結(jié)果往往并不可靠。原因在于中國國內(nèi)并沒有對量表譯本進(jìn)行充分的信、效度檢驗。為了減少量表的人種和文化偏性,提高它們在中國的臨床使用價值,迫切需要用嚴(yán)格的科學(xué)方法對量表譯本進(jìn)行評價和修訂。本文介紹筆者等在中國使用量表過程中所探索出的評價和修訂量表譯本的方法。第一步:了解、審定西方,表的發(fā)展、評價和使用情況西方國家使用過的量表中有很多質(zhì)量不高,將這樣的量表翻譯后引進(jìn)中國只會擴(kuò)大其不適應(yīng)性。在中國使用一個西方量表之前,首先要完全熟悉這一量表在西方的發(fā)展和應(yīng)用情況,盡可能地查閱有關(guān)的所有文獻(xiàn),以便正確評價這一工具的質(zhì)量,然后再決定有無必要進(jìn)行大量的工作將此量表引進(jìn)并使之適用于中國。量表必須基于可靠的科學(xué)理論。如果編制某一量表的理論本身就不清楚或具有高度的文化偏性,那么此量表多半不適合于中國使用。除此之外,還必須考慮量表編制的全過程,如:編制量表時的原始條目池(itempool)是否全面?確定量表條目時,選擇條目的方法是否適當(dāng)?用來建立常模的樣本是否具有代表性?對量表的信、效度是否進(jìn)行了嚴(yán)格的心理測t分析?如果有關(guān)文獻(xiàn)沒有滿意地回答上述問題,那么,此量表還不能用于不同文化背景。Kirshner和Guyatt寫了一篇很好的文章(尚未發(fā)表),強(qiáng)調(diào)區(qū)別三大類量表的重要性。(1)差別量表:旨在按照不同基本維度來區(qū)別不同的個體(如智力測驗、人格測驗);(2)預(yù)測量表:用來預(yù)測個體屬于已定類別中某一類的量表(診斷試驗、預(yù)測自殺行為的量表);(3)評定量表:用來評定某現(xiàn)象縱向變化程度的量表(如評定治療反應(yīng))。由于其心理測童指標(biāo)要求各有不同,一個量表不可能同時兼?zhèn)渖鲜鋈N量表的測定功能。因此,在選用某一西方量表前,應(yīng)考慮此量表在西方的用途:即用于三種目的中的哪一種,并適用于什么人群?如果在中國使用的目的或計劃中的病人對象與西方不同,最好還是選用別的量表或編制新的量表。第二步:量表的翻譯和回譯一經(jīng)確定一個量表在西方確實行之有效,而且目的與對象和中國的研究相似,下一步就是翻譯這個量表。如果研究的主要目的是比較西方國家和中國的同類病人,那么應(yīng)力求量表譯本與原版之間意思相同,這一要求可通過對量表的翻譯和回譯來達(dá)到(注釋1)。如果研究的主要目的是提供一個能在中國臨床使用的量表,那么翻譯時用詞就應(yīng)力求按照中文的習(xí)慣用法,與原文難免有所出人。這樣一來,在西方研究結(jié)果與中國使用的效度之間,就會出現(xiàn)矛盾。將西方量表進(jìn)行修訂使之適合中國文化的特殊性,可以提高量表在中國使用的效度,但其代價是與西方研究結(jié)果的可比性降低。完全不受文化制約的量表是不存在的。在量表被準(zhǔn)確無誤地翻譯后,應(yīng)該從以下幾方面評價量表條目的“表面效度”。如:譯本中的特定條目是否與準(zhǔn)備測定的概念相關(guān)?譯文意思是否清楚明確?如果是自評量表,譯文的難易水平對填表對象是否適合?條目能否區(qū)別不同個體或回答會眾口一詞?如果翻譯后的條目不符合上述標(biāo)準(zhǔn),在對量表進(jìn)行初試之前,應(yīng)對條目進(jìn)行適當(dāng)修改。在不改變基本概念的前提下,使條目含義變得清楚、簡單和適合文化要求,以便能起到區(qū)別不同個體的作用。第三步:對量表進(jìn)行初試和必要的修訂在進(jìn)行正式研究之前,有必要先行初試并根據(jù)初試結(jié)果對量表加以修改。初試有助于發(fā)現(xiàn)哪些條目含義不清楚、不明確、太復(fù)雜或不具區(qū)別能力。在正式研究之前就應(yīng)對這些不理想的條目加以修改。初試人數(shù)以20-30人為宜,其受教育程度和臨床狀況應(yīng)與將來量表的應(yīng)用對象相同。應(yīng)觀察受試者在填寫量表(或回答定式詢問)過程中如何反應(yīng),并要求他們解釋各條目的含義。如受試者選擇某個條目感到猶豫,應(yīng)該間清猶豫的原因。確定自評量表中不清楚的條目,可行的方法是:在填完每一條目后,要求受試者完成以下步驟:(1)采用三分制來判斷受試者對條目理解的難易程度(容易理解、中等、難于理解);(2)要受試者標(biāo)記出條目中看不懂的詞句;(3)如果幾乎所有的受試者對某一條目回答的結(jié)果都一樣,這個條目就肯定應(yīng)該修改,因為不具備區(qū)別能力。西方量表的一種常見情況是在量表中設(shè)有肯定和否定問句兩種形式的條目,目的在于避免受試者以千篇一律的方式作答,而不仔細(xì)思考每一個問題。在中國,對否定問句的否定意味著肯定這種語言表達(dá)方式不象英語那樣常用,受試者經(jīng)常誤解和錯答這些否定問句條目。因此,在翻譯量表時,最好將否定句的條目改成肯定間句(盡管有可能引起回答方式千篇一律的弊?。?。初試的另一個重要作用是評價量表的格式,對自評量表尤其重要。評價的內(nèi)容包括:指導(dǎo)語是否清楚?在指導(dǎo)語中要不要舉例說明?條目的回答方法是否清楚?條目是否易引起誤解?是否有使受試者容易疏忽而漏填的條目?西方量表使用的格式在中國并不一定是最適當(dāng)?shù)母袷剑袝r需要更詳細(xì)的指導(dǎo)語和更簡單明確的評定方法。為了確保不出現(xiàn)漏填,有的量表甚至需要改變整個格式(注釋2)第四步:進(jìn)行正式研究以評價量表的應(yīng)用價值完成初試并作適當(dāng)修改后,便可進(jìn)行正式研究以確定量表在中國是否具有實用價值。此時,至關(guān)重要的是應(yīng)該對量表的真正用途有明確的概念:是用于判別、預(yù)測還是評定?因為研究的設(shè)計、對量表性能的評價和修訂在很大程度上取決于量表的不同目的。一個特定的量表可以有幾種用途,但一次研究只能檢驗一種用途?!迸袆e量表:差別量表的功用是描述一種基本狀態(tài)或情況,并根據(jù)受試者的情況對不同受試者加以區(qū)別。因為沒有可檢驗此類性能的外部標(biāo)準(zhǔn)和金標(biāo)準(zhǔn)(例如:人格、智力、家庭功能),所以量表的使用價值主要取決于量表的結(jié)構(gòu)效度和信度。檢驗判別量表結(jié)構(gòu)效度的方法之一,是看它能否對兩組不同的人群作出判別,并且與其理論基礎(chǔ)保持一致。例如,家庭功能量表應(yīng)能區(qū)別違法少年家庭與非違法少年家庭。使新翻譯的量表能被接受的最大成功機(jī)會(即最大限度地減少過早否定一量表的可能性),是用此量表去測定適合基本理論的盡可能多的不同人群,樣本要夠大,以避免B類誤差(指事實上組間確有顯著差異,但經(jīng)統(tǒng)計學(xué)處理卻未能發(fā)現(xiàn))。確定樣本大小的方法在統(tǒng)計學(xué)教科書中有詳細(xì)介紹〔幻。如果一個量表對樣本夠大,量表打算測定的特征明顯不同的兩組人群不能作出判別,那么,此量表沒有使用價值,應(yīng)予放棄。反之則說明此量表具備判別能力。評價判別量表結(jié)構(gòu)效度的方法之二,是與和量表理論有關(guān)的外部測量進(jìn)行比較。如果兩者的結(jié)果一致,就證實量表的結(jié)構(gòu)效度。例如:一個評價整體健康的量表,在理論上應(yīng)與過去一年中的患病天數(shù)有關(guān),如果真正如此,亦支持量表的結(jié)構(gòu)效度。與量表相關(guān)的外部測量越多,量表的結(jié)構(gòu)效度就越好(注釋3)一個合適的判別量表不僅應(yīng)能判別不同的個體,而且在不同時間內(nèi)應(yīng)能作同樣的判別,也就是說應(yīng)具有穩(wěn)定性。這方面的指標(biāo)是測定重測信度的相關(guān)系數(shù)(依數(shù)據(jù)類型選用直線即Pearson相關(guān)或等級即Spearman相關(guān))。重測的樣本同樣應(yīng)能代表總體。重測的人數(shù)越多越好,一般說來,至少應(yīng)有30人。重測間隔時間根據(jù)不同的量表而異,多數(shù)可間隔2至4周,有些量表應(yīng)間隔一年或更久。如果是檢查者使用的定式檢查量表,還應(yīng)評價評定者之間的信度,通常采用Kappa值作為指標(biāo)〔3〕。預(yù)測量表預(yù)測量表的功用是在已有外部標(biāo)準(zhǔn)或金標(biāo)準(zhǔn)的前提下,將受試者歸人不同的類別。常用的預(yù)測量表如診斷量表和預(yù)測治療反應(yīng)、疾病復(fù)發(fā)、自殺危險性的量表。預(yù)測量表就應(yīng)該具備一些金標(biāo)準(zhǔn)所不具備的優(yōu)點(diǎn),如快速、花費(fèi)少、危險性小、能早期使用等特點(diǎn),否則就沒有實用價值。預(yù)測量表與差別量表不同,其結(jié)構(gòu)效度和內(nèi)部一致性相對并不重要。量表的使用價值取決于信度和“校標(biāo)效度”(criterionvalidity),即歸類的準(zhǔn)確性。如果量表的目的是預(yù)測混合人群中成員的現(xiàn)行類別(不論每個病人有無特定的診斷),就應(yīng)該評價量有的“平行效度(concurrentvalidity)—校標(biāo)效度的一種。具體方法是:用量表測定一個樣本,樣本成員的目標(biāo)事件發(fā)生率應(yīng)與量表實際應(yīng)用時的人群相同,并由不知道量表結(jié)果的研究者盲性使用金標(biāo)準(zhǔn)評定同一樣本。量表結(jié)果與金標(biāo)準(zhǔn)之間的符合率通常用Kappa值或組間相關(guān)系數(shù)(ICC)評定。如果量表的目的是預(yù)測未來事件(如自殺、疾病復(fù)發(fā)、治療反應(yīng)),就應(yīng)該評價量表的預(yù)測效度—屬校標(biāo)效度的另一種。具體方法是:將量表用于一個對量表實際應(yīng)用人群量具有代表性的樣本,并追蹤隨訪一段適當(dāng)?shù)臅r間,以觀察被預(yù)測的事件是否發(fā)生。評價其準(zhǔn)確能力通常也用Kappa和ICC值。如果量表結(jié)果與金標(biāo)準(zhǔn)之間的一致性顯著高于機(jī)遇巧合,則表明量表具有滿意的校標(biāo)效度。但是,如果所用的樣本很大,則Kappa值很小也會有統(tǒng)計學(xué)顯著性差異。因此,慎重考慮Kappa值的大小和顯著性水平是十分重要的。對Kappa值大小的要求意見不一,F(xiàn)liessU,提出:Kappa值大于0.75說明平行效度很好,遠(yuǎn)遠(yuǎn)超過機(jī)遇巧合,在0.40和0.75之間說明平行效度較好,小于0.40說明平行效度差。在設(shè)計評價預(yù)測量表的研究時,應(yīng)該考慮以上因素:所預(yù)測的事件越少見,則越需要較大的樣本,才能肯定是量表的預(yù)測能力超過機(jī)遇巧合。預(yù)測罕見事件(如一般人群中的自殺行為),樣本數(shù)目一般達(dá)不到這種要求,解決的方法之一是將較多發(fā)生此類的事件的人群作為樣本(如將重癥抑郁病人作為研究預(yù)測自殺的樣本),但這樣一來研究結(jié)果的代表性只限于取樣人數(shù)。一個經(jīng)常發(fā)生的錯誤是采用臨床樣本來檢驗預(yù)測量表,并把只對臨床樣本具有高度敏感性和特異性的量表用作普通人群的篩選工具。然而,預(yù)測量表的臨床使用價值主要取決于它的陽性預(yù)測值和陰性預(yù)測值(即指陽性或陰性測驗結(jié)果是正確的可能性有多大),而不是取決于它的敏感性和特異性。這些預(yù)測值易受患病率的影響。例如當(dāng)結(jié)局事件的發(fā)生率減少時,量表的陽性預(yù)測值明顯下降。因此,一個用之于病人群預(yù)測結(jié)果好的量表并不一定在結(jié)局事件發(fā)生率很低的人群中有同樣好的預(yù)測效果(注釋4)預(yù)測量表的穩(wěn)定性也是很重要的,不能因時間不同而將同一對象歸人不同的類型。有價值的預(yù)測量表,其結(jié)果應(yīng)該有顯著而穩(wěn)定的個體間差異,但與判別量表重測信度的評價指標(biāo)不同,應(yīng)采用校正機(jī)率統(tǒng)計(如Kappa值)而不能用直線相關(guān)或等級相關(guān)。量表重測的預(yù)計間隔時間因量表不同而異,如:有些診斷在幾周或幾月后有可能更改,這類量表的重測間隔時間應(yīng)短。疾病復(fù)發(fā)或自殺的預(yù)測通常以年計,因而這類量表的重測間隔時間應(yīng)適當(dāng)延長。如果是評定者使用的定式問卷,則應(yīng)該用Kappa或ICC評價評定者之間的信度。評定量表:評定量表的目的是測量某現(xiàn)象在不同時間內(nèi)的變化程度。最常見的是設(shè)計成定量指標(biāo)來評定在特定治療下臨床現(xiàn)象變化程度的量表。如漢密頓抑郁評定量表(HDRS)常用來評定抗抑郁藥的療效。評定量表的好壞取決于量表本身的縱向結(jié)構(gòu)效度、信度和敏感性。在結(jié)構(gòu)效度的評價方面,評定量表與判別量表不同。判別量表的結(jié)構(gòu)效度通過同一時點(diǎn)的量表分與外部測量分之間的相關(guān)性來評價(也稱為橫斷面結(jié)構(gòu)效度)。而評定量表的結(jié)構(gòu)效度則通過不同時點(diǎn)的量表分的變化與外部測量分的變化之間的相關(guān)性來評價(也稱為縱向結(jié)構(gòu)效度)。評價縱向結(jié)構(gòu)效度應(yīng)包括以下幾方面:(1)采用夠大的樣本,在能夠引起臨床狀況發(fā)生改變的特殊干預(yù)被使用前和使用后進(jìn)行量表評定;(2)在特殊干預(yù)使用前和后,采用另一與量表理論相關(guān)的臨床狀況測量手段,(3)計算量表分前后之差與另一測量分前后之差兩者間的直線相關(guān)或等級相關(guān)系數(shù);(4)如果兩者間有顯著相關(guān)性則表明量表有較好的縱向結(jié)構(gòu)產(chǎn)度。例如:HDRS的縱向結(jié)構(gòu)效度可通過抗抑郁藥治療前后的HDRS評分的變化與大體評定量表分的變化兩者的相關(guān)來評價。在臨床狀況穩(wěn)定不變時,評定量表的個體內(nèi)部變異應(yīng)該很小,而在臨床狀況好轉(zhuǎn)或惡化時,量表的個體內(nèi)部變化則應(yīng)該很大。因為評定量表目的不是區(qū)別不同的個體,因而不同個體間的差異并不重要。信度的相關(guān)系數(shù)和Kappa值不如配對測驗?zāi)菢佑嘘P(guān)。因此,評價評定量表的重測信度時,在重測間隔時間內(nèi)個體的臨床狀況不發(fā)生變化。對前后兩次量表的評分要用配對檢驗方法來分析(如Wilcoxon秩和檢驗或配對t檢驗),如果結(jié)果無顯著性差異,則說明不同時間的個體內(nèi)部量表分無明顯變化,信度可靠。同理,如果是由評定者使用的定式檢查量表,評定者間的信度也應(yīng)該用配對檢驗來評價。評定量表還應(yīng)該具備高度的“敏感性”,即當(dāng)臨床狀況僅僅只有非常小的變化時,量表也可以反映出來。如果敏感性低,只能反映出很明顯的臨床狀況變化,那么就需要很大的樣本(甚至不可能達(dá)到)才能觀察到量表分變化的顯著性差異。評價量表的敏感性,可使用已知療效的治療措施,通過比較治療前、后量表分的變化來看敏感性如何,一或通過用別的標(biāo)準(zhǔn)來證實病人的好轉(zhuǎn)或惡化的情況,同時觀察量表分變化的方向和程度。第五步:甚于初步研究結(jié)果對量表進(jìn)行修訂通過初步研究肯定了量表的信、效度后,下一步是利用研究結(jié)果對量表進(jìn)行修訂。目的是確定哪些條目不清楚、不穩(wěn)定或不符合量表的效度。在效、信度的評價方面,三類量表有很大的差異,在如何確定不理想條目的方法面也是如此。多數(shù)翻譯過來的量表,其條目在西方樣本研究后,已根據(jù)研究結(jié)果作過篩選削減,如果進(jìn)一步減少條目數(shù)量可能使量表對所測內(nèi)容的綜合性評定能力降低。因此,對量表譯本中不好的條目來說,需要的往往是修改或替代而不是刪除。如果對一個不好的條目有幾種可能的修改,難以肯定哪一種最好,可以在下一次修訂量表時,將幾種可能的修改都納人研究,分析修改后量表的效、信度時,相互比較,擇優(yōu)選人最后版本。如果定性研究表明量表譯本的所測內(nèi)容中未能包括本文化的重要方面,就應(yīng)該擴(kuò)充條目,包括進(jìn)去。判別量表:判別量表的條目安排原則,是要求包括被測結(jié)構(gòu)所有重要方面的條目,去掉那些降低結(jié)構(gòu)測量精確度的條目。確定判別量表中的不好條目有幾種方法,對下列類型的條目要考慮刪除:受試者經(jīng)常難以理解其含義的條目;對不同組別缺乏判別能力的條目;隨時間不同而不能保持穩(wěn)定的條目;與所屬分量表評分相關(guān)性差的條目,分量表經(jīng)因子分析(未經(jīng)旋轉(zhuǎn)),在初始因子矩陣中主要成分負(fù)荷值低的條目。條目篩選時,最理想的是使每一條目的外部效度、內(nèi)部一致性和信度同時得到最大限度的增加,三方面都不滿意的條目應(yīng)該刪除。常常有些條目在某一方面較好而在其他方面較差(如某條目對不同組別有很好的判別作用,但與所屬分量表評分的相關(guān)性卻較差),對這樣的條目是否需要修改,取決于量表的外部效度、內(nèi)部一致性或信度三方面哪一方面在當(dāng)時處于重要地位。對條目的修改應(yīng)根據(jù)條目的主要問題而定:含義不清楚的條目應(yīng)改寫清楚;對組間判別能力差的條目重在增加其判別能力;與所屬分量表評分相關(guān)性差的條目應(yīng)改進(jìn)這方面的相關(guān);不穩(wěn)定的條目應(yīng)重新擬寫,使其描述的現(xiàn)象更加穩(wěn)定和具體。預(yù)測量表預(yù)測量表的條目安排原則,是對目前或?qū)淼囊唤M人群進(jìn)行正確和穩(wěn)定的預(yù)側(cè)。如果量表內(nèi)同時包括幾種范疇的內(nèi)容(如診斷量表中含有幾種診斷類別),那么,一個特定條目就應(yīng)該能準(zhǔn)確和穩(wěn)定地預(yù)測該條目所代表的類別。因此,預(yù)測量表中的條目只強(qiáng)調(diào)校標(biāo)效度和重測信度。根據(jù)單個條目的Kappa值可能確定哪些條目不符合要求。對不能正確確定受試者(按照金標(biāo)準(zhǔn)結(jié)果)的條目應(yīng)該修改,以便能準(zhǔn)確地區(qū)別符合與不符合金標(biāo)準(zhǔn)的人群。對因時而異的不穩(wěn)定條目也應(yīng)修改,以便使條目較好地顯示出所測現(xiàn)象的客觀性和長期穩(wěn)定性。評定量表:評定量表的條目安排原則,是要求包含能靈敏地反映出臨床干預(yù)效果變化的所有有關(guān)條目。評定量表的條目應(yīng)具備下述特點(diǎn):如果臨床現(xiàn)象沒有變化,對研究對象的評定結(jié)果也應(yīng)該沒有變化。而在臨床觀象有明顯的改善或惡化時,對研究對象的評定結(jié)果也應(yīng)該有很大的變化。對每一條目前后評分的配對檢驗可確定哪些條目需要修改或取代。對給予肯定有效治療后而評分無明顯變化的的條目,或者是評分有明顯變化但并無相應(yīng)的臨床現(xiàn)象變化的條目都應(yīng)該進(jìn)行修改。評定量表的條目也應(yīng)該具備敏感性,條目評分的變化應(yīng)能反映出微小但很重要的臨床狀況變化。在條目的敏感性方面,具有等級程度(如:“從來沒有”、“很少有”、“有時有”、“經(jīng)常有”、“總是有”)選擇的條目要優(yōu)于只有兩極(如:“有”、“無”)選擇的條目。有時為了更好地達(dá)到評定目的,要將兩級評定的量表轉(zhuǎn)換成等級評量表。第六步:用已修訂的量表測定另一組人群,量表再次評價并建立具有文化特異性的常模對修訂后的量表,應(yīng)該測定另一組研究對象,并再次評價,結(jié)果仍然不好的條目應(yīng)該取代或修改。要獲得一個滿意的量表,往往需要多次的修訂和再評價。在反復(fù)修改的過程中,所用樣本對今后實用時的對象人群應(yīng)具代表性。由于文化差異,一個量表經(jīng)修訂后,在內(nèi)容和形式方面就會有很大的變化。因此,仍用西方的常模來區(qū)分“正?!迸c“異?!笔遣贿m當(dāng)?shù)?。修訂工作一旦完成,就?yīng)該采用一個很大且有代表性的樣本來建立具有文化特異性的常模,并確定效度和信度指標(biāo)。判別量表:判別量表的常模通常來自于普通人群。在全國不同地區(qū)按照年齡、性別、文化程度等比例收集一個大的、且有代表性的樣本。如果是自評量表,樣本則限制于受教育水平能完成量表填寫的人群。因此,常模不適合于這一受教育水平以下的人(注釋5)有幾種方法可用來確定判別量表的結(jié)果屬于“異?!保?1)量表分超過“常態(tài)”人的均值加減兩個標(biāo)準(zhǔn)準(zhǔn)差的人;(2)標(biāo)準(zhǔn)化“T”分高于或低于一個人為劃界分的人;(3)量表分達(dá)到或超過臨床患病樣本的均值(或其它一些特定百分位數(shù)劃界分)的人。第1、2種方法最為常用,但因僅機(jī)械地從概率的觀點(diǎn)來確定異常,不考慮臨床的實際情況而存在一些不足。第3種方法從臨床角度來講更為適當(dāng),但需要建立一個大的、有代表性的臨床患病人群的常模。一旦修訂量表定形后,要評價量表理論結(jié)構(gòu)的獨(dú)立性和同源性。常通過因素分析和內(nèi)部一致性的評價來完成。內(nèi)部一致性指標(biāo)是衡量分量表的條目(如果量表僅僅是測量一個結(jié)構(gòu),則為整個量表的條目)與基本測定結(jié)構(gòu)是否一致的準(zhǔn)確程度。如果基本測定結(jié)構(gòu)具同源性,且條目能特異性地代表此結(jié)構(gòu),量表的內(nèi)部一致性就高。反之,如果基本測定結(jié)構(gòu)具異源性,且條目不能特異性地代表此結(jié)構(gòu),量表的內(nèi)部一致性就低。用于評價內(nèi)部一致性的方法有多種,如:分量表中各條目間平均相關(guān)系數(shù)、Cronbach'salpha(信度系數(shù)),theta和omegas,等,這些方法都有賴于分量表中各條目間的平均相關(guān)程度。此外還有條目間相關(guān)矩陣,分量表的主要成份分析和因素分析方法(注釋6)0其中以Cronbach'salpha最為常用。從理論上講,Cronbach'salpha值應(yīng)大于0.8,但對于多數(shù)研究來說,達(dá)到0.6就認(rèn)為可取。從理論上講,對一個有代表性的大樣本的量表結(jié)果進(jìn)行因素分析,分析結(jié)果應(yīng)具備下列特征:(1)經(jīng)主成份因素分析,得到的有統(tǒng)計學(xué)顯著意義的因子數(shù)目應(yīng)與量表的理論測量維度相符;(2)經(jīng)旋轉(zhuǎn)后,在某一因子中負(fù)荷高的條目應(yīng)與此因子的內(nèi)容有關(guān);(3)各分量表(維度)在不經(jīng)旋轉(zhuǎn)的普通因子分析時,得到的第一因子的方差解釋值應(yīng)較大(應(yīng)>40%)。不符合上述特征的量表可能有幾個不同的理論測定結(jié)構(gòu),或者理論結(jié)構(gòu)具異源性。采用一個與西方類似的中國樣本,并與量表的西方因素分析結(jié)果進(jìn)行比較,可以了解因子結(jié)構(gòu)的文化差異。但是,對基于因素分析結(jié)果來解釋文化差異應(yīng)持慎重態(tài)度,因為不同的取樣方法、方法學(xué)方面微小的人為因素均可以明顯影響因素分析結(jié)果。因素分析和內(nèi)部一致性雖可用于評價量表的結(jié)構(gòu)效度,但對結(jié)構(gòu)效度進(jìn)行外部測量(即與有理論相關(guān)的其他測量方法進(jìn)行比較)更為重要。預(yù)測量表:預(yù)測量表的常模樣本應(yīng)來自量表實際應(yīng)用的人群,制定預(yù)測量表的常模需要兩個常模樣本或?qū)⒁粋€大的常模樣本分為兩半。第一個樣本用來獲得能最大限度提高預(yù)測準(zhǔn)確性的預(yù)測公式,第二個樣本用來評價這一預(yù)測公式的效度。用獲得預(yù)測指標(biāo)的同一樣本來確定量表的指標(biāo)效度是不適當(dāng)?shù)摹_@樣會出現(xiàn)量表效度很高但不真實的結(jié)果。因為量表的各條目具有不同的預(yù)測能力,因此可用第一個樣本來計算邏輯斯蒂(logistic)或多元回歸方程,以權(quán)衡各條目對結(jié)果的最佳預(yù)測能力。然后根據(jù)條目權(quán)衡的回歸方程重新計算量表分,可得到一個劃界分能很好地把存在和不存在指標(biāo)事件(金標(biāo)準(zhǔn))的個體區(qū)分開來(注釋7)。此外,也可用回歸方程將每一個體的量表分(或區(qū)間)轉(zhuǎn)換成似然率—即結(jié)局事件發(fā)生的可能性(在一個有限可信區(qū)間內(nèi)發(fā)生結(jié)局事件的可能性有多大)。對于有多個劃界點(diǎn)的量表(如使用樹枝狀定向的診斷量表),應(yīng)該確定每一劃界點(diǎn)的最佳劃界指標(biāo)。完成上述步驟后,應(yīng)將預(yù)測指標(biāo)—各條目的權(quán)分和劃界分用于第二個樣本,用Kappa值來評價量表的校標(biāo)效度(即特定的預(yù)測校標(biāo)校度如何)。同一指標(biāo)事件在預(yù)測指標(biāo)上的跨文化差異.高度表明在預(yù)測金標(biāo)準(zhǔn)時,不同的文化因素是十分重要的。評定量表:因為評定量表是測定個體本身前后的差異而不是個體間的差異,所以憑量表評分不能認(rèn)為正常或異常,評定量表的“常模”,是通過讓一組病人接受肯定有效的標(biāo)準(zhǔn)治療,并根據(jù)量表分變化的程度而制定的。常模樣本是指對患有該特定疾患的所有病人具有代表性如(如病期、病情嚴(yán)重程度等)的一大組病人。“常?!笔侵缚隙ㄓ行У臉?biāo)準(zhǔn)治療引起量表分變化的均值和標(biāo)準(zhǔn)差?!俺D!敝贫ê?,可用“常模”來比較其它治療方法所引起的量表分變化情況。對量表內(nèi)容和標(biāo)準(zhǔn)治療引起的量表分變化程度進(jìn)行跨文化的比較,可以確定癥狀對治療反應(yīng)敏感性的跨文化差異。用于一種以上目的的量表:量表通??捎糜谝环N以上的目的。判別量表和預(yù)測量表也可以用于測定不同時間的臨床狀況變化(與評定量表類似),反之亦然。關(guān)鍵是對不同類型的量表有不同的要求。因此,一個量表不可能對一種以上的目的都具備良好的測定能力。例如,判別量表要能夠?qū)Σ煌瑐€體進(jìn)行明確的判別,但評定量表則要求能夠確定個體本身微小的臨床狀況變化。兩極回答方式最適合于判別量表,因為量表要盡可能明確地判別不同的個體。而等級選擇回答方式最適合于評定量表,因為量表要盡可能反映出微小的、但非常重要的臨床狀況變化。對一個量表不能兼?zhèn)涠喾N良好的測定功能這一間題,沒有簡單的解決方法。在使用量表譯本時,這一不足更為空出,其原因是西方國家在編制量表時,對條目原已作出限制。許多研究人員或者由于不知道這一不足,或者是由于試圖編制一個能同時測定多種功能的量表,其結(jié)果是使量表缺乏精確性。筆者等認(rèn)為,可行的最佳解決辦法是一次針對一種目的對量表進(jìn)行評價和修訂。在量表被精制能夠用于某種目的后,才能評價其它的目的和用途。但是,要使工具能用于第二種目的,增加其實用性,通常需要做進(jìn)一步的修訂,以使其具備測定兩種目的、即兩個量表的功能。筆者認(rèn)為,分別測定兩種特定功能的兩個精確工具比一個測定多種功能的不精確工具要好。結(jié)論:使用翻譯過來的量表,并不是從編制量表的第一步做起。因為編制一個量表首先要獲得與測定現(xiàn)象有關(guān)的大條目池,然后從提高量表測定某功能的信、效度出發(fā),對條目進(jìn)行篩選削減或修訂。量表譯本中的條目來源于有關(guān)研究范疇的西方概念,并通過西方樣本的研究加以篩選和削減的。如果在中國編制同一研究范疇的量表,原始條目則來源于可能與本文概念不同的中國概念,并通過中國樣本研究后,將篩選得到的條目編制成量表,其條目肯定會與翻譯過來的量表有明顯的不同。因此,所有西方量表譯本都可能存在人種偏差。一般說來獷西方量表譯本與中國文化之間的差異性,自評量表和測量心理社會指標(biāo)的量表比定式檢查和測量心理生物指標(biāo)的量表更為突出。例如:鄭氏等人發(fā)現(xiàn)漢密頓抑郁評定量表(定式檢查量表)中譯本具有較好的信、效度,但Beck抑郁問卷(自評量表)中譯本的信、效度則不理想。使用定式檢查時,檢查者可用本文化習(xí)慣用語給病人解釋條目的含義這樣就減少了人種偏差,而自評量表則難以做到這點(diǎn)。與測量心理生物指標(biāo)的量表相比,測量心理社會指標(biāo)的量表更有可能含有西方文化特異性的條目,因而文化差異性更大。將來,有可能采用證明有跨文化信、效度的定式檢查量表做為“外部標(biāo)準(zhǔn)”,以便修訂測量同一結(jié)構(gòu)的自評量表。從理論上講,每一文化應(yīng)該從量表編制的第一步開始,編制適應(yīng)于本文化的健康狀況和心理社會方面的量表。但編制一個新量表需要眾多研究者長時間齊心協(xié)力的工作,中國的研究者很少具備這些條件。目前,中國需要一致的臨床和社會文化測量工具的迫切愿望已導(dǎo)致西方量表譯本的廣泛應(yīng)用,這些量表譯本的最后應(yīng)用價值將有賴于嚴(yán)格的科學(xué)方法進(jìn)行評價和修訂。本文提出了將盈表譯本用于中國的評價方法。在中國使用的量表譯本(即判別、預(yù)測和評定量表)和盆表應(yīng)用的目標(biāo)人群首先要符合中國文化特點(diǎn),然后采用對目標(biāo)人群具有代表性的樣本,對與量表類型有關(guān)的特定心理測量性質(zhì)進(jìn)行嚴(yán)格的評價。如果不符合本文化特點(diǎn),則必須對量表進(jìn)行文化方面的適當(dāng)修訂,隨后重新評價。經(jīng)過反復(fù)幾次的修訂和再評價,產(chǎn)生正式量表,然后制定正式量表的文化特異性常模并進(jìn)行跨文化比較。注釋:1.如果原版量表是英文的,則步驟如下:一個人將是表翻譯成中文,另一人(尚未看過原版量表)將中譯本回譯成英文,并與原版量表比較。將中譯本適當(dāng)修改后,還需進(jìn)行回譯并與原版量表比較,有必要如此反復(fù),直到回譯本盡可能接近原版量表。當(dāng)然,量表翻譯的準(zhǔn)確程度取決于譯者的水平。2.初試也用于評價回答量表的難易程度。如果是自評量表,病人填寫要花費(fèi)多長時間(可能對復(fù)雜間題難以理解)?受教育低的人能否完成?如果是定式檢查量表,檢查時間多長?如果正式研究包括幾個問卷和定式檢查,完成所有量表需要多長時間?如果初試研究發(fā)現(xiàn)受試者時間太長不愿意完成量表或不能保持注意力,研究的設(shè)計則必須修改。3.因素分析和內(nèi)部一致性測驗是評價結(jié)構(gòu)效度的方法,對判別量表譯本尤為重要,因為對西方量表理論結(jié)構(gòu)的廣度通常存在疑問,在修訂量表譯本的最初階段,由于樣本小和量表中可能含有一些不適當(dāng)要修改的條目,因子結(jié)構(gòu)和內(nèi)部,戒限噢不穩(wěn)定的。比時應(yīng)用這些分析方法可幫助修訂量表,而不是對量表在中國的理論結(jié)構(gòu)下肯定結(jié)論。只有在形成正式量表版本并用于大而有代表性的樣本之后,才可以用這些方法來評價量表在中國的理論結(jié)構(gòu)。4.要考慮所用金標(biāo)準(zhǔn)的質(zhì)量或因同時使用量表和金標(biāo)準(zhǔn)而使結(jié)果混淆不清的可能性是非常重要的。所謂“金標(biāo)準(zhǔn)”指的是:大家公認(rèn)是最客觀的方法來決定某一現(xiàn)象(如:診斷)是否存在一套標(biāo)準(zhǔn)。在精神病學(xué)領(lǐng)域,因為缺乏能肯定疾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論