第6章 預(yù)防醫(yī)學(xué)診斷試驗和篩檢試驗_第1頁
第6章 預(yù)防醫(yī)學(xué)診斷試驗和篩檢試驗_第2頁
第6章 預(yù)防醫(yī)學(xué)診斷試驗和篩檢試驗_第3頁
第6章 預(yù)防醫(yī)學(xué)診斷試驗和篩檢試驗_第4頁
第6章 預(yù)防醫(yī)學(xué)診斷試驗和篩檢試驗_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第六章第六章診斷試驗與篩檢試驗診斷試驗與篩檢試驗案例案例1 1心力衰竭是多種心臟疾病晚期共同表現(xiàn)出的一種綜合心力衰竭是多種心臟疾病晚期共同表現(xiàn)出的一種綜合征,是心源性死亡的重要原因。征,是心源性死亡的重要原因。B型利鈉肽型利鈉肽(BNP)、心房利、心房利鈉肽鈉肽(ANP)、N-末端末端ANP(NT-ANP)是人體內(nèi)重要的心臟激是人體內(nèi)重要的心臟激素,研究顯示,充血性心力衰竭時,血漿素,研究顯示,充血性心力衰竭時,血漿BNP、ANP和和NT-ANP濃度升高。通過放射免疫法檢測三項指標的血漿濃度濃度升高。通過放射免疫法檢測三項指標的血漿濃度變化對心力衰竭有診斷價值。變化對心力衰竭有診斷價值。圖圖1

2、是測定三種不同利鈉肽的血漿濃度水平和后前位是測定三種不同利鈉肽的血漿濃度水平和后前位X線胸片測心胸比例線胸片測心胸比例(CTR)對診斷心力衰竭效能的對診斷心力衰竭效能的ROC曲線曲線比較。比較。BNP、ANP、NT-ANP和和CTR的的ROC曲線下面積分曲線下面積分別為別為0.96、0.93、0.89和和0.79。 圖圖1 三種利鈉肽濃度和后前位三種利鈉肽濃度和后前位X線胸片測心胸比例對診斷心力衰竭效能的線胸片測心胸比例對診斷心力衰竭效能的ROC曲線曲線 (Cowie MR, et al. Lancet, 1997;350:1349-53 )作為一名醫(yī)生,你認為何項指標是最佳診作為一名醫(yī)生,你

3、認為何項指標是最佳診斷的指標?斷的指標?神經(jīng)母細胞瘤神經(jīng)母細胞瘤(NB)是最常見的兒童惡性腫瘤之一,是最常見的兒童惡性腫瘤之一,它可產(chǎn)生于自主神經(jīng)系統(tǒng)的各個神經(jīng)網(wǎng)絡(luò)它可產(chǎn)生于自主神經(jīng)系統(tǒng)的各個神經(jīng)網(wǎng)絡(luò)(腎上腺髓質(zhì)最腎上腺髓質(zhì)最為常見為常見),但其發(fā)病率較低,但其發(fā)病率較低(英國每年患此病的人不足英國每年患此病的人不足100例例)。目前,超過目前,超過50%的的NB在診斷時已從原發(fā)部位擴散,在診斷時已從原發(fā)部位擴散,過去過去20年中,年中,該病的生存該病的生存狀況狀況并未改善并未改善。本病預(yù)后取決于。本病預(yù)后取決于患兒年齡和疾病診斷的階段,疾病發(fā)現(xiàn)越早,預(yù)后越好?;純耗挲g和疾病診斷的階段,疾病發(fā)

4、現(xiàn)越早,預(yù)后越好。檢測尿中兒茶酚胺檢測尿中兒茶酚胺(VMA)及其代謝產(chǎn)物的含量可對該病進及其代謝產(chǎn)物的含量可對該病進行篩查。行篩查。案例案例2 2 目前在英國尚未確立神經(jīng)母細胞瘤的篩查方目前在英國尚未確立神經(jīng)母細胞瘤的篩查方案,但該病的篩查方案已在日本實施。神經(jīng)母細案,但該病的篩查方案已在日本實施。神經(jīng)母細胞瘤有自發(fā)消退的可能,篩查可能會導(dǎo)致過度診胞瘤有自發(fā)消退的可能,篩查可能會導(dǎo)致過度診斷。斷。如何建立一個研究以探討在英國實行神如何建立一個研究以探討在英國實行神經(jīng)母細胞瘤篩檢的價值?經(jīng)母細胞瘤篩檢的價值? 學(xué)習(xí)目的學(xué)習(xí)目的u定義診斷和篩檢,比較診斷試驗與篩檢試驗有何不同;定義診斷和篩檢,比較

5、診斷試驗與篩檢試驗有何不同;u學(xué)會計算試驗評價的各種指標;學(xué)會計算試驗評價的各種指標;u應(yīng)用真實性、可靠性和收益等指標評價診斷試驗和篩檢應(yīng)用真實性、可靠性和收益等指標評價診斷試驗和篩檢試驗;試驗;u列舉和討論試驗結(jié)果陽性截斷值的選定方法及注意的問列舉和討論試驗結(jié)果陽性截斷值的選定方法及注意的問題;題;u討論患病率、靈敏度、特異度及預(yù)測值等各類指標的相討論患病率、靈敏度、特異度及預(yù)測值等各類指標的相互關(guān)系;互關(guān)系;u了解提高試驗效率的方法。了解提高試驗效率的方法。第一節(jié)第一節(jié) 概概 述述第二節(jié)第二節(jié) 診斷試驗與篩檢試驗的評價診斷試驗與篩檢試驗的評價第三節(jié)第三節(jié) 提高試驗效率的方法提高試驗效率的方

6、法內(nèi)內(nèi) 容容一、概念一、概念 篩檢篩檢(screening)是運用快速、簡便的檢)是運用快速、簡便的檢驗、檢查或其它措施,在健康的人群中,發(fā)現(xiàn)驗、檢查或其它措施,在健康的人群中,發(fā)現(xiàn)那些表面健康,但可疑有病或有缺陷的人。那些表面健康,但可疑有病或有缺陷的人。 篩檢也稱篩查,篩檢所用的各種手段和方篩檢也稱篩查,篩檢所用的各種手段和方法稱為法稱為篩檢試驗篩檢試驗(screening test),它可以是),它可以是體檢、實驗室檢查和問卷調(diào)查等。體檢、實驗室檢查和問卷調(diào)查等。 第一節(jié)第一節(jié) 概概 述述 篩檢試驗只是將人群中可疑有病或有篩檢試驗只是將人群中可疑有病或有缺陷者(試驗陽性者)與那些可能無病

7、者缺陷者(試驗陽性者)與那些可能無病者(試驗陰性者)區(qū)分開來,僅是一個初步(試驗陰性者)區(qū)分開來,僅是一個初步的檢查,對篩檢結(jié)果陽性或可疑陽性者需的檢查,對篩檢結(jié)果陽性或可疑陽性者需進一步做確診檢查,對確診者還需進行治進一步做確診檢查,對確診者還需進行治療。療。圖圖2 篩檢試驗流程圖篩檢試驗流程圖 (引自:連志浩流行病學(xué)北京醫(yī)科大學(xué),北京,1989) 篩檢的目的篩檢的目的1. 疾病的二級預(yù)防,早發(fā)現(xiàn)、早診斷、早治療。疾病的二級預(yù)防,早發(fā)現(xiàn)、早診斷、早治療。如乳腺癌等篩檢。如乳腺癌等篩檢。2. 疾病的一級預(yù)防,高危人群,采取相應(yīng)的干預(yù)疾病的一級預(yù)防,高危人群,采取相應(yīng)的干預(yù)措施。例如篩檢高血壓預(yù)

8、防腦卒中。措施。例如篩檢高血壓預(yù)防腦卒中。3. 識別疾病的早期階段,幫助了解疾病的自然史,識別疾病的早期階段,幫助了解疾病的自然史,揭示疾病的揭示疾病的“冰山現(xiàn)象冰山現(xiàn)象”。4. 合理分配衛(wèi)生資源。合理分配衛(wèi)生資源。是指在臨床上醫(yī)務(wù)人員通過詳盡的檢是指在臨床上醫(yī)務(wù)人員通過詳盡的檢查及調(diào)查等方法收集各種信息,經(jīng)過整理查及調(diào)查等方法收集各種信息,經(jīng)過整理加工后對病人病情的基本認識和判斷。據(jù)加工后對病人病情的基本認識和判斷。據(jù)此制定下一步的治療或干預(yù)方案,完成救此制定下一步的治療或干預(yù)方案,完成救治任務(wù)。治任務(wù)。 診診 斷(斷(diagnosisdiagnosis)用于診斷的各種檢查及調(diào)查的方法稱用

9、于診斷的各種檢查及調(diào)查的方法稱診斷試驗診斷試驗(diagnostic test)。診斷試驗的含義。診斷試驗的含義是廣泛的,它既包括各種實驗室檢查,也是廣泛的,它既包括各種實驗室檢查,也包括放射線、包括放射線、B超等物理檢查手段,還包括超等物理檢查手段,還包括病史、體檢等臨床資料。病史、體檢等臨床資料。 診斷的主要診斷的主要目的目的是對病人病情做出及時、是對病人病情做出及時、正確的判斷,以便采取相應(yīng)有效的治療措施。正確的判斷,以便采取相應(yīng)有效的治療措施。此外,還可應(yīng)用診斷試驗進行病例隨訪,確定此外,還可應(yīng)用診斷試驗進行病例隨訪,確定疾病的轉(zhuǎn)歸、判斷療效和估計預(yù)后以及監(jiān)測治疾病的轉(zhuǎn)歸、判斷療效和估

10、計預(yù)后以及監(jiān)測治療的副作用等。療的副作用等。二、應(yīng)用原則二、應(yīng)用原則篩檢的應(yīng)用原則篩檢的應(yīng)用原則 1.被篩檢的疾病或缺陷是當(dāng)?shù)刂卮蟮男l(wèi)生問題。被篩檢的疾病或缺陷是當(dāng)?shù)刂卮蟮男l(wèi)生問題。2.對被篩檢的疾病或缺陷有進一步確診的方法與條件。對被篩檢的疾病或缺陷有進一步確診的方法與條件。3.對發(fā)現(xiàn)并確診的病人及高危人群有條件進行有效的治療和對發(fā)現(xiàn)并確診的病人及高危人群有條件進行有效的治療和干預(yù),且應(yīng)有統(tǒng)一的標準。干預(yù),且應(yīng)有統(tǒng)一的標準。4.了解被篩檢疾病的自然史,有可供識別的早期癥狀和體征了解被篩檢疾病的自然史,有可供識別的早期癥狀和體征或測量的標志?;驕y量的標志。5.篩檢試驗要快速、簡便、經(jīng)濟、可靠、

11、安全、有效及易為篩檢試驗要快速、簡便、經(jīng)濟、可靠、安全、有效及易為群眾接受。群眾接受。 診斷的應(yīng)用原則診斷的應(yīng)用原則 診斷是臨床采取有效治療措施的前提,因診斷是臨床采取有效治療措施的前提,因此診斷試驗必須能正確判斷病人和非病人,還此診斷試驗必須能正確判斷病人和非病人,還要為受檢者所接受,所以診斷試驗要求:要為受檢者所接受,所以診斷試驗要求: 1.靈敏度、特異度要高。靈敏度、特異度要高。 2.快速、簡單、價廉、容易進行??焖?、簡單、價廉、容易進行。 3.安全、可靠、盡量減少病人的損傷和痛苦。安全、可靠、盡量減少病人的損傷和痛苦。 三、診斷試驗與篩檢試驗的區(qū)別三、診斷試驗與篩檢試驗的區(qū)別篩檢試驗篩

12、檢試驗診斷試驗診斷試驗?zāi)康哪康挠靡詤^(qū)別可疑病人與可能無病者 用來區(qū)別病人與可疑有病但實際無病的人 對象對象健康或表面健康的人 病人或可疑病人 要求要求快速、簡便,有高靈敏度,盡可能發(fā)現(xiàn)所有可能的病人 較高的準確性、特異度和靈敏度,盡可能診斷出所有病人和排除所有非病人 費用費用簡單、廉價的方法 一般價格較高 處理處理陽性者須進一步作診斷試驗以確診 陽性者需要進一步觀察和及時治療 圖圖3 宮頸癌自然史與篩檢和診斷的示意圖宮頸癌自然史與篩檢和診斷的示意圖(Ahrens 2005)不管是不管是“診斷試驗診斷試驗”還是還是“篩檢篩檢試驗試驗”都需要針對該方法對疾病都需要針對該方法對疾病“診診斷斷”的真實

13、性和價值做出評價。的真實性和價值做出評價。一、試驗評價的基本步驟一、試驗評價的基本步驟試驗的試驗的評價評價就是將待評價的試驗結(jié)果就是將待評價的試驗結(jié)果與與 “金標準金標準”(gold standard)結(jié)果結(jié)果進進行同步盲法比較,判定該方法對疾病行同步盲法比較,判定該方法對疾病“診診斷斷”的真實性和價值。的真實性和價值。 第二節(jié)第二節(jié) 篩檢試驗的評價篩檢試驗的評價(一)確定(一)確定“金標準金標準”“金標準金標準”指當(dāng)前臨床醫(yī)學(xué)界公認最可靠、指當(dāng)前臨床醫(yī)學(xué)界公認最可靠、最權(quán)威的、可以反映有病或無病實際情況的診最權(quán)威的、可以反映有病或無病實際情況的診斷方法稱為斷方法稱為金標準(金標準(gold

14、standard),是診斷是診斷疾病的最可靠的方法,也稱為標準診斷。疾病的最可靠的方法,也稱為標準診斷?;罨? /尸檢尸檢手術(shù)發(fā)現(xiàn)手術(shù)發(fā)現(xiàn)微生物培養(yǎng)微生物培養(yǎng)特殊檢查特殊檢查影像診斷影像診斷長期隨訪的結(jié)果長期隨訪的結(jié)果應(yīng)注意應(yīng)注意:金標準會隨著醫(yī)學(xué)的發(fā)展不斷更新,如:金標準會隨著醫(yī)學(xué)的發(fā)展不斷更新,如金標準選擇不當(dāng),則可造成金標準選擇不當(dāng),則可造成錯誤分類偏錯誤分類偏倚倚,影響對試驗的正確評價。,影響對試驗的正確評價。一些較難診斷的疾病可能沒有真正意義上的一些較難診斷的疾病可能沒有真正意義上的金標準,或金標準復(fù)雜且昂貴、甚至使受檢者遭金標準,或金標準復(fù)雜且昂貴、甚至使受檢者遭受痛苦或冒一定風(fēng)險

15、,此時可選一種相對公認的受痛苦或冒一定風(fēng)險,此時可選一種相對公認的診斷方法作金標準,但要考慮此類金標準的假陽診斷方法作金標準,但要考慮此類金標準的假陽性率和假陰性率。性率和假陰性率。(二)選擇研究對象(二)選擇研究對象用于評價診斷試驗和篩檢試驗的研究對象,應(yīng)能代用于評價診斷試驗和篩檢試驗的研究對象,應(yīng)能代表篩檢試驗和診斷試驗可能應(yīng)用到的表篩檢試驗和診斷試驗可能應(yīng)用到的目標人群目標人群。因此,篩。因此,篩檢的研究對象應(yīng)從社區(qū)人群中選擇,診斷試驗的研究對象檢的研究對象應(yīng)從社區(qū)人群中選擇,診斷試驗的研究對象應(yīng)從可疑人群或高危人群中選擇。應(yīng)從可疑人群或高危人群中選擇。 用金標準確診用金標準確診有病有病

16、的病例,應(yīng)包含典型的、不的病例,應(yīng)包含典型的、不典型病例,早、中、晚期病例,輕、中、重病例、有和無典型病例,早、中、晚期病例,輕、中、重病例、有和無并發(fā)癥的患者。并發(fā)癥的患者。代表性代表性使評價結(jié)果具有普遍意義。來自男性、年輕使評價結(jié)果具有普遍意義。來自男性、年輕人群的試驗評價結(jié)果一般不能適用于女性、老年人群。人群的試驗評價結(jié)果一般不能適用于女性、老年人群。 (三)樣本大小的計算(三)樣本大小的計算待評試驗的靈敏度待評試驗的靈敏度待評試驗的特異度待評試驗的特異度顯著性檢驗水平顯著性檢驗水平,一般為,一般為0.05容許誤差容許誤差,一般為,一般為0.050.10 當(dāng)靈敏度和特異度均接近當(dāng)靈敏度和

17、特異度均接近50%時,可用近似公式時,可用近似公式 21znpp待評價方法的靈敏待評價方法的靈敏度或特異度度或特異度正態(tài)分布中累積概率正態(tài)分布中累積概率等于等于2 2時的時的值值( (雙側(cè)雙側(cè)) ) 此公式適用于此公式適用于p接近接近50%時,當(dāng)預(yù)期的靈敏度或特異度小于時,當(dāng)預(yù)期的靈敏度或特異度小于20%或或大于大于80時,需對靈敏度或特異度的估計值做平方根反正弦轉(zhuǎn)換。時,需對靈敏度或特異度的估計值做平方根反正弦轉(zhuǎn)換。 (四)同步盲法測試(四)同步盲法測試對用金標準所確定的病例組與非病對用金標準所確定的病例組與非病例組的研究對象,用待評價試驗進行例組的研究對象,用待評價試驗進行同同步盲法測試。

18、步盲法測試。(五)整理分析資料(五)整理分析資料 待評價待評價 試驗試驗 金標準確診金標準確診合計合計 病例病例非病例非病例陽性陽性a(真陽性)b(假陽性)a+b陰性陰性c(假陰性)d(真陰性)c+d合計合計a+cb+dn表表1 1 評價試驗的整理表評價試驗的整理表在收集和分析試驗資料時,盲法的使用具在收集和分析試驗資料時,盲法的使用具有非常重要的意義,可以減少人為的主觀偏差。有非常重要的意義,可以減少人為的主觀偏差。假設(shè)未實施盲法,研究者可能對同樣可疑假設(shè)未實施盲法,研究者可能對同樣可疑的結(jié)果,傾向于將金標準確診的病人判斷為試的結(jié)果,傾向于將金標準確診的病人判斷為試驗陽性,金標準診斷為非病人

19、的判斷為試驗陰驗陽性,金標準診斷為非病人的判斷為試驗陰性,這樣就會性,這樣就會過高估計待評價試驗的價值。過高估計待評價試驗的價值。(六)質(zhì)量控制(六)質(zhì)量控制 除采用同步盲法測試以保證結(jié)果的真實性外,除采用同步盲法測試以保證結(jié)果的真實性外,對試驗所用的儀器型號、試驗條件、試驗方法、所對試驗所用的儀器型號、試驗條件、試驗方法、所用試劑的質(zhì)量、標號等要統(tǒng)一、標準化,盡量采用用試劑的質(zhì)量、標號等要統(tǒng)一、標準化,盡量采用客觀指標,對調(diào)查員要進行嚴格培訓(xùn),將誤差減小客觀指標,對調(diào)查員要進行嚴格培訓(xùn),將誤差減小到最低。到最低。二、試驗評價的指標二、試驗評價的指標(一)真實性(一)真實性(validity,

20、效度,效度)指測量值與實際值(金標準)相符合的程指測量值與實際值(金標準)相符合的程度,故又稱準確性度,故又稱準確性(accuracy)靈敏度靈敏度(sensitivity)與假陰性率與假陰性率(false negative rate)特異度特異度(specificity)與假陽性率與假陽性率(false positive rate)約登指數(shù)(約登指數(shù)(Youdens index )粗一致性(粗一致性(crude agreement) 靈敏度靈敏度又稱敏感度或真陽性率,指金標準確診的病例中待又稱敏感度或真陽性率,指金標準確診的病例中待評價試驗也判斷為陽性者所占的百分比。它可反映待評評價試驗也判

21、斷為陽性者所占的百分比。它可反映待評價試驗?zāi)軐嶋H患病的病例正確地判斷為價試驗?zāi)軐嶋H患病的病例正確地判斷為患患某病的能力。某病的能力。理想值應(yīng)為理想值應(yīng)為100%。 式中式中n為實際患病人數(shù),即計算靈敏度的分母。為實際患病人數(shù),即計算靈敏度的分母。 nSenSenSEsen)1 ()(%100caa靈敏度特異度特異度又稱真陰性率,指金標準確診的非病例中待評價試驗又稱真陰性率,指金標準確診的非病例中待評價試驗也判斷為陰性者所占的百分比。它可反映待評價試驗?zāi)軐⒁才袛酁殛幮哉咚嫉陌俜直?。它可反映待評價試驗?zāi)軐嶋H未患某病的研究對象正確地判斷為未患某病的能力。實際未患某病的研究對象正確地判斷為未患

22、某病的能力。理想值也應(yīng)為理想值也應(yīng)為100%。式中式中n為實際無病人數(shù),即計算特異度的分母。為實際無病人數(shù),即計算特異度的分母。 %100dbd特異度nSpeSpeSESpe)1 ()(假陰性率假陰性率 又稱漏診率又稱漏診率, ,是指金標準確診的病例中待是指金標準確診的病例中待評價試驗錯判為陰性者所占的百分比,理想值評價試驗錯判為陰性者所占的百分比,理想值也應(yīng)為也應(yīng)為0%0%,漏診率,漏診率=1=1靈敏度。靈敏度越高,靈敏度。靈敏度越高,漏診率越低。漏診率越低。 %100cac假陰性率假陽性率假陽性率 又稱誤診率,是指金標準確診的非病例中又稱誤診率,是指金標準確診的非病例中待評價試驗錯判為陽性

23、者所占的百分比,理想待評價試驗錯判為陽性者所占的百分比,理想值應(yīng)為值應(yīng)為0%,誤診率,誤診率=1特異度。特異度越高,特異度。特異度越高,誤診率越低。誤診率越低。%100dbb假陽性率 靈敏度與特異度是評價試驗靈敏度與特異度是評價試驗真實性真實性的兩個基本指標。臨床上,病人和醫(yī)生的兩個基本指標。臨床上,病人和醫(yī)生都希望獲得高靈敏度和高特異度的診斷都希望獲得高靈敏度和高特異度的診斷試驗或篩檢試驗,即盡可能沒有漏診和試驗或篩檢試驗,即盡可能沒有漏診和誤診,但大多數(shù)情況下是難以達到的。誤診,但大多數(shù)情況下是難以達到的。 因為許多試驗是用定量或半定量方法判定陽因為許多試驗是用定量或半定量方法判定陽性與陰

24、性,而患者與非患者的測量值多不能截然性與陰性,而患者與非患者的測量值多不能截然分開,有重疊現(xiàn)象,故靈敏度與特異度之間往往分開,有重疊現(xiàn)象,故靈敏度與特異度之間往往顧此失彼。顧此失彼。 往往往往提高了試驗的靈敏度卻降低了試驗的特提高了試驗的靈敏度卻降低了試驗的特異度異度,而,而提高了試驗的特異度卻又降低了試驗的提高了試驗的特異度卻又降低了試驗的靈敏度靈敏度,下圖說明了兩者的關(guān)系,當(dāng)判斷標準移,下圖說明了兩者的關(guān)系,當(dāng)判斷標準移向向B B時,提高了特異度降低了靈敏度,當(dāng)判斷標準時,提高了特異度降低了靈敏度,當(dāng)判斷標準移向移向A A時,提高了靈敏度降低了特異度。時,提高了靈敏度降低了特異度。圖圖5

25、人群中血清鈣水平的分布圖人群中血清鈣水平的分布圖 約登指數(shù)約登指數(shù)也稱正確指數(shù)也稱正確指數(shù) 是靈敏度與特異度之和減去是靈敏度與特異度之和減去1表示試驗方法發(fā)現(xiàn)真正病人與非病人的總能力表示試驗方法發(fā)現(xiàn)真正病人與非病人的總能力范圍在范圍在01之間,指數(shù)越大,其真實性越高之間,指數(shù)越大,其真實性越高粗一致性粗一致性是指試驗所檢出的真陽性和真陰性例數(shù)之和占受試人是指試驗所檢出的真陽性和真陰性例數(shù)之和占受試人數(shù)的百分比。它反映試驗結(jié)果與金標準診斷結(jié)果的符合程數(shù)的百分比。它反映試驗結(jié)果與金標準診斷結(jié)果的符合程度。度。 %100dcbada粗一致性表表2 2 人群某病患病狀況與試驗結(jié)果的關(guān)系(虛擬數(shù)據(jù))人群

26、某病患病狀況與試驗結(jié)果的關(guān)系(虛擬數(shù)據(jù)) %00.60%1002012%100 caa靈敏度%00.95%1006057%100 dbd特異度表示在無甲狀旁腺功能亢進的人中血清鈣試驗陰性或正常者占表示在無甲狀旁腺功能亢進的人中血清鈣試驗陰性或正常者占95.00。 表示在甲狀旁腺功能亢進確診的病人中血清鈣試驗陽性或異常者占表示在甲狀旁腺功能亢進確診的病人中血清鈣試驗陽性或異常者占60.00。 %00.40%100208%100 cac假陰性率(漏診率)%00. 5%100603%100 dbb假陽性率(誤診率)表示在甲狀旁腺功能亢進確診的病人中血清鈣試驗陰性或正常者占表示在甲狀旁腺功能亢進確診的

27、病人中血清鈣試驗陰性或正常者占40.00。 表示在無甲狀旁腺功能亢進的人中血清鈣試驗陽性或異常者占表示在無甲狀旁腺功能亢進的人中血清鈣試驗陽性或異常者占5.00。約登指數(shù)約登指數(shù)=(0.60+0.95)-1=0.55%25.86%100805712%100dcbada粗一致性(符合率)表示血清鈣試驗陽性和陰性結(jié)果均正確的概率是表示血清鈣試驗陽性和陰性結(jié)果均正確的概率是86.25。 (二)評價試驗的可靠性(二)評價試驗的可靠性 (reliability) 也稱信度、精確度也稱信度、精確度(precision)或可重復(fù)性或可重復(fù)性(repeatability) ,指在相同條件下用某測量工具,指在相

28、同條件下用某測量工具(如待評如待評試試驗驗)重復(fù)測量同一受試者時獲得相同結(jié)果的穩(wěn)定程度。重復(fù)測量同一受試者時獲得相同結(jié)果的穩(wěn)定程度。影響試驗可靠性的因素影響試驗可靠性的因素 受試對象自身生物學(xué)差異受試對象自身生物學(xué)差異觀察者差異觀察者差異 試驗方法的差異試驗方法的差異 評價試驗可靠性的指標評價試驗可靠性的指標標準差標準差變異系數(shù)變異系數(shù)(CV) 符合率符合率(agreement/consistency rate) Kappa值值 %100測定值均數(shù)測定值均數(shù)的標準差變異系數(shù)符合率符合率 又稱一致率又稱一致率 是篩檢試驗判定的結(jié)果與標準診斷的結(jié)果是篩檢試驗判定的結(jié)果與標準診斷的結(jié)果相同的數(shù)占總受

29、檢人數(shù)的比例相同的數(shù)占總受檢人數(shù)的比例%100nda符合率表表3 可靠性評價的資料歸納表可靠性評價的資料歸納表然而僅僅通過符合率來評價篩檢或診斷試驗然而僅僅通過符合率來評價篩檢或診斷試驗的一致性是不全面的。的一致性是不全面的。 第一,符合率未表明結(jié)果不一致性的具體原第一,符合率未表明結(jié)果不一致性的具體原因:兩個觀察者所得的陽性結(jié)果和陰性結(jié)果是否因:兩個觀察者所得的陽性結(jié)果和陰性結(jié)果是否相同?還是其中一個觀察者更傾向于陽性結(jié)果?相同?還是其中一個觀察者更傾向于陽性結(jié)果? 第二,許多一致性是第二,許多一致性是由由偶然性造成偶然性造成的,然而的,然而符合率不能表明偶然性的大小。若要考慮機遇因符合率不

30、能表明偶然性的大小。若要考慮機遇因素對觀察一致性的影響,則需進行素對觀察一致性的影響,則需進行Kappa 分析。分析。 Kappa值值:是一個有用的測量分類變量的可靠性分:是一個有用的測量分類變量的可靠性分析指標,該值表示不同觀察者對同一批結(jié)果的判定和同析指標,該值表示不同觀察者對同一批結(jié)果的判定和同一觀察者在不同情況下對同一批結(jié)果判定的一致程度。一觀察者在不同情況下對同一批結(jié)果判定的一致程度。 Kappa值不同于觀察一致率,它在判斷兩次測量的值不同于觀察一致率,它在判斷兩次測量的一致性時,考慮了一致性時,考慮了機遇因素機遇因素對試驗一致性的影響。對試驗一致性的影響。)()()(A-NA-AK

31、appa22112211CC0NrcNrcNNrcNrcdaK)值()(2)()(22112211crcrNcrcrdaN200)()1 (/ )1 (CKPNPPSEKappa值的取值范圍為值的取值范圍為11,若若K為負數(shù),說明為負數(shù),說明觀察一致率比機遇造成的一致率還觀察一致率比機遇造成的一致率還要低要低;K=1,說明兩結(jié)果完全不一致。,說明兩結(jié)果完全不一致。K=0,表明觀察一致率完全是,表明觀察一致率完全是由機遇所致由機遇所致。如如K0,說明,說明觀察一致率比機遇所致的一致率高觀察一致率比機遇所致的一致率高;K=1,說明兩結(jié)果完全一致。,說明兩結(jié)果完全一致。Kappa值值越高一致性越好越

32、高一致性越好,0.2以下一致性可忽略以下一致性可忽略不計,不計,0.20.4較差一致性,較差一致性,0.40.6中度一致性,中度一致性,0.60.8較較好一致性,好一致性,0.8以上極好一致性。以上極好一致性。表表4 兩位臨床醫(yī)生對兩位臨床醫(yī)生對100名病人判定心臟雜音的一致性比較名病人判定心臟雜音的一致性比較Kappa值為值為0.78或或78%,表明兩位臨床醫(yī)生,表明兩位臨床醫(yī)生的診斷一致性較好。的診斷一致性較好。在評價試驗時應(yīng)注意,一個診斷試驗具有較在評價試驗時應(yīng)注意,一個診斷試驗具有較好的真實性,不一定具有較好的可靠性,而可靠好的真實性,不一定具有較好的可靠性,而可靠性較好,不一定有較好

33、的真實性。性較好,不一定有較好的真實性。真實性和可靠真實性和可靠性不是必定相關(guān)的性不是必定相關(guān)的。因此在選擇評價試驗時既要。因此在選擇評價試驗時既要考慮其真實性,又不能忽略其可靠性??紤]其真實性,又不能忽略其可靠性。 (三)評價試驗的收益(三)評價試驗的收益預(yù)測值預(yù)測值(predictive value) 反映應(yīng)用篩檢結(jié)果來估計受檢者患病和不反映應(yīng)用篩檢結(jié)果來估計受檢者患病和不患病可能性的大小的指標。患病可能性的大小的指標。陽性預(yù)測值陽性預(yù)測值(positive predictive value, PPV)陰性預(yù)測值陰性預(yù)測值(negative predictive value, NPV) P

34、PV 指試驗陽性結(jié)果中真正患病指試驗陽性結(jié)果中真正患病(真陽性真陽性)的比例的比例 NPV 指篩檢試驗陰性者不患目標疾病的可能性指篩檢試驗陰性者不患目標疾病的可能性 %100baa陽性預(yù)測值%100dcd陰性預(yù)測值試驗的預(yù)測值與試驗的靈敏度、特異試驗的預(yù)測值與試驗的靈敏度、特異度及受檢人群中所檢疾病的患病率有關(guān)。度及受檢人群中所檢疾病的患病率有關(guān)。在患病率一定時,試驗的靈敏度越高,陰在患病率一定時,試驗的靈敏度越高,陰性預(yù)測值越高;試驗的特異度越高,陽性性預(yù)測值越高;試驗的特異度越高,陽性預(yù)測值越高。靈敏度和特異度對陽性預(yù)測預(yù)測值越高。靈敏度和特異度對陽性預(yù)測值的影響較陰性預(yù)測值明顯。值的影響

35、較陰性預(yù)測值明顯。注:圖中實線為陽性預(yù)測值曲線,虛線為陰性預(yù)測值曲線,注:圖中實線為陽性預(yù)測值曲線,虛線為陰性預(yù)測值曲線, 較粗的曲線代表靈敏度和特異度均為較粗的曲線代表靈敏度和特異度均為95%時的預(yù)測值,時的預(yù)測值, 較細的曲線代表靈敏度和特異度均為較細的曲線代表靈敏度和特異度均為85%時的預(yù)測值時的預(yù)測值靈敏度越高,陰性預(yù)測值越高靈敏度越高,陰性預(yù)測值越高特異度越高,陽性預(yù)測值越高特異度越高,陽性預(yù)測值越高圖圖 6 預(yù)測值與和患病率、靈敏度和特異度的關(guān)系預(yù)測值與和患病率、靈敏度和特異度的關(guān)系似然比(似然比(likelihood ratiolikelihood ratio)是指病例組中某種試

36、驗結(jié)果出現(xiàn)的概率與非是指病例組中某種試驗結(jié)果出現(xiàn)的概率與非病例組中該試驗結(jié)果出現(xiàn)的概率之比。因試驗結(jié)病例組中該試驗結(jié)果出現(xiàn)的概率之比。因試驗結(jié)果有陰陽之分,所以似然比也有陽性似然比和陰果有陰陽之分,所以似然比也有陽性似然比和陰性似然比。性似然比。 陽性似然比陽性似然比(positive likelihood ratio,LR+):):是指試驗結(jié)果是指試驗結(jié)果真陽性率與假陽性率真陽性率與假陽性率之比,說之比,說明病人中出現(xiàn)某種試驗結(jié)果陽性的概率是非病人明病人中出現(xiàn)某種試驗結(jié)果陽性的概率是非病人的多少倍。其值越大,試驗結(jié)果陽性者為真陽性的多少倍。其值越大,試驗結(jié)果陽性者為真陽性的概率越大。一個診斷

37、價值高的試驗,的概率越大。一個診斷價值高的試驗,LR+應(yīng)顯應(yīng)顯著高于著高于1。特異度靈敏度假陽性率真陽性率陽性似然比1陰性似然比陰性似然比(negative likelihood ratio,LR-):): 是指試驗結(jié)果是指試驗結(jié)果假陰性率與真陰性率假陰性率與真陰性率之比,說之比,說明病人中出現(xiàn)某種試驗結(jié)果陰性的概率是非病人明病人中出現(xiàn)某種試驗結(jié)果陰性的概率是非病人的多少倍。其值越小,試驗結(jié)果陰性者為真陰性的多少倍。其值越小,試驗結(jié)果陰性者為真陰性的可能性越大。的可能性越大。 特異度靈敏度真陰性率假陰性率陰性似然比1如果如果LR+值大,值大,LR-值小,該試驗是個理想值小,該試驗是個理想的試驗

38、。試驗分析時可以計算的試驗。試驗分析時可以計算LR+和和LR-的比值,的比值,來評價試驗的陽性和陰性。來評價試驗的陽性和陰性。LR+/LR-為為12.0/0.42 ,等于,等于28.5,這個數(shù)值,這個數(shù)值沒有預(yù)期的高(一般沒有預(yù)期的高(一般50試驗效果弱)。如果數(shù)試驗效果弱)。如果數(shù)據(jù)來源于據(jù)來源于22表,可以通過計算比值比表,可以通過計算比值比(ad/bc=33.48)得到相同的結(jié)果。)得到相同的結(jié)果。 由于各級醫(yī)院的診治水平不同,以及各地區(qū)由于各級醫(yī)院的診治水平不同,以及各地區(qū)疾病的患病率也有差異,故到不同醫(yī)院就診的人疾病的患病率也有差異,故到不同醫(yī)院就診的人員中患病率差別也較大。因此在一

39、所醫(yī)院或一個員中患病率差別也較大。因此在一所醫(yī)院或一個地區(qū)進行的診斷試驗評價,地區(qū)進行的診斷試驗評價,其預(yù)測值不能外延至其預(yù)測值不能外延至其他級別或其他地區(qū)的醫(yī)院其他級別或其他地區(qū)的醫(yī)院。而似然比的計算不。而似然比的計算不受患病率的影響,受患病率的影響,只與靈敏度和特異度有關(guān)只與靈敏度和特異度有關(guān),雖,雖然不如預(yù)測值直觀,但在醫(yī)院評價診斷試驗時不然不如預(yù)測值直觀,但在醫(yī)院評價診斷試驗時不失為一種有效方法。失為一種有效方法。驗后概率(驗后概率(post-test probability) 進行診斷試驗的目的是提高對疾病診斷的準進行診斷試驗的目的是提高對疾病診斷的準確性,及時進行合理的治療。因此,

40、臨床醫(yī)生應(yīng)確性,及時進行合理的治療。因此,臨床醫(yī)生應(yīng)善于估計就診個體患病的驗后概率,即診斷試驗善于估計就診個體患病的驗后概率,即診斷試驗為陽性(或陰性)時研究對象患某病(或未患某為陽性(或陰性)時研究對象患某?。ɑ蛭椿寄巢。┑母怕?。?。┑母怕省?驗前比驗前比=驗前概率驗前概率/(1驗前概率)驗前概率) 驗后比驗后比=驗前比驗前比LR+ 驗后概率驗后概率=驗后比驗后比/(1+驗后比)驗后比) 在診斷試驗中,如果患病率為驗前概率,那在診斷試驗中,如果患病率為驗前概率,那么陽性預(yù)測值即為驗后概率。診斷試驗的似然比么陽性預(yù)測值即為驗后概率。診斷試驗的似然比綜合了靈敏度、特異度的信息,在已知患病率與綜合

41、了靈敏度、特異度的信息,在已知患病率與似然比的情況下,可以根據(jù)診斷試驗特定測量值似然比的情況下,可以根據(jù)診斷試驗特定測量值相應(yīng)的似然比計算驗后比,從而準確地估計單個相應(yīng)的似然比計算驗后比,從而準確地估計單個病人的患病概率,以幫助臨床醫(yī)生進行診斷決策。病人的患病概率,以幫助臨床醫(yī)生進行診斷決策。 例:患者男,例:患者男,60歲,有間歇性的胸前絞痛,當(dāng)?shù)蒯t(yī)生懷歲,有間歇性的胸前絞痛,當(dāng)?shù)蒯t(yī)生懷疑心肌梗死,根據(jù)該病病例統(tǒng)計,此年齡段有該癥疑心肌梗死,根據(jù)該病病例統(tǒng)計,此年齡段有該癥狀的男性患心肌梗死可能性為狀的男性患心肌梗死可能性為60%。實驗室進一步。實驗室進一步作血清肌酸激酶檢查,結(jié)果為異常。血

42、清肌酸激酶作血清肌酸激酶檢查,結(jié)果為異常。血清肌酸激酶試驗的靈敏度為試驗的靈敏度為90%,特異度為,特異度為83%。該患者患急。該患者患急性心肌梗死的概率是多少?性心肌梗死的概率是多少? 驗前概率驗前概率=患病率患病率=0.60 驗前比驗前比=驗前概率驗前概率/(1驗前概率)驗前概率)=0.60/(1-0.60)=1.5 陽性似然比陽性似然比=真陽性率真陽性率/假陽性率假陽性率=0.9/(1-0.83)=5.3 驗后比驗后比=驗前比驗前比LR+=1.55.3=7.95 驗后概率驗后概率=驗后比驗后比/(1驗后比)驗后比)=7.95/(1+7.95)=0.8883 該患者在血清肌酸激酶試驗陽性后

43、,患該患者在血清肌酸激酶試驗陽性后,患急性心肌梗死概率比驗前概率明顯上升,為急性心肌梗死概率比驗前概率明顯上升,為88.83%,因此,對該患者患急性心肌梗死,因此,對該患者患急性心肌梗死的診斷有的診斷有88.83%的把握。的把握。三、試驗陽性結(jié)果截斷值的確定三、試驗陽性結(jié)果截斷值的確定 截斷值(截斷值( cut off value)是判定試)是判定試驗陽性與陰性的界值,即確定某項指驗陽性與陰性的界值,即確定某項指標的正常值,以區(qū)分正常與異常。標的正常值,以區(qū)分正常與異常。 理想的篩檢試驗理想的篩檢試驗 靈敏度、特異度均應(yīng)接靈敏度、特異度均應(yīng)接近近100%。 但在實際工作中很難達到,往往表現(xiàn)為但

44、在實際工作中很難達到,往往表現(xiàn)為靈敏度靈敏度則特異度則特異度。兩者高低的轉(zhuǎn)換與確定篩檢試驗陽性結(jié)兩者高低的轉(zhuǎn)換與確定篩檢試驗陽性結(jié)果的截斷值果的截斷值(cut off point)或臨界點的選擇密或臨界點的選擇密切相關(guān)。切相關(guān)。圖圖7 7 病人與非病人觀測值分布類型病人與非病人觀測值分布類型確定截斷值的方法有多種,如均數(shù)確定截斷值的方法有多種,如均數(shù)2倍標準差法、百分位數(shù)法、從治療和倍標準差法、百分位數(shù)法、從治療和預(yù)防的實際應(yīng)用出發(fā)確定截斷值等,但預(yù)防的實際應(yīng)用出發(fā)確定截斷值等,但在常規(guī)情況下,即靈敏度、特異度均很在常規(guī)情況下,即靈敏度、特異度均很重要的情況下,最常用的還是受試者工重要的情況下

45、,最常用的還是受試者工作特征曲線法。作特征曲線法。定義定義 用真陽性率和假陽性率作圖得出的用真陽性率和假陽性率作圖得出的曲線,可反映靈敏度和特異度的關(guān)系曲線,可反映靈敏度和特異度的關(guān)系 受試者工作特性曲線受試者工作特性曲線 ( Receiver operator characteristic curve, ROC )表表5 5 糖尿病血糖試驗不同血糖水平的靈糖尿病血糖試驗不同血糖水平的靈敏度和特異度分布敏度和特異度分布餐后餐后2小時血糖小時血糖mg/100ml靈敏度(靈敏度(%)特異度(特異度(%)7098.6 8.8 8097.1 25.5 9094.3 47.6 10088.6 69.8

46、11085.7 84.1 12071.4 92.5 13064.3 96.9 14057.1 99.4 15050.0 99.6 16047.1 99.8 17042.9 100.0 18038.6 100.0 19034.3 100.0 20027.1 100.0 圖圖8 8 糖尿病血糖試驗的糖尿病血糖試驗的ROC曲線曲線橫軸表示假陽橫軸表示假陽性率性率(1-(1-特異度特異度) )縱軸表示真陽縱軸表示真陽性率性率( (靈敏度靈敏度)點代表篩檢試驗的特定陽性標準點代表篩檢試驗的特定陽性標準值相對應(yīng)的靈敏度和特異度對子值相對應(yīng)的靈敏度和特異度對子 最理想最理想ROC曲線是縱坐標垂直上升,橫坐標

47、曲線是縱坐標垂直上升,橫坐標緩慢增加,如圖緩慢增加,如圖9最上方的曲線(最優(yōu)曲線)。若最上方的曲線(最優(yōu)曲線)。若計算所得的靈敏度總與假陽性率相同,那么所得計算所得的靈敏度總與假陽性率相同,那么所得的的ROC曲線為一條從左下角到右上角的對角線,曲線為一條從左下角到右上角的對角線,即圖即圖9中最下方的線(無意義線)。中最下方的線(無意義線)。臨床試驗中,所得的臨床試驗中,所得的ROC曲線一般位于兩者曲線一般位于兩者之間,如圖之間,如圖9中所標記出的較優(yōu)曲線和一般曲線。中所標記出的較優(yōu)曲線和一般曲線。 ROC曲線也可用來比較兩種和兩種以上診斷曲線也可用來比較兩種和兩種以上診斷試驗的診斷價值,從而幫

48、助臨床醫(yī)師作出最佳選試驗的診斷價值,從而幫助臨床醫(yī)師作出最佳選擇。擇。圖圖9 ROC曲線曲線 % %ROC曲線在各領(lǐng)域運用的十分廣泛。其中一種方法就曲線在各領(lǐng)域運用的十分廣泛。其中一種方法就是通過比較各是通過比較各ROC曲線下的面積曲線下的面積來進行顯著性檢驗。曲線來進行顯著性檢驗。曲線下面積越大,試驗的診斷價值就越高。下面積越大,試驗的診斷價值就越高。在圖在圖10中,中,ROC曲線為對角狀的無效曲線(靈敏度與曲線為對角狀的無效曲線(靈敏度與假陽性率相同)下的面積為假陽性率相同)下的面積為50%,50歲病例組的曲線下歲病例組的曲線下面積約為面積約為60%,50歲病例組的曲線面積可占歲病例組的曲

49、線面積可占90%。因此,在得到病理報告前,因此,在得到病理報告前,50歲病人的腫瘤直徑大歲病人的腫瘤直徑大小對臨床醫(yī)生決定是否要摘除腫瘤更具有指導(dǎo)意義,而對小對臨床醫(yī)生決定是否要摘除腫瘤更具有指導(dǎo)意義,而對年輕的病人來說,意義不大。年輕的病人來說,意義不大。圖圖10 濾泡型甲狀旁腺腫瘤直徑大小與腫瘤惡性有關(guān)的濾泡型甲狀旁腺腫瘤直徑大小與腫瘤惡性有關(guān)的ROC曲線曲線 %優(yōu)化試驗方法優(yōu)化試驗方法聯(lián)合試驗的應(yīng)用聯(lián)合試驗的應(yīng)用選擇患病率高的人群作為受試對象選擇患病率高的人群作為受試對象第三節(jié) 提高試驗效率的方法 聯(lián)合試驗聯(lián)合試驗 在實施篩檢時,可采用多項篩檢試驗檢查同一受試對象,在實施篩檢時,可采用多項篩檢試驗檢查同一受試對象,以提高篩檢的靈敏度或特異度,增加篩檢的收益,這種方以提高篩檢的靈敏度或特異度,增加篩檢的收益,這種方式稱為聯(lián)合試驗。式稱為聯(lián)合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論