ROC曲線的統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告要點(diǎn)_第1頁(yè)
ROC曲線的統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告要點(diǎn)_第2頁(yè)
ROC曲線的統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告要點(diǎn)_第3頁(yè)
ROC曲線的統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告要點(diǎn)_第4頁(yè)
ROC曲線的統(tǒng)計(jì)學(xué)實(shí)驗(yàn)報(bào)告要點(diǎn)_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、上海大學(xué) 2014 2015 學(xué)年秋 季學(xué)期研究生課程報(bào)告課程名稱:生物醫(yī)學(xué)測(cè)量及儀器課程編號(hào):07SBE7002論文題目 :基于甲胎蛋白診斷肝癌的ROC曲線繪制及AUC計(jì)算研究生姓名:廖小金學(xué) 號(hào):14723542論文評(píng)語(yǔ) :成 績(jī):評(píng)閱日期 :任課教師 :摘要在檢驗(yàn)?zāi)骋晃镔|(zhì)對(duì)疾病的診斷效果時(shí),ROC曲線是一個(gè)重要的統(tǒng)計(jì)學(xué)分析方法。其以真陽(yáng)率作為縱坐標(biāo),假陽(yáng)率作為橫坐標(biāo),隨診斷臨界值的移動(dòng)而形成一條連續(xù)的曲線。曲線下的面積AUC是判斷診斷效果的一個(gè)依據(jù),面積越接近于1效果越好。顯著性差異可以幫助判斷樣本是否來(lái)自同一總體,也可以因此評(píng)價(jià)診斷方法的效果。AbstractIn the examin

2、ation of the effect of a substance for the diagnosis ofa disease, ROC curve is a significant statistic analysis. It set thetruepositive rate as ordinate, thefalse positiverate as the horizontalaxis,and forms a continuous curve with the change of diagnostic threshold .AUC areaunder the curveis a para

3、meterfor judging the effect ofdiagnosis,and the more itcloses to 1 ,the better effect it implies.Significant difference can help judge whether the samples are from the same population, and therefore can also evaluate the effectiveness of the diagnostic method.- 1 -第一章 概論1.1 甲胎蛋白與肝癌甲胎蛋白是一種糖蛋白,主要來(lái)自胚胎的

4、肝細(xì)胞,胎兒出生后約兩周甲胎蛋白從血液中消失,因此正常人血清中甲胎蛋白的含量尚不到 20 微克 / 升。但當(dāng)肝細(xì)胞發(fā)生癌變時(shí),卻又恢復(fù)了產(chǎn)生這種蛋白質(zhì)的功能,而且隨著病情惡化它在血清中的含量會(huì)急劇增加,甲胎蛋白就成了診斷原發(fā)性肝癌的一個(gè)特異性臨床指標(biāo)。過(guò)去一直認(rèn)為是診斷原發(fā)性肝癌的特異性腫瘤標(biāo)志物,具有確立診斷、早期診斷、鑒別診斷的作用。大量的臨床卻發(fā)現(xiàn),部分肝硬化病人會(huì)長(zhǎng)期出現(xiàn) AFP 達(dá)到上千,但多年都沒(méi)有肝癌的跡象; 同時(shí)發(fā)現(xiàn)約 20%的晚期肝癌病人, 直至病故前, AFP 仍不超過(guò) 10。也就是說(shuō),盡管甲胎蛋白是檢驗(yàn)肝癌的有效的指標(biāo),但肝癌患者不一定甲胎蛋白檢驗(yàn)呈陽(yáng)性( 80%呈陽(yáng)性)

5、,而 AFP檢驗(yàn)呈陽(yáng)性的人也不一定是肝癌患者。這就涉及到對(duì)診斷試驗(yàn)評(píng)價(jià)的問(wèn)題,我們課程中所學(xué)的假設(shè)檢驗(yàn)、ROC曲線繪制及 AUC計(jì)算正是針對(duì)這類問(wèn)題的方法之一。1.2 診斷試驗(yàn)的評(píng)價(jià)指標(biāo)顯著性差異顯著性差異是檢驗(yàn)假設(shè)是否合理的一個(gè)方法。例如在本項(xiàng)目中,用甲胎蛋白作為肝癌的診斷指標(biāo),若這兩組實(shí)際數(shù)據(jù)有顯著性差異,基于此,它們所來(lái)自的各自的總體不具有顯著性差異的概率 p 是多少? p 達(dá)到一個(gè)足夠小的值時(shí), 認(rèn)為總體具有顯著性差異,以此說(shuō)明甲胎蛋白作為診斷指標(biāo)是一個(gè)有力的依據(jù)。一般取這個(gè)足夠小的值為 0.05 或 0.01 ,本項(xiàng)目中取 0.05 。- 2 -ROC曲線如上圖所示,在評(píng)價(jià)診斷試驗(yàn)時(shí)

6、,患者中被診斷試驗(yàn)正確判斷為陽(yáng)性的比例亦叫真陽(yáng)性率 (true positive rate, TPR) ,也稱靈敏度;非患者中被診斷試驗(yàn)正確判斷為陰性的比例亦叫真陰性率 (true negative rate, TNR) ,也稱特異性;患者被診斷試驗(yàn)錯(cuò)誤地判斷為陰性的比例稱為假陰性;非患者被錯(cuò)誤地診斷為陽(yáng)性的比例稱為假陽(yáng)率。而ROC 曲線是以靈敏度為縱軸,假陽(yáng)率為橫軸,通過(guò)不同的診斷臨界值的移動(dòng)繪制而成的曲線。多條曲線進(jìn)行比較時(shí),曲線下的面積越大,說(shuō)明診斷越準(zhǔn)確。將繪成的曲線與斜45 度的直線對(duì)比,若差不多重合 ,說(shuō)明自變量對(duì)因變量的判定價(jià)值很差,若越遠(yuǎn)離斜45 度的直線 ,說(shuō)明自變量對(duì)因變量

7、的判定價(jià)值越好。分析單個(gè)曲線時(shí),越靠近左上角的點(diǎn)所對(duì)應(yīng)的診斷臨界值越好,例如本項(xiàng)目中的。1.3 項(xiàng)目數(shù)據(jù):測(cè)得正常人及肝病患者的甲胎蛋白(AFP)水平如下,分作兩組(肝癌、非肝癌)。肝癌組 (17 人,ug/L): 5.2, 3.2, 20.7, 40.2, 50.2, 100.7, 1030.2, 800.7, 400.5, 90.2, 19.3,6.2, 32.1, 8.4, 25.3, 83.8, 37.4非肝癌組 (20 人,ug/L) :0.8, 1.5, 3.2, 10.7, 20.8, 21.4, 5.2, 2.3, 7.2, 4.3, 9.2, 15.1, 3.4, 5.1,4

8、.3, 5.6, 6.2, 22.3, 25.2, 18.21.檢驗(yàn)肝癌組與非肝癌組的甲胎蛋白水平是否有顯著性差異。2.繪制用 AFP 診斷肝癌的 ROC 曲線,并計(jì)算曲線下面積(AUC) ,確定最優(yōu)的- 3 -診斷臨界值。第二章判斷顯著性差異2.1 正態(tài)檢驗(yàn) lillietest顯著性差異的檢驗(yàn)有多種方法,其中常見(jiàn)的t 檢驗(yàn)是針對(duì)正態(tài)分布的檢驗(yàn),而我們的兩組數(shù)據(jù)并不能確定是服從正態(tài)分布,因此需要先進(jìn)行正態(tài)分布檢驗(yàn)。利用 Lilliefors test函數(shù):H,P,LSTAT,CV=lillietest(A);h,p,lstat,cv=lillietest(B);結(jié)果顯示H=1,h=1,說(shuō)明這

9、兩組數(shù)據(jù)不服從正態(tài)分布,因此不能用t檢驗(yàn)而選用Kruskal Wallis秩和檢驗(yàn)2.2 秩和檢驗(yàn)調(diào)用 Kruskal Wallis函數(shù)p=kruskalwallis(C,group,off);結(jié)果顯示 p=3.8332e-04,pabs(zc(max)max=i;w=i;endendhold on;plot(xb(w),ya(w),b*);得到的最優(yōu)診斷臨界值是25.2ug/L.- 6 -第四章使用 SPSS輸入數(shù)據(jù):.3.1 正態(tài)檢驗(yàn)- 7 -3.2 顯著性差異檢驗(yàn)用 Mann-Whitney U 檢驗(yàn):兩組之間有顯著性差異。- 8 -3.3 繪制 ROC曲線并計(jì)算 AUC:- 9 -結(jié)果

10、:曲線下的面積檢驗(yàn)結(jié)果變量 :AFP漸近 95%置信區(qū)間面積標(biāo)準(zhǔn)誤 a漸進(jìn) Sig.b下限上限.843.068.000.710.976檢驗(yàn)結(jié)果變量:AFP 在正的和負(fù)的實(shí)際狀態(tài)組之間至少有一個(gè)結(jié)。統(tǒng)計(jì)量可能會(huì)出現(xiàn)偏差。a. 在非參數(shù)假設(shè)下b. 零假設(shè):實(shí)面積 = 0.5- 10 -第四章結(jié)論與總結(jié)由第一步檢驗(yàn)顯著性差異可以知道,這兩組數(shù)據(jù)存在顯著性差異,說(shuō)明甲胎蛋白用于診斷肝癌是有一定可靠性的。 由 ROC曲線計(jì)算所得的面積 AUC0.5,并且接近于 1,可知診斷效果較好。 計(jì)算真陽(yáng)率和假陽(yáng)率之差得到本項(xiàng)目中最優(yōu)診斷臨界值是 25.2ug/L 。在本項(xiàng)目實(shí)踐中,學(xué)習(xí)了利用 MATLAB編程和 SPSS軟件進(jìn)行統(tǒng)計(jì)分析,收獲不少。統(tǒng)計(jì)學(xué)分析的方法和思想對(duì)于科學(xué)研究有著重要的意義,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論