12213088朱紹軍開(kāi)題報(bào)告_第1頁(yè)
12213088朱紹軍開(kāi)題報(bào)告_第2頁(yè)
12213088朱紹軍開(kāi)題報(bào)告_第3頁(yè)
12213088朱紹軍開(kāi)題報(bào)告_第4頁(yè)
12213088朱紹軍開(kāi)題報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

經(jīng)典word整理文檔,僅參考,雙擊此處可刪除頁(yè)眉頁(yè)腳。本資料屬于網(wǎng)絡(luò)整理,如有侵權(quán),請(qǐng)聯(lián)系刪除,謝謝!北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文)開(kāi)題報(bào)告題目:受試者操作特征曲線的繪制與原理演示學(xué)院:電信專(zhuān)業(yè):電子科學(xué)與技術(shù)學(xué)生姓名:朱紹軍學(xué)號(hào):12213088ROC是受試者工作特征(ReceiverOperatingCharacteristic)或相對(duì)工作特征(RelativeOperatingCharacteristic)的縮寫(xiě)。ROC分析技術(shù)于五十年代起源于統(tǒng)計(jì)決策理論,用來(lái)說(shuō)明分類(lèi)器命中率和誤報(bào)警率之間的關(guān)系,最早在第二次世界大戰(zhàn)中應(yīng)用于雷達(dá)信號(hào)觀察能力的評(píng)價(jià),后來(lái)使用在晶體管的相關(guān)研究中。六十年代中期,ROC開(kāi)始應(yīng)用于實(shí)驗(yàn)心理學(xué)和心理物理學(xué)研究。Lusted在1988年首次提出了ROC分析可用于醫(yī)療決策評(píng)價(jià),隨后該方法廣泛應(yīng)用于醫(yī)療診斷性能的評(píng)價(jià).最近,Swets等人為ROC分析技術(shù)進(jìn)一步擴(kuò)展到更廣闊的公共領(lǐng)域提供了思路和建議。[1][2-5]Spackman將ROC分析技術(shù)引到機(jī)器學(xué)習(xí)領(lǐng)域中,并說(shuō)明了ROC曲線的數(shù)值估計(jì)和比較算法。ROC分析技術(shù)在最近幾年越來(lái)越多的應(yīng)用到機(jī)器學(xué)習(xí)領(lǐng)域中。ROC分析技術(shù)不僅是一種通用圖形化性能估計(jì)方法,更主要的是,ROC曲線的獨(dú)特屬性使它在類(lèi)別,ROC曲線可以在多類(lèi)ROC問(wèn)題給出清楚的解釋。ROC分析技術(shù)在類(lèi)別分布、代價(jià)不敏感性、直觀性[6]以及可理解性等方面的優(yōu)勢(shì),足以使它能夠代替?zhèn)鹘y(tǒng)的正確率成為更好的分類(lèi)精度度量標(biāo)準(zhǔn)。目前,機(jī)器學(xué)習(xí)領(lǐng)域的研究者非常重視ROC分析技術(shù)。國(guó)外一些機(jī)器學(xué)習(xí)研究者根據(jù)實(shí)際需要擴(kuò)展和改進(jìn)了ROC分析技術(shù)。并在ROC分析的基礎(chǔ)上改進(jìn)并提出了一些新的方法。如ROC曲線是對(duì)分類(lèi)性能的二維描述,為了能夠直接比較多個(gè)分類(lèi)器,希望將ROC曲線描述的分類(lèi)器性能轉(zhuǎn)換為一個(gè)數(shù)值來(lái)表示分類(lèi)器的性能。一個(gè)通用的方法是計(jì)算ROC曲線下的面積(AreaUndertheROC,AUC)。其基本原理是:通過(guò)臨界點(diǎn)(cutoffpoint/cutoffvalue)的移動(dòng),獲得多對(duì)靈敏度(sensitivity)和誤判率(1-Specificity(特異度)),以靈敏度為縱軸,以誤判率為橫軸,連接各點(diǎn)繪制曲線,然后計(jì)算曲線下的面積,面積越大,AUC的估計(jì),ROC可以用來(lái)評(píng)價(jià)分類(lèi)方法的性能。研究發(fā)現(xiàn),使用大量的比較實(shí)驗(yàn)獲得的AUC比正確率更適合作為分類(lèi)評(píng)價(jià)標(biāo)準(zhǔn)。Hand和Till進(jìn)而提出了一種簡(jiǎn)單的近似AUC的計(jì)算方法。[7]另外,ROC分析技術(shù)也被用來(lái)重新評(píng)估以前的機(jī)器學(xué)習(xí)方法,對(duì)于一些幾乎是常識(shí),我們一直認(rèn)為精度的提高主要依靠于裁剪技術(shù)。但是在用AUC評(píng)估算法時(shí),,一直認(rèn)為NaiveBayes方法和決策樹(shù)的方法不相伯仲。但是ROC分析研究表明NaiveBayes方1北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文)開(kāi)題報(bào)告,一些學(xué)者還針對(duì)與ROC分析在分類(lèi)中的應(yīng)用,提出了新的分裂標(biāo)準(zhǔn),Smoothing方法,集成方法等。ROC總體性能標(biāo)準(zhǔn),在最近幾年越來(lái)越多的應(yīng)用到機(jī)器學(xué)習(xí)領(lǐng)域中。ROC曲線對(duì)類(lèi)別分布比例和錯(cuò)誤代價(jià)不敏感性,使它在類(lèi)別分布未知的領(lǐng)域和代價(jià)敏感學(xué)習(xí)中變得越來(lái)越重要。ROC分析技術(shù)已經(jīng)廣泛應(yīng)用到處理兩個(gè)類(lèi)別分類(lèi)器的性能評(píng)估中。在國(guó)內(nèi)的科學(xué)研究實(shí)踐中,ROC分析技術(shù)雖然在醫(yī)療領(lǐng)域已得到了廣泛的應(yīng)用,但是在其他應(yīng)用領(lǐng)域還很少看到關(guān)于ROC的文獻(xiàn)資料。因此引入和推廣ROC分析技術(shù)是十分有必要的。2北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文)開(kāi)題報(bào)告理論基礎(chǔ):ROC(ReceiverOperatingCharacteristic)曲線,也就是受試者工作曲線,用于二分類(lèi)判別效果的分析與評(píng)價(jià)。對(duì)于二值因變量模型,一般自變量為連續(xù)變量,因變量為二分類(lèi)變量。靈敏度指將實(shí)際為真值的樣本判斷為真值的概率。特異度指將實(shí)際為假值的樣本判斷為假值的概率。誤判率指將實(shí)際為假值的判斷為真值的概率,其數(shù)值等于1-特異度。TNF和TPF分別代表正確診斷的真陽(yáng)性和陰性病例所占比例;FPF和FNF分別代表部分未經(jīng)正確診斷的真陽(yáng)性和真陰性病例所占比例。(cutoffpoint/cutoffvalue)(sensitivity)和誤判率(1-Specificity(特異度,以靈敏度為縱軸,以誤判率為橫軸,將繪成的曲線與45度對(duì)角線對(duì)比,若差不多重合,說(shuō)明自變量對(duì)因變量的判斷價(jià)值很差,若越遠(yuǎn)離45量可以較為準(zhǔn)確地判斷因變量。3、利用得到的數(shù)值繪制ROC曲線。預(yù)期成果:不同測(cè)試方式對(duì)應(yīng)相同閾值求得的TPFTNFFPF并不完全一致。利用相應(yīng)數(shù)據(jù)繪制的曲線也不重合,計(jì)算得到的AUC不一致。AUC大的測(cè)試方法較另一測(cè)試方法性能好。3北京交通大學(xué)畢業(yè)設(shè)計(jì)(論文)開(kāi)題報(bào)告[1]VictorFroelicher,KaterinaShetlerandEuanAshley.Bet2terdecisionsthroughscience[J].CurrentProblemsinCar2diology,2003,28(11):589~620[2]Fawcett,T.&Provost,F.Combiningdataminingandmachinelearningforeffectiveuserprofiling[c].InSimo2udis,Han,&Fayyad(Eds.),ProceedingsontheSecondInternationalConferenceonKnowledgeDiscoveryandDataMining,MenloParkCA.AAAI~13[3]PeterFlach.ThemanyfacesofROCanalysisinmachinelearning[J].ICML’04tutorialonROCanalysis,2004,7,485~487[4]JinHuang,CharlesX.Ling.UsingAUCandAccuracyinEvaluatingLearningAlgorithms[c]-Appendices.IEEETrans.Knowl.DataEng.17(3):(2005).[5]Jin.Huang,J.Lu,andC.X.Ling.Comparingnaivebayes,decisiontrees,andsvmusingaccuracyandauc[C].InProceedingsofthe5rdInternationalConferenceonDataMining,(ICDM-2005),2005,653~656[6]C.Ferri,P.A.Flach,andJ.Hernandez-Orallo.LearningdecisiontreesusingtheareaundertheROCcurve[C].InProceedingsoftheNineteenthInternationalConferenceonMachineLearning(ICML~146[7]A.P.Bradley.TheuseoftheareaundertheROCcurveintheevaluationofmachinelearningalgorithms[J].Pat2ternRecognition,1997,~1159[8]MetzCE.BasicprinciplesofROCanalysis.SeminNuclMed1978;82:83-98[9]MetzCE.ReceiverOperatingCharacteristicsAnalysis:AToolfortheQuantitativeEvaluationofObserverPerformanceandImagingSystem.AmericanCollegeofRadiology2006[10]MetzCE.ROCanalysisinmedicali

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論