判別分析discriminantanalysis課件_第1頁
判別分析discriminantanalysis課件_第2頁
判別分析discriminantanalysis課件_第3頁
判別分析discriminantanalysis課件_第4頁
判別分析discriminantanalysis課件_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

判別分析(discriminantanalysis)

判別分析是根據(jù)對象若干個(gè)指標(biāo)的觀測結(jié)果判定其應(yīng)屬于哪一類的統(tǒng)計(jì)學(xué)方法。臨床常需要根據(jù)患者的主訴、體征、檢查結(jié)果等做出診斷。如對急腹癥的患者,需要診斷患病原因。診斷闌尾炎時(shí)需要與其它急腹癥作鑒別診斷。確診為闌尾炎后還需診斷屬何種類型,如是否并發(fā)腹膜炎、是否穿孔等,以確定治療方案。判別分析的目的是通過篩選具有判別能力的指標(biāo),建立判別函數(shù),以便用于對新樣品的分類。經(jīng)典的判別分析有Fishes判別和Bayes判別。近年來,這些方法又有了新發(fā),展,同時(shí)也不斷有學(xué)者提出一些新的方法。第一節(jié)Fishes判別Fishes判別又稱典則判別(canonicaldiscriminant),適用于兩類和多類判別。一、兩類判別1、Fishes判別的原理已知A、B兩類觀察對象,A類有nA例,B類有nB例,分別記錄了X1,X2,…,Xm個(gè)觀察指標(biāo),稱為判別指標(biāo)或變量。Fishes判別法就是找出一個(gè)線性組合使得綜合指標(biāo)Z在A類的均數(shù)與在B類的均數(shù)的差異盡可能的大,而兩類內(nèi)綜合指標(biāo)Z的變異盡可能小,即使達(dá)到最大,這就是Fisher準(zhǔn)則。2、判別規(guī)則建立判別函數(shù)后按判別公式逐例計(jì)算判別函數(shù)值Zi,進(jìn)一步求Zi的兩類均數(shù)判別規(guī)則:二、判別效果的評價(jià)

判別效果一般用誤判率P來衡量。

一般要求判別函數(shù)的誤判率小于0.1或0.2才有應(yīng)用價(jià)值。誤判率可通過前瞻性或回顧性兩種方式獲得估計(jì)。所謂回顧性誤判率估計(jì)是指用建立判別函數(shù)的樣本回代判別?;仡櫺哉`判率估計(jì)往往夸大判別效果,一般而言,建立判別函數(shù)前要將樣本分成兩部分,分別占樣本總量的85%與15%。前者用于建立判別函數(shù),稱為訓(xùn)練樣本,后者用來考核判別效果,稱為驗(yàn)證樣本。

用驗(yàn)證樣本計(jì)算的誤判率作為前瞻性誤判率估計(jì),前瞻性誤判率估計(jì)則較為客觀。另外一種值得推薦的誤判率估計(jì)的方法稱為刀切法或稱為交叉核實(shí)法。它的具體步驟為:1)順序剔除一個(gè)樣品。用余下的N-1個(gè)樣品建立判別函數(shù);2)用判別函數(shù)剔除樣品;3)重復(fù)上兩步N次。計(jì)算誤判別率。這種估計(jì)的優(yōu)點(diǎn)是充分利用了樣本信息對立和驗(yàn)證判別函數(shù)。三、多類判別

多類Fisher判別原理與兩類Fisher判別相似,假定有g(shù)類,就要建立g-1個(gè)的判別函數(shù)。盡管多類Fisher判別理論完備,但由于其判別規(guī)則相對復(fù)雜,很少付諸應(yīng)用,故不作進(jìn)一步介紹。第二節(jié)最大似然判別法

最大似然判別法又稱尤度法,適用于指標(biāo)為定性指標(biāo)的兩類判別或多類判別。

1、判別原理用獨(dú)立事件概率乘法定理得到判別對象歸屬某類概率。

若m個(gè)判別指標(biāo)記為X1,X2,…Xm,,有g(shù)類記為Y1,Y2,…Yg。m個(gè)指標(biāo)互相獨(dú)立,g種類型互斥(即每個(gè)判別對象只可能歸屬其中一類).假定已知屬于第k類時(shí)變量Xj取值sl條件概率為

如某病例昨晚開始出現(xiàn)右下腹痛、嘔吐等癥,大便正常。經(jīng)檢查,右下腹部壓痛,肌性防御(+)、壓痛(+),體溫36.60C,白細(xì)胞23700。根據(jù)表18-3

2、判別規(guī)則將判別對象為最大的那一類。

例資料見表,用四種類型闌尾炎病人的構(gòu)成比作為先驗(yàn)概率p(Yk)的估計(jì)。

卡他性型闌尾炎20%

蜂窩織炎型闌尾炎50%

壞疽型闌尾炎25%

腹膜型闌尾炎5%第四節(jié)Bayes判別

前三節(jié)分別介紹了Fisher判別,最大似然判別和Bayes公式判別。Fisher判別是尋找合適的投影方向,使樣本在投影面上類內(nèi)變異變小,類間變異增大,達(dá)到判別目的;而后兩種方法是以概率為判別為依據(jù)的,要求訓(xùn)練樣本較大,否則判別效果難以保證。

本節(jié)介紹基于Bayes準(zhǔn)則的判別法,該方法仍然是根據(jù)概率大小進(jìn)行判別的,要求各類服從多元正態(tài)分布。多類判別多采用此方法1、Bayes準(zhǔn)則尋找一種判別規(guī)則使得屬于第k類的樣品,在第k類中取得最大的后驗(yàn)概率。基于準(zhǔn)則,假定已知各出現(xiàn)先驗(yàn)概率P(YK),且各類服從多元正態(tài)分布,可獲得兩種Bayes判別函數(shù)。

1)當(dāng)各類的協(xié)方差陣相等時(shí),可得到線性Bayes判別函數(shù):4、Bayes判別應(yīng)用

例欲用4個(gè)指標(biāo)鑒別3類疾病,現(xiàn)收集17例完整、確診的資料,試建立判別Bayes函數(shù)第五節(jié)逐步判別

在回歸分析中介紹了用來選擇(局部)最優(yōu)回歸子集的逐步回歸,本節(jié)介紹能篩選判別指標(biāo)的逐步判別方法,該方法的目的是選取具有判別效能的指標(biāo)建立判別函數(shù),使判別函數(shù)簡潔,判別效果穩(wěn)定。第六節(jié)判別分析中應(yīng)注意的問題

1、判別分析中所用的樣本資料視為總體的估

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論