版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第八章判別分析判別分析簡介一般判別分析典型判別分析逐步判別分析第八章判別分析判別分析簡介一、判別分析簡介判別分析是一種應用性很強的統(tǒng)計方法。它通常是根據(jù)已有的數(shù)據(jù)資料,來建立一種判別方法,然后再來判斷一個新的樣品歸屬于哪一類。例如,醫(yī)院擁有以往就診的各種病人的資料,包括他們的心率、血壓、體溫、化驗指標等很多數(shù)據(jù)?,F(xiàn)在有一個新的病人來醫(yī)院就診,對他也測量了相關的指標數(shù)據(jù),要判斷他患有哪一種病,這就屬于一個判別歸類的問題。又如,在礦產(chǎn)勘探中積累了豐富的地質(zhì)資料,現(xiàn)在某地區(qū)新采到了一個巖石標本,要從它的基本特征判斷該地區(qū)有無礦產(chǎn),是貧礦還是富礦,則也需要進行判別分析。一、判別分析簡介判別分析是一種應用性很強的統(tǒng)計二、一般判別分析1、距離判別法距離判別法是通過計算距離函數(shù)來進行判別,即樣品與哪個總體之間的距離最近,則判斷它屬于哪個總體。如何衡量樣品與總體間的這種抽象的距離?我們一般利用馬氏距離來描述。二、一般判別分析1、距離判別法距離判別法是通過二、一般判別分析2、Bayes判別法前一節(jié)介紹距離判別法十分簡便實用,但是也存在一些缺點。例如,距離判別法沒有考慮到關于總體的先驗概率,而且沒有考慮可能出現(xiàn)錯判而帶來的損失。Bayes判別法正是為了克服這些缺陷而提出來的一種判別方法。Bayes判別法是基于Bayes統(tǒng)計的思想,即假定事先對所研究的對象有一定的了解,并通過先驗概率分布來進行描述,當抽取樣本后,用樣本來修正先驗概率分布,并得到后驗概率分布,然后根據(jù)后驗概率分布進行各種統(tǒng)計推斷。Bayes判別法首先計算給定樣品屬于各個總體的條件概率,然后比較這些概率值的大小,將樣品判歸于條件概率最大的總體。二、一般判別分析2、Bayes判別法前一節(jié)介紹一般判別分析DISCRIM過程PROCDISCRIMDATA=數(shù)據(jù)集名<選項>;CLASS分類變量名;VAR變量名列表;PRIORS概率值;
BY分組變量名;RUN;一般判別分析DISCRIM過程PROCDISCRIMDA一般判別分析DISCRIM過程一般判別分析DISCRIM過程一般判別分析DISCRIM過程一般判別分析DISCRIM過程二、一般判別分析3、DISCRIM過程語句說明:(1)PROC語句用于規(guī)定開始運行DISCRIM過程并指定要分析的數(shù)據(jù)集名。選項有:TESTDATA=數(shù)據(jù)集名——指定需要進行分類的觀測組成的數(shù)據(jù)集。該數(shù)據(jù)集中定量變量的名稱必須和DATA=數(shù)據(jù)集中的定量變量的名稱相匹配。METHOD=選項——規(guī)定進行分類的方法。LIST——規(guī)定對每個觀測顯示重新分類的結(jié)果。TESTLIST——規(guī)定顯示TESTDATA=數(shù)據(jù)集中觀測的分類結(jié)果。二、一般判別分析3、DISCRIM過程語句說明:二、一般判別分析3、DISCRIM過程(2)CLASS語句用于規(guī)定分類變量,可以是數(shù)值型變量也可以是字符型變量。分類變量的不同取值則代表了不同的類別。(3)VAR語句用于規(guī)定要分析的定量變量。若不使用此語句,則默認分析數(shù)據(jù)集中所有的數(shù)值型變量。(4)PRIORS語句用于規(guī)定各類別的先驗概率。(5)BY語句規(guī)定了分組變量,它使得BY過程對分組內(nèi)進行處理。在使用BY語句前,應對數(shù)據(jù)集按照分組變量進行排序。二、一般判別分析3、DISCRIM過程(2)CLA三、典型判別分析1、Fisher判別法典型判別分析采用了與主成分分析和典型相關分析類似的降維技術,以找到能最好概括類別區(qū)分的變量的線性組合。降維時要求同一類中的區(qū)別盡可能小,而不同類間的區(qū)別盡可能大。三、典型判別分析1、Fisher判別法典型判別分析采用典型判別分析CANDISC過程PROCCANDISCDATA=數(shù)據(jù)集名<選項>;CLASS分類變量名;VAR變量名列表;
BY分組變量名;RUN;典型判別分析CANDISC過程PROCCANDISCDA典型判別分析CANDISC過程典型判別分析CANDISC過程典型判別分析CANDISC過程典型判別分析CANDISC過程典型判別分析DISCRIM過程PROCDISCRIMDATA=典型變量數(shù)據(jù)集;CLASS分類變量名;VAR典型變量名;RUN;典型判別分析DISCRIM過程PROCDISCRIMDA四、逐步判別分析1、基本原理逐步判別分析考察了p維指標(即p個變量)對總體的區(qū)分能力是否顯著,對判別分類不起作用的變量則予以刪除,優(yōu)化了判別的效果。逐步判別的基本思想與我們在上一章介紹的逐步回歸相似:在建立判別函數(shù)時逐個引入變量,每一步選擇都一個判別能力最顯著的變量進入判別函數(shù),同時對已有的變量也進行檢驗,將不顯著的變量剔除。直到在可選的變量中,既沒有變量被選入也沒有變量被刪除為止。這樣在最后得到的判別函數(shù)中,所有變量都是顯著的。通過使用逐步判別法,提高了判別樣品的能力,也增強了判別函數(shù)的穩(wěn)定性。四、逐步判別分析1、基本原理逐步判別分析考察了p維指標STEPDISC過程PROCSTEPDISCDATA=數(shù)據(jù)集名<選項>;CLASS分類變量名;VAR變量名列表;
BY分組變量;RUN;逐步判別分析STEPDISC過程PROCSTEPDISCDATA=數(shù)STEPDISC過程逐步判別分析STEPDISC過程逐步判別分析STEPDISC過程逐步判別分析STEPDISC過程逐步判別分析STEPDISC過程逐步判別分析STEPDISC過程逐步判別分析2、STEPDISC過程語句說明:(1)PROC語句用于規(guī)定運行STEPDISC過程,并指定要分析的數(shù)據(jù)集名。選項有:METHOD=選項——規(guī)定對判別函數(shù)中的變量進行選擇的方法。(2)CLASS語句用于規(guī)定分類變量,可以是數(shù)值型變量也可以是字符型變量。分類變量的不同取值則代表了不同的類別。(3)VAR語句用于規(guī)定要篩選的定量變量。若不使用此語句,則默認篩選數(shù)據(jù)集中所有的數(shù)值型變量。(4)BY語句規(guī)定了分組變量,它使得BY過程對分組內(nèi)進行處理。在使用BY語句前,應對數(shù)據(jù)集按照分組變量進行排序。四、逐步判別分析2、STEPDISC過程語句說明:四、逐步判別分析DISCRIM過程在進行逐步判別分析時,使用STEPDISC過程只能完成變量的篩選。要實現(xiàn)完整的判別分析,則還需要聯(lián)合使用DISCRIM過程。一般的做法是:首先使用STEPDISC過程對變量進行篩選,在得出篩選結(jié)果后,再利用DISCRIM過程依據(jù)篩選出的變量進行判別分析。逐步判別分析DISCRIM過程在進行逐步判別分析時,使用S第八章判別分析判別分析簡介一般判別分析典型判別分析逐步判別分析第八章判別分析判別分析簡介一、判別分析簡介判別分析是一種應用性很強的統(tǒng)計方法。它通常是根據(jù)已有的數(shù)據(jù)資料,來建立一種判別方法,然后再來判斷一個新的樣品歸屬于哪一類。例如,醫(yī)院擁有以往就診的各種病人的資料,包括他們的心率、血壓、體溫、化驗指標等很多數(shù)據(jù)?,F(xiàn)在有一個新的病人來醫(yī)院就診,對他也測量了相關的指標數(shù)據(jù),要判斷他患有哪一種病,這就屬于一個判別歸類的問題。又如,在礦產(chǎn)勘探中積累了豐富的地質(zhì)資料,現(xiàn)在某地區(qū)新采到了一個巖石標本,要從它的基本特征判斷該地區(qū)有無礦產(chǎn),是貧礦還是富礦,則也需要進行判別分析。一、判別分析簡介判別分析是一種應用性很強的統(tǒng)計二、一般判別分析1、距離判別法距離判別法是通過計算距離函數(shù)來進行判別,即樣品與哪個總體之間的距離最近,則判斷它屬于哪個總體。如何衡量樣品與總體間的這種抽象的距離?我們一般利用馬氏距離來描述。二、一般判別分析1、距離判別法距離判別法是通過二、一般判別分析2、Bayes判別法前一節(jié)介紹距離判別法十分簡便實用,但是也存在一些缺點。例如,距離判別法沒有考慮到關于總體的先驗概率,而且沒有考慮可能出現(xiàn)錯判而帶來的損失。Bayes判別法正是為了克服這些缺陷而提出來的一種判別方法。Bayes判別法是基于Bayes統(tǒng)計的思想,即假定事先對所研究的對象有一定的了解,并通過先驗概率分布來進行描述,當抽取樣本后,用樣本來修正先驗概率分布,并得到后驗概率分布,然后根據(jù)后驗概率分布進行各種統(tǒng)計推斷。Bayes判別法首先計算給定樣品屬于各個總體的條件概率,然后比較這些概率值的大小,將樣品判歸于條件概率最大的總體。二、一般判別分析2、Bayes判別法前一節(jié)介紹一般判別分析DISCRIM過程PROCDISCRIMDATA=數(shù)據(jù)集名<選項>;CLASS分類變量名;VAR變量名列表;PRIORS概率值;
BY分組變量名;RUN;一般判別分析DISCRIM過程PROCDISCRIMDA一般判別分析DISCRIM過程一般判別分析DISCRIM過程一般判別分析DISCRIM過程一般判別分析DISCRIM過程二、一般判別分析3、DISCRIM過程語句說明:(1)PROC語句用于規(guī)定開始運行DISCRIM過程并指定要分析的數(shù)據(jù)集名。選項有:TESTDATA=數(shù)據(jù)集名——指定需要進行分類的觀測組成的數(shù)據(jù)集。該數(shù)據(jù)集中定量變量的名稱必須和DATA=數(shù)據(jù)集中的定量變量的名稱相匹配。METHOD=選項——規(guī)定進行分類的方法。LIST——規(guī)定對每個觀測顯示重新分類的結(jié)果。TESTLIST——規(guī)定顯示TESTDATA=數(shù)據(jù)集中觀測的分類結(jié)果。二、一般判別分析3、DISCRIM過程語句說明:二、一般判別分析3、DISCRIM過程(2)CLASS語句用于規(guī)定分類變量,可以是數(shù)值型變量也可以是字符型變量。分類變量的不同取值則代表了不同的類別。(3)VAR語句用于規(guī)定要分析的定量變量。若不使用此語句,則默認分析數(shù)據(jù)集中所有的數(shù)值型變量。(4)PRIORS語句用于規(guī)定各類別的先驗概率。(5)BY語句規(guī)定了分組變量,它使得BY過程對分組內(nèi)進行處理。在使用BY語句前,應對數(shù)據(jù)集按照分組變量進行排序。二、一般判別分析3、DISCRIM過程(2)CLA三、典型判別分析1、Fisher判別法典型判別分析采用了與主成分分析和典型相關分析類似的降維技術,以找到能最好概括類別區(qū)分的變量的線性組合。降維時要求同一類中的區(qū)別盡可能小,而不同類間的區(qū)別盡可能大。三、典型判別分析1、Fisher判別法典型判別分析采用典型判別分析CANDISC過程PROCCANDISCDATA=數(shù)據(jù)集名<選項>;CLASS分類變量名;VAR變量名列表;
BY分組變量名;RUN;典型判別分析CANDISC過程PROCCANDISCDA典型判別分析CANDISC過程典型判別分析CANDISC過程典型判別分析CANDISC過程典型判別分析CANDISC過程典型判別分析DISCRIM過程PROCDISCRIMDATA=典型變量數(shù)據(jù)集;CLASS分類變量名;VAR典型變量名;RUN;典型判別分析DISCRIM過程PROCDISCRIMDA四、逐步判別分析1、基本原理逐步判別分析考察了p維指標(即p個變量)對總體的區(qū)分能力是否顯著,對判別分類不起作用的變量則予以刪除,優(yōu)化了判別的效果。逐步判別的基本思想與我們在上一章介紹的逐步回歸相似:在建立判別函數(shù)時逐個引入變量,每一步選擇都一個判別能力最顯著的變量進入判別函數(shù),同時對已有的變量也進行檢驗,將不顯著的變量剔除。直到在可選的變量中,既沒有變量被選入也沒有變量被刪除為止。這樣在最后得到的判別函數(shù)中,所有變量都是顯著的。通過使用逐步判別法,提高了判別樣品的能力,也增強了判別函數(shù)的穩(wěn)定性。四、逐步判別分析1、基本原理逐步判別分析考察了p維指標STEPDISC過程PROCSTEPDISCDATA=數(shù)據(jù)集名<選項>;CLASS分類變量名;VAR變量名列表;
BY分組變量;RUN;逐步判別分析STEPDISC過程PROCSTEPDISCDATA=數(shù)STE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度跨境電子商務平臺廣告服務合同4篇
- 2025年度水電工程設計與施工一體化合同匯編4篇
- 2025年度重型沖擊鉆施工工程合同4篇
- 2025年鮮蛋冷鏈配送與售后服務合同3篇
- 個人土地抵押貸款合同范本打印版(2024)一
- 2025年度智慧城市建設物業(yè)服務委托合同4篇
- 2025年度餐飲行業(yè)供應鏈戰(zhàn)略合作框架協(xié)議3篇
- 教育技術在小學科學課題研究中的應用與發(fā)展
- 個人借款轉(zhuǎn)讓協(xié)議簡明示例版
- 2025年度個人租賃房屋租賃合同違約責任及處理協(xié)議4篇
- 人教版物理八年級下冊 專項訓練卷 (一)力、運動和力(含答案)
- 山東省房屋市政工程安全監(jiān)督機構人員業(yè)務能力考試題庫-中(多選題)
- 重慶市2023-2024學年七年級上學期期末考試數(shù)學試題(含答案)
- 2024年中考語文滿分作文6篇(含題目)
- 北師大版 2024-2025學年四年級數(shù)學上冊典型例題系列第三單元:行程問題“拓展型”專項練習(原卷版+解析)
- 2023年譯林版英語五年級下冊Units-1-2單元測試卷-含答案
- 施工管理中的文檔管理方法與要求
- DL∕T 547-2020 電力系統(tǒng)光纖通信運行管理規(guī)程
- 種子輪投資協(xié)議
- 執(zhí)行依據(jù)主文范文(通用4篇)
- 浙教版七年級數(shù)學下冊全冊課件
評論
0/150
提交評論