data mining bayesian classifiers管理學(xué)教授財經(jīng)信息管理與工程學(xué)院_第1頁
data mining bayesian classifiers管理學(xué)教授財經(jīng)信息管理與工程學(xué)院_第2頁
data mining bayesian classifiers管理學(xué)教授財經(jīng)信息管理與工程學(xué)院_第3頁
data mining bayesian classifiers管理學(xué)教授財經(jīng)信息管理與工程學(xué)院_第4頁
data mining bayesian classifiers管理學(xué)教授財經(jīng)信息管理與工程學(xué)院_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

貝葉斯分類器(Bayesian托馬斯貝葉斯(Thomas,約1702年-1761年4月17PagePagePage聯(lián)合概率P(X=x,條件概率P(Y=y|P(X,Y)=P(Y|X)×P(X)=P(X|Y)×ConditionalBayes

P(C|A)P(A,C)P(P(A|C)P(A,C)P(C)P(C|A)P(A|C)P(C)=0.75=P(X=藍|Y=藍P(Y=藍P(X=藍|Y=紅P(Y=紅=0.75×0.35+0.3PagePageConsidereachattributeandclasslabelasrandomGivenarecordwithattributes(A1,GoalistopredictclassSpecifically,wewanttofindthevalueofCthatmaximizesP(C|A1,A2,…,An)CanweestimateP(C|A1,A2,…,An)directlyfromcomputetheposteriorprobability(后驗概率P(C|A1,A2,…,An)forallvaluesofCusingtheBayesP(C|AAA)P(A1A2

|C)P(C)1A P(1A

2AnChoosevalueofCthatP(C|A1,A2,…,EquivalenttochoosingvalueofCthatmaximizesP(A1,A2,…,An|C)P(C)HowtoestimateP(A1,A2,…,An|CPagePage樸素貝葉斯分類器NveBayesAssumeindependenceamongattributesAiwhenclassisP(A1,A2,…,An|C)=P(A1|Cj)P(A2|Cj)…P(An|CanestimateP(Ai|Cj)forallAiandNewpointisclassifiedtoCjifP(Cj)P(Ai|Cj)isPagePage 1125KNo 1125KNo2No100KNo3No70KNo4120KNo5No95K6No60KNo7220KNo8No85K9No75KNo10No90K P(No)=P(Yes)=Fordiscrete

|

)=

|/where|Aik|isnumberofinstanceshavingattributeAiandbelongstoclassCkForcontinuousDiscretizetherangeintooneordinalattributeperviolatesindependenceTwo-waysplit:(A<v)or(A>chooseonlyoneofthetwosplitsasnewProbabilitydensityAssumeattributefollowsanormalUsedatatoestimateparametersofdistribution(e.g.,meanandstandarddeviation)Onceprobabilitydistributionisknown,canuseittoestimatetheconditionalprobabilityP(Ai|c)1125KNo2No100KNo3NoNo4120KNo5No6NoNo7220KNo8No9NoNoNo P(A|c)

(A Oneforeach(Ai,ci)For(Income,Ifsamplemean=samplevariance=P(Income120|No)

(120110e2(2975 PageExampleofNaeBayesGivenaTestnaiveBayesP(Refund=No|No)=4/7P(Refund=Yes|Yes)=0P(Refund=No|No)=4/7P(Refund=Yes|Yes)=0P(MaritalStatus=Single|No)=2/7P(MaritalStatus=Divorced|No)=1/7P(MaritalStatus=Married|No)=4/7P(MaritalStatus=Single|Yes)=2/7P(MaritalStatus=Married|Yes)=0FortaxableIf Ifclass=Yes: samplemean=90P(Married|=4/74/70.0072=P(Married|=101.210-9=P(No)= SinceP(X|No)P(No)>P(X|Yes)P(Yes) P(No|X)>P(Yes|X)=>Class=NoPagePagePageNaeBayesIfoneoftheconditionalprobabilityiszero,thentheentireexpressionbecomeszeroProbability

|C)

c:numberof

N|C)N

Nic

p:priorprobabilitym:parameterNcii

|C)

mm稱為等價樣本大小的參數(shù),決定先驗概率p和觀測概率nc/n當(dāng)訓(xùn)練樣例較少時,mPagePageExampleofNaeBayesA:leopardP(A|M)

P(A|N)

1103

7P(A|M)P(M)0.06

P(A|N)P(N)0.004 ?=>PagePageNaeBayesRobusttoisolatednoiseHandlemissingvaluesbyignoringtheinstanceduringprobabilityestimatecalcul

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論