02 貝葉斯決策理論和ASMS3000決策分析平臺_第1頁
02 貝葉斯決策理論和ASMS3000決策分析平臺_第2頁
02 貝葉斯決策理論和ASMS3000決策分析平臺_第3頁
02 貝葉斯決策理論和ASMS3000決策分析平臺_第4頁
02 貝葉斯決策理論和ASMS3000決策分析平臺_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

模式識別

——貝葉斯決策理論馬勤勇mqymail@163一最簡單的貝葉斯分類算法

還使用前面的例子:鱸魚(seabass)和鮭魚(salmon)。使用一個特征亮度對這兩種魚進行表示。新來了一條魚特征是x(亮度),怎么根據(jù)特征x確定它到底是鱸魚ω1還是鮭魚ω2?已知數(shù)據(jù):鱸魚類標號ω1,鮭魚類標號ω2。鱸魚總數(shù)量占所有魚總數(shù)量的比率為P(ω1),鮭魚總數(shù)量占所有魚總數(shù)量的比率為P(ω2)。由鱸魚的分布得知這條魚的亮度x在分類為鱸魚時出現(xiàn)的概率為p(x|ω1),由鮭魚的分布得知這條魚的亮度x在分類為鮭魚時出現(xiàn)的概率為p(x|ω2)。如何求解?可以求出x屬于鱸魚ω1的概率P(ω1|x)和x屬于鮭魚ω2的概率P(ω2|x)。如果P(ω1|x)>P(ω2|x),就認為x是鱸魚?,F(xiàn)在的問題是如何求P(ω1|x)和P(ω2|x)。有一個概率公式:從而推出:換一種寫法:這就是著名的貝葉斯公式。其中P(ωj)叫做先驗概率,就是類別出現(xiàn)的可能性;p(x|ωj)叫條件概率,就是在ωj時x出現(xiàn)的可能性;p(ωj|x)叫后驗概率;p(x)是該樣例出現(xiàn)的可能性。因此:對于上面的問題:如果p(ω1|x)>p(ω2|x),那么就認為x屬于ω1,即這條魚是鱸魚。同理于:這幾個基本數(shù)據(jù)都已經(jīng)給出了,因此可以計算出不等式的結果。如果p(ω1|x)<p(ω2|x),那么就認為x屬于ω2,即這條魚是鮭魚。同理于:二貝葉斯決策算法上面的分類有幾個主要限制:特征向量中只包含一個特征:亮度。只有兩個類別:鱸魚和鮭魚。僅僅允許分類,而不是根據(jù)分類采取行動。同時,沒有加入損失控制:例如鱸魚比鮭魚貴。如果鱸魚的罐頭里裝入了鮭魚,那么客戶會很生氣;如果鮭魚的罐頭里裝入了鱸魚,那么客戶很難感到有損失。那么這個時候分類后采取的行動就要偏向于便宜的鮭魚。下面就看突破這幾個限制的比較通用的貝葉斯分類器是什么樣的。為了解決第一個顯示,使用向量x代替原來的單變量x。x就叫做特征向量。比如鱸魚鮭魚分類的例子中,可以設計這樣一個特征向量(x1,x2),其中x1表示亮度,x2表示長度。定義類別總共有c個:{ω1,ω2…,ωc},第j個分類為ωj。此時,x屬于類別ωj的概率依然用這個公式計算:但是,并不是簡單地將x歸于具有最大p(ωj|x)值的那個類別ωj。因為要考慮損失:定義進行第i個行動(比如將樣例歸于第i個類別)這種行為表示為:αi。在一個樣例的真正類別為ωj時,進行第i個行動造成的損失是:λ(αi|ωj)。那么進行第i個行動的總損失:這里將每個類別為真正類別時采取第i個行動造成的損失都加起來,作為采取第i個行動的總損失。那么每個行動的總損失都可以求出來,采取其中總損失最小的行動。比如行動k最小,對應的行動是將樣例歸于第k個類別,那么就如此進行分類。

舉例:貝葉斯決策算法在兩類問題中的決策。定義

,是在一個樣例的真正類別為ωj時,進行第i個行動造成的損失。采取第1個行動時的總損失:采取第2個行動時的總損失:那么當時,采取第1個行動。即:比如對于上面的例子λ11=λ22=0。鱸魚ω1比鮭魚ω2貴。如果鱸魚ω1的罐頭里裝入了鮭魚ω2,那么客戶會很生氣;如果鮭魚ω2的罐頭里裝入了鱸魚ω1,那么客戶很難感到有損失。那么這個時候分類后采取的行動就要偏向于便宜的鮭魚。因此設當真正類別是鮭魚ω2的時候,將x歸類為鱸魚ω1(造成鱸魚ω1的罐頭里裝入了鮭魚ω2)的損失λ12=2,設當真正類別是鱸魚ω1的時候,將x歸類為鮭魚ω2(造成鮭魚ω2的罐頭里裝入了鱸魚ω1)的損失λ21=0.2??梢钥吹?,上面的公式變成了:三判別函數(shù)在模式識別里,經(jīng)常用gi(x)來表示x屬于第i個類別的可能性。如果對于所有的j!=i都有:gi(x)>gj(x),那么認為x屬于第i個類別ωi。比如令gi(x)=-R(αi|x)。上面是一個不等式關系,如果不等式兩邊都乘以相同的正數(shù),或加上相同的樹,或取自然對數(shù)。那么不等式的關系是不變的。因此不考慮損失時的貝葉斯判別函數(shù):可以寫成:四正態(tài)分布貝葉斯公式中的p(x|ωj)是條件概率,代表在類別為ωj時,x的概率。比如在ωj為鱸魚時,一個特定亮度x的概率。條件概率分布中常見的一個分布是高斯分布(正態(tài)分布)。正態(tài)分布是最重要的一種概率分布。正態(tài)分布概念是由德國的數(shù)學家和天文學家Moivre于1733年首次提出的,但由于德國數(shù)學家Gauss(CarlFriedrichGauss,1777—1855)率先將其應用于天文學家研究,故正態(tài)分布又叫高斯分布。高斯分布的形狀是鐘形曲線。很多隨機變量的概率分布都可以近似地用正態(tài)分布來描述。例如:同一種生物體的身長、體重等指標;百度高個吧投票的身高分布:在生產條件不變的情況下,產品的強力、抗壓強度、口徑、長度等指標;同一種種子的重量;測量同一物體的誤差;某個地區(qū)的年降水量;學生的智力水平,包括學習能力,實際動手能力等呈正態(tài)分布。單變量正態(tài)分布的

概率密度函數(shù):其中μ是均值,σ是標準差。均值就是所有數(shù)的平均數(shù),就是把所有數(shù)都加起來再除以個數(shù)σ2方差就是把每個數(shù)減去它們的平均數(shù)再平方,把這些平方加起來再除以個數(shù)。方差表示統(tǒng)計數(shù)據(jù)的離散程度。經(jīng)??梢园焉厦娴墓胶唽懗桑簆(x)~N(μ,σ2)。多變量正態(tài)分布的

概率密度函數(shù):其中μ是d維平均向量。Σ是d*d的協(xié)方差矩陣。|Σ|是它的行列式,Σ-1是它的轉置。經(jīng)常可以把上面的公式簡寫成:p(x)~N(μ,Σ)。五正態(tài)分布下的判別函數(shù)將多變量正態(tài)分布公式帶入下面的判別函數(shù):得到:將單變量正態(tài)分布公式帶入下面的判別函數(shù):得到:1.Σi=σ2I當所有變量都相互獨立,且每個變量的方差都是σ2的時候,所有的協(xié)方差矩陣都相等:Σi=σ2I。此時,判別函數(shù)簡化成了:此時判別函數(shù)就變成了一個線性判別函數(shù)。當p(ωi)與p(ωj)相等的時候,一二三維高斯分布:如下求分割線x的位置:當p(ωi)與p(ωj)不相等的時候,

一二三維高斯分布:2.Σi=Σ當所有類別的協(xié)方差矩陣Σi都相等的時候,說明所有類別的正態(tài)分布具有同樣的形狀。此時,判別函數(shù)又可以簡化成一個線性判別函數(shù)器。3.Σi不固定此時基本就沒有什么可化簡的了。ASMS3000決策分析平臺

1、決策分析平臺的重要性2、訂票、出票、送票統(tǒng)計3、銷售數(shù)據(jù)分析、坐席工作效率分析與航線銷售對比分析的查看與統(tǒng)計4、盈利分析5、員工業(yè)績統(tǒng)計分析6、問題考核?1.1決策分析平臺的重要性全方位的統(tǒng)計公司銷售上的各類數(shù)據(jù),有利于代理人的領導層掌握公司運轉狀態(tài),針對現(xiàn)有的情況作出進一步的決策。

準確把握員工的工作效率利用決策分析平臺的各類員工工作效率的分析,制定有效地獎懲措施,解決工作效率存在的問題。盈利分析

管理層通過具體的盈利數(shù)據(jù),查看公司的一段時間內各個階段的盈利數(shù)據(jù),通過對比分析原因,制訂下階段的策略。?2.1訂票、出票、送票統(tǒng)計三個報表的統(tǒng)計數(shù)據(jù)來源1、訂票統(tǒng)計:訂單來源的統(tǒng)計,以訂票員為主,包含未出票的訂單。2、出票統(tǒng)計:出票來源地統(tǒng)計,以出票員為主,只統(tǒng)計已經(jīng)出票的數(shù)據(jù)。3、送票統(tǒng)計:送票員的統(tǒng)計,以市內配送統(tǒng)計為主,統(tǒng)計送票員送票的數(shù)據(jù)。?3.1銷售數(shù)據(jù)分析航空公司銷售對比分析查看一段時期內各個航空公司的銷售情況,給決策層提供參考的有力依據(jù),及時調整策略來平衡各個航空公司之間的銷售情況。坐席工作效率報表呼叫中心各個坐席的工作效率統(tǒng)計分析,為決策層考核呼叫中心員工的業(yè)績提供數(shù)據(jù)依據(jù)。航線銷售分析提供一段時期內所有航線的銷售張數(shù)和銷售情況,包含退廢票??蛻舨拷y(tǒng)計查詢會員一段時期內具體的出票情況,給決策層提供有力的依據(jù),查看該會員為公司創(chuàng)造的利潤價值,是否提供更好的服務。?4.1盈利分析統(tǒng)計指定時間的訂單數(shù)和毛利1、在此模塊中提供四種統(tǒng)計的方式,可是查詢到所要的數(shù)據(jù),同時系統(tǒng)也會在下面提供柱形分析圖,給客戶一個直觀簡單的參考。?5.1員工業(yè)績統(tǒng)計分析客戶出票統(tǒng)計查詢指定客戶的出票量查詢客服創(chuàng)建用戶的數(shù)量查詢一段時間內指定客戶所付款的票數(shù)會員創(chuàng)建報表查詢一個客服一段時間內所建立的所有客戶會員分析報表分析客戶的貢獻度、創(chuàng)建人員、創(chuàng)建時間等?6.1問題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論