a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt

上傳人：q*** IP屬地：江蘇上傳時(shí)間：2020-05-23 格式：PPT 頁數(shù)：95 大?。?.67MB 積分：30 舉報(bào) 版權(quán)申訴

a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt_第2頁

a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt_第3頁

a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt_第4頁

a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt_第5頁

已閱讀5頁，還剩90頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

模式識(shí)別,73441（O）,73442（H）E-mail：xpcai:,第五章統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì),統(tǒng)計(jì)推斷概述參數(shù)估計(jì)概密的窗函數(shù)估計(jì)法有限項(xiàng)正交函數(shù)級(jí)數(shù)逼近法,51統(tǒng)計(jì)推斷概述,第五章統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì),本章目的：已知類別的樣本（訓(xùn)練樣本）學(xué)習(xí)或訓(xùn)練獲得類概密,在上一章的學(xué)習(xí)中,我們一直假設(shè)類的條件概率密度函數(shù)是已知的,然后去設(shè)計(jì)貝葉斯分類器。但在實(shí)際中，這些知識(shí)往往是不知道的，這就需要用已知的樣本進(jìn)行學(xué)習(xí)或訓(xùn)練。也就是說利用統(tǒng)計(jì)推斷理論中的估計(jì)方法，從樣本集數(shù)據(jù)中估計(jì)這些參數(shù)。,5.1統(tǒng)計(jì)推斷概述,參數(shù)估計(jì),參數(shù)估計(jì)有兩類方法:將參數(shù)作為非隨機(jī)量處理，如矩法估計(jì)、最大似然估計(jì)；將參數(shù)作為隨機(jī)變量，貝葉斯估計(jì)就屬此類。,5.1統(tǒng)計(jì)推斷概述,非參數(shù)估計(jì),5.1統(tǒng)計(jì)推斷概述,當(dāng)不知道類的概型時(shí)，就要采用非參數(shù)估計(jì)的方法，這種方法也稱為總體推斷，這類方法有：1.p-窗法2.有限項(xiàng)正交函數(shù)級(jí)數(shù)逼近法3.隨機(jī)逼近法,基本概念,母體（總體）：一個(gè)模式類稱為一個(gè)總體或母體,5.1統(tǒng)計(jì)推斷概述,母體的子樣：一個(gè)模式類中某些模式(即母體中的一些元素)的集合稱為這個(gè)母體的子樣。母體的子樣含有母體的某些信息，可以通過構(gòu)造樣本的函數(shù)來獲得。,統(tǒng)計(jì)量：一般來說，每一個(gè)樣本都包含著母體的某些信息，為了估計(jì)未知參數(shù)就要把有用的信息從樣本中抽取出來。為此，要構(gòu)造訓(xùn)練樣本的某種函數(shù)，這種函數(shù)在統(tǒng)計(jì)學(xué)中稱為統(tǒng)計(jì)量。,基本概念,經(jīng)驗(yàn)分布：由樣本推斷的分布稱為經(jīng)驗(yàn)分布。,5.1統(tǒng)計(jì)推斷概述,數(shù)學(xué)期望、方差等,理論量（或理論分布）：,參數(shù)空間：在統(tǒng)計(jì)學(xué)中，把未知參數(shù)q的可能值的集合稱為參數(shù)空間，記為Q。,點(diǎn)估計(jì)、估計(jì)量：針對(duì)某未知參數(shù)q構(gòu)造一個(gè)統(tǒng)計(jì)量作為q的估計(jì)，這種估計(jì)稱為點(diǎn)估計(jì)。稱為q的估計(jì)量。,基本概念,5.1統(tǒng)計(jì)推斷概述,為了準(zhǔn)確地對(duì)某一類的分布進(jìn)行參數(shù)估計(jì)或總體推斷，應(yīng)只使用該類的樣本。,就是說在進(jìn)行參數(shù)估計(jì)時(shí)，應(yīng)對(duì)各類進(jìn)行獨(dú)立的參數(shù)估計(jì)或總體推斷。因此在以后的論述中，如無必要，不特別言明類別。,區(qū)間估計(jì)：在一定置信度條件下估計(jì)某一未知參數(shù)q的取值范圍，稱之為置信區(qū)間，這類估計(jì)成為區(qū)間估計(jì)。,基本概念,5.1統(tǒng)計(jì)推斷概述,漸近無偏估計(jì)：即。當(dāng)不能對(duì)所有的都有時(shí)，希望估計(jì)量是漸近無偏估計(jì)。,基本概念,5.1統(tǒng)計(jì)推斷概述,均方收斂:,又稱相合估計(jì),一致估計(jì):當(dāng)樣本無限增多時(shí)，估計(jì)量依概率收斂于，,52參數(shù)估計(jì),第五章統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì),5.2參數(shù)估計(jì),5.2.1均值矢量和協(xié)方差陣的矩法估計(jì)5.2.2最大似然估計(jì)(MLE)5.2.3貝葉斯估計(jì)(BE),5.2參數(shù)估計(jì),均值矢量和協(xié)方差陣的矩法估計(jì),矩法估計(jì)是用樣本(的統(tǒng)計(jì))矩作為總體(理論)矩的估值。若類的概型為正態(tài)分布，我們用矩法估計(jì)出類的均值矢量和協(xié)方差陣后，類的概密也就完全確定了。,均值矢量:,均值無偏估計(jì):,5.2參數(shù)估計(jì),均值矢量和協(xié)方差陣的矩法估計(jì),協(xié)方差陣:,5.2參數(shù)估計(jì),均值矢量和協(xié)方差陣的矩法估計(jì),協(xié)方差陣:,協(xié)方差陣無偏估計(jì):,或,5.2參數(shù)估計(jì),初始值:,均值矢量和協(xié)方差陣的矩法估計(jì),5.2參數(shù)估計(jì),協(xié)方差矩陣的遞推估計(jì)式:,均值矢量和協(xié)方差陣的矩法估計(jì),初始值:,5.2參數(shù)估計(jì),均值矢量和協(xié)方差陣的矩法估計(jì),5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),如同矩法估計(jì)一樣，最大似然估計(jì)要求已知總體的概型，即概密的具體函數(shù)形式，它也將被估計(jì)量作為確定性的變量對(duì)待。但最大似然估計(jì)適用范圍比矩法估計(jì)更寬一些，可以用于不是正態(tài)分布的情況。,最大似然估計(jì)是參數(shù)估計(jì)中最重要的方法。,5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),似然函數(shù):,5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),最大似然估計(jì)：,5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),在實(shí)際中多是獨(dú)立取樣和經(jīng)常處理正態(tài)變量，而且對(duì)數(shù)函數(shù)是單值單調(diào)函數(shù)，對(duì)數(shù)似然函數(shù)與似然函數(shù)在相同的處取得最大值。,5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),在似然函數(shù)可微的條件下，求下面微分方程組的解：,或等價(jià)地求,作為極值的必要條件。,對(duì)數(shù)似然方程組,5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),需要指出的是：對(duì)于具體問題，有時(shí)用上述方法不一定可行，原因之一是似然函數(shù)在最大值點(diǎn)處沒有零斜率。,因此，最大似然的關(guān)鍵是必須知道概型。,5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),下面我們以多維正態(tài)分布為例進(jìn)行說明。,（1）假設(shè)是已知的，未知的只是均值，則：,5.2參數(shù)估計(jì),最大似然估計(jì)(MLE),(MaximumLikelihoodEstimate),這說明，樣本總體的未知均值的最大似然估計(jì)就是訓(xùn)練樣本的平均值。它的幾何解釋就是：若把N個(gè)樣本看成是一群質(zhì)點(diǎn)，則樣本均值便是它們的質(zhì)心。,可見，正態(tài)分布中的協(xié)方差陣的最大似然估計(jì)量等于N個(gè)矩陣的算術(shù)平均值。,（3）對(duì)于一般的多維正態(tài)密度的情況，計(jì)算方法完全是類似的。最后的結(jié)果是：,可以證明上式的均值是無偏估計(jì)，但協(xié)方差陣并不是無偏估計(jì)，無偏估計(jì)是：,5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),于是：,5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),從而可得：,5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),下面介紹估計(jì),所涉及的其它公式或近似算式：由于各樣本是獨(dú)立抽取的，故它們條件獨(dú)立，即有,由貝葉斯定理知：,5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),5.2參數(shù)估計(jì),貝葉斯估計(jì)(BE),作業(yè)：,P1705.1,5.2,5.3,54概密的窗函數(shù)估計(jì)法,第五章統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì),設(shè)個(gè)樣本是從上述概密為的總體中獨(dú)立抽取的，個(gè)樣本中有個(gè)樣本落入?yún)^(qū)域中的概率服從離散隨機(jī)變量的二項(xiàng)分布,如果是整數(shù)，則:和,由于：,所以：,這里是的估計(jì)，當(dāng)較大較小時(shí)上式的近似程度是足夠的。,5.4概密的窗函數(shù)估計(jì)法,概率密度的基本估計(jì)式,當(dāng)固定時(shí)，對(duì)的最大似然估計(jì)，由概率論知，的數(shù)學(xué)期望。,5.4概密的窗函數(shù)估計(jì)法,概率密度的基本估計(jì)式,于是可得,5.4概密的窗函數(shù)估計(jì)法,概率密度的基本估計(jì)式,R0V0，同時(shí)k，N。,5.4概密的窗函數(shù)估計(jì)法,概率密度的基本估計(jì)式,為了提高,處的概密,的估計(jì)精度，我們根據(jù),理論，可以采用如下步驟以盡量滿足理論要求：,極限,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,上面所講的是從構(gòu)造上導(dǎo)出了估計(jì)式，所取的窗函數(shù)即迭加基函數(shù)為維方窗(柱)函數(shù)。事實(shí)上只要窗函數(shù)滿足下面的兩個(gè)條件:,由式構(gòu)造的估計(jì)式就是概密函數(shù)。,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,按照上面的條件，除了選擇方窗外，還可以選擇其它的滿足上述兩個(gè)條件的函數(shù)作窗函數(shù)。下面列出幾個(gè)一維窗函數(shù)的例子，n維的窗函數(shù)可用乘積的方法由一維函數(shù)構(gòu)造。,指數(shù)窗函數(shù),方窗函數(shù),正態(tài)窗函數(shù),下面進(jìn)一步討論窗寬對(duì)估計(jì)的影響:,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,定義:,于是估計(jì)式表示成:,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,估計(jì)量是一隨機(jī)變量，它依賴于隨機(jī)的訓(xùn)練樣本，所以估計(jì)量的性能只能用統(tǒng)計(jì)性質(zhì)表示。,在滿足下列條件下是漸近無偏估計(jì)、均方收斂、均方逼近、且是漸近正態(tài)分布。,5.4概密的窗函數(shù)估計(jì)法,Parzen窗法,(1)是的漸近無偏估計(jì),證明：,P窗法的特點(diǎn),適用范圍廣，無論概密是規(guī)則的或不規(guī)則的、單峰的或多峰的。,但它要求樣本分布較好且數(shù)量要大，顯然這也是一個(gè)良好估計(jì)所必須的，但它的取樣過程的操作增加了取樣工作的復(fù)雜性。,窗函數(shù)選取得當(dāng)有利于提高估計(jì)的精度和減少樣本的數(shù)量。,（a）,圖中，p(x)是均值為零、方差為1的一維正態(tài)分布，窗函數(shù)選擇為正態(tài)窗函數(shù)：,h1為可調(diào)節(jié)參量。于是：,（a）,由結(jié)果曲線可以看出，樣本量越大，估計(jì)越精確；同時(shí)，也可以看出窗口選擇是否適當(dāng)對(duì)估計(jì)結(jié)果有一定影響。,和,同上,由圖中曲線可以看出，當(dāng)N較小時(shí)，窗函數(shù)對(duì)估計(jì)結(jié)果影響較大，其估計(jì)結(jié)果與真實(shí)分布相差較遠(yuǎn)；當(dāng)N增大時(shí)，估計(jì)結(jié)果與真實(shí)分布較為接近。,5.4概密的窗函數(shù)估計(jì)法,kN-近鄰估計(jì)法,近鄰元估計(jì)法是克服這個(gè)問題的一個(gè)可能的方法。,5.4概密的窗函數(shù)估計(jì)法,kN-近鄰估計(jì)法,基本思想：把含,點(diǎn)的序列區(qū)域的體積,作為落入,中樣本數(shù),的函數(shù)，而不是直接作為,的函數(shù)。我們可以預(yù)先確定,是,的某個(gè)函數(shù)，然后在,點(diǎn)附近選擇一“緊湊”區(qū)域，,個(gè)鄰近樣本。,實(shí)驗(yàn)樣本數(shù),讓它只含,點(diǎn)附近概密較大，則包含,個(gè)樣本的區(qū)域,如果,體積自然就相對(duì)的??；,點(diǎn)附近概密較小，則區(qū)域體積就較大。,個(gè)鄰近樣本而擴(kuò)展到高密度,如果,顯然，當(dāng)區(qū)域?yàn)楹?區(qū)時(shí)，擴(kuò)展過程必然會(huì)停止。,5.4概密的窗函數(shù)估計(jì)法,kN-近鄰估計(jì)法,如果滿足條件,5.4概密的窗函數(shù)估計(jì)法,kN-近鄰估計(jì)法,5.4概密的窗函數(shù)估計(jì)法,kN-近鄰估計(jì)法,作業(yè),P1705.75.8,55有限項(xiàng)正交函數(shù)級(jí)數(shù)逼近法,第五章統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì),55有限項(xiàng)正交函數(shù)級(jí)數(shù)逼近法,應(yīng)根據(jù)的特點(diǎn)適當(dāng)選擇以期在固定的項(xiàng)數(shù)下減小誤差，項(xiàng)數(shù)R取得越大近似得就越好。,最小積分平方逼近方法,55有限項(xiàng)正交函數(shù)級(jí)數(shù)逼近法,將的具體表示代入上式得：,最小積分平方逼近方法,由此可得：,從而有：,則有:,則有:,的計(jì)算式可寫成迭代形式。,同理可得到的迭代形式。,初始值:,前面介紹的方法中被逼近的函數(shù)是概密，對(duì)于這種幅值大小變化較劇烈的函數(shù)，須用較多的項(xiàng)才可能在整個(gè)空間中有較好的逼近。,為減少計(jì)算量,在樣本出現(xiàn)較密集的區(qū)域（即概密取值較大的區(qū)域）中，應(yīng)要求逼

人人文庫> 全部分類> 應(yīng)用文書 > 項(xiàng)目管理

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

a05統(tǒng)計(jì)決策中的訓(xùn)練、學(xué)習(xí)與錯(cuò)誤率測(cè)試、估計(jì)模式識(shí).ppt