統(tǒng)計(jì)學(xué)習(xí)理論與SVM-課件

上傳人：春*** IP屬地：貴州上傳時(shí)間：2023-07-23 格式：PPT 頁數(shù)：68 大?。?.95MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩63頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

浙江大學(xué)研究生《人工智能引論》課件第八章統(tǒng)計(jì)學(xué)習(xí)理論與SVM

(Chapter8SLT&SVM)1ppt課件目錄概述統(tǒng)計(jì)學(xué)習(xí)理論中的基本概念統(tǒng)計(jì)學(xué)習(xí)理論的發(fā)展簡(jiǎn)況統(tǒng)計(jì)學(xué)習(xí)理論的基本內(nèi)容支持向量機(jī)概述研究現(xiàn)狀參考文獻(xiàn)2ppt課件8.1.1SLT&SVM的地位和作用是統(tǒng)計(jì)學(xué)習(xí)方法的優(yōu)秀代表有嚴(yán)密的數(shù)學(xué)依據(jù)，得到了嚴(yán)格的數(shù)學(xué)證明有力反駁——“復(fù)雜的理論是沒有用的，有用的是簡(jiǎn)單的算法”等錯(cuò)誤觀點(diǎn)充分表明——“沒有什么比一個(gè)好的理論更實(shí)用了”等基本的科學(xué)原則8.1概述3ppt課件8.1.2SLT&SVM的數(shù)學(xué)基礎(chǔ)概率論與數(shù)理統(tǒng)計(jì)泛函分析“ForGodsolovedtheworldthathegavehisoneandonlySon,thatwhoeverbelievesinhimshallnotperishbuthaveeternallife.ForGoddidnotsendhisSonintotheworldtocondemntheworld,buttosavetheworldthroughhim.”

fromJOHN3:16-17NIV

4ppt課件8.1.3

SLT&SVM所堅(jiān)持的“基本信念”傳統(tǒng)的估計(jì)高維函數(shù)依賴關(guān)系的方法所堅(jiān)持的信念

實(shí)際問題中總存在較少數(shù)目的一些“強(qiáng)特征”，用它們的簡(jiǎn)單函數(shù)（如線性組合）就能較好地逼近未知函數(shù)。因此，需要仔細(xì)地選擇一個(gè)低維的特征空間，在這個(gè)空間中用常規(guī)的統(tǒng)計(jì)技術(shù)來求解一個(gè)逼近。SLT&SVM所堅(jiān)持的信念

實(shí)際問題中存在較大數(shù)目的一些“弱特征”，它們“巧妙的”線性組合可較好地逼近未知的依賴關(guān)系。因此，采用什么樣的“弱特征”并不十分重要，而形成“巧妙的”線性組合更為重要。5ppt課件8.1.4SLT&SVM與傳統(tǒng)方法的區(qū)別要較好地實(shí)現(xiàn)傳統(tǒng)方法，需要人工選擇（構(gòu)造）一些數(shù)目相對(duì)較少的“巧妙的特征”SVM方法則是自動(dòng)地選擇（構(gòu)造）一些數(shù)目較少的“巧妙的特征”在實(shí)際應(yīng)用中，可通過構(gòu)造兩層（或多層）SVM來選擇“巧妙的特征”6ppt課件SLT&SVM集以下模型于一身：結(jié)構(gòu)風(fēng)險(xiǎn)最小化（SRM）模型數(shù)據(jù)壓縮模型構(gòu)造復(fù)合特征的一個(gè)通用模型在希爾伯特空間中的內(nèi)積回旋可以看作是構(gòu)造特征的一種標(biāo)準(zhǔn)途徑。對(duì)實(shí)際數(shù)據(jù)的一種模型一個(gè)小的支持向量集合可能足以對(duì)不同的機(jī)器代表整個(gè)訓(xùn)練集。7ppt課件8.2SLT中的基本概念統(tǒng)計(jì)方法

——從觀測(cè)自然現(xiàn)象或者專門安排的實(shí)驗(yàn)所得到的數(shù)據(jù)去推斷該事務(wù)可能的規(guī)律性。統(tǒng)計(jì)學(xué)習(xí)理論

——在研究小樣本統(tǒng)計(jì)估計(jì)和預(yù)測(cè)的過程中發(fā)展起來的一種新興理論?！咀⒁狻浚哼@里所說的“小樣本”是相對(duì)于無窮樣本而言的，故只要樣本數(shù)不是無窮，都可稱為小樣本，更嚴(yán)格地說，應(yīng)該稱為“有限樣本”。8ppt課件統(tǒng)計(jì)學(xué)習(xí)理論中的基本概念（續(xù)）機(jī)器學(xué)習(xí)

主要研究從采集樣本出發(fā)得出目前尚不能通過原理分析得到的規(guī)律,并利用這些規(guī)律對(duì)未來數(shù)據(jù)或無法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。模式識(shí)別

對(duì)表征事務(wù)或現(xiàn)象的各種形式(數(shù)值、文字及邏輯關(guān)系等)信息進(jìn)行處理和分析,以對(duì)事務(wù)或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程。統(tǒng)計(jì)學(xué)習(xí)理論

一種研究有限樣本估計(jì)和預(yù)測(cè)的數(shù)學(xué)理論9ppt課件8.3統(tǒng)計(jì)學(xué)習(xí)理論的發(fā)展簡(jiǎn)況學(xué)習(xí)過程的數(shù)學(xué)研究F.Rosenblatt于1958,1962年把感知器作為一個(gè)學(xué)習(xí)機(jī)器模型統(tǒng)計(jì)學(xué)習(xí)理論的開始Novikoff(1962)證明了關(guān)于感知器的第一個(gè)定理解決不適定問題的正則化原則的發(fā)現(xiàn)Tikhonov(1963),Ivanov(1962),Phillips(1962)Vanik和Chervonenkis(1968)提出了VC熵和VC維的概念提出了統(tǒng)計(jì)學(xué)習(xí)理論的核心概念得到了關(guān)于收斂速度的非漸進(jìn)界的主要結(jié)論10ppt課件SLT的發(fā)展簡(jiǎn)況(續(xù))Vapnik和Chervonenkis(1974)提出了結(jié)構(gòu)風(fēng)險(xiǎn)最小化（SRM）歸納原則。Vapnik和Chervonenkis(1989)發(fā)現(xiàn)了經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化歸納原則和最大似然方法一致性的充分必要條件,完成了對(duì)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化歸納推理的分析。90年代中期,有限樣本情況下的機(jī)器學(xué)習(xí)理論研究逐漸成熟起來,形成了較完善的理論體系—統(tǒng)計(jì)學(xué)習(xí)理論(StatisticalLearningTheory,簡(jiǎn)稱SLT)11ppt課件8.4統(tǒng)計(jì)學(xué)習(xí)理論的基本內(nèi)容機(jī)器學(xué)習(xí)的基本問題統(tǒng)計(jì)學(xué)習(xí)理論的核心內(nèi)容12ppt課件8.4.1機(jī)器學(xué)習(xí)的基本問題機(jī)器學(xué)習(xí)問題的表示13ppt課件學(xué)習(xí)問題的表示產(chǎn)生器(G)，產(chǎn)生隨機(jī)向量x屬于Rn,它們是從固定但未知的概率分布函數(shù)F(x)中獨(dú)立抽取的。訓(xùn)練器(S)，對(duì)每個(gè)輸入向量x返回一個(gè)輸出值y，產(chǎn)生輸出的根據(jù)是同樣固定但未知的條件分布函數(shù)F(y|x)。學(xué)習(xí)機(jī)器(LM)，它能夠?qū)崿F(xiàn)一定的函數(shù)集f(x,a)，a屬于A，其中A是參數(shù)集合。14ppt課件8.4.2機(jī)器學(xué)習(xí)的基本問題機(jī)器學(xué)習(xí)就是從給定的函數(shù)集f(x,)(是參數(shù))中,選擇出能夠最好地逼近訓(xùn)練器響應(yīng)的函數(shù)。機(jī)器學(xué)習(xí)的目的可以形式化地表示為：根據(jù)n個(gè)獨(dú)立同分布的觀測(cè)樣本

，

在一組函數(shù)中求出一個(gè)最優(yōu)函數(shù)對(duì)訓(xùn)練器的響應(yīng)進(jìn)行估計(jì),使期望風(fēng)險(xiǎn)最小

其中是未知的,對(duì)于不同類型的機(jī)器學(xué)習(xí)問題有不同形式的損失函數(shù)。

15ppt課件三類基本的機(jī)器學(xué)習(xí)問題模式識(shí)別函數(shù)逼近（回歸估計(jì)）概率密度估計(jì)【補(bǔ)充說明】：用有限數(shù)量信息解決問題的基本原則——在解決一個(gè)給定問題時(shí)，要設(shè)法避免把解決一個(gè)更為一般的問題作為其中間步驟。16ppt課件上述原則意味著，當(dāng)解決模式識(shí)別或回歸估計(jì)問題時(shí)，必須設(shè)法去“直接”尋找待求的函數(shù)，而不是首先估計(jì)密度，然后用估計(jì)的密度來構(gòu)造待求的函數(shù)。密度估計(jì)是統(tǒng)計(jì)學(xué)中的一個(gè)全能問題，即知道了密度就可以解決各種問題。一般地，估計(jì)密度是一個(gè)不適定問題(ill-posedproblem)，需要大量觀測(cè)才能較好地解決。實(shí)際上，需要解決的問題（如決策規(guī)則估計(jì)或回歸估計(jì)）是很特殊的，通常只需要有某一合理數(shù)量的觀測(cè)就可以解決。17ppt課件經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則對(duì)于未知的概率分布,最小化風(fēng)險(xiǎn)函數(shù),只有樣本的信息可以利用,這導(dǎo)致了定義的期望風(fēng)險(xiǎn)是無法直接計(jì)算和最小化的。根據(jù)概率論中大數(shù)定理,可用算術(shù)平均代替數(shù)據(jù)期望,于是定義了經(jīng)驗(yàn)風(fēng)險(xiǎn)

來逼近期望風(fēng)險(xiǎn)。經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(ERM)原則：使用對(duì)參數(shù)w求經(jīng)驗(yàn)風(fēng)險(xiǎn)的最小值代替求期望風(fēng)險(xiǎn)的最小值。18ppt課件經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化從期望風(fēng)險(xiǎn)最小化到經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化沒有可靠的依據(jù),只是直觀上合理的想當(dāng)然。期望風(fēng)險(xiǎn)和經(jīng)驗(yàn)風(fēng)險(xiǎn)都是w的函數(shù),概率論中的大數(shù)定理只說明了當(dāng)樣本趨于無窮多時(shí)經(jīng)驗(yàn)風(fēng)險(xiǎn)將在概率意義上趨近于期望風(fēng)險(xiǎn),并沒有保證兩個(gè)風(fēng)險(xiǎn)的w是同一點(diǎn),更不能保證經(jīng)驗(yàn)風(fēng)險(xiǎn)能夠趨近于期望風(fēng)險(xiǎn)。即使有辦法使這些條件在樣本數(shù)無窮大時(shí)得到保證,也無法認(rèn)定在這些前提下得到的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化方法在樣本數(shù)有限時(shí)仍能得到好的結(jié)果。19ppt課件復(fù)雜性與推廣能力學(xué)習(xí)機(jī)器對(duì)未來輸出進(jìn)行正確預(yù)測(cè)的能力稱作推廣能力（也稱為“泛化能力”）。在某些情況下,訓(xùn)練誤差過小反而導(dǎo)致推廣能力的下降,這就是過學(xué)習(xí)問題。神經(jīng)網(wǎng)絡(luò)的過學(xué)習(xí)問題是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則失敗的一個(gè)典型例子。20ppt課件用三角函數(shù)擬合任意點(diǎn)21ppt課件學(xué)習(xí)的示例22ppt課件復(fù)雜性與推廣能力（續(xù)）在有限樣本情況下，經(jīng)驗(yàn)風(fēng)險(xiǎn)最小并不一定意味著期望風(fēng)險(xiǎn)最??；學(xué)習(xí)機(jī)器的復(fù)雜性不但與所研究的系統(tǒng)有關(guān),而且要和有限的學(xué)習(xí)樣本相適應(yīng)；學(xué)習(xí)精度和推廣性之間似乎是一對(duì)不可調(diào)和的矛盾,采用復(fù)雜的學(xué)習(xí)機(jī)器雖然容易使得學(xué)習(xí)誤差更小,卻往往喪失推廣性；傳統(tǒng)的解決辦法（例如：采用正則化、模型選擇、噪聲干擾等方法以控制學(xué)習(xí)機(jī)器的復(fù)雜度）缺乏堅(jiān)實(shí)的理論基礎(chǔ)。23ppt課件8.5統(tǒng)計(jì)學(xué)習(xí)理論的核心內(nèi)容SLT被認(rèn)為是目前針對(duì)有限樣本統(tǒng)計(jì)估計(jì)和預(yù)測(cè)學(xué)習(xí)的最佳理論，它從理論上較為系統(tǒng)地研究了經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則成立的條件、有限樣本下經(jīng)驗(yàn)風(fēng)險(xiǎn)與期望風(fēng)險(xiǎn)的關(guān)系及如何利用這些理論找到新的學(xué)習(xí)原則和方法等問題。SLT的主要內(nèi)容包括:基于經(jīng)驗(yàn)風(fēng)險(xiǎn)原則的統(tǒng)計(jì)學(xué)習(xí)過程的一致性理論學(xué)習(xí)過程收斂速度的非漸進(jìn)理論控制學(xué)習(xí)過程的推廣能力的理論構(gòu)造學(xué)習(xí)算法的理論24ppt課件VC維(函數(shù)的多樣性)為了研究經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化函數(shù)集的學(xué)習(xí)一致收斂速度和推廣性，SLT定義了一些指標(biāo)來衡量函數(shù)集的性能，其中最重要的就是VC維(Vapnik-ChervonenkisDimension)。VC維：對(duì)于一個(gè)指示函數(shù)（即只有0和1兩種取值的函數(shù)）集，如果存在h個(gè)樣本能夠被函數(shù)集里的函數(shù)按照所有可能的2h種形式分開，則稱函數(shù)集能夠把h個(gè)樣本打散，函數(shù)集的VC維就是能夠打散的最大樣本數(shù)目。如果對(duì)任意的樣本數(shù)，總有函數(shù)能打散它們，則函數(shù)集的VC維就是無窮大。25ppt課件26ppt課件VC維（續(xù)）一般而言,VC維越大,學(xué)習(xí)能力就越強(qiáng),但學(xué)習(xí)機(jī)器也越復(fù)雜。目前還沒有通用的關(guān)于計(jì)算任意函數(shù)集的VC維的理論,只有對(duì)一些特殊函數(shù)集的VC維可以準(zhǔn)確知道。N維實(shí)數(shù)空間中線性分類器和線性實(shí)函數(shù)的VC維是n+1。Sin(ax)的VC維為無窮大?！?7ppt課件VC維（續(xù)）

Openproblem:

對(duì)于給定的學(xué)習(xí)函數(shù)集,如何用理論或?qū)嶒?yàn)的方法計(jì)算其VC維是當(dāng)前統(tǒng)計(jì)學(xué)習(xí)理論研究中有待解決的一個(gè)難點(diǎn)問題。28ppt課件三個(gè)里程碑定理29ppt課件推廣性的界SLT系統(tǒng)地研究了經(jīng)驗(yàn)風(fēng)險(xiǎn)和實(shí)際風(fēng)險(xiǎn)之間的關(guān)系,也即推廣性的界。根據(jù)SLT中關(guān)于函數(shù)集推廣性界的理論,對(duì)于指示函數(shù)集中所有的函數(shù),經(jīng)驗(yàn)風(fēng)險(xiǎn)和實(shí)際風(fēng)險(xiǎn)之間至少以概率滿足如下關(guān)系:

其中，h是函數(shù)集的VC維,n是樣本數(shù)。30ppt課件推廣性的界（續(xù)1）學(xué)習(xí)機(jī)器的實(shí)際風(fēng)險(xiǎn)由兩部分組成:訓(xùn)練樣本的經(jīng)驗(yàn)風(fēng)險(xiǎn)置信范圍(同置信水平有關(guān),而且同學(xué)習(xí)機(jī)器的VC維和訓(xùn)練樣本數(shù)有關(guān)。在訓(xùn)練樣本有限的情況下,學(xué)習(xí)機(jī)器的VC維越高,則置信范圍就越大,導(dǎo)致實(shí)際風(fēng)險(xiǎn)與經(jīng)驗(yàn)風(fēng)險(xiǎn)之間可能的差就越大。31ppt課件推廣性的界（續(xù)2）在設(shè)計(jì)分類器時(shí),不但要使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,還要使VC維盡量小,從而縮小置信范圍,使期望風(fēng)險(xiǎn)最小。尋找反映學(xué)習(xí)機(jī)器的能力的更好參數(shù)，從而得到更好的界是SLT今后的重要研究方向之一。32ppt課件結(jié)構(gòu)風(fēng)險(xiǎn)最小化傳統(tǒng)機(jī)器學(xué)習(xí)方法中普遍采用的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則在樣本數(shù)目有限時(shí)是不合理的,因此，需要同時(shí)最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍。統(tǒng)計(jì)學(xué)習(xí)理論提出了一種新的策略,即把函數(shù)集構(gòu)造為一個(gè)函數(shù)子集序列,使各個(gè)子集按照VC維的大小排列;在每個(gè)子集中尋找最小經(jīng)驗(yàn)風(fēng)險(xiǎn),在子集間折衷考慮經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍,取得實(shí)際風(fēng)險(xiǎn)的最小。這種思想稱作結(jié)構(gòu)風(fēng)險(xiǎn)最小化(StructuralRiskMinimization)，即SRM準(zhǔn)則。33ppt課件結(jié)構(gòu)風(fēng)險(xiǎn)最小化（續(xù)1）34ppt課件結(jié)構(gòu)風(fēng)險(xiǎn)最小化（續(xù)2）實(shí)現(xiàn)SRM原則的兩種思路在每個(gè)子集中求最小經(jīng)驗(yàn)風(fēng)險(xiǎn),然后選擇使最小經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍之和最小的子集。設(shè)計(jì)函數(shù)集的某種結(jié)構(gòu)使每個(gè)子集中都能取得最小的經(jīng)驗(yàn)風(fēng)險(xiǎn),然后只需選擇適當(dāng)?shù)淖蛹怪眯欧秶钚?則這個(gè)子集中使經(jīng)驗(yàn)風(fēng)險(xiǎn)最小的函數(shù)就是最優(yōu)函數(shù)。支持向量機(jī)方法實(shí)際上就是這種思路的實(shí)現(xiàn)。35ppt課件8.6支持向量機(jī)概述支持向量機(jī)概述支持向量機(jī)理論支持向量機(jī)核函數(shù)支持向量機(jī)實(shí)現(xiàn)36ppt課件8.6.1支持向量機(jī)概述1963年，Vapnik在解決模式識(shí)別問題時(shí)提出了支持向量方法,這種方法從訓(xùn)練集中選擇一組特征子集,使得對(duì)特征子集的劃分等價(jià)于對(duì)整個(gè)數(shù)據(jù)集的劃分,這組特征子集就被稱為支持向量(SV)。1971年，Kimeldorf提出使用線性不等約束重新構(gòu)造SV的核空間,解決了一部分線性不可分問題。1990年，Grace,Boser和Vapnik等人開始對(duì)SVM進(jìn)行研究。1995年，Vapnik正式提出統(tǒng)計(jì)學(xué)習(xí)理論。37ppt課件8.6.2支持向量機(jī)理論SVM從線性可分情況下的最優(yōu)分類面發(fā)展而來。最優(yōu)分類面就是要求分類線不但能將兩類正確分開(訓(xùn)練錯(cuò)誤率為0),且使分類間隔最大。SVM考慮尋找一個(gè)滿足分類要求的超平面,并且使訓(xùn)練集中的點(diǎn)距離分類面盡可能的遠(yuǎn),也就是尋找一個(gè)分類面使它兩側(cè)的空白區(qū)域(margin)最大。過兩類樣本中離分類面最近的點(diǎn)且平行于最優(yōu)分類面的超平面上H1,H2的訓(xùn)練樣本就叫做支持向量。38ppt課件支持向量機(jī)理論（續(xù)1）39ppt課件廣義最優(yōu)分類面40ppt課件廣義最優(yōu)分類面（續(xù)1）假定訓(xùn)練數(shù)據(jù)可以被一個(gè)超平面分開我們進(jìn)行正歸化此時(shí)分類間隔等于使最大間隔最大等價(jià)于使最小41ppt課件廣義最優(yōu)分類面（續(xù)2）最優(yōu)分類面問題可以表示成約束優(yōu)化問題MinimizeSubjectto定義Lagrange函數(shù)

42ppt課件廣義最優(yōu)分類面（續(xù)3）Lagrange函數(shù)43ppt課件一個(gè)簡(jiǎn)單的例子：x1=(0,0),y1=+1x2=(1,0),y2=+1x3=(2,0),y3=-1x4=(0,2),y4=-1可調(diào)用Matlab中的二次規(guī)劃程序，求得1,2,3,4的值，進(jìn)而求得w和b的值。44ppt課件45ppt課件8.6.3支持向量機(jī)很多情況下，訓(xùn)練數(shù)據(jù)集是線性不可分的，Vapnik等人提出了用廣義分類面（松弛子）來解決這一問題。非線性問題——通過非線性變換將它轉(zhuǎn)化為某個(gè)高維空間中的線性問題，在這個(gè)高維空間中尋找最優(yōu)分類面。46ppt課件高維空間中的最優(yōu)分類面分類函數(shù)只涉及到訓(xùn)練樣本之間的內(nèi)積運(yùn)算(xi·xj) ,因此,在高維空間中只需進(jìn)行內(nèi)積運(yùn)算,這種內(nèi)積運(yùn)算可通過定義在原空間中的函數(shù)來實(shí)現(xiàn),甚至不必知道變換的形式。SLT指出,根據(jù)Hibert-Schmidt原理,只要一種運(yùn)算滿足Mercer條件,就可以作為內(nèi)積使用。47ppt課件Mercer條件48ppt課件支持向量機(jī)在最優(yōu)分類面中采用適當(dāng)?shù)膬?nèi)積函數(shù)就可以實(shí)現(xiàn)某一非線性變換后的線性分類,而計(jì)算復(fù)雜度卻沒有增加。49ppt課件支持向量機(jī)50ppt課件8.6.4核函數(shù)SVM中不同的內(nèi)積核函數(shù)將形成不同的算法,主要的核函數(shù)有三類：多項(xiàng)式核函數(shù)徑向基函數(shù)S形函數(shù)51ppt課件8.6.5支持向量機(jī)實(shí)現(xiàn)SVMlight -2.private:/usr/local/binsvm_learn,svm_classifybsvm -2.private:/usr/local/binsvm-train,svm-classify,svm-scalelibsvm -2.private:/usr/local/binsvm-train,svm-predict,svm-scale,svm-toymySVMMATLABsvmtoolbox52ppt課件支持向量機(jī)實(shí)現(xiàn)53ppt課件8.7研究現(xiàn)狀應(yīng)用研究支持向量機(jī)研究支持向量機(jī)算法研究54ppt課件8.7.1應(yīng)用研究SVM的應(yīng)用主要于模式識(shí)別領(lǐng)域貝爾實(shí)驗(yàn)室對(duì)美國(guó)郵政手寫數(shù)字庫進(jìn)行的實(shí)驗(yàn)分類器錯(cuò)誤率人工表現(xiàn)2.5%決策樹C4.516.2%最好的兩層神經(jīng)網(wǎng)絡(luò)5.9%SVM4.0%55ppt課件SVM與神經(jīng)網(wǎng)絡(luò)（NN）的對(duì)比SVM的理論基礎(chǔ)比NN更堅(jiān)實(shí)，更像一門嚴(yán)謹(jǐn)?shù)摹翱茖W(xué)”（三要素：?jiǎn)栴}的表示、問題的解決、證明）SVM——嚴(yán)格的數(shù)學(xué)推理NN——強(qiáng)烈依賴于工程技巧推廣能力取決于“經(jīng)驗(yàn)風(fēng)險(xiǎn)值”和“置信范圍值”，NN不能控制兩者中的任何一個(gè)。NN設(shè)計(jì)者用高超的工程技巧彌補(bǔ)了數(shù)學(xué)上的缺陷——設(shè)計(jì)特殊的結(jié)構(gòu)，利用啟發(fā)式算法，有時(shí)能得到出人意料的好結(jié)果。56ppt課件“我們必須從一開始就澄清一個(gè)觀點(diǎn)，就是如果某事不是科學(xué)，它并不一定不好。比如說，愛情就不是科學(xué)。因此，如果我們說某事不是科學(xué)，并不是說它有什么不對(duì)，而只是說它不是科學(xué)。”

——

R.FeynmanfromTheFeynmanLecturesonPhysics,Addison-Wesley同理，與SVM相比，NN不像一門科學(xué)，更像一門工程技巧，但并不意味著它就一定不好！57ppt課件主要應(yīng)用領(lǐng)域手寫數(shù)字識(shí)別語音識(shí)別人臉識(shí)別文本分類58ppt課件8.7.2支持向量機(jī)研究如何針對(duì)不同的問題選擇不同的核函數(shù)仍然是一個(gè)懸而未決的問題。標(biāo)準(zhǔn)的SVM對(duì)噪聲是不具有魯棒性的,如何選擇合適的目標(biāo)函數(shù)以實(shí)現(xiàn)魯棒性是至關(guān)重要的。59ppt課件8.7.3支持向量機(jī)算法研究支持向量機(jī)的本質(zhì)是解一個(gè)二次規(guī)劃問題,雖然有一些經(jīng)典（如對(duì)偶方法、內(nèi)點(diǎn)算法等）,但當(dāng)訓(xùn)練集規(guī)模很大時(shí),這些算法面臨著維數(shù)災(zāi)難問題。為此,人們提出了許多針對(duì)大規(guī)模數(shù)據(jù)集的SVM訓(xùn)練算法。60ppt課件支持向量機(jī)算法研究（續(xù)1）思路1：分解子問題塊算法SMO算法(SequentialMinimalOptimization)思路2：序列優(yōu)化思路3：近鄰SVM61ppt課件支持向量機(jī)算法研究（續(xù)2）訓(xùn)練SVM的絕大多數(shù)算法都是針對(duì)分類問題,只有一小部分算法考慮了回歸函數(shù)的估計(jì)問題。提高算法效率、降低復(fù)雜度。62ppt課件支持向量機(jī)算法研究（續(xù)3）SVM增量學(xué)習(xí)算法的研究超球面SVM算法研究One-classSVM算法……SVM多值分類器算法One-against-the-rest（一對(duì)多方法）One-against-one（一對(duì)一方法）Multi-classObjectiveFunctions（多類SVM）DecisionDirectedAcyclicGraph,DDAGSVMDecisionTree超球面SV

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

統(tǒng)計(jì)學(xué)習(xí)理論與SVM-課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

統(tǒng)計(jì)學(xué)習(xí)理論與SVM-課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔