




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、支持向量機(jī)( support vector machine,SVM) OutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機(jī)SVM的研究與應(yīng)用SVM的理論基礎(chǔ)傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別方法只有在樣本趨向無窮大時(shí),其性能才有理論的保證。統(tǒng)計(jì)學(xué)習(xí)理論(STL)研究有限樣本情況下的機(jī)器學(xué)習(xí)問題。SVM的理論基礎(chǔ)就是統(tǒng)計(jì)學(xué)習(xí)理論。傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別方法在進(jìn)行機(jī)器學(xué)習(xí)時(shí),強(qiáng)調(diào)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化。而單純的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化會(huì)產(chǎn)生“過學(xué)習(xí)問題”,其推廣能力較差。推廣能力推廣能力是指: 將學(xué)習(xí)機(jī)器(即預(yù)測(cè)函數(shù),或稱學(xué)習(xí)函數(shù)、學(xué)習(xí)模型)對(duì)未來輸出進(jìn)行正確預(yù)測(cè)的能力。過學(xué)習(xí)問題“過學(xué)習(xí)問題過學(xué)習(xí)問題”:某些情況下
2、,當(dāng)訓(xùn)練誤差過小反而會(huì)導(dǎo)致推廣能力的下降。例如:對(duì)一組訓(xùn)練樣本(x,y),x分布在實(shí)數(shù)范圍內(nèi),y取值在0,1之間。無論這些樣本是由什么模型產(chǎn)生的,我們總可以用y=sin(w*x)去擬合,使得訓(xùn)練誤差為0.SVM根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論,學(xué)習(xí)機(jī)器的實(shí)際風(fēng)險(xiǎn)由經(jīng)驗(yàn)風(fēng)險(xiǎn)值和置信范圍值兩部分組成。而基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化準(zhǔn)則的學(xué)習(xí)方法只強(qiáng)調(diào)了訓(xùn)練樣本的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小誤差,沒有最小化置信范圍值,因此其推廣能力較差。Vapnik 提出的支持向量機(jī)(Support Vector Machine, SVM)以訓(xùn)練誤差作為優(yōu)化問題的約束條件,以置信范圍值最小化作為優(yōu)化目標(biāo),即SVM是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的學(xué)習(xí)方法,其推
3、廣能力明顯優(yōu)于一些傳統(tǒng)的學(xué)習(xí)方法。形成時(shí)期在19921995年。 SVM由于SVM 的求解最后轉(zhuǎn)化成二次規(guī)劃問題的求解,因此SVM 的解是全局唯一的最優(yōu)解SVM在解決小樣本、非線性及高維模式識(shí)別問題在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中Joachims 最近采用SVM在Reuters-21578來進(jìn)行文本分類,并聲稱它比當(dāng)前發(fā)表的其他方法都好 OutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機(jī)SVM的研究與應(yīng)用線性判別函數(shù)和判別面一個(gè)線性判
4、別函數(shù)(discriminant function)是指由x的各個(gè)分量的線性組合而成的函數(shù) 兩類情況:對(duì)于兩類問題的決策規(guī)則為:如果g(x)0,則判定x屬于C1,如果g(x)0;當(dāng);當(dāng)x點(diǎn)在超平面的負(fù)側(cè)時(shí),點(diǎn)在超平面的負(fù)側(cè)時(shí),g(x)0,則判定x屬于C1,如果g(x)0,則判定x屬于C2,如果g(x)=0,則可以將x任意分到某一類或者拒絕判定。 廣義線性判別函數(shù)廣義線性判別函數(shù)設(shè)計(jì)線性分類器 Fisher線性判別方法如:Fisher線性判別方法,主要解決把d維空間的樣本投影到一條直線上,形成一維空間,即把維數(shù)壓縮到一維。然而在d維空間分得很好的樣本投影到一維空間后,可能混到一起而無法分割。但一
5、般情況下總可以找到某個(gè)方向,使得在該方向的直線上,樣本的投影能分開的最好。目的是降維,在低維空間中分割OutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機(jī)SVM的研究與應(yīng)用最優(yōu)分類面 SVM 是從線性可分情況下的最優(yōu)分類面發(fā)展而來的, 基本思想可用圖2的兩維情況說明. 圖中, 方形點(diǎn)和圓形點(diǎn)代表兩類樣本, H 為分類線,H1, H2分別為過各類中離分類線最近的樣本且平行于分類線的直線, 它們之間的距離叫做分類間隔(margin)。 所謂最優(yōu)分類線就是要求分類線不但能將兩類正確分開(訓(xùn)練錯(cuò)誤率為0),而且使分類間隔最大.推廣到高維空間,最優(yōu)分類線就變?yōu)樽顑?yōu)分類面。 最優(yōu)分類面如
6、何求最優(yōu)分類面 最優(yōu)分類面OutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機(jī)SVM的研究與應(yīng)用支持向量機(jī) 上節(jié)所得到的最優(yōu)分類函數(shù)為:該式只包含待分類樣本與訓(xùn)練樣本中的支持向量的內(nèi)積 運(yùn)算,可見,要解決一個(gè)特征空間中的最優(yōu)線性分類問題,我們只需要知道這個(gè)空間中的內(nèi)積運(yùn)算即可。對(duì)非線性問題, 可以通過非線性變換轉(zhuǎn)化為某個(gè)高維空間中的線性問題, 在變換空間求最優(yōu)分類面. 這種變換可能比較復(fù)雜, 因此這種思路在一般情況下不易實(shí)現(xiàn).*1( )sgnsgn()kiiiif xwxby x xb支持向量機(jī)核函數(shù)的選擇SVM方法的特點(diǎn)非線性映射是SVM方法的理論基礎(chǔ),SVM利用內(nèi)積核函數(shù)
7、代替向高維空間的非線性映射;對(duì)特征空間劃分的最優(yōu)超平面是SVM的目標(biāo),最大化分類邊際的思想是SVM方法的核心;支持向量是SVM的訓(xùn)練結(jié)果,在SVM分類決策中起決定作用的是支持向量。SVM 是一種有堅(jiān)實(shí)理論基礎(chǔ)的新穎的小樣本學(xué)習(xí)方法。它基本上不涉及概率測(cè)度及大數(shù)定律等,因此不同于現(xiàn)有的統(tǒng)計(jì)方法。從本質(zhì)上看,它避開了從歸納到演繹的傳統(tǒng)過程,實(shí)現(xiàn)了高效的從訓(xùn)練樣本到預(yù)報(bào)樣本的“轉(zhuǎn)導(dǎo)推理”(transductive inference) ,大大簡(jiǎn)化了通常的分類和回歸等問題。SVM方法的特點(diǎn)SVM 的最終決策函數(shù)只由少數(shù)的支持向量所確定,計(jì)算的復(fù)雜性取決于支持向量的數(shù)目,而不是樣本空間的維數(shù),這在某種意
8、義上避免了“維數(shù)災(zāi)難”。少數(shù)支持向量決定了最終結(jié)果,這不但可以幫助我們抓住關(guān)鍵樣本、“剔除”大量冗余樣本,而且注定了該方法不但算法簡(jiǎn)單,而且具有較好的“魯棒”性。這種“魯棒”性主要體現(xiàn)在:增、刪非支持向量樣本對(duì)模型沒有影響;支持向量樣本集具有一定的魯棒性;有些成功的應(yīng)用中,SVM 方法對(duì)核的選取不敏感。OutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機(jī)SVM的研究與應(yīng)用SVM 應(yīng)用近年來SVM 方法已經(jīng)在圖像識(shí)別、信號(hào)處理和基因圖譜識(shí)別等方面得到了成功的應(yīng)用,顯示了它的優(yōu)勢(shì)。SVM 通過核函數(shù)實(shí)現(xiàn)到高維空間的非線性映射,所以適合于解決本質(zhì)上非線性的分類、回歸和密度函數(shù)估計(jì)等
9、問題。支持向量方法也為樣本分析、因子篩選、信息壓縮、知識(shí)挖掘和數(shù)據(jù)修復(fù)等提供了新工具。 支持向量機(jī)的研究對(duì)支持向量機(jī)的研究主要集中在對(duì)SVM本身性質(zhì)的研究以及加大支持向量機(jī)應(yīng)用研究的深度和廣度兩方面。SVM訓(xùn)練算法訓(xùn)練算法傳統(tǒng)的利用標(biāo)準(zhǔn)二次型優(yōu)化技術(shù)解決對(duì)偶問題的方法,是SVM訓(xùn)練算法慢及受到訓(xùn)練樣本集規(guī)模制約的主要原因。目前已提出了許多解決方法和改進(jìn)算法,主要是從如何處理大規(guī)模樣本集的訓(xùn)練問題、提高訓(xùn)練算法收斂速度等方面改進(jìn)。主要有:分解方法、修改優(yōu)化問題法、增量學(xué)習(xí)法、幾何方法等分別討論。 SVM分類算法SVM分類算法分類算法訓(xùn)練好SVM分類器后,得到的支持向量被用來構(gòu)成決策分類面。對(duì)于大規(guī)模樣本集問題,SVM訓(xùn)練得到的支持向量數(shù)目很大,則進(jìn)行分類決策時(shí)的計(jì)算代價(jià)就是一個(gè)值得考慮的問題。解決方法如:縮減集(Reduced Set) SVM方法,采用縮減集代替支持向量集,縮減集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025福建福州萬山電力咨詢有限公司校園招聘46人筆試歷年參考題庫附帶答案詳解
- 健康巡講科學(xué)健身課件
- 醫(yī)保相關(guān)政策解讀課件
- 企業(yè)安全生產(chǎn)會(huì)議記錄內(nèi)容
- 班克街教育方案實(shí)施綱要
- 年會(huì)流程安排
- 腦出血早期降壓治療新進(jìn)展
- 2024年山東省曹縣人民醫(yī)院公開招聘護(hù)理工作人員試題帶答案詳解
- 學(xué)生用不用網(wǎng)上教學(xué)課件
- 2025年中國(guó)干燥筒行業(yè)市場(chǎng)發(fā)展前景及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 胸痛單元建設(shè)課件介紹
- 超市消防安全管理制度制度
- 酒店服務(wù)流程與空間布局優(yōu)化
- DB11∕T 2380-2024 城市軌道交通工程蓋挖法施工技術(shù)規(guī)程
- (2025)醫(yī)療護(hù)理員理論考試試題含答案
- 2025年貴州省中考英語真題含答案
- 2025年廣西中考語文試題卷(含答案)
- 建設(shè)工程法律培訓(xùn)
- 江蘇省南通市2024-2025學(xué)年高二下學(xué)期6月期末質(zhì)量監(jiān)測(cè)政治試題(含答案)
- (高清版)DB31∕T 1427-2023 首席質(zhì)量官評(píng)價(jià)規(guī)范
- 一級(jí)醫(yī)院醫(yī)保管理制度
評(píng)論
0/150
提交評(píng)論