SVM理論和算法分析報告

上傳人：z*** IP屬地：天津上傳時間：2022-02-05 格式：DOC 頁數(shù)：25 大?。?36.50KB 積分：25 舉報 版權(quán)申訴

免費預(yù)覽已結(jié)束，剩余22頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、硬間隔線性支撐向量機(jī)假設(shè)給定一個特征空間上的訓(xùn)練數(shù)據(jù)集:T= (xi,yi)，(X2,y2)，(xn$n)其中，x i Rn, yi + 1,- 1, i = 1,2,N Xi為第i個特征向量或?qū)嵗?，yi為xi的類標(biāo)記，當(dāng)yi = 1時，稱 Xi為正例，當(dāng)yi = - 1時，稱xi為負(fù)例；（Xi , yi）為樣本點。假設(shè)訓(xùn)練數(shù)據(jù)集是線性可分的（存在硬間隔），那么學(xué)習(xí)的目標(biāo)是在特征空間找到一個分離超平面，能將實例分到不同的類。分離超平面方程w?x + b = 0，它由法向量 w和截距b決定，可用（w,b）表示。分離超平面將特征空間分為兩部分，一部分是正類，一部分是負(fù)類。法向量指向的一側(cè)為正類，另

2、一側(cè)是負(fù)類。一般地，當(dāng)訓(xùn)練數(shù)據(jù)集線性可分時，存在無窮個分離超平面可將兩類數(shù)據(jù)正確分開，感知機(jī)利用誤分類最小的策略，求得分離超平面，不過這是的解有無窮多。線性可分支撐向量機(jī)利用間隔最大化求最優(yōu)分離超平面，解唯一、模型推導(dǎo)1.函數(shù)間隔：一般來說，一個點距離分離超平面的遠(yuǎn)近可以表示分類預(yù)測的確信程度。在超平面w?x+ b= 0確定的情況下，|w?x+ b|能夠相對地表示（注意：真實距離為也藝）點x距離超平面的遠(yuǎn)近。而w ?x + b的符/w/號與類標(biāo)記y的符號是否一致能夠表示分類是否正確。所以可用標(biāo)量y（w?x + b）來表示分類的正確性及確信度，值為正表示分類正確，值為負(fù)表示分類錯誤。超平面（

3、?, ?）關(guān)于樣本點（？?, ?）的函數(shù)間隔為：? = ?(? ?+ ?)超平面(?, ?)關(guān)于訓(xùn)練數(shù)據(jù)集T的函數(shù)間隔：? = ? ? = ? ?(? + ?) ? ?、 ? /CC CC CC /2.幾何間隔：函數(shù)間隔可以表示分類預(yù)測的正確性及確信度，但是選擇分離超平面時，只有函數(shù)間隔還不夠。因為只要成比例地改變 w和b,雖然超平面并沒有改變，但函數(shù)間隔（它是（w,b）的線性函數(shù)）卻依原比例同等改變。為了將（w,b）表示的超平面的唯一化，即每個超平面對應(yīng)Rn+1中的唯一向量（w,b），可以對法向量 w加以規(guī)范化約束/w / = 1，這時函數(shù)間隔稱為幾何間隔。超平面（?, ?）關(guān)于樣本點（？

4、?, ?）的幾何間隔為：?超平面（?, ?）關(guān)于訓(xùn)練數(shù)據(jù)集T的幾何間隔為:? ?=?,?, ? ?= ?,?; ? -'/? / /? /? = ? ?= ?( ? +on on on cc on no no'二 cc ' ' II ' ' ' ' '/3間隔最大化支撐向量機(jī)學(xué)習(xí)的基本想法是求解能夠正確劃分訓(xùn)練數(shù)據(jù)集并且?guī)缀伍g隔最大的分離超平面。對于線性可分的訓(xùn)練數(shù)據(jù)集而言，線性可分分離超平面有無窮多個，每一個都是一個感知機(jī)，但是幾何間隔最大的分離超平面時唯一的。間隔最大化的直觀解釋是：對訓(xùn)練數(shù)據(jù)集找到幾何間隔最大的超

5、平面意味著以充分大的卻新都對訓(xùn)練數(shù)據(jù)進(jìn) 行分類。也就是說，不僅將正負(fù)實例點要分開，而且對最難分的實例點（離超平面最近的點）也有足夠多大的確信度將它們分開。因此所要優(yōu)化的問題表示為：?,?> ?, ? = ?, ?,? ?改寫為,?,?II? /? ?(?+ ?) >?,? = ?,?,?Y的取值不影響最優(yōu)化問題的解（如果w ?,b?是最優(yōu)解，那么入w ?,入b?也是最優(yōu)解，因此丫？是變動的可以取到任意值，如果固定Y? ,w?,b?也就變得唯一了），令丫？ = 1,等價變換為，?,? /? /? ? ?(? ? + ?) > ? ?=?？這是為了運算方便)， ? II?

6、/?'?,? ?- ?"(?"+ ?) < ? ?=?？ ?, b?。(目標(biāo)函數(shù)是支撐間隔，約束是樣本點在間隔邊界或外側(cè)，目標(biāo)是尋找支撐向量使得間隔最大化)等價變換為(標(biāo)準(zhǔn)無等式約束的凸二次規(guī)劃，?.?凸二次規(guī)劃問題存在全局最優(yōu)解w(4)分離超平面與分類決策函數(shù) 分離超平面：? ? + ? = ?分類決策函數(shù):?(?) = ?(?+ ?)(5)支撐向量與間隔邊界在線性可分情況下，訓(xùn)練數(shù)據(jù)集的樣本點中與分離超平面距離最近的樣本點的實例稱為支撐向量，支撐向量是使約束條件等號成立的點，即？- ?(? ?+ ?) = ?，對于正例點，支撐向量在超平面? +?= ?上

7、，對于負(fù)例點，支撐向量在超平面？？?？+ ?= - ?上，沒有實例點落在這兩個平行的超平面?(間隔邊界)之間，這兩個超平面之間的距離稱為間隔，它依賴于分離超平面的法向量W等于用幾。在決定分離超平面時只有支持向量起作用，而其他實例點并不起作用。如果移動支持向量將改變所求的解，但是如果在間隔邊界以外移動其他實例點，甚至去掉這些點，則解是不會改變的。顯然支撐向量是訓(xùn)練集中重要的樣本。二、模型求解將原始問題轉(zhuǎn)化為Lagrange對偶問題，通過求解對偶問題來獲得原始問題的最優(yōu)解：對每個不等式約束引入 Lagrange 乘子 a i ,1. Lagrange對偶函數(shù)：?刀?= ?(?,?,?)

8、= ? /? /?- 刀 ?(? ?+ ?) ?= ?1,2,，N。其中a = ( a 1, a 2,，a n)T為拉格朗日乘子向量，a i > 0 , i = 2.對偶問題：maxmin L(w b, a )a Wb(1) 求?(?, ?,?)?W_(W,b, a ) = W-?bL(W,b, a )=-N刀i = 1N刀i = 1a iyi Xi = 0a iyi = 0得出NW=刀 a i yii =1NXi刀 a i yi = 0i =1帶入拉格朗日函數(shù)，得出? ?(? ? ?)? ' ? ?= 工工 ? ?(? ?)?= ? ?= ?刀？?？?？（?=?刀？?？?？

9、 ?) ? + ?) + 刀 ?= ? ?= ? ?-?刀刀？?？?？?？?(？?？?？?)+ 刀?= ? ?= ? ?= ?(2) 求? ? ?(?, ?, ?)? ?,? 1 1? ? (-?刀刀? ?(? ?) + ?= ?=?刀?)?= ?. ?.刀? = ?= ? > ? , ?= ?,?, ,?轉(zhuǎn)換為求極小? ? ( T？?厶?刀?(?)-?= ? ?= ?刀?)?= ?根據(jù)對偶理論，對上述對偶優(yōu)化存在，使w 可以轉(zhuǎn)化為求解對偶問題。3.最優(yōu)解根據(jù)KKT條件?. ?.刀? = ?= ? > ? , ?= ?,?, ,？a ?是對偶問題的解，因此求解原始問題,?,b?是

10、原始問題的解,)=w?-寸*=1 a ?yi)=-寸=1 a ?yi =a ?(yi (w/? ?xi + b?) - 1) = 0 , i = 1,2,N-yi (w7?Xi + b?) - 1 > 0, i = 1,2,-,Na ? > 0, i =-(e)?ML(W b?,?b?L(w?, b?.12,，N由（a）求得其中至少有一個a 條件（C），得出? > 0 (如果a將?帶入KKT條件，得出Xj = 0 0(a)(b )(c)(d )?=刀? ?= ?0，那么w?= 0 ,b?無解，顯然它不是原始最優(yōu)化問題的解），結(jié)合 KKTyk(w ?xk + b?) - 1 =

11、 0Nyk (刀 a ?yiXi) ? xk+ b?) = 1i =1兩邊同時乘以yk，由于（yj2= 1N?ykVk(刀 a iyxj ? Xk+ b?) = yki = 1N刀 a ?yi (Xi ?Xk) + b? = yki =1? ?' = ?- X ?(?)?= ?因此分類決策函數(shù)為? ?(?) = ?( X ?(?) + ?)?= ?從?, ?中可以看出它們僅僅依賴于？ ? > 0的特征點，即支撐向量（因為yk（腫？Xk+ b?） - 1=0? W Xk + b? = ±1，所有x k在分隔邊界上）；這仍是一個二次凸優(yōu)化，存在全局最優(yōu)解, 二、模型求解仍使

12、用Lagrange對偶方法求解1.Lagrange 函數(shù)軟間隔線性支撐向量機(jī)一、模型推導(dǎo)如果樣本集中存在特異點使得樣本集線性不可分，即不能滿足函數(shù)間隔大于等于1不等式約束條件，為了解決這個問題，可以對每個樣本點 (Xi , yi)引入一個松弛變量E i > 0，使函數(shù)間隔加上松弛變量大于等于1.這樣約束條件變?yōu)?(?+ ?) > ?- ?同時對每個松弛變量E i，支付一個代價E i，目標(biāo)函數(shù)變成? ?II? /'+ ?刀 E i? ? ?' ?= ?這里，C > 0稱為懲罰參數(shù)，一般由應(yīng)用問題決定，C值大時對誤分類的懲罰增大，C值小時對誤分類的懲罰減小。最小化

13、上述目標(biāo)函數(shù)有兩層含義，要使的1 /W I2盡量小即間隔盡量大，同時使的誤分類的點的個數(shù)盡量小，C是調(diào)和二者的系數(shù)。這時的間隔稱為軟間隔，因為間隔內(nèi)含義特異點。原始優(yōu)化問題：? II? /?+ ?刀? ? ?, ?=?.?. ?- ?- ?(?+ ?) < ?, ? = ?,?,? > ?=?？: , , , , ?(?,?,?,?,?)= 刁 /?刀?= ?-刀?(?(?+ ?) - ?+ ?)-刀?= ? ?= ?其中，? > ?, ? > ?。2.對偶問題：?第?？?(?,？?,？?,？?,？?) ! - - -?,?(1)求? ?(?, ?, ?, ?, ?)?

14、 ? ? ' ' ' ' ! - - -?wL(w,b, Ew-刀 a i yi xi = 0i = 1N得出?bL(wb,=-刀 a iyji = 1C?1Tw=刀 a i yi xii =1N刀 a i yi = 0i =1C- a i - 口 i =w的解是唯一的，但 b的解不唯一，b的解存在于一個區(qū)間。帶入拉格朗日函數(shù)，得出? ?(?,?,?,?,?)=- 刀刀？?？?？?？?(？?？?？?)+ 刀？? ? ? ''?=? ?= ?= ?注意它與口無關(guān)。(2) 求 ? ?(? ? ? ? ?) ? ? ? ?' ' &#

15、39; ' ! - -? ?(- 刀刀?(? ?) + 刀?) ? -? ?刀?=:?= ?> ? >?=? ? 5 5？5 ?> ?,?=? ? 5 5？5 ?-?=? >?= ?,?,?-？5 ''?= ?=? ?= ?消去口 i ,轉(zhuǎn)換為求極小? ?(刃刀刀? ?(? ?)- ？=?= ?刀?)?= ?. ?.刀? = ?= ? > ? ?= ? ? < ? < ?(3)最優(yōu)解根據(jù)KKT條件?w?L(w? ,b?,?,a ?,?):=W -寸=1 a ?yi Xi?b?L(w?,b',?,a ?,?):=-XN=

16、1 a ?yi = 0-?L(w7,b',?',a ?,?')To?=C?1T- a ? - ?a ?(yi (w? ?Xi + b?) - 1?+ ?i)=0 , i = 1,2, -, N-=0-0Q Q?i?i =0 , i = 12,(a)(b) -(c)-(d)(e)?i > 0 , i = 12,N-(f)yi (w/?xi + b?) - 1 + ? > 0, i = 1,2，N(g)a ? > 0, i = 12,-",N-(h)? > 0, i = 12,-,N-(i)由(a)求得?=oX ? ? ? ?= ?由(c)

17、、( e)(i )得出? ?(? - ?) ? = ?Q? - ? > ?再結(jié)合(f)得出如果? ? <?，那么？ =?;如果?=? ?5? > ?;-:J (j )由(d) ,( h)得出如果?> 0,那么?(? ? +? ?) - ?+ ?=?;如果? =? ?:?, ?(? ?+ ?)? +?不確定；-(k)由(j) , (k)得出如果? <?< ?,那么？?？= ?,?(?+ ?)-?+?= ?，因此？?(？?？?+?)= ?；? ?' = ?- X ?(?)?= ?由(j) , (g)得出如果?= ?，那么?= ?, ?K?+ ?) &

18、gt; ?;這說明位于間隔邊界上或以外；由(j)，(k)得出如果?= ?，那么?(? ?+ ?) = ?- ?, ? > ?；此種情況下，進(jìn)一步討論：?如果？?？= ?，那么？?在間隔邊界上；如果? < ?< 1那么？勿分類正確，？?在間隔邊界與分離超平面之間；如果? = ?，那么？活在分界面上；如果? > 1那么？?在分離超平面誤分一側(cè)；因此可以看出，軟間隔的支撐向量(？？> 0) ?或者在間隔邊界上，或者在間隔邊界與分離超平面之間，或者在分離超平面誤分一側(cè)。3.支撐向量的另一種解釋最小化以下目標(biāo)函數(shù)：NX 1 - yi (w?xi + b)+ +

19、入 IIw fi =1第一項是經(jīng)驗損失或經(jīng)驗風(fēng)險，函數(shù)稱為合頁損失函數(shù)L(y(w?x + b) = 1 - yj (w?xi + b) +，下標(biāo)“ + "表示以下取正值得函數(shù)。+z z > 0z+ = 0 z < 0也就是說，當(dāng)樣本點被正確分類且函數(shù)間隔大于1時，損失函數(shù)為0,否則(x i為支撐向量時)損失函數(shù)是1- yj (w?xj + b)，第二項是系數(shù)為入的 w的L 2范數(shù)，是正則化項；這兩種優(yōu)化是等價的(通過變量替換方法);非線性支撐向量機(jī)對于分類問題是非線性的(線性模型無法將正負(fù)實例正確分開)，可以利用核技巧，進(jìn)行一個非線性變換，將非線性問題變換為線性問題

20、，通過解變換后的線性問題的方法求解原來的非線性問題。用線性分類方法求解非線性分類問題問題分兩步：首先使用一個變換將原空間的數(shù)據(jù)映射到新空間；然后再新空間里用線性分類學(xué)習(xí)方法從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)分類模型；核技巧應(yīng)用到支持向量機(jī)，其基本思想：通過一個非線性變換將輸入空間(歐氏空間Rn或離散集合)對應(yīng)于一個特征空間(希爾伯特空間H),使得在輸入空間R n中的超曲面模型對應(yīng)于特征空間H中的超平面模型(支撐向量機(jī))，這樣分類問題的學(xué)習(xí)任務(wù)通過在特征空間中求解線性支撐向量機(jī)就可以完成。一、非線性支撐向量機(jī)在線性支撐向量機(jī)的對偶問題中，無論是目標(biāo)函數(shù)還是決策函數(shù)(分離超平面)都只涉及輸入實例與實例之間的內(nèi)積，

21、如果把這個內(nèi)積？?？?看作是希爾伯特空間中的兩個特征的內(nèi)積？?)? ?(?)= ?(?,?) = ? ?，其中？?？= ?(?) , ?= ? (?)，那么對于在低維線性不可分的樣本集 ?，?= 1,2, ,?，如果通過映射？?變換到高維希爾伯特空間?，?= 1,2,?變得線性可分(假設(shè) 能找到這樣的合適的映射？?)，那么就可以使用核函數(shù)？?,？?)代替計算?，這里？?， ?未/ / / /知，但？?，?，?(?,?)已知。使用核函數(shù)后的對偶問題的目標(biāo)函數(shù)成為：? ? ?(?) = ?刀刀? ?(? ?)-刀? ?= ?=?= ?最優(yōu)解成為?'=刀? ?= ? ? ? = ?- 刀

22、 ?( ? ?)?= ?分類決策函數(shù)成為?(?) = ?(刀?(? ?) + ?)?=?在實際應(yīng)用中，往往依賴領(lǐng)域知識直接選擇核函數(shù)，核函數(shù)選擇的有效性需要通過實驗驗證。二、核函數(shù)方法核函數(shù)：設(shè)X是輸入空間(歐氏空間R n的子集或離散集合)，H為特征空間(希爾伯特空間)，如果存在一個從X到H的映射，?(x):X f H使得對所有x ,z X，函數(shù)K (x,z)滿足條件K(x,z) = ?(x) ?(z)則稱K(x,z)為核函數(shù)，？(x)為映射函數(shù)，？(x)?(z)為?(x)和?(z)內(nèi)積；(希爾伯特空間是完備化的內(nèi)積空間，其中的每個元素是一個向量(可以無窮維)，向量之間定義有內(nèi)積運算，且空

23、間關(guān)于內(nèi)積誘導(dǎo)出的范數(shù)是完備的) 核技巧的想法是：在學(xué)習(xí)與預(yù)測中只定義核函數(shù)K (x,z)，而不顯示地定義映射函數(shù)？，因為通常直接計算 K(x,z)比較容易，而通過?(x)和?(z)計算K(x,z)并不容易。注意，？(x)是輸入空間R n到特征空間H的映射，特征空間H般是高維的，甚至是無窮維的。我們需要的是特征空間中兩個特征的內(nèi)積結(jié)果，而不是特征的表示。如果我們能通過簡單的函數(shù)K(x,z)得到?(x) ?(z)的內(nèi)積，那就簡化了問題，不用考慮？?的形式，這正是核函數(shù)的妙用之處。對于給定的核函數(shù)K (x,z)，特征空間H (希爾伯特子空間)和映射函數(shù)？?的取法不唯一，因為核函數(shù)給出的是映射

24、后的內(nèi)積結(jié)果，所選取的映射過程可能是不同的。核函數(shù)判定定理：設(shè)K:X XX- F是對稱函數(shù)，貝叮(x,z)為正定核函數(shù)的充要條件是對任意xi X,i =1,2,m K(x,z)對應(yīng)的 Gram矩陣:K= K(?, ?)mxm是半正定的。對于一個具體函數(shù)K (x,z)來說，檢驗它是否為正定核函數(shù)并不容易，因為要去對任意有限輸入集驗證K對應(yīng)的Gram矩陣是否為半正定。在實際問題中往往應(yīng)用已有的核函數(shù)。常用核函數(shù)：(1) 多項式核函數(shù)：K(x,z) = (x?z+ 1)p,對應(yīng)的支撐向量機(jī)是一個 p次多項式分類器；(2) 高斯核函數(shù)：K(x,z) = exp (- 謬)，對應(yīng)的支撐向量機(jī)是高斯徑向基

25、函數(shù)分類器；(3) 字符串核函數(shù)：1) 基本定義：有限字符表工；字符串s: s(1)s(2)s(|s|),字符串s的長度|s|，空字符串長度為0;字符串連接：st , s和t分別是字符串；長度為n的字符串集合工n;所有字符串的集合：工?= ?n=0工n;s 的子串 u:給定一個指標(biāo)序列i = (i 1, i 2, ,i |u|), 1 < i 1 < i 2 < ? << |s|, u = s(i)=s(ijs(i2)s(i|u|)，其長度記作 l (i ) = i|u| - i 1 + 1，如果 i 是連續(xù)的，則1 (i) = |u|；否則1 (i) >

26、 |?|。2) 映射定義：?假設(shè)S是長度大于或等于n字符串的集合，s是S的元素，建立字符串集合S到特征空間？?？= ?-的映射 ? ?(?), ?表示定義在?-上的實數(shù)空間，其每一維對應(yīng)一個字符串？£?，映射？?(？?)將字符串s ?對應(yīng)于空間中？?？的一個向量，其在u維上的取值為?(?)?(?) ? = E?:?(?)=?，這里，0 < ? < 1是一個衰減參數(shù)，？?)表示字符串i的長度，求和在s中所有與u相同的子串上進(jìn)行。說明：u代表維，如在字符串u維，顯然空間有|藝|n維，每一維是字母表藝上的一個長度為n的字符串； ?(?)是表示通過指標(biāo)序列i，表示的一個s的子

27、串，這個子串可以不連續(xù)；？?(？?)= u表示s的子串?(?)等于u;l (i)是子串？?(？?)在s中的指標(biāo)序列i的最后一個分量減去第一個分量然后加一；例子：假設(shè)工為英文字符集，n為3，S為長度大于或等于3的字符串集合，考慮將字符集S映射到特征空間?3?3= ?"，?3的一維對應(yīng)于字符串 asd，這是，字符串“ Nasdaq”在這一維上的值是?(?asdaq)asd = ?3,只有一個子串a(chǎn)sd，序號是234；字符串“ lass das ”在這一維上的值是?(lass das) asd = 2?5，因為有兩個asd，序號分別為236,246;3) 核函數(shù)兩個字符創(chuàng)s和t的字符串核

28、函數(shù)是基于映射的特征空間中的內(nèi)積：kn(S,t)= 刀?(?) ?(?) ?= 刀?(?)?(?)? (i j )：s(i ) = t(j )= u它給出了字符串s和t中長度等于n的所有子串組成的特征向量的余弦相似度。直觀上，兩個字符串相同的子串越多，它們就越相似，字符串核函數(shù)的值就越大，字符串核函數(shù)可以由動態(tài)規(guī)劃快速計算。序列最小最優(yōu)化算法支撐向量機(jī)的學(xué)習(xí)問題可以形式化為求解凸二次規(guī)劃問題，具有全局最優(yōu)解，并且有很多最優(yōu)化算法可以用于求解這一問題。但是當(dāng)訓(xùn)練樣本容量很大時，這些算法往往變得非常低效。序列最小最優(yōu)化算法，由 Platt在1998年提出，它是一種啟發(fā)式算法，相對比較高效。SM

29、(算法基本思路是：如果所有變量的解都滿足次最優(yōu)化問題的KKT條件，那么這個最優(yōu)化問題的解就得到了，因為KKT條件是該最優(yōu)化問題的充分必要條件，否則，選擇兩個變量，固定其他變量，針對這個兩個變量構(gòu)建一個二次規(guī)劃問題，這個二次規(guī)劃問題關(guān)于這兩個變量的解應(yīng)該更接近原始二次規(guī)劃問題的解，因為這會使得原始二次規(guī)劃問題的目標(biāo)函數(shù)值變得更小。重要的是，這時子問題可以通過解析方法求解，子問題有兩個變量，一個是違反 KKT條件最嚴(yán)重的那一個，另一個由約束條件自動確定。如此，算法將原問題不斷分解為子問題并對子問題求解，進(jìn)而達(dá)到求解原問題的目的。原始優(yōu)化問題：Nmin /w+ CE E i w,b, E 2i

30、 =1s.t yi (w?Xi + b) > 1 - E i , i = 1,2，,NE i >0,i = 1,2，N對偶問題:N1min 刀a 2刀 a ii =1j =1a jyiyjK(Xi ,Xj)-刀 a ii =1S.t .0 <子問題的兩個變量只有一個是自由變量，假設(shè)a 的等式約束可知：NE a i yi = 0i =1< C,i = 1,2,N,a 2為兩個變量，固定a3,a 4,，a N,那么根據(jù)上面N*1 =-刀 a i yii =3由于y i ?yi = 1，所以1 = - y 1 刀 a i yii =2如果a 2確定，那么a 1也隨之確定，所以

31、子問題中同時更新兩個變量。優(yōu)化子問題：SMO?法包含兩個部分：求解兩個兩個變量二次規(guī)劃的解析方法和選擇變量的啟發(fā)式方法。不失一般性，假3 ,1 2K22 a 2+ y1y2K12 a 1 a 2 - ( a 1 + a 2) + y1 a 1 刀 yi a i K1i =3設(shè)選擇的兩個變量是a 1 ,a 2，其他變量a 3 , a 4,，a n固定，于是SMO勺優(yōu)化問題的子問題可以寫成:N1 2min W a 1, a 2） = 2 K11 a 1 + a 1 , a 22N+ y2 a 2 刀 yi ai = 3i K2S.t .其中，K ij = K(Xi,Xj) , i,j = 1,2,

32、，N,?是常數(shù)，目標(biāo)函數(shù)中省略了不含aa 2的常數(shù)項。a 1y 1 + a 2y2 =-刀 a i yi = ?i =3（1）求解兩變量二次規(guī)劃的解析方法:可行解范圍:假設(shè)子問題的初始可行解為a old , 不等式約束（盒子約束）條件的限制:a Old，最優(yōu)解為a new,a 2eW，顯然最優(yōu)解受等式約束（直線約束）和(a)化簡為new1=y1? - anew2 :old呵、=y1( a 1丄 old 、y1 + a 2y2)-newa 2 y2y1 w Cnew1 = y1?-new2 .、亦1 = a 1ld+ a 2ldy2y1- a2°切1 w c?如果y 2 = y1，那么

33、old1olda 2newa 2 W Ca old +oldnew olda 2- C W a 2 W a 1olda 2(b)由(a) , (b)得出:如果?= ?，那么？=?) = ?(? ?y ) :?)?W ?W ? ( ?+(c)? 如果y 2工，那么oldW a 1old2 +oldold久 2- a 1W a 2ew W C-olda 2(d)由(a) , (d)得出:如果？?？工？?？，那么？=?) = ? I I)?(?,? )?< ?W ?(? - ?+(e)如果最優(yōu)解不在約束內(nèi)，必須被剪輯。假設(shè)在沿著約束方向a?;a 2y2 = ?未經(jīng)剪輯時a 2的最優(yōu)解為a 2e

34、w unc;然后再求剪輯后a 2的解?F面忽略不等式約束,求取迭代解new, unc2min W( a 1,a 1 , a 21a 2)= 2K11Ny +22a2kk1 一 2+21aa2y2(a 1 + a 2) + y1 a 1 (刀 yi a i K1 )i =3+ y2 a 2 (刀 yi a i K2)i =3由于 a iy1 = ?- a 2y2，得出%1y"1=(?- a 2y2)y1a 1 = (? - a 2y2)y1帶入目標(biāo)函數(shù)1W a 2)= 21(?-1 一 2+2吩2ya22y2K12(? - a 2y2)a 2 - (? - a 2丫2)丫1- a 2

35、N+ (?-a 2丫2)( 刀 yi a i Ki1 ) + y2 a 2 (刀 yi a i Ki2)對a 2求導(dǎo)?W=-y2Kii( ?- a 2y2) + K22 a 2 + y2Ki2? - 2Ki2 a 2 + yiy2 - i - y2 (刀 yi a i Ki )i = 3+ y2 (刀 yi a i K2 )i =3=-y2Kii? + a 20i + K22 a 2 + y2Ki2? - 202 a 2 + yiy2 - iN-y2(刀 yi a i Ki) + y2 (刀 yi a i %2)i = 3i =3= -2?+ a 2(Kii+ K22 - 2Ki2) + y2

36、Ki2?+ yiy2 - i-y2(刀 yii = 3a i Ki )+ y2(刀 yi a i Ki2 )i =3a 2(Kii + K22 - 2Ki2)- y2 ( y2 - yi + Kii? - K12? +i Ki )-(刀 yi a i K2 )i = 3令其為0,得到new, unc /、a 2(Kii + K22 - 2Ki2)=y2(Ny2- yi + Kii?- Ki2?+ (刀 yii = 3Na i Ki)-(刀 yi a i 2)i = 3將?= a ildyi + a 2ldy2帶入，得到new, unca 2(Kii + K22 - 2Ki2)=y2 ( y2

37、- yi + Kii a old yi + Kii aold2 y2-Ki2 a ildyi- Ki2 a 尸 y?i Ki )-(刀 yi a i K2 )i = 3old、，=y2 ( y2 - yi + Kii a i yi+ Kii a oldy2-Ki2 a old yi - Ki2a0ldy2oldoldiii - yi a 1 Zi-y2 a 2氏21)-a i K2 -old $old / 、yi a i 22 - y2a 2 k22)=y2( y2- yi + Kii aildyi + Kii a oldy2-Ki2 a ild yi -oldKi2 a 2 y2 - yia

38、 ild Kii - y2 a 2ld K?iN+ yi a oldKi2+ y2 a oldK?2 +NNy2( y2 -yi+ (Kii +K?2 -2Ki2)aold2 y2 + (刀 yi =iq a i Ki-刀 yi a i Ki2 )i = iNN(Kii +K22-2K12)aold2 +y2 ( y2' yi + (刀 yia i Ki -刀 yi a i K2 )i = ii =i(刀 yi a i Ki -刀 yi a i Ki2)i =ii = i=(K11 + K22 - 2K12)olda 2+ y2(刀 yi a iKi1 - y1)-(刀 yi a i

39、Ki2 - y2)i = 1i =1令Ei = £=' a j Kji + b- yi , i 的預(yù)測與真實輸出y i之差；那么1,2；其中斗=1片a j Ki + b是對輸入x i的預(yù)測,因此E i表示對輸入x inew, a 2unc(K11 + K22 - 2K|2)= (K11old+ K22 - 2K12) a 2N+ y2(刀yi a M1 - yj -i = 1N(刀 yi a i 氏2 - y2)i = 1(K11 + K22 - 2K12)olda 2+ y2(E1 - E2)new unca 2old ,y2(E1 - E2)a 2+2(Ku + K22

40、- 22)old ,y2(E1 - E2)a 2 +/ 0(X1)- 0(X2)!f-因此?H,a 2ew =new, unc2a 2L,new unca 2> ?new, uncL W a 2new, unca 2new ,new由y a 1+ y2a 2= y11ld + y2 a 2ld 得出new ,y1(y1a 1 +new、y2a 2 )/ old=y1(y1a 1y2 a old )（2）變量的（啟發(fā)式）選擇方法:? ? = ?+ ? ( ?)SMO算法在每個子問題中選擇兩個變量優(yōu)化，其中至少一個變量是違反KKT條件的。1）第一個變量的選擇SMO爾選擇第1個變量的過程為外層

41、循環(huán)。外層循環(huán)在訓(xùn)練樣本中選取違反其對應(yīng)的變量作為第1個變量。具體地，檢驗訓(xùn)練樣本點（Xj , yi）是否滿足隔SVM文章）KKT條件最嚴(yán)重的樣本點，并將KKT條件，即（具體推導(dǎo)見軟間如果? = ?，那么？?？=?, ?(? ? + ?) > ?；如果? <?<?,那么？?= ?,?如(？?？?？?？+?)- ?+?= ?，因此？?(？?？?？+?)= ?；如果?= ?，那么？?(？?？+ ?) = ?- ?, ? >?；Na i = 0 ? yi (刀 a j yj K(xj ?xi) + b)j = 1N0 < a i < ? ? yi (刀 a

42、 j yj K(xj ?xi ) +j =1b) = 1a i = C? yi (刀 a j yj K(xj ?xi) + b)j = 1該檢驗是在？?范圍內(nèi)進(jìn)行的。在檢驗過程中，外層循環(huán)首先遍歷所有滿足條件0< a i < ?的樣本點，即在間隔邊界上的支撐向量點，檢驗它們是否滿足KKT條件；如果這些樣本點都滿足KKT條件，那么遍歷整個訓(xùn)練集，檢驗它們是否滿足 KKT條件；2）第二個變量的選擇SMO爾選擇第2個變量的過程為內(nèi)層循環(huán)。假設(shè)在外層循環(huán)中已經(jīng)找到第1個變量?，現(xiàn)在要在內(nèi)層循環(huán)中找第2個變量？?。第2個變量的選擇的標(biāo)準(zhǔn)是希望能使？?有足夠大的變化（這樣新的a i也會有足夠

43、大的變化，從而盡快趨向滿足 KKT條件的值）。從上面的推導(dǎo)中可以發(fā)現(xiàn)，a 2eW<賴于|Ei - E2|，為了加快計算速度，一種簡單的做法是選擇?,使其對應(yīng)的|Ei -巨|最大。因為?已定，Ei也是確定的。如果E i是正，那么選擇最小的E i作為E2；如果如果E i是負(fù)，那么選擇最大的E i作為E2;（為了節(jié)省時間，將所有的E i值保存在一個列表中）；在特殊情況下，如果內(nèi)層循環(huán)通過以上方法選擇的？?不能使目標(biāo)函數(shù)有足夠的下降，那么采用以下啟發(fā)式規(guī)則繼續(xù)選擇？?；遍歷在間隔邊界上的支撐向量點，依次將其對應(yīng)的變量作為？？?試用，直到目標(biāo)函數(shù)有足夠的下降。若找不到合適的？？?，那么遍歷

44、訓(xùn)練數(shù)據(jù)集；若仍找不到合適的？？?，則放棄第i個?，再通過外層循環(huán)尋求另外的？？?。3）計算閾值b和差值? ?每次完成兩個變量的優(yōu)化后，都要重新計算閾值b和?,使用迭代的方法更新b；根據(jù)定義預(yù)測誤差 Ei = f=iyj aj Ki + b- yi，展開得NEi + yi - XjJ=3yj下面討論如何迭代更新顯然每次更新完a new,?a）.如果? < ?" Ei =刀 yj a j Ki + b°ldj = 3 a j Ki = a °ld yi Kii?yi +oldolda iyi Kii + a 2 y2K2ia old y2K2i + bold(f)?帶入（f），得出b,即獲得?:a new后 b new的選擇應(yīng)該使得KKT條件成立;?時，由KKT條件可知：Nyi (刀 a i yi K(Xi ?xi) + b) = ii = iNa iyiK(Xi ?xi) + b = yi?=?-刀 ? (? ?)?= ?=

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

SVM理論和算法分析報告

文檔簡介

溫馨提示

最新文檔

評論

SVM理論和算法分析報告

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔