




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、收稿日期:20080418作者簡(jiǎn)介:董婷(1981,女,陜西岐山人,助教,在讀研究生,研究方向?yàn)闄C(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)研究。E-m a i :l do ng ti ng 163.co m支持向量機(jī)分類(lèi)算法在MATLAB 環(huán)境下的實(shí)現(xiàn)董 婷(榆林學(xué)院計(jì)算機(jī)與網(wǎng)絡(luò)工程系,陜西榆林719000摘 要:支持向量機(jī)算法SVM (SupportV ectorM ach i n e做為新一代機(jī)器學(xué)習(xí)算法近年來(lái)被成功的應(yīng)用到很多模式識(shí)別問(wèn)題中,其在數(shù)學(xué)上表示為求解一個(gè)二次規(guī)劃問(wèn)題。主要論述了支持向量機(jī)分類(lèi)算法在MATLAB 環(huán)境下的具體實(shí)現(xiàn)方法,為支持向量機(jī)算法的學(xué)習(xí)者和非計(jì)算機(jī)專(zhuān)業(yè)的廣大研究人員提供一種簡(jiǎn)單、
2、方便、高效、可行實(shí)現(xiàn)方法。關(guān)鍵詞:SVM;二次歸劃;MATL AB中圖分類(lèi)號(hào):TP181 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-3871(200804-0094-03 V.V apnik 等人從二十世紀(jì)六、七十年代致力于小樣本的機(jī)器學(xué)習(xí)研究,到二十世紀(jì)九十年代中期,統(tǒng)計(jì)學(xué)習(xí)理論受到越來(lái)越廣泛的重視1,研究如何從一些觀察數(shù)據(jù)(樣本出發(fā),模擬目前為止尚不能通過(guò)原理或?qū)嶒?yàn)發(fā)現(xiàn)的規(guī)律;利用這些規(guī)律分析客觀對(duì)象,對(duì)未來(lái)數(shù)據(jù)或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè),這就是機(jī)器學(xué)習(xí)的統(tǒng)計(jì)方法2。支持向量機(jī)SVM (Support VectorM achine是在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上發(fā)展起來(lái)的一種新的機(jī)器學(xué)習(xí)方法,是結(jié)構(gòu)風(fēng)險(xiǎn)最小
3、化原理的實(shí)現(xiàn)3。算法實(shí)現(xiàn)需具有深厚的數(shù)學(xué)功底和計(jì)算機(jī)編程技術(shù),對(duì)非計(jì)算機(jī)專(zhuān)業(yè)的廣大研究人員來(lái)說(shuō),一種簡(jiǎn)單高效的實(shí)現(xiàn)環(huán)境和方法是迫切的需要。支持向量機(jī)算法在MATLAB 環(huán)境下易于實(shí)現(xiàn)和靈活應(yīng)用的特點(diǎn),很好的提供這一技術(shù)平臺(tái)。1 支持向量機(jī)及MATLAB1.1 最優(yōu)超平面 SVM 方法是從線性可分的情況下的最優(yōu)分類(lèi)面(Opti m aH l yperplane提出的。設(shè)線性可分樣本集為(x i ,y i ,i=1,n ;y =+1,-1是類(lèi)別標(biāo)號(hào),分類(lèi)面方程為:w #x +b=0(1這個(gè)平面將兩類(lèi)樣本沒(méi)有錯(cuò)誤的分開(kāi),并且使得離分類(lèi)面最近的樣本到分類(lèi)面的距離最大,即分類(lèi)間隔最大,等價(jià)于使+w +2
4、最小,w 為分類(lèi)面的法向量。而要求分類(lèi)面對(duì)所有樣本正確分類(lèi),約束條件為:y i (w #x i +b-1E 0,i=1,2,L ,n(2因此,滿足上述條件且使得+w +2最小的分類(lèi)面就是最優(yōu)分類(lèi)面。過(guò)兩類(lèi)樣本中離分類(lèi)面最近的點(diǎn)且平行于最優(yōu)分類(lèi)面的超平面H 1、H 2上的訓(xùn)練樣本就是式(2中使等號(hào)成立的那些樣本叫做支持向量。最優(yōu)分類(lèi)面可以表示為如下約束的優(yōu)化問(wèn)題,即在式(2的約束下,求函數(shù)U (w =12+w +2=12(w #w (3的最小值。為此,可以定義如下的拉格朗日函數(shù):L(w,b ,a=12+w +2-r ni=1a i y i (w #x+b-1(4(4式中,a i >0為拉格
5、朗日系數(shù)。把原問(wèn)題轉(zhuǎn)化為如下較簡(jiǎn)單的對(duì)偶問(wèn)題:m ax Q (a=r ni=1a i -12r ni=1,j=1a i a j y i y j (x i #x j s .t r n i=1y i a i =0a i E 0,i=1,n 。1.2 非線性SVM 上面討論的是最優(yōu)和廣義線性分類(lèi)函數(shù),要解決一個(gè)特征空間中的最優(yōu)線性分類(lèi)問(wèn)題,我們只需知道這個(gè)空間中的內(nèi)積運(yùn)算即可。按照廣義線性判別函數(shù)的思路,要解決一個(gè)非線性問(wèn)題,我們可以設(shè)法將它通過(guò)非線性變換轉(zhuǎn)換為另一個(gè)空間的線性問(wèn)題,在這個(gè)變換空間求最優(yōu)或最廣義分類(lèi)面??紤]M ercer 條件:對(duì)于任意的對(duì)稱(chēng)函數(shù)K(x ,x c ,它是某個(gè)特征空間的
6、內(nèi)積運(yùn)算的充分必要條件是,對(duì)與任意的U (x恒不為0,且Q U 2(xdx <,有2008年7月第18卷 第4期榆林學(xué)院學(xué)報(bào)J O URNAL OF Y UL I N COLLEGE July .2008Vo.l 18No .4k K(x ,yU (xU (ydxdy 40,顯然這一條件不難滿足4。如果用內(nèi)積K (x ,y 代替最優(yōu)分類(lèi)面的點(diǎn)積,就相當(dāng)于把原特征空間變換到了某一新的特征空間,此時(shí)的支持向量機(jī)為:MAX Q(a=r ni=1a i -12r ni=1j=1a i a j y i y jK(x i ,x j s .t r ni=1y i a i =00F a ,F C i=1
7、,n 。相應(yīng)的判別函數(shù)也應(yīng)變?yōu)?f(x=sgn r ni=1a i *y i K (x i ,x+b *。其它的條件不變,這就是支持向量機(jī)。支持向量機(jī)的思想可以概括為:首先通過(guò)非線性變換將輸入空間變換到一個(gè)高維空間,然后就這個(gè)新空間中求取最優(yōu)線性分類(lèi)面,而這種非線性變換是通過(guò)定義適當(dāng)?shù)暮瘮?shù)實(shí)現(xiàn)的,這些函數(shù)叫做核函數(shù)。選擇不同的核函數(shù)就構(gòu)成不同的支持向量機(jī),常用的有以下三類(lèi)核函數(shù):li n ear :K (x ,y=x #y ;ploy :K (x ,y=(x #y+1q;rb:f K (x ,y=exp -|x-y |2R2。1.3 MATLAB MATLAB 是美國(guó)M ath W ork 公
8、司推出的一種用于工程計(jì)算的高性能程序設(shè)計(jì)語(yǔ)言。其代碼編寫(xiě)過(guò)程與數(shù)學(xué)推導(dǎo)過(guò)程的格式很接近。應(yīng)用主要集中在數(shù)值計(jì)算、算法開(kāi)發(fā)、數(shù)學(xué)建模等方面,以矩陣為運(yùn)算單元進(jìn)行計(jì)算。MATLAB 作為一種計(jì)算工具和科技資源,可以擴(kuò)大科學(xué)研究的范圍、縮短開(kāi)發(fā)周期。該軟件的特點(diǎn)語(yǔ)言簡(jiǎn)潔,代碼靈活,被稱(chēng)為第四代計(jì)算機(jī)語(yǔ)言2。其最突出的特點(diǎn)就是提供了更為直觀、符合人們思維習(xí)慣的的代碼,易學(xué)易用,被國(guó)際學(xué)術(shù)界確認(rèn)為準(zhǔn)確、可靠的計(jì)算標(biāo)準(zhǔn)軟件。2 支持向量機(jī)分類(lèi)算法的實(shí)現(xiàn)支持向量機(jī)算法是在訓(xùn)練樣本的特征空間求取能把兩類(lèi)樣本沒(méi)有錯(cuò)誤分開(kāi)的最大間隔超平面,在數(shù)學(xué)上表示為一個(gè)凸二次規(guī)劃的問(wèn)題。也可以說(shuō)算法求解的主要內(nèi)容是通過(guò)求解二
9、次規(guī)劃(QP問(wèn)題,這個(gè)優(yōu)化問(wèn)題的求解是支持向量機(jī)算法的核心,可以說(shuō)支持向量機(jī)的算法就得到了實(shí)現(xiàn)。前面所述支持向量機(jī)算法可以表示為在式(6和式(7的約束下求式(5取最小值時(shí)的拉格朗日乘子A=(51,52,5n T,為訓(xùn)練樣本的個(gè)數(shù)。Q (A=-A TI+1/2A TDA (50F A F C(6A Ty=0(7其中:A =(51,52,5n T為n 元列向量,是要求的拉格朗日乘子;D ij =y i y j K (x i ,x j 是一個(gè)正定矩陣;y =(y 1,y 2,y n T是樣本的所屬類(lèi)別,由1或-1組成的列向量;x i 為訓(xùn)練樣本??梢钥闯?求解支持向量機(jī)就是求解上述的一個(gè)二次規(guī)劃問(wèn)題
10、,求解后得到拉格朗日乘子A =(51,52,5n T,也就求得了最大間隔超平面。求解這個(gè)二次規(guī)劃問(wèn)題需要深厚的數(shù)學(xué)功底數(shù)值計(jì)算方面的技能,在主流程序語(yǔ)言中實(shí)現(xiàn)算法又需要專(zhuān)業(yè)的計(jì)算機(jī)程序設(shè)計(jì)的知識(shí)。在MATLAB 環(huán)境下求解這一問(wèn)題會(huì)變得非常簡(jiǎn)單,這得益于MATLAB 軟件強(qiáng)大的優(yōu)化工具箱,提供了一個(gè)求解二次規(guī)劃的函數(shù),可以直接調(diào)用。二次規(guī)劃問(wèn)題(quadratic pr ogra mm ing的標(biāo)準(zhǔn)形式為:m i n f c x+12x c H xsub .to Ax F b Aeqx=beq lb F x F ub其中,H 、A 、A eq 為矩陣;f 、b 、beq 、lb 、ub 、x
11、為向量,其它形式的二次規(guī)劃問(wèn)題都可轉(zhuǎn)化為標(biāo)準(zhǔn)形式。MATLAB5.x 版中的qp 函數(shù)已被6.0版中的函數(shù)quadprog 取代。函數(shù)quadprog 格式如下:x ,fva l=quadprog(H,f A,b,A eq ,beq ,lb ,ub ,x0其中H 、f 、A 、b 、Aeq 、beq 、l b 、ub 為標(biāo)準(zhǔn)形中的參數(shù);x 為求解得到的最優(yōu)值,也就是二次規(guī)劃的解析解;lb 、ub 分別為x 的下界與上界,滿足不等式約&b F x F ub ;A eq 、beq 滿足等約束條件Aeq #x=beq ;x0為設(shè)置的初值,這個(gè)值是人為賦予x 的值,一般x 為零;fval 為目
12、標(biāo)函數(shù)最小值,可以看出,支持向量機(jī)算法是一個(gè)標(biāo)準(zhǔn)的二次規(guī)劃問(wèn)題;H =D ij =y i y j K (x i ,x j ,根據(jù)訓(xùn)練樣本數(shù)據(jù)求出;f=-1;支持向量機(jī)算法沒(méi)形式的不等式約束條件,所以A 、b 為空矩陣;Aeq=A T ,beq=y ,實(shí)現(xiàn)A Ty=0等式約束;Lb =0、ub=C ,實(shí)現(xiàn)0F A F C 不等式約束;x0=0,賦予A 的初始值為零。樣本數(shù)據(jù)已知,C 是人工賦于的值?,F(xiàn)在支持向量機(jī)的求解需要一個(gè)公式就可以完成了,主要MATLAB 代碼如下:functi o n nsv ,a l p ha ,b=svc(X,Y,ker ,C% X -訓(xùn)練樣本% Y -訓(xùn)練樣本類(lèi)別%
13、 ker -核函數(shù)類(lèi)型% C -正則系數(shù)% nsv -支持向量個(gè)數(shù)#95#董 婷:支持向量機(jī)分類(lèi)算法在MATLAB 環(huán)境下的實(shí)現(xiàn)% a l p ha -拉格朗日乘子% b -偏置值H =zeros(n,n;for i=1:n for j=1:nH (,i j=Y (i*Y (j*svkerne l(ker ,X (,i :,X(,j :; end end%D ij =y y j K (x i ,x j f=-ones(n ,1;l b =zeros(n ,1; %a l p has >=0ub =C *ones(n ,1; %alphas <=C x0=zeros(n ,1; %賦
14、初值0000A =Y c ,b =0; %Ax =b a l p ha la m bda ho w =qp(H,c ,A,b ,v l b ,vub,x0,neqcstr %調(diào)用qp 函數(shù)其中的svker nel 函數(shù)為核函數(shù),容易實(shí)現(xiàn),參照核函數(shù)的公式編寫(xiě)代碼就成。我們調(diào)用函數(shù)svc 得到拉格朗日乘子(51,52,5n T和偏置b ,對(duì)于任何一個(gè)未知樣本x ,用判別函數(shù)f (x =sgnE ni=1a *i y i K (x i ,x+ b *就可以得到其類(lèi)別預(yù)測(cè)值,sgn 函數(shù)為判別函數(shù),sgn(x=1 x>0-1 x<0。3 結(jié)論MATLAB 軟件是數(shù)學(xué)類(lèi)應(yīng)用軟件,在數(shù)值計(jì)算
15、方面尤為突出,被認(rèn)為是進(jìn)行高效研究、開(kāi)發(fā)的首選軟件工具。加上其語(yǔ)言簡(jiǎn)單自由,易于學(xué)習(xí)和掌握,是很多非計(jì)算機(jī)類(lèi)專(zhuān)業(yè)的科研人員首選開(kāi)發(fā)工具。支持向量機(jī)算法在MATLAB 環(huán)境下的實(shí)現(xiàn)的核心內(nèi)容是優(yōu)化工具箱的應(yīng)用?;贛ATALAB 環(huán)境下支持向量機(jī)算法的實(shí)現(xiàn)具有方便簡(jiǎn)單、代碼編寫(xiě)和移植快捷、性能可靠、程序運(yùn)行易于控制等特點(diǎn)。尤其為非計(jì)算機(jī)專(zhuān)業(yè)的科研工作者提供了一種簡(jiǎn)單、快捷的支持向量機(jī)算法研究和應(yīng)用的技術(shù)平臺(tái)。參考文獻(xiàn):1(英克里斯特安尼.支持向量機(jī)導(dǎo)論M .李國(guó)正,王猛,曾華軍譯.北京:電子工業(yè)出版社,2004.2張瑞豐.精通MATLAB 6.5M .北京:中國(guó)水利水電出版社,2004.3V l
16、andi m ir N.Vapnik .統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)M .張學(xué)工譯.北京B 清華大學(xué)出版社,1999.4邊肇祺,張學(xué)工.模式識(shí)別M .北京:清華大學(xué)出版社,1988.(責(zé)任編輯:王瑞斌S V M A lgorith m R ealized i n MABLABDONG T ing(Depart m ent of Co m puter and N et w ork Eng i n eer i n g ,Yu li n College ,Yuli n 719000,Shaanx iAbst ract :A s a novel generation-m achine lear n i n g-m et h od ,Suppo rtV ectorM ach i n e has caughtm uch a-t tention i n recent years,and successfu lly used i n so m e top ics of patter n recogn iti o n .I n m athe m atics it presents a quadratic prog ra mm i n g .The w ays and
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 美美少年計(jì)劃面試題及答案
- 肺炎治療與康復(fù)
- 幼兒園運(yùn)動(dòng)會(huì)方案培訓(xùn)
- 2025年中國(guó)女式牛仔褲行業(yè)市場(chǎng)全景分析及前景機(jī)遇研判報(bào)告
- 4S店執(zhí)行力培訓(xùn)
- 低血鉀癥狀外科護(hù)理學(xué)
- 教育培訓(xùn)班教師工作總結(jié)
- CNAS認(rèn)證實(shí)施流程
- 財(cái)務(wù)會(huì)計(jì)人員勞動(dòng)合同續(xù)簽與終止范本
- 電信禮儀培訓(xùn)
- 2024-2025學(xué)年廣東省新部編版七年級(jí)歷史第二學(xué)期期末模擬卷(含答案)
- 2025年新疆維吾爾自治區(qū)公務(wù)員錄用考試面試真題試卷:無(wú)領(lǐng)導(dǎo)小組討論邊疆穩(wěn)定與發(fā)展試題
- 2025年高考湖南卷物理真題(解析版)
- 七年級(jí)下冊(cè)地理知識(shí)點(diǎn)總結(jié)(考點(diǎn)清單)(背記版)七年級(jí)地理下學(xué)期期末復(fù)習(xí)(人教2024版)
- 2025至2030中國(guó)汽車(chē)物流行業(yè)深度發(fā)展研究與企業(yè)投資戰(zhàn)略規(guī)劃報(bào)告
- 2025年四川富潤(rùn)招聘筆試沖刺題(帶答案解析)
- 2024-2025學(xué)年人教版一年級(jí)下數(shù)學(xué)期末試卷(含答案)
- 2025山西萬(wàn)家寨水務(wù)控股集團(tuán)所屬企業(yè)校園招聘82人筆試參考題庫(kù)附帶答案詳解
- 牙科手術(shù)安全核查流程與標(biāo)準(zhǔn)
- 【MOOC】《中國(guó)哲學(xué)》(北京師范大學(xué)) 章節(jié)作業(yè)中國(guó)大學(xué)慕課答案
- 中國(guó)當(dāng)代文學(xué)專(zhuān)題-003-國(guó)開(kāi)機(jī)考復(fù)習(xí)資料
評(píng)論
0/150
提交評(píng)論