模式識(shí)別導(dǎo)論第9章模式分析的核方法.ppt

上傳人：m*** IP屬地：北京上傳時(shí)間：2020-12-24 格式：PPT 頁(yè)數(shù)：75 大小：1.26MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩70頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第9章模式分析的核方法,9.1 核函數(shù) 9.2 核HCM算法 9.3 核FCM算法 9.4 核離散K-L變換 9.5 核Fisher線性判別 9.6 支持向量機(jī),現(xiàn)實(shí)世界存在的數(shù)據(jù)是復(fù)雜的，傳統(tǒng)的線性學(xué)習(xí)器一般很難適用于線性不可分?jǐn)?shù)據(jù)的劃分問(wèn)題，為此人們需要利用比線性函數(shù)更富有表達(dá)能力的假設(shè)空間。核方法提供了一種很好的解決途徑，它利用特征映射將低維輸入空間中的線性不可分?jǐn)?shù)據(jù)映射到高維特征空間(一般來(lái)說(shuō)，該高維特征空間是一個(gè)希爾伯特空間)，使其在該空間中變得線性可分。該方法使得數(shù)據(jù)在高維空間中易于處理，同時(shí)又避免了高維空間帶來(lái)的維數(shù)災(zāi)難問(wèn)題，大大提升了傳統(tǒng)線性學(xué)習(xí)器的計(jì)算能力。對(duì)核方法的研究受

2、到了研究者越來(lái)越多的關(guān)注。本章首先介紹核函數(shù)的基本理論，然后對(duì)模式識(shí)別領(lǐng)域中幾種經(jīng)典的核方法進(jìn)行敘述。,9.1 核函數(shù)9.1.1 非線性特征映射和核函數(shù)給定l維輸入空間X上的一個(gè)模式x=(x1，x2，xq)T，采用一種非線性特征映射函數(shù)()將x從q維原模式特征空間映射到Q維變換特征空間，即,(9-1),其中，(x)=(1(x)，2(x)，Q(x)T。()表示一個(gè)從低維特征空間到高維特征空間的非線性映射，映射的目的是將非線性可分的樣本在變換特征空間中線性可分。以圖9.1中左側(cè)的數(shù)據(jù)為例，對(duì)其進(jìn)行非線性映射，得到圖9.1中右側(cè)的數(shù)據(jù)，可以明顯看出，數(shù)據(jù)在新特征空間中是線性可分的。在現(xiàn)實(shí)生活中，

3、很多問(wèn)題都不能用線性函數(shù)來(lái)表示，但是如果改變其表達(dá)形式，則有可能用線性函數(shù)來(lái)描述。下面以物理學(xué)中的萬(wàn)有引力定律為例進(jìn)行說(shuō)明。,圖9.1 低維空間中的線性不可分?jǐn)?shù)據(jù)映射到高維空間后變成線性可分,例9.1 牛頓萬(wàn)有引力定律是解釋物體之間的相互作用的引力定律，其表達(dá)式為其中,m1和m2為兩個(gè)物體的質(zhì)量，r為它們之間的距離。很明顯，傳統(tǒng)的線性學(xué)習(xí)器是不能表達(dá)這種關(guān)系的。我們按照如下方式對(duì)坐標(biāo)進(jìn)行變換；可以得到新的表達(dá)方式；該表達(dá)式可以通過(guò)一個(gè)線性學(xué)習(xí)器進(jìn)行學(xué)習(xí)。,根據(jù)模式識(shí)別理論，低維空間線性不可分的模式可以通過(guò)非線性映射將其映射到高維特征空間來(lái)實(shí)現(xiàn)線性可分，此高維特征空間應(yīng)該是完備且可分的內(nèi)積空間

4、。所謂內(nèi)積空間是指，在向量空間X上，如果存在一個(gè)實(shí)值對(duì)稱(chēng)的雙線性(對(duì)于每個(gè)自變量來(lái)說(shuō)都是線性的)映射，(這一映射也被稱(chēng)為內(nèi)積)，該映射滿足x，x0，則該向量空間是一個(gè)內(nèi)積空間。此外，如果當(dāng)且僅當(dāng)x=0時(shí)x，x=0，則稱(chēng)內(nèi)積是嚴(yán)格的。嚴(yán)格內(nèi)積空間也被稱(chēng)為希爾伯特空間，下面給出其正式的定義。,定義9.1 希爾伯特空間F是一個(gè)具備可分性和完備性的嚴(yán)格內(nèi)積空間。完備性是指F中的元素的每一柯西序列hnn1都收斂于元素hF。這里，柯西序列是滿足性質(zhì)的序列?？煞中允侵缚臻gF中有一組可數(shù)元素h1，hi，使得對(duì)于所有的hF和0，存在i滿足|hih| (9-3),(9-2),如果直接在映射后的特征空間進(jìn)行分類(lèi)，則

5、存在確定非線性映射函數(shù)的形式和參數(shù)以及特征空間維數(shù)等問(wèn)題。此外，在高維空間進(jìn)行運(yùn)算存在“維數(shù)災(zāi)難”問(wèn)題。有時(shí)候我們可以把內(nèi)積作為輸入特征的直接函數(shù)來(lái)更高效地計(jì)算內(nèi)積，而不用顯式地計(jì)算映射函數(shù)()。我們把這種直接計(jì)算內(nèi)積的技術(shù)稱(chēng)為核函數(shù)技術(shù)。下面給出核函數(shù)的定義。,定義9.2 對(duì)于所有的x，若函數(shù)K滿足K(x，z)=(x)，(z) (9-4)則稱(chēng)函數(shù)K是核函數(shù)，其中是從輸入空間X到特征空間F的一個(gè)映射(見(jiàn)式(9-1)，表示內(nèi)積。下面給出一個(gè)核函數(shù)的例子來(lái)說(shuō)明非線性特征映射和核函數(shù)的關(guān)系。例9.2 考慮一個(gè)二維輸入空間，假設(shè)通過(guò)特征映射得到,那么，F(xiàn)中的線性函數(shù)的假設(shè)空間將是通過(guò)上面這樣一種特征映

6、射方式，輸入空間中的數(shù)據(jù)從二維空間被映射到三維空間。在特征空間中，利用給出的特征映射結(jié)果和內(nèi)積操作，可以得到,因此，函數(shù)K(x，z)=x，z2就是一個(gè)核函數(shù)。這意味著我們可以計(jì)算兩個(gè)點(diǎn)在原輸入特征空間上的內(nèi)積，而不用顯式地求出它們?cè)谛绿卣骺臻gF的坐標(biāo)。此外，x，z2也可以是下面給出的四維特征映射的內(nèi)積，這表明特征空間并不能由核函數(shù)唯一確定。,9.1.2 核函數(shù)的基本理論定義9.2中給出了核函數(shù)K與映射之間的關(guān)系。在實(shí)際應(yīng)用中，非線性映射的具體表達(dá)式是很難直接給出的，我們可以通過(guò)核函數(shù)的構(gòu)造和確定來(lái)隱式地定義特征空間，避免對(duì)原數(shù)據(jù)進(jìn)行映射。下面給出幾個(gè)與核函數(shù)相關(guān)的概念和性質(zhì)。定義9.3(Gra

7、m矩陣) 給定一個(gè)向量集合X=x1，x2，xn，Gram矩陣G為nn的矩陣，其矩陣元素Gij=xi，xj。,定義9.4(核函數(shù)矩陣) 給定輸入空間的向量集合X=x1，x2，xn，核函數(shù)矩陣K被定義為nn的矩陣，且其矩陣元素為Kij=(xi)，(xj)=K(xi，xj)。其中，K為核函數(shù)。從定義9.3和9.4中可以看出G和K都是對(duì)稱(chēng)矩陣，并且K是特征空間的Gram矩陣。定義9.5 半正定性(連續(xù)情況)對(duì)于任意的fL2(X)，如果對(duì)稱(chēng)函數(shù)K(xi，xj)使下式成立；,(9-5),則稱(chēng)函數(shù)K(xi，xj)為半正定的；,(離散情況)對(duì)于任意的n，任意的樣本集x1，x2，和任意的系數(shù)a1，a2，anR，

8、如果對(duì)稱(chēng)函數(shù)K(xi，xj)滿足下式；則稱(chēng)函數(shù)K(xi，xj)為半正定的?？梢宰C明，Gram矩陣和核函數(shù)矩陣都是半正定矩陣。下面，我們采用定理9.1對(duì)核函數(shù)進(jìn)行描述。,(9-6),定理9.1(核的描述) 假設(shè)函數(shù)K：XXR，K這個(gè)函數(shù)可分解為K(x，z)=(x)，(z)當(dāng)且僅當(dāng)該函數(shù)滿足半正定性質(zhì)。這里，是X到希爾伯特空間F的一個(gè)特征映射。證明假設(shè)K(x，z)=(x)，(z)，令Gij=K(xi，xj)=(xi)，(xj)，其中i，j=1，n對(duì)于任意一個(gè)向量v，我們有,因此函數(shù)K滿足半正定性。反過(guò)來(lái)，假設(shè)K滿足半正定性質(zhì)，通過(guò)構(gòu)造希爾伯特空間內(nèi)的映射，可使K是一個(gè)核函數(shù)。實(shí)際上，特征空間F

9、可以看成原始向量空間中數(shù)據(jù)點(diǎn)的映射的集合(x1)，(x2)，(xn)，這里令(xi)=K(xi，)。根據(jù)這些已知的數(shù)據(jù)，我們可以對(duì)整個(gè)特征空間進(jìn)行預(yù)測(cè)。給定權(quán)系數(shù)ai，整個(gè)特征空間可以表示為,對(duì)該空間中的兩個(gè)元素和作內(nèi)積，得到其中，n1n，n2n。由上式可知，f，g是實(shí)值、對(duì)稱(chēng)和雙線性的，從而滿足內(nèi)積的性質(zhì)。由于核矩陣K是半正定的，因此，對(duì)于任意的fF,其中是一個(gè)元素為i(i=1，n1)的向量，K是構(gòu)造在x1，x2，xn上的核矩陣。此外，如果記g=K(x，)，則上式可以改寫(xiě)為因此，也有 K(xi，)，K(xj，)=K(xi，xj)上述兩式稱(chēng)為核K的再生性，這樣的核也稱(chēng)為再生核，它仍然具備完備

10、性和可分性兩個(gè)性質(zhì)。因此該函數(shù)是可分的，這里我們省去這一事實(shí)的證明細(xì)節(jié)。給定一個(gè)滿足半正定性質(zhì)的函數(shù)K，我們將對(duì)應(yīng)的空間FK稱(chēng)為它的再生核希爾伯特空間。,定義9.6 再生核希爾伯特空間(ReproducingKernelHilbertSpace，RKHS) 設(shè)X為一非空集合，給定一個(gè)核函數(shù)K，如果它具有再生性，那么由它張成的空間是一個(gè)再生核Hilbert空間。再生核希爾伯特空間上的內(nèi)積操作具有再生特性，是一個(gè)具備完備性和可分性的內(nèi)積空間。在核方法中，Mercer定理通常用來(lái)為有效的核函數(shù)構(gòu)造一個(gè)特征空間。前面我們已經(jīng)分析出核函數(shù)可以通過(guò)構(gòu)造再生核希爾伯特空間來(lái)實(shí)現(xiàn)，為了保證核方法理論的完整性，

11、下面對(duì)Mercer定理進(jìn)行介紹。,(9-7),定理9.2(Mercer定理) 令X是Rq上的一個(gè)緊湊子集，假定K是一個(gè)連續(xù)的對(duì)稱(chēng)函數(shù)，存在積分算子TK：L2(X)L2(X)，使得是正的，也就是說(shuō)，對(duì)于任意的L2(X)，有上式等價(jià)于K(，),可以表示為XX上的一個(gè)一致收斂序列；其中i是TK的特征值，i是i對(duì)應(yīng)的特征函數(shù)，歸一化使得|i|L2=1，并且i0。,(9-8),(9-9),9.1.3 核函數(shù)的構(gòu)造前面給出的對(duì)核的描述不僅僅可以判定一個(gè)給定的核函數(shù)是否有效，還可以對(duì)一個(gè)或多個(gè)核進(jìn)行運(yùn)算以獲得新的核函數(shù)。下面我們給出與核函數(shù)運(yùn)算有關(guān)的性質(zhì)。引理9.1(封閉性質(zhì)) 令K1和K2是定義在XX上

12、的核，x，aR+，f()是X上的一個(gè)實(shí)值函數(shù)，：XRQ，K3是定義在RqRq上的一個(gè)核，B是一個(gè)qq的半正定對(duì)稱(chēng)矩陣，那么下列函數(shù)都是核：,(1)K(x，z)=K1(x，z)+K2(x，z)(2)K(x，z)=aK1(x，z)(3)K(x，z)=K1(x，z)K2(x，z)(4)K(x，z)=f(x)f(z)(5)K(x，z)=K3(x)，(z)(6)K(x，z)=xTBz證明令S為一個(gè)有限點(diǎn)集x1，xl，K1和K2是通過(guò)把核函數(shù)K1和K2限制于這些點(diǎn)得到的對(duì)應(yīng)的核矩陣。由前面內(nèi)容可知，對(duì)于任意一個(gè)向量Rm，當(dāng)且僅當(dāng)對(duì)于所有的，有TK0，則矩陣K為半正定的。,(1)對(duì)于所有的，T(K1+K2

13、)=TK1+TK20，所以K1+K2是半正定的，K1+K2是一個(gè)核函數(shù)。(2)類(lèi)似地，TaK1=aTK10，因此aK1是一個(gè)核函數(shù)。(3)令K=K1K2是矩陣K1和K2的張量積，它是通過(guò)用K1中的每一個(gè)元素與K2相乘所得的積去取代K1中原來(lái)的元素得到的。兩個(gè)半正定矩陣的張量積本身也是半正定的，我們將對(duì)應(yīng)于函數(shù)K1K2的矩陣稱(chēng)為K1和K2的Schur積H，其元素是兩個(gè)成分中的對(duì)應(yīng)元素的乘積。因此，對(duì)于任意一個(gè)Rm，存在一個(gè)對(duì)應(yīng)的1Rll，使得,TH=T1K10，因此H是一個(gè)半正定矩陣，K1K2是一個(gè)核函數(shù)。該性質(zhì)說(shuō)明了任何一個(gè)核都可以分解為規(guī)范化的Schur積。(4)考慮一維特征映射：x|f(x

14、)，那么f(x)f(z)就是對(duì)應(yīng)的核。該性質(zhì)說(shuō)明了任何一個(gè)核可以分解為一維核，其中。(5)由于K3是一個(gè)核函數(shù)，通過(guò)把K3限制于點(diǎn)(x1)，(xl)而得到的矩陣是半正定的，因此K3(x)，(z)是一個(gè)核函數(shù)。,(6)已知B是半正定對(duì)稱(chēng)矩陣，利用正交矩陣V可以將矩陣B對(duì)角化，即B=VTV，這里V是一個(gè)對(duì)角矩陣，包含了非負(fù)特征值。令也是一個(gè)對(duì)角矩陣，其元素為特征值的平方根，并設(shè)。因此我們有即利用線性特征空間映射A得到了所需的內(nèi)積。利用這些封閉性質(zhì)我們可以從簡(jiǎn)單的核構(gòu)造出更加復(fù)雜的核。根據(jù)引理9.1，容易證明以下引理。,引理9.2 令K1(x，z)是定義在XX上的核，其中x，zX，那么下列函數(shù)也是核

15、：(1)K(x，z)=+1p(2)K(x，z)=exp(K1(x，z)(3)引理9.2的(1)對(duì)應(yīng)的是多項(xiàng)式核，p為次數(shù)，(2)為指數(shù)核函數(shù)，對(duì)應(yīng)的是高斯核函數(shù)。多項(xiàng)式核和高斯核都是常用的基本核，高斯核用得最為廣泛，高斯核函數(shù)組成了徑向基函數(shù)(RadialBasisFunction，RBF)網(wǎng)絡(luò)的隱藏單位，因此它也被稱(chēng)為RBF核。雖然有許多核函數(shù)可供選擇，但是對(duì)于某個(gè)具體的機(jī)器學(xué)習(xí)任務(wù)，并非所有的核函數(shù)都是合適的選擇。因此，需要根據(jù)具體問(wèn)題來(lái)構(gòu)造相應(yīng)的核。,基于核的模式分析方法有很多，其中包括核HCM算法、核FCM算法、核離散K-L變換、核Fisher線性判別以及支持向量機(jī)，下面對(duì)它們逐一進(jìn)行

16、介紹。,9.2 核HCM算法HCM聚類(lèi)算法是一種基于誤差平方和準(zhǔn)則的聚類(lèi)方法，當(dāng)各類(lèi)樣本的邊界是線性不可分以及類(lèi)分布為非高斯分布時(shí)，其聚類(lèi)性能較差。為了提高HCM算法的性能，可以引入核方法的思想，提出一種核HCM聚類(lèi)算法。該算法的主要思想就是將原空間的樣本映射到高維特征空間，使樣本在該空間中變得線性可分或近似線性可分，然后再利用HCM對(duì)它們進(jìn)行聚類(lèi)。,假設(shè)有n個(gè)待聚類(lèi)樣本x1，x2，xn，聚類(lèi)數(shù)目為c，設(shè)待聚類(lèi)的樣本被劃分成k(k=1，2，c)個(gè)類(lèi)。原樣本集通過(guò)非線性特征映射函數(shù)()，在特征空間中表示為(x1)，(x2)，(xn)。與傳統(tǒng)的HCM算法類(lèi)似，令為第k(k=1，c)類(lèi)的樣本的均值，

17、由下式計(jì)算；其中，nk是第k類(lèi)中樣本的數(shù)目。核HCM聚類(lèi)算法的目標(biāo)函數(shù)可以寫(xiě)為,(9-10),(9-11),在核空間中，任意一個(gè)樣本(xi)和第k類(lèi)的樣本的均值之間的距離可以展開(kāi)為,(9-12),一般情況下，非線性映射函數(shù)的表達(dá)式是未知的。這里我們不需要真正使用映射，而是利用滿足Mercer條件的核函數(shù)計(jì)算高維特征空間上的內(nèi)積，即K(x，z)=(x)，(z)，可以將式(9-12)進(jìn)一步化簡(jiǎn)得到：從上式可以看出，高維特征空間上的樣本與聚類(lèi)中心之間的距離可以通過(guò)計(jì)算原始空間樣本之間的核函數(shù)值得到，具體的核函數(shù)可以采用引理9.2中介紹的三種常用的核函數(shù)。,(9-13),根據(jù)上面給出的聚類(lèi)準(zhǔn)則(參考式

18、(9-11)和式(9-13)，核HCM算法的流程如下：步驟1：給定聚類(lèi)數(shù)目c，以及允許誤差和最大迭代次數(shù)T，并確定一種聚類(lèi)過(guò)程中使用的核函數(shù)形式。步驟2：對(duì)原始樣本集隨機(jī)初始化c個(gè)聚類(lèi)中心或者一個(gè)聚類(lèi)結(jié)果。這里以初始化聚類(lèi)中心為例，即在原始樣本集中任意選擇c個(gè)樣本作為初始聚類(lèi)中心。步驟3：設(shè)置迭代次數(shù)t=1，利用式(9-11)和式(9-13)計(jì)算核HCM聚類(lèi)算法的目標(biāo)函數(shù)值。,步驟4：根據(jù)式(9-13)計(jì)算每個(gè)樣本(xi)與中心的距離，并根據(jù)最近鄰原則將該樣本分配到與它距離最近的那個(gè)類(lèi)中。步驟5：獲得每個(gè)樣本的新的類(lèi)別標(biāo)簽之后，t=t+1，重新計(jì)算目標(biāo)函數(shù)值。步驟6：判斷算法是否達(dá)到最大迭代次

19、數(shù)T或者，如果滿足條件,則算法停止，否則轉(zhuǎn)至步驟4。,盡管這種算法很流行，但是由于其聚類(lèi)準(zhǔn)則的最優(yōu)化問(wèn)題是非凸的，很容易陷入局部極小值，為此，研究者試圖通過(guò)尋找更好的初始聚類(lèi)結(jié)果，或者引入額外的約束條件來(lái)提高算法性能。此外，核函數(shù)的選取對(duì)該算法的性能也具有一定的影響。對(duì)于這些方面的研究，這里就不再一一贅述。,9.3 核FCM算法與核HCM方法類(lèi)似，核模糊c-均值聚類(lèi)算法也是將數(shù)據(jù)通過(guò)核函數(shù)映射到高維特征空間后再進(jìn)行FCM聚類(lèi)，一定程度上克服了FCM不適合多種數(shù)據(jù)分布的缺陷。若樣本集為X=x1，x2，xn，c為聚類(lèi)個(gè)數(shù)，vj(j=1,2,c)為第j個(gè)聚類(lèi)的聚類(lèi)中心，通過(guò)非線性特征映射，將FCM的

20、目標(biāo)函數(shù)修改為高維特征空間下的目標(biāo)函數(shù)：,(9-14),uij必須滿足：式中：n為樣本數(shù)，U=uijcn是模糊劃分矩陣，uij為樣本(xi)對(duì)應(yīng)于第j個(gè)聚類(lèi)的隸屬度值，m是影響隸屬度矩陣模糊化程度的指數(shù)權(quán)重。在高維特征空間中，將歐式距離|(xi)(vj)|2展開(kāi)，得到,(9-15),(9-16),對(duì)于每一個(gè)只使用內(nèi)積的線性算法來(lái)說(shuō)，都可以利用滿足Mercer條件的核函數(shù)把該算法擴(kuò)展成一個(gè)非線性版本。這里，我們不需要真正使用變換，而是利用核函數(shù)K(x，y)計(jì)算高維空間中樣本的內(nèi)積。因此，式(9-16)可以被改寫(xiě)為如果采用高斯核,(9-17),(9-18),作為核函數(shù)，則有最終，KFCM的目標(biāo)

21、函數(shù)整理為分別對(duì)JKFCM關(guān)于uij、vj求偏導(dǎo)，得到新的聚類(lèi)中心和隸屬度矩陣的更新公式：,(9-19),(9-20),(9-21),核模糊c-均值聚類(lèi)算法的具體步驟為：步驟1：給定聚類(lèi)數(shù)目c(2cn)，閾值，最大迭代次數(shù)T，加權(quán)指數(shù)m。步驟2：初始化聚類(lèi)中心，,設(shè)置迭代次數(shù)k=1。步驟3：利用式(9-22)計(jì)算隸屬度，i=1，2，n;j=1，2，c。,(9-22),步驟4：利用式(9-21)計(jì)算聚類(lèi)中心，j=1，2，c。步驟5：如果|V(k+1)V(k)|T，則算法結(jié)束，輸出最終聚類(lèi)結(jié)果；否則，k=k+1，執(zhí)行步驟3。核FCM算法與核HCM算法類(lèi)似，也容易出現(xiàn)局部極小化的問(wèn)題。人們?cè)O(shè)計(jì)了很

22、多方法來(lái)提高算法的性能，由于這些已經(jīng)超出了本書(shū)的內(nèi)容，這里就不再贅述。,9.4 核離散K-L變換在7.3節(jié)中討論的離散K-L變換是在最小均方誤差準(zhǔn)則下，找到一個(gè)d維子空間，使其能夠很好地表達(dá)原始數(shù)據(jù)。如果原始數(shù)據(jù)存在復(fù)雜的非線性關(guān)系，那么線性子空間的表示性能將很差。為了使離散K-L變換方法能夠處理非線性問(wèn)題，將核方法的思想引入進(jìn)來(lái)，得到核離散K-L變換方法。,已知原始樣本集X=x1，x2，xn，xi是q維的向量，利用非線性特征映射，得到高維特征空間的樣本(xi)(i=1，2，n)，(xi)RQ。假設(shè)在該高維空間中，樣本集的均值為，可以利用高維特征空間上的樣本集的協(xié)方差矩陣對(duì)樣本進(jìn)行離散K-L變

23、換。協(xié)方差矩陣采用下式表示：,(9-23),C為大小是QQ的矩陣。此時(shí)，與第7章中的式(7-42)的推導(dǎo)類(lèi)似，高維特征空間上的離散K-L變換就是通過(guò)求解Cw=w (9-24)來(lái)獲得w，從而得到高維特征空間上的最佳投影方向。這里，首先將高維特征空間中的每個(gè)樣本與上式的等號(hào)左右兩端做內(nèi)積，則有由再生核理論可知，給定權(quán)系數(shù)i，高維特征空間中的所有向量都可以表示為,(9-25),(9-26),整理式(9-23)、式(9-25)和式(9-26)，可得定義一個(gè)QQ核矩陣K=Kij，其中，則式(9-27)可簡(jiǎn)化為 nK=K2 (9-29)可以看出，n=K (9-30)的解也必然滿足式(9-29)中的等式

24、關(guān)系。,(9-27),(9-28),通過(guò)對(duì)核矩陣K進(jìn)行特征分解，可以獲得要求的特征值和特征向量。由式(9-26)可知，利用核矩陣K的特征向量=(1)，(2)，(Q)可以求出C的特征向量w，從而得到高維特征空間的投影方向。這里，用12Q表示核矩陣K的特征值，(1)，(2)，(Q)為對(duì)應(yīng)的特征向量，選擇前l(fā)個(gè)最大的非零特征根1，2，l及其特征向量(1)，(2)，(l)。根據(jù)式(9-26)，可以得到,， k=1，l(9-31),因此可以利用如下公式來(lái)計(jì)算新數(shù)據(jù)在w構(gòu)成的l維子空間上的投影；其中x為原始空間的輸入向量，(x)為高維空間的映射向量。因此，利用核矩陣計(jì)算(xj)，(x)可以得到在高維特征空

25、間上特征提取的結(jié)果；,(9-32),9.5 核Fisher線性判別我們?cè)?.5節(jié)已經(jīng)介紹了Fisher線性判別的基本內(nèi)容，F(xiàn)isher線性判別所要解決的基本問(wèn)題是找到一個(gè)最好的投影方向，使樣本在這個(gè)方向上的投影最容易分開(kāi)。顯然，對(duì)于大多數(shù)的實(shí)際數(shù)據(jù)，線性判別分析的方法顯得過(guò)于簡(jiǎn)單。為了增加判別函數(shù)的表達(dá)性，可以引入核方法，先把數(shù)據(jù)非線性地映射到某個(gè)高維特征空間，然后在這個(gè)特征空間中進(jìn)行Fisher線性判別，這就是核Fisher線性判別法。,下面以兩類(lèi)問(wèn)題為例來(lái)對(duì)核Fisher線性判別法進(jìn)行介紹。已知n個(gè)q維樣本x1，x2，xn，其中i(i=1，2)為第i類(lèi)對(duì)應(yīng)的樣本集，樣本容量為ni。設(shè)經(jīng)過(guò)一

26、個(gè)非線性映射，將輸入空間的數(shù)據(jù)xi映射到高維特征空間中的(xi)，則在高維特征空間中各類(lèi)樣本的類(lèi)內(nèi)離散度矩陣和總的類(lèi)內(nèi)離散度矩陣分別為：,i=1，2 (9-33),(9-34),其中，(i=1，2)為在高維空間的第i類(lèi)樣本的均值向量。類(lèi)間離散度矩陣定義為由式(9-33)和式(9-35)知，和均為對(duì)稱(chēng)半正定矩陣。為了在高維特征空間上進(jìn)行Fisher線性判別分析，需要給出特征空間上的Fisher判別準(zhǔn)則函數(shù)，與第2章中Fisher準(zhǔn)則函數(shù)的推導(dǎo)類(lèi)似，可以得到；,(9-35),(9-36),其中，W為任一非零列向量。使J(W)達(dá)到最大值的W即為最佳投影方向W*。由于無(wú)法給出有效的非線性映射函數(shù)并且特

27、征空間的維數(shù)也是非常高甚至是無(wú)窮維的，直接求解最優(yōu)投影方向是不可能的。由再生核理論可知，高維特征空間中的任何一個(gè)向量W可以表示為根據(jù)式(9-37)和均值向量的定義，得到下面形式；,(9-37),(9-38),其中，=(1，2，n)T，。將上式引入到的定義中，則有其中，KB=(K1-K2)(K1-K2)T。同理，將式(9-38)引入到中，將其修改為,(9-39),(9-40),其中，Ki表示第i類(lèi)的核矩陣，其中(Ki)jk=K(xj，xk)，xki。I為單位矩陣，為元素全部為1/ni的矩陣。,此時(shí)，可以將高維特征空間上的Fisher判別準(zhǔn)則函數(shù)修改為上式即為核Fisher判別的準(zhǔn)則函數(shù)。類(lèi)似于F

28、isher線性判別方法，可以通過(guò)求矩陣的最大的l個(gè)特征值及其對(duì)應(yīng)的特征向量(1)，(2)，(l)來(lái)求解核Fisher判別準(zhǔn)則函數(shù)的最大化問(wèn)題。此時(shí)新樣本y到W的投影可以采用下式計(jì)算；,(9-41),(9-42),核Fisher判別方法是一種基于Fisher線性判別的非線性分類(lèi)方法，無(wú)須通過(guò)非線性映射函數(shù)將數(shù)據(jù)映射到高維特征空間，只需要計(jì)算訓(xùn)練樣本的核矩陣即可。此外，不同形式的核由于其可能的非線性范圍很廣，因而具有很高的靈活性。,9.6 支持向量機(jī)支持向量機(jī)(Support Vector Machine，SVM)是數(shù)據(jù)挖掘的一項(xiàng)新技術(shù)，是借助于最優(yōu)化方法解決機(jī)器學(xué)習(xí)問(wèn)題的新工具。該方法以結(jié)構(gòu)風(fēng)險(xiǎn)

29、最小化(Structure RiskMinimization，SRM)為原則，是由Vapnik等人在統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上提出的，該算法在有限個(gè)訓(xùn)練樣本的學(xué)習(xí)精度和泛化能力之間取得了很好的平衡，從而獲得了很好的推廣能力?，F(xiàn)在經(jīng)常使用的包括線性的和非線性的SVM算法，其中線性SVM也分為線性可分和線性不可分兩種情況。最初SVM方法是從線性可分情況下提出的，然而現(xiàn)實(shí)生活中很多問(wèn)題不能用線性函數(shù)來(lái)表示，因此非線性支持向量機(jī)方法得到了很好的推廣和使用。,在SVM方法中，為了解決非線性問(wèn)題，核方法被巧妙地引入進(jìn)來(lái)，使得SVM在獲得良好的泛化性能的同時(shí)，也有效地解決了經(jīng)典學(xué)習(xí)方法中過(guò)學(xué)習(xí)、維數(shù)災(zāi)難、局部極小等

30、問(wèn)題，其復(fù)雜度與樣本維數(shù)無(wú)關(guān)。正是由于這些優(yōu)點(diǎn)，使得支持向量機(jī)獲得了廣泛的關(guān)注，并在手寫(xiě)體識(shí)別、語(yǔ)音辨識(shí)、人臉檢測(cè)、文本分類(lèi)、DNA和蛋白質(zhì)數(shù)據(jù)分析等方面得到了廣泛應(yīng)用。,9.6.1 線性支持向量機(jī)1.線性可分在支持向量機(jī)中最早是從線性可分情況下的最優(yōu)分類(lèi)超平面提出的，基本思想如圖9.2所示。圖中實(shí)心點(diǎn)和空心點(diǎn)分別表示兩類(lèi)不同的樣本，H為將兩類(lèi)數(shù)據(jù)沒(méi)有錯(cuò)誤地分開(kāi)的最優(yōu)分類(lèi)線，H1和H2分別為過(guò)兩類(lèi)樣本中離分類(lèi)超平面最近的點(diǎn)且平行于分類(lèi)線的直線，H1和H2之間的距離叫做分類(lèi)間隔。所謂最優(yōu)分類(lèi)線(在多維空間稱(chēng)為最優(yōu)分類(lèi)超平面)就是要求分類(lèi)線不但能將兩類(lèi)正確分開(kāi)，還要保證分類(lèi)間隔最大?？梢钥闯?最優(yōu)

31、分類(lèi)線或者最優(yōu)分類(lèi)超平面所要求的第一個(gè)條件，就是將兩類(lèi)數(shù)據(jù)無(wú)錯(cuò)誤的分開(kāi)，即保證經(jīng)驗(yàn)風(fēng)險(xiǎn)最小；第二個(gè)條件是使分類(lèi)間距最大，即使推廣能力的界的置信區(qū)間最小，從而使真實(shí)風(fēng)險(xiǎn)最小。,圖9.2 支持向量機(jī)原理示意圖,假設(shè)已知n個(gè)線性可分的觀測(cè)樣本x1，x2，xn，xiRq，對(duì)于兩類(lèi)問(wèn)題，定義樣本xi的類(lèi)別標(biāo)記為yi，即若xi1，則yi=1若xi2，則yi=1于是所有的觀測(cè)樣本集可以表示為(xi，yi)。由于觀測(cè)樣本是線性可分的，因此正確分類(lèi)的界面H可以表示為wTx+b=0(9-43)對(duì)于給定的訓(xùn)練樣本集，通過(guò)學(xué)習(xí)可以確定適當(dāng)?shù)臋?quán)向量w和閾值b來(lái)建立分類(lèi)界面。圖9.2中給出的線性可分的例子中，能將這組樣本

32、分開(kāi)的線性超平面很多，但是分類(lèi)間隔最大的超平面只有一個(gè)。,定義9.7(分類(lèi)間隔) 設(shè)超平面g(x)=wTx+b=0能將正負(fù)樣本分開(kāi)，且使得正樣本滿足g(x)=wTx+b1；負(fù)樣本滿足g(x)=wTx+b-1。其中w是一個(gè)垂直于超平面的權(quán)向量，b為閾值，一個(gè)超平面完全可以由其參數(shù)(w，b)決定。定義滿足條件min|wTxi+b|=1，i=1，n(9-44)的超平面為規(guī)范超平面，對(duì)于線性可分的樣本x，滿足下面的不等式：yi(wTxi+b)1，i=1，2，n9-45)此時(shí)，分類(lèi)間隔等于2/|w|。,能夠?qū)⒂?xùn)練樣本正確分類(lèi)，并且|w|最小的分類(lèi)面就是最優(yōu)分類(lèi)面。滿足|wxi+b|=1的樣本點(diǎn)，我們稱(chēng)之

33、為支持向量，它們離分類(lèi)線(或平面)的距離最小，決定了最優(yōu)分類(lèi)線(或平面)。在圖9.2中，用圓圈標(biāo)出的點(diǎn)即為支持向量。最優(yōu)分類(lèi)超平面要求分類(lèi)間隔最大，即等價(jià)于使|w|最小。為求最優(yōu)分類(lèi)面，可以利用拉格朗日優(yōu)化方法來(lái)求解函數(shù)在條件式(9-45)約束下的最小化問(wèn)題。為此，得到拉格朗日函數(shù),(9-46),其中，i0是拉格朗日乘子。為求該式的最小值，我們分別求上式對(duì)w和b的偏導(dǎo)數(shù)并令它們等于0，計(jì)算得根據(jù)拉格朗日函數(shù)的二元性，將上述最優(yōu)分類(lèi)面問(wèn)題轉(zhuǎn)化為對(duì)偶問(wèn)題。將上式代入原拉格朗日函數(shù)式(9-46)，得到,和,(9-47),(9-48),其中，i為與每個(gè)樣本對(duì)應(yīng)的拉格朗日乘子。因此在約束條件下，權(quán)向量

34、就實(shí)現(xiàn)了分類(lèi)間隔最大。通過(guò)分析可知，只有那些最靠近超平面的點(diǎn)對(duì)應(yīng)的才非零，這樣的樣本就是支持向量。b*可以由任一xi用式(9-45)取等號(hào)時(shí)求解，即b*=yiw*Txi。通過(guò)對(duì)上述問(wèn)題的求解，最終得到相應(yīng)的判別函數(shù)是 sgn()為符號(hào)函數(shù)，進(jìn)而得到x的所屬類(lèi)別。,(9-49),2.線性不可分最優(yōu)分類(lèi)面是在線性可分的前提下討論的，但是在現(xiàn)實(shí)世界中許多問(wèn)題是不能用線性的方法來(lái)解決的。針對(duì)線性不可分的情況，可以增加松弛變量i，將約束條件放寬變成yiwTxi+b1+i0 i0，i=1，2，n) (9-50i=0是指那些位于H1和H2兩條線之外且分類(lèi)正確的向量的約束條件?，F(xiàn)在的任務(wù)仍然是求出分類(lèi)間隔最大

35、，且滿足使得i0的向量盡量少的最優(yōu)分類(lèi)面，這里稱(chēng)為廣義最優(yōu)分類(lèi)面。此時(shí)增加松弛變量的目標(biāo)函數(shù)為,其中，C是一個(gè)用來(lái)控制錯(cuò)分樣本數(shù)目的懲罰參數(shù)，C的值越小，對(duì)離群點(diǎn)的懲罰就越小，界面間隔越寬。由式(9-50)和式(9-51)可得到對(duì)應(yīng)的拉格朗日函數(shù)為,(9-51),(9-52),同前面求最優(yōu)分類(lèi)面解法相同，分別求上式對(duì)w、b和的偏導(dǎo)并令它們等于零，得到；由非負(fù)條件i0，可將式(9-55)修改為Ci0 i=1，2，n (9-56) 從該式中也可以看出，C控制了i的大小，因而控制了噪聲和離群點(diǎn)的影響。,(9-53),(9-54),(9-55),將上面得到的等式代入原拉格朗日函數(shù)中，可以對(duì)下面的目標(biāo)函數(shù)進(jìn)行優(yōu)化：解得的可以得到廣義最優(yōu)分類(lèi)面；這里b*需滿足yjg(xj)=1。此外，參數(shù)C選取的典型方法是在一定范圍內(nèi)試驗(yàn)，直到找到特定的訓(xùn)練集最好的參數(shù)為止。,(9-57),(9-58),9.6.2

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

模式識(shí)別導(dǎo)論第9章模式分析的核方法.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

模式識(shí)別導(dǎo)論第9章模式分析的核方法.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔