版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章 反饋神經(jīng)網(wǎng)絡(luò),2,第五章 反饋神經(jīng)網(wǎng)絡(luò),5.1 前言 5.2 Hopfield神經(jīng)網(wǎng)絡(luò) 5.3 Boltzmann模型 5.4 小結(jié),3,5.1 前言,反饋網(wǎng)絡(luò)又稱遞歸網(wǎng)絡(luò),或回歸網(wǎng)絡(luò)。在反饋網(wǎng)絡(luò)(Feedback NNs)中,輸入信號決定反饋系統(tǒng)的初始狀態(tài),然后系統(tǒng)經(jīng)過一系列狀態(tài)轉(zhuǎn)換以后,逐漸收斂于平衡狀態(tài)。這樣的平衡狀態(tài)就是反饋網(wǎng)絡(luò)經(jīng)計算后的輸出結(jié)果,由此可見,穩(wěn)定性是反饋網(wǎng)絡(luò)中最重要的問題之一。如果能找到網(wǎng)絡(luò)的Lyapunov函數(shù),則能保證網(wǎng)絡(luò)從任意的初始狀態(tài)都能收斂到局部最小點。 Hopfield神經(jīng)網(wǎng)絡(luò)是反饋網(wǎng)絡(luò)中最簡單且應(yīng)用最廣的模型,它具有聯(lián)想記憶的功能。如果把Lyapu
2、nov函數(shù)定義為尋優(yōu)函數(shù)的話,Hopfield網(wǎng)絡(luò)還可用來解決快速尋優(yōu)問題。,4,5.1 前言,在這類網(wǎng)絡(luò)中,多個神經(jīng)元互連以組成一個互連神經(jīng)網(wǎng)絡(luò),如右圖所示。,表示節(jié)點的狀態(tài),返回,有些神經(jīng)元的輸出被反饋至同層或前層神經(jīng)元。因此,信號能夠從正向和反向流通。Hopfield神經(jīng)網(wǎng)絡(luò)是反饋網(wǎng)絡(luò)中最有代表性的例子。,5,5.2 Hopfield神經(jīng)網(wǎng)絡(luò),Hopfield神經(jīng)網(wǎng)絡(luò)是美國物理學(xué)家J. J. Hopfield于1982年首先提出的。它主要用于模擬生物神經(jīng)網(wǎng)絡(luò)的記憶機(jī)理。 Hopfield網(wǎng)絡(luò)是一種全連接型的神經(jīng)網(wǎng)絡(luò)。對于每一個神經(jīng)元來說,自己的輸出信號通過其它神經(jīng)元又反饋到自己,所以Ho
3、pfield網(wǎng)絡(luò)是一種反饋型神經(jīng)網(wǎng)絡(luò)。 Hopfield神經(jīng)網(wǎng)絡(luò)可分為離散型(DHNN)和連續(xù)型(CHNN)兩種。,6,5.2 Hopfield神經(jīng)網(wǎng)絡(luò),Hopfield神經(jīng)網(wǎng)絡(luò)狀態(tài)的演變過程是一個非線性動力學(xué)系統(tǒng),可以用一組非線性差分方程(對于離散型Hopfield神經(jīng)網(wǎng)絡(luò))或微分方程(對于連續(xù)型Hopfield神經(jīng)網(wǎng)絡(luò))來描述。系統(tǒng)的穩(wěn)定性可用所謂的“能量函數(shù)”(即李雅普諾夫或哈密頓函數(shù))進(jìn)行分析。在滿足一定條件下,某種“能量函數(shù)”的能量在網(wǎng)絡(luò)運行過程中不斷地減小,最后趨于穩(wěn)定的平衡狀態(tài)。,7,離散型Hopfield神經(jīng)網(wǎng)絡(luò)是一種單層的、輸入輸出為二值的反饋網(wǎng)絡(luò),它主要用于聯(lián)想記憶,其結(jié)構(gòu)
4、如圖所示。,離散型Hopfield神經(jīng)網(wǎng)絡(luò),8,網(wǎng)絡(luò)的結(jié)構(gòu)與工作方式,離散型反饋網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),離散型Hopfield神經(jīng)網(wǎng)絡(luò),9,(1)網(wǎng)絡(luò)的狀態(tài) DHNN網(wǎng)中的每個神經(jīng)元都有相同的功能,其輸出稱為狀態(tài),用 xj 表示。,j=1,2,n,所有神經(jīng)元狀態(tài)的集合就構(gòu)成反饋網(wǎng)絡(luò)的狀態(tài) X=x1,x2,xnT,反饋網(wǎng)絡(luò)的輸入就是網(wǎng)絡(luò)的狀態(tài)初始值,表示為 X(0)=x1(0), x2(0), xn(0)T,反饋網(wǎng)絡(luò)在外界輸入激發(fā)下,從初始狀態(tài)進(jìn)入動態(tài)演變過程,變化規(guī)律為,10,j=1,2,n,DHNN網(wǎng)的轉(zhuǎn)移函數(shù)常采用符號函數(shù),式中凈輸入為,j=1,2,n,對于DHNN網(wǎng),一般有wii=0 ,wij=
5、wji。,反饋網(wǎng)絡(luò)穩(wěn)定時每個神經(jīng)元的狀態(tài)都不再改變,此時的穩(wěn)定狀態(tài)就是網(wǎng)絡(luò)的輸出,表示為,11,(2)網(wǎng)絡(luò)的異步工作方式 網(wǎng)絡(luò)運行時每次只有一個神經(jīng)元進(jìn)行狀態(tài)的調(diào)整計算,其它神經(jīng)元的狀態(tài)均保持不變,即,(3)網(wǎng)絡(luò)的同步工作方式 網(wǎng)絡(luò)的同步工作方式是一種并行方式,所有神經(jīng)元同時調(diào)整狀態(tài),即,j=1,2,n,12,1. 網(wǎng)絡(luò)的穩(wěn)定性 DHNN網(wǎng)實質(zhì)上是一個離散的非線性動力學(xué)系統(tǒng)。網(wǎng)絡(luò)從初態(tài)X(0)開始,若能經(jīng)有限次遞歸后,其狀態(tài)不再發(fā)生變化,即X(t+1)X(t),則稱該網(wǎng)絡(luò)是穩(wěn)定的。 如果網(wǎng)絡(luò)是穩(wěn)定的,它可以從任一初態(tài)收斂到一個穩(wěn)態(tài):,網(wǎng)絡(luò)的穩(wěn)定性與吸引子,13,若網(wǎng)絡(luò)是不穩(wěn)定的,由于DHNN網(wǎng)
6、每個節(jié)點的狀態(tài)只有1和-1兩種情況,網(wǎng)絡(luò)不可能出現(xiàn)無限發(fā)散的情況,而只可能出現(xiàn)限幅的自持振蕩,這種網(wǎng)絡(luò)稱為有限環(huán)網(wǎng)絡(luò)。,如果網(wǎng)絡(luò)狀態(tài)的軌跡在某個確定的范圍內(nèi)變遷,但既不重復(fù)也不停止,狀態(tài)變化為無窮多個,軌跡也不發(fā)散到無窮遠(yuǎn),這種現(xiàn)象稱為渾沌。,14,網(wǎng)絡(luò)達(dá)到穩(wěn)定時的狀態(tài)X,稱為網(wǎng)絡(luò)的 吸引子。 如果把吸引子視為問題的解,從初態(tài)朝吸引子演變的過程便是求解計算的過程。若把需記憶的樣本信息存儲于網(wǎng)絡(luò)不同的吸引子,當(dāng)輸入含有部分記憶信息的樣本時,網(wǎng)絡(luò)的演變過程便是從部分信息尋找全部信息,即聯(lián)想回憶的過程。,定義5.1 若網(wǎng)絡(luò)的狀態(tài)X 滿足 X=f(WX-T) 則稱X為網(wǎng)絡(luò)的吸引子。,吸引子與能量函數(shù),
7、15,定理5.1 對于DHNN 網(wǎng),若按異步方式調(diào)整網(wǎng)絡(luò)狀態(tài),且連接權(quán)矩陣W 為對稱陣,則對于任意初態(tài),網(wǎng)絡(luò)都最終收斂到一個吸引子。 證明: 定義網(wǎng)絡(luò)的能量函數(shù)為:,令網(wǎng)絡(luò)的能量改變量為E,狀態(tài)改變量為X,有,16,則網(wǎng)絡(luò)能量可進(jìn)一步展開為,將 代入上式 ,并考慮到W為對稱矩陣,有,17,上式中可能出現(xiàn)的情況:,情況a :xj(t)=-1, xj(t+1)=1, 得xj(t)=2, netj(t)0,得E(t)0。,情況b :xj(t)=1, xj(t+1)=-1, 所以xj(t)=-2, netj(t)0,得E(t)0。,情況c :xj(t)=xj(t+1), 所以xj(t)=0, 從而有E
8、(t)=0。,由此可知在任何情況下均有E(t)0 。,18,由于網(wǎng)絡(luò)中各節(jié)點的狀態(tài)只能取1 或 1 ,能量函數(shù)E(t) 作為網(wǎng)絡(luò)狀態(tài)的函數(shù)是有下界的,因此網(wǎng)絡(luò)能量函數(shù)最終將收斂于一個常數(shù),此時E(t)=0 。綜上所述,當(dāng)網(wǎng)絡(luò)工作方式和權(quán)矩陣均滿足定理5.1的條件時,網(wǎng)絡(luò)最終將收斂到一個吸引子。,綜上所述,當(dāng)網(wǎng)絡(luò)工作方式和權(quán)矩陣均滿足定理5.1的條件時,網(wǎng)絡(luò)最終將收斂到一個吸引子。,定理5.2 對于DHNN網(wǎng),若按同步方式調(diào)整狀態(tài),且連接權(quán)矩陣W為非負(fù)定對稱陣,則對于任意初態(tài),網(wǎng)絡(luò)都最終收斂到一個吸引子。,19,證明:,前已證明,對于任何神經(jīng)元 j ,有,因此上式第一項不大于0,只要W為非負(fù)定陣
9、,第二項也不大于0,于是有E(t)0 ,也就是說E(t)最終將收斂到一個常數(shù)值,對應(yīng)的穩(wěn)定狀態(tài)是網(wǎng)絡(luò)的一個吸引子。,20,以上分析表明,在網(wǎng)絡(luò)從初態(tài)向穩(wěn)態(tài)演變的過程中,網(wǎng)絡(luò)的能量始終向減小的方向演變,當(dāng)能量最終穩(wěn)定于一個常數(shù)時,該常數(shù)對應(yīng)于網(wǎng)絡(luò)能量的極小狀態(tài),稱該極小狀態(tài)為網(wǎng)絡(luò)的能量井,能量井對應(yīng)于網(wǎng)絡(luò)的吸引子。,吸引子與能量函數(shù),定義:若網(wǎng)絡(luò)的狀態(tài) X 滿足 則稱X為網(wǎng)絡(luò)的吸引子。,21,性質(zhì)1 :若X 是網(wǎng)絡(luò)的一個吸引子,且閾值T=0,在sgn(0)處,xj(t+1)=xj(t),則 X 也一定是該網(wǎng)絡(luò)的吸引子。,證明:X 是吸引子,即X= f (WX),從而有 f W(X)=f WX=f
10、 WX= X X 也是該網(wǎng)絡(luò)的吸引子。,吸引子的性質(zhì),22,性質(zhì)2:若Xa是網(wǎng)絡(luò)的一個吸引子,則與Xa的海明距離dH(Xa,Xb)=1的Xb一定不是吸引子。,證明:不妨設(shè)x1ax1b,xjaxjb,j=2,3,n。 w11=0,由吸引子定義,有,由假設(shè)條件知,x1ax1b,故, Xb不是該網(wǎng)絡(luò)的吸引子。,23,能使網(wǎng)絡(luò)穩(wěn)定在同一吸引子的所有初態(tài)的集合,稱為該吸引子的吸引域。,定義5.2 若Xa是吸引子,對于異步方式,若存在一個調(diào)整次序,使網(wǎng)絡(luò)可以從狀態(tài)X 演變到Xa ,則稱 X 弱吸引到Xa;若對于任意調(diào)整次序,網(wǎng)絡(luò)都可以從狀態(tài)X 演變到Xa,則稱X強(qiáng)吸引到Xa。,定義5.3 若對某些X,有X
11、弱吸引到吸引子Xa,則稱這些X的集合為Xa的弱吸引域;若對某些X,有X強(qiáng)吸引到吸引子Xa,則稱這些X的集合為Xa的強(qiáng)吸引域。,吸引子的吸引域,24,例5.1 設(shè)有3節(jié)點DHNN網(wǎng),用無向圖表示如下,權(quán)值與閾值均已標(biāo)在圖中,試計算網(wǎng)絡(luò)演變過程的狀態(tài)。,x1 -0.1 -0.5 0.2 x2 0.0 0.0 x3 0.6,25,解:設(shè)各節(jié)點狀態(tài)取值為1 或0 ,3 節(jié)點DHNN 網(wǎng)絡(luò)應(yīng)有23=8種狀態(tài)。不妨將X=(x1,x2,x3 )T=(0,0,0)T 作為網(wǎng)絡(luò)初態(tài),按123的次序更新狀態(tài)。,第1步:更新x1 , x1=sgn(-0.5)0+0.20(-0.1) =sgn(0.1)=1 其它節(jié)點
12、狀態(tài)不變,網(wǎng)絡(luò)狀態(tài)由(0,0,0)T變成(1,0,0)T。如果先更新 x2 或 x3,網(wǎng)絡(luò)狀態(tài)將仍為(0,0,0)T,因此初態(tài)保持不變的概率為2/3,而變?yōu)?1,0,0)T的概率為1/3。,x1 -0.1 -0.5 0.2 x2 0.0 0.0 x3 0.6,26,第2步:此時網(wǎng)絡(luò)狀態(tài)為(1,0,0)T,更新x2后,得 x2=sgn(-0.5)1+0.600=sgn(-0.5)=0 其它節(jié)點狀態(tài)不變,網(wǎng)絡(luò)狀態(tài)仍為(1,0,0)T。如果本步先更新 x1 或 x3,網(wǎng)絡(luò)相應(yīng)狀態(tài)將為(1,0,0)T和(1,0,1)T,因此本狀態(tài)保持不變的概率為2/3,而變?yōu)?1,0,0)T 的概率為1/3。,第3步
13、:此時網(wǎng)絡(luò)狀態(tài)為(1,0,0)T,更新x3得 x3=sgn0.21+0.600=sgn(0.2)=1,同理可算出其它狀態(tài)之間的演變歷程和狀態(tài)轉(zhuǎn)移概率。,27,DHNN網(wǎng)絡(luò)狀態(tài)演變示意圖,28,為了使所設(shè)計的權(quán)值滿足要求,權(quán)值矩陣應(yīng)符合以下要求:,為保證異步方式工作時網(wǎng)絡(luò)收斂,W應(yīng)為對稱陣; 為保證同步方式工作時網(wǎng)絡(luò)收斂,W應(yīng)為非負(fù)定對稱陣; 保證給定樣本是網(wǎng)絡(luò)的吸引子,并且要有一定的吸引域。,外積和法,設(shè)給定P個模式樣本Xp,p=1,2,P,x-1,1n,并設(shè)樣本兩兩正交,且nP,則權(quán)值矩陣為記憶樣本的外積和,網(wǎng)絡(luò)的權(quán)值設(shè)計,29,若取wjj=0,上式應(yīng)寫為,式中I為單位矩陣。上式寫成分量元素
14、形式,有,下面檢驗所給樣本能否稱為吸引子。,因為P個樣本Xp,p=1,2,P,x-1,1n是兩兩正交的,有,30,因為nP,所以有,可見給定樣本Xp,p=1,2,P是吸引子。,31,連續(xù)型Hopfield神經(jīng)網(wǎng)絡(luò),連續(xù)型Hopfield神經(jīng)網(wǎng)絡(luò)(CHNN)是J. J. Hopfield于1984年在離散型Hopfield神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上提出來的,它的原理與離散型網(wǎng)絡(luò)相似。 CHNN是以模擬量作為網(wǎng)絡(luò)的輸入輸出量,各神經(jīng)元采用并行方式工作,因此在信息處理的并行性、聯(lián)想性、實時性、分布存貯、協(xié)同性等方面比DHNN更接近于生物神經(jīng)網(wǎng)絡(luò)。,32,Hopfield動態(tài)神經(jīng)元模型,和電容,并聯(lián),模擬生物神
15、經(jīng)元的延時特性,運算放大器是一個非線性放大器,它模擬生物神經(jīng)元的非線性特性。Ii為獨立的外輸入信號。,電阻,電阻,模擬生物神經(jīng)元之間的突觸特性,33,其輸入、輸出關(guān)系常用如下的兩種非線性函數(shù),圖中每個神經(jīng)元可由同向端或反向端輸出。當(dāng)由反向端輸出時,它對其它神經(jīng)元將起到抑制作用。對于每一個神經(jīng)元而言,自己的輸出信號經(jīng)過其它神經(jīng)元又反饋到自己,所以CHNN是一個連續(xù)的非線 性動力學(xué)系統(tǒng)。,連續(xù)型Hopfield神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖,返回,34,5.3 Boltzmann模型,Boltzmann機(jī)模型與離散型Hopfield神經(jīng)網(wǎng)絡(luò)(DHNN)模型基本相似 共同點 1. 神經(jīng)元取二值輸出(0和1) 2.
16、 神經(jīng)元之間得連接權(quán)矩陣是對稱的 3. 神經(jīng)元的抽樣是隨機(jī)的,每次只調(diào)整一個神經(jīng)元 4. 無自反饋,35,不同點 1.Boltzmann機(jī)允許使用隱含層,而離散型Hopfield神經(jīng)網(wǎng)絡(luò)(DHNN)沒有 2. Boltzmann機(jī)的神經(jīng)元采用隨機(jī)激活機(jī)制,而DHNN則是確定性的 3. DHNN在無監(jiān)督狀態(tài)下運行,而Boltzmann機(jī)可以以某種隨機(jī)模式進(jìn)行有監(jiān)督的學(xué)習(xí),36,Boltzmann機(jī)模型結(jié)構(gòu),由可視層和隱含層兩部分組成,主要用于隨機(jī)性自聯(lián)想記憶。 訓(xùn)練時可視層神經(jīng)元由外輸入矢量鉗制在特定狀態(tài),隱含層運行在自由狀態(tài)。 隱含層神經(jīng)元是用于檢測外輸入的統(tǒng)計特征,這種網(wǎng)絡(luò)可以通過無監(jiān)督的學(xué)
17、習(xí)模擬外界給定的概率分布。,37,Boltzmann機(jī)模型結(jié)構(gòu),這種結(jié)構(gòu)主要用于聯(lián)想記憶。 這種網(wǎng)絡(luò)采用有教師學(xué)習(xí)方式,把某個記憶模式加到網(wǎng)絡(luò)的輸入部分,同時在網(wǎng)絡(luò)的輸出部分按一定概率分布給出一組期望模式。 給出的概率分布函數(shù)實際上是輸出模式對于輸入模式的條件概率分布。,38,例:一個Boltzmann機(jī)構(gòu)成的柴油機(jī)故障診斷系統(tǒng),當(dāng)網(wǎng)絡(luò)提供一個表示排氣管有黑煙的故障輸入模式后,在網(wǎng)絡(luò)的輸出部分(故障診斷系統(tǒng)的診斷輸出端)按產(chǎn)生這種故障現(xiàn)象原因的概率大小提供一系列輸出模式,如氣缸點火位置不準(zhǔn),油料中含有雜質(zhì)等,從而構(gòu)成網(wǎng)絡(luò)學(xué)習(xí)的模式對。 與DHNN相似, Boltzmann機(jī)能量函數(shù)定義為: 其
18、中,n為網(wǎng)絡(luò)的神經(jīng)元總數(shù)(包括可視層和隱含層)。能量函數(shù)E的值與網(wǎng)絡(luò)的全狀態(tài)有關(guān)。,(1),39,所謂全狀態(tài)是指由網(wǎng)絡(luò)全體神經(jīng)元輸出所構(gòu)成的狀態(tài)。網(wǎng)路的全狀態(tài)數(shù)為 。,對應(yīng)于第i個神經(jīng)元的能量函數(shù)為:,設(shè)xi為神經(jīng)元i的輸出,則網(wǎng)絡(luò)的狀態(tài)可表示為,全連接權(quán)為,輸出閥值為,則神經(jīng)元i的綜合輸入(即內(nèi)部狀態(tài)為),(2),(3),40,當(dāng) 發(fā)生變化時,將引起神經(jīng)元狀態(tài)的更新。這種更新在神經(jīng)元之間是同步進(jìn)行的,并用概率分析方法來描述。全神經(jīng)元i 的輸出 為1和0的概率分別為 和 :,T為網(wǎng)絡(luò)溫度。,(5),(4),(6),41,按式(7)和(8)反復(fù)進(jìn)行網(wǎng)絡(luò)的狀態(tài)更新,當(dāng)更新系數(shù)足夠大,網(wǎng)絡(luò)處于“熱平
19、衡”狀態(tài)時,則網(wǎng)絡(luò)某狀態(tài)出現(xiàn)的概率服從Boltzmann分布,且與到達(dá)“熱平衡”狀態(tài)的路徑無關(guān)。,可見,狀態(tài)能量越小,這一狀態(tài)出現(xiàn)的概率越大。這就是Boltzmann分布的一大特點,即“最小能量狀態(tài)以最大概率出現(xiàn)”。,由式(5),相鄰兩次疊代第i個神經(jīng)元能量變化為,(7),(8),42,令(7)中的 則,表明(4)和(5)中的 可以用 代替,所以式(4)和(5)可以寫成,(10),(9),43,和 的關(guān)系如圖所示。由式(7)可以看出,令 ,當(dāng) 時 ,表示狀態(tài)更新能量單調(diào)減少;當(dāng) 時 ,表示能量增加或不變。,當(dāng) 時,當(dāng) 時,在Boltzmann機(jī)中,當(dāng) 時,也容許以較小的概率接受狀態(tài)更新。,44
20、,從圖中還可以看出 隨 的變化較平緩。特別是當(dāng) 時,曲線變成一條恒為0.5的直線,此時 取1和0的概率相等。 在T 較高時,網(wǎng)絡(luò)神經(jīng)元有更多機(jī)會進(jìn)行行狀態(tài)選擇;當(dāng)T 降低時, 曲線變陡,即 對 的變化敏感。當(dāng) 時曲線退化為一階函數(shù),算法就成為Hopfield算法。,45,Boltzmann機(jī)的工作規(guī)則,工作規(guī)則是指在連接權(quán)確定的情況下,網(wǎng)絡(luò)采用的算法。 Boltzmann機(jī)工作規(guī)則與Hopfield網(wǎng)絡(luò)規(guī)則相似,不同是以概率方式代替階躍函數(shù)方式,以決定網(wǎng)絡(luò)根據(jù)其神經(jīng)元內(nèi)部狀態(tài)進(jìn)行狀態(tài)更新。 網(wǎng)絡(luò)的溫度參數(shù)隨著狀態(tài)更新而逐漸減小。 Boltzmann機(jī)的工作規(guī)則就是模擬退火算法的神經(jīng)網(wǎng)絡(luò)實現(xiàn)。,
21、46,Boltzmann機(jī)工作規(guī)則的步驟,初始化,令 根據(jù)設(shè)計計算給定 1. 從n個神經(jīng)元隨機(jī)選擇一個神經(jīng)元i。 2. 按式(8)計算神經(jīng)元的綜合輸入,即內(nèi)部狀態(tài),3. 按式(9)的概率將神經(jīng)元i的狀態(tài)更新為1。更新 概率為:,(11),47,4. i以外神經(jīng)元的輸出狀態(tài)保持不變 5. 從n個神經(jīng)元中另選一個神經(jīng)元,重復(fù)步驟1-4,直到該溫度下網(wǎng)絡(luò)達(dá)到“熱平衡”狀態(tài)。 6. 以某種方式取 ,令 。 7. 判斷運行過程是否結(jié)束?未結(jié)束則返回1.,Boltzmann機(jī)工作規(guī)則的步驟,(12),48,研究表明,按下式的降溫策略可以保證網(wǎng)絡(luò)收斂到全局最小。 其中,k為降溫過程的迭代次數(shù)。 這種降溫策略
22、通常網(wǎng)絡(luò)收斂時間很長,可采用快速降溫策略,返回,(13),(14),49,Boltzmann機(jī)的學(xué)習(xí)規(guī)則,Boltzmann機(jī)的學(xué)習(xí)規(guī)則是指連接權(quán)和閥值的修正規(guī)則,主要用于把網(wǎng)絡(luò)作為一種外界概率分布的模擬。 Boltzmann機(jī)的隱含層用于檢測外輸入的統(tǒng)計特征。隱含層的引入增強(qiáng)了網(wǎng)絡(luò)的計算能力,但也增加了網(wǎng)絡(luò)的復(fù)雜程度。,50,具有可視層和隱含層的隨機(jī)網(wǎng)絡(luò),設(shè)網(wǎng)絡(luò)有n個神經(jīng)元,其中可視層有k個,隱含層有l(wèi)個,nkl 可視層有2k個狀態(tài),隱含層有 2l 個狀態(tài),網(wǎng)絡(luò)共有 個狀態(tài)。 可視層的狀態(tài)向量為 隱含層的狀態(tài)向量為,51,表示網(wǎng)絡(luò)工作在鉗制狀態(tài)下(即有外輸入)可視層神經(jīng)元處于狀態(tài) 的概率。
23、表示網(wǎng)絡(luò)工作在自由狀態(tài)(即無外輸入)下可視層神經(jīng)元處于狀態(tài) 的概率。 可以認(rèn)為概率集合:,為外輸入的期望概率,為網(wǎng)絡(luò)輸出的實際概率,52,Boltzmann機(jī)的學(xué)習(xí)過程中,調(diào)整網(wǎng)絡(luò)的連接權(quán)的目的是使可視層神經(jīng)元具有期望的概率分布,即學(xué)習(xí)的任務(wù)是使實際概率 趨近于期望的概率 。 表示外輸入與網(wǎng)絡(luò)內(nèi)部模型之間偏差的測度。這種測度可以采用由下式定義的相對熵來表示。,(15),53,只有對于所有 都有 才等于0。這種情況下表明內(nèi)部模型與外部輸入完全匹配。 的分布是與連接權(quán) 無關(guān)的,而 則與它有關(guān)。因此 可以通過調(diào)整 使之極小化,并可用梯度算法實現(xiàn)。,對于Boltzmann機(jī),當(dāng)網(wǎng)絡(luò)處于熱平衡狀態(tài)時,由
24、于其概率分布的簡單性質(zhì)可以直接求出式(5) 對 的偏導(dǎo)數(shù)。,取式(5)對 的偏導(dǎo)數(shù),(16),54,因此,連接權(quán)的調(diào)整量可表示為:,式中, 是一個正的常數(shù)。,55,的計算,令 為網(wǎng)絡(luò)工作在自由狀態(tài)下可視層神經(jīng)元處于狀態(tài) ,隱含層神經(jīng)元處于狀態(tài) 的聯(lián)合概率。在這種情況下, 可表示為可視層神經(jīng)元處于狀態(tài) ,而隱含層神經(jīng)元處于任意可能狀態(tài) 的概率。 由全概率公式:,(17),56,當(dāng)網(wǎng)絡(luò)處于熱平衡狀態(tài)時,可以引用Boltzmann分布計算 式中, 為可視層神經(jīng)元處于狀態(tài) ,而隱含層神經(jīng)元處于狀態(tài) 時網(wǎng)絡(luò)的能量。T為網(wǎng)絡(luò)溫度,考慮: 則函數(shù)Z為,(18),(19),57,由網(wǎng)絡(luò)能量函數(shù)定義有 式中,
25、, 為可視層神經(jīng)元處于狀態(tài) ,隱含層神經(jīng)元處于狀態(tài) 時網(wǎng)絡(luò)神經(jīng)元i和j的狀態(tài)(輸出),式(20)的wij已隱含閥值項在內(nèi),由式(19)有,(20),(21),(22),58,由式(20) , 有,式(21)左邊第一項為,(24),(25),(23),59,式(21)右邊第二項為,由式(18),上式第一個因子為Boltzmann分布 。 由式(22)、(23), 上式的第二因子為:,(26),(27),60,將式(18)和式(26)代入(27),得,將式(24)和式(28)代入(21),得,將上式代入(16)則得連接權(quán)的調(diào)整公式如下:,(30),(29),(28),61,為使表達(dá)進(jìn)一步簡化,考慮
26、以下因素: 全部狀態(tài)概率之和為1,即 應(yīng)用Bayes公式,聯(lián)合概率 表示為 式中, 是可視層神經(jīng)元處于狀態(tài) ,且網(wǎng)絡(luò)工作在自由狀態(tài)條件下隱含層神經(jīng)元處于狀態(tài) 的條件概率。,(31),(32),62,同樣網(wǎng)絡(luò)工作在鉗制狀態(tài)的條件下,有 式中, 是可視層神經(jīng)元處于狀態(tài) ,且網(wǎng)絡(luò)工作在鉗制狀態(tài)條件下隱含層處于 狀態(tài)下的概率。,(33),對于Boltzmann機(jī)而言,在給定某一個可視層狀態(tài)的情況下,不管它是外輸入的鉗制狀態(tài),還是網(wǎng)絡(luò)自由運行所達(dá)到的狀態(tài),隱含層狀態(tài)的條件概率是相同的,即,(34),則有,(36),(35),63,將式(31)應(yīng)用于式(30)的第二項,將式(36)應(yīng)用于式(30)的第一項,則得到如下的化簡結(jié)果。,為了簡化表達(dá)形式,引入如下定義,(37),(38),(39),64,式中狀態(tài) 的范圍是 ,狀態(tài) 的范圍是 , 是可視層神經(jīng)元處于鉗制狀態(tài)下,神經(jīng)元i和j所有可能狀態(tài)的相關(guān)矩。 是可視層神經(jīng)元處于自由狀態(tài)下,神經(jīng)元i和j所有可能狀態(tài)之間的相關(guān)矩。 將前式用于式(37) ,最后得到如下的簡化結(jié)果: 式中, 為學(xué)習(xí)速率參數(shù)。式(40)的梯度規(guī)則稱為Boltzmann 機(jī)的學(xué)習(xí)規(guī)則。,(40),65,Boltzmann 機(jī)的學(xué)習(xí)規(guī)則,連接權(quán) 賦予-1,+1區(qū)間的隨機(jī)值,并令 按給定的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 飯店代運營合同范例
- 辦公樓標(biāo)識合同范例
- 北京司機(jī)合同范例
- 購買酒店合同范例范例
- 借貸債權(quán)轉(zhuǎn)讓合同范例
- 集中供氣合同范例
- 專用變壓器合同范例
- 提供服務(wù)合作合同范例
- 土方調(diào)運合同范例
- 托管產(chǎn)品主動分紅合同范例
- 橋梁施工技術(shù)簡介
- 人體生物電脈沖療法
- 具有明顯首過消除的藥物
- 幼兒園采購索證索票制度
- 邁達(dá)斯橋梁建模
- 新產(chǎn)品試制流程管理辦法
- 幼兒園中班個人工作計劃幼兒園中班個人工作計劃范例2021.doc
- 常見繁體字的簡化表 香港人簡體字教學(xué)
- 《教育經(jīng)濟(jì)學(xué)》試題及答案
- 塑料模具肥皂盒設(shè)計說明書
- 穿越河流工程定向鉆專項施工方案
評論
0/150
提交評論