神經(jīng)網(wǎng)絡(luò)非確定方法訓(xùn)練網(wǎng)絡(luò)_第1頁
神經(jīng)網(wǎng)絡(luò)非確定方法訓(xùn)練網(wǎng)絡(luò)_第2頁
神經(jīng)網(wǎng)絡(luò)非確定方法訓(xùn)練網(wǎng)絡(luò)_第3頁
神經(jīng)網(wǎng)絡(luò)非確定方法訓(xùn)練網(wǎng)絡(luò)_第4頁
神經(jīng)網(wǎng)絡(luò)非確定方法訓(xùn)練網(wǎng)絡(luò)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)學(xué)習(xí)的非確定方法在此之前已經(jīng)講述了感知器、BP網(wǎng)絡(luò)、及RBF網(wǎng)絡(luò)的訓(xùn)練算法,這些算法有一個共同特點(diǎn):對應(yīng)于某個樣本的一次迭代,算法都是根據(jù)相應(yīng)樣本、神經(jīng)元狀態(tài)及網(wǎng)絡(luò)聯(lián)接權(quán)當(dāng)前值等計算出本次迭代后網(wǎng)絡(luò)各聯(lián)接權(quán)的調(diào)整量。即:算法所執(zhí)行的計算是確定的。但人腦中有時神經(jīng)元是按照概率工作的,神經(jīng)元在某時刻是處于激勵狀態(tài)還是處于抑制狀態(tài)具有一定的隨機(jī)性。所以為增強(qiáng)神經(jīng)元狀態(tài)的隨機(jī)性可使神經(jīng)元按一定概率工作,聯(lián)接權(quán)的計算根據(jù)一定概率實(shí)現(xiàn)隨機(jī)調(diào)整,這種方法叫做非確定方法,也稱為統(tǒng)計方法(StatisticalMethod。確定方法非確定方法聯(lián)接權(quán)修改方法確定按概率原則隨機(jī)調(diào)整激活原則由激勵函數(shù)確定神經(jīng)元的

2、激勵或抑制具有隨機(jī)性一.基本非確定訓(xùn)練算法1 .基本思想:從所給網(wǎng)絡(luò)中隨機(jī)選取一個聯(lián)接權(quán),對該聯(lián)接權(quán)提出一個偽隨機(jī)調(diào)整量”若此調(diào)整量能使網(wǎng)絡(luò)性能得到改善”則保留此調(diào)整,否則放棄。這種網(wǎng)絡(luò)性能的改善”除了那些真正改善網(wǎng)絡(luò)性能的調(diào)整外,還應(yīng)該包括一定概率下那些使網(wǎng)絡(luò)性能暫時變差、但在總的趨勢上有助于網(wǎng)絡(luò)性能改善的調(diào)整。如圖1所示的從A點(diǎn)到B點(diǎn)的移動(跳出局部極小。圖1局部極小示意圖以下是有監(jiān)督方式下對一個多層前饋網(wǎng)絡(luò)的訓(xùn)練過程。多層前饋網(wǎng)絡(luò)結(jié)構(gòu)如下(1(2(M圖2多層前饋網(wǎng)絡(luò)結(jié)構(gòu)設(shè)網(wǎng)絡(luò)樣本集為:(2211ssDXDXDXS,=其中一,=(21nxxxX,(21mdddD,=為網(wǎng)絡(luò)輸入向量和理想輸出

3、向量網(wǎng)絡(luò)共M層,其聯(lián)接權(quán)矩陣依次為:(2(1,MlWWWW訓(xùn)練算法如下:Step1從樣本集S中取一樣本(X,D;Step2將X輸入網(wǎng)絡(luò),計算網(wǎng)絡(luò)實(shí)際輸出Y(liY,Ml,2,1=;Step3求出網(wǎng)絡(luò)關(guān)于D和Y的誤差測度E;Step4:隨機(jī)從(2(1,MWWW中選擇一個聯(lián)接權(quán)(pij;Step機(jī)生成一個小的隨機(jī)數(shù)(Apij;Step6調(diào)整(pij3,(pijpijpij+二;Step7修改后的(2(1,MWWW重新計算X對應(yīng)的Y;Step8求出網(wǎng)絡(luò)關(guān)于D和Y的誤差測度'E;Step9若EE<',則保留本次對權(quán)值矩陣的修改;否則根據(jù)概率判斷本次修改是否有用,如果認(rèn)為有用,則保

4、留本次修改,否則放棄。Step10重復(fù)上述過程,直到網(wǎng)絡(luò)滿足要求。2 .算法說明:(1訓(xùn)練目標(biāo):對樣本集中白所有樣本,網(wǎng)絡(luò)能獲得最小的誤差測度。常采用理想輸出與網(wǎng)絡(luò)實(shí)際輸出的方差之和作為目標(biāo)函數(shù)。(2網(wǎng)絡(luò)輸入層神經(jīng)元個數(shù)為n,輸出層個數(shù)為m,設(shè)各隱層神經(jīng)元個數(shù)用kH表示,則上述算法Step4中是從mHHHHnM?+?+?-1211個聯(lián)接權(quán)中隨機(jī)選擇其中一個聯(lián)接權(quán)(pij就此可供選擇的方法較多。(3算法中的(Apij可采用偽隨機(jī)數(shù)發(fā)生器得到,也可根據(jù)網(wǎng)絡(luò)當(dāng)前狀態(tài)按照能量”函數(shù)的分布去計算,這樣雖計算量大些,但對提高算法的效率有好處。(從理論上講,聯(lián)接權(quán)的大小應(yīng)該和網(wǎng)絡(luò)能量相關(guān)(4算法中Step9

5、中EE>'的操作是為算法能跳出局部極小點(diǎn)而設(shè)計的,應(yīng)用概率原則判斷是否接受本次修改。為使網(wǎng)絡(luò)從局部極小點(diǎn)逃離,必須允許目標(biāo)函數(shù)暫時變差。(5用何種標(biāo)準(zhǔn)來判斷網(wǎng)絡(luò)滿足要求。(6當(dāng)一個樣本輸入網(wǎng)絡(luò)后,產(chǎn)生的隨機(jī)修改量可能使網(wǎng)絡(luò)性能變差,即該修改無效,此時能否可以隨機(jī)抽取其他網(wǎng)絡(luò)權(quán)值進(jìn)行修改,直至修改有效?(7對一個選定的樣本,能否每次選取若干個聯(lián)接權(quán)進(jìn)行修改?若修改有效,可一次進(jìn)行多個權(quán)值的更新。3局部極小問題:從數(shù)學(xué)角度來說,上述問題是求一個mHHHHnM?+?+?-1211元函數(shù)的極小點(diǎn)問題,也就是說算法要在一個極其復(fù)雜的高維環(huán)境中尋找其全局極小點(diǎn)。由圖1可見,若采用基于負(fù)梯度白

6、方法修改權(quán)值,則網(wǎng)絡(luò)一旦陷入局部極小,就難以逃離出來而在上述算法中,如果權(quán)值修改量較大,就很有可能使網(wǎng)絡(luò)遠(yuǎn)離已經(jīng)陷入的某個極小點(diǎn),所以保留使網(wǎng)絡(luò)性能變差的修改,同時適當(dāng)增加修改量將有助于網(wǎng)絡(luò)逃離局部極小點(diǎn)的束縛。同樣,權(quán)值修改量不宜過大,否則容易造成函數(shù)在相鄰極值點(diǎn)之間的來回跳動。一個較好的辦法是:在算法初期選擇較大的權(quán)值修改量,這樣有利于搜索整個輸入空間;然后逐漸減小這個修改量,但應(yīng)保證網(wǎng)絡(luò)有能力從局部極小點(diǎn)跳出;在算法后期,進(jìn)一步減小權(quán)值修改量,當(dāng)網(wǎng)絡(luò)進(jìn)入全局極小點(diǎn)區(qū)域時,網(wǎng)絡(luò)沒有足夠能量跳出。所以權(quán)值修改量大小應(yīng)該和網(wǎng)絡(luò)的能量相關(guān)。.模擬退火算法(AnnealingAlgorithm網(wǎng)絡(luò)

7、的目標(biāo)函數(shù)統(tǒng)稱定義為網(wǎng)絡(luò)的某種誤差測度。當(dāng)誤差測度較大時,表明網(wǎng)絡(luò)距離全局極小點(diǎn)比較遠(yuǎn),所以網(wǎng)絡(luò)應(yīng)該具有較大的能量”以使其能逃離可能路過”的局部極小點(diǎn);當(dāng)誤差測度較小時,說明距離全局極小點(diǎn)較近,或已進(jìn)入全局極小點(diǎn)區(qū)域,此時網(wǎng)絡(luò)的能量”較小,修改網(wǎng)絡(luò)權(quán)值時不足以使其有足夠的能量跳出全局極小點(diǎn)。這一過程可用金屬的退火過程形象地描述。在金屬熱加工過程中,金屬的溫度與其能量有一定關(guān)系。當(dāng)金屬溫度超過其熔點(diǎn)(MeltingPoint時,原子會激烈地隨機(jī)運(yùn)動,這種運(yùn) 動趨向于尋找其能量最小的狀態(tài)。溫度越高,原子具有的能量就越高。隨著溫度的不斷降低,金屬逐漸冷卻,其原子的能量也越來越小,最后到達(dá)能量最低點(diǎn),

8、這就是全局極小點(diǎn)。即通過升高溫度可提高金屬原子的能量,使其能擺脫原來的能量狀態(tài)(局部極小而最終到達(dá)一個更加穩(wěn)定的狀態(tài)(全局極小。3 .退火過程描述:在金屬的退火過程中,其能量的狀態(tài)分布如下:?8kTE-EPexp(其中:(EP表示系統(tǒng)處于能量E的狀態(tài)的概率;k為Boltzmann常數(shù);T為系統(tǒng)的絕對溫度(開氏溫度,Kelvin。1explim=?8+kTET所以當(dāng)溫度足夠高時,系統(tǒng)溫度T起主要作用,此時對于所有的能量狀態(tài)E,其概率趨于1,這表明系統(tǒng)處于高能量狀態(tài)的概率與處于低能量狀態(tài)的概率是一樣的。隨著溫度的降低,E在決定/exp(kTE-的值時作用越來越明顯:E越大,(EP就越小,系統(tǒng)處于高

9、能量狀態(tài)的可能性就越小。當(dāng)溫度降為0時,系統(tǒng)就很難處于一個高能量狀態(tài)。(1在高溫情況下,T足句,對系統(tǒng)所能處的任意能量狀態(tài)E,隨kTE/趨于0,/exp(kTE-將趨于1。(2在中溫情況下,T比較小,設(shè)21EE>,則:kTEkTE21>,?kTEkTE21-<-,?(12EPEP>即:系統(tǒng)處于高能量狀態(tài)的可能性小于處于低能量狀態(tài)的可能性。(3在低溫情況下,T非常小,設(shè)21EE>,則:?-=?-=一一一kTEEkTEkTEEPEPTTT210210210explim/exp(/exp(lim(lim0exp(1lim1210=?-二一kTTEE所以有:(12EPEP

10、>>,即:溫度趨近于0時,系統(tǒng)處于低能量狀態(tài)的概率遠(yuǎn)遠(yuǎn)大于系統(tǒng)處于高能量狀態(tài)的概率。4 .模擬退火算法描述:可將網(wǎng)絡(luò)的訓(xùn)練過程看成是讓網(wǎng)絡(luò)尋找最低能量狀態(tài)的過程,此時可取網(wǎng)絡(luò)目標(biāo)函數(shù)為其能量函數(shù),再定義一個較大的人工溫度T,并且在訓(xùn)練過程中依據(jù)網(wǎng)絡(luò)的能量和溫度來決定其聯(lián)接權(quán)的調(diào)整量。這種方法稱為模擬退火組合優(yōu)化法。(1基本思想如下:隨機(jī)為系統(tǒng)選擇一個初始狀態(tài)(pij在初始狀態(tài)下給系統(tǒng)一個小的隨機(jī)擾動(pij就算系統(tǒng)的能量變化:(pijpijpijEEE-?+=?若0<?E,則接受此擾動;若0?E則根據(jù)以下概率判斷是否接受:?-kTEexp如果此擾動被接受,則系統(tǒng)從狀態(tài)(pij

11、變換(pijp?需則系統(tǒng)狀態(tài)保持不變逐漸降低溫度T ,并如此重復(fù)下去,直至溫度最上述過程也稱為Metropolis抽樣過程,它滿足Boltzmann分布,即系統(tǒng)的狀態(tài)序列(pij涉足:(?-=kTETcfpijexp(?-=kTETcpijexp1(設(shè)(pijE表示物質(zhì)體系在狀態(tài)(pij時的內(nèi)能。對于給定的溫度T,若系統(tǒng)處于熱平衡狀態(tài)時(pijE服從Boltzmann分布,當(dāng)溫度T下降時,內(nèi)能E也隨之下降。若T下降的足夠慢,則系統(tǒng)總可以保持熱平衡狀態(tài),使其內(nèi)能在該溫度下最低。當(dāng)T下降至0K時,系統(tǒng)內(nèi)能達(dá)到最小值。(2模擬退火算法如下:Step1初始化各層的權(quán)值聯(lián)接矩陣0W,定義人工溫度T的初值

12、0T;Step2:對每個溫度T重復(fù)如下過程:(2.2)隨機(jī)從ij中選取一個ij;(p(p(2.1)選取一個樣本,計算其實(shí)際輸出與目標(biāo)函數(shù)/;(P(2.3)按一定算法產(chǎn)生ij的一個調(diào)整量ij;(p(p(2.4)按照ij(p(P(P(Pij重新計算相應(yīng)的輸出和目標(biāo)函數(shù)七。;(2.5)計算EEij(p(p(pijEij;(2.6)如果E0,則:(2.6.1)按均勻分布在0,1區(qū)間取一隨機(jī)數(shù)r;(2.6.2)按Boltzmann分布計算接受本次調(diào)整的概率:(p(pBijijPEexpkF(p(p(2.6.3)如果PLijijr,則轉(zhuǎn)(2.2);(pij(pij(2.7)用ij(P(P(Pij)代替ij

13、;(2.8)如果樣本集中還有未被選用的樣本,則轉(zhuǎn)(2.1);Step3:判斷在此溫度下,Metropolis抽樣是否穩(wěn)定。若穩(wěn)定則轉(zhuǎn)Step4,否則轉(zhuǎn)Step2;Step4:降低溫度T;Step5:如果T足夠小,則結(jié)束,否則轉(zhuǎn)StepZ三.模擬退火算法使用說明:1.模擬退火算法是否能達(dá)到E的最小值,取決于T0足夠高和T下降的足夠慢,以及在每個溫度下,Metropolis抽樣是否穩(wěn)定。2.溫度的初值T(0可按照如下方法確定:(1)TOE(W0,即:取初始時系統(tǒng)目標(biāo)函數(shù)的值。(2)10kE(W0,即:取初始時系統(tǒng)目標(biāo)函數(shù)值的若干倍。(3)依據(jù)經(jīng)驗(yàn)而定,選取某個較大的值作為T0。3.溫度的下降原則。

14、理論上說溫度T的下降應(yīng)不快于T(lTO,”Int,l123,。所以可選用如下的溫度下降方法:(1)T(tT(t1,稱為冷卻率,取值范圍為:0.8,0.9。(2)Geman在1984年曾證明:溫度的下降必須與時間的對數(shù)成反比,網(wǎng)絡(luò)才能收斂到全局極小點(diǎn)。此時溫度的下降采用如下公式:TT0,t為人工時間,可采用迭代次數(shù)。logU14.Metropolis抽樣是否穩(wěn)定的判斷。(1)檢驗(yàn)?zāi)繕?biāo)函數(shù)E的均值是否穩(wěn)定(記錄迭代過程中各樣本相應(yīng)的目標(biāo)函數(shù)值);(2)檢驗(yàn)是否連續(xù)若干步E的變化值均小于某個值(為非常小的正數(shù));(3)每個溫度下按照固定的或預(yù)先設(shè)定的步數(shù)進(jìn)行抽樣。5.調(diào)整量ij的確定:(p(1)簡單

15、起見,ij為小的均勻分布的隨機(jī)擾動;(p(2)根據(jù)Boltzmann分布或Gauss分布來計算。Gauss分布如下所示:(2p(expT2上式說明:當(dāng)增加時,其相應(yīng)的概率將降低。為求得可采用如下的MonteCarlo法:首先對p(用數(shù)值積分法從0到求積分,根據(jù)網(wǎng)絡(luò)精度要求設(shè)定一個積分長度,構(gòu)造出如下形式的表格:cl2c23c3,NcN0p(>ik然后按照均勻分布在c1,cN上隨機(jī)選取一個值c,再從cl,c2,cN)中選取ck,使ck滿足:ckcminclc,c2c,cN。,最后ck所對應(yīng)的k即為需求的權(quán)值修改量。Boltzmann分布可得到與Gauss分布類似的結(jié)論。值得注意的是:ij值

16、較大時,可能使網(wǎng)絡(luò)產(chǎn)生振蕩;而ij值較小時,又會影響(p(p到算法的收斂速度。6.Cauchy訓(xùn)練:Cauchy分布的一般形式為:P(xTTx22用Cauchy分布取代上述MonteCarlo法中的Gauss分布,具有如下優(yōu)點(diǎn):(1)按照Cauchy分布得到的聯(lián)接權(quán)調(diào)整量大于Gauss分布得到的調(diào)整量。取得較大聯(lián)接權(quán)調(diào)整量的機(jī)會越多,訓(xùn)練的速度就越快,算法的效率就高。(2)用Cauchy分布取代Gauss分布或Boltzmann分布,溫度T可以下降得更快,從而提高算法訓(xùn)練速度。此時溫度下降公式可為:TTOIt(3)Cauchy分布可以直接用常規(guī)積分方法計算:P(即:OpfxdxOTdxarcian(/ITx22Ttan(P(,加上學(xué)習(xí)率,有Turn(P(。與MonteCarlo法相對應(yīng),僅需在0,1區(qū)間內(nèi)按均勻分布隨機(jī)選取一個數(shù)作為P(,再取當(dāng)前的溫度值T,即可算出權(quán)值修改量。7.算法的Step2是對每個樣本調(diào)整一個權(quán)值,調(diào)整順序是隨機(jī)的,所以實(shí)際應(yīng)用中可針對具體情況對算法流程加以適當(dāng)改變。四.BP算法與Cauchy訓(xùn)練的結(jié)合Cauchy訓(xùn)練的速度比Boltzmann訓(xùn)練快,但與BP算法相比,速度較慢。其原因在于BP算法是沿著能量函數(shù)極小化的方向調(diào)整聯(lián)接權(quán)值,且每次

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論