版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第10章 非確定方法 10.1 基本的非確定學(xué)習(xí)算法 10.2 模擬退火算法 10.3 Cauchy學(xué)習(xí) 10.4 相關(guān)的幾個問題 第10章 非確定方法確定的方法前幾章所給方法的共同特征非確定的方法生物神經(jīng)網(wǎng)絡(luò)按照概率運行別稱統(tǒng)計方法(Statistical Method)。既可以用于學(xué)習(xí),又可以用于運行 10.1 基本的非確定學(xué)習(xí)算法 基本思想從所給的網(wǎng)絡(luò)中“隨機地選取一個聯(lián)接權(quán)”,對該聯(lián)接權(quán)提出一個“偽隨機調(diào)整量”,當(dāng)用此調(diào)整量對所選的聯(lián)接權(quán)進行修改后,如果“被認為”修改改進了網(wǎng)絡(luò)的性能,則保留此調(diào)整;否則放棄本次調(diào)整。 10.1 基本的非確定學(xué)習(xí)算法基本數(shù)據(jù)結(jié)構(gòu)樣本集:S= (X1,Y1
2、),(X2,Y2),(Xs,Ys)輸入向量:X=(x1,x2,xn)理想輸出向量:Y=(y1,y2,ym)L層: W(1) ,W(2) ,W(L) 10.1 基本的非確定學(xué)習(xí)算法拓撲結(jié)構(gòu) x1o1輸出層隱藏層輸入層x2o2omxnW(1) W(L)W(2)算法10-1 基本統(tǒng)計學(xué)習(xí)算法7 用修改后的W(1) ,W(2) ,W(L)重新計算X對應(yīng)的實際輸出O;8 求出網(wǎng)絡(luò)關(guān)于Y,O的誤差測度E;9 如果EE,則保留本次對W(1) ,W(2) ,W(L)的修改, 否則,根據(jù)概率判斷本次修改是否有用,如果認為有用,則保留本次對W(1) ,W(2) ,W(L)的修改,如果認為本次修改無用,則放棄它;1
3、0 重復(fù)上述過程,直到網(wǎng)絡(luò)滿足要求。 算法10-1 基本統(tǒng)計學(xué)習(xí)算法目標函數(shù)(Objective Function)誤差測度函數(shù):實際輸出與理想輸出方差和 計算量 從W(1) ,W(2) ,W(L)中隨機地選擇wij 共有nH1+H1H2+H2H3+HM-1m個“變量”可供選擇偽隨機數(shù)偽隨機數(shù)發(fā)生器來產(chǎn)生wij(p);按照所謂的“能量”函數(shù)的分布去計算它逃離局部極小點 聯(lián)接權(quán)修改量 太?。郝涞紸點后很難逃離 太大:導(dǎo)致在A、B兩點來回抖動 解決辦法 控制聯(lián)接權(quán)修改量的大?。簷?quán)修改量由大變小 允許暫時變壞 修改量的大小和網(wǎng)絡(luò)的“能量”相關(guān) 模擬退火 ABD逃離局部極小點DBA10.1 模擬退火算
4、法及模型 算法的提出 模擬退火算法最早的思想由Metropolis等(1953)提出,1983年Kirkpatrick等將其應(yīng)用于組合優(yōu)化。算法的目的 解決NP復(fù)雜性問題; 克服優(yōu)化過程陷入局部極??; 克服初值依賴性。 10.1.1 物理退火過程10.1 模擬退火算法及模型 物理學(xué)方面的模擬退火概念 固體物理中,金屬結(jié)構(gòu)的穩(wěn)定程度對應(yīng)著一個能量函數(shù)。 當(dāng)溫度高時,原子的運動不穩(wěn)定,能量函數(shù)較高。 如果用淬火的方式驟然降溫,能量函數(shù)就會進入一個局部極小。 10.1.1 物理退火過程10.1 模擬退火算法及模型 物理學(xué)方面的模擬退火概念 所謂退火,是近似一種雙極限過程:極限一:當(dāng)溫度有改變時,經(jīng)過
5、無窮大時間后,系統(tǒng)可以進入穩(wěn)態(tài);極限二:溫度以無窮小的速度趨進于絕對零度; 10.1.1 物理退火過程10.1 模擬退火算法及模型 物理退火過程 加溫過程增強粒子的熱運動,消除系統(tǒng)原先可能存在的非均勻態(tài); 等溫過程對于與環(huán)境換熱而溫度不變的封閉系統(tǒng),系統(tǒng)狀態(tài)的自發(fā)變化總是朝自由能減少的方向進行,當(dāng)自由能達到最小時,系統(tǒng)達到平衡態(tài); 冷卻過程使粒子熱運動減弱并漸趨有序,系統(tǒng)能量逐漸下降,從而得到低能的晶體結(jié)構(gòu)。 10.1.1 物理退火過程10.1 模擬退火算法及模型 數(shù)學(xué)表述 在溫度T,分子停留在狀態(tài)r滿足Boltzmann概率分布 10.1.1 物理退火過程10.1 模擬退火算法及模型 數(shù)學(xué)表
6、述 在同一個溫度T,選定兩個能量E1E2,有 在同一個溫度,分子停留在能量小的狀態(tài)的概率比停留在能量大的狀態(tài)的概率要大。 10.1.1 物理退火過程010.1 模擬退火算法及模型 數(shù)學(xué)表述 若|D|為狀態(tài)空間D中狀態(tài)的個數(shù),D0是具有最低能量的狀態(tài)集合: 當(dāng)溫度很高時,每個狀態(tài)概率基本相同,接近平均值1/|D|; 狀態(tài)空間存在超過兩個不同能量時,具有最低能量狀態(tài)的概率超出平均值1/|D| ; 當(dāng)溫度趨于0時,分子停留在最低能量狀態(tài)的概率趨于1。能量最低狀態(tài) 10.1 模擬退火算法及模型 Metropolis準則(1953)以概率接受新狀態(tài) 固體在恒定溫度下達到熱平衡的過程可以用Monte Ca
7、rlo方法(計算機隨機模擬方法)加以模擬,雖然該方法簡單,但必須大量采樣才能得到比較精確的結(jié)果,計算量很大。 10.1.1 物理退火過程10.1 模擬退火算法及模型 Metropolis準則(1953)以概率接受新狀態(tài) 若在溫度T,當(dāng)前狀態(tài)i 新狀態(tài)j 若Ej=randrom0,1 s=sj; Until 抽樣穩(wěn)定準則滿足; 退溫tk+1=update(tk)并令k=k+1; Until 算法終止準則滿足; 輸出算法搜索結(jié)果。 10.1.3 模擬退火算法的基本思想和步驟10.1 模擬退火算法及模型 定義馬爾科夫性(無后效性):由時刻t0系統(tǒng)或過程所處的狀態(tài),可以決定系統(tǒng)或過程在時刻t0所處的狀
8、態(tài),而無需借助于t0以前系統(tǒng)或過程所處狀態(tài)的歷史資料。馬爾科夫性過程分布函數(shù)的描述:X(tn-1)=xn-1,即:PX(tn)=xn|x(t1=x1),X(t2)=x2,.,X(tn-1)=xn-1=PX(tn)=xn|X(tn-1)=xn-1, xnR. 10.2.1 馬爾科夫鏈10.2 模擬退火算法的馬氏鏈描述 定義 10.2.1 馬爾科夫鏈10.2 模擬退火算法的馬氏鏈描述 定義 一步轉(zhuǎn)移概率: n步轉(zhuǎn)移概率: 若解空間有限,稱馬爾可夫鏈為有限狀態(tài); 若 ,稱馬爾可夫鏈為時齊的。 10.2.1 馬爾科夫鏈10.2 模擬退火算法的馬氏鏈描述 模擬退火算法對應(yīng)了一個馬爾可夫鏈 模擬退火算法:
9、新狀態(tài)接受概率僅依賴于新狀態(tài)和當(dāng)前狀態(tài),并由溫度加以控制。 若固定每一溫度,算法均計算馬氏鏈的變化直至平穩(wěn)分布,然后下降溫度,則稱為時齊算法; 若無需各溫度下算法均達到平穩(wěn)分布,但溫度需按一定速率下降,則稱為非時齊算法。分析收斂性 10.2.2 模擬退火算法與馬爾科夫鏈10.3 模擬退火算法關(guān)鍵參數(shù)和操作的設(shè)計原則 產(chǎn)生的候選解應(yīng)遍布全部解空間方法 在當(dāng)前狀態(tài)的鄰域結(jié)構(gòu)內(nèi)以一定概率方式(均勻分布、正態(tài)分布、指數(shù)分布等)產(chǎn)生 10.10.1 狀態(tài)產(chǎn)生函數(shù)10.3 模擬退火算法關(guān)鍵參數(shù)和操作的設(shè)計原則 (1)在固定溫度下,接受使目標函數(shù)下降的候選解的概率要大于使目標函數(shù)上升的候選解概率; (2)隨
10、溫度的下降,接受使目標函數(shù)上升的解的概率要逐漸減?。?(3)當(dāng)溫度趨于零時,只能接受目標函數(shù)下降的解。方法 具體形式對算法影響不大 一般采用min1,exp(-C/t) 10.10.2 狀態(tài)接受函數(shù)10.3 模擬退火算法關(guān)鍵參數(shù)和操作的設(shè)計收斂性分析 通過理論分析可以得到初溫的解析式,但解決實際問題時難以得到精確的參數(shù); 初溫應(yīng)充分大;實驗表明 初溫越大,獲得高質(zhì)量解的機率越大,但花費較多的計算時間; 10.10.3 初溫10.3 模擬退火算法關(guān)鍵參數(shù)和操作的設(shè)計方法 (1)均勻抽樣一組狀態(tài),以各狀態(tài)目標值得方差為初溫; (2)隨機產(chǎn)生一組狀態(tài),確定兩兩狀態(tài)間的最大目標值差,根據(jù)差值,利用一定
11、的函數(shù)確定初溫; (3)利用經(jīng)驗公式。 10.10.3 初溫10.3 模擬退火算法關(guān)鍵參數(shù)和操作的設(shè)計時齊算法的溫度下降函數(shù) (1) ,越接近1溫度下降越慢,且其大小可以不斷變化; (2) ,其中t0為起始溫度,K為算法溫度下降的總次數(shù)。 10.10.4 溫度更新函數(shù)10.3 模擬退火算法關(guān)鍵參數(shù)和操作的設(shè)計 時齊算法常用的Metropolis抽樣穩(wěn)定準則 (1)檢驗?zāi)繕撕瘮?shù)的均值是否穩(wěn)定; (2)連續(xù)若干步的目標值變化較??; (3)按一定的步數(shù)抽樣。 10.10.5 內(nèi)循環(huán)終止準則10.3 模擬退火算法關(guān)鍵參數(shù)和操作的設(shè)計常用方法 (1)設(shè)置終止溫度的閾值; (2)設(shè)置外循環(huán)迭代次數(shù); (3
12、)算法搜索到的最優(yōu)值連續(xù)若干步保持不變; (4)概率分析方法。 10.10.6 外循環(huán)終止準則模擬退火組合優(yōu)化法 目標函數(shù)能量函數(shù)人工溫度T一個初值較大的數(shù)依據(jù)網(wǎng)絡(luò)的能量和溫度來決定聯(lián)接權(quán)的調(diào)整量(稱為步長)。與金屬的退火過程(Annealing)非常相似模擬退火組合優(yōu)化法基本思想 隨機地為系統(tǒng)選擇一個初始狀態(tài)wij(p),在此初始狀態(tài)下,給系統(tǒng)一個小的隨機擾動wij(p),計算系統(tǒng)的能量變化E=E(wij(p)+wij(p)-E(wij(p) 若 E0 then2.10.1 按均勻分布在0,1區(qū)間取一隨機數(shù)r;2.10.2 按Boltzmann分布計算接受本次調(diào)整的概率:P(E( wij(p
13、) +wij(p) ) = 2.10.3 if P(E( wij(p) +wij(p) )r then 轉(zhuǎn)2.2; 算法10-2 模擬退火算法2.7 用 wij(p) +wij(p) 代替 wij(p) ;2.8 if 樣本集中還有未被選用的樣本 then 轉(zhuǎn) 2.1;3 判斷在此溫度下,檢驗Metropolis抽樣是否穩(wěn)定。如不穩(wěn)定,則直接轉(zhuǎn)2;4 降低溫度T;5 如果T足夠小,則結(jié)束,否則,轉(zhuǎn)2。 算法10-2 模擬退火算法算法的第2步原則上應(yīng)該對每一個樣本調(diào)整每一個權(quán),調(diào)整的順序是隨機的;溫度T的降低 T=T 叫做冷卻率,一般情況下可以在0.8,0.9之間取值 Geman(1984年):
14、溫度下降必須與時間的對數(shù)成反比,網(wǎng)絡(luò)最終才能收斂到全局極小點 算法10-2 模擬退火算法T的初值T0 T0= E(w (h) );即:取初始系統(tǒng)目標函數(shù)(能量)的值 T0=z E(w (h) )。即:取初始系統(tǒng)目標函數(shù)(能量)值的若干倍 按照經(jīng)驗給出 算法10-2 模擬退火算法調(diào)整量wij(p)的計算 可以根據(jù)Boltzmann分布或者Gaussian分布來計算。也可以用其它的方法。下面討論按Gaussian分布進行計算的方法。我們?nèi)∪缦滦问降腉aussian分布函數(shù)。簡潔起見,用符號w代替符號wij(p): p(w)= 10.5 模擬退火算法的實現(xiàn)與應(yīng)用 10.5.1 30城市TSP問題(d
15、*=4210.741 by D B Fogel) TSP Benchmark 問題 41 94;37 84;54 67;25 62; 7 64;2 99;68 58;71 44;54 62;83 69;64 60;18 54;22 60;83 46;91 38;25 38;24 42;58 69;71 71;74 78;87 76;18 40;13 40;82 7;62 32; 58 35;45 21;41 26;44 35;4 5010.5 模擬退火算法的實現(xiàn)與應(yīng)用算法流程 10.5.1 30城市TSP問題(d*=4210.741 by D B Fogel) 10.4 模擬退火算法的改進模擬
16、退火算法的優(yōu)點 質(zhì)量高; 初值魯棒性強; 簡單、通用、易實現(xiàn)。模擬退火算法的缺點 由于要求較高的初始溫度、較慢的降溫速率、較低的終止溫度,以及各溫度下足夠多次的抽樣,因此優(yōu)化過程較長。 10.4.1 模擬退火算法的優(yōu)缺點10.4 模擬退火算法的改進改進的可行方案 (1)設(shè)計合適的狀態(tài)產(chǎn)生函數(shù); (2)設(shè)計高效的退火歷程; (3)避免狀態(tài)的迂回搜索; (4)采用并行搜索結(jié)構(gòu); (5)避免陷入局部極小,改進對溫度的控制方式; (6)選擇合適的初始狀態(tài); (7)設(shè)計合適的算法終止準則。 10.4.2 改進內(nèi)容10.4 模擬退火算法的改進改進的方式 (1)增加升溫或重升溫過程,避免陷入局部極?。?(2
17、)增加記憶功能(記憶“Best so far”狀態(tài)); (3)增加補充搜索過程(以最優(yōu)結(jié)果為初始解); (4)對每一當(dāng)前狀態(tài),采用多次搜索策略,以概率接受區(qū)域內(nèi)的最優(yōu)狀態(tài); (5)結(jié)合其它搜索機制的算法; (6)上述各方法的綜合。 10.4.2 改進內(nèi)容10.4 模擬退火算法的改進改進的思路 (1)記錄“Best so far”狀態(tài),并即時更新; (2)設(shè)置雙閾值,使得在盡量保持最優(yōu)性的前提下減少計算量,即在各溫度下當(dāng)前狀態(tài)連續(xù) m1 步保持不變則認為Metropolis抽樣穩(wěn)定,若連續(xù) m2 次退溫過程中所得最優(yōu)解不變則認為算法收斂。 10.4.3 一種改進的模擬退火算法10.4 模擬退火算
18、法的改進改進的退火過程 (1)給定初溫t0,隨機產(chǎn)生初始狀態(tài)s,令初始最優(yōu)解s*=s,當(dāng)前狀態(tài)為s(0)=s,i=p=0; (2)令t=ti,以t,s*和s(i)調(diào)用改進的抽樣過程,返回其所得最優(yōu)解s*和當(dāng)前狀態(tài)s(k),令當(dāng)前狀態(tài)s(i)=s(k); (3)判斷C(s*)m2? 若是,則轉(zhuǎn)第(6)步;否則,返回第(2)步; (6)以最優(yōu)解s*作為最終解輸出,停止算法。 10.4.3 一種改進的模擬退火算法10.4 模擬退火算法的改進改進的抽樣過程 (1)令k=0時的初始當(dāng)前狀態(tài)為s(0)=s(i),q=0; (2)由狀態(tài)s通過狀態(tài)產(chǎn)生函數(shù)產(chǎn)生新狀態(tài)s,計算增量C=C(s)-C(s); (3)
19、若CC(s)? 若是,則令s*=s,q=0;否則,令q=q+1。若C0,則以概率exp(-C/t)接受s作為下一當(dāng)前狀態(tài); (4)令k=k+1,判斷qm1? 若是,則轉(zhuǎn)第(5)步;否則,返回第(2)步; (5)將當(dāng)前最優(yōu)解s*和當(dāng)前狀態(tài)s(k)返回改進退火過程。 10.4.3 一種改進的模擬退火算法10.5 模擬退火算法的實現(xiàn)與應(yīng)用初始溫度的計算 for i=1:100 route=randperm(CityNum); fval0(i)=CalDist(dislist,route); end t0=-(max(fval0)-min(fval0)/log(0.9); 10.5.1 30城市TSP問題(d*=4210.741 by D B Fogel) 10.5 模擬退火算法的實現(xiàn)與應(yīng)用狀態(tài)產(chǎn)生函數(shù)的設(shè)計 (1)互換操作,隨機交換兩個城市的順序; (2)逆序操
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山東省臨沂市(2024年-2025年小學(xué)五年級語文)統(tǒng)編版開學(xué)考試(下學(xué)期)試卷及答案
- 《消防設(shè)施操作員(初級)》認證培訓(xùn)-初起火災(zāi)處置基本知識-考試題庫
- 2024年引資企業(yè)獎勵協(xié)議書模板
- 2024年繼父斷絕母女關(guān)系協(xié)議書模板
- 2024年一事不再理離婚協(xié)議書模板
- 2024年婚紗店鋪租房合同范本
- 云南省西雙版納傣族自治州(2024年-2025年小學(xué)五年級語文)人教版綜合練習(xí)(下學(xué)期)試卷及答案
- 云南省玉溪市(2024年-2025年小學(xué)五年級語文)統(tǒng)編版課后作業(yè)((上下)學(xué)期)試卷及答案
- 2024房屋裝修合同常用范本簡單
- 2024大學(xué)生就業(yè)簽訂勞動合同注意事項
- 安全管理的幾點做法1000字
- 國網(wǎng)基建各專業(yè)考試題庫大全-安全專業(yè)-上(單選題匯總)
- 新公共服務(wù)視角下的政府職能轉(zhuǎn)變問題研究共3篇
- 全部財產(chǎn)給獨生子女遺囑范文(優(yōu)選3篇)
- 新疆烏魯木齊2022學(xué)年高二上學(xué)期期中考試 英語
- (完整版)安全管理體系
- 2023年湖南有色金屬職業(yè)技術(shù)學(xué)院單招考試職業(yè)技能考試模擬試題及答案解析
- 中班健康《魔幻消氣屋》有聲動態(tài)課件
- 基于蘭州市局部路網(wǎng)數(shù)據(jù)的非平衡交通分配模型分析
- RB/T 115-2014能源管理體系石油化工企業(yè)認證要求
- 夏商周考古課件 第1章 緒論
評論
0/150
提交評論