學(xué)習(xí)電腦信息五大常用算法之二:動態(tài)規(guī)劃算法_第1頁
學(xué)習(xí)電腦信息五大常用算法之二:動態(tài)規(guī)劃算法_第2頁
學(xué)習(xí)電腦信息五大常用算法之二:動態(tài)規(guī)劃算法_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Page1五大常用算法之二:動態(tài)規(guī)劃算法五大常用算法之二:動態(tài)規(guī)劃算法

一、基本概念

動態(tài)規(guī)劃過程是:每次決策依靠于當前狀態(tài),又隨即引起狀態(tài)的轉(zhuǎn)移。一個決策序列就是在改變的狀態(tài)中產(chǎn)生出來的,所以,這種多階段最優(yōu)化決策解決問題的過程就稱為動態(tài)規(guī)劃。二、基本思想與策略

基本思想與分治法類似,也是將待求解的問題分解為若干個子問題(階段),按依次求解子階段,前一子問題的解,為后一子問題的求解供應(yīng)了有用的信息。在求解任一子問題時,列出各種可能的局部解,通過決策保留那些有可能達到最優(yōu)的局部解,丟棄其他局部解。依次解決各子問題,最終一個子問題就是初始問題的解。

由于動態(tài)規(guī)劃解決的問題多數(shù)有重疊子問題這個特點,為削減重復(fù)計算,對每一個子問題只解一次,將其不同階段的不同狀態(tài)保存在一個二維數(shù)組中。

與分治法最大的差別是:適合于用動態(tài)規(guī)劃法求解的問題,經(jīng)分解后得到的子問題往往不是相互獨立的(即下一個子階段的求解是建立在上一個子階段的解的基礎(chǔ)上,進行進一步的求解)。

三、適用的狀況能采納動態(tài)規(guī)劃求解的問題的一般要具有3特性質(zhì):

(1)最優(yōu)化原理:假如問題的最優(yōu)解所包含的子問題的解也是最優(yōu)的,就稱該問題具有最優(yōu)子結(jié)構(gòu),即滿意最優(yōu)化原理。

(2)無后效性:即某階段狀態(tài)一旦確定,就不受這個狀態(tài)以后決策的影響。也就是說,某狀態(tài)以后的過程不會影響以前的狀態(tài),只與當前狀態(tài)有關(guān)。

(3)有重疊子問題:即子問題之間是不獨立的,一個子問題在下一階段決策中可能被多次運用到。(該性質(zhì)并不是動態(tài)規(guī)劃適用的必要條件,但是假如沒有這條性質(zhì),動態(tài)規(guī)劃算法同其他算法相比就不具備優(yōu)勢)

四、求解的基本步驟

動態(tài)規(guī)劃所處理的問題是一個多階段決策問題,一般由初始狀態(tài)起先,通過對中間階段決策的選擇,達到結(jié)束狀態(tài)。這些決策形成了一個決策序列,同時確定了完成整個過程的一條活動路途(通常是求最優(yōu)的活動路途)。如圖所示。動態(tài)規(guī)劃的設(shè)計都有著肯定的模式,一般要經(jīng)驗以下幾個步驟。

初始狀態(tài)→│決策1│→│決策2│→…→│決策n│→結(jié)束狀態(tài)

圖1動態(tài)規(guī)劃決策過程示意圖

(1)劃分階段:依據(jù)問題的時間或空間特征,把問題分為若干個階段。在劃分階段時,留意劃分后的階段肯定要是有序的或者是可排序的,否則問題就無法求解。

(2)確定狀態(tài)和狀態(tài)變量:將問題發(fā)展到各個階段時所處于的各種客觀狀況用不同的狀態(tài)表示出來。當然,狀態(tài)的選擇要滿意無后效性。

(3)確定決策并寫出狀態(tài)轉(zhuǎn)移方程:因為決策和狀態(tài)轉(zhuǎn)移有著自然的聯(lián)系,狀態(tài)轉(zhuǎn)移就是依據(jù)上一階段的狀態(tài)和決策來導(dǎo)出本階段的狀態(tài)。所以假如確定了決策,狀態(tài)轉(zhuǎn)移方程也就可寫出。但事實上經(jīng)常是反過來做,依據(jù)相鄰兩個階段的狀態(tài)之間的關(guān)系來確定決策方法和狀態(tài)轉(zhuǎn)移方程。

(4)找尋邊界條件:給出的狀態(tài)轉(zhuǎn)移方程是一個遞推式,須要一個遞推的終止條件或邊界條件。

一般,只要解決問題的階段、狀態(tài)和狀態(tài)轉(zhuǎn)移決策確定了,就可以寫出狀態(tài)轉(zhuǎn)移方程(包括邊界條件)。實際應(yīng)用中可以按以下幾個簡化的步驟進行設(shè)計:

(1)分析最優(yōu)解的性質(zhì),并刻畫其結(jié)構(gòu)特征。

(2)遞歸的定義最優(yōu)解。

(3)以自底向上或自頂向下的記憶化方式(備忘錄法)計算出最優(yōu)值

(4)依據(jù)計算最優(yōu)值時得到的信息,構(gòu)造問題的最優(yōu)解

五、算法實現(xiàn)的說明

動態(tài)規(guī)劃的主要難點在于理論上的設(shè)計,也就是上面4個步驟的確定,一旦設(shè)計完成,實現(xiàn)部分就會特別簡潔。

運用動態(tài)規(guī)劃求解問題,最重要的就是確定動態(tài)規(guī)劃三要素:

(1)問題的階段(2)每個階段的狀態(tài)

(3)從前一個階段轉(zhuǎn)化到后一個階段之間的遞推關(guān)系。

遞推關(guān)系必需是從次小的問題起先到較大的問題之間的轉(zhuǎn)化,從這個角度來說,動態(tài)規(guī)劃往往可以用遞歸程序來實現(xiàn),不過因為遞推可以充分利用前面保存的子問題的解來削減重復(fù)計算,所以對于大規(guī)模問題來說,有遞歸不行比擬的優(yōu)勢,這也是動態(tài)規(guī)劃算法的核心之處。

確定了動態(tài)規(guī)劃的這三要素,整個求解過程就可以用一個最優(yōu)決策表來描述,最優(yōu)決策表是一個二維表,其中行表示決策的階段,列表示問題狀態(tài),表格須要填寫的數(shù)據(jù)一般對應(yīng)此問題的在某個階段某個狀態(tài)下的最優(yōu)值(如最短路徑,最長公共子序列,最大價值等),填表的過程就是依據(jù)遞推關(guān)系,從1行1列起先,以行或者列優(yōu)先的依次,依次填寫表格,最終依據(jù)整個表格的數(shù)據(jù)通過簡潔的取舍或者運算求得問題的最優(yōu)解。

f(n,m)=max{f(n-1,m),f(n-1,m-w[n])+P(n,m)}

六、動態(tài)規(guī)劃算法基本框架代碼1for(j=1;j<=m;j=j+1)//第一個階段2

xn[j]=初始值;34

for(i=n-1;i>=1;i=i-1)//其他n-1個階段5

for(j=1;j>=f(i);j=j+1)//f(i)與i有關(guān)的表達式6xi[j]=j=max(或min){g(xi-1[j1:j2]),,g(xi-1[jk:jk+1])};89t=g(x1[j1:j2]);//由子問題的最優(yōu)解求解整個問題的最優(yōu)解的方案1011print(x1[j1]);1213for(i=2;i<=n-1;i=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論