吉林大學(xué)本科運(yùn)籌學(xué)PPT演示文稿

上傳人：優(yōu)*** IP屬地：廣東上傳時(shí)間：2020-12-28 格式：PPT 頁(yè)數(shù)：51 大小：519.50KB 積分：32 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩46頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第七章動(dòng)態(tài)規(guī)劃,動(dòng)態(tài)規(guī)劃的基本方法動(dòng)態(tài)規(guī)劃應(yīng)用舉例,動(dòng)態(tài)規(guī)劃,什么是動(dòng)態(tài)規(guī)劃解決多階段決策過(guò)程最優(yōu)化的一種數(shù)學(xué)方法。動(dòng)態(tài)規(guī)劃的形成產(chǎn)生于20世紀(jì)50年代。1951年美國(guó)數(shù)學(xué)家貝爾曼(R.Bellman)等人，根據(jù)一類(lèi)多階段決策問(wèn)題的特點(diǎn)，把多階段決策問(wèn)題變換為一系列互相聯(lián)系的單階段問(wèn)題，然后逐個(gè)加以解決。與此同時(shí)，他提出了解決這類(lèi)問(wèn)題的“最優(yōu)性原理”，研究了許多實(shí)際問(wèn)題，從而創(chuàng)建了解決最優(yōu)化問(wèn)題的一種新的方法動(dòng)態(tài)規(guī)劃。動(dòng)態(tài)規(guī)劃的應(yīng)用在工程技術(shù)、企業(yè)管理、工農(nóng)業(yè)生產(chǎn)及軍事等部門(mén)中都有廣泛的應(yīng)用，并且獲得了顯著的效果。,動(dòng)態(tài)規(guī)劃,動(dòng)態(tài)規(guī)劃在企業(yè)管理中的主要應(yīng)用領(lǐng)域最優(yōu)路徑問(wèn)題資源

2、分配問(wèn)題生產(chǎn)調(diào)度問(wèn)題庫(kù)存問(wèn)題裝載問(wèn)題排序問(wèn)題設(shè)備更新問(wèn)題生產(chǎn)過(guò)程最優(yōu)控制問(wèn)題等等動(dòng)態(tài)規(guī)劃是求解某類(lèi)問(wèn)題的一種方法，是考查問(wèn)題的一種途徑，而不是一種特殊算法(如線(xiàn)性規(guī)劃是一種算法)。因而，它不像線(xiàn)性規(guī)劃那樣有一個(gè)標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá)式和明確定義的一組規(guī)則，而必須對(duì)具體問(wèn)題進(jìn)行具體分析處理。,動(dòng)態(tài)規(guī)劃,動(dòng)態(tài)規(guī)劃模型的分類(lèi) 根據(jù)多階段決策過(guò)程的時(shí)間參量是離散的還是連續(xù)變量，分為離散決策過(guò)程和連續(xù)決策過(guò)程。根據(jù)決策過(guò)程的演變是確定性的還是隨機(jī)性的，又可分為確定性決策過(guò)程和隨機(jī)性決策過(guò)程。組合起來(lái)可分為離散確定性離散隨機(jī)性連續(xù)確定性連續(xù)隨機(jī)性本書(shū)主要研究離散確定性決策過(guò)程。,第8

3、章動(dòng)態(tài)規(guī)劃的基本方法,第1節(jié) 多階段決策過(guò)程及實(shí)例第2節(jié) 動(dòng)態(tài)規(guī)劃的基本概念和基本方程第3節(jié) 動(dòng)態(tài)規(guī)劃的最優(yōu)性原理和最優(yōu)性定理第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,第1節(jié) 多階段決策過(guò)程及實(shí)例,例1 最短路線(xiàn)問(wèn)題給定一個(gè)線(xiàn)路網(wǎng)絡(luò)，兩點(diǎn)之間連線(xiàn)上的數(shù)字表示兩點(diǎn)間的距離(或費(fèi)用)，試求一條由A到G的鋪管線(xiàn)路，使總距離為最短(或總費(fèi)用最小)。,第1節(jié) 多階段決策過(guò)程及實(shí)例,多階段決策過(guò)程在生產(chǎn)和科學(xué)實(shí)驗(yàn)中，有一類(lèi)活動(dòng)的過(guò)程，由于它的特殊性，可將過(guò)程分為若干個(gè)互相聯(lián)系的階段，在它的每一個(gè)階段都需要作出決策，從而使整個(gè)過(guò)程達(dá)到最好的活動(dòng)效果。因此，各個(gè)階段決策的選取不是任意確定的，它依賴(lài)于當(dāng)前面

4、臨的狀態(tài)，又影響以后的發(fā)展。當(dāng)各個(gè)階段決策確定后，就組成了一個(gè)決策序列，因而也就決定了整個(gè)過(guò)程的一條活動(dòng)路線(xiàn)。這種把一個(gè)問(wèn)題可看作是一個(gè)前后關(guān)聯(lián)具有鏈狀結(jié)構(gòu)的多階段過(guò)程就稱(chēng)為多階段決策過(guò)程，也稱(chēng)序貫決策過(guò)程。,第1節(jié) 多階段決策過(guò)程及實(shí)例,例2 機(jī)器負(fù)荷分配問(wèn)題某種機(jī)器可以在高低兩種不同的負(fù)荷下進(jìn)行生產(chǎn)。在高負(fù)荷下進(jìn)行生產(chǎn)時(shí)，產(chǎn)品的年產(chǎn)量g和投入生產(chǎn)的機(jī)器數(shù)量u1的關(guān)系為 g=g(u1) 這時(shí)，機(jī)器的年完好率為a，即如果年初完好機(jī)器的數(shù)量為u，到年終時(shí)完好的機(jī)器就為au，0a1，在低負(fù)荷下生產(chǎn)時(shí)，產(chǎn)品的年產(chǎn)量h和投入生產(chǎn)的機(jī)器數(shù)量u2的關(guān)系為 h=h(u2) 相應(yīng)的機(jī)器年完好率為b,0b1。

5、假定開(kāi)始生產(chǎn)時(shí)完好的機(jī)器數(shù)量為s1。要求制定一個(gè)五年計(jì)劃，在每年開(kāi)始時(shí)，決定如何重新分配完好的機(jī)器在兩種不同的負(fù)荷下生產(chǎn)的數(shù)量，使在五年內(nèi)產(chǎn)品的總產(chǎn)量達(dá)到最高。,第2節(jié) 動(dòng)態(tài)規(guī)劃的基本概念和基本方程,例1中求A到G的最短路線(xiàn)問(wèn)題是動(dòng)態(tài)規(guī)劃中一個(gè)典型例子?，F(xiàn)通過(guò)討論它的解法，說(shuō)明動(dòng)態(tài)規(guī)劃方法的基本思想，并闡述有關(guān)基本概念。由圖8-2可知，從A點(diǎn)到G點(diǎn)可以分為6個(gè)階段。在第一階段，A為起點(diǎn)，終點(diǎn)有B1、B2兩個(gè)，因而這時(shí)走的路線(xiàn)有兩個(gè)選擇，一是走到B1；一是走到B2，若選擇走到B2的決策，則B2就是第一階段決策的結(jié)果。它既是第一階段路線(xiàn)的終點(diǎn)，又是第二階段路線(xiàn)的始點(diǎn)。在第二階段，再?gòu)腂2點(diǎn)出發(fā)

6、，有一個(gè)可供選擇的終點(diǎn)集合C2，C3，C4；若選擇由B2走至C2，則C2就是第二階段的終點(diǎn)，同時(shí)又是第三階段的始點(diǎn)。遞推下去可看到：各個(gè)階段的決策不同，路線(xiàn)就不同。顯然，當(dāng)某階段的始點(diǎn)給定后，會(huì)影響后面各階段的行進(jìn)路線(xiàn)和整個(gè)路線(xiàn)的長(zhǎng)短，而后面各階段路線(xiàn)的發(fā)展不受這點(diǎn)以前各階段決策的影響。故此問(wèn)題的要求是：在各個(gè)階段上選則一個(gè)恰當(dāng)?shù)臎Q策，使得由這些決策組成的一個(gè)決策序列所決定的一條路線(xiàn)是總路程最短的一條。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,1階段把所給問(wèn)題的過(guò)程，恰當(dāng)?shù)胤譃槿舾蓚€(gè)相互聯(lián)系的階段，以便能按一定的次序去求解。描述階段的變量稱(chēng)為階段變量，常用k表示。階段的劃分，一般是根據(jù)時(shí)間和空間的自然特

7、征來(lái)劃分，但要便于把問(wèn)題的過(guò)程能轉(zhuǎn)化為多階段決策的過(guò)程。如例1可分為6個(gè)階段來(lái)求解，k分別等于1、2、3、4、5、6。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,2狀態(tài) 狀態(tài)表示每個(gè)階段開(kāi)始所處的自然狀況或客觀條件，它描述了研究問(wèn)題過(guò)程的狀況，又稱(chēng)不可控因素。在例1中，狀態(tài)就是某階段的出發(fā)位置。它既是該階段某支路的起點(diǎn)，又是前一階段某支路的終點(diǎn)。通常一個(gè)階段有若干個(gè)狀態(tài)，第一階段有一個(gè)狀態(tài)就是點(diǎn)A，第二階段有兩個(gè)狀態(tài)，即點(diǎn)集合B1，B2，一般第k階段的狀態(tài)就是第k階段所有始點(diǎn)的集合。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,描述過(guò)程狀態(tài)的變量稱(chēng)為狀態(tài)變量。它可用一個(gè)數(shù)、一組數(shù)或一向量(多維情形)來(lái)描述。常用Sk表示第k

8、階段的狀態(tài)變量。如在例1中第三階段有四個(gè)狀態(tài)，則狀態(tài)變量Sk可取四個(gè)值，即C1、C2、C3、C4。點(diǎn)集合C1，C2，C3，C4就稱(chēng)為第三階段的可達(dá)狀態(tài)集合。記為S3C1，C2，C3，C4。有時(shí)為了方便起見(jiàn)，將該階段的狀態(tài)編上號(hào)碼1，2這時(shí)也可記S31，2，3，4。第k階段的可達(dá)狀態(tài)集合就記為Sk。,馬爾科夫性這里所說(shuō)的狀態(tài)應(yīng)具有下面的性質(zhì)：如果某階段狀態(tài)給定后，則在這階段以后過(guò)程的發(fā)展不受這階段以前各段狀態(tài)的影響。換句話(huà)說(shuō)，過(guò)程的過(guò)去歷史只能通過(guò)當(dāng)前的狀態(tài)去影響它未來(lái)的發(fā)展，當(dāng)前的狀態(tài)是以往歷史的一個(gè)總結(jié)。這個(gè)性質(zhì)稱(chēng)為無(wú)后效性(即馬爾科夫性)。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,3決策決策表示當(dāng)

9、過(guò)程處于某一階段的某個(gè)狀態(tài)時(shí)，可以作出不同的決定(或選擇)，從而確定下一階段的狀態(tài)，這種決定稱(chēng)為決策。在最優(yōu)控制中也稱(chēng)為控制。描述決策的變量，稱(chēng)為決策變量。它可用一個(gè)數(shù)、一組數(shù)或一向量來(lái)描述。常用uk（sk）表示第k階段當(dāng)狀態(tài)處于sk時(shí)的決策變量。它是狀態(tài)變量的函數(shù)。在實(shí)際問(wèn)題中，決策變量的取值往往限制在某一范圍之內(nèi)，此范圍稱(chēng)為允許決策集合。常用Dk(sk)表示第k階段從狀態(tài)sk出發(fā)的允許決策集合，顯然有uk（sk）Dk(sk)。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,3決策如在例1第二階段中，若從狀態(tài)B1出發(fā)，就可作出三種不同的決策，其允許決策集合D2(B1)C1，C2，C3，若選取的點(diǎn)為C2，則C

10、2是狀態(tài)B1在決策u2(B1)作用下的一個(gè)新的狀態(tài)，記作u2(B1)=C2。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,4策略策略是一個(gè)按順序排列的決策組成的集合。由過(guò)程的第k階段開(kāi)始到終止?fàn)顟B(tài)為止的過(guò)程，稱(chēng)為問(wèn)題的后部子過(guò)程。由每段的決策按順序排列組成的決策函數(shù)序列稱(chēng)為k子過(guò)程策略，簡(jiǎn)稱(chēng)子策略，記為，即,當(dāng)k=1時(shí)，此決策函數(shù)序列稱(chēng)為全過(guò)程的一個(gè)策略，簡(jiǎn)稱(chēng)策略，記為，即,在實(shí)際問(wèn)題中，可供選擇的策略有一定的范圍，此范圍稱(chēng)為允許策略集合，用P表示。從允許策略集合中找出達(dá)到最優(yōu)效果的策略稱(chēng)為最優(yōu)策略。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,5狀態(tài)轉(zhuǎn)移方程狀態(tài)轉(zhuǎn)移方程是確定過(guò)程由一個(gè)狀態(tài)到另一個(gè)狀態(tài)的演變過(guò)程。

11、若給定第k階段狀態(tài)變量的值，如果該段的決策變量uk一經(jīng)確定，第k+1階段的狀態(tài)變量sk+1的值也就完全確定。即sk+1的值隨sk和uk的值變化而變化。這種確定的對(duì)應(yīng)關(guān)系，記為,上式描述了由k階段到k+1階段的階段的狀態(tài)轉(zhuǎn)移規(guī)律，稱(chēng)為狀態(tài)轉(zhuǎn)移方程。Tk稱(chēng)為狀態(tài)轉(zhuǎn)移函數(shù)。如例1中，狀態(tài)轉(zhuǎn)移方程為,2.1 動(dòng)態(tài)規(guī)劃的基本概念,6指標(biāo)函數(shù)和最優(yōu)值函數(shù) 用來(lái)衡量所實(shí)現(xiàn)過(guò)程優(yōu)劣的一種數(shù)量指標(biāo)，稱(chēng)為指標(biāo)函數(shù)。它是定義在全過(guò)程和所有后部子過(guò)程上確定的數(shù)量函數(shù)。常用Vk,n表示，即,對(duì)于要構(gòu)成動(dòng)態(tài)規(guī)劃模型的指標(biāo)函數(shù)，應(yīng)具有可分離性，并滿(mǎn)足遞推關(guān)系。即Vk,n可以表示為sk、uk、Vk+1,n的函數(shù)，記為,在實(shí)際

12、問(wèn)題中很多指標(biāo)函數(shù)都滿(mǎn)足這個(gè)性質(zhì)。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,(1) 過(guò)程和它的任一子過(guò)程的指標(biāo)是它所包含的各階段的指標(biāo)的和。即,其中,表示第j階段的階段指標(biāo)，這時(shí)上式可寫(xiě)成,(2) 過(guò)程和它的任一子過(guò)程的指標(biāo)是它所包含的各階段的指標(biāo)的乘積。即,這時(shí)就可寫(xiě)成,常見(jiàn)的指標(biāo)函數(shù)形式,2.1 動(dòng)態(tài)規(guī)劃的基本概念,指標(biāo)函數(shù)的最優(yōu)值，稱(chēng)為最優(yōu)值函數(shù)，記為,。它表示從第,k階段的狀態(tài)sk開(kāi)始到第n階段的終止?fàn)顟B(tài)的過(guò)程，采取最優(yōu)策略所得到的指標(biāo)函數(shù)值。即,“opt”是最優(yōu)化(optimization)的縮寫(xiě)，可根據(jù)題意而取min或max。,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,結(jié)合最短路線(xiàn)問(wèn)題介紹動(dòng)態(tài)規(guī)劃

13、方法的基本思想。生活中的常識(shí)告訴我們，最短路線(xiàn)有一個(gè)重要特性：如果由起點(diǎn)A經(jīng)過(guò)P點(diǎn)和H點(diǎn)而到達(dá)終點(diǎn)G是一條最短路線(xiàn)，則由點(diǎn)P出發(fā)經(jīng)過(guò)H點(diǎn)到達(dá)終點(diǎn)G的這條子路線(xiàn)，對(duì)于從點(diǎn)P出發(fā)到達(dá)終點(diǎn)的所有可能選擇的不同路線(xiàn)來(lái)說(shuō)，必定也是最短路線(xiàn)。例如，在最短路線(xiàn)問(wèn)題中，若找到了AB1C2D1E2F2G是由A到G的最短路線(xiàn)，則D1E2F2G應(yīng)該是由D1出發(fā)到G點(diǎn)的所有可能選擇的不同路線(xiàn)中的最短路線(xiàn)。證明：（用反證法）如果不是這樣，則從點(diǎn)P到G點(diǎn)有另一條距離更短的路線(xiàn)存在，把它和原來(lái)最短路線(xiàn)由A點(diǎn)到達(dá)P點(diǎn)的那部分連接起來(lái)，就會(huì)得到一條由A點(diǎn)到G點(diǎn)的新路線(xiàn)，它比原來(lái)那條最短路線(xiàn)的距離還要短些。這與假設(shè)矛盾，是不

14、可能的。,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,根據(jù)最短路線(xiàn)這一特性，尋找最短路線(xiàn)的方法，就是從最后一段開(kāi)始，用由后向前逐步遞推的方法，求出各點(diǎn)到G點(diǎn)的最短路線(xiàn)，最后求得由A點(diǎn)到G點(diǎn)的最短路線(xiàn)。所以，動(dòng)態(tài)規(guī)劃的方法是從終點(diǎn)逐段向始點(diǎn)方向?qū)ふ易疃搪肪€(xiàn)的一種方法。下面按照動(dòng)態(tài)規(guī)劃的方法，將例1從最后一段開(kāi)始計(jì)算，由后向前逐步推移至A點(diǎn)。,2.1 動(dòng)態(tài)規(guī)劃的基本概念,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,當(dāng)k=6時(shí)，由F1到終點(diǎn)G只有一條路線(xiàn)，故,。同理，,當(dāng)k=5時(shí)，出發(fā)點(diǎn)有三個(gè)。若從E1出發(fā)，則有兩個(gè)選擇至F1，至F2，則,其相應(yīng)的決策為,這說(shuō)明，由E1至終點(diǎn)G的最短距離為7，其最短路線(xiàn)是,

15、2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,同理，從E2和E3出發(fā)，則有,其相應(yīng)的決策為,且,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,當(dāng)k=4時(shí)，有,當(dāng)k=3時(shí)，有,當(dāng)k=2時(shí)，有,當(dāng)k=1時(shí)，出發(fā)點(diǎn)有一個(gè)A點(diǎn)，則,且,。于是得到從起點(diǎn)A到終點(diǎn)G的最短距離為18。,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,為了找出最短路線(xiàn)，再按計(jì)算的順序反推之，可求出最優(yōu)決策函數(shù)序列,，即由,組成一個(gè)最優(yōu)策略。因而，找出相應(yīng)的最短路線(xiàn)為,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,從上面的計(jì)算過(guò)程中可以看出，在求解的各個(gè)階段，我們利用了,k階段與k+1階段之間的遞推關(guān)系：,一般情況，k階段與k+1階段的遞推關(guān)系式可寫(xiě)成,邊界條

16、件為,遞推關(guān)系式(8-1)稱(chēng)為動(dòng)態(tài)規(guī)劃的基本方程。,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,動(dòng)態(tài)規(guī)劃方法基本思想歸納：動(dòng)態(tài)規(guī)劃方法的關(guān)鍵在于正確地寫(xiě)出基本的遞推關(guān)系式和恰當(dāng)?shù)倪吔鐥l件(簡(jiǎn)言之為基本方程)。要做到這一點(diǎn)，必須先將問(wèn)題的過(guò)程分成幾個(gè)相互聯(lián)系的階段，恰當(dāng)?shù)剡x取狀態(tài)變量和決策變量及定義最優(yōu)值函數(shù)，從而把一個(gè)大問(wèn)題化成一族同類(lèi)型的子問(wèn)題，然后逐個(gè)求解。即從邊界條件開(kāi)始，逐段遞推尋優(yōu)，在每一個(gè)子問(wèn)題的求解中，均利用了它前面的子問(wèn)題的最優(yōu)化結(jié)果，依次進(jìn)行，最后一個(gè)子問(wèn)題所得的最優(yōu)解，就是整個(gè)問(wèn)題的最優(yōu)解。在多階段決策過(guò)程中，動(dòng)態(tài)規(guī)劃方法是既把當(dāng)前一段和未來(lái)各段分開(kāi)，又把當(dāng)前效益和未來(lái)效益結(jié)

17、合起來(lái)考慮的一種最優(yōu)化方法。因此，每段決策的選取是從全局來(lái)考慮的，與該段的最優(yōu)選擇答案一般是不同的。,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,在求整個(gè)問(wèn)題的最優(yōu)策略時(shí)，由于初始狀態(tài)是已知的，而每段的決策都是該段狀態(tài)的函數(shù)，故最優(yōu)策略所經(jīng)過(guò)的各段狀態(tài)便可逐次變換得到，從而確定了最優(yōu)路線(xiàn)。如例1最短路線(xiàn)問(wèn)題，初始狀態(tài)A已知，則按下面箭頭所指的方向逐次變換有,從而可得最優(yōu)策略為u1(A),u2(B1),u0(F2)，相應(yīng)的最短路線(xiàn)為,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,求解最短路問(wèn)題的標(biāo)號(hào)法逆序解法,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,求解最短路問(wèn)題的標(biāo)號(hào)法順序解法,2.2 動(dòng)態(tài)規(guī)劃的基本思想和

18、基本方程,動(dòng)態(tài)規(guī)劃的方法比窮舉法有以下優(yōu)點(diǎn)： (1) 減少了計(jì)算量。計(jì)算例1若用窮舉法，就要對(duì)48條路線(xiàn)進(jìn)行比較，運(yùn)算在計(jì)算機(jī)上進(jìn)行時(shí)，比較運(yùn)算要進(jìn)行47次；求各條路線(xiàn)的距離，即使用逐段累加方法，也要進(jìn)行6+12+24+48+48138次加法運(yùn)算。用動(dòng)態(tài)規(guī)劃方法來(lái)計(jì)算，比較運(yùn)算(從k=5段開(kāi)始向前算)共進(jìn)行3+3+4+4+115次。每次比較運(yùn)算相應(yīng)有兩次加法運(yùn)算，再去掉中間重復(fù)兩次(即B1C1，B2C4各多算了一次)，實(shí)際只有28次加法運(yùn)算?？梢?jiàn)，動(dòng)態(tài)規(guī)劃方法比窮舉法減少了計(jì)算量。而且隨著段數(shù)的增加，計(jì)算量將大大地減少。 (2) 豐富了計(jì)算結(jié)果。在逆序(或順序)解法中，我們得到的不僅僅是由A點(diǎn)

19、(或G點(diǎn))出發(fā)到G點(diǎn)(或A點(diǎn))的最短路線(xiàn)及相應(yīng)的最短距離，而且得到了從所有各中間點(diǎn)出發(fā)到G點(diǎn)(或A點(diǎn))的最短路線(xiàn)及相應(yīng)的距離。這就是說(shuō)，求出的不是一個(gè)最優(yōu)策略，而是一族的最優(yōu)策略。,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,建立動(dòng)態(tài)規(guī)劃模型的五個(gè)要點(diǎn)： (1) 將問(wèn)題的過(guò)程劃分成恰當(dāng)?shù)碾A段； (2) 正確選擇狀態(tài)變量sk，使它既能描述過(guò)程的演變，又要滿(mǎn)足無(wú)后效性； (3) 確定決策變量uk及每階段的允許決策集合Dk(sk)； (4) 正確寫(xiě)出狀態(tài)轉(zhuǎn)移方程； (5) 正確寫(xiě)出指標(biāo)函數(shù)的關(guān)系，它應(yīng)滿(mǎn)足下面性質(zhì)：是定義在全過(guò)程和所有后部子過(guò)程上的數(shù)量函數(shù)；要具有可分離性，并滿(mǎn)足遞推關(guān)系。即,2.2

20、動(dòng)態(tài)規(guī)劃的基本思想和基本方程,所以，得到動(dòng)態(tài)規(guī)劃逆序解法的基本方程：,邊界條件為,式中,求解過(guò)程，根據(jù)邊界條件，從k=n開(kāi)始，由后向前逆推，從而逐步可求得各段的最優(yōu)決策和相應(yīng)的最優(yōu)值，最后求出,時(shí)，就得到整個(gè)問(wèn)題的最優(yōu)解。,2.2 動(dòng)態(tài)規(guī)劃的基本思想和基本方程,動(dòng)態(tài)規(guī)劃順序解法的基本方程,邊界條件為,式中,求解過(guò)程：根據(jù)邊界條件，從k=1開(kāi)始，由前向后順推，逐步求得各段的最優(yōu)決策和相應(yīng)的最優(yōu)值，最后求出，,就得到整個(gè)問(wèn)題的最優(yōu)解。,第3節(jié) 動(dòng)態(tài)規(guī)劃的最優(yōu)性原理和最優(yōu)性定理,動(dòng)態(tài)規(guī)劃的最優(yōu)性原理： “作為整個(gè)過(guò)程的最優(yōu)策略具有這樣的性質(zhì)：即無(wú)論過(guò)去的狀態(tài)和決策如何，對(duì)前面的決策所形成的狀態(tài)而言

21、，余下的諸決策必須構(gòu)成最優(yōu)策略?！?簡(jiǎn)言之，一個(gè)最優(yōu)策略的子策略總是最優(yōu)的。動(dòng)態(tài)規(guī)劃的基本方程或者說(shuō)最優(yōu)性定理才是動(dòng)態(tài)規(guī)劃的理論基礎(chǔ),第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,相同點(diǎn) 動(dòng)態(tài)規(guī)劃、線(xiàn)性規(guī)劃和非線(xiàn)性規(guī)劃都屬于數(shù)學(xué)規(guī)劃范圍，研究對(duì)象本質(zhì)上都是求極值問(wèn)題，都是利用迭代法去逐步求解。不同點(diǎn) 線(xiàn)性規(guī)劃和非線(xiàn)性規(guī)劃研究的問(wèn)題通常與時(shí)間無(wú)關(guān)，故又稱(chēng)為靜態(tài)規(guī)劃。線(xiàn)性規(guī)劃迭代中的每一步是就問(wèn)題的整體加以改善的。動(dòng)態(tài)規(guī)劃研究的問(wèn)題與時(shí)間有關(guān)，研究具有多階段決策過(guò)程的一類(lèi)問(wèn)題，將問(wèn)題的整體按時(shí)間或空間的特征分成若干個(gè)前后銜接的時(shí)空階段，把多階段決策問(wèn)題表示為前后有關(guān)聯(lián)的一系列單階段決策問(wèn)題，然后逐個(gè)加以

22、解決，從而求出整個(gè)問(wèn)題的最優(yōu)決策序列。對(duì)于某些靜態(tài)問(wèn)題，也可以人為地引入時(shí)間因素，把它看作是按階段進(jìn)行的一個(gè)動(dòng)態(tài)規(guī)劃問(wèn)題，這就使得動(dòng)態(tài)規(guī)劃成為求解某些線(xiàn)性、非線(xiàn)性規(guī)劃的有效方法。,第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,動(dòng)態(tài)規(guī)劃方法逆序解法順序解法關(guān)鍵：正確寫(xiě)出動(dòng)態(tài)規(guī)劃的遞推關(guān)系式逆推形式，當(dāng)初始狀態(tài)給定時(shí)，用逆推比較方便順推形式，當(dāng)終止?fàn)顟B(tài)給定時(shí)，用順推比較方便,第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,考查如圖所示的n階段決策過(guò)程。其中取狀態(tài)變量為,決策變量為,。在第k階段，決策xk使?fàn)顟B(tài)sk(輸入）轉(zhuǎn)移,為sk+1 (輸出)，設(shè)狀態(tài)轉(zhuǎn)移函數(shù)為,假定過(guò)程的總效益(指標(biāo)函數(shù))與各階段效益(階段

23、指標(biāo)函數(shù))的關(guān)系為,其中記號(hào)*都表示為+,或都表示為。問(wèn)題是：使,達(dá)到最優(yōu)化，即求,，為簡(jiǎn)單起見(jiàn)，不妨此處就求,第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,4.1 逆推解法設(shè)已知初始狀態(tài)為s1，并假定最優(yōu)值函數(shù)fk(sk)表示第k階段的初始狀態(tài)為sk，從k階段到n階段所得到的最大效益。,第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,例3 用逆推解法求解下面問(wèn)題,解 : 按問(wèn)題的變量個(gè)數(shù)劃分階段，把它看作為一個(gè)三階段決策問(wèn)題。設(shè)狀態(tài)變量為s1, s2,s3,s4，并記s1=c；取問(wèn)題中的變量x1,x2,x3為決策變量；各階段指標(biāo)函數(shù)按乘積方式結(jié)合。令最優(yōu)值函數(shù)fk(sk)表示為第k階段的初始狀態(tài)為sk，從k階段到3階段所得到的最大值。,設(shè),第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,用逆推解法，從后向前依次有,及最優(yōu)解,由,得,和,(舍去),，而,，故,為極大值點(diǎn)。,最優(yōu)解,由,所以,第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,像前面一樣利用微分法易知,故,由于已知,而按計(jì)算的順序反推算，可得各階段的最優(yōu)決策和最優(yōu)值。,第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,即,由,所以,所以,因此得到最優(yōu)解為,最大值為,由,第4節(jié) 動(dòng)態(tài)規(guī)劃和靜態(tài)規(guī)劃的關(guān)系,4.2 順推解法設(shè)已知終止?fàn)?/p>

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

吉林大學(xué)本科運(yùn)籌學(xué)PPT演示文稿

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

吉林大學(xué)本科運(yùn)籌學(xué)PPT演示文稿

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔