版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第六講動態(tài)規(guī)劃上第1頁,共47頁,2023年,2月20日,星期一第一節(jié)多階段決策過程的最優(yōu)化
美國數(shù)學(xué)家貝爾曼(R.Bellman)50年代執(zhí)教于普林斯頓和斯坦福大學(xué),后進(jìn)入蘭德(Rand)研究所。1957年發(fā)表“DynamicProgramming”一書,標(biāo)識動態(tài)規(guī)劃的正式誕生。
第2頁,共47頁,2023年,2月20日,星期一最短路問題給定一個(gè)交通網(wǎng)絡(luò)圖如下,其中兩點(diǎn)之間的數(shù)字表示距離(或花費(fèi)),試求從A點(diǎn)到G點(diǎn)的最短距離(總費(fèi)用最小)AB1B2C1C2C3C4D1D2D3E1E2E3F1F2G531368766835338422123335526643123456第3頁,共47頁,2023年,2月20日,星期一2、每個(gè)階段都要進(jìn)行決策,目的是使整個(gè)過程的決策達(dá)到最優(yōu)效果。多階段決策問題:1、在多階段決策過程中,系統(tǒng)的動態(tài)過程可以按照時(shí)間進(jìn)程分為狀態(tài)相互聯(lián)系而又相互區(qū)別的各個(gè)階段;第4頁,共47頁,2023年,2月20日,星期一12n狀態(tài)決策狀態(tài)決策狀態(tài)狀態(tài)決策第5頁,共47頁,2023年,2月20日,星期一多階段決策問題的典型例子第6頁,共47頁,2023年,2月20日,星期一給定一個(gè)線路網(wǎng)絡(luò)圖,要從A地向F地鋪設(shè)一條輸油管道,各點(diǎn)間連線上的數(shù)字表示距離,問應(yīng)選擇什么路線,可使總距離最短?第7頁,共47頁,2023年,2月20日,星期一資源分配問題
例.某公司擬將某種設(shè)備5臺,分配給所屬的甲、乙、丙三個(gè)工廠。各工廠獲得此設(shè)備后,預(yù)測可創(chuàng)造的利潤如下表所示,問這5臺設(shè)備應(yīng)如何分配給這3個(gè)工廠,使得所創(chuàng)造的總利潤為最大?
工廠盈利設(shè)備臺數(shù)甲廠乙廠丙廠
0
0
0
0
1
3
5
4
2
7
10
6
3
9
11
11
4
12
11
12
5
13
11
12第8頁,共47頁,2023年,2月20日,星期一機(jī)器負(fù)荷分配問題
某種機(jī)器可以在高低兩種不同的負(fù)荷下進(jìn)行生產(chǎn)。在高負(fù)荷下進(jìn)行生產(chǎn)時(shí),產(chǎn)品的年產(chǎn)量g和投入生產(chǎn)的機(jī)器數(shù)量u1的關(guān)系為g=g(u1)
這時(shí),機(jī)器的年完好率為a,即如果年初完好機(jī)器的數(shù)量為u,到年終完好的機(jī)器就為au,0<a<1。
在低負(fù)荷下生產(chǎn)時(shí),產(chǎn)品的年產(chǎn)量h和投入生產(chǎn)的機(jī)器數(shù)量u2的關(guān)系為h=h(u2)
假定開始生產(chǎn)時(shí)完好的機(jī)器數(shù)量為s1。要求制定一個(gè)五年計(jì)劃,在每年開始時(shí),決定如何重新分配完好的機(jī)器在兩種不同的負(fù)荷下生產(chǎn)的數(shù)量,使在五年內(nèi)產(chǎn)品的總產(chǎn)量達(dá)到最高。
相應(yīng)的機(jī)器年完好率b,0<b<1。
第9頁,共47頁,2023年,2月20日,星期一設(shè)備更新問題
企業(yè)在使用設(shè)備時(shí)都要考慮設(shè)備的更新問題,因?yàn)樵O(shè)備越陳舊所需的維修費(fèi)用越多,但購買新設(shè)備則要一次性支出較大的費(fèi)用?,F(xiàn)某企業(yè)要決定一臺設(shè)備未來8年的更新計(jì)劃,已預(yù)測了第j年購買設(shè)備的價(jià)格為Kj,設(shè)Gj為設(shè)備經(jīng)過j年后的殘值,Cj為設(shè)備連續(xù)使用j-1年后在第j年的維修費(fèi)(j=1,2,…,8),問應(yīng)在哪些年更新設(shè)備可使總費(fèi)用最小。這是一個(gè)8階段決策問題,每年年初要作出決策,是繼續(xù)使用舊設(shè)備,還是購買新設(shè)備。第10頁,共47頁,2023年,2月20日,星期一第二節(jié)動態(tài)規(guī)劃的基本概念和基本原理
一、動態(tài)規(guī)劃的基本概念使用動態(tài)規(guī)劃方法解決多階段決策問題,首先要將實(shí)際問題寫成動態(tài)規(guī)劃模型,此時(shí)要用到以下概念:(1)階段;(2)狀態(tài);(3)決策和策略;
(4)狀態(tài)轉(zhuǎn)移;(5)指標(biāo)函數(shù)。
第11頁,共47頁,2023年,2月20日,星期一要便于把問題的過程轉(zhuǎn)化為多階段決策的過程。
1.
階段、階段變量
把所給問題的過程,適當(dāng)?shù)胤譃槿舾蓚€(gè)相互聯(lián)系的階段,以便按次序去求每階段的解;
描述階段的變量稱為階段變量,常用k表示;
階段的劃分,一般是按時(shí)間和空間的自然特征(年、月、路段)來劃分;第12頁,共47頁,2023年,2月20日,星期一
例中,從A到F可以分成從A到B(B有兩種選擇B1,B2),從B到C(C有四種選擇C1,C2,C3,C4),從C到D(D有三種選擇D1,D2,D3),從D到E(E有兩種選擇E1,E2),再從E到F五個(gè)階段。k=1,2,3,4,5。第13頁,共47頁,2023年,2月20日,星期一
狀態(tài)變量的取值有一定的允許集合或范圍,此集合稱為狀態(tài)允許集合,用Sk表示。2.狀態(tài)、狀態(tài)變量
每個(gè)階段開始所處的自然狀態(tài)或客觀條件。通常一個(gè)階段有若干個(gè)狀態(tài)。
描述過程狀態(tài)的變量稱為狀態(tài)變量,常用sk(一個(gè)數(shù)、一組數(shù)、一個(gè)向量)表示第k階段的狀態(tài)。第14頁,共47頁,2023年,2月20日,星期一
在例5中,第一階段狀態(tài)為A,第二階段則有二個(gè)狀態(tài):Bl,B2。狀態(tài)變量s1的集合,后面各段的狀態(tài)集合分別是:
第15頁,共47頁,2023年,2月20日,星期一
動態(tài)規(guī)劃中的狀態(tài)應(yīng)具有如下性質(zhì):當(dāng)某階段狀態(tài)給定以后,在這階段以后過程的發(fā)展不受這段以前各段狀態(tài)的影響。也就是說,當(dāng)前的狀態(tài)是過去歷史的一個(gè)完整總結(jié),過程的過去歷史只能通過當(dāng)前狀態(tài)去影響它未來的發(fā)展,這稱為無后效性。如果所選定的變量不具備無后效性,就不能作為狀態(tài)變量來構(gòu)造動態(tài)規(guī)劃模型。
例5
中,當(dāng)某段的初始狀態(tài)已選定某個(gè)點(diǎn)時(shí),從這個(gè)點(diǎn)以后的鋪管路線只與該點(diǎn)有關(guān),不受以前的鋪管路線影響,所以滿足狀態(tài)的無后效性。
第16頁,共47頁,2023年,2月20日,星期一
在實(shí)際問題中決策變量的取值往往在某一范圍之內(nèi),此范圍稱為允許決策集合。常用Dk(sk)表示第k階段從狀態(tài)sk出發(fā)的允許決策集合,顯然有決策變量是狀態(tài)變量的函數(shù)。3.
決策、決策變量
過程的某一階段、某個(gè)狀態(tài),可以做出不同的決定(選擇),決定下一階段的狀態(tài),這種決定稱為決策。uk(sk)Dk(sk)
描述決策的變量,稱為決策變量。常用表示第k階段當(dāng)狀態(tài)為sk時(shí)的決策變量。第17頁,共47頁,2023年,2月20日,星期一在例5中,從第二階段的狀態(tài)B1出發(fā),可選擇下一段的C1,C2,C3,即其允許決策集合為:
我們決定選擇C3,則可表為:
uk(sk)Dk(sk)第18頁,共47頁,2023年,2月20日,星期一
由每段的決策按順序排列組成的決策函數(shù)序列稱為k子過程策略,簡稱子策略,記為pk,n(sk),即
當(dāng)k=1時(shí),此決策函數(shù)序列成為全過程的一個(gè)策略,簡稱策略,記為p1,n
(s1)即:4.
策略按順序排列的決策組成的集合;
可供選擇的策略有一定范圍,此范圍稱為允許策略集合,用
表示。從允許策略集合中找出達(dá)到最優(yōu)效果的策略稱為最優(yōu)策略。
由第k
n(終止?fàn)顟B(tài))為止的過程,稱為問題的后部子過程(k子過程)第19頁,共47頁,2023年,2月20日,星期一
費(fèi)用、成本、利潤、路長等。用
Vk,n
表示之。5.
指標(biāo)函數(shù)和最優(yōu)值函數(shù)
用于衡量所選定策略優(yōu)劣的數(shù)量指標(biāo)稱為指標(biāo)函數(shù);它是定義在全過程或所有后部子過程上確定的數(shù)量函數(shù)。
一個(gè)n段決策過程,從l到n叫作問題的原過程,對于任意一個(gè)給定的k(1≤k≤n),從第k段到第n段的過程稱為原過程的一個(gè)后部子過程。表示在第k段,狀態(tài)為sk采用策略,后部子過程的指標(biāo)函數(shù)值。表示初始狀態(tài)為s1采用策略時(shí)原過程的指標(biāo)函數(shù)值,而
第20頁,共47頁,2023年,2月20日,星期一最優(yōu)指標(biāo)函數(shù)記為,它表示從第k段狀態(tài)sk采用最優(yōu)策略到過程終止時(shí)的最佳效益值。與間的關(guān)系為:
opt全稱optimum,表示最優(yōu)化,根據(jù)具體問題分別表為max或min。當(dāng)k=1時(shí),就是從初始狀態(tài)s1到全過程結(jié)束的整體最優(yōu)函數(shù)。
在例5中,指標(biāo)函數(shù)是距離。如第2階段,狀態(tài)為B1時(shí),表示從B1到F的距離,而則表示從B1到F的最短距離。本問題的總目標(biāo)是求,即從A到終點(diǎn)F的最短距離。
第21頁,共47頁,2023年,2月20日,星期一二、動態(tài)規(guī)劃的基本思想與基本原理下面結(jié)合例5最短路線問題介紹動態(tài)規(guī)劃的基本思想。
第22頁,共47頁,2023年,2月20日,星期一
為了求出最短路線,一種簡單的方法,可以求出所有從A至F的可能鋪設(shè)的路長并加以比較。不難知道從A至F共有24條不同路徑,要求出最短路線需要做23次比較運(yùn)算,這種方法稱窮舉法。
當(dāng)問題的段數(shù)很多、各段的狀態(tài)也很多時(shí),窮舉法的計(jì)算量會大大增加,甚至使得求優(yōu)成為不可能。下面介紹動態(tài)規(guī)劃方法。注意本方法是從過程的最后一段開始,用逆序遞推方法求解,逐步求出各段各點(diǎn)到終點(diǎn)F的最短路線,最后求得A點(diǎn)到F點(diǎn)的最短路線。
第23頁,共47頁,2023年,2月20日,星期一用表示由狀態(tài)sk點(diǎn)出發(fā),采用決策uk到達(dá)下一階段sk+1點(diǎn)時(shí)的兩點(diǎn)距離。
第一步,從k=5開始,狀態(tài)變量s5可取兩種狀態(tài)E1,E2,它們到F點(diǎn)的路長分別為4,3。
即:
第二步,k=4,狀態(tài)變量s4可取三個(gè)值D1,D2,D3,這是經(jīng)過一個(gè)中途點(diǎn)到達(dá)終點(diǎn)F的兩級決策問題,從D1到F有兩條路線,需加以比較,取其中最短的,即:
第24頁,共47頁,2023年,2月20日,星期一由D1到終點(diǎn)F最短距離為7,其路徑為D1→E1→F。相應(yīng)決策為即D2到終點(diǎn)最短距離為5,其路徑為D2→E2→F。相應(yīng)決策為
即D3到終點(diǎn)最短距離為5,其路徑為D3→E1→F。相應(yīng)決策為
第25頁,共47頁,2023年,2月20日,星期一類似的,可算得:k=3時(shí),有
k=2時(shí),有
k=1時(shí),則
第26頁,共47頁,2023年,2月20日,星期一所以最優(yōu)路線為:
即從A到F的最短距離為17。本段決策為
再按計(jì)算順序反推可得最優(yōu)決策序列即
第27頁,共47頁,2023年,2月20日,星期一這種遞推關(guān)系稱為動態(tài)規(guī)劃的基本方程,(7.3b))式稱為邊界條件。從例5的計(jì)算過程中可以看出,在求解的各階段,都利用了第k段和第k+1段的如下關(guān)系:第28頁,共47頁,2023年,2月20日,星期一上述最短路線的計(jì)算過程也可用圖直觀表示出來,如圖7-2,每個(gè)結(jié)點(diǎn)上方的括號內(nèi)的數(shù),表示該點(diǎn)到終點(diǎn)F的最短距離。連結(jié)各點(diǎn)到F點(diǎn)的線表示最短路徑。這種在圖上直接計(jì)算的方法叫標(biāo)號法。第29頁,共47頁,2023年,2月20日,星期一第三節(jié)動態(tài)規(guī)劃模型的建立與求解
一、動態(tài)規(guī)劃模型的建立
建立動態(tài)規(guī)劃的模型,就是分析問題并建立問題的動態(tài)規(guī)劃基本方程。
應(yīng)用動態(tài)規(guī)劃方法的關(guān)鍵在于:識別問題的多階段特征,將問題分解成為可用遞推關(guān)系式聯(lián)系起來的若干子問題,而正確建立基本遞推關(guān)系方程的關(guān)鍵又在于正確選擇狀態(tài)變量,保證各階段的狀態(tài)變量具有遞推的狀態(tài)轉(zhuǎn)移關(guān)系。第30頁,共47頁,2023年,2月20日,星期一
下面以資源分配問題為例介紹動態(tài)規(guī)劃的建模條件及解法。資源分配問題是動態(tài)規(guī)劃的典型應(yīng)用之一,資源可以是資金、原材料、設(shè)備、勞力等,資源分配就是將一定數(shù)量的一種或幾種資源恰當(dāng)?shù)胤峙浣o若干使用者,以獲取最大效益。
第31頁,共47頁,2023年,2月20日,星期一資源分配問題
例.某公司擬將某種設(shè)備5臺,分配給所屬的甲、乙、丙三個(gè)工廠。各工廠獲得此設(shè)備后,預(yù)測可創(chuàng)造的利潤如下表所示,問這5臺設(shè)備應(yīng)如何分配給這3個(gè)工廠,使得所創(chuàng)造的總利潤為最大?
工廠盈利設(shè)備臺數(shù)甲廠乙廠丙廠
0
0
0
0
1
3
5
4
2
7
10
6
3
9
11
11
4
12
11
12
5
13
11
12第32頁,共47頁,2023年,2月20日,星期一解:將問題按工廠分為三個(gè)階段,甲、乙、丙三個(gè)廠分別編號為1、2、3廠。設(shè)sk=分配給第k個(gè)廠至第3個(gè)廠的設(shè)備臺數(shù)(k=1、2、3)
xk=分配給第k個(gè)設(shè)備臺數(shù)。已知s1=5,
并有
第33頁,共47頁,2023年,2月20日,星期一第三階段:
顯然將臺設(shè)備都分配給第3工廠時(shí),也就是時(shí),第3階段的指標(biāo)值(即第3廠的盈利)為最大,即
由于第3階段是最后的階段,故有其中可取值為0,1,2,3,4,5。其數(shù)值計(jì)算見表。
第34頁,共47頁,2023年,2月20日,星期一
0
1
2
3
4
5
0
0-----00
1-4----41
2--6---62
3---11--113
4----12-124
5-----12125第35頁,共47頁,2023年,2月20日,星期一其中表示取3子過程上最優(yōu)指標(biāo)值時(shí)的決策,例如在表可知當(dāng)=4時(shí),有有此時(shí),即當(dāng)時(shí),此時(shí)?。ò?臺設(shè)備分配給第3廠)是最優(yōu)決策,此時(shí)階段指標(biāo)值(盈利)為12,最優(yōu)3子過程最優(yōu)指標(biāo)值也為12。第二階段:
當(dāng)把臺設(shè)備分配給第2工廠和第3工廠時(shí),則對每個(gè)值,有一種最優(yōu)分配方案,使最大盈利即最優(yōu)2子過程最優(yōu)指標(biāo)函數(shù)值為
第36頁,共47頁,2023年,2月20日,星期一因?yàn)樯鲜揭部蓪懗善鋽?shù)值計(jì)算如表所示。
0
1
2
3
4
5
0-----00
10+4
----51
20+6
5+4---102
30+11
5+6
11+0--142
40+12
11+4
11+0-161,2
50+12
5+12
11+6
11+4
11+0
212第37頁,共47頁,2023年,2月20日,星期一其中在的這一行里,當(dāng)時(shí),這里從表10-5中可知,把1臺設(shè)備交給乙廠所得盈利數(shù)即可,知,這里從表10-6查即可知=11。同樣可知當(dāng)時(shí),可知
;當(dāng)時(shí),;當(dāng)時(shí),;當(dāng)時(shí),;由于,不可能分2廠5臺設(shè)備,故時(shí),欄空著不填。從這些數(shù)值中取得最大即得,即有=16。在此行中我們在取最大值的上面加一橫以示區(qū)別,也可知這時(shí)的最優(yōu)決策為1或2。第38頁,共47頁,2023年,2月20日,星期一
第一階段:把臺設(shè)備分配給第1,第2,第3廠時(shí),最大盈利為其中可取值0,1,2,3,4,5.數(shù)值計(jì)算見表
然后按計(jì)算表格的順序推算,可知最優(yōu)分配方案有兩個(gè):
1.由于,根據(jù),查表10-7可知,再由,求得。即分配給甲廠0臺,乙廠2臺,丙廠3臺。
2.由于,根據(jù),查表可
0
1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報(bào)參考:教育家精神引領(lǐng)民族地區(qū)師范院校高質(zhì)量教師隊(duì)伍建設(shè)的路徑研究
- 課題申報(bào)參考:家校社協(xié)同育人下大學(xué)新生積極心理品質(zhì)的培育研究
- 2025版學(xué)生入學(xué)校園網(wǎng)絡(luò)安全與信息保護(hù)合同3篇
- 三方出口交易合作合同2024年版版B版
- 二零二五年度金融創(chuàng)新合伙協(xié)議書模板3篇
- 基于二零二五年度哺乳期婦女權(quán)益保護(hù)的離婚贍養(yǎng)協(xié)議3篇
- 2025年度個(gè)人客戶信息保密合作協(xié)議4篇
- 二零二五年度倉儲倉儲設(shè)施節(jié)能改造合同4篇
- 2025年度樂器租賃與電商平臺合作協(xié)議3篇
- 二零二五美容院客戶投訴處理與反饋機(jī)制合同4篇
- 2024年國家工作人員學(xué)法用法考試題庫及參考答案
- 國家公務(wù)員考試(面試)試題及解答參考(2024年)
- 《阻燃材料與技術(shù)》課件 第6講 阻燃纖維及織物
- 同等學(xué)力英語申碩考試詞匯(第六版大綱)電子版
- 人教版五年級上冊遞等式計(jì)算100道及答案
- 2024年部編版初中語文各年級教師用書七年級(上冊)
- 2024年新課標(biāo)全國Ⅰ卷語文高考真題試卷(含答案)
- 湖南省退休人員節(jié)日慰問政策
- QB/T 5998-2024 寵物尿墊(褲)(正式版)
- 4P、4C、4R-營銷理論簡析
- 《電力信息系統(tǒng)信息安全檢查規(guī)范》
評論
0/150
提交評論