運籌學(xué)基礎(chǔ)及應(yīng)用第五版-胡運權(quán)課件_第1頁
運籌學(xué)基礎(chǔ)及應(yīng)用第五版-胡運權(quán)課件_第2頁
運籌學(xué)基礎(chǔ)及應(yīng)用第五版-胡運權(quán)課件_第3頁
運籌學(xué)基礎(chǔ)及應(yīng)用第五版-胡運權(quán)課件_第4頁
運籌學(xué)基礎(chǔ)及應(yīng)用第五版-胡運權(quán)課件_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1第八章 動態(tài)規(guī)劃8.1 多階段決策問題8.2 最優(yōu)化原理與動態(tài)規(guī)劃的數(shù)學(xué)模型8.3 離散確定性動態(tài)規(guī)劃模型的求解8.4 離散隨機性動態(tài)規(guī)劃模型的求解 8.5 一般數(shù)學(xué)規(guī)劃模型的動態(tài)規(guī)劃解法1第八章 動態(tài)規(guī)劃8.1 多階段決策問題2 理解動態(tài)規(guī)劃基本概念、最優(yōu)化原理和基本方程,逆序法和順序解法,學(xué)習(xí)應(yīng)用動態(tài)規(guī)劃解決多階段決策問題。 重點 :掌握動態(tài)規(guī)劃模型結(jié)構(gòu)、逆序法算法原理、資源分配、設(shè)備更新、生產(chǎn)與存貯等問題。學(xué)習(xí)要點:2 理解動態(tài)規(guī)劃基本概念、最優(yōu)化原理和基本方程3第一節(jié) 多階段的決策問題3第一節(jié) 多階段的決策問題4動態(tài)規(guī)劃(Dynamic Programming) R. Bellman

2、50年代執(zhí)教于普林斯頓和斯坦福大學(xué),后進入蘭德(Rand)研究所。1957年發(fā)表“Dynamic Programming”一書,標識動態(tài)規(guī)劃的正式誕生。 動態(tài)規(guī)劃的基本概念和定義 動態(tài)規(guī)劃的研究對象和引例 動態(tài)規(guī)劃是解決復(fù)雜系統(tǒng)優(yōu)化問題的一種方法。是解決動態(tài)系統(tǒng)多階段決策過程的基本方法之一。4動態(tài)規(guī)劃(Dynamic Programming) 5 動態(tài)規(guī)劃:是解決多階段決策過程最優(yōu)化問題的一種方法,無特定的數(shù)學(xué)模型。可解決 與時間有關(guān)的動態(tài)問題 與時間無關(guān)的靜態(tài)問題5 動態(tài)規(guī)劃:是解決多階段決策過程最優(yōu)化問題的一種方6多階段決策問題 1)動態(tài)決策將時間作為變量的決策問題稱為動態(tài)決策。其基本特點

3、是多次決策。 2)多階段決策問題是一類特殊形式的動態(tài)決策問題。是指這樣一類活動過程:系統(tǒng)的動態(tài)過程可以按照時間進程分為狀態(tài)互相聯(lián)系而又互相區(qū)別的各個階段,而且在每個階段都要進行決策,當每一個階段的決策確定以后,就完全確定了一個過程的活動路線。6多階段決策問題712345引例1 最短路線問題25375632455114633334C1C3D1AB1B3B2D2EC2712345引例1 最短路線問題253756324551148引例2 生產(chǎn)與存貯問題要求確定一個逐月的生產(chǎn)計劃,在滿足需求條件下,使一年的生產(chǎn)與存貯費用之和最?。?引例3 投資決策問題某公司現(xiàn)有資金Q萬元,在今后5年內(nèi)考慮給A,B,C

4、,D 4個項目投資?引例4 設(shè)備更新問題現(xiàn)企業(yè)要決定一臺設(shè)備未來8年的更新計劃,問應(yīng)在哪些年更新設(shè)備可使總費用最小? 8引例2 生產(chǎn)與存貯問題9 動態(tài)規(guī)劃方法的特點優(yōu)點:1)許多問題用動態(tài)規(guī)劃求解比線性規(guī)劃、非線性規(guī)劃更有效,特別是離散性問題,解析數(shù)學(xué)無用武之地,而動態(tài)規(guī)劃成為得力工具。2)某些情況下,用動態(tài)規(guī)劃處理不僅能作定性描述分析,且可利用計算機給出求其數(shù)值解的方法。9 動態(tài)規(guī)劃方法的特點優(yōu)點:10動態(tài)規(guī)劃方法的特點缺點:1)沒有統(tǒng)一的處理方法,求解時要根據(jù)問題的性質(zhì),結(jié)合多種數(shù)學(xué)技巧。因此,實踐經(jīng)驗及創(chuàng)造性思維將起重要作用。2)“維數(shù)障礙”:當變量個數(shù)太多時,由于計算機內(nèi)存和速度的限制

5、導(dǎo)致問題無法解決。有些問題由于涉及的函數(shù)沒有理想的性質(zhì)使問題只能用動態(tài)規(guī)劃描述,而不能用動態(tài)規(guī)劃方法求解。10動態(tài)規(guī)劃方法的特點缺點:11第二節(jié) 最優(yōu)化原理與動態(tài)規(guī)劃的數(shù)學(xué)模型一 最短路線問題求解25375632455114633334C1C3D1AB1B3B2D2EC2f(E)=011第二節(jié) 最優(yōu)化原理與動態(tài)規(guī)劃的數(shù)學(xué)模型一 最短路12考慮一個階段的最優(yōu)選擇C1C3D1AB1B3B2D2EC2f(D1)=3f(E)=02537563245511463333412考慮一個階段的最優(yōu)選擇C1C3D1AB1B3B2D2EC13C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(D1)

6、=325375632455114633334考慮一個階段的最優(yōu)選擇13C1C3D1AB1B3B2D2EC2f(D2)=4f(E14C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C1)=4f(D1)=325375632455114633334考慮二個階段的最優(yōu)選擇14C1C3D1AB1B3B2D2EC2f(D2)=4f(E15C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C2)=7f(D1)=3f(C1)=437563245511463332534考慮二個階段的最優(yōu)選擇15C1C3D1AB1B3B2D2EC2f(D2)=4f(E16C1C3D1AB1B3B

7、2D2EC2f(D2)=4f(E)=0f(C3)=6f(D1)=3f(C1)=4f(C2)=725375632455114633334考慮二個階段的最優(yōu)選擇16C1C3D1AB1B3B2D2EC2f(D2)=4f(E17C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C3)=6f(D1)=3f(B1)=11f(C2)=7f(C1)=425375632455114633334考慮三個階段的最優(yōu)選擇17C1C3D1AB1B3B2D2EC2f(D2)=4f(E18C1C3D1AB1B3B2D2EC2f (D2)=4f (E)=0f(C3)=6f (D1)=3f(B2)=7f(C2)

8、=7f(C1)=4f(B1)=1125375632455114633334考慮三個階段的最優(yōu)選擇18C1C3D1AB1B3B2D2EC2f (D2)=4f 19C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C3)=6f(D1)=3f(B3)=8f(C2)=7f(C1)=4f(B1)=11f(B2)=725375632455114633334考慮三個階段的最優(yōu)選擇19C1C3D1AB1B3B2D2EC2f(D2)=4f(E2010C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C3)=6f(D1)=3f(B3)=8f(C2)=7f(C1)=4f(A)=11f

9、(B2)=7f(B1)=1125375632455114633334四個階段聯(lián)合考慮從A點到E點的最優(yōu)選擇2010C1C3D1AB1B3B2D2EC2f(D2)=4f216C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C3)=6f(D1)=3f(B3)=8f(C2)=7f(C1)=4f(A)=11f(B2)=7f(B1)=11狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài)A ( A,B3) B37532455125314633334216C1C3D1AB1B3B2D2EC2f(D2)=4f(226C1C3D1AB1B3B2D2EC2f(D2)=4f(E

10、)=0f(C3)=6f(D1)=3f(B3)=8f(C2)=7f(C1)=4f(A)=11f(B2)=7f(B1)=11狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài)A ( A,B3) B3 ( B3, C2 ) C27532455125314633334226C1C3D1AB1B3B2D2EC2f(D2)=4f(236C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C3)=6f(D1)=3f(B3)=8f(C2)=7f(C1)=4f(A)=11f(B2)=7f(B1)=11狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài)A ( A,

11、B3) B3 ( B3, C2 ) C2 ( C2, D2 ) D2 7532455125314633334236C1C3D1AB1B3B2D2EC2f(D2)=4f(246C1C3D1AB1B3B2D2EC2f(D2)=4f(E)=0f(C3)=6f(D1)=3f(B3)=8f(C2)=7f(C1)=4f(A)=11f(B2)=7f(B1)=11狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài) 最優(yōu)決策 狀態(tài)A ( A,B3) B3 ( B3, C2 ) C2 ( C2, D2 ) D2 ( D2, E) E7532455125314633334從A到E的最短路徑為11,路線為AB3C2

12、 D2 E246C1C3D1AB1B3B2D2EC2f(D2)=4f(25通過上例的討論,可以看到多級決策過程具有以下特點:(1)把整個過程看成(或認為地分成)n個具有遞推關(guān)系的單級過程。(2)采取逐級分析的方法,一般由最后一級開始倒向進行。(3)在每一級決策時,不只考慮本級的性能指標的最優(yōu),而且同時考慮本級及以后的總性能指標最優(yōu),因此它是根據(jù)“全局”最優(yōu)作出本級決策的。25通過上例的討論,可以看到多級決策過程具有以下特點:(1)26動態(tài)規(guī)劃法較之窮舉法的優(yōu)點:(1) 容易計算出結(jié)果;(2) 動態(tài)規(guī)劃的計算結(jié)果不僅得到了從起始點到最終點的最短路線,而且得到了中間段任一點到最終點的最短路線 。2

13、6動態(tài)規(guī)劃法較之窮舉法的優(yōu)點:27動態(tài)規(guī)劃方法的基本思想: (1)將多階段決策過程劃分階段,恰當?shù)剡x取狀態(tài)變量、決策變量及定義最優(yōu)指標函數(shù)從而把問題化成一族同類型的子問題,然后逐個求解。 (2)求解時從邊界條件開始,逆(或順)過程行進方向,逐段遞推尋優(yōu)。在每一個子問題求解時,都要使用它前面已求出的子問題的最優(yōu)結(jié)果,最后一個子問題的最優(yōu)解,就是整個問題的最優(yōu)解。 (3)動態(tài)規(guī)劃方法是既把當前一段與未來各段分開,又把當前效益和未來效益結(jié)合起來考慮的一種最優(yōu)化方法,因此每段的最優(yōu)決策選取是從全局考慮的,與該段的最優(yōu)選擇一般是不同的。27動態(tài)規(guī)劃方法的基本思想:28二、基本概念和基本原理動態(tài)規(guī)劃模型要

14、用到的概念: (1)階段; (2)狀態(tài); (3)決策和策略; (4)狀態(tài)轉(zhuǎn)移律; (5)指標函數(shù)。1、階段:將所給問題的過程,按時間或空間特征分解成若干互相聯(lián)系的階段,以便按次序去求每階段的解,常用字母k表示階段變量。28二、基本概念和基本原理動態(tài)規(guī)劃模型要用到的概念:1、階段292、狀態(tài):各階段開始時的客觀條件叫做狀態(tài)。狀態(tài)變量:描述各階段狀態(tài)的變量,用sk表示第k階段的狀態(tài)變量。狀態(tài)集合:狀態(tài)變量的取值集合,用Sk表示。一階段:S1A二階段:S2B1,B2,B3三階段:S3C1,C2,C3四階段:S4D1,D2一階段:S1A二階段:S2B1,B2,B3三階段:S3C1,C2,C3四階段:S

15、4D1,D2二、基本概念和基本原理292、狀態(tài):各階段開始時的客觀條件叫做狀態(tài)。一階段:S130二、基本概念和基本原理二、基本概念和基本原理3、決策:當各段的狀態(tài)取定以后,就可以作出不同的決定(或選擇),從而確定下一階段的狀態(tài),這種決定稱為決策。決策變量:表示決策的變量,稱為決策變量,常用xk(sk)表示第k階段當狀態(tài)為sk時的決策變量。允許決策集合:決策變量的取值往往限制在一定范圍內(nèi),我們稱此范圍為允許決策集合,用Dk(sk)表示第k階段從狀態(tài)sk出發(fā)的允許決策集合。D2( B1)=C1,C2 D2( B2)=C1,C2,C3如狀態(tài)為B1時選擇C2,可表示為:u2(B1)=C2D2( B1)

16、=C1,C2 D2( B2)=C1,C2,C3如狀態(tài)為B1時選擇C2,可表示為:x2(B1)=C230二、基本概念和基本原理二、基本概念和基本原理3、決策:當31二、基本概念和基本原理4 策略:各段決策確定后,整個問題的決策序列就構(gòu)成一個策略,用p1,nx1(s1),x2(s2),.xn(sn)表示。允許策略集合:對每個實際問題,可供選擇的策略有一定范圍,稱為允許策略集合,記作P1,n,使整個問題達到最優(yōu)效果的策略就是最優(yōu)策略。31二、基本概念和基本原理4 策略:各段決策確定后,整個問題32二、基本概念和基本原理 5、狀態(tài)轉(zhuǎn)移方程:動態(tài)規(guī)劃中本階段的狀態(tài)往往是上一階段狀態(tài)和上一階段的決策結(jié)果。

17、第k段的狀態(tài)sk,本階段決策為xk(sk),則第k+1段的狀態(tài)sk+1也就完全確定,它們的關(guān)系可用公式表示:sk+1=Tk(sk,xk)32二、基本概念和基本原理 5、狀態(tài)轉(zhuǎn)移方程:動態(tài)規(guī)劃中本階33 6、指標函數(shù):用于衡量所選定策略優(yōu)劣的數(shù)量指標。 它分為階段指標函數(shù)和過程指標函數(shù)。 階段指標函數(shù)是指第k段,從狀態(tài)sk出發(fā),采取決策xk時的效益,用Vk(sk,uk)表示。 過程指標函數(shù)記為fk(sk):表示從第k段狀態(tài)sk按預(yù)定指標到過程終止時的效益值。二、基本概念和基本原理33 6、指標函數(shù):用于衡量所選定策略優(yōu)劣的數(shù)量指標。 二、34最簡單的方法窮舉法。共有多少條路徑,依次計算并比較。動

18、態(tài)規(guī)劃方法本方法是從過程的最后一段開始,用逆序遞推方法求解,逐步求出各段各點到終點的最短路線,最后求得起始點到終點的最短路線。三、最優(yōu)化原理與動態(tài)規(guī)劃的數(shù)學(xué)模型34最簡單的方法窮舉法。共有多少條路徑,依次計算并比較。35最優(yōu)化原理Optimization Principle 作為整個過程的最優(yōu)策略具有這樣的性質(zhì):無論過去的狀態(tài)和決策如何,對先前決策所形成的狀態(tài)而言,余下的諸決策必構(gòu)成最優(yōu)策略。 若M是從A到B的最優(yōu)路線上的一點,則從M到B的路線也是最優(yōu)的。ABM35最優(yōu)化原理Optimization Principle 36動態(tài)規(guī)劃的基本方程(最優(yōu)化原理的應(yīng)用)根據(jù)最優(yōu)化原理得到的計算動態(tài)規(guī)劃

19、問題的遞(逆)推關(guān)系式:邊界條件:k=n時,fn+1(sn+1)=0邊界條件: k=n時, fn+1(sn+1)=1Opt: optimization, max or min vk: k階段的指標函數(shù) fk+1:k+1階段的最優(yōu)指標函數(shù)值 fk:k階段的最優(yōu)指標函數(shù)值36動態(tài)規(guī)劃的基本方程(最優(yōu)化原理的應(yīng)用)根據(jù)最優(yōu)化原理得37構(gòu)成動態(tài)規(guī)劃模型的條件-1根據(jù)時間或空間的自然特征,實際問題能恰當?shù)貏澐譃槿舾呻A段,形成多階段決策的過程37構(gòu)成動態(tài)規(guī)劃模型的條件-1根據(jù)時間或空間的自然特征,實際38構(gòu)成動態(tài)規(guī)劃模型的條件-2正確的選擇狀態(tài)變量S 動態(tài)規(guī)劃的狀態(tài)應(yīng)具有三個特征: 能夠用來描述受控過程的

20、演變特征;滿足無后效性:如果某階段狀態(tài)給定,則在這階段以后過程的發(fā)展只與當前的狀態(tài)有關(guān),而與過去的歷史無關(guān)?;虍斍暗臓顟B(tài)是過去歷史發(fā)展的一個總結(jié),過程的過去歷史只能通過當前的狀態(tài)影響未來的發(fā)展??芍裕焊麟A段狀態(tài)變量的值,直接或間接地都是可以知道的。38構(gòu)成動態(tài)規(guī)劃模型的條件-2正確的選擇狀態(tài)變量S39構(gòu)成動態(tài)規(guī)劃模型的條件 - 3確定決策變量sk的含義及每階段的允許決策集合Dk(sK)39構(gòu)成動態(tài)規(guī)劃模型的條件 - 3確定決策變量sk的含義及每40構(gòu)成動態(tài)規(guī)劃模型的條件-4正確寫出狀態(tài)轉(zhuǎn)移方程 sk+1=T(sk,xk(sk) 或 sk+1=T(sk,xk) 40構(gòu)成動態(tài)規(guī)劃模型的條件-4正

21、確寫出狀態(tài)轉(zhuǎn)移方程41構(gòu)成動態(tài)規(guī)劃模型的條件-5明確指標函數(shù)Vk,n的關(guān)系一般有兩種形式和式積式41構(gòu)成動態(tài)規(guī)劃模型的條件-5明確指標函數(shù)Vk,n的關(guān)系42四 逆序解法與順序解法如果尋優(yōu)的方向與多階段決策過程的實際行進方向相反,從最后一段開始計算逐段前推,求得全過程的最優(yōu)策略,稱為逆序解法。順序解法的尋優(yōu)方向同于過程的行進方向,計算時從第一段開始逐段向后遞推,計算后一階段要用到前一階段的求優(yōu)結(jié)果,最后一段計算的結(jié)果就是全過程的最優(yōu)結(jié)果。42四 逆序解法與順序解法43第一步:k=0狀態(tài):s1Af0(A)0求解步驟順序解法求解43第一步:k=0f0(A)0求解步驟順序解法求解44第二步:k=1 狀

22、態(tài):B1 B2 x1*(B1)=Ax1*(B2)=Af1(B1)4f1(B2)5(4)(5)44第二步:k=1 x1*(B1)=Ax1*(B245第三步:k=2 狀態(tài):C1 C2 C3 C4u2*(C1)=B1x2*(C2)=B1x2*(C3)=B1f2(C1)6f2(C2)7f2(C3)10 x2*(C4)=B2f2(C4)12(4)(5)(6)(7)(10)(12)x2*(C1)=B145第三步:k=2 u2*(C1)=B1x2*(C2)46(4)(5)(6)(7)(10)(12)第四步:k=3 狀態(tài):D1 D2 D3x3*(D1)=C1或C2x3*(D2)=C2x3*(D3)=C3f3(

23、D1)11f3(D2)12f3(D3)14(11)(12)(14)46(4)(5)(6)(7)(10)(12)第四步:k=3 47第五步:k=4 狀態(tài):E1 E2 x4*(E1)=D1x4*(E2)=D2f4(E1)14f4(E2)14(4)(5)(6)(7)(10)(12)(11)(12)(14)(14)(14)47第五步:k=4 x4*(E1)=D1x4*(E2)48第六步:k=5 狀態(tài):F u5*(F)=E2f5(F)17(6)(4)(5)(7)(10)(12)(11)(12)(14)(14)(14)(17)即從A到F的最短距離為17。最優(yōu)路線為:AB1C2D2E2F48第六步:k=5

24、u5*(F)=E2f5(F)1749逆序解法與順序解法建模的不同點1狀態(tài)轉(zhuǎn)移方式不同sk+1=Tk(sk,xk) sk=Tk(sk+1,xk) 1狀態(tài)s1決策x1效益v1(s1,x1)s2kskxkvk(sk,xk)Sk+1nsnxnvn(sn,xn)Sn+11狀態(tài)s1決策x1效益v1(s2,x1)s2kskxkvk(sk+1,xk)Sk+1nsnxnvn(sn+1,xn)Sn+149逆序解法與順序解法建模的不同點1狀態(tài)轉(zhuǎn)移方式不同1狀態(tài)502指標函數(shù)的定義不同 逆序解法中,我們定義最優(yōu)指標函數(shù)fk(sk)表示第k段從狀態(tài)sk出發(fā),到終點后部子過程最優(yōu)效益值,f1(s1)是整體最優(yōu)函數(shù)值。 順

25、序解法中,定義最優(yōu)指標函數(shù)fk(sk+1)表示第k段時從起點到狀態(tài)sk+1的前部子過程最優(yōu)效益值。fn(sn+1)是整體最優(yōu)函數(shù)值。502指標函數(shù)的定義不同513. 基本方程形式不同(1)當指標函數(shù)為階段指標和形式逆序解法則基本方程為:則基本方程為:順序解法513. 基本方程形式不同則基本方程為:則基本方程為:順序解52(2)當指標函數(shù)為階段指標積形式逆序解法基本方程為:基本方程為:順序解法52(2)當指標函數(shù)為階段指標積形式基本方程為:基本方程為:53第3節(jié) 離散確定型動態(tài)規(guī)劃 模型求解Solution of Discrete Certain DP Model53第3節(jié) 離散確定型動態(tài)規(guī)劃

26、模型求54例4某一警衛(wèi)部門共有12支巡邏隊,負責(zé)4個要害部位A、B、C、D的警衛(wèi)巡邏。對每個部位可分別派出2-4支巡邏隊,并且由于派出巡邏隊數(shù)的不同,各部位預(yù)期在一段時期內(nèi)可能造成的損失有差別,具體數(shù)字見表8-1。問該警衛(wèi)部門應(yīng)往各部位分別派多少支巡邏隊,使總的預(yù)期損失為最小。 ABCD218382434314352231410312125巡邏隊數(shù)巡邏部位預(yù)期損失54例4某一警衛(wèi)部門共有12支巡邏隊,負責(zé)4個要害部位A、B55解-1階段變量k :把12支巡邏隊往4個部位派遣看成依次分四個階段(k=1,2,3,4)。狀態(tài)變量sk:表示每個階段初擁有的可派遣的巡邏隊數(shù)是前面階段決策的結(jié)果,也是本階

27、段決策的依據(jù)決策變量xk:表示各階段對各部位派出的巡邏隊數(shù),各階段允許的決策集合Dk(sk)為:Dk(sk)=xk|2xk4| (k=1,2,3,4)55解-1階段變量k :把12支巡邏隊往4個部位派遣看成56解-2狀態(tài)轉(zhuǎn)移方程:sk+1=sk-xk (k=1,2,3,4)每階段初擁有可派遣的巡邏隊數(shù)量等于上階段初擁有的數(shù)量減去上階段派出的數(shù)量過程函數(shù)為階段指標函數(shù)之和:階段指標函數(shù)vk(xk)表示k階段派出的巡邏隊數(shù)為xk時,該階段的部位的預(yù)期損失值56解-2狀態(tài)轉(zhuǎn)移方程:sk+1=sk-xk (k=57解-3fk(sk):表示從k階段狀態(tài)為sk出發(fā),采用最優(yōu)子策略到過程結(jié)束時的預(yù)期損失值,

28、有先考慮給D部位派巡邏隊,即k=4,上式可寫為 邊界條件f5(s5)=0 ,所以 57解-3fk(sk):表示從k階段狀態(tài)為sk出發(fā),采用58解-4 x4s4v4(x4)f4(s4)x4*23423434233431313434312525453431252546343125254因D4(s4)=2,3,4,又s4的可能值是2s46,故由表8-1的數(shù)據(jù),可得下表的結(jié)果 總共12支巡邏隊,每部位24支巡邏隊。58解-4 x4v4(x4)f4(s4)x59解-5聯(lián)合考慮對C、D兩個部位派巡邏隊,k=3,有:因D3(s3)=2,3,4,4s38,可得如下結(jié)果 x3s3v3(x3)+f4(s3-x3)

29、f3(s3)x3*234424+34582524+3122+34552624+2522+3121+34492724+2522+2521+31473824+2522+2521+2546459解-5聯(lián)合考慮對C、D兩個部位派巡邏隊,k=3,有:60解-6考慮對B、C、D三個部位派巡邏隊,k=2,有由D2(s2)=2,3,4,8s210,可得如下結(jié)果 x2s2v2(x2)+f3(s2-x2)f2(s2)x2*234838+4935+5531+58872938+4735+4931+558431038+4635+4731+4980460解-6考慮對B、C、D三個部位派巡邏隊,k=2,有 61解-7考慮對

30、A、B、C、D四個部隊派巡邏隊,即k=1時,有因s1=12, D1(s1)=2,3,4,可得如下結(jié)果 x1s1v1(x1)+f2(s1-x1)f1(s1)x1*2341218+8014+8410+8797461解-7考慮對A、B、C、D四個部隊派巡邏隊,即k=162解-8 x3s3v3(x3)+f4(s3-x3)f3(s3)x3*234424+34582524+3122+34552624+2522+3121+34492724+2522+2521+31473824+2522+2521+25464x4s4v4(x4)f4(s4)x4*23423434233431313434312525453431252546343125254 x2s2v2(x2)+f3(s2-x2)f2(s2)x2*234838+4935+5531+58872938+4735+4931+558431038+4635+4731+49804最優(yōu)策略為:A部位4支,B部位2支,C部位2支,D部位4支,總預(yù)期損失為97單位。x1s1v1(x1)+f2(s1-x1)f1(s1)x1*2341218+8014+8410+8797462解-8 x3v3(x3)+f4(s3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論