最優(yōu)化技術(shù)基礎(chǔ)_第1頁(yè)
最優(yōu)化技術(shù)基礎(chǔ)_第2頁(yè)
最優(yōu)化技術(shù)基礎(chǔ)_第3頁(yè)
最優(yōu)化技術(shù)基礎(chǔ)_第4頁(yè)
最優(yōu)化技術(shù)基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于最優(yōu)化技術(shù)基礎(chǔ)第一頁(yè),共二十七頁(yè),編輯于2023年,星期一▲最優(yōu)策略:對(duì)應(yīng)于一個(gè)策略,可以由一個(gè)量化的指標(biāo)來(lái)確定這個(gè)策略對(duì)應(yīng)的效果,不同的策略有各自的效果。在所有可供選擇的策略中,對(duì)應(yīng)效果最好的策略稱(chēng)為最優(yōu)策略。

多階段決策過(guò)程最優(yōu)化的目標(biāo)是要達(dá)到整個(gè)活動(dòng)過(guò)程的總體效果最優(yōu)。由于各段決策間有機(jī)地聯(lián)系著,本段決策的執(zhí)行將影響到下一段的決策,以至于影響總體效果,所以決策者在每段決策時(shí)不應(yīng)僅考慮本階段最優(yōu),還應(yīng)考慮對(duì)最終目標(biāo)的影響,從而作出對(duì)全局來(lái)講是最優(yōu)的決策。動(dòng)態(tài)規(guī)劃就是符合這種要求的一種決策方法。應(yīng)指出,動(dòng)態(tài)規(guī)劃不象線(xiàn)性規(guī)劃那樣有一個(gè)標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá)式和明確定義的一組規(guī)則,而必須對(duì)具體問(wèn)題進(jìn)行具體分析處理,除了要對(duì)基本概念和方法正確理解外,應(yīng)以豐富的想象力去建立模型,用創(chuàng)造性的技巧去求解。第二頁(yè),共二十七頁(yè),編輯于2023年,星期一(2)多階段決策問(wèn)題舉例

a)工廠(chǎng)生產(chǎn)過(guò)程:為了取得全年最佳經(jīng)濟(jì)效益,在全年的生產(chǎn)過(guò)程中,根據(jù)市場(chǎng)需求,逐月或者逐季度地根據(jù)庫(kù)存和需求情況決定生產(chǎn)計(jì)劃安排。

b)設(shè)備更新問(wèn)題:需要綜合權(quán)衡決定設(shè)備的使用年限,使總的經(jīng)濟(jì)效益最好

c)連續(xù)生產(chǎn)過(guò)程的控制問(wèn)題:一般化工生產(chǎn)過(guò)程中,常包含一系列完成生產(chǎn)過(guò)程的設(shè)備,前一工序設(shè)備的輸出則是后一工序設(shè)備的輸入,因此,應(yīng)該如何根據(jù)各工序的運(yùn)行工況,控制生產(chǎn)過(guò)程中各設(shè)備的輸入和輸出,以使總產(chǎn)量最大。以上問(wèn)題的發(fā)展過(guò)程都與時(shí)間因素有關(guān),因此階段的劃分常取時(shí)間區(qū)段來(lái)表示,并且各個(gè)階段上的決策往往也與時(shí)間因素有關(guān),這就是“動(dòng)態(tài)”的含義,所以把處理這類(lèi)問(wèn)題的方法稱(chēng)為動(dòng)態(tài)規(guī)劃方法。第三頁(yè),共二十七頁(yè),編輯于2023年,星期一d)資源分配問(wèn)題:某工業(yè)部門(mén)擬對(duì)其所屬企業(yè)進(jìn)行稀缺資源分配,為此需要制定出收益最大的資源分配方案。這種問(wèn)題與時(shí)間因素?zé)o關(guān),不屬動(dòng)態(tài)決策,但我們可以人為地規(guī)定一個(gè)資源分配的階段和順序,從而使其變成一個(gè)多階段決策問(wèn)題。

e)運(yùn)輸網(wǎng)絡(luò)問(wèn)題:

運(yùn)輸網(wǎng)絡(luò)連線(xiàn)上的數(shù)字表示兩地距離(也可以是運(yùn)費(fèi)、時(shí)間等),要求從A

至E的最短路線(xiàn)。這種運(yùn)輸網(wǎng)絡(luò)問(wèn)題也是靜態(tài)決策問(wèn)題。但是,按照網(wǎng)絡(luò)中點(diǎn)的分布,可以把它分為幾個(gè)階段,而作為多階段決策問(wèn)題來(lái)研究。第四頁(yè),共二十七頁(yè),編輯于2023年,星期一

(3)動(dòng)態(tài)規(guī)劃求解的多階段決策問(wèn)題的特點(diǎn)通常多階段決策過(guò)程的發(fā)展是通過(guò)狀態(tài)的一系列變換來(lái)實(shí)現(xiàn)的。一般情況下,系統(tǒng)在某個(gè)階段的狀態(tài)轉(zhuǎn)移除與本階段的狀態(tài)和決策有關(guān)外,還可能與系統(tǒng)過(guò)去經(jīng)歷的狀態(tài)和決策有關(guān)。因此,問(wèn)題的求解就比較困難復(fù)雜。適合于用動(dòng)態(tài)規(guī)劃方法求解的只是一類(lèi)特殊的多階段決策問(wèn)題,即具有“無(wú)后效性”(馬爾柯夫性)的多階段決策過(guò)程。所謂無(wú)后效性,是指系統(tǒng)從某個(gè)階段往后的發(fā)展,僅由本階段所處的狀態(tài)及其往后的決策所決定,與系統(tǒng)以前經(jīng)歷的狀態(tài)和決策(歷史)無(wú)關(guān)。多階段決策過(guò)程特點(diǎn):狀態(tài)

x1階段1T1決策u1狀態(tài)

x2決策u2階段2T2狀態(tài)

x3...狀態(tài)

xk決策uk階段kTk狀態(tài)

xk+1...狀態(tài)

xn決策un階段nTn狀態(tài)

xn+1第五頁(yè),共二十七頁(yè),編輯于2023年,星期一(4)動(dòng)態(tài)規(guī)劃方法導(dǎo)引例1:為了說(shuō)明動(dòng)態(tài)規(guī)劃的基本方法和特點(diǎn),以上面運(yùn)輸網(wǎng)絡(luò)圖為例,討論求最短路問(wèn)題的方法。

第一種方法枚舉法.它的基本思想是列舉出所有可能發(fā)生的方案和結(jié)果,再一一比較,求出最優(yōu)方案。這里從A到E的路程可以分為5個(gè)階段。各階段走法:第1段有3種,第2段各有3種,第3段各有2種,第4段各1種,因此共有3×3×2×1=18條可能的路線(xiàn),分別算出各條路線(xiàn)的距離進(jìn)行比較,可知最優(yōu)路線(xiàn)是A

B2

C1

D1

E,最短距離是19.顯然,如果組成網(wǎng)絡(luò)的節(jié)點(diǎn)很多時(shí),用窮舉法求最優(yōu)路線(xiàn)的計(jì)算量將會(huì)十分龐大,其中包含許多重復(fù)計(jì)算.枚舉法雖可找出最優(yōu)方案,但不是個(gè)好算法第六頁(yè),共二十七頁(yè),編輯于2023年,星期一

第二種方法:“局部最優(yōu)路徑”法.說(shuō)某人從某站出發(fā),他選擇“逢近便走”的決策,以為只要“局部最優(yōu)”,就會(huì)達(dá)到”“整體最優(yōu)”,所取決策必是A

B3

C3

D1

E,但全程長(zhǎng)度是25;顯然,這種方法的結(jié)果常是錯(cuò)誤的.局部最優(yōu)法則是錯(cuò)誤方法.

第三種方法動(dòng)態(tài)規(guī)劃方法.

首先將問(wèn)題劃分為5個(gè)階段,每次的選擇總是綜合后繼過(guò)程的一并最優(yōu)進(jìn)行考慮,在各段所有可能狀態(tài)的最優(yōu)后繼過(guò)程都已求得的情況下,全程的最優(yōu)路線(xiàn)便也隨之得到。動(dòng)態(tài)規(guī)劃方法總是從過(guò)程的最后階段開(kāi)始考慮,然后逆著實(shí)際過(guò)程發(fā)展的順序,逐段向前遞推計(jì)算直至始點(diǎn)。動(dòng)態(tài)規(guī)劃方法屬較科學(xué)有效的算法,計(jì)算過(guò)程中,系統(tǒng)地刪去了所有中間非最優(yōu)的方案組合,從而使計(jì)算量比枚舉法大為減少。第七頁(yè),共二十七頁(yè),編輯于2023年,星期一

2.動(dòng)態(tài)規(guī)劃的基本概念

使用動(dòng)態(tài)規(guī)劃方法解決多階段決策問(wèn)題,首先要將實(shí)際問(wèn)題寫(xiě)成動(dòng)態(tài)規(guī)劃模型,需要對(duì)動(dòng)態(tài)規(guī)劃的一些基本術(shù)語(yǔ)加以說(shuō)明和定義:

1.階段為了便于求解和表示決策及過(guò)程的發(fā)展順序,而把所給問(wèn)題恰當(dāng)?shù)貏澐譃槿舾蓚€(gè)相互聯(lián)系又有區(qū)別的子問(wèn)題,稱(chēng)之為多段決策問(wèn)題的階段。一個(gè)階段,就是需要作出一個(gè)決策的子問(wèn)題,通常,階段是按決策進(jìn)行的時(shí)間或空間上先后順序劃分的。

2.狀態(tài)和狀態(tài)變量用以描述系統(tǒng)在某特定的時(shí)間與空間域中所處位置及運(yùn)動(dòng)特征的量,稱(chēng)為狀態(tài)。每個(gè)階段的狀態(tài)可分為初始狀態(tài)和終止?fàn)顟B(tài),階段k的初始狀態(tài)記作sk,終止?fàn)顟B(tài)記為sk+1。但通常定義階段的狀態(tài)即指其初始狀態(tài),故階段k的終止?fàn)顟B(tài)sk+1為階段k+1的初始狀態(tài)。描述過(guò)程k的狀態(tài)變量稱(chēng)為狀態(tài)變量sk

,其取值范圍稱(chēng)為可能狀態(tài)集Sk,即sk∈Sk。第八頁(yè),共二十七頁(yè),編輯于2023年,星期一3.決策和決策變量決策是狀態(tài)的選擇,是決策者從給定階段狀態(tài)出發(fā)對(duì)下一階段狀態(tài)作出的選擇。描述決策變化的量稱(chēng)之決策變量,和狀態(tài)變量一樣,決策變量可以用一個(gè)數(shù)或一向量來(lái)描述,也可以是狀態(tài)變量的函數(shù),記以u(píng)k=uk(sk),表示階段k狀態(tài)sk時(shí)的決策變量。決策變量的取值也有一定的允許范圍,稱(chēng)之允許決策集合Uk(sk),uk(sk)∈Uk(sk)。

4.策略全過(guò)程策略(Policy)是依次進(jìn)行的全部n個(gè)階段決策構(gòu)成的決策序列,表示為p1,n{u1,u2,…,un};從k階段到第n階段,依次構(gòu)成的決策序列稱(chēng)為k部子策略,表示為pk,n{uk,uk+1,…,un},顯然當(dāng)k=1時(shí)的k部子策略就是全過(guò)程策略。在實(shí)際問(wèn)題中,由于在各個(gè)階段可供選擇的決策有許多個(gè),因此,它們的不同組合就構(gòu)成了許多可供選擇的決策序列(策略),它們組成”允許策略集”,記作P1,n

,從中找出具有最優(yōu)效果的策略稱(chēng)為最優(yōu)策略。第九頁(yè),共二十七頁(yè),編輯于2023年,星期一5.狀態(tài)轉(zhuǎn)移方程系統(tǒng)在階段k處于狀態(tài)sk,執(zhí)行決策uk(sk)的結(jié)果是系統(tǒng)狀態(tài)的轉(zhuǎn)移,即系統(tǒng)由階段k的初始狀態(tài)sk轉(zhuǎn)移到終止?fàn)顟B(tài)sk+1,或者說(shuō)由k階段的狀態(tài)sk轉(zhuǎn)移到了k+1階段的狀態(tài)sk+1。對(duì)于具有無(wú)后效性的多階段決策過(guò)程,系統(tǒng)由階段k到階段k+1的狀態(tài)轉(zhuǎn)移完全由階段k的狀態(tài)sk和決策uk(sk)所確定,與系統(tǒng)過(guò)去的狀態(tài)s1,s2,…,sk-1及其決策u1(s1),u2(s2)…uk-1(sk-1)無(wú)關(guān)。系統(tǒng)狀態(tài)的這種轉(zhuǎn)移,用數(shù)學(xué)公式描述即有:(1)

式(1)稱(chēng)為多階段決策過(guò)程的狀態(tài)轉(zhuǎn)移方程。有些問(wèn)題的狀態(tài)轉(zhuǎn)移方程不一定存在數(shù)學(xué)表達(dá)式,但是它們的狀態(tài)轉(zhuǎn)移,還是有一定規(guī)律可循的。第十頁(yè),共二十七頁(yè),編輯于2023年,星期一6.指標(biāo)函數(shù)和最優(yōu)解指標(biāo)函數(shù)是用來(lái)衡量策略效果的某種數(shù)量指標(biāo)。對(duì)不同問(wèn)題,指標(biāo)函數(shù)可以是諸如費(fèi)用、成本、產(chǎn)值、利潤(rùn)、產(chǎn)量、耗量、距離、時(shí)間、效用等等。(1)階段指標(biāo)函數(shù):用gk(sk,uk)表示第k段處于sk狀態(tài)且所作決策為uk(sk)時(shí)的指標(biāo),它就是第k段指標(biāo)函數(shù),簡(jiǎn)記為gk

。(2)過(guò)程指標(biāo)函數(shù)(也稱(chēng)目標(biāo)函數(shù)):用Rk(sk,uk)表示第k子過(guò)程的指標(biāo)函數(shù)。如運(yùn)輸網(wǎng)絡(luò)圖的Rk(sk,uk)表示處于第k段sk狀態(tài)且所作決策為uk時(shí),從sk點(diǎn)到終點(diǎn)E的距離。由此可見(jiàn),Rk(sk,uk)不僅跟當(dāng)前狀態(tài)sk有關(guān),還跟該子過(guò)程策略pk(sk)有關(guān),因此它是sk和pk(sk)的函數(shù),應(yīng)表示為:第十一頁(yè),共二十七頁(yè),編輯于2023年,星期一

用fk(sk)表示第k子過(guò)程指標(biāo)函數(shù)在狀態(tài)sk下的最優(yōu)值,即

與它相應(yīng)的子策略稱(chēng)為sk狀態(tài)下的最優(yōu)子策略,簡(jiǎn)記為:

特別當(dāng)k=1且s1取值唯一時(shí),f1(s1)就是問(wèn)題的最優(yōu)值,而p1*就是最優(yōu)策略。我們把最優(yōu)策略和最優(yōu)值統(tǒng)稱(chēng)為問(wèn)題的最優(yōu)解。第十二頁(yè),共二十七頁(yè),編輯于2023年,星期一7.多階段決策問(wèn)題的數(shù)學(xué)模型綜上所述,適于應(yīng)用動(dòng)態(tài)規(guī)劃方法求解的一類(lèi)多階段決策問(wèn)題,亦即具有無(wú)后效性的多階段決策問(wèn)題的數(shù)學(xué)模型呈以下形式:(5)模型說(shuō)明對(duì)于給定的多階段決策過(guò)程,求取一個(gè)最優(yōu)策略(決策序列),使之既滿(mǎn)足全部約束條件,又使目標(biāo)函數(shù)取得極值,同時(shí),執(zhí)行該最優(yōu)策略時(shí),過(guò)程狀態(tài)演變序列即最優(yōu)路線(xiàn),按上述定義,所謂最優(yōu)決策是指它們?cè)谌^(guò)程上整體最優(yōu)第十三頁(yè),共二十七頁(yè),編輯于2023年,星期一8.最優(yōu)化原理(貝爾曼最優(yōu)化原理)作為一個(gè)全過(guò)程的最優(yōu)策略具有這樣的性質(zhì):對(duì)于最優(yōu)策略過(guò)程中的任意狀態(tài)而言,無(wú)論其過(guò)去的狀態(tài)和決策如何,余下的諸決策必構(gòu)成一個(gè)最優(yōu)子策略。該原理的具體解釋是,若某一全過(guò)程最優(yōu)策略為:

則對(duì)上述策略中所隱含的任一狀態(tài)而言,第k子過(guò)程上對(duì)應(yīng)于該狀態(tài)的最優(yōu)策略必然包含在上述全過(guò)程最優(yōu)策略p1*中,即為第十四頁(yè),共二十七頁(yè),編輯于2023年,星期一貝爾曼最優(yōu)化原理概念:

如圖,如果已經(jīng)給出從點(diǎn)A到點(diǎn)C的最優(yōu)軌跡,那么從任一中間點(diǎn)B到點(diǎn)C的部分軌跡必須是從B到C的最優(yōu)軌跡。

設(shè)給出路線(xiàn)Ⅰ-Ⅱ是從A到C的最優(yōu)路線(xiàn),根據(jù)貝爾曼原理,則路線(xiàn)Ⅱ是從B到C的最優(yōu)路線(xiàn)。[證]:用反證法,假設(shè)某條其它路線(xiàn),例如Ⅱ’是從B到C的最優(yōu)路線(xiàn),那么,路線(xiàn)I-Ⅱ’比路線(xiàn)I-Ⅱ有更小的費(fèi)用。但這與I-Ⅱ是從A到C最優(yōu)路線(xiàn)的前提相矛盾,因此Ⅱ必是從B到C的最優(yōu)路線(xiàn)貝爾曼闡述:“一個(gè)最優(yōu)策略有這樣的特性,不論初始狀態(tài)和初始決策如何,相對(duì)于第一個(gè)決策所形成的狀態(tài)來(lái)說(shuō),余下的決策必定構(gòu)成一個(gè)最優(yōu)策略”。第十五頁(yè),共二十七頁(yè),編輯于2023年,星期一(1)應(yīng)將實(shí)際問(wèn)題恰當(dāng)?shù)胤指畛蒼個(gè)子問(wèn)題(n個(gè)階段)。通常是根據(jù)時(shí)間或空間而劃分的。(2)正確地定義狀態(tài)變量sk,使它既能正確地描述過(guò)程的狀態(tài),又能滿(mǎn)足無(wú)后效性.動(dòng)態(tài)規(guī)劃中的狀態(tài)變量必須具備以下三個(gè)特征:

a)要能夠正確地描述受控過(guò)程的變化特征。

b)要滿(mǎn)足無(wú)后效性。即如果在某個(gè)階段狀態(tài)已經(jīng)給定,那么在該階段以后,過(guò)程的發(fā)展不受前面各段狀態(tài)的影響,如果所選的變量不具備無(wú)后效性,就不能作為狀態(tài)變量來(lái)構(gòu)造動(dòng)態(tài)規(guī)劃的模型。

c)要滿(mǎn)足可知性。即所規(guī)定的各段狀態(tài)變量的值,可以直接或間接地測(cè)算得到。3.動(dòng)態(tài)規(guī)劃方法的基本步驟第十六頁(yè),共二十七頁(yè),編輯于2023年,星期一(3)正確地定義決策變量及各階段的允許決策集合Uk(sk).根據(jù)經(jīng)驗(yàn),一般將問(wèn)題中待求的量,選作動(dòng)態(tài)規(guī)劃模型中的決策變量?;蛘咴诎鸯o態(tài)規(guī)劃模型(如線(xiàn)性與非線(xiàn)性規(guī)劃)轉(zhuǎn)換為動(dòng)態(tài)規(guī)劃模型時(shí),常取前者的變量xj為后者的決策變量uk。(4)能夠正確地寫(xiě)出狀態(tài)轉(zhuǎn)移方程。如果給定第k階段狀態(tài)變量sk的值,則該段的決策變量uk一經(jīng)確定,第k+1段的狀態(tài)變量sk+1的值也就完全確定,即有sk+1=Tk(sk,uk)(5)正確地構(gòu)造出目標(biāo)函數(shù).例如常見(jiàn)的指標(biāo)函數(shù)是取各段指標(biāo)和的形式

其中表示第i階段的指標(biāo),它顯然滿(mǎn)足遞推關(guān)系:第十七頁(yè),共二十七頁(yè),編輯于2023年,星期一求最短路徑4.動(dòng)態(tài)規(guī)劃方法應(yīng)用舉例第十八頁(yè),共二十七頁(yè),編輯于2023年,星期一

將問(wèn)題分成五個(gè)階段,第k階段到達(dá)的具體地點(diǎn)用狀態(tài)變量xk表示,例如:x2=B3表示第二階段到達(dá)位置B3,等等。這里狀態(tài)變量取字符值而不是數(shù)值。

將決策定義為到達(dá)下一站所選擇的路徑,例如目前的狀態(tài)是x2=B3,這時(shí)決策允許集合包含三個(gè)決策,它們是

D2(x2)=D2(B3)={B3C1,B3C2,B3C3}

最優(yōu)指標(biāo)函數(shù)fk(xk)表示從目前狀態(tài)到E的最短路徑。

終端條件為

f5(x5)=f5(E)=0

其含義是從E到E的最短路徑為0。第十九頁(yè),共二十七頁(yè),編輯于2023年,星期一從f5(x5)到f4(x4)的遞推過(guò)程用下表表示:

第四階段的遞推方程為:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論