第一章 數(shù)值最優(yōu)化方法 建模與數(shù)學(xué)預(yù)備知識_第1頁
第一章 數(shù)值最優(yōu)化方法 建模與數(shù)學(xué)預(yù)備知識_第2頁
第一章 數(shù)值最優(yōu)化方法 建模與數(shù)學(xué)預(yù)備知識_第3頁
第一章 數(shù)值最優(yōu)化方法 建模與數(shù)學(xué)預(yù)備知識_第4頁
第一章 數(shù)值最優(yōu)化方法 建模與數(shù)學(xué)預(yù)備知識_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)學(xué)院碩士研究生

《數(shù)值最優(yōu)化方法》

張鴻雁計劃學(xué)時數(shù):48學(xué)時主要參考書目:最優(yōu)化理論與方法,袁亞湘,孫文俞,科學(xué)出版社,1999.05[1]最優(yōu)化方法,解可新等,天津大學(xué)出版社,1997。[2]最優(yōu)化原理與方法(修訂版),薛嘉慶,冶金工業(yè)出版社,2003.6。[3]最優(yōu)化方法,何堅勇,清華大學(xué)出版社,2007.1。[4]最優(yōu)化方法,孫文瑜,徐成賢,朱德通,高等教育出版社,2005.3。[5]非線性規(guī)劃,胡毓達(dá),高等教育出版社,1990。[6]微粒群優(yōu)化與調(diào)度算法,王凌,劉波,清華大學(xué)出版社,2008.5。[7]蟻群優(yōu)化算法,馬良等,科學(xué)出版社,2008.2。數(shù)值最優(yōu)化方法

第一章最優(yōu)化問題數(shù)學(xué)建模專題

§1引言

最優(yōu)化技術(shù)是一門較新的學(xué)科分支。它是在本世紀(jì)五十年代初在電子計算機(jī)廣泛應(yīng)用的推動下才得到迅速發(fā)展,并成為一門直到目前仍然十分活躍的新興學(xué)科。最優(yōu)化所研究的問題是在眾多的可行方案中怎樣選擇最合理的一種以達(dá)到最優(yōu)目標(biāo)。

將達(dá)到最優(yōu)目標(biāo)的方案稱為最優(yōu)方案或最優(yōu)決策,搜尋最優(yōu)方案的方法稱為最優(yōu)化方法,關(guān)于最優(yōu)化方法的數(shù)學(xué)理論稱為最優(yōu)化理論。最優(yōu)化問題至少有兩要素:一是可能的方案;二是要追求的目標(biāo)。后者是前者的函數(shù)。如果第一要素與時間無關(guān)就稱為靜態(tài)最優(yōu)化問題,否則稱為動態(tài)最優(yōu)化問題。本課程專門講授靜態(tài)最優(yōu)化問題。最優(yōu)化技術(shù)應(yīng)用范圍十分廣泛,在我們?nèi)粘I钪校诠まr(nóng)業(yè)生產(chǎn)、社會經(jīng)濟(jì)、國防、航空航天工業(yè)中處處可見其用途。比如我們自己所接觸過的課題有:結(jié)構(gòu)最優(yōu)設(shè)計、電子器件最優(yōu)設(shè)計、光學(xué)儀器最優(yōu)設(shè)計、化工工程最優(yōu)設(shè)計、運(yùn)輸方案、機(jī)器最優(yōu)配備、油田開發(fā)、水庫調(diào)度、飼料最優(yōu)配方、食品結(jié)構(gòu)優(yōu)化等等。

最優(yōu)化技術(shù)工作被分成兩個方面,一是由實(shí)際生產(chǎn)或科技問題形成最優(yōu)化的數(shù)學(xué)模型,二是對所形成的數(shù)學(xué)問題進(jìn)行數(shù)學(xué)加工和求解。對于第二方面的工作,目前已有一些較系統(tǒng)成熟的資料,但對于第一方面工作即如何由實(shí)際問題抽象出數(shù)學(xué)模型,目前很少有系統(tǒng)的資料,而這一工作在應(yīng)用最優(yōu)化技術(shù)解決實(shí)際問題時是十分關(guān)鍵的基礎(chǔ),沒有這一工作,最優(yōu)化技術(shù)將成為無水之源,難以健康發(fā)展。因此,我們在學(xué)習(xí)本課程時要盡可能了解如何由實(shí)際問題形成最優(yōu)化的數(shù)學(xué)模型。為了便于大家今后在處理實(shí)際問題時建立最優(yōu)化數(shù)學(xué)模型,下面我們先把有關(guān)數(shù)學(xué)模型的一些事項(xiàng)作一些說明。

所謂數(shù)學(xué)模型就是對現(xiàn)實(shí)事物或問題的數(shù)學(xué)抽象或描述。建立數(shù)學(xué)模型時要盡可能簡單,而且要能完整地描述所研究的系統(tǒng),但要注意到過于簡單的數(shù)學(xué)模型所得到的結(jié)果可能不符合實(shí)際情況,而過于詳細(xì)復(fù)雜的模型又給分析計算帶來困難。因此,具體建立怎樣的數(shù)學(xué)模型需要豐富的經(jīng)驗(yàn)和熟練的技巧。即使在建立了問題的數(shù)學(xué)模型之后,通常也必須對模型進(jìn)行必要的數(shù)學(xué)簡化以便于分析、計算。一般的模型簡化工作包括以下幾類:(1)將離散變量轉(zhuǎn)化為連續(xù)變量。(2)將非線性函數(shù)線性化。(3)刪除一些非主要約束條件。建立最優(yōu)化問題數(shù)學(xué)模型的三要素:(1)決策變量和參數(shù)。決策變量是由數(shù)學(xué)模型的解確定的未知數(shù)。參數(shù)表示系統(tǒng)的控制變量,有確定性的也有隨機(jī)性的。(2)約束或限制條件。由于現(xiàn)實(shí)系統(tǒng)的客觀物質(zhì)條件限制,模型必須包括把決策變量限制在它們可行值之內(nèi)的約束條件,而這通常是用約束的數(shù)學(xué)函數(shù)形式來表示的。(3)目標(biāo)函數(shù)。這是作為系統(tǒng)決策變量的一個數(shù)學(xué)函數(shù)來衡量系統(tǒng)的效率,即系統(tǒng)追求的目標(biāo)?!?最優(yōu)化問題數(shù)學(xué)建模

最優(yōu)化在物資運(yùn)輸、自動控制、機(jī)械設(shè)計、采礦冶金、經(jīng)濟(jì)管理等科學(xué)技術(shù)各領(lǐng)域中有廣泛應(yīng)用。下面舉幾個專業(yè)性不很強(qiáng)的實(shí)例。

例1.把半徑為1的實(shí)心金屬球熔化后,鑄成一個實(shí)心圓柱體,問圓柱體取什么尺寸才能使它的表面積最小?

解:決定圓柱體表面積大小有兩個決策變量:圓柱體底面半徑r、高h(yuǎn)。問題的約束條件是所鑄圓柱體重量與球重相等。即

min即問題追求的目標(biāo)是圓柱體表面積最小。即則得原問題的數(shù)學(xué)模型:

利用在微積分學(xué)中所學(xué)的Lagrange乘子法可求解本問題分別對r、h、λ求偏導(dǎo)數(shù),并令其等于零,有:

此時圓柱體的表面積為例2.多參數(shù)曲線擬合問題已知兩個物理量x和y之間的依賴關(guān)系為:

其中和待定參數(shù),為確定這些參數(shù),對x、y測解:很顯然對參數(shù)和任意給定的一組數(shù)值,就由上式確定了

y關(guān)于x

的一個函數(shù)關(guān)系式,在幾何上它對應(yīng)一條曲線,這條曲線不一定通過那m個測量點(diǎn),而要產(chǎn)生“偏差”.將測量點(diǎn)沿垂線方向到曲線的距離的平方和作為這種“偏差”的度量.即得m個實(shí)驗(yàn)點(diǎn):試將確定參數(shù)的問題表示成最優(yōu)化問題.

顯然偏差S越小,曲線就擬合得越好,說明參數(shù)值就選擇得越好,從而我們的問題就轉(zhuǎn)化為5維無約束最優(yōu)化問題。即:例3:兩桿桁架的最優(yōu)設(shè)計問題。由兩根空心圓桿組成的對稱兩桿桁架,其頂點(diǎn)承受負(fù)載為2p,兩支座之間的水平距離為2L,圓桿的壁厚為B,桿的比重為ρ,彈性橫量為E,屈服強(qiáng)度為δ。求在桁架不被破壞的情況下使桁架重量最輕的桁架高度h及圓桿平均直徑d。桁桿示意圖

受力分析圖圓桿截面圖由此得穩(wěn)定約束:解:桁桿的截面積為:桁桿的總重量為:負(fù)載2p在每個桿上的分力為:于是桿截面的應(yīng)力為:此應(yīng)力要求小于材料的屈服極限,即圓桿中應(yīng)力小于等于壓桿穩(wěn)定的臨界應(yīng)力。由材料力學(xué)知:壓桿穩(wěn)定的臨界應(yīng)力為

例4.(混合飼料配合)以最低成本確定滿足動物所需營養(yǎng)的最優(yōu)混合飼料。下面舉一個簡化了的例子予以說明。設(shè)每天需要混合飼料的批量為100磅,這份飼料必須含:至少0.8%而不超過1.2%的鈣;至少22%的蛋白質(zhì);至多5%的粗纖維。假定主要配料包括石灰石、谷物、大豆粉。這些配料的主要營養(yǎng)成分為:另外還要考慮到設(shè)計變量d和h有界。從而得到兩桿桁架最優(yōu)設(shè)計問題的數(shù)學(xué)模型:配料每磅配料中的營養(yǎng)含量鈣蛋白質(zhì)纖維每磅成本(元)石灰石谷物大豆粉0.3800.000.000.0010.090.020.0020.500.08

0.01640.04630.1250解:根據(jù)前面介紹的建模要素得出此問題的數(shù)學(xué)模型如下:設(shè)是生產(chǎn)100磅混合飼料所須的石灰石、谷物、大豆粉的量(磅)?!?.最優(yōu)化問題的基本概念

其中是向量變量實(shí)值函數(shù)則有m個式約束的最優(yōu)化問題為:n維歐氏空間向量向量變量實(shí)值函數(shù):無約束最優(yōu)問題:向量變量向量值函數(shù):其中均為向量Z的實(shí)值連續(xù)函數(shù),有二階連續(xù)偏導(dǎo)數(shù),采用向量表示法即為:其中這就是最優(yōu)化問題的一般形式,又稱非線性規(guī)劃。注意集約束通常可用不等式約束表示出來,有時在本課程我們討論的是如下形式的靜態(tài)最優(yōu)化問題:

最優(yōu)化問題模型統(tǒng)一化:在上述最優(yōu)化問題的一般式中只是取極小值,如果遇到極大化問題,只須將目標(biāo)函數(shù)反號就可以化為求極小的問題。

例如:函數(shù)在有極大值,將它改變符號后,在同一點(diǎn)處有極小值由此可見:有相同最優(yōu)點(diǎn)。

因此后面專門研究最小化問題。因此,一般不考慮集約束。稱滿足所有約束條件的向量Z為容許解或可行解,容許點(diǎn)的集合稱為容許集或可行集。

在容許集中找一點(diǎn),使目標(biāo)函數(shù)在該點(diǎn)取最小值,即滿足:的過程即為最優(yōu)化的求解過程。

稱為問題的最優(yōu)點(diǎn),稱為最優(yōu)值,稱為最優(yōu)解。如果約束條件中有“小于等于“的,即則轉(zhuǎn)化為,另外,等式約束可以由下面兩個不等式來代替:因而最優(yōu)化問題的一般形式又可寫成:對于最優(yōu)化問題一般可作如下分類:其中求解一維無約束問題的方法稱為一維搜索或直線搜索,這在最優(yōu)化方法中起十分重要的作用。§4.二維問題的圖解法這是定義在平面上的無約束極小化問題,其目標(biāo)函數(shù)在三維空間中代表一個曲面。

二維最優(yōu)化問題具有鮮明的幾何解釋,并且可以象征性地把這種解釋推廣到n維空間中去。因此我們簡要介紹一下圖解法,這對于以后理解和掌握最優(yōu)化的理論和方法是很有益處的。例1.求解

=4

=9

=1

0ssL在平面上任給一點(diǎn),就對應(yīng)有一個目標(biāo)函數(shù)值=這個值就是過點(diǎn)作平面的垂線與S曲面交點(diǎn)的縱坐標(biāo)。

反之,任給一個值,使目標(biāo)函數(shù)取值為的點(diǎn)Z個數(shù)就不相同了。可能沒有,可能只有一個,可能有多個。這一事實(shí)的幾何意義是:過f軸上坐標(biāo)為的點(diǎn)作坐標(biāo)平面的平行平面L,可能與曲面S無交點(diǎn)(〈0時),可能與S有一個交點(diǎn)(=0時),可能與S交成一條曲線(〉0)。

我們感興趣的是至少有一個交點(diǎn)(≥0)的情形。此時用平面L截曲面S得到一個圓,將它投影到平面上,仍為同樣大小的圓。在這個圓上每一點(diǎn)的目標(biāo)函數(shù)值均為,若一條曲線上任何一點(diǎn)的目標(biāo)函數(shù)值等于同一常數(shù),則稱此曲線為目標(biāo)函數(shù)的等值線。易見,變動f的值,得到不同等值線,這是一組同心圓,對應(yīng)f=0的等值線縮為一點(diǎn)G,對應(yīng)f<0的等值線為空集。易見,隨著f值變小,等值線圓半徑變小,最后縮為一點(diǎn),即為問題的最小值點(diǎn)G,=解:先畫出目標(biāo)函數(shù)等值線,再畫出約束曲線,本處約束曲線是一條直線,這條直線就是容許集。而最優(yōu)點(diǎn)就是容許集上使等值線具有最小值的點(diǎn)。由圖易見約束直線與等值線的切點(diǎn)是最優(yōu)點(diǎn),利用解析幾何的方法得該切點(diǎn)為=,對應(yīng)的最優(yōu)值為=2(圖一)。例2用圖解法求解=2=10例3:用圖解法求解解:①先畫出等式約束曲線的圖形。這是一條拋物線,如圖②再畫出不等式約束區(qū)域,如圖(怎樣選定哪側(cè)區(qū)域)③最后畫出目標(biāo)函數(shù)等值線,特別注意可行集邊界點(diǎn),以及等值線與可行集的切點(diǎn)。==●

DE易見可行域?yàn)榍€段ABCD。當(dāng)動點(diǎn)沿拋物曲線段ABCD由A點(diǎn)出發(fā)時,AB段目標(biāo)函數(shù)值下降。過點(diǎn)B后,在BC段目標(biāo)函數(shù)值上升。過C點(diǎn)后,在CD段目標(biāo)函數(shù)值再次下降。D點(diǎn)是使目標(biāo)函數(shù)值最小的可行點(diǎn),其坐標(biāo)可通過解方程組:得出=,=4

由以上三個例子可見,對二維最優(yōu)化問題。我們總可以用圖解法求解,而對三維或高維問題,已不便在平面上作圖,此法失效。在三維和三維以上的空間中,使目標(biāo)函數(shù)取同一常數(shù)值的是{Z|f(Z)=r,r是常數(shù)}稱為目標(biāo)函數(shù)的等值面。等值面具有以下性質(zhì):

(1)不同值的等值面之間不相交,因?yàn)槟繕?biāo)函數(shù)是單值函數(shù)。

(2)除了極值點(diǎn)所在的等值面外,不會在區(qū)域內(nèi)部中斷,因?yàn)槟繕?biāo)函數(shù)是連續(xù)的

(3)等值面稠的地方,目標(biāo)函數(shù)值變化得較快,而稀疏的地方變化得比較慢。

(4)一般地,在極值點(diǎn)附近,等值面(線)近似地呈現(xiàn)為同心橢球面族(橢圓族)。5二次函數(shù)

二次函數(shù)的一般形式為其中均為常數(shù)?;騠(z)=az+c,外,最簡單最重要的一類就是二次函數(shù)。在n元函數(shù)中,除了線性函數(shù):

定義:設(shè)Q為n×n對稱矩陣若,Z≠0,均有>0,則稱矩陣Q是正定的。若,均有≥0,則稱矩陣Q是半正定的。若,且Z≠0,均有<0,則稱Q是負(fù)定的。

在代數(shù)學(xué)中將特殊的二次函數(shù)稱為二次型。對于二次函數(shù),我們更關(guān)心的是Q為正定矩陣的情形。其向量矩陣表示形式是:其中Q=為對稱矩陣,b=

若,均有≤0,則稱Q是半負(fù)定的。判定一個對稱矩陣Q是不是正定的,可以用Sylvester定理來判定。Sylvester定理:一個n×n對稱矩陣Q是正定矩陣的充要條件是矩陣Q的各階主子式都是正的。例:判定矩陣Q=是否正定

解:對稱矩陣Q的三個主子式依次為:A是正定矩陣非奇異矩陣A=A的所有特征根大于零有高矩陣G,使A=(矩陣秩等于矩陣列:高矩陣)

A的所有主子式>0

=6>0,=3>0,=10>0因此知矩陣Q是正定的。定理:若二次函數(shù)中Q正定,則它的等值面是同心橢球面族,且中心為=

證明:作變換Z=Y,代入二次函數(shù)式中:

根據(jù)解析幾何知識,Q為正定矩陣的二次型的等值面是以坐標(biāo)原點(diǎn)=0為中心的同心橢球面族。由于上式中的

另外,這族橢球面的中心=恰是二次目標(biāo)函數(shù)的唯一極小點(diǎn)。前面已說過,一般目標(biāo)函數(shù)的等值面在極小點(diǎn)附近近似地呈現(xiàn)為橢球面族。由此可見對于二次目標(biāo)函數(shù)有效的求極小點(diǎn)的算法,當(dāng)用于一般目標(biāo)函數(shù)時,至少在極小點(diǎn)附近同樣有效。因此在最優(yōu)化理論中判定一個算法好壞的標(biāo)準(zhǔn)之一,是把該算法用于Q為正定的二次目標(biāo)函數(shù),如能迅速找到極小點(diǎn),就是好算法;否則就不是太好的算法。是常數(shù),所以的等值面也是以=0為中心的同心橢球面族,回到原坐標(biāo)系中去,原二次函數(shù)就是以=為中心的同心橢球面族。

特別地若算法對于Q為正定的二次目標(biāo)函數(shù)能在有限步內(nèi)找出極小點(diǎn)來,就稱此算法為二次收斂算法,或具有二次收斂性。例:把二次函數(shù)化為矩陣向量形式并檢驗(yàn)Q是否正定,如正定,試用公式=求這個函數(shù)的極小點(diǎn)。與題中函數(shù)比較各項(xiàng)系數(shù)為:Q=b=極小點(diǎn)是==解:展開==由前例知Q正定

f:表示f是定義在中區(qū)域D上的n元實(shí)值函數(shù)。定義1:設(shè)f:,D,若l

,使P有:

=0⑴則稱f(Z)在處可微。

若令=則f在處可微時,有=0,即是無窮小量。從而⑵§6梯度與Hesse矩陣一、多元函數(shù)的可微性和梯度以后我們研究的最優(yōu)化問題涉及的均是多元函數(shù),并要求它們的可微性,下面先給出定義。其中表示的高階無窮小,與一元函數(shù)可微性定義類似(即)定理:若f(Z)在處可微,則f(Z)在該點(diǎn)處關(guān)于各變量的一階偏導(dǎo)數(shù)存在,且⑶證明:令,依次取P=,為任意無窮小變量,是第i個坐標(biāo)軸上的單位向量,即由f在處可微,則⑵對P=成立,即兩邊除以并取的極限有:定義2

以f(Z)的n個偏導(dǎo)數(shù)為分量的向量稱為f(Z)在Z處的梯度。記為=⑷梯度也可稱為函數(shù)f(Z)關(guān)于向量Z的一階導(dǎo)數(shù)。若f在處可微,將⑶代入⑵得⑸這與一元函數(shù)展開到兩項(xiàng)的Taylor公式是相對應(yīng)的。二、梯度的性質(zhì)設(shè)f(Z)在定義域內(nèi)有連續(xù)偏導(dǎo)數(shù),即有連續(xù)梯度,則梯度有以下兩個重要性質(zhì):性質(zhì)一函數(shù)在某點(diǎn)的梯度不為零,則必與過該點(diǎn)的等值面垂直性質(zhì)二梯度方向是函數(shù)具有最大變化率的方向。性質(zhì)一的證明:過點(diǎn)的等值面方程為:=或=,

=⑹

設(shè)是過點(diǎn)同時又完全在等值面⑹上的任一條光滑曲線L的方程,θ為參數(shù)。點(diǎn)對應(yīng)的參數(shù)是把此曲線方程代入⑹兩邊同時在處關(guān)于θ求導(dǎo)數(shù),根據(jù)復(fù)合函數(shù)微分法有:⑺向量恰為曲線L在處的切向量,由⑷、⑺有:,即函數(shù)f(Z)在處的梯度與過該點(diǎn)在等值面上的任一條曲線L在此點(diǎn)的切線垂直。從而與過該點(diǎn)的切平面垂直,從而性質(zhì)一成立。=為說明第二條性質(zhì),先引進(jìn)下面方向?qū)?shù)定義:定義設(shè)在點(diǎn)Z處可微,P為固定向量,e為向量P方向的單位向量,則稱極限:為函數(shù)f(Z)在點(diǎn)處沿方向P的方向?qū)?shù),其中為其記號,由定義及極限性質(zhì)可知:若<0,則f(Z)從出發(fā)在附近沿P方向是下降的(∵<0,則t>0充分小時<0即<,)

若>0,則f(Z)從出發(fā)在附近沿方向P是上升的。定理:若在點(diǎn)處可微,則,其中

e為P方向上的單位向量。證明:利用方向?qū)?shù)定義并將中的P換成te有:

==※推論:若<0,則P是函數(shù)f(Z)在處的下降方向。若>0,則P是函數(shù)f(Z)在處的上升方向。(∵P=te,t>0,則<0,有<0,由前面證明即知P為下降方向。)(同樣可證明后者)

以上我們看到方向?qū)?shù)正負(fù)決定了函數(shù)升降,而升降速度的快慢由方向?qū)?shù)絕對值大小來決定,絕對值越大升降速度越大。因此又將方向?qū)?shù)稱為f(Z)在處沿方向P的變化率。由于

(β為方向P與的夾角)為使取最小值,β應(yīng)取,即P=-,可見負(fù)梯度方向即為函數(shù)的最速下降方向;同樣梯度方向即為函數(shù)的最速上升方向。這樣我們就說明了性質(zhì)二。上升方向變化率為0方向下降方向-我們有結(jié)論:

函數(shù)在與其梯度正交的方向上變化率為0

函數(shù)在與其梯度成銳角的方向上是上升的函數(shù)在與其梯度成鈍角的方向上是下降的解:由于則函數(shù)在處的最速下降方向是這個方向上的單位向量是:例1

試求目標(biāo)函數(shù)在點(diǎn)處的最速下降方向,并求沿這個方向移動一個單位長度后新點(diǎn)的目標(biāo)函數(shù)值。幾個常用的梯度公式:新點(diǎn)是故②故①

解:①例2:求下列函數(shù)的梯度:三、Hesse矩陣:

下面我們來考察多元函數(shù)關(guān)于X的二階導(dǎo)數(shù)。首先定義向量變量值函數(shù)的導(dǎo)數(shù):定義:設(shè)如果g(x)的所有分量在點(diǎn)均可微,則向量值函數(shù)g(x)在處稱為可微。根據(jù)前面多元函數(shù)定義,若g(x)在點(diǎn)X0

處可微,則對任意n維向量P均有:

因?yàn)橄蛄康臉O限是通過它所有分量的極限來定義的。則上式等價于:

從而由上面(8)可得:

其中:

稱之為向量值函數(shù)g(x)在處的導(dǎo)數(shù),也稱向量值函數(shù)g(x)在點(diǎn)處的Jacobi矩陣。設(shè)m=n。且其中為n元函數(shù),有二階連續(xù)偏導(dǎo)數(shù)。

這就是多元函數(shù)f(X)關(guān)于X的二階導(dǎo)數(shù),稱為

f(X)的Hessian矩陣。

多元函數(shù)的一階導(dǎo)數(shù)即梯度。二階導(dǎo)數(shù)即Hesse陣。這兩個概念在最優(yōu)化中是最常用的。在高等數(shù)學(xué)中我們已經(jīng)證明過當(dāng)f(X)的所有二階偏導(dǎo)數(shù)連續(xù)時,有j=1,2……n因此在這種情況下,Hesse矩陣是對稱的。例:求目標(biāo)函數(shù)f(X)=的梯度和Hesse矩陣。解:因?yàn)楣蔋esse陣為:

又因?yàn)椋?/p>

則下面幾個Hesse矩陣公式是今后常用到的:(1)則(2)則(單位陣)(3)Q對稱。則(4)若其中f:則:證明(4):對t求導(dǎo),根據(jù)多元函數(shù)復(fù)合函數(shù)求導(dǎo)公式即得第一式。

再對t求一次導(dǎo)數(shù)有:§7多元函數(shù)的Taylor

展開公式

多元函數(shù)Taylor展開式在最優(yōu)化理論中十分重要。許多方法及其收斂性的證明都是從它出發(fā)的。下面就給出多元函數(shù)Taylor展開式及其證明:定理:設(shè)f:具有二階連續(xù)偏導(dǎo)數(shù)。則:

其中而0<θ<1

證明:設(shè)于是

按一元函數(shù)Taylor展開定理把在t=0點(diǎn)展開。有:其中0<θ<1

而由前節(jié)(4)當(dāng)時從而定理中Taylor公式可以寫成(*)式。

這是因?yàn)榈拿恳粋€分量都是連續(xù)函數(shù)。則Taylor展開式還可寫成如下形式:

代入上式并令t=1有:§8極小點(diǎn)及其判定條件一極小點(diǎn)概念:

f例如:圖中一元函數(shù)f定義在區(qū)間[ab]上為嚴(yán)格局部極小點(diǎn),

為非嚴(yán)格局部極小點(diǎn)。0Xa為全局嚴(yán)格極小點(diǎn)。ab

定義1滿足不等式的點(diǎn)X的集合稱為的鄰域。記為:定義2:設(shè)若使(1)均有:則稱為f的非嚴(yán)格局部極小點(diǎn)。(2)。且有則稱為f的嚴(yán)格局部極小點(diǎn)。定義3:設(shè)若使(1)均有則稱為f在D上的非嚴(yán)格全局極小點(diǎn)。(2)有則稱為

f在D上的嚴(yán)格全局極小點(diǎn)。二、局部極小點(diǎn)的判定條件:為了求出函數(shù)的局部極小值點(diǎn),我們首先希望知道函數(shù)f在局部極小點(diǎn)處滿足什么條件?以及滿足什么條件的點(diǎn)是局部極小點(diǎn)。

定理1:設(shè)具有連續(xù)的一階偏導(dǎo)數(shù),若是f的局部極小點(diǎn),且為D的內(nèi)點(diǎn),則證明:設(shè)e為任意單位向量。因?yàn)槭莊(Z)的局部極小點(diǎn)。由定義知:當(dāng)|t|〈δ即時,

局部極小點(diǎn)是指在的某個鄰域內(nèi),f在處取極小值。全局極小點(diǎn)是指在整個定義域D中,f在處取極小值。全局極小點(diǎn)可能在某個局部極小點(diǎn)達(dá)到,也可能在邊界達(dá)到。我們希望知道的當(dāng)然是全局極小點(diǎn),而到目前為止的一些最優(yōu)化算法卻基本上是求局部極小值點(diǎn)的。因此一般要先求出所有局部極小值點(diǎn),再從中找出全局極小點(diǎn)??傆校毫睿ㄒ辉o助函數(shù))則上式即為:而是D的內(nèi)點(diǎn)。從而與之對應(yīng)的t=0是的局部極小點(diǎn)。

注意:定理中條件僅為必要的,而不是充分的。(否則取則

矛盾。由單位向量任意性,即知則根據(jù)一元函數(shù)極小點(diǎn)必要性條件知:而由前述性質(zhì)知:證明:因正定,則使對均有:

將f在處按Taylor公式展開。注意有:f

定理2

設(shè)具有連續(xù)的二階偏導(dǎo)數(shù),是D的內(nèi)點(diǎn),若且

正定,則是f(X)的嚴(yán)格局部極小點(diǎn)。例:在處梯度為但只是雙曲拋物面的鞍點(diǎn),而不是極小點(diǎn)。定義:設(shè)是D的內(nèi)點(diǎn),若則稱為f的駐點(diǎn)。

當(dāng)X充分接近時,上式左端的符號取決于右端的一項(xiàng)(為正)。故(X充分接近時)。但我們實(shí)際中解最優(yōu)化問題時,一般難以求得目標(biāo)函數(shù)的Hesse矩陣。更難以判別其正定性了。因此定理又只具有理論上的意義。推論:①對于具有對稱正定矩陣的二次函數(shù):

是它的唯一極小點(diǎn)。證明:求此二次函數(shù)的駐點(diǎn):由知有唯一駐點(diǎn)而這點(diǎn)處的Hesse陣正定。故由定理又知:是其唯一極小點(diǎn)。②若多元函數(shù)在其極小點(diǎn)處的Hesse陣正定,則它在這個極小點(diǎn)附近的等值面近似地呈現(xiàn)為同心橢球面族。證明:設(shè)是多元函數(shù)f的極小點(diǎn)。并設(shè)f(X)=r是充分靠近極小點(diǎn)的一個等值面,即充分小。將f(X)在點(diǎn)展開為Taylor公式。

因?yàn)闃O小值點(diǎn)。又是高階無窮小量。省略。則有:

這是等值面f=(X)的一個近似曲面。由于假設(shè)正定,則

是以為中心的橢球面方程。

我們知道求解最優(yōu)化問題可以通過求出其全部駐點(diǎn),即求解非線性方程組:達(dá)到。但求解此非線性方程組的難度并不比原最優(yōu)化問題求解難度小。因此一般不采用此法,而利用對原問題的直接迭代法。§9下降迭代算法及

其收斂性一、下降迭代算法:設(shè)是f的一個局部極小點(diǎn)。一般的尋找最優(yōu)點(diǎn)的方法是先找到極小點(diǎn)的一個初始估計點(diǎn)然后按一定規(guī)則即算法產(chǎn)生一個序列,如果:稱算法產(chǎn)生的序列收斂于。

最常見的最優(yōu)化算發(fā)是下降算法。即給定初始點(diǎn)之后,如果每迭代一步均使目標(biāo)函數(shù)有所下降,即在一般算法中,若已迭代到點(diǎn)那么下一次迭代有下面兩種情形之一發(fā)生:從出發(fā)沿任何方向移動,目標(biāo)函數(shù)不再下降。根據(jù)定義知,此點(diǎn)即為局部極小點(diǎn)。迭代終止。

如果算法在某步迭代時找到了極小點(diǎn)則稱算法是有限步終止的。這種情形極少見。

從出發(fā)至少有一個方向使目標(biāo)函數(shù)有所下降。這時從中選定一個下降方向再沿這個方向迭代一步。即在直線上適當(dāng)找一個新點(diǎn)使。此時我們說完成了一次迭代,其中稱為步長因子。

一個算法是有效的,如果它所產(chǎn)生的序列收斂于極小點(diǎn)。

一個自然的想法就是當(dāng)小于預(yù)先給定的誤差時,即為所求的近似解。但未知,因而無法計算。然而很小時,自然也很小,于是想到用①作為算法的一個終止準(zhǔn)則。其中是預(yù)先給定的一個判別算法終止的界限,稱為終止限。但僅用此作為終止準(zhǔn)則是不可靠的。因?yàn)楹苄〔⒉荒鼙WC很小。如圖(a)所示的一條一元目標(biāo)函數(shù)曲線。

在利用計算機(jī)求解時,總只能進(jìn)行有限次迭代,一般難求解精確的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論