版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
玩撲克牌,比大小兩組撲克牌,分別是3、5、7和4、6、8你們先選,然后先出玩撲克牌,比大小1為什么我是總能贏?這就是決策,對(duì)策田忌賽馬田忌賽馬是大多數(shù)人都熟知的故事,傳說(shuō)戰(zhàn)國(guó)時(shí)期齊王欲與大將田忌賽馬,雙方約定每人挑選上、中、下三個(gè)等級(jí)的馬各一匹進(jìn)行比賽,每局賭金為一千金。齊王同等級(jí)的馬均比田忌的馬略勝一籌,似乎必勝無(wú)疑。田忌的朋友孫臏給他出了一個(gè)主意,讓他用下等馬比齊王的上等馬,上等馬對(duì)齊王的中等馬,中等馬對(duì)齊王的下等馬,結(jié)果田忌二勝一敗,反而贏了一千金。為什么我是總能贏?2第一場(chǎng)第二場(chǎng)第三場(chǎng)獲勝方齊
王上中下田忌1上中下齊王田忌2上下中齊王田忌3中上下齊王田忌4中下上齊王田忌5下上中田忌田忌6下中上齊王第一場(chǎng)第二場(chǎng)第三場(chǎng)獲勝方齊王上中下田忌1上中下齊王田忌2上3田忌能贏,主要是已知齊王的策略而做出決策如果田忌和齊王事先都不知道各自采用何種組合來(lái)賽馬,那結(jié)果又如何田忌能贏,主要是已知齊王的策略而做出決策4兩人輪流報(bào)數(shù),每次只能報(bào)1或2,把兩人報(bào)的所有數(shù)加起來(lái),誰(shuí)報(bào)數(shù)后和是10,誰(shuí)就獲勝。想一想,如果讓你先報(bào)數(shù),為了確報(bào)勝利,你第一次應(yīng)報(bào)幾?接下來(lái)應(yīng)該怎樣報(bào)??jī)扇溯喠鲌?bào)數(shù),每次只能報(bào)1或2,把兩人報(bào)的所有數(shù)加起來(lái),誰(shuí)報(bào)5(囚犯的困惑)警察同時(shí)逮捕了兩人并分開關(guān)押,逮捕的原因是他們持有大量偽幣,警方懷疑他們偽造錢幣,但沒(méi)有找到充分證據(jù),希望他們能自己供認(rèn),這兩個(gè)人都知道:如果他們雙方都不供認(rèn),將被以使用和持有大量偽幣罪被各判刑18個(gè)月;如果雙方都供認(rèn)偽造了錢幣,將各被判刑3年;如果一方供認(rèn)另一方不供認(rèn),則供認(rèn)方將被從寬處理而免刑,但另一方面將被判刑7年。將嫌疑犯A、B被判刑的幾種可能情況列表如下:嫌疑犯B供認(rèn)不供認(rèn)嫌疑犯A供認(rèn)不供認(rèn)(3,3)(0,7)(7,0)(1.5,1.5)表中每對(duì)數(shù)字表示嫌疑犯A、B被判刑的年數(shù)。如果兩名疑犯均擔(dān)心對(duì)方供認(rèn)并希望受到最輕的懲罰,最保險(xiǎn)的辦法自然是承認(rèn)制造了偽幣。(囚犯的困惑)警察同時(shí)逮捕了兩人并分開關(guān)押,逮捕的原因是他們6對(duì)策論(博弈論)解決具有對(duì)抗性局勢(shì)的模型。在這類模型中,參與對(duì)抗的各方都有一些可供選擇的策略,該模型為對(duì)抗各方提供獲得最優(yōu)對(duì)策的方法決策分析在決策環(huán)境不確定和風(fēng)險(xiǎn)情況下對(duì)幾種被選方案進(jìn)行決策的準(zhǔn)則和方法預(yù)測(cè)對(duì)未來(lái)的發(fā)展作出的推測(cè)。如,基于歷史數(shù)據(jù)及相關(guān)分析的定量方法、利用專家判斷的定性方法
主要分支對(duì)策論(博弈論)主要分支7一、對(duì)策的基本要素(1)局中人。參加決策的各方被稱為決策問(wèn)題的局中人,一個(gè)決策總是可以包含兩名局中人(如棋類比賽、人與大自然作斗爭(zhēng)等),也可以包含多于兩名局中人(如大多數(shù)商業(yè)中的競(jìng)爭(zhēng)、政治派別間的斗爭(zhēng))。局中人必須要擁用可供其選擇并影響最終結(jié)局的策略,在例8.3中,局中人是A、B兩名疑犯,警方不是局中人。兩名疑犯最終如何判刑取決于他們各自采取的態(tài)度,警方不能為他們做出選擇。從這些簡(jiǎn)單實(shí)例中可以看出對(duì)策現(xiàn)象中包含的幾個(gè)基本要素。一、對(duì)策的基本要素(1)局中人。參加決策的各方被稱為決策問(wèn)題8(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可采取的全部策略稱為此局中人的策略集合。對(duì)策問(wèn)題中,對(duì)應(yīng)于每一局中人存在著一個(gè)策略集合,而每一策略集合中至少要有兩個(gè)策略,否則該局中人可從此對(duì)策問(wèn)題中刪去,因?yàn)閷?duì)他來(lái)講,不存在選擇策略的余地。應(yīng)當(dāng)注意的是,所謂策略是指在整個(gè)競(jìng)爭(zhēng)過(guò)程中對(duì)付他方的完整方法,并非指競(jìng)爭(zhēng)過(guò)程中某步所采取的具體局部辦法。例如下棋中的某步只能看和一個(gè)完整策略的組成部分,而不能看成一個(gè)完整的策略。當(dāng)然,有時(shí)可將它看成一個(gè)多階段對(duì)策中的子對(duì)策。策略集合可以是有限集也可以是無(wú)限集。策略集為有限集時(shí)稱為有限對(duì)策,否則稱為無(wú)限對(duì)策。
記局中人i的策略集合為Si。當(dāng)對(duì)策問(wèn)題各方都從各自的策略集合中選定了一個(gè)策略后,各方采取的策略全體可用一矢量S表示,稱之為一個(gè)純局勢(shì)(簡(jiǎn)稱局勢(shì))。
(2)策略集合。局中人能采取的可行方案稱為策略,每一局中人可9例如,若一對(duì)策中包含A、B兩名局中人,其策略集合分別為SA
={1,…,m},SB
={1,…,n}。若A選擇策略i而B選策略j,則(i,j)就構(gòu)成此對(duì)策的一個(gè)純局勢(shì)。顯然,SA與SB一共可構(gòu)成m×n個(gè)純局勢(shì),它們構(gòu)成表8.3。對(duì)策問(wèn)題的全體純局勢(shì)構(gòu)成的集合S稱為此對(duì)策問(wèn)題的局勢(shì)集合。
(m,n)
…(m,j)
…(m,2)
(m,1)
m…………………(i,n)
…(i,j)
…(i,2)
(i,1)
i…………………(2,n)
…(2,j)
…(2,2)
(2,1)
2(1,n)
…(1,j)
…(1,2)
(1,1)
1A的策略n…J…21B的策略例如,若一對(duì)策中包含A、B兩名局中人,其策略集合分別為SA10(3)贏得函數(shù)(或稱支付函數(shù))。對(duì)策的結(jié)果用矢量表示,稱之為贏得函數(shù)。贏得函數(shù)F為定義在局勢(shì)集合S上的矢值函數(shù),對(duì)于S中的每一純局勢(shì)S,F(xiàn)(S)指出了每一局中人在此對(duì)策結(jié)果下應(yīng)贏得(或支付)的值。綜上所述,一個(gè)對(duì)策模型由局中人、策略集合和贏得函數(shù)三部分組成。記局中人集合為I={1,…,k},對(duì)每一i∈I,有一策略集合Si,當(dāng)I中每一局中人i選定策略后得一個(gè)局勢(shì)s;將s代入贏得函數(shù)F,即得一矢量F(s)=(F1(s),…,Fk(s)),其中Fi(s)為在局勢(shì)s下局中人i的贏得(或支付)。本節(jié)討論只有兩名局中人的對(duì)策問(wèn)題,即兩人對(duì)策,其結(jié)果可以推廣到一般的對(duì)策模型中去。對(duì)于只有兩名局中人的對(duì)策問(wèn)題,其局勢(shì)集合和贏得函數(shù)均可用表格表示。例如,表8.2就給出了例8.3的局勢(shì)集合和贏得函數(shù)。(3)贏得函數(shù)(或稱支付函數(shù))。對(duì)策的結(jié)果用矢量表示,稱之為11二、零和對(duì)策存在一類特殊的對(duì)策問(wèn)題。在這類對(duì)策中,當(dāng)純局勢(shì)確定后,A之所得恰為B之所失,或者A之所失恰為B之所得,即雙方所得之和總為零。在零和對(duì)策中,因F1(s)=-F2(s),只需指出其中一人的贏得值即可,故贏得函數(shù)可用贏得矩陣表示。例如若A有m種策略,B有n種策略,贏得矩陣
表示若A選取策略i而B選取策略j,則A之所得為aij(當(dāng)aij<0時(shí)為支付)。二、零和對(duì)策存在一類特殊的對(duì)策問(wèn)題。在這類對(duì)策中,當(dāng)純局勢(shì)確12在有些兩人對(duì)策的贏得表中,A之所得并非明顯為B之所失,但雙方贏得數(shù)之和為一常數(shù)。例如在表8.4中,無(wú)論A、B怎樣選取策略,雙方贏得總和均為10,此時(shí),若將各人贏得數(shù)減去兩人的平均贏得數(shù),即可將贏得表化為零和贏得表。表8.4中的對(duì)策在轉(zhuǎn)化為零和對(duì)策后,具有贏得矩陣表8.4局中人B123局中人A1(8,2)(1,9)(7,3)2(4,6)(9,1)(3,7)3(2,8)(6,4)(8,2)4(6,4)(4,6)(6,4)在有些兩人對(duì)策的贏得表中,A之所得并非明顯為B之所失,但雙方13給定一個(gè)兩人對(duì)策只需給出局中人A、B的策略集合SA、SB及表示雙方贏得值的贏得矩陣R。綜上所述,當(dāng)遇到零和對(duì)策或可轉(zhuǎn)化為零和對(duì)策的問(wèn)題時(shí),R可用通常意義下的矩陣表示,否則R的元素為一兩維矢量。故兩人對(duì)策G又可稱為矩陣對(duì)策并可簡(jiǎn)記成G={SA,SB,R}給定一個(gè)兩人對(duì)策只需給出局中人A、B的策略集合SA、SB及表14例8.4
給定G={SA,SB,R},其中SA
={1,2,3},SB
={1,2,3,4}
從R中可以看出,若A希望獲得最大贏利30,需采取策略1,但此時(shí)若B采取策略4,A非但得不到30,反而會(huì)失去22。為了穩(wěn)妥,雙方都應(yīng)考慮到對(duì)方有使自己損失最大的動(dòng)機(jī),在最壞的可能中爭(zhēng)取最好的結(jié)果。局中人A采取策略1、2、3時(shí),最壞的贏得結(jié)果分別為min{12,-6,30,-22}=-22min{14,2,18,10}=2min{-6,0,-10,16}=-10其中最好的可能為max{-22,2,-10}=2。如果A采取策略2,無(wú)論B采取什么策略,A的贏得均不會(huì)少于2.例8.4給定G={SA,SB,R},其中SA15B采取各方案的最大損失為max{12,14,-6}=14,max{-6,2,0}=2,max{30,18,-10}=30和max{-22,10,16}=16。當(dāng)B采取策略2時(shí),其損失不會(huì)超過(guò)2。注意到在贏得矩陣中,2既是所在行中的最小元素又是所在列中的最大元素。此時(shí),只要對(duì)方不改變策略,任一局中人都不可能通過(guò)變換策略來(lái)增大贏得或減小損失,稱這樣的局勢(shì)為對(duì)策的一個(gè)穩(wěn)定點(diǎn)或穩(wěn)定解,(注:也被稱為鞍點(diǎn))定義8.1
對(duì)于兩人對(duì)策G={SA,SB,R},若有,則稱G具有穩(wěn)定解,并稱VG為對(duì)策G的值。若純局勢(shì)()使得,則稱()為對(duì)策G的鞍點(diǎn)或穩(wěn)定解,贏得矩陣中與()相對(duì)應(yīng)的元素稱為贏得矩陣的鞍點(diǎn),與分別稱為局中人A與B的最優(yōu)策略。對(duì)(8.1)式中的贏得矩陣,容易發(fā)現(xiàn)不存在具有上述性質(zhì)的鞍點(diǎn)。給定一個(gè)對(duì)策G,如何判斷它是否具有鞍點(diǎn)呢?為了回答這一問(wèn)題,先引入下面的極大極小原理。蘊(yùn)涵的思想是樸素自然的,可以概括為:“從最壞處著想,去爭(zhēng)取最好的結(jié)果”B采取各方案的最大損失為max{12,14,-6}=1416定理8.1
設(shè)G={SA,SB,R},記,則必有μ+ν≤0證明:,易見(jiàn)μ為A的最小贏得,ν為B的最小贏得,由于G是零和對(duì)策,故μ+ν≤0必成立。定理8.2
零和對(duì)策G具有穩(wěn)定解的充要條件為μ+ν=0。
證明:
(充分性)由μ和ν的定義可知,存在一行(例如p行)μ為p行中的最小元素且存在一列(例如q列),-ν為q列中的最大元素。故有apq≥μ且apq≤-ν又因μ+ν=0,所以μ=-ν,從而得出apq=μ,apq為贏得矩陣的鞍點(diǎn),(p,q)為G的穩(wěn)定解。
定理8.1設(shè)G={SA,SB,R},記17(必要性)若G具有穩(wěn)定解(p,q),則apq為贏得矩陣的鞍點(diǎn)。故有
從而可得μ+ν≥0,但根據(jù)定理8.1,μ+ν≤0必成立,故必有μ+ν=0。上述定理給出了對(duì)策問(wèn)題有穩(wěn)定解(簡(jiǎn)稱為解)的充要條件。當(dāng)對(duì)策問(wèn)題有解時(shí),其解可以不唯一。例如,若
則易見(jiàn),(2,2),(2,4),(4,2),(4,4)均為此對(duì)策問(wèn)題的解。一般又可以證明。(必要性)若G具有穩(wěn)定解(p,q),則apq為18例:某單位采購(gòu)員在秋天時(shí)要決定冬天取暖用煤的采購(gòu)量。已知在正常氣溫條件下需要用煤15噸,在較暖和較冷氣溫條件下需要用煤10噸和20噸。假定冬季的煤價(jià)隨著天氣寒冷的程度而變化,在較暖、正常、較冷氣溫條件下每噸煤價(jià)為100元、150元、200元。又秋季每噸煤價(jià)為100元。在沒(méi)有關(guān)于當(dāng)年冬季氣溫情況下,秋季應(yīng)購(gòu)多少噸煤,能使總支出最少?例:某單位采購(gòu)員在秋天時(shí)要決定冬天取暖用煤的采購(gòu)量。已知在正19解:局中人I(采購(gòu)員)有三個(gè)策略:策略1:10噸,策略2:15噸,策略3:20噸。局中人II(環(huán)境):策略1較暖,策略2正常,策略3較冷現(xiàn)把該單位冬天取暖用煤全部費(fèi)用(秋季購(gòu)煤費(fèi)用與冬天不夠時(shí)再補(bǔ)購(gòu)煤費(fèi)用)作為采購(gòu)員的贏得矩陣。解:20
1231 -1000-1750-30002 -1500-1500 -25003 -2000-2000 -2000由maxminaij=
minmaxaij=a33=-2000Ijji該最優(yōu)策略為(3,
3),即秋季購(gòu)煤20噸。1221具有穩(wěn)定解的零和對(duì)策問(wèn)題是一類特別簡(jiǎn)單的對(duì)策問(wèn)題,它所對(duì)應(yīng)的贏得矩陣存在鞍點(diǎn),任一局中人都不可能通過(guò)自己?jiǎn)畏矫娴呐?lái)改進(jìn)結(jié)果。然而,在實(shí)際遇到的零和對(duì)策中更典型的是μ+ν≠0的情況。由于贏得矩陣中不存在鞍點(diǎn),至少存在一名局中人,在他單方面改變策略的情況下,有可能改善自己的收益。例如,考察(8.1)中的贏得矩陣R。若雙方都采取保守的maxmin原則。將會(huì)出現(xiàn)純局勢(shì)(4,1)或(4,3)。但如果局中人A適當(dāng)改換策略,他可以增加收入。例如,如果B采用策略1,而A改換策略1,則A可收益3。但此時(shí)若B改換策略
2,又會(huì)使A輸?shù)?,……。此時(shí),在只使用純策略的范圍內(nèi),對(duì)策問(wèn)題無(wú)解。這類決策如果只進(jìn)行一次,局中人除了碰運(yùn)氣以外別無(wú)辦法。但如果這類決策要反復(fù)進(jìn)行多次,則局中人固定采用一種策略顯然是不明智的,因?yàn)橐坏?duì)手看出你會(huì)采用什么策略,他將會(huì)選用對(duì)自己最為有利的策略。這時(shí),局中人均應(yīng)根據(jù)某種概率來(lái)選用各種策略,即采用混合策略的辦法,使自己的期望收益盡可能大。
具有穩(wěn)定解的零和對(duì)策問(wèn)題是一類特別簡(jiǎn)單的對(duì)策問(wèn)題,它所對(duì)應(yīng)的22設(shè)A方用概率xi選用策略i,B方用概率yj選用策略j,,且雙方每次選用什么策略是隨機(jī)的,不能讓對(duì)方看出規(guī)律,記X=(x1,…,xm)T,Y=(y1,…,yn)T,則A的期望贏得為E(X,Y)=XTRY其中,R為A方的贏得矩陣。記SA:策略α1,…,αmSB:策略β1,…,βn概率x1,…,xm概率y1,…,yn分別稱SA與SB為A方和B方的混合策略。對(duì)于需要使用混合策略的對(duì)策問(wèn)題,也有具有穩(wěn)定解的對(duì)策問(wèn)題的類似結(jié)果。設(shè)A方用概率xi選用策略i,B方用概率yj選用策略23定義8.2若存在m維概率向量和n維概率向量,使得對(duì)一切m維概率向量X和n維概率向量y有則稱(,)為混合策略對(duì)策問(wèn)題的鞍點(diǎn)。定理8.4(VonNeumann)任意混合策略對(duì)策問(wèn)題必存在鞍點(diǎn),即必存在概率向量和,使得:(證明從略)。使用純策略的對(duì)策問(wèn)題(具有穩(wěn)定解的對(duì)策問(wèn)題)可以看成使用混合策略的對(duì)策問(wèn)題的特殊情況,相當(dāng)于以概率1選取其中某一策略,以概率0選取其余策略。對(duì)于雙方均只有兩種策略的對(duì)策問(wèn)題(即2×2對(duì)策),可按幾何方法求解。定義8.2若存在m維概率向量和n維概率向量,使得對(duì)一切m24例8.5A、B為作戰(zhàn)雙方,A方擬派兩架轟炸機(jī)I和II去轟炸B方的指揮部,轟炸機(jī)I在前面飛行,II隨后。兩架轟炸機(jī)中只有一架帶有炸彈,而另一架僅為護(hù)航。轟炸機(jī)飛至B方上空,受到B方戰(zhàn)斗機(jī)的阻擊。若戰(zhàn)斗機(jī)阻擊后面的轟炸機(jī)II,它僅受II的射擊,被擊中的概率為0.3(I來(lái)不及返回?fù)羲H魬?zhàn)斗機(jī)阻擊I,它將同時(shí)受到兩架轟炸機(jī)的射擊,被擊中的概率為0.7。一旦戰(zhàn)斗機(jī)未被擊落,它將以0.6的概率擊毀其選中的轟炸機(jī)。請(qǐng)為A、B雙方各選擇一個(gè)最優(yōu)策略,即:對(duì)于A方應(yīng)選擇哪一架轟炸機(jī)裝載炸彈?對(duì)于B方戰(zhàn)斗機(jī)應(yīng)阻擊哪一架轟炸機(jī)?
解:雙方可選擇的策略集分別為SA={1,2},1:轟炸機(jī)I裝炸彈,II護(hù)航
2:轟炸機(jī)II裝炸彈,I護(hù)航SA={1,2},1:阻擊轟炸機(jī)I2:阻擊轟炸機(jī)II例8.5A、B為作戰(zhàn)雙方,A方擬派兩架轟炸機(jī)I和II去轟25贏得矩陣R=(aij)2×2,aij為A方采取策略
i而B方采取策略j時(shí),轟炸機(jī)轟炸B方指揮部的概率,由題意可計(jì)算出:a11=0.7+0.3(1-0.6)=0.82a12=1,a21=1a22=0.3+0.7(1-0.6)=0.58即易求得,。由于μ+ν≠0,矩陣R不存在鞍點(diǎn),應(yīng)當(dāng)求最佳混合策略。贏得矩陣R=(aij)2×2,aij為A方采取策略26現(xiàn)設(shè)A以概率x1取策略1、概率x2取策略2;B以概率y1取策略1、概率y2取策略2。先從B方來(lái)考慮問(wèn)題。B采用1時(shí),A方轟炸機(jī)攻擊指揮部的概率的期望值為E(1)=0。82x1+x2,而B采用2時(shí),A方轟炸機(jī)攻擊指揮部的概率的期望值為E(2)=x1+0.58x2。若E(1)≠E(2),不妨設(shè)E(1)<E(2),則B方必采用1以減少指揮部被轟炸的概率。故對(duì)A方選取的最佳概率x1和x2,必滿足:即由此解得x1=0.7,x2=0.3?,F(xiàn)設(shè)A以概率x1取策略1、概率x2取策略27同樣,可從A方考慮問(wèn)題,得即并解得y1=0.7,y2=0.3。B方指揮部轟炸的概率的期望值VG=0.874。上述方法也可以用幾何方式表達(dá)。在x軸上取長(zhǎng)度為1的線段,左端點(diǎn)為x=0,右端點(diǎn)為x=1。過(guò)x=0和x=1各作x軸的垂線,稱之為軸I和軸II。在軸I上取B1、B2,它們到x軸的距離分別的a11和a12,表示在A采取策略1
即(x2=0)時(shí)A方在B方分別采取策略1和2下的贏得,如圖8.1所示。同樣,可從A方考慮問(wèn)題,得即并解得y1=0.7,y2=0.328零和對(duì)策的解法矩陣對(duì)策的線性規(guī)劃法零和對(duì)策的解法29A方選擇混合策略的目的是使得其中ej為只有第j個(gè)分量為1而其余分量均為零的向量,Ej
=XTRej。記,由于,在yk=1,yj=0(j≠k)時(shí)達(dá)到最大值u,
A方選擇混合策略的目的是使得其中ej為只有第j個(gè)分30故應(yīng)為線性規(guī)劃問(wèn)題
minu
,j=1,2,…,n(即Ej≤Ek)xi≥0,i=1,2,…,mS.t的解。同理,應(yīng)為線性規(guī)劃maxν
,i=1,2,…,myj≥0,i=1,2,…,nS.t的解。故應(yīng)為線性規(guī)劃問(wèn)題minu,j=1,231
做相應(yīng)的數(shù)學(xué)處理,可將求解零和對(duì)策化為更簡(jiǎn)單的線性規(guī)劃問(wèn)題
32
(LP)
min
pipiaij1ipi0(i=1,2,…..m)(DLP)maxqjqjaij1jqj0(j=1,2,…..n)且pi=qj=1/VX=(pi
)*V(LP)minpiX=(pi33
例對(duì)給定的贏得矩陣AA,=(aij+2)01-1123A=2311-10-101312A,=例對(duì)給定的贏得矩陣AA,=34
(LP)min
(p1+p2+p3)2p1+p2+3p313p1+2p2+p31p1+3p2+2p31pi0(i=1,2,3)(LP)min(p1+p2+p3)35
(DLP)
max(q1+q2+q3)2q1+3q2+q31q1+2q2+3q313q1+q2+2q31qj0(j=1,2,3)且pi=qj=1/V(DLP)max(q1+q2+q3)36例對(duì)給定的贏得矩陣A729A=2909011例對(duì)給定的贏得矩陣A37(DLP)
max(q1+q2+q3)7q1+2q2+9q312q1+9q219q1+11q31qj0(j=1,2,3)且pi=qj=1/V(DLP)max(q1+q2+q338(DLP)max(q1+q2+q3)7q1+2q2+9q312q1+9q219q1+11q31qj0(j=1,2,3)且pi=qj=1/V(DLP)max(q1+q2+q3)39例在W城的冰箱市場(chǎng)上,以往的市場(chǎng)份額由本市生產(chǎn)的A牌冰箱占有絕大部分。本年初,一個(gè)全國(guó)知名的B牌冰箱進(jìn)入W城的市場(chǎng)。在這場(chǎng)競(jìng)爭(zhēng)中假設(shè)雙方考慮可采用的市場(chǎng)策略均為三種:廣告、降價(jià)、完善售后服務(wù),且雙方用于營(yíng)銷的資金相同。根據(jù)市場(chǎng)預(yù)測(cè),A的市場(chǎng)占有率為:例在W城的冰箱市場(chǎng)上,以往的市場(chǎng)份額由本市生產(chǎn)的A牌冰箱40
B廣告1降價(jià)2售后服務(wù)3廣告10.600.620.65A=降價(jià)20.750.700.72售后服務(wù)30.730.760.78試確定雙方的最優(yōu)策略。
41田忌賽馬,田忌不知齊王出馬次序,請(qǐng)問(wèn)田忌應(yīng)如何出馬田忌賽馬,田忌不知齊王出馬次序,請(qǐng)問(wèn)田忌應(yīng)如何出馬42三、非零和對(duì)策除了零和對(duì)策外,還存在著另一類對(duì)策問(wèn)題,局中人獲利之和并非常數(shù)。例8.4現(xiàn)有一對(duì)策問(wèn)題,雙方獲利情況見(jiàn)表8.5。表8.5B方A方1231234(8,2)(3,4)(1,6)(4,2)(0,9)(9,0)(6,2)(4,6)(7,3)(2,7)(8,1)(5,1)假如A、B雙方仍采取穩(wěn)妥的辦法,A發(fā)現(xiàn)如采取策略4,則至少可獲利4,而B發(fā)現(xiàn)如采取策略1,則至少可獲利2。因而,這種求穩(wěn)妥的想法將導(dǎo)至出現(xiàn)局勢(shì)(4,2)。三、非零和對(duì)策除了零和對(duì)策外,還存在著另一類對(duì)策問(wèn)題,局中人43容易看出,從整體上看,結(jié)果并不是最好的,因?yàn)殡p方的總獲利有可能達(dá)到10。不難看出,依靠單方面的努力不一定能收到良好的效果??磥?lái),對(duì)這一對(duì)策問(wèn)題,雙方最好還是握手言和,相互配合,先取得總體上的最大獲利,然后再按某一雙方均認(rèn)為較為合理的方式來(lái)分享這一已經(jīng)獲得的最大獲利。例8.4說(shuō)明,總獲利數(shù)并非常數(shù)的對(duì)策問(wèn)題(即不能轉(zhuǎn)化為零和對(duì)策的問(wèn)題),是一類存在著合作基礎(chǔ)的對(duì)策問(wèn)題。當(dāng)然,這里還存在著一個(gè)留待解決而又十分關(guān)鍵的問(wèn)題:如何分享總獲利,如果不能達(dá)到一個(gè)雙方(或各方)都能接受的“公平”的分配原則,則合作仍然不能實(shí)現(xiàn)。怎樣建立一個(gè)“公平”的分配原則是一個(gè)較為困難的問(wèn)題,將在第九章中介紹。
最后,我們來(lái)考察幾個(gè)對(duì)策問(wèn)題的實(shí)例。容易看出,從整體上看,結(jié)果并不是最好的,因?yàn)殡p方的總獲利有可44例8.6(戰(zhàn)例分析)1944年8月,美軍第一軍和英軍占領(lǐng)法國(guó)諾曼第不久,立即從海防前線穿過(guò)海峽,向Avranches進(jìn)軍。美軍第一軍和英軍的行動(dòng)直接威脅到德軍第九軍。美軍第三軍也開到了Avranches的南部,雙方軍隊(duì)所處的地理位置如圖8.2所示。美軍方面的指揮官是Bradley將軍,德軍指揮官是VonKluge將軍。VonKluge將軍面臨的問(wèn)題是或者向西進(jìn)攻,加強(qiáng)他的西部防線,切斷美軍援助;或者撤退到東部,占據(jù)塞那河流域的有利地形,并能得到德軍第十五軍的援助。Bradley將軍的問(wèn)題是如何調(diào)動(dòng)他的后備軍,后備軍駐扎在海峽南部。Bradley將軍有三種可供選擇的策略:他可以命令后備軍原地待命,當(dāng)海峽形勢(shì)危急時(shí)支援第一軍或出擊東部敵人,以減輕第一軍的壓力。雙方應(yīng)如何決策,使自己能有較大的機(jī)會(huì)贏得戰(zhàn)爭(zhēng)的勝利呢?
例8.6(戰(zhàn)例分析)1944年8月,美軍第一軍和英軍占領(lǐng)法國(guó)45我們將用建立矩陣對(duì)策模型的方法,來(lái)試圖求得雙方的最優(yōu)策略。模型假設(shè):
1、Bradley將軍和VonKluge將軍分別為對(duì)策問(wèn)題的局中人A和B。2、局中人A的策略集合為SA={1,2,3},其中:1為后備軍增援保衛(wèi)海峽;2為后備軍東征,切斷德軍后路;3為后備軍待命
3、局中人B的策略集合為SB={1,2},其中:1為德國(guó)向西進(jìn)攻海峽,切斷美軍援助;2為德軍撤退到東部,占領(lǐng)塞納河流域有利地形。4、SA、SB構(gòu)成六種純局勢(shì),綜合雙方實(shí)力,各種局勢(shì)估計(jì)結(jié)果如下。若B采取策略1,即德軍采取攻勢(shì),則有(1)(1,1),估計(jì)美軍擊敗德軍并占領(lǐng)海峽的可能性(即概率)為(2)(2,1),估計(jì)美軍取勝的可能為。德軍很可能打破美軍第一軍的防線,并切斷美軍的退路。(3)(3,1),估計(jì)美軍可以根據(jù)需要增援。如不需增援,后備軍可東進(jìn)繞行到德軍后方。這樣,美軍將占領(lǐng)海峽并徹底殲滅德軍第九軍。情況(1)、(2)、(3)如圖8.3(1)、(2)、(3)所示。我們將用建立矩陣對(duì)策模型的方法,來(lái)試圖求得雙方的最優(yōu)策略。模46若B采取策略2,即德軍第九軍東撤,占據(jù)塞納河流域有利地形,則有
(4)(1,2),美方擴(kuò)大了戰(zhàn)線,德軍雖占據(jù)了有利地形,美軍仍有擊敗德軍的可能性。(5)(2,2),美后備軍東進(jìn)給德軍東撤造成壓力并挫傷德軍,使美軍擊敗德軍的可能性增大到。(6)(3,2),美后備軍待命。在發(fā)現(xiàn)德軍撤退后,奉命向東擾亂敵方撤退,為以后殲滅德第九軍創(chuàng)造條件,估計(jì)是美軍擊敗德軍的可能性。情況(4)、(5)、(6)見(jiàn)圖8.3(4)、(5)(6)所示。若B采取策略2,即德軍第九軍東撤,占據(jù)塞納河流域有47上述分析估計(jì)是由Bradley將軍作出的,據(jù)此構(gòu)造出A方贏得矩陣這是一個(gè)3×2對(duì)策矩陣。可以求得,,,不存在穩(wěn)定解,需要考慮其他解法。上述分析估計(jì)是由Bradley將軍作出的,據(jù)此構(gòu)造出A方贏得48定義8.3對(duì)于贏得矩陣R,如果對(duì)所有j,aij≥akj均成立,且至少存在一個(gè)使得則稱i行優(yōu)于k行(策略ai優(yōu)于ak)。同樣,如對(duì)一切i有aij≤akl,且至少有一個(gè)i0使得,則稱j列優(yōu)于l例(局中人B的策略j優(yōu)于l)。易見(jiàn),若一個(gè)對(duì)策矩陣的第i行優(yōu)于第k行,則無(wú)論局中人B選擇哪種策略,局中人A采取策略i的獲利總優(yōu)于(至少不次于)采取策略k的獲利。定理8.5對(duì)于矩陣對(duì)策G={SA,SB,R},若矩陣R的某行優(yōu)于第i1,……,ik行,則局中人A在選取最優(yōu)策略時(shí),必取。令,R’為從R中劃去第i1行,…,ik行后剩下的矩陣,則的最優(yōu)策略即原對(duì)策G的最優(yōu)策略,對(duì)于R中列的最優(yōu)關(guān)系也有類似的結(jié)果。定義8.3對(duì)于贏得矩陣R,如果對(duì)所有j,aij≥akj均49利用這一定理,有時(shí)對(duì)策問(wèn)題可先進(jìn)行化簡(jiǎn),降低矩陣的階數(shù)。現(xiàn)在回過(guò)來(lái)討論美、德軍隊(duì)對(duì)策問(wèn)題。在Bradleg構(gòu)造的矩陣中容易發(fā)現(xiàn)a1j<a3j,j=1,2故3優(yōu)于1。根據(jù)上面的定理8.5,可劃去該矩陣的第一行,得到2×2贏得矩陣這仍然是一個(gè)無(wú)鞍點(diǎn)的對(duì)策矩陣。設(shè)Bradley以概率p1取策略2而以概率p2取略3,則應(yīng)有解得利用這一定理,有時(shí)對(duì)策問(wèn)題可先進(jìn)行化簡(jiǎn),降低矩陣的階數(shù)?,F(xiàn)在50類似地,設(shè)VonKluge以概率q1取策略1而以概率q2取策略2,則應(yīng)有解得。由于兩軍作戰(zhàn)并非可以反復(fù)進(jìn)行的對(duì)策問(wèn)題,看來(lái)最大的可能是美軍采取策略3而德軍采取策略2,即美方后備軍待命而德軍第九軍東撤。事實(shí)上,當(dāng)時(shí)雙方指揮官正是這樣決策的,如果真能實(shí)行,雙方勝負(fù)還難以料定。但正當(dāng)?shù)萝姷诰跑妱傞_始東撤時(shí),突然接到了希特勒的命令要他們向西進(jìn)攻,從而失去了他們有可能取得的最佳結(jié)局,走上必然滅亡的道路。VonKluge將軍指揮的德軍向西進(jìn)攻,開始時(shí)德軍占領(lǐng)了海峽,但隨之即被美軍包圍遭到了全軍復(fù)滅,VonKluge本人在失敗后自殺。
類似地,設(shè)VonKluge以概率q1取策略1而51例8.7(防坦克地雷場(chǎng)的布設(shè))實(shí)戰(zhàn)中,攻方為了增強(qiáng)攻擊力,大量使用攻擊力強(qiáng)、防御堅(jiān)固的坦克;守方為了抵御對(duì)方攻擊,需要大量殺傷敵方的有生力量,有效對(duì)策之一是布設(shè)防坦克地雷場(chǎng)。1、分析評(píng)價(jià)防坦克地雷場(chǎng)的重要指標(biāo)是戰(zhàn)斗效力,而布雷密度是基本因素之一。只要有足夠多的地雷,用較高密度的地雷場(chǎng)對(duì)付敵方進(jìn)攻總是行之有效的。但在實(shí)際戰(zhàn)斗中,地雷不太可能是足夠多的。假設(shè):(1)防坦克地雷數(shù)量有限;(2)通過(guò)偵察、分析,已知敵方可能采用1、2、…、n種進(jìn)攻策略之一;(3)通過(guò)敵情分析,確定了防御正面的寬度,并根據(jù)我方地雷數(shù)量,設(shè)計(jì)了1,2,…,m這m種布雷方案。問(wèn)采取哪一方案或什么樣的混合策略能有效擊毀敵方的坦克?例8.7(防坦克地雷場(chǎng)的布設(shè))實(shí)戰(zhàn)中,攻方為了增強(qiáng)攻52本例在過(guò)去一般是憑指揮員的作戰(zhàn)經(jīng)驗(yàn)定性決策的,現(xiàn)用矩陣對(duì)策方法進(jìn)行定量擇優(yōu)。
由于每?jī)奢v坦克之間一般要保持50米的間距,因而進(jìn)攻正面拉得很寬,如一個(gè)梯隊(duì)20輛坦克,進(jìn)攻正面約為一公里寬。因?yàn)橹挥杏邢迋€(gè)防御正面,用有限個(gè)進(jìn)攻策略來(lái)描述敵方的進(jìn)攻狀態(tài)是非常接近實(shí)際情況的。對(duì)守方來(lái)講,布雷密度通??煞殖?.5,1,1.5,2等有限個(gè)等級(jí)。按常規(guī)做法,在防御正面上一般采用同一種技術(shù)密度。為了提高殺傷率,現(xiàn)將一個(gè)防御正面劃分成幾段,各段允許采用不同密度。本例在過(guò)去一般是憑指揮員的作戰(zhàn)經(jīng)驗(yàn)定性決策的,現(xiàn)用矩陣對(duì)策方532、對(duì)策決策要用矩陣對(duì)策決策,關(guān)鍵問(wèn)題是如何列出守方的贏得矩陣。由效率評(píng)定試驗(yàn)可得出在各種布雷密度下的殺傷率表,如表8.6所示。表8.6布雷密度0.511.52殺傷率0.640.870.950.98根據(jù)上表,在確定方案后即可根據(jù)各段不同密度針對(duì)攻方的進(jìn)攻策略計(jì)算出坦克的殺傷率。為便于理解,作為實(shí)例分析下面兩種情況:2、對(duì)策決策要用矩陣對(duì)策決策,關(guān)鍵問(wèn)題是如何列出守方的贏得矩54情況1設(shè)守方只有1500個(gè)防坦克地雷,欲布設(shè)在攻方必經(jīng)的2公里攻擊正面上。攻方一個(gè)坦克梯隊(duì)的20輛坦克展開成1公里寬的陣面,但既可能從左側(cè)進(jìn)攻(策略1)也可能從右側(cè)進(jìn)攻(策略2)。守方設(shè)計(jì)了三種布雷方案1,2,3,(圖8.4),試求守方的贏得矩陣和最優(yōu)策略。圖8.4情況1設(shè)守方只有1500個(gè)防坦克地雷,欲布設(shè)在攻方必經(jīng)的55情況1求解:容易求得守方的贏得矩陣這是一個(gè)有鞍點(diǎn)的矩陣,鞍點(diǎn)為a22。守方只要按2方案布雷,則不管攻方從哪一側(cè)進(jìn)攻,總可毀傷對(duì)方47.5%的坦克。情況1求解:容易求得守方的贏得矩陣這是一個(gè)有鞍點(diǎn)的矩陣,鞍點(diǎn)56情況2攻方一梯隊(duì)20輛坦克可從左側(cè)(1)、中路(2)或右翼(3)進(jìn)攻,展開成1公里布陣。守方只有2000個(gè)防坦克地雷,初步提出三種布雷方案,如圖8.5所示,試求守方采用何種布雷方案較好。圖8.5情況2攻方一梯隊(duì)20輛坦克可從左側(cè)(1)、中路(57對(duì)情況2,可求得守方的贏得矩陣為此時(shí),矩陣A中不存在鞍點(diǎn),對(duì)策無(wú)穩(wěn)定解,應(yīng)采用混合策略??梢郧蟮?,此時(shí)守方如按照0.166:0.456:0.378的比例采取策略1,2,3布雷,平均可毀傷對(duì)方83.5%的坦克。由本例可以看出,在決策問(wèn)題中,策略的設(shè)計(jì)至關(guān)重要,它直接影響到贏得矩陣。策略的設(shè)計(jì)并沒(méi)有包含在決策問(wèn)題的求解中,事實(shí)上,僅當(dāng)策略設(shè)計(jì)完成后,即策略集合給定后,決策問(wèn)題才被給定,從而才能被求解,因而,在用對(duì)策論方法研究實(shí)際課題時(shí),應(yīng)當(dāng)特別注意策略的設(shè)計(jì)。這一部分工作既具有一定的創(chuàng)造性又在很大程度上影響到結(jié)果,對(duì)它研究也是十分有趣的。對(duì)情況2,可求得守方的贏得矩陣為此時(shí),矩陣A中不存在鞍點(diǎn),對(duì)58§8.2決策問(wèn)題人們?cè)谔幚韱?wèn)題時(shí),常常會(huì)面臨幾種可能出現(xiàn)的自然情況,同時(shí)又存在著幾種可供選擇的行動(dòng)方案。此時(shí),需要決策者根據(jù)已知信息作決策,即選擇出最佳的行動(dòng)方案,這樣的問(wèn)題稱為決策問(wèn)題。面臨的幾種自然情況叫做自然狀態(tài)或簡(jiǎn)稱狀態(tài)。狀態(tài)是客觀存在的,是不可控因素??晒┻x擇的行動(dòng)方案叫做策略,這是可控因素,選擇哪一方案由決策者決定。
§8.2決策問(wèn)題人們?cè)谔幚韱?wèn)題時(shí),常常會(huì)面臨幾種可能出現(xiàn)59不確定環(huán)境下的決策決策者面臨的決策環(huán)境由一些自然狀態(tài)組成,決策者可以采取若干決策方案,每一種決策方案在不同的自然狀態(tài)下出現(xiàn)的結(jié)果是已知的,但決策者不能預(yù)先估計(jì)各種自然狀態(tài)出現(xiàn)的概率。不確定決策的幾種準(zhǔn)則:悲觀準(zhǔn)則樂(lè)觀準(zhǔn)則等可能性準(zhǔn)則樂(lè)觀系數(shù)準(zhǔn)則后悔值準(zhǔn)則不確定環(huán)境下的決策決策者面臨的決策環(huán)境由一些60悲觀準(zhǔn)則:最壞的情況下?tīng)?zhēng)取最好的結(jié)果例1.某工廠決定投產(chǎn)一種新產(chǎn)品。投產(chǎn)以后銷售情況有好、中等、差三種可能,但廠家目前無(wú)法估計(jì)這三種情況出現(xiàn)的概率。產(chǎn)品的生產(chǎn)批量有大中小三種選擇。不同的生產(chǎn)批量在不同的市場(chǎng)銷售情況下企業(yè)的收益如下表:收益(萬(wàn)元)需求大N1需求中N2需求小N3MinMax(min)大批量(S1)500300-250-250100中批量(S2)3002008080小批量(S3)200150100100*按照這個(gè)準(zhǔn)則,最優(yōu)決策是小批量生產(chǎn)悲觀準(zhǔn)則:最壞的情況下?tīng)?zhēng)取最好的結(jié)果收益(萬(wàn)元)需求大需求中61收益(萬(wàn)元)需求大N1需求中N2需求小N3MaxMax(max)大批量(S1)500300-250500*500中批量(S2)30020080300小批量(S3)200150100200樂(lè)觀準(zhǔn)則:最好的情況下?tīng)?zhēng)取最好的結(jié)果按照這個(gè)準(zhǔn)則,最優(yōu)決策是大批量生產(chǎn)討論:你認(rèn)為悲觀和樂(lè)觀的決策準(zhǔn)則在實(shí)際決策問(wèn)題可行嗎?有那些不足?收益(萬(wàn)元)需求大需求中需求小MaxMax(max)大批量(62悲觀準(zhǔn)則和樂(lè)觀準(zhǔn)則都假定,決策環(huán)境是不確定的,而不確定的決策環(huán)境中可能出現(xiàn)的各種狀態(tài)的可能性是不可知的或不可度量的。如果這些狀態(tài)出現(xiàn)的可能性是可以度量的,決策問(wèn)題就轉(zhuǎn)變成為風(fēng)險(xiǎn)型決策。悲觀準(zhǔn)則和樂(lè)觀準(zhǔn)則都假定,決策環(huán)境是不確定的63收益(萬(wàn)元)需求大N1需求中N2需求小N3期望值最大期望值概率(pi)1/31/31/3大批量(S1)500300-250183.33193.33中批量(S2)30020080193.33*小批量(S3)200150100150.00等可能性準(zhǔn)則:假設(shè)等可能性條件下,期望值最大按照這個(gè)準(zhǔn)則,最優(yōu)決策是中批量生產(chǎn)收益(萬(wàn)元)需求大N1需求中N2需求小N3期望值最大概64樂(lè)觀系數(shù)準(zhǔn)則:樂(lè)觀系數(shù)α(0≤α≤1)收益(萬(wàn)元)需求大N1需求中N2需求小N3CVi大批量(S1)500300-250275*中批量(S2)30020080234小批量(S3)200150100170對(duì)于α=0.7 (1-α)=0.3最優(yōu)決策為大批量生產(chǎn)CV1=0.7max(500,300,-250)+0.3min(500,300,-250)=350-75=275CV2=0.7max(300,200,80)+0.3min(300,200,80)=210+24=234CV3=0.7max(200,150,100)+0.3(200,150,100)=140+30=170樂(lè)觀系數(shù)準(zhǔn)則:樂(lè)觀系數(shù)α(0≤α≤1)收益(萬(wàn)元)需求大65對(duì)于α=0.5 (1-α)=0.5收益(萬(wàn)元)需求大N1需求中N2需求小N3CVi大批量(S1)500300-250125中批量(S2)30020080190*小批量(S3)200150100150最優(yōu)決策為中批量生產(chǎn)CV1=0.5max(500,300,-250)+0.5min(500,300,-250)=250-125=125CV2=0.5max(300,200,80)+0.5min(300,200,80)=150+40=190CV3=0.5max(200,150,100)+0.5(200,150,100)=100+50=150對(duì)于α=0.5 (1-α)=0.5收益(萬(wàn)元)需求大需求66對(duì)于α=0.3 (1-α)=0.7收益(萬(wàn)元)需求大N1需求中N2需求小N3CVi大批量(S1)500300-250-25中批量(S2)30020080146*小批量(S3)200150100130最優(yōu)決策為中批量生產(chǎn)CV1=0.3max(500,300,-250)+0.7min(500,300,-250)=150-175=-25CV2=0.3max(300,200,80)+0.7min(300,200,80)=90+56=146CV3=0.3max(200,150,100)+0.7(200,150,100)=60+70=130對(duì)于α=0.3 (1-α)=0.7收益(萬(wàn)元)需求大需求67后悔值準(zhǔn)則:以最大后悔值中的最小的為最優(yōu)決策收益(萬(wàn)元)需求大N1需求中N2需求小N3大批量(S1)500300-250中批量(S2)30020080小批量(S3)200150100Max(Si,Nj)500300100收益(萬(wàn)元)需求大N1需求中N2需求小N3Max(Si,Nj)大批量(S1)00350350中批量(S2)20010020200*小批量(S3)3001500300后悔值矩陣后悔值準(zhǔn)則:收益(萬(wàn)元)需求大N1需求中N2需求小N3大批量68風(fēng)險(xiǎn)型決策最大可能決策收益(萬(wàn)元)需求大N1需求中N2需求小N3概率(pi)0.10.20.7大批量(S1)500300-250中批量(S2)30020080小批量(S3)200150100*100最大可能為需求小,按最大可能考慮,應(yīng)采用小批量生產(chǎn)。最大可能決策用于一種狀態(tài)的可能性明顯大于其它狀態(tài)時(shí),如果幾種狀態(tài)發(fā)生的概率相差不大,則不適用。決策者能預(yù)先估計(jì)決策環(huán)境中各種自然狀態(tài)出現(xiàn)的概率。風(fēng)險(xiǎn)型決策最大可能決策收益(萬(wàn)元)需求大N1需求中N2需求小69期望值決策收益(萬(wàn)元)需求大N1需求中N2需求小N3期望值概率(pi)0.10.20.7大批量(S1)500300-250-65中批量(S2)30020080126*小批量(S3)200150100120選擇期望值最大的決策為最優(yōu)決策中批量的決策為最優(yōu)決策。期望值決策收益(萬(wàn)元)需求大N1需求中N2需求小N3期望值概70例8.8在開采石油時(shí),會(huì)遇到是否在某處鉆井的問(wèn)題。盡管勘探隊(duì)已作了大量調(diào)研分析,但由于地下結(jié)構(gòu)極為復(fù)雜,仍無(wú)法準(zhǔn)確預(yù)測(cè)開采的結(jié)果,決策者可以決定鉆井,也可以決定不鉆井。設(shè)根據(jù)經(jīng)驗(yàn)和勘探資料,決策者已掌握一定的信息并列出表8.7。表8.7000不鉆井(2)
4020-30鉆井(1)
P(3)=0.3
P(2)=0.5
P(1)=0.2
(億元)高產(chǎn)油井(3)
一般(2)
無(wú)油(1)
自然狀態(tài)概率
收益方案問(wèn):決策者應(yīng)如何作出決策?例8.8在開采石油時(shí),會(huì)遇到是否在某處鉆井的問(wèn)題。盡管勘71解:由題意可以看出,決策問(wèn)題應(yīng)包含三方面信息:狀態(tài)集合Q={1,…,n}、策略集合A={1,…,m}及收益R={aij},其中aij表示如果決策者選取策略i而出現(xiàn)的狀態(tài)為j,則決策者的收益值為aij(當(dāng)aij為負(fù)值時(shí)表示損失值)。決策問(wèn)題按自然狀態(tài)的不同情況,常被分為三種類型:確定型、風(fēng)險(xiǎn)型(或隨機(jī)型)和不確定型。確定型決策是只存在一種可能自然狀態(tài)的決策問(wèn)題。這種決策問(wèn)題的結(jié)構(gòu)較為簡(jiǎn)單,決策者只需比較各種方案,確定哪一方案最優(yōu)即可。值得一提的是策略集也可以是無(wú)限集,例如,線性規(guī)劃就可行看成一個(gè)策略集是限集的確定型決策,問(wèn)題要求決策者從可行解集合(策略集)中挑選出最優(yōu)解。確定型決策的求解并非全是簡(jiǎn)單的,但由于這些問(wèn)題一般均有其自己的專門算法,本節(jié)不準(zhǔn)備再作介紹。在本節(jié)中,我們主要討論風(fēng)險(xiǎn)型與不確定型決策,并介紹它們的求解方法。解:由題意可以看出,決策問(wèn)題應(yīng)包含三方面信息:狀態(tài)集合決策問(wèn)72一、風(fēng)險(xiǎn)型決策問(wèn)題在風(fēng)險(xiǎn)型決策問(wèn)題中存在著兩種以上可能出現(xiàn)的自然狀態(tài)。決策者不知道究竟會(huì)出現(xiàn)哪一種狀態(tài),但知道各種狀態(tài)出現(xiàn)的概率有多大。例如,例8.8就是一個(gè)風(fēng)險(xiǎn)型決策問(wèn)題。對(duì)于風(fēng)險(xiǎn)型決策問(wèn)題,最常用的決策方法是期望值法,即根據(jù)各方案的期望收益或期望損失來(lái)評(píng)估各方案的優(yōu)劣并據(jù)此作出決策。如對(duì)例1,分別求出方案1(鉆井)和2(不鉆井)的期望收益值:E(1)=0.2×(-30)+0.5×20+0.3×40=16(萬(wàn)元)E(2)=0由于E(1)>E(2),選取1作為最佳策略。風(fēng)險(xiǎn)型決策也可采用期望后悔值法求解。首先,求出采取方案i而出現(xiàn)狀態(tài)j時(shí)的后悔值。一、風(fēng)險(xiǎn)型決策問(wèn)題在風(fēng)險(xiǎn)型決策問(wèn)題中存在著兩種以上可73例如,如果不鉆井,但事實(shí)上該處可開出一口高產(chǎn)井,則后悔值為40。因?yàn)殂@井可收益40萬(wàn)元,但決策者作了不鉆井的決策,未獲得本來(lái)可以獲得的40萬(wàn)元收益。然后,比較各方案的期望后悔值,選取期望后悔最小的方案作為最佳策略。在例8.8中,如采用期望后悔值法,則E(1)=6,E(2)=22,取1為最佳策略。在選取策略i而出現(xiàn)狀態(tài)j時(shí)后悔值為的理由是在出現(xiàn)狀態(tài)j情況下的最大可能收益為。定理8.6最大期望收益法與最小期望后悔值法等價(jià),即兩者選出的最佳策略相同。證明:由得故
等式(8.4)的右端項(xiàng)為一常數(shù),其左端項(xiàng)為采取策略i時(shí)期后悔值與期望收益值之和,從而,若某策略使期望收益最大,則該策略必使期望后悔值最小,定理得證。例如,如果不鉆井,但事實(shí)上該處可開出一口高產(chǎn)井,則后悔值為474對(duì)于較為復(fù)雜的決策問(wèn)題,尤其是需要作多階段決策的問(wèn)題,常采用較直觀的決策樹方法,但從本質(zhì)上講,決策樹方法仍然是一種期望值法。
例8.9某工程按正常速度施工時(shí),若無(wú)壞天氣影響可確保在30天內(nèi)按期完工。但根據(jù)天氣預(yù)報(bào),15天后天氣肯定變壞。有40%的可能會(huì)出現(xiàn)陰雨天氣而不影響工期,在50%的可能會(huì)遇到小風(fēng)暴而使工期推遲15天,另有10%的可能會(huì)遇到大風(fēng)暴而使工期推遲20天。對(duì)于可能出現(xiàn)的情況,考慮兩種方案:(1)提前緊急加班,在15天內(nèi)完成工程,實(shí)施此方案需增加開支18000元。
(2)先按正常速度施工,15天后根據(jù)實(shí)際出現(xiàn)的天氣狀況再作決策。如遇到陰雨天氣,則維持正常速度,不必支付額外費(fèi)用。如遇到小風(fēng)暴,有兩個(gè)備選方案:(i)維持正常速度施工,支付工程延期損失費(fèi)20000元。(ii)采取應(yīng)急措施。實(shí)施此應(yīng)急措施有三種可能結(jié)果:有50%可能減少誤工期1天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共24000元;有30%可能減少誤工期2天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共18000元;有20%可能減少誤工期3天,支付應(yīng)急費(fèi)用和延期損失費(fèi)共12000元。對(duì)于較為復(fù)雜的決策問(wèn)題,尤其是需要作多階段決策的問(wèn)題,常采用75如遇大風(fēng)暴,也有兩個(gè)方案可供選擇:(i)維持正常速度施工,支付工程延期損失費(fèi)50000元。(ii)采取應(yīng)急措施。實(shí)施此應(yīng)急措施也有三種可能結(jié)果:有70%可能減少誤工期2天,支付應(yīng)急費(fèi)及誤工費(fèi)共54000元;有20%可能減少誤工期3天,支付應(yīng)急費(fèi)及誤工費(fèi)共46000元;有10%可能減少誤工期4天,支付應(yīng)急費(fèi)和誤工費(fèi)共38000元。根據(jù)上述情況,試作出最佳決策使支付的額外費(fèi)用最少。解:由于未來(lái)的天氣狀態(tài)未知,但各種天氣狀況出現(xiàn)的概率已知,本例是一個(gè)風(fēng)險(xiǎn)型決策問(wèn)題,所謂的額外費(fèi)用應(yīng)理解為期望值。
本例要求作多次決策,工程初期應(yīng)決定是按正常速度施工還是提前緊急加班。如按正常速度施工,則15天后還需根據(jù)天氣狀況再作一次決策,以決定是否采取應(yīng)急措施,故本例為多階段(兩階段)決策問(wèn)題。為便于分析和決策,采用決策樹方法。根據(jù)題意,作決策樹如圖8.6如遇大風(fēng)暴,也有兩個(gè)方案可供選擇:(i)維持正常速度施工,支76圖8.6中,□表示決策點(diǎn),從它分出的分枝稱為方案分枝,分枝的數(shù)目就是方案的個(gè)數(shù)。○表示機(jī)會(huì)節(jié)點(diǎn),從它分出的分枝稱為概率分枝,一條概率分枝對(duì)應(yīng)一條自然狀態(tài)并標(biāo)有相應(yīng)的發(fā)生概率。△稱為未梢節(jié)點(diǎn),右邊的數(shù)字表示相應(yīng)的收益值或損失值。圖8.6中,□表示決策點(diǎn),從它分出的分枝稱為方案分枝,分枝的77在決策樹上由右向左計(jì)算各機(jī)會(huì)節(jié)點(diǎn)處的期望值,并將結(jié)果標(biāo)在節(jié)點(diǎn)旁。遇到?jīng)Q策點(diǎn)則比較各方案分枝的效益期望值以決定方案的優(yōu)劣,并且用雙線劃去淘汰掉的方案分枝,在決策點(diǎn)旁標(biāo)上最佳方案的效益期望值,計(jì)算步驟如下:(1)在機(jī)會(huì)節(jié)點(diǎn)E、F處計(jì)算它們的效益期望值E(E)=0.5×(-24000)+0.3×(-18000)+0.2×(-12000)=-19800E(F)=0.7×(-54000)+0.2×(-46000)+0.1×(-38000)=-50800(2)在第一級(jí)決策點(diǎn)C、D處進(jìn)行比較,在C點(diǎn)處劃去正常速度分枝,在D處劃去應(yīng)急分枝。
(3)計(jì)算第二級(jí)機(jī)會(huì)節(jié)點(diǎn)B處的效益期望值E(B)=0.4×0+0.5×(-19800)+0.1×(-50000)=-14900并將-14900標(biāo)在B點(diǎn)旁。在決策樹上由右向左計(jì)算各機(jī)會(huì)節(jié)點(diǎn)處的期望值,并將結(jié)果標(biāo)在節(jié)點(diǎn)78(4)在第二級(jí)決策點(diǎn)A處進(jìn)行方案比較,劃去提前緊急加班,將-14900標(biāo)在A點(diǎn)旁。
結(jié)論最佳決策為前15天按正常速度施工,15天后按實(shí)際出現(xiàn)的天氣狀況再作決定。如出現(xiàn)陰雨天氣,仍維持正常速度施工;如出現(xiàn)小風(fēng)暴,則采取應(yīng)急措施;如出現(xiàn)大風(fēng)暴,也按正常速度施工,整個(gè)方案總損失的期望值為-14900元。
根據(jù)期望值大小決策是隨機(jī)型決策問(wèn)題最常用的辦法之一。實(shí)際應(yīng)用時(shí)應(yīng)根據(jù)具體情況作出分析,選取期望收益最大或期望損失最小的方案。(4)在第二級(jí)決策點(diǎn)A處進(jìn)行方案比較,劃去提前緊急加班,將-79二、不確定型決策問(wèn)題只知道有幾種可能自然狀態(tài)發(fā)生,但各種自然狀態(tài)發(fā)生的概率未知的決策問(wèn)題稱為不確定型決策問(wèn)題,由于概率未知,期望值方法不能用于這類決策問(wèn)題。下面結(jié)合一個(gè)例子,介紹幾種處理這類問(wèn)題的方法。例8.10設(shè)存在五種可能的自然狀態(tài),其發(fā)生的概率未知。有四種可供選擇的行動(dòng)方案,相應(yīng)的收益值見(jiàn)表8.7表8.866653415964387543266544154321自然狀態(tài)方案二、不確定型決策問(wèn)題只知道有幾種可能自然狀態(tài)發(fā)生,但各種自然80(1)樂(lè)觀法(maxmax原則)
采用樂(lè)觀法時(shí),決策者意在追求最大可能收益。他先計(jì)算每一方案的最大收益值,再比較找出其中的最大者,并采取這一使最大收益最大的方案,在例8.10中,maxa1j=6,maxa2j=8,maxa3j=9,maxa4j=6,而max{6,8,9,6}=9,采取方案3。(2)悲觀法(maxmin原則)采用悲觀法時(shí),決策者意在安全保險(xiǎn)。他先求每一方案的最小收益,再比較找出其中的最大者,并采取這一使最小收益值最大化的方案。對(duì)于例8.10,mina1j=4,mina2j=3,mina3j=1,mina4j=3。因?yàn)閙ax{4,3,1,3}=4,采取方案1。(3)樂(lè)觀系數(shù)法(Hurwicz決策準(zhǔn)則)樂(lè)觀系數(shù)法采用折中的辦法,引入一個(gè)參數(shù)t,0≤t≤1,稱t為樂(lè)觀系數(shù)。作決策時(shí),決策者先適當(dāng)選取一個(gè)t的值;再對(duì)各方案1求出;最后再作比較,找出使最大的方案。在例8.10中,若取t=0.5,采用樂(lè)觀系數(shù)法決策,將選取方案2。易見(jiàn),t=1對(duì)應(yīng)樂(lè)觀法,而t=0則對(duì)應(yīng)于悲觀法。(1)樂(lè)觀法(maxmax原則)采用樂(lè)觀法時(shí),81(4)等可能法(Laplace準(zhǔn)則)由于不能估計(jì)各狀態(tài)出現(xiàn)的概率,決策者認(rèn)為它們相差不會(huì)過(guò)大。此時(shí),決策者采用將各狀態(tài)的概率取成相同值的辦法把問(wèn)題轉(zhuǎn)化為風(fēng)險(xiǎn)型,并借用風(fēng)險(xiǎn)型問(wèn)題的期望值法來(lái)決策。對(duì)于例8.10,如取各狀態(tài)出現(xiàn)的概率均為0.2,用期望值法決策,將選取策略2。不難看出,對(duì)于不確定型決策問(wèn)題,不論采用什么方法決策,最終采用的策略都不能稱為最佳策略。事實(shí)上,采取什么方法決策與決策者的心理狀態(tài)有關(guān)。而且,即使對(duì)同一決策者,在處理不同決策問(wèn)題時(shí)也可能采取不同的方法。例如,在決定購(gòu)買幾元錢一張的對(duì)獎(jiǎng)券時(shí),決策者也許會(huì)采用樂(lè)觀法。因?yàn)閹自X的損失對(duì)他來(lái)講是無(wú)所謂的事,小額獎(jiǎng)金他也許看不上眼,要中就來(lái)個(gè)大獎(jiǎng)。但是,在決策購(gòu)買何種股票時(shí),因?yàn)殛P(guān)系重大,也許他為了保險(xiǎn)又會(huì)采取悲觀法。同而,不確定型問(wèn)題的決策充其量只能算是在決策者某種心理狀態(tài)下的選優(yōu)。要作出較符合實(shí)際情況的決策,還需決策者多作些調(diào)查研究,以便對(duì)未來(lái)自然狀態(tài)的出現(xiàn)作出較符合客觀實(shí)際的預(yù)測(cè),才能收到較好的效果。(4)等可能法(Laplace準(zhǔn)則)由于不能估計(jì)各狀態(tài)出現(xiàn)82例8.11(離散報(bào)童模型)設(shè)某商品的需求量θ為離散變量,其取值范圍為Q={1,…,n},取值i的概率為P(i),=1。記該商品的進(jìn)貨量為(決策變量),若>,進(jìn)貨過(guò)量,每單位進(jìn)貨過(guò)剩將造成k0元過(guò)量損失;反之,若<,進(jìn)貨不足,每單位進(jìn)貨不足將造成ku元的不足損失。試確定該商品的最佳進(jìn)貨量。解:當(dāng)≥時(shí),將有過(guò)量損失k0(-);當(dāng)<時(shí),將有不足損失ku(-)。故總期望損失為若*為最優(yōu)進(jìn)貨量,則必有且
由此經(jīng)平凡的計(jì)算可以得出:最佳進(jìn)貨量*應(yīng)使成立(推導(dǎo)過(guò)程從略)。例8.11(離散報(bào)童模型)設(shè)某商品的需求量θ為離散變量,其取83例8.12
某燒雞店每賣出一只燒雞可賺5元,如出現(xiàn)過(guò)剩將于下午5點(diǎn)另作處理,每剩一只將損失2.5元。該店根據(jù)平時(shí)銷售情況列出下表,試根據(jù)表8.9中提供的信息確定制作燒雞的最佳數(shù)量并求該店銷售燒雞的最佳平均利潤(rùn)。表8.90.10.180.20.220.20.1概率P()
302928272625需求量
解:根據(jù)題意,單位過(guò)剩損失k0=2.5,單位不足損失ku=5,。
因?yàn)椋?/p>
但。故燒雞的最佳制作量為28只。
最佳平均利潤(rùn)為
(元)
例8.12某燒雞店每賣出一只燒雞可賺5元,如出現(xiàn)過(guò)剩將于84有一個(gè)風(fēng)險(xiǎn)投資的機(jī)會(huì),成功和失敗的概率都是0.5。投資1元,如果成功可以得到1.6元的利潤(rùn),即資本成為2.6元。如果失敗,則損失1元,即資本成為0。開始的資本為100萬(wàn)元。投資的次數(shù)和每次投資額不限。為了不至于把錢輸光,投資者采取如下的策略:每次總是將資本的一半去投資。問(wèn)題:這項(xiàng)投資的結(jié)局如何,是一本萬(wàn)利,還是一貧如洗?問(wèn)題1:風(fēng)險(xiǎn)決策的一個(gè)討論題有一個(gè)風(fēng)險(xiǎn)投資的機(jī)會(huì),成功和失敗的概率都是0.5。投資1元,851(訂貨計(jì)劃)某廠制造和銷售一種新儀器,需要外購(gòu)一種配件。現(xiàn)有三個(gè)廠生產(chǎn)這種配件,牌號(hào)為A,B,C。A配件每只10元,但有次品,裝配的儀器也是次品,每臺(tái)損失100元;B配件每只55元,也有次品,但裝配的儀器出售后可在保修期內(nèi)稍加修理就能使用,修理費(fèi)55元;C配件每只118元,沒(méi)有次品;問(wèn)該廠應(yīng)如何購(gòu)置各種配件,使總費(fèi)用(包括損失費(fèi)和修理費(fèi))最少?對(duì)策問(wèn)題習(xí)題1(訂貨計(jì)劃)某廠制造和銷售一種新儀器,需要外購(gòu)一種配件?,F(xiàn)862(費(fèi)用分?jǐn)倖?wèn)題)假設(shè)沿某河流有相鄰的三個(gè)城市:A,B,C。各城市都想建立自來(lái)水廠解決用水問(wèn)題。各城市可單獨(dú)建立自來(lái)水廠,也可以合作建一個(gè)大水廠,再用管道送到各城市。經(jīng)估計(jì),合作建一個(gè)大水廠比單獨(dú)建三個(gè)自來(lái)水廠的總費(fèi)用少。三個(gè)城市有意合作,但是否實(shí)施,看總費(fèi)用的分?jǐn)偸欠窈侠?。?wèn)題是如何合理分?jǐn)傎M(fèi)用,使合作建立大水廠的方案得以實(shí)現(xiàn)。2(費(fèi)用分?jǐn)倖?wèn)題)假設(shè)沿某河流有相鄰的三個(gè)城市:A,B,C。873(拍賣問(wèn)題)拍賣形式是先由拍賣商對(duì)拍賣品描述一番,然后提出第一個(gè)報(bào)價(jià)。接下來(lái)由買者報(bào)價(jià),每一次都比前次高,最后誰(shuí)出的價(jià)格高拍賣品即歸誰(shuí)所有。假設(shè)報(bào)價(jià)為p1,p2…pn-1,pn,設(shè)p1<p2<
…<pn-1<pn.買主只要略高于pn-1就能買到。問(wèn)題是,各買主之間可能知道他人的估價(jià),也可能不知道他人的估價(jià),每人應(yīng)如何報(bào)價(jià)對(duì)自己能以較低的價(jià)格得到拍賣品最為有利?3(拍賣問(wèn)題)拍賣形式是先由拍賣商對(duì)拍賣品描述一番,然后提出884(囚犯難題)設(shè)有兩個(gè)嫌疑犯被警察拘留,警察分別對(duì)兩人進(jìn)行審訊。根據(jù)法律,如果兩人都承認(rèn)此案是他們干的,則每人各判刑7年;如果兩人都不承認(rèn),則由于證據(jù)不足,兩人各判刑1年;如果只有一人承認(rèn),則承認(rèn)者以寬大處理,當(dāng)場(chǎng)釋放,而不承認(rèn)者判刑9年。因此,對(duì)兩個(gè)囚犯來(lái)說(shuō),面臨著一個(gè)“承認(rèn)”和“不承認(rèn)”之間兩個(gè)策略的選擇的難題。4(囚犯難題)設(shè)有兩個(gè)嫌疑犯被警察拘留,警察分別對(duì)兩人進(jìn)行審89案例:俾斯麥海的??諏?duì)抗
1943年2月,第二次世界大戰(zhàn)中的日本,在太平洋戰(zhàn)區(qū)已經(jīng)處于劣勢(shì)。為扭轉(zhuǎn)局勢(shì),日本統(tǒng)帥山本五十六大將統(tǒng)率下的一支艦隊(duì)策劃了一次軍事行動(dòng):由集結(jié)地——南太平洋的新不列顛群島的蠟包爾出發(fā),穿過(guò)俾斯麥海,開往新幾內(nèi)亞的萊城,支援困守在那里的日軍。現(xiàn)代企業(yè)決策管理問(wèn)題90
當(dāng)盟軍獲悉此情報(bào)后,盟軍統(tǒng)帥麥克阿梭命令太平洋戰(zhàn)區(qū)空軍司令肯尼將軍組織空中打擊。日本統(tǒng)帥山本五十六大將心里很明白:在日本艦隊(duì)穿過(guò)俾斯麥海的三天航行中,不可能躲開盟軍的空中打擊,他要策劃的是盡可能減少損失。日美雙方的指揮官及參謀人員都進(jìn)行了冷靜的思考與全面的謀劃。當(dāng)盟軍獲悉此情報(bào)后,盟軍統(tǒng)帥麥克阿梭命令太平91
自然條件對(duì)于雙方都是已知的。基本情況如下:從蠟包爾出發(fā)開往萊城的海上航線有南北兩條。通過(guò)時(shí)間均為3天。氣象預(yù)報(bào)表明:未來(lái)3天中,北線陰雨,能見(jiàn)度差;而南線天氣晴好,能見(jiàn)度好??夏釋④姷霓Z炸機(jī)布置在南線的機(jī)場(chǎng),偵察機(jī)全天候進(jìn)行偵察,但有一定的搜索半徑。自然條件對(duì)于雙方都是已知的。基本情況如下:92
經(jīng)測(cè)算,雙方均可得到如下估計(jì):局勢(shì)1:
盟軍的偵察機(jī)重點(diǎn)搜索北線,日本艦隊(duì)也恰好走北線。由于氣候惡劣,能見(jiàn)度差,盟軍
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆山東德州一中物理高一第一學(xué)期期中考試模擬試題含解析
- 浙江省五校2025屆物理高三上期中聯(lián)考試題含解析
- GB/T 44574-2024建筑排水管道系統(tǒng)防污染用塑料止回閥
- 2024年樓宇監(jiān)控系統(tǒng)項(xiàng)目提案報(bào)告模范
- 2024年防靜電手套項(xiàng)目提案報(bào)告模范
- 2024年小區(qū)套房裝修合同書
- 常年知識(shí)產(chǎn)權(quán)顧問(wèn)合同協(xié)議
- 建筑項(xiàng)目貸款合同范例
- 標(biāo)準(zhǔn)版工程居間合同書
- 房產(chǎn)贈(zèng)與中限制競(jìng)爭(zhēng)的條款
- 初中數(shù)學(xué)北師大七年級(jí)上冊(cè)(2023年修訂) 一元一次方程分段計(jì)費(fèi)問(wèn)題教案
- 東華大學(xué)學(xué)生手冊(cè)題庫(kù)
- 羅伊護(hù)理個(gè)案模板
- 新人教PEP版六年級(jí)上冊(cè)英語(yǔ) Unit 4 Part A1 教學(xué)課件
- (新版)護(hù)士資格-第3章 消化系統(tǒng)疾病病人的護(hù)理-考試題庫(kù)
- 汽車美容店股東合伙協(xié)議書
- 1.繪畫的多元化 (3)
- Q∕GDW 12108-2021 電力物聯(lián)網(wǎng)全場(chǎng)景安全技術(shù)要求
- 醫(yī)院醫(yī)療精神科危險(xiǎn)物品管理PPT課件講義
- AECOPD病例分享
- (完整版)電線電纜載流量表
評(píng)論
0/150
提交評(píng)論