04博弈論-混合策略與隨機行動_第1頁
04博弈論-混合策略與隨機行動_第2頁
04博弈論-混合策略與隨機行動_第3頁
04博弈論-混合策略與隨機行動_第4頁
04博弈論-混合策略與隨機行動_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、混合策略與隨機行動賽場點球射門攻方的策略是:攻左邊,或攻右邊守方的策略是:守左邊,或守右邊(以守方的方向為準)守左邊右邊攻左邊58,4295,5右邊93,770,30混合策略提出 得益:進球得分的百分比。根據(jù)1995-2000年間意大利、西班牙和英國最高聯(lián)盟的數(shù)據(jù) 就一次游戲而言,猜測對方的策略,保密自己的策略。在多次反復游戲中,避免任何的傾向性和規(guī)律性。嚴格競爭博弈 零和博弈實驗辦法是將行動隨機化。 混合策略: 參與人在每一個給定信息的情況下以某種概率分布隨機地選擇不同的行動。 例如:乒乓球員以60的概率選擇正手發(fā)球,40的概率選擇反手發(fā)球。 什么是純策略?混合策略如果你是踢球人,這兩個純策

2、略中你更喜歡哪一種?(70)你能不能做得更好? 混合策略(1)以50:50(拋硬幣)的比例隨機地選擇左邊或右邊。如果守門員選擇左邊,你混合策略成功的概率:*58%+ * 93%= 75.5%如果守門員選擇右邊,你混合策略成功的概率:*95%+ * 70%= 82.5%50:50是你最佳混合策略嗎? 混合策略(2)以40:60(在你的口袋里放一本書,如果頁眉最后一位數(shù)是1到4選左,0到5則選右)的比例隨機地選擇左邊或右邊。如果守門員選擇左邊,你混合策略成功的概率:0.4*58%+ 0.6* 93%= 79%如果守門員選擇右邊,你混合策略成功的概率:0.4*95%+ 0.6* 70%= 80%你的

3、連續(xù)更優(yōu)的混合策略比例就是如何使自己在守門員選擇左邊時和選擇右邊的成功概率差距縮小。58701275.5% 82.5%7.379% 80%1xy0 混合策略不管守門員選擇他的左邊還是右邊,你的最佳混合比例都會使你得到相等的成功率 混合策略(3)以x:1x的比例隨機地選擇左邊或右邊。如果守門員選擇左邊,你混合策略成功的概率:x*58%+ (1x)* 93%如果守門員選擇右邊,你混合策略成功的概率:x*95%+ (1x) * 70%兩者相等,求得選x0.383不管守門員選擇他的左邊還是右邊,你的最佳混合比例都會使你得到相等的成功率 混合策略(4)以0.383:0.617的比例隨機地選擇左邊或右邊。

4、如果守門員選擇左邊,你混合策略成功的概率:0.383*58%+ 0.617* 93%79.6如果守門員選擇右邊,你混合策略成功的概率:0.383*95%+ 0.617 * 70% 79.6那么守門員的策略怎樣?混合策略納什均衡? 混合策略守門員的最佳策略是使踢球者選擇左邊和選擇右邊的成功率相等的策略。守門員應當分別以41.7和58.3的比例選擇自己的左邊和右邊,使踢球者成功的概率為79.6%.法則 混合策略在純沖突博弈(零和博弈)中,如果讓你的對手事先看清楚你的真實選擇對你不利,那么你可以通過隨機選擇自己備選的純策略而獲益。你的混合比例應該是這樣的:對手采取任何特定的備選純策略,都不可能利用你

5、的選擇,即,當你以混合策略對付他的混合策略中任一純策略時,你得到的平均贏利都相等。實驗拋硬幣 怎樣隨機行動?拋硬幣翻出正面之后再拋一次,這時出正面的可能性與拋出反面的可能性相等。無規(guī)律的隨機行動(點名4/18=22%,不點名78)。例如:一個秘密的、足夠復雜以致讓人難以破解的規(guī)則。舉例:秘密報案(reporting a crime)n個人目睹一樁罪行,每個人都希望報警,但是都傾向于其他人打電話。特別的,假定能從報警中得到v單位的收益,而打電話的人需要付出c單位的成本,vc0。分析這個問題的純戰(zhàn)略NE和混合戰(zhàn)略NE?;旌喜呗园咐治觯簠⑴c人:n個每個參與人的戰(zhàn)略集:打電話,不打電話效用:沒有任何

6、人打,所有人0支付; 打,v-c; 不打,但其他人至少有一個人打,v混合策略案例純戰(zhàn)略NE當只有兩個參與人的時候(公共產品提供的斗雞博弈)兩個NEn個人的時候: 假設有m個人提供,m1 or m=1 n個NE混合策略案例混合策略案例混合戰(zhàn)略NE 隨著人數(shù)n的增加,p減小,即人越多,每個人選擇報案的概率就會越小,如果n1,則p1社會心理學與博弈分析混合策略案例 小孩玩的游戲“石頭,剪子,布”,也是一種博弈。但是,這個博弈有一種有趣的特征,即給定一方的任何選擇,另一方都有制勝對方的戰(zhàn)略,所以,給定一方任何一個戰(zhàn)略,對方都有制勝這個戰(zhàn)略的戰(zhàn)略,因而這個戰(zhàn)略不是最優(yōu)的。任何“純戰(zhàn)略”都不是最優(yōu)的,純戰(zhàn)

7、略是“石頭,剪子,布”中的任何一個。 但是,我們知道,玩這個游戲是總是以對方不易猜出的隨機方式出招。事實上,可以通過數(shù)學證明,當雙方都以每個戰(zhàn)略按1/3的概率出招時,達成一種雙方都不愿改變這種概率分布的局面。這被稱為“混合戰(zhàn)略納什均衡”,而這種以隨機方式選擇純戰(zhàn)略的博弈被稱為“混合戰(zhàn)略博弈”。 實驗顯示:“陷入無意識但仍可預測的模式”例如:官僚作風連續(xù)出“布” 雪崩連續(xù)出石頭 排除策略省略一個隨機:秘密的,足夠復雜以至難以讓人破解的規(guī)則 例子1 田忌賽馬新編 春秋戰(zhàn)國時期,齊威王常與旗下大將田忌賽馬。規(guī)則是:每次賽三局,每一局齊威王與田忌各出一匹馬比賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田

8、忌有上、中、下三匹馬,而齊威王也有上、中、下三匹馬。每次比賽,第一局田忌出上馬,齊威王也出上馬;第二局田忌出中馬,齊威王也出中馬;第三局,田忌出下馬,齊威王也出下馬。齊威王的上馬比田忌的上馬好,齊威王的中馬也比田忌的中馬好,齊威王的下馬還是比田忌的下馬好。于是,每次比賽的結果都是田忌連輸三局。 田忌的謀士孫臏了解了田忌的困境后,就打聽到這樣一個消息:盡管齊威王的上、中、下三匹馬都要比田忌的對應上、中、下三匹馬好,但碰巧的是田忌的上馬可勝齊威王的中馬,田忌的中馬可勝齊威王的下馬。于是,孫臏為田忌獻計:下一次比賽中第一局時田忌出下馬對齊威王的上馬輸一局,第二局田忌出上馬對齊威王的中馬,第三局田忌出

9、中馬對齊威王的下馬,這樣可連贏兩局,最后凈勝一千斤銅。田忌依計而行,果真贏回一千斤銅。 這個故事曾經被很多人當作博弈論的例子來演繹,但實際上這個故事與博弈論無關。博弈論會假定所有局中人都是理性的,不能假定一些局中人聰明而另一些局中人卻是傻子。當田忌出下馬時,齊威王最好的選擇是出下馬而不是上馬。孫臏的計謀中假定齊威王是傻子,當田忌出下、上、中馬時,他仍然按上、中、下馬出,當然要輸了。事實上,當田忌出下馬時,齊威王應出下馬,但齊威王出下馬時,田忌不應出下馬而是出中馬,但此時齊威王又應出中馬而不是下馬了,。這樣,博弈不會有純戰(zhàn)略的均衡。 兩人只能玩混合戰(zhàn)略博弈,齊威王分別以1/6隨機的概率選擇出上、

10、中、下馬的任一排列,田忌也如此。由于齊威王存在絕對優(yōu)勢,他平均看來仍然會贏田忌一千斤銅。 例子2 如果曹操與諸葛亮一樣聰明:三國演義中的華容道博弈 在三國演義中,曹操在赤壁大戰(zhàn)中一敗涂地,率殘兵敗將向許都方向逃竄。諸葛亮命關羽率兵在途中阻截曹軍。當時,第一批攔截大軍是趙云率領的,第二批攔截大軍是張飛帶隊的,第三批才是關羽率部伏擊。由于曹軍兵多將廣,前二批伏擊軍不能逮住曹操,只是搶劫一些軍械馬匹之類。 待曹軍沖過趙云、張飛兩道關后,進入關羽的伏擊地帶。但是,當時關羽與曹操相遇的地方有兩條道,一條是華容道,除此外還有另一條道。諸葛亮令關羽伏兵于華容道,并且要求關羽在華容道上點燃樹枝冒出煙霧引曹操到

11、來。當時關羽不解,問諸葛亮,“如果在伏兵之處點火,豈不令曹兵看見而改走另一條道逃脫?”諸荀亮叫關羽不要再問,只如此照辦即可。 當曹操沖破趙云、張飛的阻截后,來到華容道前,看見華容道上靜悄悄的,但有煙火縈繞。曹操大笑道:“孔明以為我會上他的當,故意叫人在華容道上點火讓我走另一條道,而他卻伏兵于這條道上好逮住我呢!我偏不上他的當!”于是,曹操令大軍徑直上華容道上而去,結果與關羽大軍撞個正著。 曹操為何進了孔明的圈套呢?這里的道理是這樣的:孔明知道曹操是聰明人,而聰明人見華容道上有煙火會認為華容道上有伏兵,于是會避開華容道而走另一條路。如果孔明令關羽在另一條路等著,曹操就被逮住了。但是,曹操不僅聰明

12、,而且還聰明過人,他也知道孔明的如此盤算來誘他上鉤,他偏不上當,知道點火的華容道上無人,孔明的隊伍在另一條道上呢!于是他選擇走華容道。 但是,依三國演義作者羅貫中的邏輯,孔明總是比曹操計高一籌,按博弈論的術語來說,就是孔明的理性程度要比曹操高上一階??酌饕仓啦懿僦揽酌鞯拇蛩?,于是令關羽正好在點火的華容道上等著曹操。三國演義中的這個故事很可能是作者編造的,因為在三國志中并無這一情節(jié)。這里,羅貫中假設了曹操在智力上比孔明差一些,才有華容道上被關羽抓住,要不是關羽舊情難忘,曹操就死無葬身之地了。 但是,如果我們不假定曹操比孔明要笨一些,而是相反假定曹操與孔明一樣聰明,則曹操又知道孔明知道曹操知道

13、孔明的打算,曹操就會知道關羽在華容道上等著他呢?此時曹操就避開華容道走另一條路。但是,這還沒有完,因為若孔明知道曹操知道孔明知道。顯然,最終的結果是曹操與孔明玩混合戰(zhàn)略博弈,曹操隨機地以1/2的概率選擇走華容道和另一條路,孔明也以1/2的概率令關羽守華容道或另一條路。 于是,三國演義中的這一情節(jié)就應作如下改寫: 諸葛亮拋出一枚硬幣,決定關羽是守華容道呢還是另一條道,而曹操也擲出一枚硬幣,決定是走華容道呢還是走另一條路。平均看來,曹操有1/2的概率逃脫,而關羽也只有1/2的概率抓住曹操。如果說關羽在華容道上抓住了曹操,則純屬偶然、并非孔明比曹操計高一籌所致!剪刀-石頭-布爬樓梯游戲策略,石頭、剪

14、子、布布獲勝,向上爬5個臺階剪刀獲勝,向上爬2個臺階石頭獲勝,向上爬1個臺階平局,再來一遍第一個爬上樓梯的是獲勝者商業(yè)與其他對抗中的混合策略商界、政界和戰(zhàn)爭非零和博弈商業(yè)與其他對抗中的混合策略例如:折扣券博弈問題商業(yè)與其他對抗中的混合策略例1:折扣券博弈問題目的?1、都不發(fā)行2、都發(fā)行3、一個發(fā)行,另一個不發(fā)行如何占得先機?商業(yè)與其他對抗中的混合策略如何占得先機?避免他人占得先機,唯一的途徑就是保持出人意料的元素。這一元素源于隨機化策略的應用但是:獨立隨機選擇有“出錯”的危險。進行合作!商業(yè)與其他對抗中的混合策略可口可樂和百事可樂52個星期,分別發(fā)放26周優(yōu)惠券沒有出現(xiàn)兩家同時的情況計算:如果

15、兩家獨立以50概率隨機選擇任何一周發(fā)放優(yōu)惠券,那么他們各自發(fā)放26周而不會出現(xiàn)同時發(fā)放的概率是1/10005(10億的10億次方)延伸:聯(lián)合營銷麥當勞與可口可樂,肯德基與百事可樂從美國相攜走向全球,許多大的跨國企業(yè)均與知名連鎖酒店、供應商保持全球的合作體系,令人慨嘆中國的許多企業(yè)盡管軀體龐大,但在經營的思想和理念上與它們相去甚遠。 辜鴻銘曾用西文出版過一本書,書名為中國人的精神,其中將中國人的民族性格歸結為三大特征:“deep, bright, simple”,譯成中文是“深沉、聰明、淳樸”。 延伸:聯(lián)合營銷深沉就是含而不露,靜水流深,但這種性格與聯(lián)盟的陽光與規(guī)則的透明背道而馳。聰明更多是為人

16、為事的創(chuàng)造力與洞察,但似乎缺少更大氣的哲學和價值觀思考,這樣也不利于建立通用的制度規(guī)則,大家思考的更多是彼此之間的利益而非聯(lián)盟共事致力追求的長遠目標這也是戰(zhàn)國時期秦國以連橫成功打破六國合縱政策的原因所在。 例2:飛機折扣票博弈航空公司告訴你折扣,不告訴你剩余的空位你隨機選擇時點進行訂票V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷混合戰(zhàn)略:守衛(wèi)以n概率選擇睡覺,以1m的概率選擇不睡小偷以m概率選擇偷,以1n概率選擇不偷例4 監(jiān)督博弈加重對守衛(wèi)的處罰:短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概率0- D- D守衛(wèi)得益(睡)S小偷偷的概率1激勵悖論Sm加重對小偷

17、的處罰:短期內能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會使得守衛(wèi)更多的偷懶0- P- P小偷得益(偷)V守衛(wèi)睡的概率1n激勵悖論 例5 為什么一般人總是小錯不斷,大錯不犯;偷稅漏稅的一般是中小企業(yè),大企業(yè)會老老實實地交稅? 稅務部門不會對所有企業(yè)的交稅情況每一次都去檢查,因為這樣做的成本太高,得不償失。所以,稅務部門總是隨機地對企業(yè)的交稅情況進行檢查。 企業(yè)也是隨機地在交稅與偷漏稅之間進行選擇。稅收部門與企業(yè)間進行的是混合戰(zhàn)略博弈。因為如果企業(yè)總是交稅,稅務部門就最好不檢查;但給定不檢查,企業(yè)就會偷漏稅。所以,兩者只有在隨機地檢查與不檢查,企業(yè)隨機地在偷漏稅與交稅之間選擇,才會達成均衡。

18、對于大企業(yè),因一旦偷稅就數(shù)目巨大,所以,稅務部門在隨機檢查時放在大企業(yè)上的可能性就大一些;而給定稅務部門檢查大企業(yè)的可能性較大,大企業(yè)偷漏稅的行為就較少,否則就容易被逮個正著。所以,偷漏稅較多的就是一些中小企業(yè),大企業(yè)納稅的積極性較高。同樣,大人物或有錢人納稅的積極性應較高,至于我國在過去一段時期有錢人反而不交稅的現(xiàn)象主要源于制度不健全或已有的制度得不到貫徹所致。同樣的道理,在犯罪或對錯誤的監(jiān)督懲罰博弈中,也是混合博弈,人們可能總是大錯不犯小錯不斷。9、靜夜四無鄰,荒居舊業(yè)貧。2022/9/92022/9/9Friday, September 9, 202210、雨中黃葉樹,燈下白頭人。202

19、2/9/92022/9/92022/9/99/9/2022 2:07:19 PM11、以我獨沈久,愧君相見頻。2022/9/92022/9/92022/9/9Sep-2209-Sep-2212、故人江海別,幾度隔山川。2022/9/92022/9/92022/9/9Friday, September 9, 202213、乍見翻疑夢,相悲各問年。2022/9/92022/9/92022/9/92022/9/99/9/202214、他鄉(xiāng)生白發(fā),舊國見青山。09 九月 20222022/9/92022/9/92022/9/915、比不了得就不比,得不到的就不要。九月 222022/9/92022/9

20、/92022/9/99/9/202216、行動出成果,工作出財富。2022/9/92022/9/909 September 202217、做前,能夠環(huán)視四周;做時,你只能或者最好沿著以腳為起點的射線向前。2022/9/92022/9/92022/9/92022/9/99、沒有失敗,只有暫時停止成功!。2022/9/92022/9/9Friday, September 9, 202210、很多事情努力了未必有結果,但是不努力卻什么改變也沒有。2022/9/92022/9/92022/9/99/9/2022 2:07:19 PM11、成功就是日復一日那一點點小小努力的積累。2022/9/92022

21、/9/92022/9/9Sep-2209-Sep-2212、世間成事,不求其絕對圓滿,留一份不足,可得無限完美。2022/9/92022/9/92022/9/9Friday, September 9, 202213、不知香積寺,數(shù)里入云峰。2022/9/92022/9/92022/9/92022/9/99/9/202214、意志堅強的人能把世界放在手中像泥塊一樣任意揉捏。09 九月 20222022/9/92022/9/92022/9/915、楚塞三湘接,荊門九派通。九月 222022/9/92022/9/92022/9/99/9/202216、少年十五二十時,步行奪得胡馬騎。2022/9/9

22、2022/9/909 September 202217、空山新雨后,天氣晚來秋。2022/9/92022/9/92022/9/92022/9/99、楊柳散和風,青山澹吾慮。2022/9/92022/9/9Friday, September 9, 202210、閱讀一切好書如同和過去最杰出的人談話。2022/9/92022/9/92022/9/99/9/2022 2:07:19 PM11、越是沒有本領的就越加自命不凡。2022/9/92022/9/92022/9/9Sep-2209-Sep-2212、越是無能的人,越喜歡挑剔別人的錯兒。2022/9/92022/9/92022/9/9Friday, September 9, 202213、知人者智,自知者明。勝人者有力,自勝者強。2022/9/92022/9/92022/9/92022/9/99/9/202214、意志堅強的人能把世界放在手中像泥塊

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論