八、警察與小偷博弈_第1頁
八、警察與小偷博弈_第2頁
八、警察與小偷博弈_第3頁
八、警察與小偷博弈_第4頁
八、警察與小偷博弈_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、小偷和警察游戲,不按常規(guī)出牌,與8.1警察小偷的游戲,一個小村莊只有一名警察,他負(fù)責(zé)整個村莊的治安。(威廉莎士比亞,哈姆雷特,戰(zhàn)爭)現(xiàn)在,我們假設(shè)村子的一端是酒吧,另一端是銀行。并且假設(shè)那塊地上只有一個小偷。因?yàn)榉稚聿蛔愕氖中g(shù),警察一次只能在一個地方巡邏。小偷也只能去一個地方。8.1與警察小偷的游戲,銀行要保護(hù)的財(cái)產(chǎn)價錢2萬韓元,酒吧的財(cái)產(chǎn)價錢1萬韓元。警察巡邏怎么做效果最好?如果警察選擇小偷,偷巡邏的地方,就能抓住小偷;如果小偷選擇沒有警察巡邏的地方進(jìn)行盜竊,偷竊就可能成功。與8.1警察小偷的游戲,分析:采用警察最簡單、最常見的方法之一是警察在銀行巡邏。這樣,警察就可以保護(hù)兩萬元的財(cái)產(chǎn)不被盜

2、。但是小偷去酒吧的話,盜竊一定會成功。牙齒方法是警察最佳實(shí)踐嗎?答案是不。因?yàn)槲覀兛梢酝ㄟ^博弈論知識改進(jìn)這些策略。8.1與警察小偷的游戲,警察最好的戰(zhàn)略之一是通過抽簽決定去銀行還是去酒吧。因?yàn)殂y行的價值是酒吧的兩倍,比如簽一、二號去銀行,簽三號去酒吧,用兩個茄子簽名來代表。這樣警察就有機(jī)會去銀行巡邏,三分之一去酒吧。8.1警察小偷和游戲,在牙齒情況下小偷的最佳策略是:用同樣的抽簽方法去銀行還是去酒吧行竊,代替警察簽1,2次名去酒吧,還是簽3次名去銀行。阿爾伯特愛因斯坦,Northern Exposure(美國電視電視劇),這樣小偷有三分之一的機(jī)會去銀行,三分之二的機(jī)會去酒吧。8.1警察從小偷和

3、游戲、警察和小偷的不同角度計(jì)算最佳混合策略,將得到有趣的共同點(diǎn):相同的成功概率。也就是說,如果采用警察、自己最好的混合策略,小偷可能會抓住的成功概率(收益2*2/9 1*2/9=6/9),小偷可能會采用自己最好的混合策略的成功概率(收益2 * 1/9 1 *),8.1警察小偷和游戲、警察、小偷之間的游戲、混合戰(zhàn)略的想法,但是更多的形象模型是“剪刀、石頭、布”游戲。這種游戲沒有純策略均衡。向所有兒童推出“剪刀”、“布”或“石頭”的戰(zhàn)略必須是隨機(jī)的,不要讓對方知道自己的戰(zhàn)略,甚至是戰(zhàn)略的傾向性。一旦對方發(fā)現(xiàn)自己出某種策略的可能性變大,在游戲中輸?shù)目赡苄砸矔黾?。以與8.2警察盜賊的游戲?yàn)槔?,傳統(tǒng)政

4、治中有“群臣一天一百戰(zhàn)”的說法,描寫了國軍和大臣之間游戲的激烈。因?yàn)榧ち?,不斷出現(xiàn)的手法為博弈論研究提供了豐富的事例。與8.2警察小偷的游戲事例,呂氏春秋有這樣的故事記錄。戰(zhàn)國時,宋康王是個極端的變態(tài),整天喝酒,很暴虐。凡大臣中前來訓(xùn)誡的人,他都因找理由被免職或監(jiān)禁。大臣們也對他更加反感,經(jīng)常指責(zé)他。他很苦惱地對宰相湯陽說?!拔姨幜P的人很多,大臣們?yōu)槭裁床缓ε挛夷??”唐馬丁蓋爾說:“你懲罰的都是違法的人。懲罰他們吧,不犯法的好人當(dāng)然不會害怕。要使臣民害怕,就不能區(qū)分好人和壞人,不管他違法還是犯法,只要隨便抓,就要治罪。我知道在牙齒,長官們很害怕。與8.2警察小偷的游戲事例,唐陽提出的牙齒建議有

5、點(diǎn)缺德,但不能說深入掌握了混合戰(zhàn)略游戲的精髓??深A(yù)測的懲罰,大臣們總是千方百計(jì)躲避,但不可預(yù)測的懲罰是無法阻止的,所以更加令人膽寒。與8.2警察小偷的游戲事例,宋康王也是聰明人,聽了牙齒的想法,恍然大悟,深深地點(diǎn)了點(diǎn)頭。很快,他下令殺死唐馬丁格爾,長官們真的很害怕,因?yàn)榕c8.2警察盜賊的游戲案例,車站警察,與小偷的游戲,火車站盜竊活動猖獗,上司每年都向逆境隊(duì)下達(dá)嚴(yán)厲打擊任務(wù)。由于警力不足,逆境視察隊(duì)不得不抽調(diào)其他人員,如治安,犧牲其他工作,才能擊潰幾個最大的小偷集團(tuán),遏制一些盜竊活動。但是車站每年此時都會受到上級機(jī)關(guān)的批評,例如秩序混亂等。與8.2警察小偷的游戲事例,隨著時間的推移,車站警察隊(duì)

6、開始思考如何在牙齒的時候同時享受兩個世界的優(yōu)點(diǎn)。第一,逆境視察隊(duì)有行賄的小偷集團(tuán)。牙齒現(xiàn)象引起了領(lǐng)導(dǎo)的高度重視。領(lǐng)導(dǎo)人認(rèn)為,只有在牙齒問題上實(shí)現(xiàn)合作董思成,才能最大限度地提高車站的政治利益。關(guān)鍵是建立與警察隊(duì)和最大的小偷集團(tuán)的溝通機(jī)制。小偷每天在警察隊(duì)進(jìn)行一些保證金交涉的情況下,工作活動不受干擾,但不能偷市民,只能偷外地人。與8.2警察小偷的游戲案例,上級有嚴(yán)重打擊任務(wù)的時候,牙齒小偷們立即被隱藏起來,警察可以用正常的力量打擊其他盜竊活動。在牙齒游戲模式下,小偷保證了安全和工作活動,損失只是每天幾個保證金及市民的錢包。警方保證了上級和市民的肯定,沒有任何損失,反而每天得到了一些保證金收益。這是

7、雙方最好的游戲結(jié)果。與8.2警察竊賊的游戲案例,硬幣游戲猜測,例如足球比賽開幕,裁判將手中的硬幣拋向空中,讓雙方隊(duì)長推測硬幣墜落后朝上是正面還是背面。因?yàn)橛矌耪卖~的贊成和反對是隨機(jī)的,所以概率都是二分之一。那么,硬幣游戲參與者選擇正反反的概率都是二分之一,此時游戲達(dá)到混合策略納什均衡。8.3警察和小偷游戲的啟示,牙齒游戲與囚徒困境游戲案例有很大區(qū)別。沒有純戰(zhàn)略納什均衡點(diǎn),只有混合策略均衡點(diǎn)。牙齒平衡點(diǎn)下的政策選擇是每個參與者的最佳(混合)政策選擇。對混合策略的傳統(tǒng)解釋是,局中人應(yīng)用隨機(jī)方法來決定選擇的策略。8.3在與警察小偷的游戲中獲得的啟示,“最小最大定理”,定理在兩個人的零和博弈中。參加者

8、的收益很嚴(yán)格(一個人的收入等于另一個人的收入),每個參加者都努力將對方的最大收益最小化,他的對手努力將自己的最小收益最大化。在與數(shù)學(xué)家約翰馮諾依曼(John Von Neumann)牙齒創(chuàng)立的8.3警察小偷的游戲中得到的啟示,在這樣的情況下,產(chǎn)生了最大收益的最小(最小最大收益)等于最小收益的最大(最大最小收益)的驚人結(jié)果。雙方都沒有辦法改善自己的收益,所以牙齒戰(zhàn)略在牙齒游戲中保持平衡。最小最大定理的證明相當(dāng)復(fù)雜,但其結(jié)論很實(shí)用。如果你想知道的只是一個選手的收入或另一個選手的損失。你只需計(jì)算其中一位選手最好的混合策略并得出結(jié)果。根據(jù)與8.3警察竊賊的游戲中獲得的啟示,所有混合策略的均衡都有一個茄子共同點(diǎn)。每位參加者都不在乎自己的具體策略。如果需要混合策略,找出自己的策略的方法是讓對方認(rèn)為自己的策略不會影響下一步。(阿爾伯特愛因斯坦,戰(zhàn)略名言),在與8.3警察竊賊的游戲中得到的啟示聽起來像是對混亂的無為的后退,但事實(shí)并非如此。零和博弈隨機(jī)化動機(jī):一方面因?yàn)橐l(fā)現(xiàn)對方有規(guī)律的行動,并相應(yīng)地行動。如果他們確實(shí)傾向于采取某種特別的行動,這只是意味著他們選擇了最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論