版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二講完全信息靜態(tài)博弈
所謂完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對博弈中的各種情況下的得益都完全了解的博弈問題納什均衡無限策略博弈的解和反應(yīng)函數(shù)混合策略納什均衡的存在性2.1納什均衡博弈的解和納什均衡嚴格下策反復(fù)消去法與納什均衡2.1.1博弈的解和納什均衡定義在博弈中,如果策略組合中任一博弈方i的策略都是對其余博弈方的策略組合的最佳對策,也即對任意都成立,則稱為G的一個納什均衡。
斯特恩巴赫是費城的一個家庭保健醫(yī)生,她很奇怪為什么輝瑞公司(Pfizer)的五位不同推銷員重復(fù)上門到她的診所推銷同樣的止痛藥—Betra及Celebrex。她在貯藏室里一個像冰箱大的柜子里已裝滿了Bextra和Celebrex,她說,“眾多的推銷員重復(fù)同樣的產(chǎn)品,沒有任何新意,實在是離奇?!遍L達十年的招聘狂潮使制藥業(yè)的推銷員人數(shù)增加到90000,為原來人數(shù)的三倍。制藥業(yè)人士篤信:只要推銷員與醫(yī)生推銷一種藥越頻繁,醫(yī)生越有可能多開此藥。據(jù)統(tǒng)計,2010年制藥業(yè)在推銷員工上花費為120多億美元,在藥物廣告上花費為27.6億美元。根據(jù)聯(lián)邦政府的報告,美國國內(nèi)在處方藥上的支出激增14%,達到1,610億美元。專欄—制藥公司的銷售大戰(zhàn)(摘自華爾街日報)Betra輝瑞推銷員止痛藥醫(yī)生2010年美國制藥業(yè)推銷員工與藥物廣告花費(單位:億美元)專欄—制藥公司的銷售大戰(zhàn)(摘自華爾街日報)(續(xù))
盡管如此,沒有任何一家制藥商愿意第一個單方面裁軍。葛蘭素史克公司(GlaxoSmithKline)的推銷員隊伍是如此壯大:它只需要七天就可以聯(lián)系到美國80%以上的醫(yī)生?!斑@有必要嗎?”葛蘭素史克的CEO加涅爾說:“應(yīng)該說是沒有必要,但是如果我的競爭對手能而我做不到,我們就處于劣勢。這的確是以最壞可能的方式進行的軍備競賽?!?/p>
“擁有眾多的推銷員不是競爭優(yōu)勢的源泉”,默克公司的主席和CEO吉爾馬丁補充說。他說制藥商通過發(fā)現(xiàn)新藥來獲得優(yōu)勢。然而,默克公司2001年起在美國已增加了1500名推銷員,使得總數(shù)達到約7000人。既然誰都知道擁有眾多的推銷員并不是競爭優(yōu)勢的源泉,那為什么各家制藥公司的推銷員仍然在不斷膨脹呢?
——引自周林,《商業(yè)戰(zhàn)略決策:博弈論的應(yīng)用》同步,一次博弈--標準式博弈 構(gòu)成標準式博弈的要素有:參與者:參加博弈并做出決策的個體策略:參與者可能采取的行動得益:參與者采取不同策略帶來的利益或損失參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標準式博弈:均衡分析假設(shè)參與者1認為參與者2選擇“A”參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標準式博弈:均衡分析則參與者1應(yīng)該選擇“a”參與者1對“A”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標準式博弈:均衡分析假設(shè)參與者1認為參與者2選擇“B”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標準式博弈:均衡分析則參與者1應(yīng)該選擇“a”.參與者1對“B”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標準式博弈:均衡分析如果參與者1認為參與者2選擇C…參與者1對“C”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5占優(yōu)策略不管參與者2是選擇A、B還是C,參與者1都會選擇“a”!“a”是參與者1的占優(yōu)策略!占優(yōu)策略(上策)
不管對手做什么,對一個參與者都能獲得最高得益的策略參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5站到對手的立場上,想?yún)⑴c者2會怎么做呢?
參與者2沒有占優(yōu)策略!但是參與者2應(yīng)該能夠推斷出1會選擇“a”因此參與者2會選擇“C”參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5結(jié)果“a”是參與者1對“C”的最優(yōu)反應(yīng).“C”是參與者2對“a”的最優(yōu)反應(yīng).此結(jié)果被稱為納什均衡:
在給定其他參與者策略情況下,沒有一個參與者能通過單方面改變自己的策略而使自己的得益提高,從而沒有人有積極性打破這種均衡參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5關(guān)鍵點:尋找占優(yōu)策略
檢查一下你是否存在占優(yōu)策略,如果有,就選擇占優(yōu)策略站在對手的位置上思考問題
如果你沒有占優(yōu)策略,那么從你對手角度考慮博弈。如果對手有占優(yōu)策略,預(yù)期他將按占優(yōu)策略行動納什均衡
我所做的是:給定你所做的,我所做的是最好的;你所做的是:給定我所做的,你所做的是最好的同步,一次博弈的應(yīng)用專欄的博弈分析(制藥公司銷售大戰(zhàn))策略適中龐大適中10,105,13龐大13,57,7默克輝瑞納什均衡彩電價格大戰(zhàn)策略低價高價低價0,03,-1高價-1,31,1伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價格競爭)海信長虹納什均衡2.1.1博弈的解和納什均衡劃線法
囚徒2
不坦白坦白囚不坦白徒
1坦白箭頭法囚徒2
不坦白坦白囚不坦白徒
1坦白
-1,-1
-8,0
0,-8
-5,-5-1,-1
-8,00,-8
-5,-5
劃線法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭
箭頭法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭
2.1.2嚴格下策反復(fù)消去法嚴格下策:不管其它博弈方的策略如何變化,給一個博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略嚴格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中國家戰(zhàn)略:軍備競賽兩國之間的軍備競賽可以用囚徒困境來描述。兩國都可以聲稱有兩種選擇:增加軍備(背叛)、或是達成削減武器協(xié)議(合作)兩國都無法肯定對方會遵守協(xié)議,因此兩國最終會傾向增加軍備似乎自相矛盾的是,雖然增加軍備會是兩國的“理性”行為,但結(jié)果卻顯得“非理性”(例如會對經(jīng)濟造成都有損壞等)這種被稱作“遏制理論”的推論,就是以強大的軍事力量來遏制對方的進攻,以達到和平你要給我小心點??!我也不是好惹的!博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境軍事力量是世界制衡的砝碼為什么要削減武器?我們還是好好談?wù)劙刹┺恼撆c企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境彩電價格大戰(zhàn)策略低價高價低價0,03,-1高價-1,31,1伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價格競爭)海信長虹納什均衡博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境2.2無限策略的解和反應(yīng)函數(shù)古諾的寡頭模型反應(yīng)函數(shù)伯特蘭德的寡頭模型公共資源問題2.2.1古諾的寡頭模型
博弈方1利潤:博弈方2利潤:在本博弈中,的納什均衡的充分必要條件是和的最大值問題:社會收益最大化:假設(shè)總產(chǎn)量為Q,總收益為U=QP(Q)-CQ
=Q(8-Q)-2Q=6Q-Q2
其最大值為Q*=3,U=9
該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。4.5,4.55,3.753.75,54,4不突破突破廠商2不突破突破廠商1以自身最大利益為目標:各生產(chǎn)2單位產(chǎn)量,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈28分析經(jīng)營管理的實踐案例29誠信之道當一個社會缺乏信用、蔑視契約時,是難以建立人與人之間的互信基礎(chǔ)的。所以從建立對信用和契約神圣的認知,并用強制措施加以保障。30誠信的選擇道德乎?策略乎?31社會學(xué)家和經(jīng)濟學(xué)家的爭辯社會學(xué)家云:誠信是人在較低層次的需求得到適當滿足之后自然出現(xiàn)的一種較高層次的需求;誠信帶給人的滿足感會超過逐利帶來的滿足感。經(jīng)濟學(xué)家云:人們在重復(fù)博弈、反復(fù)切磋過程中謀求長期的、穩(wěn)定的物質(zhì)利益的一種策略選擇。32誠信案例假定A是一名生產(chǎn)商,B是一名銷售商,AB雙方互為博弈對手,會出現(xiàn)以下4種博弈的可能性:雙方都講誠信,A按約交貨,B按約付款,各得其所,每人都得到的效用都是10;A誠信而B不誠信,A交了貨而B不付款,那麼B可以獲得自己最大的利益,得15,而A吃虧了,得-10;A不誠信而B誠信,即A收了錢而不發(fā)貨,則A的利益實現(xiàn)了最大化,得15,而B得-10;AB雙方互不信任,也互不守信,生意泡湯了,各自的效用都為0。33矩陣分析
生產(chǎn)方銷售方誠信不誠信誠信1010-1015不誠信15-1000交易34案例研討自身利益最大化:
對方講誠信,自己不講誠信合理結(jié)果:都不講誠信
雙贏:
都講誠信35誠信缺失的案例安然安達信丑聞36背景
安達信是全球五大會計事務(wù)所之一。它代理著美國23000家上市公司的審計業(yè)務(wù),占美國上市公司總數(shù)的17%。2002年安達信卻因為假帳問題被美國國會、司法部、證券交易委員會調(diào)查,接下來包括福特汽車、默克制藥、聯(lián)邦快遞、德爾塔航空公司在內(nèi)的36家大客戶與安達信解除了合同。37共贏案利中銀消費信貸卡38背景中銀消費信貸記錄卡是中國銀行消費信貸業(yè)務(wù)中一創(chuàng)新產(chǎn)品,是為客戶提供貸款購物且具無抵押、零首付、減免息等優(yōu)點的消費記錄憑證。它依附于中國銀行長城信用卡或長城電子借記卡,由北京市商業(yè)信息資詢中心監(jiān)制,北京資和信咨詢公司負責發(fā)行管理。39經(jīng)營分析得到付出基礎(chǔ)客戶免減息;無首付;無抵押;信用循環(huán);便捷年費誠信銀行收益、人氣信用卡平臺誠信商戶收益、人氣貼息誠信中介收益、人氣管理誠信2.2.2反應(yīng)函數(shù)
反應(yīng)函數(shù)-每個博弈方針對其他博弈方所有策略的最佳反應(yīng)構(gòu)成的函數(shù)。而各個博弈方反應(yīng)函數(shù)的交點(如果有的話)就是納什均衡。2.2.2反應(yīng)函數(shù)-古諾模型在古諾模型中廠商1和廠商2的反應(yīng)函數(shù)分別為q2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0)
從左圖可以看出,當一方的選擇為0時,另一方的最佳反應(yīng)為3,這正是我們前面所說過的實現(xiàn)總體最大利益的產(chǎn)量,因為一家產(chǎn)量為零,意味著另一家壟斷市場。當一方的產(chǎn)量達到6時,另一方則被迫選擇0,因為實際上堅持生產(chǎn)已無利可圖。2.2.3伯特蘭德的寡頭模型在該模型中廠商選擇價格而不是產(chǎn)量廠商1的價格與需求函數(shù):P1,廠商2的價格與需求函數(shù):
P2,其中,d1,d2>0為兩廠商產(chǎn)品的替代系數(shù)。假設(shè)兩廠商無固定成本,邊際成本分別為c1和c2。收益:納什均衡:公共地悲劇英國人哈定:十八世紀以前,蘇格蘭地區(qū)大量草地,由于屬公共資源導(dǎo)致過度放牧,致使草地消失,生態(tài)破壞2.2.4公共資源問題公共產(chǎn)品的供給
如果大家都出錢興辦公用事業(yè),所有人的福利都會增加。問題是,如果我出錢你不出錢,我得不償失,而如果你出錢我不出錢,我就可以占你的便宜。所以每個人的最優(yōu)選擇都是“不出錢”,結(jié)果使所有人的福利都得不到提高。軍備競賽
兩國都不搞軍備競賽,都把資源用于民用,兩國福利都變好。但由于都怕受威脅而大搞軍備競賽,結(jié)果兩國福利都變得更糟。經(jīng)濟改革經(jīng)濟改革要付出成本(包括風險),而改革的成果大家享受,結(jié)果是,盡管人人都認為改革好,卻很難有人真正去改革,大家只好在都不滿意的體制下繼續(xù)生活下去。2.2.4公共資源問題2.2.4公共資源問題公共資源(1)沒有哪個個人、企業(yè)或其他經(jīng)濟組織擁有;(2)大家都可以自由利用這兩個特征的自然資源或人類生產(chǎn)的供大眾免費使用的設(shè)施或財貨。例設(shè)某村莊有n個農(nóng)戶,一公共草地,可養(yǎng)羊數(shù)為qi(i=1,…,n)為n個農(nóng)戶各自的策略空間,當各戶養(yǎng)羊數(shù)為q1,…,qn時,總數(shù)為Q=q1+…+qn,每只羊的產(chǎn)出為羊的總數(shù)Q的減函數(shù)V=V(Q)=V(q1+…+qn),假設(shè)每只羊的成本為c,則農(nóng)戶i養(yǎng)qi只羊的得益為:ui=qiV(Q)-qic2.2.4公共資源問題-實例
設(shè)n=3,V=100-Q=100-(q1+q2+q3),c=4
三農(nóng)戶的得益函數(shù)和反應(yīng)函數(shù):
u1=q1[100-(q1+q2+q3)]-4q1,q1=R1(q2,q3)=48-0.5q2-0.5q3
u2=q2[100-(q1+q2+q3)]-4q2,q2=R1(q1,q3)=48-0.5q1-0.5q3
u3=q3[100-(q1+q2+q3)]-4q3,q3=R1(q1,q2)=48-0.5q1-0.5q2
納什均衡:q1*=q2*=q3*=24,
u1*=u2*=u3*=576
最大總體收益:u*=2304Q*=48
由此說明,納什均衡的解常常是低效率的,而在現(xiàn)實生活中卻經(jīng)常出現(xiàn)。如果采取最佳策略(集體理性),那么個體的貪婪性將會來破壞這一平衡。47系統(tǒng)思維和雙贏策略“商場如戰(zhàn)場”企業(yè)在商戰(zhàn)中的惡性競爭不僅僅損害的是企業(yè)的利益,更可怕的是往往將一個行業(yè)做“爛”?!半p贏”是一種相互的妥協(xié),也是一種良性的競爭,它可以幫助我們實現(xiàn)共同利益的最大化。也就是說,它可以使我們都能分到“蛋糕”,而且可以使我們一起“把蛋糕做大”。48
行業(yè)自律道德約束
組織形式:中介組織;行會;保險公司每個博弈者建立各自的“圈子”——A與B的生意可能只是一次性的,但是,A卻要長期與B所在“圈子”打交道,這樣,通過“圈子”,A與B的一次性博弈就轉(zhuǎn)化為A與B所在“圈子”的重復(fù)博弈。同時,“圈子”還有另一重作用,就是傳遞信息,是“雙盲”博弈變成“透明”博弈,提高合作的可能性。49
制度保證政府監(jiān)管
保險制度;信用制度健全法制,完善有關(guān)規(guī)章制度,讓不遵守游戲規(guī)則的投機取巧者、坑蒙拐騙者和背信棄義者受到應(yīng)有的懲罰。法律旨在使合作利益能夠順利實現(xiàn),旨在促進繁榮,而并非為了威嚇百姓。我國最早文獻《尚書.呂刑篇》曾明確地指出:典獄非訖于威,唯訖于富。擺脫惡性競爭,建立規(guī)則。位置博弈商業(yè)布點、飛機航班、電視節(jié)目、政治選舉01/41/23/41ABAB智豬博弈
豬圈中有一頭大豬一頭小豬,豬圈一端有個按鈕,每按一下豬圈另一端食槽中會有10個單位豬食進槽,但按一下會耗去相當于2單位豬食的成本。如果大豬先到食槽,大豬吃到9單位食物,小豬只能吃到1單位;如小豬先到,小豬吃4單位而大豬吃6單位;如果同時按并同時到食槽,則大豬吃7單位而小豬吃3單位食物。按等待按5,14,4等待9,-10,0小豬大豬納什均衡關(guān)鍵點處于強勢的參與者為維護自己利益采取某種決策時,為其他弱勢參與者提供了搭便車的機會股市中的機構(gòu)大戶與散戶新產(chǎn)品研發(fā)與中小企業(yè)可口可樂、百事可樂與非品牌軟飲料產(chǎn)品(Scott)小狗策略大智若愚中的智慧貧困縣的教育撥款智豬博弈的進一步分析答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標是:每次落下的食物數(shù)量和踏板與投食口之間的距離。如果改變一下核心指標,豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境智豬博弈的進一步分析
改變一下指標,情景如何?1.減量方案:投食僅原來的一半分量。1.結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。怎樣才能實現(xiàn)多勞多得?博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境按等待按(3.5-2)1.5,(1.5-2)-0.5-1,4等待5,-20,0小豬大豬納什均衡智豬博弈的進一步分析2.增量方案:投食為原來的一倍分量。.結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強。3.減量加移位方案:投食僅原來的一半分量,但同時將投食口移到踏板附近。小豬和大豬都在拼命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。企業(yè)、政府與商業(yè)環(huán)境博弈論與企業(yè)競爭智豬博弈的進一步分析
思考題:“聰明的豬”游戲
在企業(yè)經(jīng)營方面有哪些啟示?人力資源市場營銷企業(yè)戰(zhàn)略博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境斗雞博弈進退“大將軍”“猛英雄”進
退-3,-32,00,20,0相對優(yōu)勢戰(zhàn)略圈定法博弈論與企業(yè)競爭57企業(yè)、政府與商業(yè)環(huán)境討論
先動優(yōu)勢先發(fā)制人、志在必得不戰(zhàn)而屈人之兵,善之善者也。后動優(yōu)勢靜觀其變、從容應(yīng)付昔之善戰(zhàn)者,先為不可勝,以待敵之可勝。博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境協(xié)調(diào)博弈足球芭蕾足球2,10,0芭蕾0,01,2情侶博弈女男策略220伏110伏220伏$100,$1000,0110伏0,0$100,$100企業(yè)B企業(yè)A此協(xié)調(diào)博弈有兩個納什均衡產(chǎn)業(yè)標準(軟盤、CD的大小等)國家標準(電壓、交通法等)關(guān)鍵點不是所有的博弈都涉及到利益沖突.溝通能夠幫助解決協(xié)調(diào)問題.順序行動能夠幫助解決協(xié)調(diào)問題.先動優(yōu)勢的作用2.3混合策略概念應(yīng)用2.3.1概念的提出在前面的例子,如猜硬幣,齊威王田忌賽馬,夫妻之爭等博弈問題不存在納什均衡策略組合,然而這類問題十分常見。例1小偷與守衛(wèi)的博弈守衛(wèi)睡不睡小偷偷不偷例2猜硬幣
1.若被對手事先知道出現(xiàn)哪一面,肯定輸
2.若正面出現(xiàn)的概率為p,負面為1-p,且p>0.5,則猜正面的話贏的幾率就比較大。V,-D-P,00,S0,0猜硬幣博弈
猜硬幣方正面反面蓋硬正面幣方反面該博弈與上一個例子相似,即取勝的關(guān)鍵都是不能讓另一方猜到自己的策略而同時自己又要盡可能猜出對方的策略。若p>1/2,則猜硬幣方全猜正面,他的期望得益為p×1+(1-p)×(-1)=2p-1>0,即平均來說,猜硬幣方贏多輸少。
-1,11,-11,-1-1,1請找出這個博弈的納什均衡。2.3.1概念的提出特點:1.自己的選擇不能讓對手預(yù)先知道2.若重復(fù)多次,則不讓對手發(fā)現(xiàn)其中的規(guī)律。除非有意輸(一種行賄的手段),注意行賄只是一個手段,有意無意間讓對手了解自己的策略或規(guī)律。2.3.1概念的提出定義:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空間為Si={si1,…,sik},則博弈方i以概率分布pi=(pi1,…,pik)隨機選擇其k個可選策略稱為一個“混合策略”,其中0≤pik≤1對k=1,…,k都成立且pi1+…+pik=1。相對于這種以一定概率分布在一些策略中隨機選擇的混合策略,確定性的具體的策略我們稱為“純策略”混合策略的原則:自己的策略選擇不能被另一方預(yù)知或猜到。即在決策時利用隨機性。選擇每種策略的概率一定要恰好使對方無機可乘,即讓對方無法通過有針對性的傾向某一策略而占上風。納什定理納什均衡的存在性定理(納什,1950):每一個有限博弈至少存在一個納什均衡。博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境納什均衡純戰(zhàn)略均衡是就是,不是就不是混合戰(zhàn)略均衡:純戰(zhàn)略空間的概率分布是也不是,不是也是例:投硬幣博弈
博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境混合戰(zhàn)略納什均衡——警察與小偷出工收手警察小偷巡夜
睡覺1,-10,0-1,11,-1警察巡夜的效用=q。
睡覺的效用=-q+(1-q)
效用無差別,q=-q+(1-q)
q*=1/3
P
1-Pq1-q小偷出工的效用=-p+(1-p)。
收手的效用=-(1-p)
效用無差別,-p+(1-p)==-(1-p)
p*=2/3博弈論與企業(yè)競爭68企業(yè)、政府與商業(yè)環(huán)境討論:混合戰(zhàn)略納什均衡度:為與不為之間兩難問題的一條出路
博弈論與企業(yè)競爭企業(yè)、政府與商業(yè)環(huán)境2.3.2應(yīng)用博弈方1選A、B的概率:pA,pB;博弈方2選C、D的概率:pC,pD。原則應(yīng)用:博弈方1選A和B的概率pA和pB一定要使博弈方2選C的期望得益和選D的期望得益相等。即pA×
3
+pB×1=pA×
2
+pB×5又由pA+pB=1,可得pA=0.8,pB=0.2,此即博弈方1應(yīng)選的混合策略。同理可得博弈方2的混合策略為pC=0.8,pD=0.2。納什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e=pA.pC.u1(A,C)+pA.pD.u1(A,D)+pB.pC.u1(B,C)+pB.pD.u1(B,D)=2.6u2e=2.6
單獨一次博弈的結(jié)果可能是四種狀態(tài)的任何一種,然而多次獨立重復(fù)博弈得到如上的結(jié)果是可能的。
2,35,23,11,5
2CDA1B2023年2月1日712.3.2應(yīng)用一、案例:情侶博弈(三)優(yōu)勢策略均衡(足球,足球),(時裝,時裝)2,10,00,01,3時裝足球時裝足球丈夫妻子夫妻之爭2.3.2應(yīng)用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問題,同
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 質(zhì)量現(xiàn)場問題處理方案
- 浙江移動攀巖墻施工方案
- 清理管道施工方案
- 分紅入股合同范本
- 職教教材招標方案
- 單位電器購買合同范例
- 住宅劃地出售合同范例
- 企業(yè)午餐供應(yīng)合同范例
- 倉儲設(shè)計合同范例
- 農(nóng)機產(chǎn)品代銷合同范例
- 新華師大版八年級下冊初中數(shù)學(xué)全冊課時練(課后作業(yè)設(shè)計)
- 致命性大出血急救專家共識
- 住院成人高血糖患者血糖監(jiān)測醫(yī)護協(xié)議處方共識
- JTS-169-2017碼頭附屬設(shè)施技術(shù)規(guī)范
- DL-T5816-2020分布式電化學(xué)儲能系統(tǒng)接入配電網(wǎng)設(shè)計規(guī)范
- 2024年4月自考00832英語詞匯學(xué)試題
- 競賽試卷(試題)-2023-2024學(xué)年六年級下冊數(shù)學(xué)人教版
- 《電力用直流電源系統(tǒng)蓄電池組遠程充放電技術(shù)規(guī)范》
- 2024年中考語文 (湖北專用)專題一 字音、字形課件
- T-ACEF 095-2023 揮發(fā)性有機物泄漏檢測紅外成像儀(OGI)技術(shù)要求及監(jiān)測規(guī)范
- 2023年全國高考乙卷歷史真題試卷及答案
評論
0/150
提交評論