




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1上一講內(nèi)容回顧博弈論用處(解釋、預(yù)測(cè)和提出建議)猜數(shù)游戲----博弈關(guān)注的(interdependence)博弈論發(fā)展簡(jiǎn)史囚徒困境智豬博弈商業(yè)中心區(qū)(CBD)的形成動(dòng)態(tài)博弈與承諾行動(dòng)信息不對(duì)稱(二手車市場(chǎng))混合策略機(jī)制設(shè)計(jì)(定價(jià)策略、制度設(shè)計(jì)等)2通俗理解博弈論博弈論是有關(guān)取舍策略的科學(xué),它的方程式告訴你在與人接觸中怎樣得到最大的好處。博弈論剛開始運(yùn)用到經(jīng)濟(jì)領(lǐng)域,現(xiàn)在幾乎在哪個(gè)科學(xué)領(lǐng)域都能看到它的身影,尤其是那些涉及到人性與人的行為的科學(xué)。34上述問(wèn)題都有如下共同點(diǎn)都有若干決策者,我們稱之為參與人(players)N-人博弈問(wèn)題的決策者集合,習(xí)慣上也用N表示針對(duì)具體問(wèn)題,參與人可以是個(gè)人一個(gè)政府公司的整個(gè)董事會(huì)博弈的基本要素567對(duì)參與人的理解博弈中的決策者。每個(gè)參與人的目標(biāo)是選擇一個(gè)期望最大化的策略,要求博弈的決策主體具有行為選擇能力,并且對(duì)博弈結(jié)果負(fù)責(zé)的能力,否則不是參與人。眾所周知的田忌賽馬博弈,參與人是田忌和齊威王,孫臏僅僅是一個(gè)策略分析者。孫臏并不是決策者,因而不是參與人.虛擬參與人,又稱為自然(nature)。自然在博弈的一些特定點(diǎn)按照給定的概率隨機(jī)選擇行動(dòng)。虛擬參與人與正常的參與人之間在概念上的差異是:參與人有預(yù)先設(shè)定的效用函數(shù),而虛擬的參與人對(duì)于給定的結(jié)局,不存在任何效用感受。8博弈論對(duì)參與人做兩個(gè)基本假設(shè)1理性的(rational)?1—如果一個(gè)決策者在追逐其目標(biāo)時(shí)能前后一致地做決策,就稱他為rational。RogerB·Myerson(P2)
2—廣義而言指的是一種行為方式,他同在給定條件或約束下最有效地實(shí)現(xiàn)預(yù)期目標(biāo)相關(guān)。具體地講,理性含義如下:9(1)存在一組可供選擇的備選或替代方案;(2)每一種方案均對(duì)應(yīng)著某種特定的預(yù)期凈收益或滿足程度或目標(biāo)實(shí)現(xiàn)程度;(3)人們總是選擇那個(gè)能夠帶來(lái)最大預(yù)期凈收益的方案。(西蒙,1964)博弈論對(duì)參與人做兩個(gè)基本假設(shè)102智能的(intelligent)?
當(dāng)我們像博弈論專家那樣分析一個(gè)博弈時(shí),如果參與人知道我們對(duì)此博弈所知道的一切,并能做出我們對(duì)此博弈所能做出的一切推斷,我們就說(shuō)此博弈的參與人是智能的。RogerB·Myerson(P3)博弈論對(duì)參與人做兩個(gè)基本假設(shè)11參與人都存在若干策略(strategies)或行動(dòng)(actions)參與人i的策略用si表示,參與人i的所有策略構(gòu)成的集合稱為策略集,記為Si,si∈Si注意行動(dòng)與策略的區(qū)別博弈的基本要素121314支付(收益、效用)(payoff)各參與人對(duì)所有參與人不同策略組合(strategyprofile),構(gòu)成了博弈的一個(gè)局勢(shì)。記為s參與人i(i∈N)對(duì)局勢(shì)s有一個(gè)主觀的偏好,可用一個(gè)函數(shù)表示這種偏好,這個(gè)偏好函數(shù)稱為參與人i的支付博弈的基本要素1516參與人、各參與人的策略集、各參與人的支付函數(shù),是博弈最重要的基本要素。博弈的基本要素17
1:博弈的基本特征是一個(gè)參與人的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇;是策略組合的函數(shù)。
2:效用是參與人真正關(guān)心的東西,參與人在博弈中的目標(biāo)就是選擇自己的策略以最大化自己的效用函數(shù)。1819202122Anitemofinformationinagameiscommonknowledgeifalloftheplayersknowitandalloftheplayersknowthatallotherplayersknowitandallotherplayersknowthatallotherplayersknowthatallotherplayersknowit,andsoon.Thisismuchmorethansimplysayingthatsomethingisknownbyall,butalsoimpliesthatthefactthatitisknownisalsoknownbyall,etc.23Considerasimpleexampleoftwoalliedarmiessituatedonoppositehilltopswaitingtoattacktheirfoe.Neithercommanderwillattackunlessheissurethattheotherwillattackatexactlythesametime.Thefirstcommandersendsamessengertotheotherhilltopwiththemessage"Iplantoattackinthemorning."Themessenger'sjourneyisperilousandhemaydieonthewaytodeliveringthemessage.24Ifhegetstotheotherhilltopandinformstheothercommander-canwebecertainthatbothwillattackinthemorning?Notethatbothcommandersnowknowthemessage,butthefirstcannotbesurethatthesecondgotthemessage.Thus,commonknowledgeimpliesnotonlythatbothknowsomepieceofinformation,butcanalsobeabsolutelyconfidentthattherestknowit,andthattherestknowthatweknowit,andsoon.25共同知識(shí)趣題有一群人圍坐在一起,假定只有4個(gè)人,每人頭上帶著戴著一頂帽子,顏色為黑色和白色,每個(gè)人看不到自己頭上帽子的顏色,但能看到別人帽子的顏色.為了分析的方便,我們假定這四個(gè)人均戴的是黑色帽子。這時(shí)候,一個(gè)局外人來(lái)到他們集體當(dāng)中,對(duì)他們說(shuō):“你們其中至少一個(gè)頭戴的是黑色帽子?!碑?dāng)他說(shuō)完這句話后,他問(wèn):“你們知道你們頭上的帽子顏色嗎?”4個(gè)人都說(shuō)不知道。這個(gè)局外人第二次問(wèn)道:“你們知道你們頭上帽子的顏色嗎?”4個(gè)人又都說(shuō)不知道。局外人第三次問(wèn):“你們知道你們頭上帽子的顏色嗎?”4個(gè)人又說(shuō)不知道。局外人第四次問(wèn)道:“你們知道你們頭上帽子的顏色嗎?”這時(shí)4個(gè)人均說(shuō)知道了。你能知道這是為什么嗎?26博弈概念的理解OPEC成員國(guó)選擇其年產(chǎn)量;兩家制造商,一家做螺釘,一一家做螺帽,決定是采用美制標(biāo)準(zhǔn)還是公制標(biāo)準(zhǔn);公司董事會(huì)為其總經(jīng)理設(shè)立一項(xiàng)期股安排;一家電力公司在估計(jì)了未來(lái)10年對(duì)電力的需求后,決定是否購(gòu)置一套新的發(fā)電機(jī)組;明天出去玩,決定是否帶傘;諸葛亮和司馬懿進(jìn)行的空城計(jì);27DefinitionofaGameMustconsiderthestrategicenvironmentWhoarethePLAYERS? (Decisionmakers)WhatSTRATEGIESareavailable? (Feasibleactions)WhatarethePAYOFFS? (Objectives)RulesofthegameWhatisthetime-framefordecisions?Whatisthenatureoftheconflict?Whatisthenatureofinteraction?Whatinformationisavailable?2829303132課程主要內(nèi)容完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完全信息靜態(tài)博弈機(jī)制設(shè)計(jì)合作博弈33完全信息靜態(tài)博弈概念概念:各參與人對(duì)彼此的策略集、支付函數(shù)有準(zhǔn)確了解博弈行為同時(shí)進(jìn)行一些實(shí)例石頭、剪子、布游戲彼此了解的兩個(gè)廠商的價(jià)格戰(zhàn)34完全信息靜態(tài)博弈概念有些實(shí)際博弈雖然決策不是在絕對(duì)時(shí)間意義上的“同時(shí)”,但決策的時(shí)間先后差別跟博弈結(jié)果沒(méi)有關(guān)系,也可看成是“同時(shí)進(jìn)行的博弈”。如不同競(jìng)標(biāo)單位作出的工程投標(biāo)決策35博弈的策略式表述常用G表示一個(gè)博弈博弈模型的兩種表示形式策略式表述(Strategicform),擴(kuò)展式表述(Extensiveform)本章主要介紹博弈的策略式表述36博弈的策略式表述參與人集合N人博弈的參與人集合,往往也記為N。參與人則記為i,i∈N參與人i的策略集,記為Si,其中的一個(gè)特定策略,可記為si.有si∈Si.37對(duì)于給定的參與人i,i=1,2,…N,卡氏積
S1×S2…×Si-1×Si+1…×Sn
表示除了參與人i外所有參與人所有策略的可能組合,通常記為S-i;于是所有參與人不同策略組合構(gòu)成的策略空間可表示為S=(Si,S-i)博弈的策略式表述38Si中的元素si表示參與人i的一個(gè)具體策略一旦確定了所有參與人的策略,便形成了一個(gè)博弈局勢(shì),表示為s=(s1,s2,…sN),s∈S。博弈的策略式表述39參與人i的效用函數(shù)參與人i的支付函數(shù),是從博弈局勢(shì)集S=S1×S2…×SN
到實(shí)數(shù)集R的一個(gè)映射,記為ui(s1,s2,…sN),表示參與人i對(duì)局勢(shì)s=(s1,s2,…sn)的偏好。一個(gè)博弈可以表示為G={S1,…,SN;u1,…,uN,i
∈N}這就是博弈的策略式表述博弈的策略式表述40博弈的策略式表述例寫出囚徒問(wèn)題的策略式表述參與人集合N={囚徒1,囚徒2}參與人的策略集S1=S2={坦白,不坦白}各參與人的支付,可用圖1-1表示。坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)圖1-1囚徒問(wèn)題的支付矩陣囚徒1囚徒241博弈的策略式表述實(shí)質(zhì)上,圖1-1已經(jīng)完全表述了囚徒困境的策略式表述信息稱圖1-1為二人有限博弈的雙矩陣(bimatrix)表述坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)圖1-1囚徒問(wèn)題的支付矩陣囚徒1囚徒242占優(yōu)均衡英文術(shù)語(yǔ):Dominant-strategyEquilibrium定義:在博弈中如果不管其他參與人選擇什么策略,一個(gè)參與人的某個(gè)策略給他帶來(lái)的支付值始終高于其他策略,或至少不劣于其他策略,則稱該策略為該參與人的嚴(yán)格占優(yōu)策略或占優(yōu)策略。43占優(yōu)策略對(duì)于所有的s-i,si*稱為參與人i的嚴(yán)格占優(yōu)戰(zhàn)略,如果滿足:ui(si*,s-i)>ui(si',s-i)s-i,si'si*44占優(yōu)均衡占優(yōu)均衡定義一個(gè)博弈的某個(gè)策略組合中,如果對(duì)應(yīng)的所有策略都是各參與人的占優(yōu)策略,則稱該策略組合為該博弈的一個(gè)占優(yōu)均衡。45占優(yōu)均衡占優(yōu)戰(zhàn)略均衡:每個(gè)參與人的占優(yōu)戰(zhàn)略組合(如果存在的話)被稱為占優(yōu)戰(zhàn)略均衡。坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)圖1-2囚徒問(wèn)題的支付矩陣囚徒1囚徒246占優(yōu)均衡以囚徒1為例,無(wú)論囚徒2采取什么策略…坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)圖1-2囚徒問(wèn)題的支付矩陣囚徒1囚徒247占優(yōu)均衡坦白總是占優(yōu)策略圖1-2囚徒問(wèn)題的支付矩陣囚徒1囚徒2坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)48占優(yōu)均衡由于矩陣的對(duì)稱性,對(duì)囚徒2來(lái)說(shuō)亦可得出類似結(jié)論坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)圖1-2囚徒問(wèn)題的支付矩陣囚徒1囚徒249占優(yōu)均衡因此,該博弈的策略組合(坦白、坦白)是占優(yōu)均衡。圖1-2囚徒問(wèn)題的支付矩陣囚徒1囚徒2坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)50占優(yōu)均衡但該占優(yōu)均衡的收益,卻劣于另外一個(gè)策略組合(不坦白,不坦白)。坦白不坦白坦白(-8,-8)(0,-10)不坦白(-10,0)(-1,-1)圖1-2囚徒問(wèn)題的支付矩陣囚徒1囚徒2成績(jī)博弈,分析占優(yōu)策略和占優(yōu)均衡5152重復(fù)剔除嚴(yán)劣策略均衡前面介紹了第一均衡概念——占優(yōu)均衡(顯然)并非所有博弈都存在占優(yōu)均衡,如石頭、剪子、布游戲?qū)φ純?yōu)均衡概念稍加擴(kuò)展,就得到重復(fù)剔除嚴(yán)劣策略均衡概念選舉實(shí)例中間選民定理5354重復(fù)剔除嚴(yán)劣策略均衡“嚴(yán)劣”和“弱劣”的含義:設(shè)
si’和si’’是參與人i可選擇的兩個(gè)策略,若對(duì)其他參與人的任意策略組合s-i,均成立ui(si’,s-i)<ui(si’’,s-i),則說(shuō)策略si’嚴(yán)劣于策略si’’
。上面式子中,若將“<”改為“≤”,則說(shuō)策略si’弱劣于策略si’’
。55重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡的定義重復(fù)剔除嚴(yán)格策略就是各參與人在其各自策略集中,不斷剔除嚴(yán)劣策略…如果最終各參與人僅剩下一個(gè)策略,則該策略組合就被稱為重復(fù)剔除嚴(yán)劣策略均衡。56重復(fù)剔除嚴(yán)劣策略均衡實(shí)例一個(gè)虛擬的博弈,見(jiàn)圖1-4。該博弈不存在占優(yōu)均衡。參與人1
參與人2上下
左中右1,01,30,10,40,22,0圖1-457重復(fù)剔除嚴(yán)劣策略均衡可用重復(fù)剔除嚴(yán)劣策略的方法,得到重復(fù)剔除嚴(yán)劣策略均衡解參與人1
參與人2上下
左中右1,01,30,10,40,22,0圖1-458重復(fù)剔除嚴(yán)劣策略均衡先從參與人2開始顯然,策略“中”要嚴(yán)格優(yōu)于策略“右”,因此,參與人2應(yīng)該剔除嚴(yán)劣策略“右”,博弈簡(jiǎn)化為圖1-5參與人1
參與人2上下
左中右1,01,30,10,40,22,0圖1-459重復(fù)剔除嚴(yán)劣策略均衡先從參與人2開始顯然,策略“中”要嚴(yán)格優(yōu)于策略“右”,因此,參與人2應(yīng)該剔除嚴(yán)劣策略“右”,博弈簡(jiǎn)化為圖1-5參與人1
參與人2上下
左中1,01,30,40,2圖1-560重復(fù)剔除嚴(yán)劣策略均衡由于博弈的信息對(duì)于兩個(gè)參與人來(lái)說(shuō)是“完全的”,因此,參與人1能夠預(yù)測(cè)到參與人2的這個(gè)推理過(guò)程參與人1
參與人2上下
左
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 06 寫作 表達(dá)要得體2024-2025學(xué)年八年級(jí)語(yǔ)文上冊(cè)同步教學(xué)設(shè)計(jì)(河北專版)
- 主題四 任務(wù)一 認(rèn)識(shí)操作系統(tǒng) 教學(xué)設(shè)計(jì) -2023-2024學(xué)年桂科版初中信息技術(shù)七年級(jí)上冊(cè)
- 《第三單元 創(chuàng)建交互動(dòng)畫 第12課 制作留言板 添加輸入文本區(qū)和動(dòng)態(tài)文本區(qū)》教學(xué)設(shè)計(jì)教學(xué)反思-2023-2024學(xué)年初中信息技術(shù)人教版八年級(jí)上冊(cè)
- 第二單元 第8課 數(shù)據(jù)計(jì)算 教學(xué)設(shè)計(jì) 2023-2024學(xué)年浙教版(2020)初中信息技術(shù)七年級(jí)上冊(cè)
- 人工智能模擬習(xí)題含參考答案
- 電鏟初級(jí)工模擬練習(xí)題含參考答案
- 第一單元 古代文明的產(chǎn)生與發(fā)展 教學(xué)設(shè)計(jì)-2023-2024學(xué)年高中歷史統(tǒng)編版(2019)必修中外歷史綱要下冊(cè)
- 2025年仿石材漆合作協(xié)議書
- 第六單元實(shí)驗(yàn)活動(dòng)3·二氧化碳的實(shí)驗(yàn)室制取與性質(zhì)教學(xué)設(shè)計(jì)-2024-2025學(xué)年九年級(jí)化學(xué)人教版(2024)上冊(cè)
- 江西省贛州市大余縣部分學(xué)校聯(lián)考2023-2024學(xué)年高二上學(xué)期12月月考地理試題(解析版)
- 中國(guó)古代快遞的產(chǎn)生與發(fā)展
- 高二物理上期期末復(fù)習(xí)備考黃金30題 專題04 大題好拿分(提升20題)
- 節(jié)事活動(dòng)策劃與組織管理 節(jié)事活動(dòng)概論
- 電梯安裝質(zhì)量手冊(cè)、程序文件、作業(yè)指導(dǎo)書及記錄表符合特種設(shè)備許可規(guī)范TSG07-2019
- 肋骨骨折病人的業(yè)務(wù)學(xué)習(xí)
- 生產(chǎn)建設(shè)項(xiàng)目水土保持補(bǔ)償費(fèi)免征申請(qǐng)表
- GBZ/T(衛(wèi)生) 277-2016職業(yè)病危害評(píng)價(jià)通則
- GB/T 5267.3-2008緊固件熱浸鍍鋅層
- GB/T 3498-2008潤(rùn)滑脂寬溫度范圍滴點(diǎn)測(cè)定法
- GB/T 31586.2-2015防護(hù)涂料體系對(duì)鋼結(jié)構(gòu)的防腐蝕保護(hù)涂層附著力/內(nèi)聚力(破壞強(qiáng)度)的評(píng)定和驗(yàn)收準(zhǔn)則第2部分:劃格試驗(yàn)和劃叉試驗(yàn)
- GB/T 15175-2012固體激光器主要參數(shù)測(cè)量方法
評(píng)論
0/150
提交評(píng)論