版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、西方經(jīng)濟(jì)學(xué)實(shí)驗(yàn)一:完全信息靜態(tài)博弈實(shí)驗(yàn)指南一、博弈論概述1、博弈論的概念博弈論(game theory)又被稱為對策論、“賽局論”。博弈論是研究相互依賴、相互影響的決策主體的理性決策行 為及這些決策的均衡結(jié)果的理論。2、博弈的構(gòu)成要素博弈主要包括局中人、行動、信息、戰(zhàn)略、支付(效用)、結(jié)果和均衡等要素,其中,局中人、戰(zhàn)略和支付是描 述一個(gè)博弈所需的最少要素。局中人、行動和結(jié)果統(tǒng)稱為“博弈規(guī)則”。3、博弈的分類依據(jù)博弈參與者相互作用時(shí)能否達(dá)成一個(gè)具有約束力的協(xié)議,可將博弈分為合作博弈和非合作博弈。如果 有具有約束力的協(xié)議,就是合作博弈;如果沒有,就是非合作博弈。依據(jù)博弈局中人行為的時(shí)間序列性,可
2、將博弈分為靜態(tài)博弈、動態(tài)博弈兩類。靜態(tài)博弈是指在博弈中,局 中人同時(shí)選擇或雖非同時(shí)選擇但后行動者并不知道先行動者采取了什么具體行動;動態(tài)博弈是指在博弈中,局中人的 行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。按照局中人對其他局中人的了解程度,可將博弈分為完全信息博弈和不完全信息博弈。完全信息博弈是指 在博弈過程中,每位局中人對其他局中人的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。不完全信息博弈是指如果局中 人對其他局中人的特征、策略空間及收益函數(shù)信息了解得不夠準(zhǔn)確,或者不是對所有局中人的特征、策略空間及收益 函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。目前經(jīng)濟(jì)學(xué)家們
3、所談的博弈論一般是指非合作博弈,由于合作博弈論比非合作博理論復(fù)雜,在理論上的成熟度遠(yuǎn) 遠(yuǎn)不如非合作博弈論。非合作博弈可分為完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息 動態(tài)博弈,其對應(yīng)的均衡概念和理論研究的代表人物如表1所示。表1非合作博弈分類及對應(yīng)的均衡概念行動次序信息-靜態(tài)動態(tài)完全信息納什均衡代表人物:納什(1950,1951)子博弈精練納什均衡 代表人物:澤爾騰(1965)不完全信息貝葉斯均衡代表人物:海薩尼(1967-1968)精煉貝葉斯均衡 代表人物:澤爾騰(1965)4、幾種典型的博弈均衡納什均衡納什均衡(Nash equilibrium)的核心思想是:博弈的
4、理想結(jié)局是,每個(gè)局中人選擇的策略是對其他局中人所選 策略的最佳反應(yīng),其中每一個(gè)局中人都不能因單方面改變自己的策略而獲益。納什均衡有一個(gè)很重要的特點(diǎn),是可以自我實(shí)施的,即信念和選擇之間的一致性。就是說,基于信念的選擇是合 理的,同時(shí)支持這個(gè)選擇的信念也是正確的。如果所有人都認(rèn)為這個(gè)結(jié)果會出現(xiàn),這個(gè)結(jié)果就真的會出現(xiàn)。如果局中人事前達(dá)成一個(gè)協(xié)議,在不存在外部強(qiáng)制的情況下,每個(gè)人都有積極性遵守這個(gè)協(xié)議,這個(gè)協(xié)議就是納什均衡。(R2,C2)局中人CC1C2C3局中人RR1100, 1000, 050, 101R250, 01, 160, 0R30, 3000, 0200, 200老板1, -1-1, 2
5、-2, 32, 2工人監(jiān)督 不監(jiān)督偷懶 不偷懶混合戰(zhàn)略納什均衡則老板不監(jiān)督;員工不偷懶、老板不監(jiān)督是最好的(總收益最大),但這不是一個(gè)納什均衡。如果員工不偷懶,但如果員工知道老板不監(jiān)督,員工則偷懶;如果老板知道員工偷懶,老板則監(jiān)督形成一個(gè)循環(huán) 假如老板認(rèn)為員工偷懶的概率是P,不偷懶的概率是1-P,從老板的角度看,監(jiān)督的預(yù)期收益是:1xP + (-1)x(1-P) = 2P-1不監(jiān)督的預(yù)期收益為:(-2)xP+2x(1-P) = 1-4P(2)令 =(2),得P=1/3,這時(shí),員工選擇以1/3的概率偷懶,2/3的概率不偷懶,老板監(jiān)督與不監(jiān)督,老板的 收益一樣的。假如員工認(rèn)為老板監(jiān)督的概率為Q,不
6、監(jiān)督的概率為1-Q,這時(shí),從員工的角度,偷懶的預(yù)期收益是:(-1)xQ+3x(1-Q)=3-4Q(3)不偷懶的預(yù)期收益為:2xQ + 2x(1-Q)=2(4)要使員工的選擇在這兩者之間無差異,則令(3)二(4),得Q = 1/4 ;意味著老板以1/4的概率監(jiān)督,3/4的概率 不監(jiān)督,員工的的收益一樣的。因此,混合戰(zhàn)略納什均衡是:員工以1/3的概率偷懶,2/3的概率不偷懶;老板以1/4的概率監(jiān)督,3/4的概率不*納什均衡的存在性問題:(一般存在奇數(shù)個(gè)納什均衡)1、每一個(gè)有限博弈至少存在一個(gè)納什均衡(純戰(zhàn)略或混合戰(zhàn)略); 2、如果一個(gè)博弈存在兩個(gè)純戰(zhàn)略納什均衡,那么,一定存在第三個(gè)混合戰(zhàn)略納什均衡
7、(3)高風(fēng)險(xiǎn)下的納什均衡在一些特殊情況下,即使犯錯(cuò)誤的可能性很小也可能導(dǎo)致大的災(zāi)難(比如核電站,出問題就非常嚴(yán)重),納什均 衡就可能不會產(chǎn)生有說服力的解釋??紤]如下博弈:8, 10-1000, 97, 66, 5乙上下左右在這個(gè)博弈中,局中人甲會選擇“下”因?yàn)槿绻也恍⌒模ǖ透怕剩┓稿e(cuò)誤,要避免產(chǎn)生右上的災(zāi)難性情況。這個(gè)例子說明,個(gè)體可能不想我們所假設(shè)的那樣完全理性,在遇到高風(fēng)險(xiǎn)的情況下,人們會考慮風(fēng)險(xiǎn),從而使得 最終結(jié)果可能偏離納什均衡戰(zhàn)略。占優(yōu)策略均衡在一些特殊博弈中,一個(gè)局中人的最優(yōu)策略選擇可能并不依賴于其他局中人的策略選擇,即無論其他局中人選擇 什么策略,他的最優(yōu)策略是唯一的,這種最優(yōu)
8、策略被稱為“占優(yōu)策略”。該策略只要求行動者是理性的,對手是否理性 不作要求。在一個(gè)博弈里,如果所有局中人都有占優(yōu)策略存在,那么占優(yōu)策略均衡是可以預(yù)測到的唯一的均衡,因?yàn)闆]有一 個(gè)理性的局中人會選擇劣策略。(5)重復(fù)剔除占優(yōu)均衡“劣”戰(zhàn)略:無論對方選擇什么,如果自己選擇A得到的收益總是小于選擇B得到的收益,A就是相對于B的劣 戰(zhàn)略。把這個(gè)劣戰(zhàn)略剔除;然后再剔除剩下的博弈中對手的劣戰(zhàn)略;繼續(xù)這個(gè)過程,直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”最初的智豬博弈收益矩陣首先剔除小豬行動劣策略所得的收 其次,再剔除了大豬等待劣策略的 益矩陣為: 智豬博弈均衡
9、(5, 1)(4, 4)(9, -1)(0, 0)小豬大豬 行等動待行動 等待大豬(4, 4)(0, 0)行動等待小豬行動 等待大豬(4, 4)行動等待小豬行動 等待0 階理性共識:每個(gè)人都是理性的,但不知道其他人是否是理性的;1 階理性共識:每個(gè)人是理性的,并且知道其他每個(gè)人也都是理性的,但并不知道其他人是否知道自己是理性 的;2 階理性共識:每個(gè)人是理性的,并且知道其他每個(gè)人也都是理性的,并且知道其他人知道自己是理性的,但不 知道其他人是否知道自己知道其他人都是理性的三階、四階n階依次類推。重復(fù)剔除不僅要求每個(gè)人是理性的,而且要求每個(gè)人知道其他人都是理性的,每個(gè)人知道每個(gè)人知道每個(gè)人是理
10、性的,如此等等,即理性是“共識”。5、經(jīng)典博弈分析|(1)囚徒困境:假定有兩個(gè)犯罪嫌疑人共同作案。警察抓住他們以后,分開拘押,并告訴他們:可以選擇坦白,或是不坦白;如果一個(gè)人坦白,而另一個(gè)人不坦白,則坦白的一方會被立即釋放,而不坦白的一方被判10 年;如果兩人都坦白,則 會每人各判8 年;如果兩人都抵賴,因證據(jù)不足,則每人在關(guān)押1 年后釋放。那么,這兩個(gè)犯罪嫌疑人該如何選擇 呢?該博弈體現(xiàn)了哪種均衡?乙(-8, -8)(0.-10)(-10, 0)(-1, -1)坦白 不坦白坦白 不坦白我們假設(shè)局中人是理性的,都不想坐牢,能少坐牢盡量少坐牢。我們先考慮甲的選擇,他面對的問題是:如果乙坦白的話,
11、自己坦白判8年,不坦白判10年,那么坦白比不坦白好;如果乙不坦白,自己坦白會被立即釋放,不坦白則判1年,坦白還是比不坦白好。因此,不論對方坦白不坦白,甲或乙自己的最優(yōu)選擇都是坦白。由囚徒困境我們 可以看出,一個(gè)人的最優(yōu)選擇并不依賴于他人的選擇,因此囚徒困境博弈有占優(yōu)均衡,所以其結(jié)果很容易預(yù)測。(2)智豬博弈假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的按鈕,按一下按鈕會有 10 個(gè)單位的豬食進(jìn)槽,誰先按按鈕,誰會后到食槽邊。而且按按鈕的那一方就少吃2個(gè)單位的食物(按按鈕的成 本),若大豬按按鈕,那么小豬先到槽邊,大小豬吃到食物的收益比是4:4,如果兩只豬同時(shí)按按
12、鈕,它們同時(shí)到槽 邊,大小豬吃到的食物比是5 : 1 ;如果小豬按按鈕,那么大豬先到槽邊,大小豬吃到的食物比是9:-1;當(dāng)然如果兩 只豬都選擇等待,那么沒有食物進(jìn)入食槽,兩只豬的收益比就為0:0。小豬行動(5, 1)(4, 4)等待(9, -1)(0, 0)行動 等待大豬綜合來看,無論大豬是選擇行動還是等待,小豬的選擇都將是等待,即等待是小豬的占優(yōu)策略。大豬明知小豬不 會去踩踏板,但是去踩踏板總比不踩強(qiáng),所以只好選擇行動了。因此,小豬等待大豬行動是唯一的納什均衡結(jié)果(3)混合戰(zhàn)略納什均衡足球隊(duì)的點(diǎn)球手走向罰球點(diǎn)時(shí)需要做一個(gè)重要決策:踢向網(wǎng)的左邊還是右邊(為了簡單起見,忽略踢向中間或高 球或低平
13、球的選項(xiàng))。守門員將力圖預(yù)測點(diǎn)球手的行為,決定撲向左邊還是右邊。如果他撲向了罰點(diǎn)球的方向,那他 很有可能將球撲出;如果他撲錯(cuò)了方向,那點(diǎn)球手就很可能取得進(jìn)球。再次地,為了簡單起見,假定守門員撲的方向 正確就一定能撲出點(diǎn)球,不正確就會失球。相應(yīng)的支付矩陣:守門員點(diǎn)球手(-1,1)點(diǎn)球被撲出(1, -1)點(diǎn)球被踢進(jìn)(1, -1)點(diǎn)球被踢進(jìn)(-1,1)點(diǎn)球被撲出左右左右顯然,上表4個(gè)策略組合都不會是均衡:給定一方的選擇,另一方有激勵(lì)改變他的選擇。這是一種混合戰(zhàn)略 (mixed strateg,是指根據(jù)預(yù)先決定的概率隨機(jī)選擇不同的行動?;旌蠎?zhàn)略的實(shí)質(zhì)如下:你應(yīng)該在每次罰點(diǎn)球前私 下地通過拋硬幣來決定你
14、罰點(diǎn)球的方向。正面朝上就踢向右邊,反面朝上就踢向左邊;或者反之。如果某個(gè)局中人有n個(gè)純戰(zhàn)略,那么,混合戰(zhàn)略就是在這n個(gè)純戰(zhàn)略上的概率分布(卩山?,,p),即以p的概12 ni率選擇純戰(zhàn)略i,丫 P二1。若p=0,則說明純戰(zhàn)略i被選到的概率為0。iii=1性質(zhì)1:給定對手的均衡混合戰(zhàn)略,每個(gè)局中人的均衡混合戰(zhàn)略中以正概率選擇的純戰(zhàn)略對該局中人是一樣好的 (或者稱為無差異,indifferent)。原因在于,如果某個(gè)純戰(zhàn)略嚴(yán)格地好于其他純戰(zhàn)略,那么,該局中人應(yīng)該以1的概率選擇那個(gè)純戰(zhàn)略,而這與混 合戰(zhàn)略納什均衡是矛盾的。性質(zhì)2:給定對手的均衡混合戰(zhàn)略,每個(gè)局中人的均衡混合戰(zhàn)略中以正概率選擇的純戰(zhàn)略
15、不會比以0概率選擇的 純戰(zhàn)略差。原因在于,如果局中人的均衡混合戰(zhàn)略中以正概率選擇的純戰(zhàn)略比以0概率選擇的純戰(zhàn)略差,那么,該局中人的 那個(gè)所謂均衡混合戰(zhàn)略就不是他的最優(yōu)選擇,這與混合戰(zhàn)略納什均衡矛盾。結(jié)論性評述(1)以上罰點(diǎn)球中的博弈論分析說明,罰丟點(diǎn)球很正常,除非點(diǎn)球手將每個(gè)點(diǎn)球都罰到守門員夠不到的死角。(2)梅西罰丟點(diǎn)球應(yīng)該得到原諒?。?)博弈論的主旨是換位思考。二、實(shí)驗(yàn)?zāi)康耐ㄟ^完全信息靜態(tài)博弈實(shí)驗(yàn),使學(xué)生直接參與博弈游戲并親身感受“囚徒困境”,從而讓學(xué)生進(jìn)一步理解博弈論中的占優(yōu)戰(zhàn)略、納什均衡等有關(guān)概念,并能夠應(yīng)用這些概念分析完全信息靜態(tài)博弈問題。三、實(shí)驗(yàn)過程(一實(shí)驗(yàn)準(zhǔn)備1、實(shí)驗(yàn)材料(撲克牌
16、)一副,用作標(biāo)記實(shí)驗(yàn)參與者身份及編號;2、每位實(shí)驗(yàn)參與者有1份“完全信息靜態(tài)博弈實(shí)驗(yàn)者收益記錄表”,8輪均有完全信息靜態(tài)博弈決策(第X輪?!?;3、工作人員填寫“完全信息靜態(tài)博弈實(shí)驗(yàn)記錄表”、“完全信息靜態(tài)博弈實(shí)驗(yàn)數(shù)據(jù)匯總表”、“完全信息靜態(tài)博弈實(shí)驗(yàn) 全班收益匯總表”。(二)實(shí)驗(yàn)人員分組1、抽取4-5人為試驗(yàn)工作人員,保證全班按照偶數(shù)原則落實(shí)實(shí)驗(yàn)參與者。2、按紅、黑撲克牌顏色將實(shí)驗(yàn)者分為兩組,編號分別為A1、A2、An;編號分別為B1、B2、Bn。A組坐 教室一邊,B組坐教室另一邊,中間隔離,方便工作人員收發(fā)撲克牌。3、按照特定牌落實(shí)工作人員。實(shí)驗(yàn)規(guī)則1、在博弈過程中不允許合謀、欺詐欺騙等行為發(fā)
17、生,出牌前不能讓對方任何人看到自己的決策;2、每個(gè)實(shí)驗(yàn)者都以追求最大收益為目標(biāo);3、每位實(shí)驗(yàn)參與者在每輪博弈中僅可做出“紅”或“黑”的選擇。4、本實(shí)驗(yàn)分兩個(gè)階段共8輪實(shí)驗(yàn),每輪實(shí)驗(yàn)流程相同。首先,AB兩組工作人員隨機(jī)發(fā)牌,每位實(shí)驗(yàn)參與者需要 確定自己的牌和身份編號。分發(fā)“完全信息靜態(tài)博弈實(shí)驗(yàn)者收益記錄表”每位實(shí)驗(yàn)參與者填寫相關(guān)信息。其次,AB兩 組工作人員分發(fā)“完全信息靜態(tài)博弈決策”,每位實(shí)驗(yàn)參與者填寫“完全信息靜態(tài)博弈決策”,并在“完全信息靜態(tài)博弈實(shí) 驗(yàn)者收益記錄表”中記錄 “我的牌”、“我的編號”、“我的決策”。將填寫好的“完全信息靜態(tài)博弈決策”交給本組的工作人 員。第三,AB組工作人員清
18、點(diǎn)“完全信息靜態(tài)博弈決策”無誤后,交給統(tǒng)計(jì)人員。第四,AB組工作人員回收撲克牌,洗 牌,等待“本輪實(shí)驗(yàn)結(jié)束,開始下一輪實(shí)驗(yàn)”指令。5、教師公布配對博弈規(guī)則,工作人員記錄每輪每對實(shí)驗(yàn)參與者的決策結(jié)果,填寫每一輪的“完全信息靜態(tài)博弈實(shí) 驗(yàn)記錄表”。記錄完畢以后,向全體實(shí)驗(yàn)參與者宣讀配對結(jié)果,全體實(shí)驗(yàn)參與者自行計(jì)算本輪個(gè)人收益,并將結(jié)果填入 “完全信息靜態(tài)博弈實(shí)驗(yàn)者收益記錄表”。8 輪實(shí)驗(yàn)結(jié)束后,實(shí)驗(yàn)參與者完成“完全信息靜態(tài)博弈實(shí)驗(yàn)者收益記錄表”,并 交到各自組工作人員。AB組工作人員清點(diǎn)無誤后,交給統(tǒng)計(jì)人員。6、工作人員應(yīng)及時(shí)匯總、計(jì)算實(shí)驗(yàn)數(shù)據(jù),完成“完全信息靜態(tài)博弈實(shí)驗(yàn)數(shù)據(jù)匯總表”和“完全信息靜
19、態(tài)博弈實(shí)驗(yàn)全班 收益匯總表”,并予以發(fā)布。4、工作人員須保存好A、B組工作人員移交上來的所有實(shí)驗(yàn)表格,以備匯總統(tǒng)計(jì)和查詢之用。5、實(shí)驗(yàn)參與者的收益為8輪實(shí)驗(yàn)個(gè)人收益總和。A、B組工作人員和統(tǒng)計(jì)人員收益數(shù)值為全班平均收益。7、實(shí)驗(yàn)分為兩個(gè)階段,第一階段進(jìn)行1-4輪博弈, 收益計(jì)算如下:兩人同時(shí)出紅牌,則兩人都將獲得5元收益;兩人同時(shí)出黑牌,則兩人都將獲得6 元收益;兩人出牌花色不同時(shí),出紅的同學(xué)獲得11元收益,出黑的同學(xué)獲得0元收益。第二階段共進(jìn)行博弈 5-8 輪,收益計(jì)算如下:兩人同時(shí)出紅牌,則兩人都將獲得5元收益;兩人同時(shí)出黑牌,則兩人都將獲得11元收益;兩人出牌花色不同時(shí) ,出紅的同學(xué)獲得16 元收益,出黑的同學(xué)獲得0 元收益。四、實(shí)驗(yàn)表格小樣(一)每位實(shí)驗(yàn)參與者填寫1、完全信息靜態(tài)博弈決策(第X輪)姓名我的牌我的編號我的決策2、完全信息靜態(tài)博弈實(shí)驗(yàn)者收益記錄表姓名 班級輪次我的牌我的編號我的決策(黑或紅)對手的決策(黑或紅)我的收益第1輪第2輪第3輪第4輪第5輪第6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024項(xiàng)目融資合同協(xié)議書
- 2025年度中醫(yī)食療研究與推廣合同4篇
- 2025年度特色餐飲連鎖品牌授權(quán)合同3篇
- 2025年度生態(tài)修復(fù)工程承包商借款合同范本4篇
- 2025年度數(shù)據(jù)中心運(yùn)維外包合同4篇
- 2025年度體育用品代理服務(wù)合同模板4篇
- 2025年度物流車輛環(huán)保排放檢測合同4篇
- 2025年度人工智能技術(shù)應(yīng)用與開發(fā)合同2篇
- 2024版全新銷售擔(dān)保合同范本下載
- 2025年度新能源汽車充電站車位銷售與管理協(xié)議4篇
- 專升本英語閱讀理解50篇
- 施工單位值班人員安全交底和要求
- 中國保險(xiǎn)用戶需求趨勢洞察報(bào)告
- 數(shù)字化轉(zhuǎn)型指南 星展銀行如何成為“全球最佳銀行”
- 中餐烹飪技法大全
- 靈芝孢子油減毒作用課件
- 現(xiàn)場工藝紀(jì)律檢查表
- 醫(yī)院品管圈與護(hù)理質(zhì)量持續(xù)改進(jìn)PDCA案例降低ICU病人失禁性皮炎發(fā)生率
- 新型電力系統(tǒng)研究
- 烘干廠股東合作協(xié)議書
- 法院服務(wù)外包投標(biāo)方案(技術(shù)標(biāo))
評論
0/150
提交評論