石頭,剪刀,布三人博弈_第1頁
石頭,剪刀,布三人博弈_第2頁
石頭,剪刀,布三人博弈_第3頁
石頭,剪刀,布三人博弈_第4頁
石頭,剪刀,布三人博弈_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

(一)“石頭,剪刀,布”游戲

(Rock,Scissor,Paper)思考:

雙方應(yīng)該怎么選擇才是最優(yōu)的?

是否存在絕對致勝的方法?

我們總是在選擇自己的戰(zhàn)略前試圖猜中對手的行動選擇;同時,我們又會力圖避免自己的選擇被對方猜中,還要根據(jù)自己對對方行動的事前預(yù)測來做出最優(yōu)的行動選擇,即這樣的游戲行動選擇帶有隨機性。(二)著名的“囚徒困境”

(Prisoners’Dilemma)

假設(shè)有兩個小偷聯(lián)合犯事,私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行單獨審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩人都認罪,則各被判刑8年。如果一人認罪,另一人不認,則認罪者立即釋放,不認罪者加重判刑至10年。如果兩人都不認罪,則警方因證據(jù)不足不能判兩人有罪,但可以因私入民宅的罪名將兩人各判入獄一年。并且,每個小偷都被告知,他的同伙也面對著同樣的政策。想想:

他們會如何選擇,最終的決策結(jié)果會是什么?分析:

這個模型有如下要素:1.兩個小偷必須在不知道對方的選擇的情況下獨立進行自己的決策2.雙方都會為自己的利益考慮,即使自己的盈利最大化將雙方的具體選擇和相應(yīng)的結(jié)果描述如下:-8-80-10-100-1-12認罪不認罪認罪1不認罪對1來說無論2選擇什么,他選擇‘認罪’總是最優(yōu)的,根據(jù)對稱性,對于2,‘認罪’也是最優(yōu)的,所以模型的最終選擇結(jié)果是(認罪,認罪)但是,實際上,顯然(不認罪,不認罪)是對雙方最好的結(jié)果。所以,在個人理性與集體理性之間存在不一致性。我們假定兩個小偷都只在乎各自的刑期,且盈利等于刑期的相反數(shù)博弈與決策:

博弈是建立在相互猜測對方的決策過程基礎(chǔ)上的決策,即是“互動性”的決策。

博弈論是建立在理性人的假設(shè)基礎(chǔ)之上(理性人一般是指主體所追求的唯一目標是自身經(jīng)濟利益的最大化),

博弈論考慮游戲中的個體的預(yù)測行為和實際行為,并研究它們的優(yōu)化策略,被廣泛應(yīng)用到經(jīng)濟活動和其他社會科學領(lǐng)域當中。上述兩個例子,其實都可以被描述為一局博弈,而且都是二人博弈(只有兩個參與者),其中隱含了時間的動態(tài)性質(zhì),被稱為靜態(tài)戰(zhàn)略式博弈。下面我們給出博弈模型的戰(zhàn)略式數(shù)學描述GameTheory

局中人(Players):可以是個人也可以是團體、組織等,在博弈論中假定局中人是理性人。行動空間(Actionspace):每個局中人都有一行動集,而每個人在自己的行動集當中的選擇所構(gòu)成的一組策略,被稱為行動空間,即上述

A。盈利函數(shù)(效用函數(shù)Payofffunction):指局中人從博弈中獲得的效用水平,大多是數(shù)值型的,來表示自己在一局博弈當中的盈利。顯然,它是A的函數(shù),并且滿足線性變換。(

Rock,Scissor,Paper)

001-1-11-11001-11-1-11002石頭剪刀布

石頭剪刀布(Rock,Scissor,Paper)

顯然,從支付矩陣上看,不存在一個對雙方都是最優(yōu)的決策,但是無論雙方的選擇是什么,各自的效用函數(shù)之和總是為零。這樣的博弈稱為二人零和博弈那么我們怎么選擇才能使自己的盈利最大呢?既然,局中人的行動具有隨機性,我們對每一行動選擇賦予概率,組成該博弈的混合戰(zhàn)略。

局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效用(等價于最大化自己的期望效用,因為是零和博弈),根據(jù)二人零和博弈理論,1和2的決策問題變?yōu)椋?/p>

在博弈理論中,納什均衡是一個非常重要的概念,它表達了博弈的基本原理,我們簡單地給出它的定義:

對二人博弈,用計算機求解納什均衡常用的Lemke-Howson算法主要運用下述定理:LINGO程序如下:model:sets:k/1..3/:p;n/1..3/:q;pay(k,n):Ma,Mb;endsetsdata:Ma=01-1

-101

1-10;Mb=0-1110-1-110;enddatava=@sum(pay(i,j):Ma(i,j)*p(i)*q(j));vb=@sum(pay(i,j):Mb(i,j)*p(i)*q(j));@for(k(i):@sum(n(j):Ma(i,j)*q(j))<=va);@for(n(j):@sum(k(i):Mb(i,j)*p(i))<=vb);@sum(k:p)=1;@sum(n:q)=1;@free(va);@free(vb);End運行結(jié)果:VariableValue

VA0.000000

VB0.000000

P(1)0.3333333

P(2)0.3333333

P(3)0.3333333

Q(1)0.3333333

Q(2)0.3333333

Q(3)0.3333333

1.我們可以這么理解該游戲的混合戰(zhàn)略,當每個人以同等的概率隨機的選擇時,他們認為這三個行動一樣好,即沒有對哪個的偏好,此時對于對方的選擇,你選擇哪一個行動所獲得的期望效用是相同的,所以你選擇哪個是無差別的。2.對于該游戲,我們選取的效用函數(shù)構(gòu)成了零和博弈(Zero-SumGame),但是如果局中人的效用之和不為零,我們不能根據(jù)最小最大定理簡單地去分析和計算,但是我們可以根據(jù)納什均衡的定義去求解。我現(xiàn)在要求是三個人玩呢?(”Rock,Scissor,Paper”forthreepeople)拆分成三個二維矩陣:對于某一局中人1有23石頭剪刀布石頭0,0,01,1,-1-1,-1,1剪刀1,-1,11,-1,-10,0,0布-1,1,-10,0,0-1,1,1石頭:23石頭剪刀布石頭-1,1,1-1,1,-10,0,0剪刀-1,-1,10,0,01,1,-1布0,0,01,-1,11,-1,-1剪刀:23石頭剪刀布石頭1,-1,-10,0,01,-1,1剪刀0,0,0-1,1,1-1,1,-1布1,1,-1-1,-1,10,0,0布:

進一步分析:局中人的選擇和盈利是對稱的,所以我們考慮的局中人1怎么選讓自己的盈利最大,對于2和3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論