


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一次性n人英烈人的叛逆愿度
0內(nèi)外合作與方域博弈自1950年唐克教授為心理學(xué)雜志開(kāi)設(shè)了一個(gè)例子以來(lái),他在賭博和經(jīng)濟(jì)方面產(chǎn)生了深遠(yuǎn)的影響。中心問(wèn)題是“囚徒”們?nèi)绾巫叱隼Ь硢?wèn)題的研究,大部分都是關(guān)于重復(fù)博弈的,例如文獻(xiàn)如,也有一些一次性博弈的,例如文獻(xiàn)。在n人囚徒困境中,每個(gè)參與人(“囚徒”)都恰有兩個(gè)純策略——合作與背叛,因此這種博弈是n人雙行動(dòng)博弈,姜殿玉()專門(mén)研究了雙行動(dòng)n人博弈的局勢(shì)分析問(wèn)題。本文試圖研究在一種懲罰機(jī)制下,一次性n人囚徒困境的背叛與合作行為。研究表明,“囚徒”愿意合作的程度與背叛懲罰機(jī)制與博弈的參數(shù)有關(guān),用所得到的結(jié)論研究文獻(xiàn)中大量出現(xiàn)的囚徒困境問(wèn)題,其結(jié)論是非常合理的。1.各參與人的博弈模型定義1n人囚徒困境定義為?!訹N,(Ai),(ui)],其中N={1,2,…n}是參與人的集合,Ai={Di,Ci}是參與人i的純策略集合,其中Di和Ci分別是參與人i的策略——背叛和合作,記a=an…a1∈A=∏i∈NAi,a-1=an…ai+1ai-1…a1∈A-1=∏j∈Ni}Aj,當(dāng)參與人i使用Di和Ci時(shí),他的贏得效用分別為ui(a?i,Di)={δia?i≠D?iβia?i=D?i?ui(a?i,Ci)={αia?i≠C?iγia?i=C?i?αi<βi<γi<δi??i∈Nui(a-i,Di)={δia-i≠D-iβia-i=D-i?ui(a-i,Ci)={αia-i≠C-iγia-i=C-i?αi<βi<γi<δi??i∈Ν這個(gè)博弈模型解釋為,當(dāng)全體參與人都選擇背叛時(shí),參與人i的利益是βi;當(dāng)全體參與人都選擇合作時(shí),參與人i的利益是γi;當(dāng)既有背叛的,又有合作的時(shí),背叛的參與人i得到最好的利益δi,合作的參與人j得到最壞的利益αj。特別當(dāng)n=2,δ1=δ2=0,γ1=γ2=-γ,β1=β2=-β,α1=α2=-α,0<γ<β<α?xí)r,就成為文獻(xiàn)中經(jīng)常出現(xiàn)的(2人)囚徒困境的一般情形。定理1對(duì)于n人囚徒困境,我們有ui(a-i,Di)>ui(a-i,Ci),?i∈N,?a-i∈A-i。證明情況1:當(dāng)a-i=D-i時(shí),有ui(a-i,Di)=ui(D-i,Di)=βi>αi=ui(D-i,Ci)=ui(a-i,Ci)情況2:當(dāng)a-i≠C-i、D-i時(shí),有ui(a-i,Di)=δi>αi=ui(a-i,Di)情況3:當(dāng)a-i=C-i時(shí),有ui(a-i,Di)=ui(C-i,Di)=δi>γi=ui(C-i,Ci)=ui(a-i,Ci)定理1說(shuō)明,對(duì)于任意參與人,無(wú)論其他參與人使用什么策略,他使用背叛策略Di都優(yōu)于使用合作策略Ci。因此從個(gè)體利益出發(fā),全體參與人必然都使用背叛策略Di。此時(shí),參與人i的贏得是βi。但是如果大家都使用合作策略Ci,則每個(gè)參與人i的贏得為γi>βi。這說(shuō)明合作優(yōu)于各顧各。2違背懲罰函數(shù)的定義當(dāng)僅有參與人i背叛時(shí),他由背叛所得到的利益為ui(C-i,Di)-ui(C-i,Ci)=δi-γi,其他參與人j(j≠i)的損失為|uj(C1…Ci-1DiCi+1…Cj…Cn)-uj(C-j,Cj)|=|αj-γj|=γj-αj定義2P=kx(k≥0,x>0)稱為背叛懲罰函數(shù),意為給參與人j造成的損失由背叛者承擔(dān)k(γj-αj),其中k稱為(對(duì)背叛者的)懲罰力度。由于不可能背叛者給某個(gè)非背叛者造成的損失越大,他受到的懲罰就越小,所以k≥0。3有被違者的矛盾行為的參與人i當(dāng)i所獲得的利益可以賠償全體不背叛的參與人時(shí),有δi-γi≥k∑j∈Ni}(γj-αj)。此時(shí)參與人i有積極性背叛,且右端越小或者左邊越大,積極性越高。當(dāng)參與人i的獲利不能賠償全體不背叛的參與人時(shí),有δi-γi<k∑j∈Ni}(γj-αj)。此時(shí)參與人i沒(méi)有積極性背叛,且右端越小或者左邊越大,不背叛的積極性越高。定義3Di(k)=1-k∑j∈Ni}(γj-αj)/(δi-γi)表示參與人i背叛的積極性的大小,稱為參與人i的背叛愿意度。定理2當(dāng)0≤Di(k)≤1時(shí),參與人i愿意背叛,且Di(k)越大,參與人i的愿意背叛的程度越大。特別,當(dāng)Di(k)=0時(shí),參與人i是否背叛結(jié)果一樣。當(dāng)Di(k)<0時(shí),-Di(k)越大,參與人i的合作的積極性就越大。定理3計(jì)算每個(gè)參與人的背叛度。如果至少有一個(gè)參與人愿意背叛,那么大家都背叛;如果全體參與人都愿意合作,則合作成功。為使大家都不背叛,公共背叛懲罰力度k一般盡量設(shè)計(jì)得足夠大。例如,(1)在戰(zhàn)場(chǎng)上,長(zhǎng)官遇到逃兵則就地正法。(2)k可以表示社會(huì)道德水平(自律意識(shí)),例如社會(huì)道德水平較高的人都會(huì)自動(dòng)排隊(duì)買(mǎi)票——加塞會(huì)受到道德的譴責(zé);否則將陷入囚徒困境——大家買(mǎi)票都困難。(3)k可表示江湖上的義氣程度或江湖幫規(guī)等約束機(jī)制。特別當(dāng)k=0時(shí),Di(k)=1。說(shuō)明當(dāng)無(wú)懲罰機(jī)制時(shí),參與人i愿意背叛的程度最大。4兩個(gè)囚徒不同合作時(shí)的比較例1考察如下囚徒困境中的背叛積極性解我們有Di(k)=1-[-1-(-10)]k/[0-(-1)]=1-9k,i=1,2。當(dāng)0≤k≤1/9時(shí),0≤Di(k)≤1,此時(shí)每個(gè)囚徒都愿意背叛,k越小,即懲罰越輕,Di(k)越大,兩個(gè)囚徒都越愿意背叛。當(dāng)k>1/9時(shí),Di(k)<0,此時(shí)每個(gè)囚徒都不愿意背叛,即都愿意合作。k值越大,即對(duì)背叛者懲罰越嚴(yán)厲,-Di(k)越大,兩個(gè)囚徒越愿意合作。例2考察如下囚徒困境中的背叛積極性解:我們有Di(k)=1-[-6-(-10)]k/[0-(-6)]=1-2k/3,i=1,2。當(dāng)0≤k≤3/2時(shí),0≤Di(k)≤1,此時(shí)每個(gè)囚徒都愿意背叛,k越小,即懲罰越輕,Di(k)越大,兩個(gè)囚徒都越愿意背叛。當(dāng)k>3/2時(shí),Di(k)<0,此時(shí)每個(gè)囚徒都不愿意背叛,即都愿意合作。k值越大,即背叛懲罰越嚴(yán)厲,-Di(k)越大,兩個(gè)囚徒越愿意合作。例1中的嚴(yán)厲度區(qū)域比例2中的小得多。這說(shuō)明在例2中兩個(gè)囚徒比例1中的兩個(gè)囚徒容易背叛。直觀看來(lái),在例1中,兩個(gè)囚徒合作與都背叛每人的利益差是7年,而例2中則是2年。因此例2中的囚徒合作積極性較小,因此例2中的囚徒比例1中的容易背叛。一般文獻(xiàn)中都假定囚徒困境無(wú)懲罰機(jī)制,即k=0,因此兩個(gè)囚徒都選擇背叛。例3(三人囚徒困境)甲乙丙(依次編號(hào)1、2、3)三人合伙作案時(shí)被警察抓住,并從其身上搜出一些證據(jù)。為了進(jìn)一步調(diào)查他們的罪行,警察將他們隔離審訊并根據(jù)搜出的有關(guān)證據(jù)告訴他們:如果都如實(shí)招供以前所犯罪行,三人依次判刑3、2和3年;如果三人都抵賴,因?yàn)檎也坏狡渌C據(jù),依次判刑2、1和2年;如果甲和乙都抵賴,而丙招供,則依次判刑5、3和1年;如果甲和丙抵賴,而乙招供,則甲和丙分別判刑5和4年,乙被釋放;如果僅僅甲抵賴,而乙和丙都招供,則甲和丙分別判刑5和1年,乙被釋放;如果僅僅甲招供而乙和丙都抵賴,則三人依次判刑1、3和4年;如果僅僅乙抵賴而甲和丙都招供,則三人依次判刑1、3和1年;如果僅僅丙抵賴,而甲和乙都招供,則甲和丙分別被判刑1和4年,而乙被釋放。假設(shè)他們有嚴(yán)格的幫規(guī):幾個(gè)人同時(shí)被抓時(shí)招供者被懲罰每個(gè)抵賴者損失的(1)22.5%,(2)50%,試分別研究這三個(gè)人的博弈結(jié)果。解可以求得(α1,β1,γ1,δ1)=(-5,-3,-2,-1),(α2,β2,γ2,δ2)=(-3,-2,-1,0),(α3,β3,γ3,δ3)=(-4,-3,-2,-1)。(1)當(dāng)懲罰力度為k=22.5%時(shí),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 浙江國(guó)企招聘2024臺(tái)州溫嶺市金達(dá)建設(shè)有限公司招聘1人筆試參考題庫(kù)附帶答案詳解
- 【社招+校招】招232人江西國(guó)泰集團(tuán)股份有限公司子公司2025年招聘筆試參考題庫(kù)附帶答案詳解
- 地質(zhì)安全知識(shí)培訓(xùn)課件
- 交互英語(yǔ)知到智慧樹(shù)章節(jié)測(cè)試課后答案2024年秋麗水學(xué)院
- 2025寧夏銀川威力傳動(dòng)技術(shù)股份有限公司招聘811人筆試參考題庫(kù)附帶答案詳解
- 2025中國(guó)航空集團(tuán)有限公司飛行員招募筆試參考題庫(kù)附帶答案詳解
- 2025年上半年信陽(yáng)浉河區(qū)五星辦事處招考治安巡防隊(duì)員易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年佛山市職業(yè)病防治所招考輔助服務(wù)雇員易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年人民日?qǐng)?bào)社校園招聘72人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年上半年云南省楚雄州事業(yè)單位招考易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 建筑消防性能化設(shè)計(jì)評(píng)估課件
- DB32T4220-2022消防設(shè)施物聯(lián)網(wǎng)系統(tǒng)技術(shù)規(guī)范-(高清版)
- (新版)老年人健康管理理論考試題庫(kù)(含答案)
- 感應(yīng)加熱操作規(guī)程
- 煤氣設(shè)施安全檢查表(修訂)
- 二DNA的結(jié)構(gòu)和復(fù)制課件
- XX省血液調(diào)配管理辦法
- 微信開(kāi)放平臺(tái)網(wǎng)站信息登記表
- 腦病科中醫(yī)疾病護(hù)理常規(guī)(精)
- JJG 700 -2016氣相色譜儀檢定規(guī)程-(高清現(xiàn)行)
- 壓力容器安全檢查表
評(píng)論
0/150
提交評(píng)論