S-囚徒困境與社會(huì)的基本問題課件_第1頁(yè)
S-囚徒困境與社會(huì)的基本問題課件_第2頁(yè)
S-囚徒困境與社會(huì)的基本問題課件_第3頁(yè)
S-囚徒困境與社會(huì)的基本問題課件_第4頁(yè)
S-囚徒困境與社會(huì)的基本問題課件_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

囚徒困境與社會(huì)的

基本問題“我們有望得到晚餐并非源于屠夫、釀酒師或面包師的仁慈,而是源于他們關(guān)心自己的私利?!薄獊啴?dāng)斯·斯密“合作現(xiàn)象隨處可見,它是文明的基礎(chǔ)?!薄_伯特·阿克塞爾羅德人類社會(huì)的兩個(gè)公理自利是人的天性合作是社會(huì)的基礎(chǔ)(一)“囚徒困境”模型的起源“囚徒困境”模型是是博弈論中最經(jīng)典、最著名的模型,由普林斯頓大學(xué)數(shù)學(xué)系主任塔克(Tucker)1950年提出的;該博弈本身講的是一個(gè)法律刑偵或犯罪學(xué)方面的問題,但可以擴(kuò)展到許多經(jīng)濟(jì)問題,以及各種社會(huì)問題,可以揭示人類社會(huì)合作失敗的重要原因。(二)囚徒困境的基本模型-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白兩個(gè)罪犯的支付矩陣囚徒2囚徒1囚徒1:坦白囚徒2:坦白一般意義:囚徒困境博弈既揭示了個(gè)體理性與集體理性之間的矛盾——從個(gè)體利益出發(fā)的行為不能實(shí)現(xiàn)團(tuán)體的最大利益,同時(shí)也揭示了個(gè)體理性本身的內(nèi)在矛盾——從個(gè)體利益出發(fā)的行為最終也不一定能真正實(shí)現(xiàn)個(gè)體的最大利益,甚至?xí)玫较喈?dāng)差的結(jié)果。(三)囚徒困境的模型的意義二、社會(huì)的基本問題三、關(guān)于這一問題的重要思想(一)西方古典社會(huì)契約理論1.霍布斯的“利維坦”理論人類的自利與欲望→避免“自然狀態(tài)”下的“所有人對(duì)所有人的戰(zhàn)爭(zhēng)”→“利維坦”→社會(huì)合作沒有利維坦(“作為國(guó)家政府的集權(quán)體制機(jī)構(gòu)”)的存在,人類合作將使不可能產(chǎn)生的,因此一個(gè)強(qiáng)權(quán)的政府機(jī)構(gòu)是必要的。(一)西方古典社會(huì)契約理論3.西方古典社會(huì)契約理論的一個(gè)基本假設(shè)一個(gè)具有共同利益的群體會(huì)在某種外在強(qiáng)制力量和社會(huì)安排下為實(shí)現(xiàn)共同利益而采取集體行動(dòng),并且這要么導(dǎo)致君主專制,要么達(dá)致共和獨(dú)裁。亦即,只有通過外部的強(qiáng)制力量才能確保自利的個(gè)人實(shí)現(xiàn)社會(huì)合作。(二)奧爾森的“集體行動(dòng)的邏輯”由具有自利傾向的理性“經(jīng)濟(jì)人”組成的集體中,因“搭便車”行為而難以實(shí)現(xiàn)合作:人人都想分享集體行動(dòng)的成果,但不愿分擔(dān)集體行動(dòng)的成本。集體越大,越難克服“搭便車”行為。(二)奧爾森的“集體行動(dòng)的邏輯”“除非一個(gè)集團(tuán)中人數(shù)很少,或者除非存在強(qiáng)制或其他某些特殊手段以使個(gè)人按照他們的共同利益行事,有理性的,尋求自我利益的個(gè)人不會(huì)采取行動(dòng)以實(shí)現(xiàn)他們共同的集團(tuán)的利益?!保∣lson,1980)四、阿克塞爾羅德

“重復(fù)囚徒困境博弈計(jì)算機(jī)

程序奧林匹克競(jìng)賽”羅伯特·阿克塞爾羅德1964年獲得芝加哥大學(xué)數(shù)學(xué)學(xué)士,1966年和1969年相繼從耶魯大學(xué)獲得政治學(xué)碩士和博士學(xué)位。現(xiàn)任密歇根大學(xué)政治學(xué)與公共政策學(xué)院教授,美國(guó)科學(xué)院院士,著名的行為分析及博弈論專家。(二)第一屆競(jìng)賽1.過程14個(gè)策略程序+1個(gè)隨機(jī)程序(隨機(jī)選擇“合作”或“背叛”);225場(chǎng)比賽,每個(gè)比賽200回合;最大收益:15場(chǎng)×200回合×5分=15000分((D,C)或(C,D));最小收益:15場(chǎng)×200回合×0分=0分((D,C)或(C,D));基礎(chǔ)收益:每場(chǎng)200回合全部選擇(C,C),即雙方合作,收益為600分;

策略i策略j

C(合作)D(背叛)C(合作)R=3,R=3S=0,T=5D(背叛)T=5,S=0P=1,P=1(二)第一屆競(jìng)賽2.結(jié)果第一名:加拿大多倫多大學(xué)博弈論心理學(xué)家阿納托爾?拉波波特(AnatolRapoport)提出的“一報(bào)還一報(bào)(titfortat,TFT):第一回合選擇“合作”,然后每一回合重復(fù)對(duì)手的上一個(gè)回合策略?!耙粓?bào)還一報(bào)”策略的平均分為504.5,即600基準(zhǔn)分的84%,其他8個(gè)好的策略中,得基準(zhǔn)分的28.4%和83.4%之間。

策略i策略j

C(合作)D(背叛)C(合作)R=3,R=3S=0,T=5D(背叛)T=5,S=0P=1,P=1(三)第二屆競(jìng)賽1.過程62個(gè)策略程序+1個(gè)隨機(jī)程序(隨機(jī)選擇“合作”或“背叛”)其中包括“一報(bào)還一報(bào)”策略,以及著名的生物學(xué)家、演化博弈論的奠基人約翰?梅納德?史密斯(JohnMaynardSmith)的“超級(jí)寬恕”程序——“兩怨換一報(bào)”策略。

策略i策略j

C(合作)D(背叛)C(合作)R=3,R=3S=0,T=5D(背叛)T=5,S=0P=1,P=1(三)第二屆競(jìng)賽2.結(jié)果整體而言,“善良”的策略再次普遍表現(xiàn)得比“狡詐”的策略好。前15名中只有一個(gè)不是“善良”的策略,最后15名中只有一個(gè)不是“狡詐”策略。其中,“一報(bào)還一報(bào)”策略再次獲得第一名,并且獲得了基準(zhǔn)分的96%;而“兩怨換一報(bào)”的策略“死的很慘”。

策略i策略j

C(合作)D(背叛)C(合作)R=3,R=3S=0,T=5D(背叛)T=5,S=0P=1,P=1(四)第三屆競(jìng)賽2.結(jié)果所有“狡詐型”策略都在200代左右完全消失。“一報(bào)還一報(bào)”策略和另外5種“善良但不怯弱”的策略獲得了成功。

策略i策略j

C(合作)D(背叛)C(合作)R=3,R=3S=0,T=5D(背叛)T=5,S=0P=1,P=1(五)三屆競(jìng)賽的結(jié)論1.善良的策略總不首先背叛。2.友誼對(duì)基于回報(bào)的合作的產(chǎn)生并不是必要的:“在合適的環(huán)境下,合作甚至可以在敵對(duì)者之間產(chǎn)生?!?.合作的基礎(chǔ)不是真正的信任,而是關(guān)系的持續(xù)性。從長(zhǎng)遠(yuǎn)來看,雙方建立穩(wěn)定的合作模式的條件是否成熟比雙方是否相互信任來得重要。4.在適當(dāng)?shù)臈l件下,合作確實(shí)能夠從沒有集權(quán)的自私自利的世界中產(chǎn)生。進(jìn)一步閱讀的材料亞當(dāng)·斯密.國(guó)民財(cái)富的性質(zhì)和原因的研究(上下冊(cè)),商務(wù)印書館,1974.理查德·道金斯.自私的基因,中信出版集團(tuán)股份有限公司,2012.曼瑟爾·奧爾森.集體行動(dòng)的邏輯,格致出版社,2011.霍布斯.利維坦,商務(wù)印書館,1985.盧梭.社會(huì)契約論,商務(wù)印書館,2011.阿克塞爾羅德.合作的復(fù)雜性,上海人民出版社,2008.阿克塞爾羅德.合作的進(jìn)化,上海人民出版社,2007.謝識(shí)予.經(jīng)濟(jì)博弈論,復(fù)旦大學(xué)出版社,2008.赫伯特·金迪斯等.走向統(tǒng)一的社會(huì)科學(xué),上海世紀(jì)出版集團(tuán),2005赫伯特·金迪斯.理性的邊界,格致出版社,2011(一)合作與激勵(lì)合作問題的實(shí)質(zhì)個(gè)體理性與集體理性的矛盾個(gè)人行為與社會(huì)利益的沖突如何把個(gè)人行為與社會(huì)利益統(tǒng)一起來,即實(shí)現(xiàn)合作?激勵(lì)(incentive)物質(zhì)手段(實(shí)施條件:掌握財(cái)富、信息、能力、公正的第三方)非物質(zhì)的手段(二)合作與懲罰1.在長(zhǎng)期的重復(fù)博弈關(guān)系中人們之所以可能會(huì)實(shí)現(xiàn)合作,是因?yàn)橹匾曃磥硎找?,不?huì)為了短期利益而做出有損未來收益的當(dāng)前行為。換言之,對(duì)未來的態(tài)度決定了當(dāng)前的行為;2.正因?yàn)榇?,如果在長(zhǎng)期的重復(fù)博弈關(guān)系中有背叛或不合作行為的出現(xiàn),懲罰可能會(huì)成為實(shí)現(xiàn)合作的有效手段;3.重復(fù)博弈中懲罰的兩種策略:針鋒相對(duì)(tit-for-tat):每一次的行動(dòng)都建立在對(duì)手前一次行動(dòng)的基礎(chǔ)上。(二)合作與懲罰3.重復(fù)博弈中懲罰的兩種策略:觸發(fā)策略(triggerstrategy)或冷酷策略:合作中如果有任何一方采取一次背叛或不合作行為,其他博弈方就永遠(yuǎn)不與其合作。以上兩種都是對(duì)不合作行為的懲罰,根據(jù)博弈論專家的社會(huì)實(shí)驗(yàn),第一種方法有效性更高。(二)合作與懲罰4.但是不是所有的懲罰都有效:①懲罰對(duì)方的同時(shí)也懲罰了自己(觸發(fā)策略);②實(shí)施懲罰的條件不可信。案例:懲罰不可信博弈(二)合作與懲罰5.嚴(yán)厲可信懲罰戰(zhàn)略究竟什么樣的懲罰最有利于鼓勵(lì)人們合作?Abreu(1986)在“ExternalEquilibriaofOligopolisticSupergame”一文中指出,當(dāng)發(fā)現(xiàn)對(duì)方有不合作行為時(shí),對(duì)對(duì)方的懲罰足夠長(zhǎng)、足夠大,并對(duì)實(shí)施處罰的人來說是最優(yōu)的,即“嚴(yán)厲可信懲罰戰(zhàn)略”(thestrongestcrediblepunishment)。(二)合作與懲罰6.不確定性下的最優(yōu)懲罰在確定的情況下,懲罰越嚴(yán)厲,越有助于合作。因?yàn)榇_定情況下,欺騙從來不會(huì)發(fā)生,所以懲罰實(shí)際上是沒有成本的。但在不確定的情況下,即使每個(gè)人都選擇合作,“壞結(jié)果”也會(huì)出現(xiàn)。如果壞結(jié)果總是觸發(fā)懲罰,就會(huì)冤枉好人,過重的懲罰反到導(dǎo)致不合作;但如果總是原諒,合作也不會(huì)發(fā)生。這就有一個(gè)“最優(yōu)懲罰”的問題。(二)合作與懲罰系安全帶會(huì)導(dǎo)致事故概率提高嗎?例如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論