S-囚徒困境與社會(huì)的基本問題課件

上傳人：上*** IP屬地：江蘇上傳時(shí)間：2022-12-15 格式：PPT 頁(yè)數(shù)：39 大?。?.88MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩34頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

囚徒困境與社會(huì)的

基本問題“我們有望得到晚餐并非源于屠夫、釀酒師或面包師的仁慈，而是源于他們關(guān)心自己的私利?！薄獊啴?dāng)斯·斯密“合作現(xiàn)象隨處可見，它是文明的基礎(chǔ)?！薄_伯特·阿克塞爾羅德人類社會(huì)的兩個(gè)公理自利是人的天性合作是社會(huì)的基礎(chǔ)（一）“囚徒困境”模型的起源“囚徒困境”模型是是博弈論中最經(jīng)典、最著名的模型，由普林斯頓大學(xué)數(shù)學(xué)系主任塔克（Tucker）1950年提出的；該博弈本身講的是一個(gè)法律刑偵或犯罪學(xué)方面的問題，但可以擴(kuò)展到許多經(jīng)濟(jì)問題，以及各種社會(huì)問題，可以揭示人類社會(huì)合作失敗的重要原因。（二）囚徒困境的基本模型-5，-50，-8-8，0-1，-1坦白不坦白坦白不坦白兩個(gè)罪犯的支付矩陣囚徒2囚徒1囚徒1：坦白囚徒2：坦白一般意義：囚徒困境博弈既揭示了個(gè)體理性與集體理性之間的矛盾——從個(gè)體利益出發(fā)的行為不能實(shí)現(xiàn)團(tuán)體的最大利益，同時(shí)也揭示了個(gè)體理性本身的內(nèi)在矛盾——從個(gè)體利益出發(fā)的行為最終也不一定能真正實(shí)現(xiàn)個(gè)體的最大利益，甚至?xí)玫较喈?dāng)差的結(jié)果。（三）囚徒困境的模型的意義二、社會(huì)的基本問題三、關(guān)于這一問題的重要思想（一）西方古典社會(huì)契約理論1.霍布斯的“利維坦”理論人類的自利與欲望→避免“自然狀態(tài)”下的“所有人對(duì)所有人的戰(zhàn)爭(zhēng)”→“利維坦”→社會(huì)合作沒有利維坦（“作為國(guó)家政府的集權(quán)體制機(jī)構(gòu)”）的存在，人類合作將使不可能產(chǎn)生的，因此一個(gè)強(qiáng)權(quán)的政府機(jī)構(gòu)是必要的。（一）西方古典社會(huì)契約理論3.西方古典社會(huì)契約理論的一個(gè)基本假設(shè)一個(gè)具有共同利益的群體會(huì)在某種外在強(qiáng)制力量和社會(huì)安排下為實(shí)現(xiàn)共同利益而采取集體行動(dòng)，并且這要么導(dǎo)致君主專制，要么達(dá)致共和獨(dú)裁。亦即，只有通過外部的強(qiáng)制力量才能確保自利的個(gè)人實(shí)現(xiàn)社會(huì)合作。（二）奧爾森的“集體行動(dòng)的邏輯”由具有自利傾向的理性“經(jīng)濟(jì)人”組成的集體中，因“搭便車”行為而難以實(shí)現(xiàn)合作：人人都想分享集體行動(dòng)的成果，但不愿分擔(dān)集體行動(dòng)的成本。集體越大，越難克服“搭便車”行為。（二）奧爾森的“集體行動(dòng)的邏輯”“除非一個(gè)集團(tuán)中人數(shù)很少，或者除非存在強(qiáng)制或其他某些特殊手段以使個(gè)人按照他們的共同利益行事，有理性的，尋求自我利益的個(gè)人不會(huì)采取行動(dòng)以實(shí)現(xiàn)他們共同的集團(tuán)的利益?！保∣lson，1980）四、阿克塞爾羅德

“重復(fù)囚徒困境博弈計(jì)算機(jī)

程序奧林匹克競(jìng)賽”羅伯特·阿克塞爾羅德1964年獲得芝加哥大學(xué)數(shù)學(xué)學(xué)士，1966年和1969年相繼從耶魯大學(xué)獲得政治學(xué)碩士和博士學(xué)位。現(xiàn)任密歇根大學(xué)政治學(xué)與公共政策學(xué)院教授，美國(guó)科學(xué)院院士，著名的行為分析及博弈論專家。（二）第一屆競(jìng)賽1.過程14個(gè)策略程序+1個(gè)隨機(jī)程序（隨機(jī)選擇“合作”或“背叛”）；225場(chǎng)比賽，每個(gè)比賽200回合；最大收益：15場(chǎng)×200回合×5分=15000分（（D，C）或（C，D））；最小收益：15場(chǎng)×200回合×0分=0分（（D，C）或（C，D））；基礎(chǔ)收益：每場(chǎng)200回合全部選擇（C，C），即雙方合作，收益為600分；

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（二）第一屆競(jìng)賽2.結(jié)果第一名：加拿大多倫多大學(xué)博弈論心理學(xué)家阿納托爾?拉波波特（AnatolRapoport）提出的“一報(bào)還一報(bào)（titfortat，TFT）：第一回合選擇“合作”，然后每一回合重復(fù)對(duì)手的上一個(gè)回合策略?！耙粓?bào)還一報(bào)”策略的平均分為504.5，即600基準(zhǔn)分的84%，其他8個(gè)好的策略中，得基準(zhǔn)分的28.4%和83.4%之間。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（三）第二屆競(jìng)賽1.過程62個(gè)策略程序+1個(gè)隨機(jī)程序（隨機(jī)選擇“合作”或“背叛”）其中包括“一報(bào)還一報(bào)”策略，以及著名的生物學(xué)家、演化博弈論的奠基人約翰?梅納德?史密斯（JohnMaynardSmith）的“超級(jí)寬恕”程序——“兩怨換一報(bào)”策略。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（三）第二屆競(jìng)賽2.結(jié)果整體而言，“善良”的策略再次普遍表現(xiàn)得比“狡詐”的策略好。前15名中只有一個(gè)不是“善良”的策略，最后15名中只有一個(gè)不是“狡詐”策略。其中，“一報(bào)還一報(bào)”策略再次獲得第一名，并且獲得了基準(zhǔn)分的96%；而“兩怨換一報(bào)”的策略“死的很慘”。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（四）第三屆競(jìng)賽2.結(jié)果所有“狡詐型”策略都在200代左右完全消失。“一報(bào)還一報(bào)”策略和另外5種“善良但不怯弱”的策略獲得了成功。

策略i策略j

C（合作）D（背叛）C（合作）R=3，R=3S=0，T=5D（背叛）T=5，S=0P=1，P=1（五）三屆競(jìng)賽的結(jié)論1.善良的策略總不首先背叛。2.友誼對(duì)基于回報(bào)的合作的產(chǎn)生并不是必要的：“在合適的環(huán)境下，合作甚至可以在敵對(duì)者之間產(chǎn)生?！?.合作的基礎(chǔ)不是真正的信任，而是關(guān)系的持續(xù)性。從長(zhǎng)遠(yuǎn)來看，雙方建立穩(wěn)定的合作模式的條件是否成熟比雙方是否相互信任來得重要。4.在適當(dāng)?shù)臈l件下，合作確實(shí)能夠從沒有集權(quán)的自私自利的世界中產(chǎn)生。進(jìn)一步閱讀的材料亞當(dāng)·斯密.國(guó)民財(cái)富的性質(zhì)和原因的研究（上下冊(cè)），商務(wù)印書館，1974.理查德·道金斯.自私的基因，中信出版集團(tuán)股份有限公司，2012.曼瑟爾·奧爾森.集體行動(dòng)的邏輯，格致出版社，2011.霍布斯.利維坦，商務(wù)印書館，1985.盧梭.社會(huì)契約論，商務(wù)印書館，2011.阿克塞爾羅德.合作的復(fù)雜性，上海人民出版社，2008.阿克塞爾羅德.合作的進(jìn)化，上海人民出版社，2007.謝識(shí)予.經(jīng)濟(jì)博弈論，復(fù)旦大學(xué)出版社，2008.赫伯特·金迪斯等.走向統(tǒng)一的社會(huì)科學(xué)，上海世紀(jì)出版集團(tuán)，2005赫伯特·金迪斯.理性的邊界，格致出版社，2011（一）合作與激勵(lì)合作問題的實(shí)質(zhì)個(gè)體理性與集體理性的矛盾個(gè)人行為與社會(huì)利益的沖突如何把個(gè)人行為與社會(huì)利益統(tǒng)一起來，即實(shí)現(xiàn)合作？激勵(lì)(incentive)物質(zhì)手段（實(shí)施條件：掌握財(cái)富、信息、能力、公正的第三方）非物質(zhì)的手段（二）合作與懲罰1.在長(zhǎng)期的重復(fù)博弈關(guān)系中人們之所以可能會(huì)實(shí)現(xiàn)合作，是因?yàn)橹匾曃磥硎找?，不?huì)為了短期利益而做出有損未來收益的當(dāng)前行為。換言之，對(duì)未來的態(tài)度決定了當(dāng)前的行為；2.正因?yàn)榇?，如果在長(zhǎng)期的重復(fù)博弈關(guān)系中有背叛或不合作行為的出現(xiàn)，懲罰可能會(huì)成為實(shí)現(xiàn)合作的有效手段；3.重復(fù)博弈中懲罰的兩種策略：針鋒相對(duì)（tit-for-tat）：每一次的行動(dòng)都建立在對(duì)手前一次行動(dòng)的基礎(chǔ)上。（二）合作與懲罰3.重復(fù)博弈中懲罰的兩種策略：觸發(fā)策略（triggerstrategy）或冷酷策略：合作中如果有任何一方采取一次背叛或不合作行為，其他博弈方就永遠(yuǎn)不與其合作。以上兩種都是對(duì)不合作行為的懲罰，根據(jù)博弈論專家的社會(huì)實(shí)驗(yàn)，第一種方法有效性更高。（二）合作與懲罰4.但是不是所有的懲罰都有效：①懲罰對(duì)方的同時(shí)也懲罰了自己（觸發(fā)策略）；②實(shí)施懲罰的條件不可信。案例：懲罰不可信博弈（二）合作與懲罰5.嚴(yán)厲可信懲罰戰(zhàn)略究竟什么樣的懲罰最有利于鼓勵(lì)人們合作？Abreu（1986）在“ExternalEquilibriaofOligopolisticSupergame”一文中指出，當(dāng)發(fā)現(xiàn)對(duì)方有不合作行為時(shí)，對(duì)對(duì)方的懲罰足夠長(zhǎng)、足夠大，并對(duì)實(shí)施處罰的人來說是最優(yōu)的，即“嚴(yán)厲可信懲罰戰(zhàn)略”（thestrongestcrediblepunishment）。（二）合作與懲罰6.不確定性下的最優(yōu)懲罰在確定的情況下，懲罰越嚴(yán)厲，越有助于合作。因?yàn)榇_定情況下，欺騙從來不會(huì)發(fā)生，所以懲罰實(shí)際上是沒有成本的。但在不確定的情況下，即使每個(gè)人都選擇合作，“壞結(jié)果”也會(huì)出現(xiàn)。如果壞結(jié)果總是觸發(fā)懲罰，就會(huì)冤枉好人，過重的懲罰反到導(dǎo)致不合作；但如果總是原諒，合作也不會(huì)發(fā)生。這就有一個(gè)“最優(yōu)懲罰”的問題。（二）合作與懲罰系安全帶會(huì)導(dǎo)致事故概率提高嗎？例如

人人文庫(kù)> 全部分類> 行業(yè)資料 > 醫(yī)學(xué)制藥

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

S-囚徒困境與社會(huì)的基本問題課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

S-囚徒困境與社會(huì)的基本問題課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔