淺析生活中的囚徒困境

上傳人：s*** IP屬地：天津上傳時間：2022-07-29 格式：DOCX 頁數(shù)：4 大?。?6.90KB 積分：12 舉報 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、淺析生活中的囚徒困境商學(xué)院0908210313工程一班楊鵬內(nèi)容摘要：我們把動物利用大自然移動的癮魂，在決策人期待的空間里，形成相對均衡的語文學(xué)理論，稱為博弈論。博弈論(Game Theory)，亦名“對策論”、“賽局理論”，屬應(yīng)用數(shù)學(xué)的一個分支，近年來,在經(jīng)濟學(xué)中的應(yīng)用越來越廣，近年來的諾貝爾獎不斷授予研究博弈論的人.生活中，博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思想，最經(jīng)典的當(dāng)屬于出現(xiàn)在生活中各處的囚徒理論，探討個體最優(yōu)和整體最優(yōu)的矛盾。、關(guān)鍵詞：博弈論經(jīng)濟學(xué)生活囚徒困境一、博弈論的產(chǎn)生和發(fā)展博弈論思想古已有之，我國古代的孫子兵法就不僅是一部軍事著作，而且算是最早

2、的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負(fù)問題，人們對博弈局勢的把握只停留在經(jīng)驗上，沒有向理論化發(fā)展，正式發(fā)展成一門學(xué)科則是在20世紀(jì)初。1928 年馮諾意曼證明了博弈論的基本原理，從而宣告了博弈論的正式誕生。1944年，馮諾意曼和摩根斯坦共著的劃時代巨著博弈論與經(jīng)濟行為將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟領(lǐng)域，從而奠定了這一學(xué)科的基礎(chǔ)和理論體系。談到博弈論就不能忽略博弈論天才納什，納什的開創(chuàng)性論文n人博弈的均衡點 (1950)，非合作博弈(1951)等等，給出了納什均衡的概念和均衡存在定理。此外，塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。直

3、至博弈圣經(jīng)的出現(xiàn)，博弈圣經(jīng)與原有博弈論書籍最大的不同就在于，獨創(chuàng)了國正論、國正雙贏理論和粒子行為論，書中博弈取勝的文化理論統(tǒng)一了人類的博弈占優(yōu)行為。更重要的是，它讓博弈理論終于可以在現(xiàn)實生活中具體操作，讓普通大眾通過研習(xí)，成為真正的博弈高手。因此，博弈圣經(jīng) 中的博弈理論在政治、經(jīng)濟、文化、生活、娛樂等社會的各個領(lǐng)域具有可應(yīng)用性，并且對于個人的工作、生活也有具體的指導(dǎo)意義。此外，塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論已發(fā)展成一門較完善的的學(xué)科。二、博弈論的基本概念基本假設(shè)“理性人”假設(shè)(hypothesis of rational man )是指作為經(jīng)濟決策的主體都

4、是充滿理智的，既不會感情用事，也不會盲從，而是精于判斷和計算，其行為是理性的。在經(jīng)濟活動中，主體所追求的惟一目標(biāo)是自身經(jīng)濟利益的最優(yōu)化?；疽貨Q策人：在博弈中率先作出決策的一方，這一方往往依據(jù)自身的感受、經(jīng)驗和表面狀態(tài)優(yōu)先采取一種有方向性的行動。對抗者：在博弈二人對局中行動滯后的那個人，與決策人要作出基本反面的決定，并且他的動作是滯后的、默認(rèn)的、被動的，但最終占優(yōu)。他的策略可能依賴于決策人劣勢的策略選擇，占去空間特性，因此對抗是唯一占優(yōu)的方式，實為領(lǐng) 導(dǎo)人的階段性終結(jié)行為。生物親序：所有生物在惡劣、未知的環(huán)境中都有尋找規(guī)律和有序的本能。在博弈中指參與者有從混亂的環(huán)境中等待、尋找有

5、序的親近行為。局中人(players):在一場競賽或博弈中，每一個有決策權(quán)的參與者成為一個局中人。只有兩個局中人的博弈現(xiàn)象稱為“兩人博弈”，而多于兩個局中人的博弈稱為“多人博弈”。策略(strategiges)：一局博弈中，每個局中人都有選擇實際可行的完整的行動方案，即方案不是某階段的行動方案，而是指導(dǎo)整個行動的一個方案，一個局中人的一個可行的自始至終全局籌劃的一個行動方案，稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略，則稱為“有限博弈”，否則稱為“無限博弈”。得失（payoffs）：一局博弈結(jié)局時的結(jié)果稱為得失。每個局中人在一局博弈結(jié) 束時的得失，不僅與

6、該局中人自身所選擇的策略有關(guān)，而且與全局中人所取定的一組策略有關(guān)。所以，一局博弈結(jié)束時每個局中人的“得失”是全體局中人所取定的一組策略的函數(shù)，通常稱為支付（payoff）函數(shù)。次序（orders）:各博弈方的決策有先后之分，且一個博弈方要作不止一次的決策選擇，就出現(xiàn)了次序問題；其他要素相同次序不同，博弈就不同。3.基本類型合作博弈研究人們達(dá)成合作時如何分配合作得到的收益，即收益分配問題。非合作博弈研究人們在利益相互影響的局勢中如何選決策使自己的收益最大，即策略選擇問題。完全信息不完全信息博弈:參與者對所有參與者的策略空間及策略組合下的支付有充了解稱為完全信息；反之，則稱為不完全信息

7、。靜態(tài)博弈和動態(tài)博弈（1）靜態(tài)博弈：指參與者同時采取行動，或者盡管有先后順序，但后行動者不知道先行動者的策略。（2）動態(tài)博弈：指雙方的的行動有先后順序并且后行動者可以知道先行動者的策略。博弈論在經(jīng)濟學(xué)中主要用兩種形式：策略型博弈與展開型博弈，即純策略（局中人確定性地從自己的策略集中選取一個策略）和混和策略（局中人在自己的策略集中隨機地選取策略）三、博弈在當(dāng)今經(jīng)濟中的意義經(jīng)典意義上的經(jīng)濟學(xué),以經(jīng)濟主體人的自利行為以及相應(yīng)的市場反應(yīng)作為研究的出發(fā) 點。無論是消費者還是生產(chǎn)者，也無論是競爭形勢還是壟斷形勢，基本上是經(jīng)濟主體人面對市場作出自己的最優(yōu)決策。無論形勢嚴(yán)峻也好還是寬松也好，行為的結(jié)

8、果是主體人自己決策的結(jié)果。現(xiàn)代經(jīng)濟活動早已超出上述模式。競爭的結(jié)果是許多行業(yè)都剩下少數(shù)幾家企業(yè)每一方的市場份額都很大，每一個主體人的行為后果，受對手的行為的影響很大。博弈論就是研究利益沖突的主體人的對局的理論。現(xiàn)代經(jīng)濟學(xué)的創(chuàng)始人亞當(dāng)斯密曾經(jīng)描述市場機制這只“看不見的手”，會引導(dǎo)人們自利的行為促進(jìn)社會的福利。博弈論的“囚徒困境”卻揭示非合作的自利行為可能導(dǎo)致兩敗俱傷的前景。在工作中，你在和上司博弈，也在和下屬博弈，你也同樣會跟其他相關(guān)部門人員博弈；而要開展業(yè)務(wù)，你更是在和你的客戶以及競爭對手博弈。在生活中，博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思，生活就是和某一件

9、事有關(guān)利益群體的集中博弈后呈現(xiàn)出來的結(jié)果,可以說，現(xiàn)在社會中的人的一舉一動都是博弈出來的結(jié)果,彼此相互妥協(xié) 得到的.四、生活中囚徒困境博弈有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境（prisoners dilemma）博弈模型,.市場是殘酷的，是無情的，你不追求利潤最大化，不追求效用最大化，你就難以存活下去，同自然界“物競選擇”一樣，從這個方面講，人類社會似乎是一個“利”者生存的社會，沒有利潤，企業(yè)生存不了，工人存活不了。所以，自利的原則還是存在的。不可能使得最終所追求的利益最大化，但這并不是說人們不想最大化其利潤，個體理性、個體利益最大，不一定能導(dǎo)致集體理性、集體利益最大

10、，“囚徒困境”就是個人利益與集體利益相沖突的典型。價格大戰(zhàn)的囚徒困境這方面以中國電信和中國聯(lián)通的來說明.根據(jù)我國電信業(yè)的實際情況，我們來構(gòu)造電信業(yè)價格戰(zhàn)的博弈模型。假設(shè)此博弈的參加者為電信運營商A與B,他們在電信某一領(lǐng)域展開競爭，一開始的價格都是P0。A （中國電信）是老牌企業(yè)，實力雄厚，占據(jù)了絕大多數(shù)的市場份額；B （中國聯(lián)通）則剛剛成立不久，翅膀還沒有長硬，是政府為了打破壟斷鼓勵競爭而籌建起來的。正因為B是政府扶植起來鼓勵競爭的，所以B得到了政府的一些優(yōu)惠，其中就有B的價格可以比P0低10%。這一舉動，還不會對A產(chǎn)生多大的影響，因為A的根基實在是太牢固了。在這樣的市場分配下，

11、A、B可以達(dá)到平衡，但由于B在價格方面的優(yōu)勢，市場份額逐步壯大，到了一定程度，對A造成了影響。這時候，A該怎么做？不妨假定： A降價而B維持，則A獲利15, B損失5，整體獲利10； A維持且B也維持，則A獲利5，B獲利10，整體獲利15； A維持而B降價，則A損失10，B獲利15，整體獲利5；A降價且B也降價，則A損失5, B損失5，整體損失10。從A角度看，顯然降價要比維持好，降價至少可以保證比B好，在概率均等的情況下， A降價的收益為15X50%5X50%=5，維持的收益為5X50% 10X50% = 2. 5，為了自身利益的最大化，A就不可避免地選擇了降價。從B角度看，效果也一樣，

12、降價同樣比維持好，其降價收益為5,維持收益為2. 5,它也同樣會選擇降價。在這輪博弈中，A、B都將降價作為策略，因此各損失5,整體損失10，整體收益是最差的。這就是此博弈最終所出現(xiàn)的納什均衡。我們構(gòu)造的這一電信業(yè)價格戰(zhàn)博弈模型是典型的囚徒困境現(xiàn)象，各個局部都尋求利益的最大化，而整體利益卻不是最優(yōu)，甚至是最差公共設(shè)施修建的囚徒困境設(shè)想有兩戶相居為鄰的農(nóng)家（雙方都是理性人），十分需要有一條好路從居住地通往公路。修一條路的成本為4,每個農(nóng)家從修好的好路上獲得的好處為3。如果兩戶居民共同出資聯(lián)合修路，并平均分?jǐn)傂蘼烦杀荆瑒t每戶居民獲得凈的好處（支付）為3-4/2=1 ；當(dāng)只有一戶人家單獨

13、出資修路時，修路的居民獲得的支付為3-4=-1 （虧損），搭便車”不出資但仍然可以使用修好的路的另一戶人家獲得支付3-0=3 .修路博弈的得利如下圖所示：我們看到，對甲和修不修修1,1-1,3不修3,-10,0表2修路博弈乙兩家居民來說，“修路”都是劣戰(zhàn)略，因而他們都不會出資修路。這里，為了解決這條新路的建設(shè)問題，需要政府強制性地分別向每家征稅2單位，然后投入4單位資金修好這條對大家都有好處的路，并使兩家居民的生活水平都得到改善。教育類囚徒困境我國的中小學(xué)的教育一直在提倡肩負(fù),但大家多知道，減到現(xiàn)在反而是越減越重了，已經(jīng) 陷入到素質(zhì)和作業(yè)的囚徒困境中去了.在現(xiàn)有的教育體制下，學(xué)生（或?qū)W生

14、家長）有兩個可選擇的策略：“減負(fù)”和“增負(fù)”。學(xué)生的精力是有限的，如果選擇“減負(fù)”策略，意味著學(xué) 生有更多的時間學(xué)習(xí)課本以外的東西，這樣學(xué)生的素質(zhì)得到提高，因此，“減負(fù)”策略往往與素質(zhì)教育聯(lián)系在一起；而如果選擇“增負(fù)”策略，則意味著學(xué)生花大量的時間做大量的習(xí) 題，以“學(xué)透V “學(xué)精”課本規(guī)定的東西，此時，學(xué)生沒有時間學(xué)習(xí)課本以外的沒有規(guī)定的內(nèi)容?！皽p負(fù)”的結(jié)果是學(xué)生的全面發(fā)展；而“增負(fù)”的結(jié)果是學(xué)生獲得高的分?jǐn)?shù)。在這樣的博弈結(jié)構(gòu)下，學(xué)生（或?qū)W生家長）如何選擇呢？每個學(xué)生這樣想：其他人采取的是“增負(fù)”教育策略的話，如果我采取“減負(fù)”教育策略，我的考試分?jǐn)?shù)不如他人，在求學(xué)方面我會落后，接

15、受不了好的教育，在未來求職時我也趕不上他人。在他人采取“增負(fù)” 的策略下，我也應(yīng)當(dāng)采取“增負(fù)”策略。如果其他人采取的是“減負(fù)”策略，我應(yīng)當(dāng)采取什么策略呢？還是應(yīng)當(dāng)采取“增負(fù)”策略！因為，如果其他人采取的是“減負(fù)”策略的話，如果我采取的是“增負(fù)”策略，我的考試分?jǐn)?shù)會比其他人高，我會上好的學(xué)校，在未來的職業(yè) 競爭中我會處于優(yōu)勢。因此，無論其他人采取的是什么策略，我采取“增負(fù)”策略都是最好的。當(dāng)每個學(xué)生都這樣想的時候，全社會便進(jìn)入了應(yīng)試教育這樣一個囚徒困境之中。如果我國現(xiàn)有的考試制度沒有改變，現(xiàn)在假設(shè)所有的學(xué)生都選擇“減負(fù)”策略，即除了做少量的鞏固性的作業(yè)外，不補課、不做其他的練習(xí)題，情況會

16、是什么樣子？假設(shè)這種狀態(tài)會出現(xiàn)，我們說，這種狀態(tài)會很快消失，而立即會出現(xiàn)所有學(xué)生都進(jìn)入 “增負(fù)”的這樣一個狀態(tài)?？梢哉f，均選擇“減負(fù)”策略的狀態(tài)是不穩(wěn)定的，而“增負(fù)”的狀態(tài)是穩(wěn)定的均衡。原因就是，目前的教育的博弈結(jié)構(gòu)規(guī)定了各種行動或行為的收益或好處：獲得高分的會進(jìn)入好的初中、高中，進(jìn)入好的初中、高中的學(xué)生可以考高分進(jìn)入好的大學(xué)。在這個博弈中，對于教師來說，學(xué)生的升學(xué)率高意味著其成績大、獎金高，對自己的學(xué)生采取“增負(fù)”策略，對于自己而言是占優(yōu)策略。我國基礎(chǔ)教育的博弈與囚徒困境有共同的結(jié)構(gòu)，大家均選擇“增負(fù)”策略構(gòu)成基礎(chǔ)教育博弈的納什均衡。納什均衡是一個穩(wěn)定的博弈結(jié)果，這也是為什么我國目

17、前的應(yīng)試教育難以改變的原因。戀人變心的囚徒困境兩個人相愛后，在以后的時間內(nèi)，如果雙方都不變心，那是最好的結(jié)局，在天愿為比翼鳥，在地愿為連理枝嘛；如果都變了心，效果也不壞，你走你的陽關(guān)道，我過我的獨木橋嘛；如果一方變了心，另外找到了更好的情侶，一方卻還傻乎乎地忠貞不二，那么，另覓新歡的一方是最幸福的，比兩人都不變心的結(jié)果還幸福，因為他找見了更好的情人，而被拋棄的一方是最不幸的，比兩人都變心的結(jié)果更不幸，因為他承擔(dān)的壓力既來自于對方的太幸福，也來自于自己的太不幸福。按照囚徒困境的分析結(jié)論，戀人最得意的選擇是另覓新歡，最天真的選擇是天荒地老，最理性的選擇是分道揚鐮，最糟糕的選擇是被另有

18、新歡的對方無情拋棄。但是，反關(guān)現(xiàn) 實中的戀人，大都天真的認(rèn)為能夠天荒地老，對于最理性的選擇，又認(rèn)為結(jié)局過于殘酷，沒有誰愿意回頭是岸，甚至被對方拋棄了還不死心，反而結(jié)果變成了最糟糕的選擇.所以這就是假設(shè)為理性人的情況下，個體的最優(yōu)化選擇和整體最優(yōu)的矛盾.五、囚徒困境的博弈和分析感受囚徒困境的理性人假設(shè)，注定每個人都是利己的，在消息不對稱的情況下，每個人只能根據(jù)自身要采取的利己措施，來保證自己的利益最大化，但當(dāng)每個人都這么想的話，都會采取對別人最壞的措施，最終的結(jié)果是整體處于一個非常糟糕的狀態(tài)，但由于此時已經(jīng)達(dá)到納什均衡，這個狀態(tài)時穩(wěn)定的，所以最后就陷入了惡性循環(huán)中.這個時候就要有類似于公共設(shè)施的政府來保證整體的利益維持在最壞和最好的之間，保持穩(wěn)定.這個個體和集體的矛盾，解決的辦法就是彼此相信，

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

淺析生活中的囚徒困境

文檔簡介

溫馨提示

最新文檔

評論

淺析生活中的囚徒困境

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔