淺析生活中的囚徒困境_第1頁
淺析生活中的囚徒困境_第2頁
淺析生活中的囚徒困境_第3頁
淺析生活中的囚徒困境_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、淺析生活中的囚徒困境商學(xué)院0908210313工程一班 楊鵬內(nèi)容摘要:我們把動物利用大自然移動的癮魂,在決策人期待的空間里,形成相對均衡的語文學(xué)理論,稱為博弈論。博弈論(Game Theory),亦名“對策論”、“賽 局理論”,屬應(yīng)用數(shù)學(xué)的一個分支,近年來,在經(jīng)濟學(xué)中的應(yīng)用越來越廣,近年來的諾貝爾獎 不斷授予研究博弈論的人.生活中,博弈仍然無處不在。博弈論代表著一種全新的分析方法 和全新的思想,最經(jīng)典的當(dāng)屬于出現(xiàn)在生活中各處的囚徒理論,探討個體最優(yōu)和整體最優(yōu)的 矛盾。、關(guān)鍵詞:博弈論經(jīng)濟學(xué)生活囚徒困境一、博弈論的產(chǎn)生和發(fā)展博弈論思想古已有之,我國古代的孫子兵法就不僅是一部軍事著作,而且算是最早

2、 的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負(fù)問題,人們對博弈局勢 的把握只停留在經(jīng)驗上,沒有向理論化發(fā)展,正式發(fā)展成一門學(xué)科則是在20世紀(jì)初。1928 年馮諾意曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮諾 意曼和摩根斯坦共著的劃時代巨著博弈論與經(jīng)濟行為將二人博弈推廣到n人博弈結(jié)構(gòu)并 將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟領(lǐng)域,從而奠定了這一學(xué)科的基礎(chǔ)和理論體系。談到博弈論就不能忽略博弈論天才納什,納什的開創(chuàng)性論文n人博弈的均衡點 (1950),非合作博弈(1951)等等,給出了納什均衡的概念和均衡存在定理。此外, 塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。直

3、至博弈圣經(jīng)的出現(xiàn),博弈 圣經(jīng)與原有博弈論書籍最大的不同就在于,獨創(chuàng)了國正論、國正雙贏理論和粒子行為論, 書中博弈取勝的文化理論統(tǒng)一了人類的博弈占優(yōu)行為。更重要的是,它讓博弈理論終于可以 在現(xiàn)實生活中具體操作,讓普通大眾通過研習(xí),成為真正的博弈高手。因此,博弈圣經(jīng) 中的博弈理論在政治、經(jīng)濟、文化、生活、娛樂等社會的各個領(lǐng)域具有可應(yīng)用性,并且對于 個人的工作、生活也有具體的指導(dǎo)意義。此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到 推動作用。今天博弈論已發(fā)展成一門較完善的的學(xué)科。二、博弈論的基本概念基本假設(shè)“理性人”假設(shè)(hypothesis of rational man )是指作為經(jīng)濟決策的主體都

4、 是充滿理智的,既不會感情用事,也不會盲從,而是精于判斷和計算,其行為是理 性的。在經(jīng)濟活動中,主體所追求的惟一目標(biāo)是自身經(jīng)濟利益的最優(yōu)化?;疽貨Q策人:在博弈中率先作出決策的一方,這一方往往依據(jù)自身的感受、經(jīng)驗和 表面狀態(tài)優(yōu)先采取一種有方向性的行動。對抗者:在博弈二人對局中行動滯后的那個人,與決策人要作出基本反面的決 定,并且他的動作是滯后的、默認(rèn)的、被動的,但最終占優(yōu)。他的策略可能依賴 于決策人劣勢的策略選擇,占去空間特性,因此對抗是唯一占優(yōu)的方式,實為領(lǐng) 導(dǎo)人的階段性終結(jié)行為。生物親序:所有生物在惡劣、未知的環(huán)境中都有尋找規(guī)律和有序的本能。在博 弈中指參與者有從混亂的環(huán)境中等待、尋找有

5、序的親近行為。局中人(players):在一場競賽或博弈中,每一個有決策權(quán)的參與者成為一 個局中人。只有兩個局中人的博弈現(xiàn)象稱為“兩人博弈”,而多于兩個局中人的 博弈稱為“多人博弈”。策略(strategiges): 一局博弈中,每個局中人都有選擇實際可行的完整的行 動方案,即方案不是某階段的行動方案,而是指導(dǎo)整個行動的一個方案,一個局 中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策 略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則 稱為“無限博弈”。得失(payoffs): 一局博弈結(jié)局時的結(jié)果稱為得失。每個局中人在一局博弈結(jié) 束時的得失,不僅與

6、該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的 一組策略有關(guān)。所以,一局博弈結(jié)束時每個局中人的“得失”是全體局中人所取 定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)。次序(orders):各博弈方的決策有先后之分,且一個博弈方要作不止一次的 決策選擇,就出現(xiàn)了次序問題;其他要素相同次序不同,博弈就不同。3.基本類型合作博弈研究人們達(dá)成合作時如何分配合作得到的收益,即收益分配 問題。非合作博弈研究人們在利益相互影響的局勢中如何選決策使自己的 收益最大,即策略選擇問題。完全信息不完全信息博弈:參與者對所有參與者的策略空間及策略組合下 的支付有充了解稱為完全信息;反之,則稱為不完全信息

7、。靜態(tài)博弈和動態(tài)博弈(1)靜態(tài)博弈:指參與者同時采取行動,或者盡管有先后順序,但后 行動者不知道先行動者的策略。(2)動態(tài)博弈:指雙方的的行動有先后順序并且后行動者可以知道先行 動者的策略。博弈論在經(jīng)濟學(xué)中主要用兩種形式:策略型博弈與展開型博弈,即純策略(局中人確 定性地從自己的策略集中選取一個策略)和混和策略(局中人在自己的策略集中隨機地選取 策略)三、博弈在當(dāng)今經(jīng)濟中的意義經(jīng)典意義上的經(jīng)濟學(xué),以經(jīng)濟主體人的自利行為以及相應(yīng)的市場反應(yīng)作為研究的出發(fā) 點。無論是消費者還是生產(chǎn)者,也無論是競爭形勢還是壟斷形勢,基本上是經(jīng)濟主體人面對市 場作出自己的最優(yōu)決策。無論形勢嚴(yán)峻也好還是寬松也好,行為的結(jié)

8、果是主體人自己決策的 結(jié)果。現(xiàn)代經(jīng)濟活動早已超出上述模式。競爭的結(jié)果是許多行業(yè)都剩下少數(shù)幾家企業(yè)每一方 的市場份額都很大,每一個主體人的行為后果,受對手的行為的影響很大。博弈論就是研究利 益沖突的主體人的對局的理論。現(xiàn)代經(jīng)濟學(xué)的創(chuàng)始人亞當(dāng)斯密曾經(jīng)描述市場機制這只“看 不見的手”,會引導(dǎo)人們自利的行為促進(jìn)社會的福利。博弈論的“囚徒困境”卻揭示非合作 的自利行為可能導(dǎo)致兩敗俱傷的前景。在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關(guān)部門人員博弈; 而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。在生活中,博弈仍然無處不在。博 弈論代表著一種全新的分析方法和全新的思,生活就是和某一件

9、事有關(guān)利益群體的集中博弈 后呈現(xiàn)出來的結(jié)果,可以說,現(xiàn)在社會中的人的一舉一動都是博弈出來的結(jié)果,彼此相互妥協(xié) 得到的.四、生活中囚徒困境博弈有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境(prisoners dilemma) 博弈模型,.市場是殘酷的,是無情的,你不追求利潤最大化,不追求效用最大化,你 就難以存活下去,同自然界“物競選擇”一樣,從這個方面講,人類社會似乎是一個“利”者生存的社會,沒有利潤,企業(yè)生存不了,工人存活不了。所以,自利的原則 還是存在的。不可能使得最終所追求的利益最大化,但這并不是說人們不想最大化其 利潤,個體理性、個體利益最大,不一定能導(dǎo)致集體理性、集體利益最大

10、,“囚徒困 境”就是個人利益與集體利益相沖突的典型。價格大戰(zhàn)的囚徒困境這方面以中國電信和中國聯(lián)通的來說明.根據(jù)我國電信業(yè)的實際情況,我們來構(gòu)造電信 業(yè)價格戰(zhàn)的博弈模型。假設(shè)此博弈的參加者為電信運營商A與B,他們在電信某一領(lǐng)域展開 競爭,一開始的價格都是P0。A (中國電信)是老牌企業(yè),實力雄厚,占據(jù)了絕大多數(shù)的市 場份額;B (中國聯(lián)通)則剛剛成立不久,翅膀還沒有長硬,是政府為了打破壟斷鼓勵競爭 而籌建起來的。正因為B是政府扶植起來鼓勵競爭的,所以B得到了政府的一些優(yōu)惠,其中 就有B的價格可以比P0低10%。這一舉動,還不會對A產(chǎn)生多大的影響,因為A的根基實 在是太牢固了。在這樣的市場分配下,

11、A、B可以達(dá)到平衡,但由于B在價格方面的優(yōu)勢, 市場份額逐步壯大,到了一定程度,對A造成了影響。這時候,A該怎么做?不妨假定: A降價而B維持,則A獲利15, B損失5,整體獲利10; A維持且B也維持,則A獲利5,B獲利10,整體獲利15; A維持而B降價,則A損失10,B獲利15,整體獲利5;A降價且B也降價,則A損失5, B損失5,整體損失10。從A角度看,顯然降價要比維持好,降價至少可以保證比B好,在概率均等的情況下, A降價的收益為15X50%5X50%=5,維持的收益為5X50% 10X50% = 2. 5,為了 自身利益的最大化,A就不可避免地選擇了降價。從B角度看,效果也一樣,

12、降價同樣比維 持好,其降價收益為5,維持收益為2. 5,它也同樣會選擇降價。在這輪博弈中,A、B都 將降價作為策略,因此各損失5,整體損失10,整體收益是最差的。這就是此博弈最終所出 現(xiàn)的納什均衡。我們構(gòu)造的這一電信業(yè)價格戰(zhàn)博弈模型是典型的囚徒困境現(xiàn)象,各個局部都 尋求利益的最大化,而整體利益卻不是最優(yōu),甚至是最差公共設(shè)施修建的囚徒困境設(shè)想有兩戶相居為鄰的農(nóng)家(雙方都是理性人),十分需要有一條好路從居住地通往公路。 修一條路的成本為4,每個農(nóng)家從修好的好路上獲得的好處為3。如果兩戶居民共同出資聯(lián)合 修路,并平均分?jǐn)傂蘼烦杀荆瑒t每戶居民獲得凈的好處(支付)為3-4/2=1 ;當(dāng)只有一戶人 家單獨

13、出資修路時,修路的居民獲得的支付為3-4=-1 (虧損),搭便車”不出資但仍然 可以使用修好的路的另一戶人家獲得支付3-0=3 .修路博弈的得利如下圖所示:我們看到,對甲和修不修修1,1-1,3不修3,-10,0表2修路博弈乙兩家居民來說,“修路”都是劣戰(zhàn)略,因而他們都不會出資修路。這里,為了解決這條新路的建設(shè)問題,需 要政府強制性地分別向每家征稅2單位,然后投入4單位資金修好這條對大家都有好處的路, 并使兩家居民的生活水平都得到改善。教育類囚徒困境我國的中小學(xué)的教育一直在提倡肩負(fù),但大家多知道,減到現(xiàn)在反而是越減越重了,已經(jīng) 陷入到素質(zhì)和作業(yè)的囚徒困境中去了.在現(xiàn)有的教育體制下,學(xué)生(或?qū)W生

14、家長)有兩個可 選擇的策略:“減負(fù)”和“增負(fù)”。學(xué)生的精力是有限的,如果選擇“減負(fù)”策略,意味著學(xué) 生有更多的時間學(xué)習(xí)課本以外的東西,這樣學(xué)生的素質(zhì)得到提高,因此,“減負(fù)”策略往往 與素質(zhì)教育聯(lián)系在一起;而如果選擇“增負(fù)”策略,則意味著學(xué)生花大量的時間做大量的習(xí) 題,以“學(xué)透V “學(xué)精”課本規(guī)定的東西,此時,學(xué)生沒有時間學(xué)習(xí)課本以外的沒有規(guī)定的 內(nèi)容?!皽p負(fù)”的結(jié)果是學(xué)生的全面發(fā)展;而“增負(fù)”的結(jié)果是學(xué)生獲得高的分?jǐn)?shù)。在這樣的博弈結(jié)構(gòu)下,學(xué)生(或?qū)W生家長)如何選擇呢?每個學(xué)生這樣想:其他人采 取的是“增負(fù)”教育策略的話,如果我采取“減負(fù)”教育策略,我的考試分?jǐn)?shù)不如他人,在 求學(xué)方面我會落后,接

15、受不了好的教育,在未來求職時我也趕不上他人。在他人采取“增負(fù)” 的策略下,我也應(yīng)當(dāng)采取“增負(fù)”策略。如果其他人采取的是“減負(fù)”策略,我應(yīng)當(dāng)采取什 么策略呢?還是應(yīng)當(dāng)采取“增負(fù)”策略!因為,如果其他人采取的是“減負(fù)”策略的話,如 果我采取的是“增負(fù)”策略,我的考試分?jǐn)?shù)會比其他人高,我會上好的學(xué)校,在未來的職業(yè) 競爭中我會處于優(yōu)勢。因此,無論其他人采取的是什么策略,我采取“增負(fù)”策略都是最好 的。當(dāng)每個學(xué)生都這樣想的時候,全社會便進(jìn)入了應(yīng)試教育這樣一個囚徒困境之中。如果我國現(xiàn)有的考試制度沒有改變,現(xiàn)在假設(shè)所有的學(xué)生都選擇“減負(fù)”策略,即除了 做少量的鞏固性的作業(yè)外,不補課、不做其他的練習(xí)題,情況會

16、是什么樣子?假設(shè)這種狀態(tài)會出現(xiàn),我們說,這種狀態(tài)會很快消失,而立即會出現(xiàn)所有學(xué)生都進(jìn)入 “增負(fù)”的這樣一個狀態(tài)??梢哉f,均選擇“減負(fù)”策略的狀態(tài)是不穩(wěn)定的,而“增負(fù)”的 狀態(tài)是穩(wěn)定的均衡。原因就是,目前的教育的博弈結(jié)構(gòu)規(guī)定了各種行動或行為的收益或好處: 獲得高分的會進(jìn)入好的初中、高中,進(jìn)入好的初中、高中的學(xué)生可以考高分進(jìn)入好的大學(xué)。 在這個博弈中,對于教師來說,學(xué)生的升學(xué)率高意味著其成績大、獎金高,對自己的學(xué)生采 取“增負(fù)”策略,對于自己而言是占優(yōu)策略。我國基礎(chǔ)教育的博弈與囚徒困境有共同的結(jié)構(gòu),大家均選擇“增負(fù)”策略構(gòu)成基礎(chǔ)教育 博弈的納什均衡。納什均衡是一個穩(wěn)定的博弈結(jié)果,這也是為什么我國目

17、前的應(yīng)試教育難以 改變的原因。戀人變心的囚徒困境兩個人相愛后,在以后的時間內(nèi),如果雙方都不變心,那是最好的結(jié)局,在天愿為比翼 鳥,在地愿為連理枝嘛;如果都變了心,效果也不壞,你走你的陽關(guān)道,我過我的獨木橋嘛; 如果一方變了心,另外找到了更好的情侶,一方卻還傻乎乎地忠貞不二,那么,另覓新歡的 一方是最幸福的,比兩人都不變心的結(jié)果還幸福,因為他找見了更好的情人,而被拋棄的一 方是最不幸的,比兩人都變心的結(jié)果更不幸,因為他承擔(dān)的壓力既來自于對方的太幸福,也 來自于自己的太不幸福。按照囚徒困境的分析結(jié)論,戀人最得意的選擇是另覓新歡,最天真的選擇是天荒地 老,最理性的選擇是分道揚鐮,最糟糕的選擇是被另有

18、新歡的對方無情拋棄。但是,反關(guān)現(xiàn) 實中的戀人,大都天真的認(rèn)為能夠天荒地老,對于最理性的選擇,又認(rèn)為結(jié)局過于殘酷,沒 有誰愿意回頭是岸,甚至被對方拋棄了還不死心,反而結(jié)果變成了最糟糕的選擇.所以這就是 假設(shè)為理性人的情況下,個體的最優(yōu)化選擇和整體最優(yōu)的矛盾.五、囚徒困境的博弈和分析感受囚徒困境的理性人假設(shè),注定每個人都是利己的,在消息不對稱的情況下,每個人只能 根據(jù)自身要采取的利己措施,來保證自己的利益最大化,但當(dāng)每個人都這么想的話,都會采取 對別人最壞的措施,最終的結(jié)果是整體處于一個非常糟糕的狀態(tài),但由于此時已經(jīng)達(dá)到納什 均衡,這個狀態(tài)時穩(wěn)定的,所以最后就陷入了惡性循環(huán)中.這個時候就要有類似于公共設(shè)施的 政府來保證整體的利益維持在最壞和最好的之間,保持穩(wěn)定.這個個體和集體的矛盾,解決的辦法就是彼此相信,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論