《博弈與決策》90%復習資料

上傳人：d*** IP屬地：天津上傳時間：2022-05-24 格式：DOCX 頁數(shù)：7 大小：29.91KB 積分：18 舉報 版權申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、博弈與決策期末復習資料一、期末考試形式和時間半開卷時間： 90 分鐘二、考試題型1 、名詞解釋（每小題5 分，共 20 分）； 2、簡答題（每小題 10 分，共 30 分）； 3、論述題（每小題15 分，共 30 分）； 4、案例分析題（共20 分）參考復習資料如下：三、名詞解釋1. 信號傳遞：在信息經(jīng)濟學里，具有優(yōu)勢的一方（擁有私人信息的一方）采取某種行動向信息劣勢一方（不了解對方私人信息的一方）發(fā)送相關信號，來告訴對方自己的真實類型。2. 非合作博弈：是指參與人之間沒有一個對各方具有約束力的協(xié)議，參與人不在協(xié)議范圍內進行的博弈。3. 重復博弈：是指同一個博弈在相同的環(huán)境、規(guī)則下

2、反復多次執(zhí)行的博弈問題。4. 第一價格密封拍賣：在這種拍賣模式下，投標者利用秘密方式（比如將報價寫好裝入一個信封）同時投標，所有的投標人都不知道其他投標人的出價，且一旦呈交了投標就沒有機會更新。拍賣人當眾打開這些信封，出價最高者就是贏者，可以以其所報出的最高價格購買被拍賣物品。5. 靜態(tài)博弈：是指在博弈中，參與人同時選擇或雖非同時選擇單后行動者并不知道先行動者采取了什么具體行動。6. 逆向歸納法：就是從最后一個階段或最后一個子博弈開始逆推上去，逐步向前倒推以求解動態(tài)博弈均衡。7. 精煉葉貝斯納什均衡：在不完全信息動態(tài)博弈下，如果給定參與者自己的特征和其他參與者特征概率分布的情況下，每個參與者選

3、擇的策略能使自己的期望支付達到最大化，也就是沒有人積極選擇其他策略，這就形成了“精煉貝葉斯納什均衡”。8. 第二價格密封拍賣：每個競標者分別向拍賣方提交自己的報價，而且他們不知道別人的出價，出價最高的競標者將獲得物品，并按所有的出價中僅次于最高出價的第二高價格支付給賣家。9. 不完全信息：是指在博弈過程中，每一位參與人對其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠或者不是對所有參與人的特征策略空間及收益函數(shù)都有準確的信息。10. 子博弈：是指它本身可以作為一個獨立的博弈進行分析，它是原博弈的一部分。任何博弈本身可被稱為自身的一個子博弈。11. 完美信息：某個參與人行動前，有足夠的信息來

4、確定已經(jīng)行動的參與人選擇了什么行動，這種信息結構稱為完美信息。12. 貝葉斯納什均衡：在給定自己類型以及給定其他參與者的類型與策略選擇之間關系的條件下，使自己的棋王小勇最大化，這時形成的一個納什均衡，就稱為“貝葉斯納什均衡”。13. 參與人：指的是博弈中選擇行動以最大化自己效用的決策主體（可以是個人，也可以是團體）；14. 占優(yōu)戰(zhàn)略均衡：占優(yōu)戰(zhàn)略均衡是指在博弈中，如果所有參與人都有占優(yōu)戰(zhàn)略存在，博弈將在所有參與人占優(yōu)戰(zhàn)略的基礎上達到均衡。15. 行動：行動是指參與人在博弈進程中輪到自己選擇時所作的某個具體決策。16. 動態(tài)博弈：動態(tài)博弈是指在博弈中，參與人的行動有先后順序且后行動者能夠觀

5、察到先行動者所選擇的行動。17. 劣策略：在博弈中，不論其他參與人采取什么策略，某一參與人可能采取的策略中對自己嚴格不利的策略。18. 信息集：是指某一參與人在某一階段的行動時由博弈歷史信息反映的那一組都有可能是真實位置的決策結的集合。19. 得益：得益是參與人在博弈結束后從博弈中獲得的效用，一般是所有參與人的策略或行動的函數(shù)，這是每個參與人最關心的東西。20. 納什戰(zhàn)略均衡：納什戰(zhàn)略均衡是指在均衡中，每個博弈參與人都確信，在給定其他參與人戰(zhàn)略決定的情況下，該參與人選擇了最優(yōu)戰(zhàn)略以回應對手的戰(zhàn)略。21. 博弈論：博弈論就是系統(tǒng)的研究各種各樣的博弈問題，尋求各博弈方合理選擇策略的情況下博

6、弈的解，并對這些解進行討論分析的理論。22. 納什均衡：當博弈的所有參與者在某一選定的策略組合下都沒有動機（單方面）偏離各自己選定的策略時，該策略組合就構成一個納什均衡。即給定其他參與者的策略。每一個參與者的這個策略能十七期望效用最大化。四、簡答題1. 什么是重復博弈中的“針鋒相對”策略？（ 1）重復博弈中的“針鋒相對”策略，其實就是說，如果博弈參與者第一步采取合作，此后每一步都重復對方上一步的行動，要么是合作要么是背判，只要博弈沒有確切的期限，由于長期利益對短期行為的制約作用，因此有一些在一次性博弈中不可行的威脅或者承諾在重復博弈中會變得可信，那么就會形成一種持續(xù)合作的態(tài)勢。（ 5 分）（

7、 2）比如在囚徒困境中，在第一局中，你采取合作不坦白的策略。在以后的每一局中，如果你的對手在上一局中采取背叛的策略，那么你也采取背叛的策略；如果你的對手在上一局中采取合作的策略，那么你也采取合作的策略。結果發(fā)現(xiàn)這是一種最好的策略。針鋒相對的策略的確非常令人滿意，它能立即對背叛者施以懲罰。（ 5 分）2. 簡述混合策略的含義及如何正確選擇混合策略。（ 1）混合策略的含義為：若果在每個給定信息下，參與者只能以某種概率選擇不同的策略，換句話說，不是參與者純粹地選擇什么策略，而是隨機的，或者以百分之多少的概率選擇不同的策略。（ 2）正確選擇混合策略，要注意以下幾點：避免在隨機中有規(guī)律性。不要依賴對手

8、的隨機性。做一個獨一無二的自己。先發(fā)制人以便搶占先機。虛虛實實以便出人意料。3. 什么是逆向選擇？逆向選擇在銀行貸款上是如何體現(xiàn)的？（ 1）逆向選擇是指由于交易雙方信息不對稱和市場價格下降產(chǎn)生的劣質品驅逐優(yōu)質品, 進而出現(xiàn)市場交易產(chǎn)品平均質量下降的現(xiàn)象。（ 2）在銀行信貸中有兩類借款人：一類“高質量帶狂人”，一類“低質量貸款人”，但是由于銀行根據(jù)寄款人提供的有限信息不能夠完全判斷出借款人的真實狀況，銀行只好給出一個平均的貸款利率水平。這一利率對于高質量借款人而言貸款成本和貸款壓力顯得高，就會讓他們退出信貸市場。而對于低質量借款人而言，如果項目失敗了，也就償還一點銀行的貸款，如果項目成功，收益可

9、觀，也就不在乎這點利息，而由于銀行無法分辨項目的風險高低。所以關心利率高低的借款人是信用質量高的人，而與其會違約的借款人不會在意較高的利率，所以利率的上升會使得地方先的投資項目和高質量的借款人退出市場，貸款的質量會下降，貸款違約率會增大，不良貸款會增加，對于理性的銀行而言，會進一步提高貸款利率，這樣就形成一個惡性循環(huán)，導致整個銀行信貸市場陷入一個風險的漩渦。4. 簡述不確定性的含義及不確定性條件下如何進行策略選擇。（ 1）不確定性就是指經(jīng)濟行為者事先不能準確地知道自己某種決策的結果，或者說，只要經(jīng)濟行為主體的一種決策的可能結果不止一種、就會產(chǎn)生不確定性。（ 2）遇到此類問題時，我們可以使用最大

10、期望收益法或者使用最大期望效用法進行決策。最大期望收益法就是在事情結果不確定的情況下，應該選擇給他帶來“期望收益”最大的策略。5. 按照行動順序和信息結構劃分博弈論的分類有哪些？各是什么含義？（ 1）按照行動順序和信息結構，博弈分為完全信息動態(tài)博弈和不完全信息動態(tài)博弈。（ 2）在完全信息動態(tài)博弈中，如果參與者的策略在該動態(tài)博弈本身和所有子博弈中都構成一個納什均衡，則該策略組合為一個“子博弈納什均衡” 。（ 3）在不完全信息動態(tài)博弈下，如果給定參與者自己的特征和其他參與者特征概率分布的情況下，每個參與者選擇的策略能使自己的期望支付達到最大化，也就是說，沒有人有積極性選擇其他策略，這就形成了“精煉

11、貝葉斯納什均衡”。6. 簡述重復博弈及其特征。（ 1 ）重復博弈是指同一個博弈在相同的環(huán)境、規(guī)則下反復多次執(zhí)行的博弈問題。次數(shù)可以是有限的定數(shù)，也可以是無限的。重復博弈是一個動態(tài)博弈。（ 2）重復博弈的基本特征是：首先，重復博弈的每一個階段之間不存在物質聯(lián)系，即前一個階段的博弈并不改變后一個階段博弈的結構，被重復的基本博弈的結構不變；其次，在重復博弈的每一個階段，所有參與者都可以觀測到該博弈過去的歷史；第三，博弈參與者總的支付是由各次博弈收益按貼現(xiàn)率的加權和構成。7. 簡述公地悲劇及如何調節(jié)。（ 1） 1968 年，美國學者哈定在科學雜志上發(fā)表了一篇題為公地的悲劇的文章。英國曾經(jīng)有這樣一種土地

12、制度封建主在自己的領地中劃出一片尚未耕種的土地作為牧場（稱為“公地”），無償向牧民開放。這本來是一件造福于民的事，但由于是無償放牧，每個牧民都養(yǎng)盡可能多的牛羊。隨著牛羊數(shù)量無節(jié)制地增加，公地牧場最終因“超載”而持續(xù)退化，所有牧民野就一起破產(chǎn)而無法維持生計，這就是“公地的悲劇” 。（ 2）為了避免這樣的結果，可以動用制度約束和道德約束來進行調節(jié)。所謂制度約束，就是要建立相應的權力機構，無論這種權力機構是公共的還是私人的。就是要建立明晰的產(chǎn)權制度，如這塊牧場們可以明確化出若干小塊，分別給相應的牧民自行管理，不能越界放牧，這樣每個牧民就會在各自的小牧場放養(yǎng)最優(yōu)數(shù)量的牛羊，而不會過度放養(yǎng)，避免公地悲

13、劇的產(chǎn)生。所謂道德約束，就是要建立相應的基于社會到一的行為規(guī)范，讓他們從人們的內心來調節(jié)自己的言行。當然，隨著社會經(jīng)濟的發(fā)展，需要政府規(guī)制和市場機制兩者有機結合，才能更好的解決公共物品供給及相關長夜發(fā)展中的過度進入問題。8. 簡述博弈論發(fā)展的過程。（ 1）萌芽階段：博弈論思想古已有之，我國古代的孫子兵法就不僅是一部軍事著作，而且算是最早的一部博弈論專著。19 世紀 30 年代古諾對兩寡頭壟斷競爭進行了比較系統(tǒng)的研究。艾奇沃德、斯坦克爾伯格等人對不完全競爭為博弈論的創(chuàng)立奠定了堅實的基礎。（ 2）產(chǎn)生階段：1944 年科學家馮?諾伊曼和經(jīng)濟學家奧斯卡?摩根斯坦合著博弈論與經(jīng)濟行為將二人博弈推廣到n

14、人博弈結構并將博弈論系統(tǒng)的應用于經(jīng)濟領域，標志著博弈論作為一門獨立的的學科誕生。1950 年和 1951 年發(fā)表了2 篇關于非合作博弈的重要文章，土克于1950年定義了“囚徒困境”。（3）發(fā)展階段：塞爾頓于1965 年將動態(tài)分析引入了納什均衡的概念，提出來“精煉納什均衡”概念；海薩尼則把不完全信息引入博弈論的研究，提出來不完全信息博弈和貝葉斯均衡概念等。（4）繁榮階段：以納什、塞爾頓、海薩尼榮獲1994 年諾貝爾經(jīng)濟學獎為標志。克瑞普斯、威爾遜、米格羅姆和羅伯茨建立了非常有名的四人幫模型。這個時期是博弈論研究的一個高潮時期，一方面是合作博弈發(fā)展到了鼎盛時期。（5）成熟階段：20 世紀

15、90 年代是博弈論于駐留經(jīng)濟學融合時期，也是博弈論走向成熟時期。9. 壟斷者阻止市場進入的策略有哪些？（ 1）擴大生產(chǎn)能力策略。現(xiàn)有企業(yè)為了防止出現(xiàn)因受生產(chǎn)限制而未能向顧客供應產(chǎn)品而采取的一種策略反映，就是進行投資擴大生產(chǎn)能力。（ 2） “保證最低價格”的策略 . 保證最低價格條款是一種承諾，由于法律的限制，商店在向消費者公布了這一條款之后是不能不實行的，因此它是絕對可信的。（ 3）限制進入定價策略。限制進入定價是指現(xiàn)有企業(yè)通過收取低于進入發(fā)生的價格的策略來防范進入。潛在進入者看到這一低價后，推測出進入后價格也會那么低甚至更低，因而進入該市場終將無利可圖。（ 4）掠奪性定價策略。掠奪性定價是指

16、將價格設定為低于成本，而期望由此發(fā)生的損失在新進入企業(yè)或者競爭對手被逐出市場后，掠奪企業(yè)能夠行使市場權力時可能得到補償。這也是一種價格報復策略。（每點 2.5 分）10. 博弈的構成要素有哪些？并對這些要素進行說明。博弈一般由以下幾個要素組成，包括：參與人、行動、信息、策略、得益、結果、均衡等。11. 1 ）參與人指的是博弈中選擇行動以最大化自己效用的決策主體（可以是個人，也可以是團體）；12. 2）行動是指參與人在博弈進程中輪到自己選擇時所作的某個具體決策；13. 3）策略是指參與人選擇行動的規(guī)則，即在博弈進程中，什么情況下選擇什么行動的預先安排；14. 4）得益是參與人在博弈結束后從博

17、弈中獲得的效用，一般是所有參與人的策略或行動的函數(shù)，這是每個參與人最關心的東西；15. 5）均衡是所有參與人的最優(yōu)策略或行動的組合；均衡結果是指博弈結束后博弈分析者感興趣的一些要素的集合，如在各參與人的均衡策略作用下，各參與人最終的行動或效用集合。上述要素中，參與人、行動、結果統(tǒng)稱為博弈規(guī)則，博弈分析的目的就是使用博弈規(guī)則來決定均衡。（每點 2 分）11. 博弈論的不同分類有哪些？（ 1）按照參與人行動的先后順序進行分類，分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈是指博弈中，參與者同時采取行動，或者盡管參與者行動的采取有先后順序，但后行動的人不知道先采取行動的人采取的是什么行動。動態(tài)博弈是指在博弈中，參

18、與者的行動有先后順序，并且后采取行動的人可以知道先采取行動的人所采取的行動。（ 3 分）（ 2）按照參與人對其他參與人的了解程度進行分類，分為完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈過程中，每一位參與人對其他參與人的特征、策略空間及策略組合下的支付有準確的信息。不完全信息博弈是指博弈過程中，參與人對其他參與人的特征、策略空間及策略組合下的支付的信息了解得不夠準確或者不是對所有參與人的特征、策略空間及策略組合下的支付的信息都有準確的了解。（ 4 分）（ 3）按照參與人之間是否進行合作進行分類，分為合作博弈和非合作博弈。合作博弈是指參與者從自己的利益出發(fā)與其他參與者談判達成協(xié)議或形成聯(lián)

19、盟，其結果對聯(lián)盟方均有利；參與人在協(xié)議范圍內進行博弈。非合作博弈就是參與者在行動選擇時無法達成約束性的協(xié)議。（ 3 分）12. 簡述重復博弈及其特征（ 1）重復博弈是指同一個博弈在相同的環(huán)境、規(guī)則下反復多次執(zhí)行的博弈問題。次數(shù)可以是有限的定數(shù)，也可以是無限的。重復博弈是一個動態(tài)博弈。（ 2）重復博弈的基本特征是：首先，重復博弈的每一個階段之間不存在物質聯(lián)系，即前一個階段的博弈并不改變后一個階段博弈的結構，被重復的基本博弈的結構不變；其次，在重復博弈的每一個階段，所有參與者都可以觀測到該博弈過去的歷史；第三，博弈參與者總的支付是由各次博弈收益按貼現(xiàn)率的加權和構成。13. 試闡述納什均衡的意義。（

20、 1）納什均衡是指在對手策略既定的情況下，各自對局者所選擇的策略都是最好的。合作是有利的“利己策略”。但它必須符合以下黃金律：按照你原意別人對你的方式來對待別人，但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施與我。（ 5 分）（ 2）其次，納什均衡是一種非合作博弈均衡，在現(xiàn)實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯坦恩的合作博弈理論的重大發(fā)展，甚至可以說是一場革命。（ 5 分）五、論試題1. 試闡述說明經(jīng)濟管理中的保證最低價格條款策略。（ 1）管理學中的“保證最低價格”的策略。（ 5 分）（ 2）該條款規(guī)定，

21、顧客在本商店購買這種商品一個月內，如果發(fā)現(xiàn)其他任何商店比本店更低價格出售同樣的商品，本店將退還差價，并補償差額的10%。對消費者來說，保證最低價格條款使你至少在一個月內不會因為商品降價而后悔你的購買，但這種條款無疑是企業(yè)之間競爭的一種手段。（ 5 分）（ 3）我們假定推行保證最低價格條款的商店為商店A，它的競爭者為商店B。當商店A把某產(chǎn)品定為5000 元并推行保證最低價格條款的時候，商店 B 應如何定價最為有利呢？如果商店B 高于 5000 元，顯然對其競爭不利，因為除非顧客不了解情況，否則他們將到商店A去購買該產(chǎn)品。如果商店的定價低于5000 元，它能否因此而爭取到更多的顧客呢？不能，因

22、為商店A已經(jīng)有了保證最低價格的條款。這樣，對商店B來說，它的最優(yōu)的定價策略就是與商店A制定同樣的價格。（ 5 分）2 試述道德風險的含義、道德風險與逆向選擇的區(qū)別及如何規(guī)避道德風險。（請舉例說明，至少一個詳細的案例，并加以具體的說明。）（ 1 ）在信息部不對稱的情況下，委托人委托代理人從事某項工作，由于委托人無法直接觀察代理人的行動，使得代理人可能為了其自身的利益二選擇其行動而損害委托人的利益，這種行為就是代理人對委托人造成的“道德風險”。 2）逆向選擇是指由于交易雙方信息不對稱和市場價格下降產(chǎn)生的劣質品驅逐優(yōu)質品, 進而出現(xiàn)市場交易產(chǎn)品平均質量下降的現(xiàn)象。與道德風險一樣都是信息不對稱情況下

23、出現(xiàn)的。但逆向選擇屬事前機會主義行為，道德風險屬于事后機會主義行為。 3） 3）規(guī)避道德風險的策略之一就是進行有效的激勵機制設計，就是在信息不對稱的情況下設計一條博弈規(guī)則，令不同類型的博弈參與者做出不同的選擇，并促使他們盡最大努力去工作。比如，大學公共選修課的老師們都會發(fā)現(xiàn)一個難題，就是有很多學生選這個課程，并不是因為喜歡它，而是為了混學分。由于老師公布的考試政策對學生而言是公共信息，但學生是否來上課并好好學習是不充分信息。由于信息不對稱，老師無法政治了解哪些學生對課程真正感新區(qū)，哪些學生企圖混學分，老師就需要設計一套激勵機制，對真正希望聽課的學生幾乎不構成額外成本，而且使他們參加學習的機會

24、成本得到降低，還應該滿足學?？荚囍贫鹊囊蠛筒僮骱啽??？梢赃@樣來考慮：首先，第一節(jié)課時就宣布考試制度和方案，不安排期末考試，只是在上課期間隨機出 5 次課堂練習，并且選擇其中的一次課堂練習成績作為期末考試成績。其次，老師選擇哪一次課堂練習作為期末考試成績取決于來上課的學生人數(shù)，老師只選學生人數(shù)最少的那一次課堂練習作為期末考試成績。這就使得學生的最優(yōu)策略是“最好我來上課”，而且老師的機會成本也較小，因為批改的試卷最少。第三，所有要請假的學生必須實現(xiàn)通知到老師，而且在全部課時期間請假者，每次扣總分的10%。這樣，凡是第一次課后甚至第一次課還沒上完就去取消選修這門課的學生，肯定就屬于混學分的學生，而

25、其他留下來的學生也會因為你設定的游戲規(guī)則而好好來上課。3. 以斗雞博弈為例談談企業(yè)在競爭中如何實現(xiàn)共贏。（1）兩只山羊迎面而來，都要回到自己對面的家，卻遭遇在一個獨木橋上。此時，每只羊都有兩個行動選擇：一個是退回去，另一個是硬往前行進。其支付矩陣如下嘜嘜后退前進咩咩后退1， 10， 2前進2，0-2 ， -2這個博弈是山羊博弈，也叫斗雞博弈，此時有四種可能，兩只山羊對峙，兩敗俱傷，各自支付為-2 ；二是互相退讓，各自支付為；還有兩種情況就是一退一進，進的支付為2，退的支付為0。用劃線法可以得到兩個純策略均衡：（前進，后退）和（后退，前進）。（2）在企業(yè)競爭中，斗雞博弈的均衡為（前進，后退）和

26、（后退，前進），實際上雙方也可能選擇（前進，前進），從結果上看，不是很好的選擇，但對雙方也可能是最好的結構，因為斗爭也是一種“造勢”， “造勢”是為了今后的長遠發(fā)展。在這樣的博弈中要想取勝，就要則氣勢上壓倒對方，至少要顯示出破釜沉舟、背水一戰(zhàn)的決心來，以迫使對方退讓。所以在這樣的博弈中，非理性、非理智的形象塑造往往是一種可選擇的策略運用。（3）在企業(yè)競爭中引用斗雞博弈的意義就在于博弈的雙方如何在博弈中采用妥協(xié)的方式取得利益。如果博弈的雙方都換位思考，它們可以就補償進行談判，最后造成以補償換退讓的協(xié)議，問題就解決了。博弈中經(jīng)常有妥協(xié)，雙方能換位思考就可以較容易地達成協(xié)議。考慮自己得到多少補償才愿

27、意退，并用自己的想法來理解對方。只從自己立場出發(fā)考慮問題，不愿退，又不想給對方一定的補償，僵局就難以打破。4. 以囚徒的困境為例說明如何用下劃線法尋找最優(yōu)策略。1 、警察把囚徒張三、李四分開關押，并在提審時分別告之，如果你坦白而對方不坦白，你將只判0 年，對方判5 年；如果你不坦白對方坦白，你將判5 年對方判0 年，如果兩人都坦白都將判3 年，如果都不坦白，都被判1 年。2、當張三選擇坦白時，對李四而言，選擇坦白被判3 年，選擇抵賴被判5 年，顯然他寧愿選擇坦白而不是抵賴，因為-3 大于 -5 ，所以在張三選擇坦白而李四選擇坦白的那個支付-3 下劃上一條橫線，表示這個選擇比較好；當張三選擇抵賴

28、時，對李四而言，選擇坦白無罪釋放，選擇抵賴被判1 年，毫無疑問，他愿意坦白而不是抵賴，因為0 大于 -1 ，所以在張三選擇抵賴而李四選擇坦白的那個支付0 下劃上一條橫線，表示這個選擇比較好。3、同樣，當李四選擇坦白時，張三如果坦白被判3 年，抵賴則判5 年，所以在他坦白的支付-3 下劃上一條橫線。當李四選擇抵賴，經(jīng)過分析后同樣在張三坦白的支付0 下劃上一條橫線。4、這樣有四個數(shù)字下面被劃上了橫線，而在該博弈的左上角的那一個方框里，兩個數(shù)字下面都有橫線。就說明張三和李四都同時選擇了坦白的策略，也就代表著他們的選擇形成了一個交集，從而形成了一個策略組合，對兩個人而言，面對這個結果，各自都不愿意主動

29、改變。5、下劃線法如圖所示：李四坦白不坦白張三坦白-3 ， -30， -5不坦白-5，0-1 ， -15. 試闡述博弈論發(fā)展的幾個階段及各階段代表人物和主要貢獻。（ 1）萌芽階段：博弈論思想古已有之，我國古代的孫子兵法就不僅是一部軍事著作，而且算是最早的一部博弈論專著。19 世紀 30 年代古諾對兩寡頭壟斷競爭進行了比較系統(tǒng)的研究。艾奇沃德、斯坦克爾伯格等人對不完全競爭為博弈論的創(chuàng)立奠定了堅實的基礎。（ 2）產(chǎn)生階段：1944 年科學家馮?諾伊曼和經(jīng)濟學家奧斯卡?摩根斯坦合著博弈論與經(jīng)濟行為將二人博弈推廣到n 人博弈結構并將博弈論系統(tǒng)的應用于經(jīng)濟領域，標志著博弈論作為一門獨立的的學科誕生。19

30、50 年和 1951 年發(fā)表了2 篇關于非合作博弈的重要文章，土克于1950年定義了“囚徒困境”。（3）發(fā)展階段：塞爾頓于1965 年將動態(tài)分析引入了納什均衡的概念，提出來“精煉納什均衡”概念；海薩尼則把不完全信息引入博弈論的研究，提出來不完全信息博弈和貝葉斯均衡概念等。（4）繁榮階段：以納什、塞爾頓、海薩尼榮獲1994 年諾貝爾經(jīng)濟學獎為標志。克瑞普斯、威爾遜、米格羅姆和羅伯茨建立了非常有名的四人幫模型。這個時期是博弈論研究的一個高潮時期，一方面是合作博弈發(fā)展到了鼎盛時期，包括納什和夏普里的“討價還價”模型， “核”的概念。這一時期海還提出了“微分博弈”，奧曼提出了“強均衡”概念， “重

31、復博弈”也開始研究。 1996 年諾貝爾經(jīng)濟學獎獲得者詹姆斯?莫里斯教授和威廉姆?維克瑞教授在20 世紀60、 70 年代提示不對稱信息對交易帶來的影響，并提出相應對策。70 年代的重要事件還包括“進化博弈論”， “進化穩(wěn)定策略”，此外“共同知識”也引起了廣泛關注。（5）成熟階段：20 世紀 90 年代是博弈論于駐留經(jīng)濟學融合時期，也是博弈論走向成熟時期。這個時期最重要的進展包括Elon KohlbergZAI 1981年引入“前向歸納法”，克里普斯和威爾遜在982 年提出“序列均衡”，斯密 1982 年出版進化和博弈論，海薩尼和澤爾藤在988 年提出有關非合作博弈中均衡選擇的一般理論和標準

32、。1991 年佛德伯格和泰勒提出了“精練貝葉斯均衡”。（每點 3 分）6. 舉例說明博弈論在經(jīng)濟管理領域的應用或現(xiàn)象。（至少一個詳細的案例，并加以具體的說明。）（同論述題1 ）答 : 管理學中的“保證最低價格”的策略。該條款規(guī)定，顧客在本商店購買這種商品一個月內，如果發(fā)現(xiàn)其他任何商店比本店更低價格出售同樣的商品，本店將退還差價，并補償差額的10%。對消費者來說，保證最低價格條款使你至少在一個月內不會因為商品降價而后悔你的購買，但這種條款無疑是企業(yè)之間競爭的一種手段。我們假定推行保證最低價格條款的商店為商店A，它的競爭者為商店B。當商店A把某產(chǎn)品定為5000 元并推行保證最低價格條款的時

33、候，商店 B 應如何定價最為有利呢？如果商店B 高于 5000 元，顯然對其競爭不利，因為除非顧客不了解情況，否則他們將到商店A去購買該產(chǎn)品。如果商店的定價低于5000 元，它能否因此而爭取到更多的顧客呢？不能，因為商店A已經(jīng)有了保證最低價格的條款。這樣，對商店B來說，它的最優(yōu)的定價策略就是與商店A制定同樣的價格。7. 試舉例說明保證最低價格的策略。（同 1）8. 舉例說明占優(yōu)戰(zhàn)略博弈。（至少 1 個案例，加以詳細說明）所謂占優(yōu)戰(zhàn)略即是這樣的一種策略，不管對手采取什么策略，這種策略都是最優(yōu)的。當對局者選擇的都是占優(yōu)戰(zhàn)略的時候，這種均衡就是占優(yōu)戰(zhàn)略均衡。（ 2 分）在囚徒困境中，每個博弈方選擇自

34、己的策略時，雖然無法知道另一方的實際選擇，但他卻不能忽視另一方的選擇對他自己的得益的影響，因此他應該考慮到另一方有兩種可能的選擇，并分別考慮自己相應的最佳策略。對囚徒甲來說，囚徒乙有坦白和不坦白兩種可能的選擇，假設囚徒乙的選擇是不坦白，則對囚徒甲來說，不坦白得益為-2 ，坦白得益為0，他應該選擇坦白；（ 4 分）假設囚徒乙選擇的是坦白，則囚徒甲不坦白得益為-9 ，坦白得益為-6 ，他還是該選擇坦白。因此，在此博弈中，無論囚徒乙采取何種策略囚徒甲的選擇只有一種，即坦白，因為在另一方兩種可能的情況下，坦白給自己帶來的得益都是較大的。同樣的道理，囚徒乙的唯一的選擇也是坦白。所以最可能的結局：該博弈的

35、最終結果是兩博弈方同選擇坦白策略，其均衡就是占優(yōu)戰(zhàn)略均衡。（ 4 分9. 試應用博弈論知識闡述囚徒困境案例。1 、警察把囚徒甲乙分開關押，并在提審時分別告之，如果你坦白而對方不坦白，你將只判0 年，對方判9 年；如果你不坦白對方坦白，你將判 9 年對方判0 年，如果兩人都坦白都將判6 年，如果都不坦白，都被判2 年。2、每個博弈方選擇自己的策略時，雖然無法知道另一方的實際選擇，但他卻不能忽視另一方的選擇對他自己的得益的影響，因此他應該考慮到另一方有兩種可能的選擇，并分別考慮自己相應的最佳策略。對囚徒甲來說，囚徒乙有坦白和不坦白兩種可能的選擇，假設囚徒乙的選擇是不坦白，則對囚徒甲來說，不坦白得益

36、為-2 ，坦白得益為0，他應該選擇坦白；3、假設囚徒乙選擇的是坦白，則囚徒甲不坦白得益為-9 ，坦白得益為-6 ，他還是該選擇坦白。因此，在此博弈中，無論囚徒乙采取何種策略囚徒甲的選擇只有一種，即坦白，因為在另一方兩種可能的情況下，坦白給自己帶來的得益都是較大的。同樣的道理，囚徒乙的唯一的選擇也是坦白。4、所以最可能的結局：該博弈的最終結果是兩博弈方同選擇坦白策略，其均衡就是占優(yōu)戰(zhàn)略均衡，雙方同獲得益-6 ，即都被判6 年。5、其支付矩陣如下：（每個空格2 分）嫌疑犯甲坦白不坦白嫌疑犯乙坦白-6 ， -60， -9不坦白-9 ，0-2 ， -210. 試從博弈論的角度分析價格競爭策略。1 、兩

37、家企業(yè)生產(chǎn)同一種產(chǎn)品，面臨降價與不減價的選擇，其支付矩陣如下：企業(yè)甲不降價降價企業(yè)乙不降價0， 0-100， 80降價80，-100-50 ， -502、每個博弈方選擇自己的策略時，雖然無法知道另一方的實際選擇，但他卻不能忽視另一方的選擇對他自己的得益的影響，因此他應該考慮到另一方有兩種可能的選擇，并分別考慮自己相應的最佳策略。對企業(yè)甲來說，企業(yè)乙有降價和不降價兩種可能的選擇，假設企業(yè)乙的選擇是不降價，則對企業(yè)甲來說，不降價得益為0，降價得益為80，企業(yè)甲應該選擇降價；3、假設企業(yè)乙選擇的是降價，則企業(yè)甲不降價得益為-100 ，降價得益為-50 ，企業(yè)甲還是該選擇降價。因此，在此博弈中，無論企

38、業(yè)乙采取何種策略企業(yè)甲的選擇只有一種，即降價，因為在另一方兩種可能的情況下，降價給自己帶來的得益都是較大的。同樣的道理，企業(yè)乙的唯一的選擇也是降價。4、所以最可能的結局：該博弈的最終結果是兩博弈方同時選擇降價策略，同獲得益-50 ，即雙方利潤減少50 萬。六、案例分析題主要結合納什均衡原理和占優(yōu)均衡原理分析具體案例。囚徒困境；智豬博弈；性別大戰(zhàn)；價格戰(zhàn)。性格大戰(zhàn)（情侶博弈）案例：一對戀人準備在周末晚上一起出去，男的喜歡看足球，但女的喜歡看時裝表演。當然兩個人都不愿意分開活動。不同的選擇給他們帶給他們不同的滿足。分析：可以看出，分開將使他們兩人得不到任何滿足，只要在一起，不管是看時裝表演還是看足

39、球，兩人都會得到一定的滿足。但看足球將使男的得到更大的滿足，看時裝表演則使女的得到更大的滿足。在這樣的一個對局中，男的和女的都沒有占優(yōu)戰(zhàn)略。他們的最優(yōu)策略依賴于對方的選擇，一旦對方選定了某一項活動，另一個人選擇同樣的活動就是最好的策略。因此，如果男的已經(jīng)買好了足球的門票，女的當然就不再反對；反之，如果女的已經(jīng)買好了時裝表演票，男的也就會與她一起看時裝表演。女足球時裝男足球2， 10， 0時裝0， 01， 2那么，兩人都去看時裝表演是一種均衡狀態(tài)，也就是說在這種狀態(tài)下，雙方都不想改變他們的策略。同樣，兩人都去看足球也是一種均衡狀態(tài)。因此，在這個對局中，同時出現(xiàn)了兩個均衡狀態(tài)。智豬博弈豬圈中有一

40、頭大豬和一頭小豬，在豬圈的一端設有一個按鈕，每按一下，位于豬圈另一端的食槽中就會有10 單位的豬食進槽，但每按一下按鈕會耗去相當于2 單位豬食的成本。如果大豬先到食槽，則大豬吃到9 單位食物，小豬僅能吃到1 單位食物；如果兩豬同時到食槽，則大豬吃 7 單位，小豬吃3 單位食物；如果小豬先到，大豬吃6 單位而小豬吃4 單位食物。下表給出這個博弈的支付矩陣。小豬按等待大豬按5， 14， 4等待9， -10， 0從矩陣中可以看出，當大豬選擇行動的時候，小豬如果行動，其收益是1，而小豬等待的話，收益是4，所以小豬選擇等待；當大豬選擇等待的時候，小豬如果行動的話，其收益是-1 ，而小豬等待的話，收益是0, 所以小豬也選擇等待。綜合來看，無論大豬是選擇行動還是等待，小豬的選擇都將是等待，即“按”是小豬的劣戰(zhàn)略，而等待是小豬的占優(yōu)策略。所以，理性的小豬會剔除“按”，而選擇“等待”；理性的大豬知道小豬會選擇“等待”，從而自己選擇“按”

人人文庫> 全部分類> 應用文書 > 研究報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《博弈與決策》90%復習資料

文檔簡介

溫馨提示

最新文檔

評論

《博弈與決策》90%復習資料

文檔簡介

溫馨提示

最新文檔

評論

相關文檔