《博弈論前沿專題》Word版教案

上傳人：為*** IP屬地：貴州上傳時(shí)間：2020-12-14 格式：DOC 頁(yè)數(shù)：6 大?。?4KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩1頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、20112012學(xué)年第二學(xué)期博弈論前沿專題Word版教案第一章預(yù)備知識(shí)（1）1 博弈論學(xué)科的研究對(duì)象：a 博弈論研究沖突與合作b 理性的個(gè)體或群體間的沖突與合作c 相互影響的決策理論（羅伯特奧曼Robert J. Aumann）2 博弈論(Game Theory)學(xué)科的產(chǎn)生和發(fā)展：（1）作為一門學(xué)科始于1944年馮諾伊曼（Von Neumann）和摩根斯坦（O. Morgenstern）的“Theory of Games and Economic Behavior” 一書。（2）50年代初天才數(shù)學(xué)家納什（J. Nash）證明了非合作博弈穩(wěn)定解的存在性，納什均衡和一般均衡一起成為經(jīng)濟(jì)學(xué)兩個(gè)基石

2、。（3）澤爾騰（1965）提出求解動(dòng)態(tài)博弈問題的子博弈均衡概念；（4）海薩尼（Harsanyi，1967）提出求解不完全信息博弈問題的海薩尼轉(zhuǎn)換，以及對(duì)于不完美信息博弈問題的貝葉斯均衡概念；（5）90年代以來博弈論的3個(gè)發(fā)展動(dòng)向：合作博弈理論（cooperate GT）、演化博弈（evolutionary GT）、實(shí)驗(yàn)博弈3 古典經(jīng)濟(jì)學(xué)中“理性經(jīng)濟(jì)人”內(nèi)涵：（1）“自利”。追求自身利益是根本動(dòng)機(jī)，同時(shí)利他。（2）“理性行為”4 西蒙的“有限理性”概念：（1）經(jīng)濟(jì)學(xué)家西蒙（1976）認(rèn)為，經(jīng)濟(jì)行為人由于：人類認(rèn)知能力的限制；未來預(yù)測(cè)不確定性；多樣化的目標(biāo)追求，最優(yōu)解是根本達(dá)不到的，提出了“有限理

3、性”（bounded rationality）（2）具有有限理性的個(gè)體決策者，只能進(jìn)行次優(yōu)選擇-追求較滿意的目標(biāo)。5 博弈論中“理性”概念的內(nèi)涵：（1）目標(biāo)理性(主觀理性):參與者追求自身利益的最大化(經(jīng)濟(jì)學(xué)理性的內(nèi)涵)（2）過程理性（具有理性的能力）：給定參與者對(duì)外部環(huán)境的信念后最大化自己的報(bào)酬，即“前后一致的”做出選擇.可以分為兩個(gè)推理步驟：a 認(rèn)知理性（cognitive）參與者對(duì)相關(guān)環(huán)境可獲得的信息與形成的信念之間的一致性，即參與者具有對(duì)相關(guān)環(huán)境形成信念的能力；b 工具理性（instrumental）參與者對(duì)外部給定的機(jī)遇與固定的偏好之間的一致性，即參與者具有從既定的信念推導(dǎo)出采取相應(yīng)

4、策略的能力。6 貝葉斯決策：（1）先由過去的經(jīng)驗(yàn)或者專家估計(jì)獲得即將發(fā)生事件的事前先驗(yàn)概率；（2）根據(jù)調(diào)查或者試驗(yàn)得出的條件概率，利用貝葉斯公式，計(jì)算事后的后驗(yàn)概率。第二章預(yù)備知識(shí)（2）1 博弈中均衡（納什均衡）的不同理解：（1）觀點(diǎn)1：參與者們采取的最佳應(yīng)對(duì)策略一致同意達(dá)到的結(jié)果，其具有“可自我實(shí)施”（self-inforcement）的特征（即：獨(dú)自偏離均衡策略不會(huì)帶來更好結(jié)果）。該觀點(diǎn)認(rèn)為，均衡是一種結(jié)果。（2）觀點(diǎn)2：博弈均衡，當(dāng)且僅當(dāng)每一個(gè)參與者對(duì)所有參與者的行為有正確的預(yù)期。該觀點(diǎn)認(rèn)為，均衡是一種信念。（3）觀點(diǎn)3：該觀點(diǎn)認(rèn)為，均衡是一種規(guī)則。在“理性”假設(shè)下，該三種定義是等價(jià)的

5、。2 選擇（selection）與精練（perfection）(1) 選擇問題：在非合作博弈中，一些威脅和承諾是不可信的，如何選擇那些能夠?qū)崿F(xiàn)一致預(yù)期的均衡結(jié)果；(2)精練問題：對(duì)于博弈存在多重均衡的情況，如何判斷哪些均衡更有可能實(shí)現(xiàn)。3 Nash在其博士論文“Non-cooperative games”（1950年）給出Nash均衡的兩種解釋:(1) 是“理性主義”的、內(nèi)省的、演繹的傳統(tǒng)解說均衡是通過理性的參與者進(jìn)行嚴(yán)密的邏輯演繹推理得到的，對(duì)參與者的理性能力有較高要求（傳統(tǒng)博弈分析）。(2) 是學(xué)習(xí)的、歸納的、演化的解說當(dāng)時(shí)沒有很好的方法構(gòu)建數(shù)學(xué)模型（國(guó)際上90年代興起演化博弈理論）。4

6、合作博弈：參與者之間的協(xié)議是有完全約束力并能夠?qū)嵤┑模赐馍o定的。合作博弈研究的主要問題：如何實(shí)現(xiàn)有約束力的協(xié)議的參與者之間無沖突的串謀？5 完美信息（perfective information）參與者在選擇行動(dòng)時(shí)了解以前的歷史，并且雙方?jīng)]有同時(shí)行動(dòng)。完備信息（complete information）參與者對(duì)博弈的信息是否完全了解，又稱完全信息。當(dāng)各個(gè)要素（參與者、規(guī)則、得益、策略）都是共同知識(shí)時(shí)，為完備信息。第三章傳統(tǒng)博弈理論的簡(jiǎn)介1 傳統(tǒng)博弈理論的研究思路：參與者“完全理性”假設(shè)下，通過推理演繹達(dá)到均衡化過程。均衡是瞬間實(shí)現(xiàn)的。2 納什均衡（Nash Equilibrium，簡(jiǎn)記N

7、E）的理解：參與者可以直接交換信息并一致同意選擇某一策略，雖然這些口頭協(xié)議無法強(qiáng)制實(shí)施，但是每個(gè)參與者單獨(dú)偏離卻不會(huì)帶來更大收益，因此該策略組合是自動(dòng)實(shí)施的（self-enforcing）。3 納什均衡的無效率問題：囚徒困境在非合作博弈框架內(nèi)的解決途徑？博弈重復(fù)進(jìn)行的過程中產(chǎn)生合作行為。其它的一些途徑包括聲譽(yù)效應(yīng)、互惠機(jī)制、利他主義行為、空間網(wǎng)絡(luò)上的演化博弈等4 無限次重復(fù)博弈的分析思路；在無限次重復(fù)博弈中，考慮到時(shí)間價(jià)值，引入貼現(xiàn)系數(shù)，這樣總收益將是一個(gè)有限數(shù)加以比較。5如何理解無限次重復(fù)博弈的無名氏定理（民間定理）？對(duì)于原博弈具有唯一NE（如囚徒困境）的無限次重復(fù)博弈，可以設(shè)計(jì)出具有可信威

8、脅的觸發(fā)策略，如果參與者比較看重未來長(zhǎng)期合作的收益（貼現(xiàn)系數(shù)足夠大），就可以達(dá)成合作結(jié)局，擺脫囚徒困境。6 動(dòng)態(tài)博弈的核心問題：為了影響對(duì)方下階段的行動(dòng)，作出一些威脅或承諾。但這些威脅或承諾是否可信？7 子博弈完美的基本思想：（1）動(dòng)態(tài)博弈中，一個(gè)納什均衡策略的每一個(gè)子博弈都是納什均衡，則該均衡策略是子博弈完美納什均衡；（2）其對(duì)于雙方理性能力的要求是基于“共同知識(shí)”，因此在NE的基礎(chǔ)上（可自我實(shí)施的穩(wěn)定均衡），依據(jù)反向歸納法進(jìn)一步剔除那些不可信的威脅和承諾。（3）由于動(dòng)態(tài)博弈的核心問題是“可信性”，因此子博弈完美均衡是求解動(dòng)態(tài)博弈問題的基本均衡概念。8 不完全信息博弈的處理方法：（1）海薩尼

9、轉(zhuǎn)換（Harsanyis procedure），引入一個(gè)神秘的“自然”，其事先決定了參與者的各種可能類型，以及每種類型發(fā)生的概率。注意：每個(gè)參與者的真實(shí)類型只是他本人的私人信息；但是各種可能的類型和相應(yīng)概率，卻是共同知識(shí)。由此，可將不完備信息轉(zhuǎn)化為完備但不完美信息。（2）進(jìn)而，通過貝葉斯決策，可以得到不完美信息下分析方法。9 計(jì)算要求：掌握求解靜態(tài)博弈的混合策略均衡；動(dòng)態(tài)博弈的子博弈完美納什均衡；重復(fù)博弈的均衡路徑求解第四章不完全信息博弈和信息經(jīng)濟(jì)學(xué)（1）：道德風(fēng)險(xiǎn)和激勵(lì)理論1 信息經(jīng)濟(jì)學(xué)的研究對(duì)象：以參與者不對(duì)稱信息為基本出發(fā)點(diǎn)，分析不對(duì)稱信息對(duì)效率的損害，以及怎樣設(shè)計(jì)可能的機(jī)制減輕這種損

10、害。2 私人信息（private information）:訂立契約或執(zhí)行過程中只有自己知道的信息。其造成了交易雙方的不對(duì)稱信息。公共信息（public information）:大家都可以觀察到的信息。3 委托人和代理人：交易過程中具有私人信息的一方稱為代理人(agent)，處于信息劣勢(shì)的一方稱為委托人(contract)。不對(duì)稱信息的交易過程即為委托人與代理人簽訂某種契約的過程。4 道德風(fēng)險(xiǎn)（moral hazard）：由于委托人無法簡(jiǎn)單的要求代理人根據(jù)其利益采取相應(yīng)的行動(dòng)，因此代理人根據(jù)自己喜好采取有損委托人利益的行動(dòng)（又稱為簽訂契約后隱藏行動(dòng)問題）。其中，一種情況是代理人的行動(dòng)無法被觀

11、察；另一種情況是觀察到代理人的行動(dòng)后無法證實(shí)違背合同。5 逆向選擇（adverse selection）:代理人在交易前謊報(bào)自己的真實(shí)信息，從而謀取更大利益。由于委托人降低了對(duì)代理人水平的預(yù)期，造成高質(zhì)量的代理人退出市場(chǎng)，交易減少，效率下降（又成簽約前的隱藏信息問題）。6 委托代理模型：（1）參與約束(Participation Constraints)：代理人接受合同所能獲得的最低效用，應(yīng)該大于市場(chǎng)的保留效用。（2）激勵(lì)相容約束（Incentive-compatibility Constraints）：在委托人無法觀察代理人行動(dòng)時(shí)，合同設(shè)計(jì)必須滿足代理人付出較高水平的努力獲得的效用，大于偷懶

12、的效用。此時(shí)代理人的激勵(lì)和委托人目標(biāo)是相容的。各種激勵(lì)方案，必須同時(shí)滿足代理人的參與約束和激勵(lì)相容約束。（3）委托人選擇的最優(yōu)激勵(lì)方案，目標(biāo)使得委托人的期望收益最大化。7 委托代理理論的優(yōu)缺點(diǎn)：（1）優(yōu)點(diǎn)：給定外部環(huán)境下，適用于分析在信息不對(duì)稱條件下，哪一種激勵(lì)兼容的契約安排能夠成為對(duì)環(huán)境和激勵(lì)約束的次優(yōu)反應(yīng)。（2）局限性：一是模型解對(duì)技術(shù)環(huán)境、參與者目標(biāo)函數(shù)的參數(shù)、代理人參與約束的外部制度環(huán)境的設(shè)定非常敏感；二是適用于特定的由技術(shù)唯一決定的制度環(huán)境中，未能考慮政治、文化、慣例等其它因素。第五章不完全信息博弈和信息經(jīng)濟(jì)學(xué)（2）：逆向選擇和信息甄別1 阿克羅夫（Akerlof）在其1970年發(fā)

13、表的檸檬市場(chǎng)：產(chǎn)品質(zhì)量的不確定性與市場(chǎng)機(jī)制中舉了二手車市場(chǎng)的案例。2 考慮勞動(dòng)力可以通過接受教育發(fā)送信號(hào)的情況，分離均衡概念的涵義：是指均衡狀態(tài)下，不同類型的代理人選擇不同的觀察指標(biāo)（信號(hào)）最優(yōu)水平，從而委托人能夠加以區(qū)分。3 不同信息條件下的效率比較：(1) 完全信息下，企業(yè)不需任何成本，直接觀察到兩種類型的勞動(dòng)力；(2) 不完全信息下信號(hào)發(fā)送達(dá)到分離均衡時(shí)，企業(yè)也能區(qū)分兩種類型的勞動(dòng)力，但是高素質(zhì)勞動(dòng)力需要付出一定的教育成本，效率損失；4 信息甄別概念：在不完全信息下，委托人設(shè)計(jì)特定的契約對(duì)不同類型的代理人進(jìn)行篩選。5 計(jì)算要求：作圖和計(jì)算分析信號(hào)發(fā)送的混同均衡和分離均衡臨界值。第六章不

14、完全信息博弈和信息經(jīng)濟(jì)學(xué)（3）：機(jī)制設(shè)計(jì)理論與顯示原理1 機(jī)制設(shè)計(jì)理論的研究對(duì)象：為了達(dá)到某種理想的目標(biāo)，而需要設(shè)計(jì)什么樣的博弈規(guī)則（機(jī)制）來實(shí)現(xiàn)？其中所謂最優(yōu)的機(jī)制，是從機(jī)制設(shè)計(jì)者角度而言最好的均衡結(jié)果。2 設(shè)計(jì)者的約束條件：(1) 首先，不能有任何強(qiáng)迫(參與約束，或個(gè)人理性約束)；(2) 其次，參與者只根據(jù)自身利益最大化采取相應(yīng)行動(dòng)(激勵(lì)相容約束)3 機(jī)制設(shè)計(jì)的過程：(1) 委托人設(shè)計(jì)一個(gè)機(jī)制（或契約、激勵(lì)方案），即博弈規(guī)則；(2) 代理人接受或拒絕該機(jī)制；(3) 接受機(jī)制的代理人進(jìn)行由機(jī)制所確定的博弈。4 機(jī)制設(shè)計(jì)的目的：由于不完全信息下的均衡結(jié)果存在著福利損失，機(jī)制設(shè)計(jì)理論的一個(gè)重要目

15、的：尋求使這種福利損失最小的機(jī)制5 顯示原理：任何一個(gè)說謊話機(jī)制（non-truth-telling）下的潛在交易達(dá)到的均衡結(jié)果，都可以被一個(gè)說真話的機(jī)制所取代。顯示原理（revelation principle）能夠大大縮小我們的考察范圍：當(dāng)代理人擁有私人信息可以說謊時(shí)，根據(jù)顯示原理，搜尋最優(yōu)機(jī)制的范圍縮小為那些說真話的機(jī)制即可。第七章不完全信息博弈和信息經(jīng)濟(jì)學(xué)（3）：招標(biāo)和拍賣1拍賣和招標(biāo)（auction）：把出售物品稱為拍賣，把為了發(fā)包一項(xiàng)工程或提供一項(xiàng)服務(wù)的交易活動(dòng)稱為招標(biāo)，即花錢購(gòu)買服務(wù)。兩者區(qū)別：拍賣品已經(jīng)存在，信息比較完全，因此由出價(jià)高者獲得；招標(biāo)是未完成的工程或服務(wù)，涉及到未

16、來的不確定性，除了價(jià)格低廉外，還要考慮企業(yè)實(shí)施的承諾和企業(yè)信譽(yù)等因素。兩者共同點(diǎn)：通常標(biāo)的物潛在價(jià)值都比較大；市場(chǎng)上只有單方向的競(jìng)爭(zhēng)，即潛在的買主和投標(biāo)人之間；一般情況下，買主對(duì)標(biāo)的物的估價(jià)（保留價(jià)格）是私人信息，賣主或招標(biāo)人不知道。2 獨(dú)立私有價(jià)值拍賣（individual private value auction）：每個(gè)參與者都知道自己對(duì)拍賣品的估價(jià)，但是不知道別人的估價(jià)，而且每個(gè)買主是相互獨(dú)立的（即拍賣時(shí)候不相互影響，不勾結(jié)）。如藝術(shù)品3 公共價(jià)值拍賣（common value auction）：拍賣品的價(jià)值對(duì)所有買主都是相同的，但是仍不確定具體數(shù)額。4 根據(jù)拍賣規(guī)則，拍賣的分類：（1

17、）英國(guó)式拍賣（English auction）：一種升價(jià)的公開喊價(jià)拍賣，買主不斷的提高競(jìng)拍價(jià)格，直到?jīng)]人愿意出更高價(jià)錢為止。具有“說真話”激勵(lì)。（2）荷蘭式拍賣（Dutch auction）:一種降價(jià)的公開喊價(jià)拍賣，拍賣主持人先提出一個(gè)很高的價(jià)格，然后不斷降價(jià)，直到有人愿意接受。（3）密封第一價(jià)格拍賣（first price sealed bid auction）：買主向拍賣人遞交密封的出價(jià)，由出價(jià)最高者贏得交易，付出所出價(jià)格。（4）密封第二價(jià)格拍賣：買主向拍賣人遞交密封的出價(jià)，由出價(jià)最高者贏得交易，但是只需要付出第二高的價(jià)格。該拍賣制度為了便于分析拍賣理論，由維克瑞（Vickrey，96諾獎(jiǎng)

18、得主）1961年提出，又稱維克瑞拍賣（Vickrey auction）。具有“說真話”激勵(lì)。5 實(shí)際拍賣設(shè)計(jì)面臨的一些問題：參與者合謀；進(jìn)入阻撓和掠奪；保留價(jià)格過低等。第八章討價(jià)還價(jià)和合作博弈理論1討價(jià)還價(jià)問題的特點(diǎn)：(1) 各方都面臨共同的結(jié)果集合（即包含各種可能的談判方案）；(2) 參與者在討價(jià)還價(jià)過程中不會(huì)考慮那些比現(xiàn)狀更糟糕的結(jié)果（即使談判失敗，也會(huì)維持現(xiàn)狀而不會(huì)變得更差）；(3) 至少有一個(gè)討價(jià)還價(jià)的結(jié)果是各方都有利可圖的。2討價(jià)還價(jià)問題的納什解法：不考慮具體討價(jià)還價(jià)過程，現(xiàn)假定有一個(gè)裁判者，其效用偏好（即反映了該問題的一種解法）在圖形上表現(xiàn)為無差異曲線： u(s)u1(s)u2(

19、s)，該無差異曲線與效用配置集U(B)的切點(diǎn)N即為討價(jià)還價(jià)問題的納什解。N(B) s arg max u1(s) u1(d)u2(s) u2(d ) 3討價(jià)還價(jià)問題的解法的基本要求（公理化體系）：（1）帕累托最優(yōu)：討價(jià)還價(jià)問題的解不會(huì)是嚴(yán)格劣勢(shì)的結(jié)果（2）不相關(guān)選擇項(xiàng)的獨(dú)立性（3）線性變換無關(guān)：討價(jià)還價(jià)問題的解與效用函數(shù)的線性變換無關(guān)（4）對(duì)稱性要求：如果討價(jià)還價(jià)雙方的實(shí)力是相同的，那么任何合理的解法應(yīng)該賦予雙方同樣的效用。4討價(jià)還價(jià)問題按比例分配的K-S解法（Kalai和Smorodinsky,1975）： (1) 首先找出參與者在討價(jià)還價(jià)問題中所能獲得的各自最大效用；(2) 將“最大效用組

20、合點(diǎn)”與談判破裂點(diǎn)連線，稱為K-S線；(3) 該直線與效用配置集的交點(diǎn)，即為該方案的K-S解。5討價(jià)還價(jià)問題的“平均主義”解法：K-S線換成了固定的45度線。倫理上考慮，無論初始條件如何，雙方的分配結(jié)果絕對(duì)平均。6討價(jià)還價(jià)問題的“效用主義”解法：假設(shè)討價(jià)還價(jià)雙方能夠形成總效用u1(s)u2(s)，即將納什解法的雙曲型無差異曲線換成了直線型。只關(guān)心雙方總效用的最大化7 計(jì)算要求：掌握NASH解法和K-S解法。第九章演化博弈理論1演化博弈理論群體參與者的“有限理性”基本假設(shè)的內(nèi)涵:（1）慣例行為（inertia）：由于參與者變更策略存在著成本，因此大多數(shù)人按慣例采取行動(dòng)（2）決策上的“近似眼”(myopia)：當(dāng)少部分參與者變更策略時(shí)，總是以現(xiàn)有策略狀態(tài)作為已知條件進(jìn)行分析，而不具有預(yù)測(cè)能力（3）試錯(cuò)法的嘗試行為(trial and experiments)：少部分具有冒險(xiǎn)精神的參與者并不拘泥于最優(yōu)策略，而是嘗試采取其它各種策略。2 演化博弈理論的分析對(duì)象：社會(huì)經(jīng)濟(jì)系統(tǒng)中有限

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《博弈論前沿專題》Word版教案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《博弈論前沿專題》Word版教案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔