《博弈論基礎(chǔ)》大學(xué)筆記

上傳人：1*** IP屬地：四川上傳時(shí)間：2025-05-16 格式：DOCX 頁(yè)數(shù)：14 大?。?6.96KB 積分：6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩9頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《博弈論基礎(chǔ)》大學(xué)筆記第一章：引言1.1博弈論的起源與發(fā)展博弈論作為一種數(shù)學(xué)理論，最早可追溯到20世紀(jì)初。它的誕生標(biāo)志著對(duì)策略互動(dòng)的正式研究開(kāi)始。約翰·馮·諾依曼和奧斯卡·摩根斯坦在1944年合著的《博弈論與經(jīng)濟(jì)行為》是該領(lǐng)域的奠基之作。時(shí)間重要事件關(guān)鍵人物1928年馮·諾依曼發(fā)表論文《ZurTheoriederGesellschaftsspiele》約翰·馮·諾依曼1944年《博弈論與經(jīng)濟(jì)行為》出版馮·諾依曼和摩根斯坦1950年代納什均衡概念提出約翰·納什1960-70年代合作博弈與非合作博弈區(qū)分確立多位學(xué)者參與1.2博弈論的應(yīng)用領(lǐng)域博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、政治學(xué)、生物學(xué)等多個(gè)學(xué)科。例如，在市場(chǎng)分析中，它幫助理解價(jià)格戰(zhàn)；在國(guó)際關(guān)系里，用于模擬國(guó)家間的戰(zhàn)略互動(dòng)；在生態(tài)學(xué)方面，解釋物種間的競(jìng)爭(zhēng)和共生現(xiàn)象。1.3學(xué)習(xí)目標(biāo)與方法本課程旨在為學(xué)生提供一個(gè)全面了解博弈論基礎(chǔ)知識(shí)的平臺(tái)。學(xué)習(xí)過(guò)程中，將強(qiáng)調(diào)理論與實(shí)踐相結(jié)合，通過(guò)案例分析加深理解。我們鼓勵(lì)學(xué)生積極參與討論，培養(yǎng)批判性思維能力。第二章：策略形式的博弈2.1策略形式博弈的定義策略形式博弈指的是所有參與者同時(shí)選擇行動(dòng)的情況。每個(gè)參與者根據(jù)其他人的選擇來(lái)決定自己的最佳策略。這種博弈通常用支付矩陣表示。2.2支付矩陣的構(gòu)建與解讀支付矩陣是展示策略形式博弈的一種工具。以?xún)蓚€(gè)玩家A和B為例，如果A有兩個(gè)策略（S1,S2），B也有兩個(gè)策略（T1,T2），那么可以構(gòu)建一個(gè)2x2的支付矩陣來(lái)展示不同策略組合下的結(jié)果。2.2.1示例分析假設(shè)玩家A和B正在玩一場(chǎng)簡(jiǎn)單的游戲，其支付矩陣如下所示：如果A選擇S1且B選擇T1，則A得2分，B得3分。如果A選擇S1而B(niǎo)選擇T2，則A得1分，B得4分。如果A選擇S2而B(niǎo)選擇T1，則A得4分，B得1分。如果A選擇S2且B選擇T2，則A得3分，B得2分。2.3實(shí)例分析考慮一個(gè)更復(fù)雜的場(chǎng)景，如廣告競(jìng)爭(zhēng)中的兩家公司。它們可以選擇高投資或低投資于廣告。通過(guò)分析不同的策略組合及其對(duì)應(yīng)的收益，可以幫助理解哪種策略可能帶來(lái)最大利益。第三章：純策略納什均衡3.1納什均衡的概念及其意義納什均衡是指在一個(gè)博弈中，任何一位參與者都無(wú)法通過(guò)單方面改變自己的策略來(lái)獲得更好的結(jié)果。換句話(huà)說(shuō)，每位玩家都選擇了對(duì)自己最有利的策略，基于其他玩家的選擇。3.2如何找到純策略納什均衡尋找純策略納什均衡的一個(gè)簡(jiǎn)單方法是檢查每個(gè)玩家的每種策略組合，看看是否有任何一方可以通過(guò)改變策略來(lái)改善自己的處境。如果沒(méi)有，那么當(dāng)前的策略組合就是一個(gè)納什均衡。3.2.1步驟解析列出所有可能的策略組合計(jì)算每個(gè)組合下的收益評(píng)估是否可以通過(guò)改變策略提高收益3.3純策略納什均衡的存在性并非所有博弈都有純策略納什均衡。例如，在某些情況下，只有當(dāng)玩家采用混合策略時(shí)才能達(dá)到均衡。然而，對(duì)于有限的兩人零和博弈，至少存在一個(gè)納什均衡點(diǎn)。3.4案例研究：囚徒困境囚徒困境是一個(gè)經(jīng)典的例子，展示了為什么即使在雙方都能從合作中獲益的情況下，個(gè)人理性也可能導(dǎo)致集體不理想的結(jié)局。在這個(gè)游戲中，兩名嫌疑人被拘留并分別審問(wèn)。他們面臨的選擇是保持沉默（合作）還是背叛對(duì)方。無(wú)論另一方如何選擇，背叛總是比合作更有利，但兩人都背叛會(huì)導(dǎo)致最差的結(jié)果。第四章：混合策略納什均衡4.1混合策略的定義混合策略是指玩家在每個(gè)回合中隨機(jī)選擇行動(dòng)，而不是始終選擇相同的確定性策略。這意味著玩家會(huì)根據(jù)一定的概率分布來(lái)決定采取哪種策略。4.2如何計(jì)算混合策略納什均衡找到混合策略納什均衡需要確保沒(méi)有玩家可以通過(guò)改變自己的策略分布來(lái)提高預(yù)期收益。這通常涉及到解一系列方程組，以確定每個(gè)玩家的最佳概率分布。4.2.1步驟解析列出所有純策略組合及其對(duì)應(yīng)的支付設(shè)置變量表示每種策略的概率構(gòu)建并求解線(xiàn)性方程組玩家A\玩家BB選T1的概率B選T2的概率A選S1的概率P(S1,T1)P(S1,T2)A選S2的概率P(S2,T1)P(S2,T2)4.3實(shí)際案例研究考慮一個(gè)簡(jiǎn)單的剪刀石頭布游戲。假設(shè)兩位玩家A和B都采用混合策略，即每位玩家都有1/3的概率選擇剪刀、石頭或布。在這種情況下，任何一方都無(wú)法通過(guò)單方面調(diào)整策略概率來(lái)改善其預(yù)期收益，從而形成一個(gè)混合策略納什均衡。4.4混合策略納什均衡的重要性在許多實(shí)際情境中，純策略納什均衡可能不存在或者不唯一，而混合策略納什均衡提供了一種解決方法。它不僅擴(kuò)展了博弈論的應(yīng)用范圍，還為理解不確定性和風(fēng)險(xiǎn)提供了理論基礎(chǔ)。第五章：擴(kuò)展形式的博弈5.1擴(kuò)展形式博弈的表示方法擴(kuò)展形式博弈（ExtensiveFormGames）是一種用于描述序列決策過(guò)程的方法。與策略形式博弈不同，它能夠捕捉到游戲中時(shí)間順序的影響。5.2決策樹(shù)與信息集在擴(kuò)展形式博弈中，決策樹(shù)是一個(gè)關(guān)鍵工具，用于描繪每個(gè)玩家在不同階段的選擇路徑。此外，信息集幫助我們理解哪些信息是可用的以及何時(shí)可用。5.2.1構(gòu)建決策樹(shù)確定游戲的起始點(diǎn)添加每個(gè)決策節(jié)點(diǎn)連接各節(jié)點(diǎn)形成分支標(biāo)記每個(gè)終端節(jié)點(diǎn)的收益5.3子博弈完美納什均衡子博弈完美納什均衡（SubgamePerfectNashEquilibrium,SPNE）要求每個(gè)子博弈中的策略都是納什均衡。這避免了非理性威脅的存在，并確保了均衡策略在整個(gè)游戲中的一致性。5.3.1計(jì)算SPNE識(shí)別所有子博弈為每個(gè)子博弈找到納什均衡回溯至初始節(jié)點(diǎn)，驗(yàn)證整體策略是否構(gòu)成均衡5.4應(yīng)用實(shí)例：談判中的承諾問(wèn)題在商業(yè)談判中，參與者可能會(huì)做出某些承諾，但這些承諾只有在其對(duì)未來(lái)行為產(chǎn)生影響時(shí)才具有可信度。通過(guò)分析擴(kuò)展形式博弈，可以評(píng)估不同承諾的有效性及其對(duì)談判結(jié)果的影響。第六章：重復(fù)博弈6.1重復(fù)博弈的基本概念重復(fù)博弈指的是同一博弈被多次重復(fù)進(jìn)行的情況。與一次性博弈相比，重復(fù)博弈允許參與者基于之前的經(jīng)驗(yàn)調(diào)整策略，增加了合作的可能性。6.2針對(duì)不同類(lèi)型的重復(fù)博弈策略分析根據(jù)重復(fù)次數(shù)的不同，重復(fù)博弈可分為有限次重復(fù)博弈和無(wú)限次重復(fù)博弈。不同的重復(fù)結(jié)構(gòu)會(huì)導(dǎo)致不同的最優(yōu)策略選擇。6.2.1有限次重復(fù)博弈觸發(fā)策略：一旦對(duì)手背叛，立即轉(zhuǎn)向懲罰性的策略。寬容策略：即使對(duì)方偶爾背叛，仍保持一定程度的合作。6.3合作與背叛的長(zhǎng)期影響在重復(fù)博弈中，合作往往比背叛更能帶來(lái)長(zhǎng)期利益。然而，實(shí)現(xiàn)這一目標(biāo)需要建立信任機(jī)制，并設(shè)計(jì)有效的激勵(lì)措施以促進(jìn)合作行為。6.3.1合作的條件透明的信息交流明確的規(guī)則與懲罰機(jī)制長(zhǎng)期互動(dòng)的機(jī)會(huì)6.4典型案例：囚徒困境的重復(fù)版本在重復(fù)囚徒困境中，如果博弈足夠長(zhǎng)且雙方都采用適當(dāng)?shù)牟呗?，如“以牙還牙”策略，則可以實(shí)現(xiàn)持續(xù)的合作。這種策略鼓勵(lì)初始合作，并在對(duì)方背叛后立即報(bào)復(fù)，隨后恢復(fù)合作，以此來(lái)維持穩(wěn)定的合作關(guān)系。第七章：零和博弈7.1零和博弈的特點(diǎn)與分類(lèi)零和博弈是一種特殊類(lèi)型的博弈，在這種博弈中，一個(gè)參與者的收益必然等于另一個(gè)參與者的損失。換句話(huà)說(shuō)，所有參與者收益的總和為零。特性描述收益分配參與者之間收益總和為零策略互動(dòng)對(duì)抗性強(qiáng)，一方所得即另一方所失應(yīng)用領(lǐng)域經(jīng)濟(jì)、軍事、競(jìng)技體育等7.2極小極大定理極小極大定理（MinimaxTheorem）是零和博弈中的一個(gè)重要概念，它指出在兩人有限零和博弈中，存在一個(gè)納什均衡點(diǎn)，該點(diǎn)可以通過(guò)最小化對(duì)手的最大可能收益來(lái)找到。7.2.1定理內(nèi)容玩家A的目標(biāo)：最大化其最小可能收益。玩家B的目標(biāo)：最小化其最大可能損失。7.3解決零和博弈的方法解決零和博弈通常涉及尋找最優(yōu)策略組合，這可以通過(guò)線(xiàn)性規(guī)劃或直接計(jì)算支付矩陣中的值來(lái)實(shí)現(xiàn)。7.3.1線(xiàn)性規(guī)劃方法定義變量表示每種策略的概率建立目標(biāo)函數(shù)添加約束條件求解線(xiàn)性規(guī)劃問(wèn)題7.4實(shí)際案例分析考慮一個(gè)簡(jiǎn)單的撲克游戲，兩位玩家通過(guò)下注和棄牌來(lái)進(jìn)行對(duì)抗。在這個(gè)游戲中，每位玩家的策略選擇直接影響對(duì)方的收益，因此是一個(gè)典型的零和博弈。通過(guò)對(duì)不同策略組合的分析，可以找到最佳策略以確保在長(zhǎng)期中獲得最大收益。第八章：合作博弈8.1合作博弈的基礎(chǔ)理論合作博弈關(guān)注的是如何在參與者之間分配合作帶來(lái)的總收益。與非合作博弈不同，合作博弈假設(shè)參與者能夠達(dá)成協(xié)議并共同行動(dòng)以實(shí)現(xiàn)集體利益最大化。8.2核心與穩(wěn)定集核心（Core）是指一組分配方案，其中沒(méi)有任何子集能通過(guò)脫離聯(lián)盟而獲得更高的收益。穩(wěn)定集（StableSet）則是指一系列合理的分配方案，它們相互支持且不存在優(yōu)于其他方案的情況。8.2.1核心的性質(zhì)個(gè)體理性：每個(gè)成員至少獲得獨(dú)立行動(dòng)時(shí)的收益。群體穩(wěn)定性：沒(méi)有子群能通過(guò)脫離聯(lián)盟獲得更高收益。8.3分配方案與夏普利值夏普利值（ShapleyValue）提供了一種公平分配合作收益的方法。它基于每個(gè)參與者對(duì)聯(lián)盟貢獻(xiàn)的邊際價(jià)值來(lái)確定分配比例。8.3.1夏普利值的計(jì)算確定所有可能的聯(lián)盟組合計(jì)算每個(gè)參與者在各聯(lián)盟中的邊際貢獻(xiàn)根據(jù)邊際貢獻(xiàn)加權(quán)平均得出最終分配8.4案例研究：企業(yè)間的合作在一個(gè)由多家公司組成的供應(yīng)鏈網(wǎng)絡(luò)中，各家公司通過(guò)資源共享和技術(shù)合作來(lái)提升整體競(jìng)爭(zhēng)力。通過(guò)應(yīng)用合作博弈理論，可以設(shè)計(jì)出合理的利潤(rùn)分配機(jī)制，激勵(lì)各方積極參與合作，從而實(shí)現(xiàn)共贏局面。第九章：談判理論9.1談判問(wèn)題的形式化描述談判理論探討的是當(dāng)兩個(gè)或多個(gè)參與者就資源分配進(jìn)行協(xié)商時(shí)的行為模式。談判過(guò)程可以被形式化為一個(gè)博弈，其中每個(gè)參與者都有自己的偏好和策略。9.2納什談判解納什談判解（NashBargainingSolution）提出了一種理想化的解決方案，旨在最大化雙方的聯(lián)合收益，同時(shí)考慮到各自的威脅點(diǎn)（即不達(dá)成協(xié)議時(shí)各自能獲得的最佳結(jié)果）。9.2.1計(jì)算納什談判解確定雙方的威脅點(diǎn)構(gòu)建效用函數(shù)求解使聯(lián)合效用最大化的分配方案9.3影響談判結(jié)果的因素談判結(jié)果受多種因素影響，包括但不限于信息不對(duì)稱(chēng)、權(quán)力分布、信任程度以及談判技巧。了解這些因素有助于制定更有效的談判策略。9.3.1關(guān)鍵因素分析信息透明度：充分的信息共享有助于減少誤解和沖突。談判力量對(duì)比：較強(qiáng)的談判地位往往帶來(lái)更有利的結(jié)果。信任關(guān)系：建立互信是長(zhǎng)期合作的基礎(chǔ)。9.4實(shí)際案例：跨國(guó)公司的并購(gòu)談判在全球化背景下，跨國(guó)公司之間的并購(gòu)活動(dòng)日益頻繁。成功的并購(gòu)談判不僅需要精確評(píng)估雙方的價(jià)值，還需考慮文化差異、法律環(huán)境等因素。通過(guò)運(yùn)用談判理論，可以幫助雙方找到平衡點(diǎn)，達(dá)成互利共贏的協(xié)議。第十章：拍賣(mài)理論10.1拍賣(mài)的基本類(lèi)型與規(guī)則拍賣(mài)是一種通過(guò)競(jìng)爭(zhēng)性出價(jià)來(lái)分配商品或服務(wù)的機(jī)制。根據(jù)拍賣(mài)規(guī)則的不同，可以分為多種類(lèi)型，如英式拍賣(mài)、荷蘭式拍賣(mài)、密封第一價(jià)格拍賣(mài)和密封第二價(jià)格拍賣(mài)等。拍賣(mài)類(lèi)型規(guī)則描述英式拍賣(mài)競(jìng)標(biāo)者公開(kāi)加價(jià)，最高出價(jià)者獲勝荷蘭式拍賣(mài)價(jià)格從高到低遞減，第一個(gè)接受者獲勝密封第一價(jià)格所有競(jìng)標(biāo)者同時(shí)提交一次報(bào)價(jià)，最高者勝出并支付其報(bào)價(jià)密封第二價(jià)格類(lèi)似于密封第一價(jià)格，但勝出者支付第二高的報(bào)價(jià)10.2不同拍賣(mài)機(jī)制下的策略選擇在不同的拍賣(mài)機(jī)制下，參與者的最優(yōu)策略會(huì)有所不同。例如，在英式拍賣(mài)中，參與者可能會(huì)選擇逐步提高報(bào)價(jià)以保持競(jìng)爭(zhēng)力；而在密封第一價(jià)格拍賣(mài)中，則需要仔細(xì)評(píng)估對(duì)手的可能報(bào)價(jià)，并據(jù)此調(diào)整自己的出價(jià)。10.2.1英式拍賣(mài)策略初期試探：開(kāi)始時(shí)觀察他人出價(jià)。適時(shí)加價(jià)：當(dāng)接近心理價(jià)位時(shí)逐步增加出價(jià)。避免過(guò)度競(jìng)爭(zhēng)：防止因情緒化出價(jià)過(guò)高。10.3拍賣(mài)設(shè)計(jì)中的博弈論應(yīng)用拍賣(mài)設(shè)計(jì)不僅涉及經(jīng)濟(jì)學(xué)原理，還涉及到復(fù)雜的博弈論問(wèn)題。如何設(shè)計(jì)一個(gè)既能最大化賣(mài)家收益又能保證公平性的拍賣(mài)機(jī)制是一個(gè)重要的研究領(lǐng)域。10.3.1關(guān)鍵考慮因素信息不對(duì)稱(chēng)：買(mǎi)家對(duì)商品價(jià)值的認(rèn)知差異。激勵(lì)相容性：確保誠(chéng)實(shí)報(bào)價(jià)是最優(yōu)策略。市場(chǎng)效率：商品應(yīng)分配給對(duì)其估值最高的買(mǎi)家。10.4實(shí)際案例分析：頻譜拍賣(mài)頻譜資源是電信行業(yè)的重要資產(chǎn)，各國(guó)政府通常通過(guò)拍賣(mài)方式分配這些稀缺資源。美國(guó)聯(lián)邦通信委員會(huì)（FCC）曾采用多輪次拍賣(mài)機(jī)制成功分配頻譜，既提高了資源利用效率，也增加了國(guó)家財(cái)政收入。第十一章：演化博弈論11.1演化穩(wěn)定策略的概念**演化穩(wěn)定策略（ESS）**是指在一個(gè)種群中，如果大多數(shù)個(gè)體都采取這種策略，則任何突變策略都無(wú)法入侵該種群。ESS提供了一個(gè)解釋生物行為和社會(huì)現(xiàn)象的新視角。11.2動(dòng)態(tài)模型與復(fù)制者方程為了理解ESS在種群中的傳播過(guò)程，演化博弈論引入了動(dòng)態(tài)模型，特別是復(fù)制者方程。該方程描述了不同策略在種群中的頻率隨時(shí)間變化的情況。11.2.1復(fù)制者方程解析基本形式：dx/dt=x(1-x)(u-v)，其中x表示某一策略的比例，u和v分別為該策略與其他策略相遇時(shí)的平均收益。穩(wěn)定性分析：通過(guò)計(jì)算固定點(diǎn)及其穩(wěn)定性判斷是否為ESS。11.3生物學(xué)與社會(huì)科學(xué)中的應(yīng)用實(shí)例演化博弈論不僅應(yīng)用于生物學(xué)領(lǐng)域，解釋動(dòng)物行為和社會(huì)結(jié)構(gòu)，還在社會(huì)科學(xué)中找到了廣泛應(yīng)用，如經(jīng)濟(jì)學(xué)、政治學(xué)等，用于分析人類(lèi)決策模式。11.3.1經(jīng)濟(jì)學(xué)中的應(yīng)用市場(chǎng)競(jìng)爭(zhēng)：企業(yè)間的價(jià)格戰(zhàn)可以通過(guò)演化博弈論模型進(jìn)行預(yù)測(cè)。合作與背叛：重復(fù)囚徒困境展示了長(zhǎng)期合作的可能性。11.4案例研究：鷹鴿博弈鷹鴿博弈是演化博弈論中的經(jīng)典例子，它模擬了兩個(gè)物種在爭(zhēng)奪有限資源時(shí)的行為選擇。通過(guò)分析不同策略組合下的收益情況，可以找到哪種策略更有利于生存繁衍。第十二章：不完全信息博弈12.1不完全信息的引入與處理在現(xiàn)實(shí)生活中，很多博弈都存在信息不對(duì)稱(chēng)的問(wèn)題，即某些參與者擁有其他人不知道的信息。這類(lèi)博弈被稱(chēng)為不完全信息博弈，需要特別的方法來(lái)處理。12.2貝葉斯納什均衡貝葉斯納什均衡是解決不完全信息博弈的一種方法，它假設(shè)每個(gè)參與者基于自己擁有的私人信息和其他人的可能行動(dòng)做出最佳反應(yīng)。12.2.1計(jì)算貝葉斯納什均衡定義玩家的類(lèi)型空間確定各類(lèi)型的概率分布尋找每種類(lèi)型下的最優(yōu)策略12.3信號(hào)博弈信號(hào)博弈是一種特殊類(lèi)型的不完全信息博弈，其中一

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《博弈論基礎(chǔ)》大學(xué)筆記

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《博弈論基礎(chǔ)》大學(xué)筆記

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔