




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《博弈論基礎(chǔ)》大學(xué)筆記第一章:引言1.1博弈論的起源與發(fā)展博弈論作為一種數(shù)學(xué)理論,最早可追溯到20世紀(jì)初。它的誕生標(biāo)志著對(duì)策略互動(dòng)的正式研究開(kāi)始。約翰·馮·諾依曼和奧斯卡·摩根斯坦在1944年合著的《博弈論與經(jīng)濟(jì)行為》是該領(lǐng)域的奠基之作。時(shí)間重要事件關(guān)鍵人物1928年馮·諾依曼發(fā)表論文《ZurTheoriederGesellschaftsspiele》約翰·馮·諾依曼1944年《博弈論與經(jīng)濟(jì)行為》出版馮·諾依曼和摩根斯坦1950年代納什均衡概念提出約翰·納什1960-70年代合作博弈與非合作博弈區(qū)分確立多位學(xué)者參與1.2博弈論的應(yīng)用領(lǐng)域博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、政治學(xué)、生物學(xué)等多個(gè)學(xué)科。例如,在市場(chǎng)分析中,它幫助理解價(jià)格戰(zhàn);在國(guó)際關(guān)系里,用于模擬國(guó)家間的戰(zhàn)略互動(dòng);在生態(tài)學(xué)方面,解釋物種間的競(jìng)爭(zhēng)和共生現(xiàn)象。1.3學(xué)習(xí)目標(biāo)與方法本課程旨在為學(xué)生提供一個(gè)全面了解博弈論基礎(chǔ)知識(shí)的平臺(tái)。學(xué)習(xí)過(guò)程中,將強(qiáng)調(diào)理論與實(shí)踐相結(jié)合,通過(guò)案例分析加深理解。我們鼓勵(lì)學(xué)生積極參與討論,培養(yǎng)批判性思維能力。第二章:策略形式的博弈2.1策略形式博弈的定義策略形式博弈指的是所有參與者同時(shí)選擇行動(dòng)的情況。每個(gè)參與者根據(jù)其他人的選擇來(lái)決定自己的最佳策略。這種博弈通常用支付矩陣表示。2.2支付矩陣的構(gòu)建與解讀支付矩陣是展示策略形式博弈的一種工具。以?xún)蓚€(gè)玩家A和B為例,如果A有兩個(gè)策略(S1,S2),B也有兩個(gè)策略(T1,T2),那么可以構(gòu)建一個(gè)2x2的支付矩陣來(lái)展示不同策略組合下的結(jié)果。2.2.1示例分析假設(shè)玩家A和B正在玩一場(chǎng)簡(jiǎn)單的游戲,其支付矩陣如下所示:如果A選擇S1且B選擇T1,則A得2分,B得3分。如果A選擇S1而B(niǎo)選擇T2,則A得1分,B得4分。如果A選擇S2而B(niǎo)選擇T1,則A得4分,B得1分。如果A選擇S2且B選擇T2,則A得3分,B得2分。2.3實(shí)例分析考慮一個(gè)更復(fù)雜的場(chǎng)景,如廣告競(jìng)爭(zhēng)中的兩家公司。它們可以選擇高投資或低投資于廣告。通過(guò)分析不同的策略組合及其對(duì)應(yīng)的收益,可以幫助理解哪種策略可能帶來(lái)最大利益。第三章:純策略納什均衡3.1納什均衡的概念及其意義納什均衡是指在一個(gè)博弈中,任何一位參與者都無(wú)法通過(guò)單方面改變自己的策略來(lái)獲得更好的結(jié)果。換句話(huà)說(shuō),每位玩家都選擇了對(duì)自己最有利的策略,基于其他玩家的選擇。3.2如何找到純策略納什均衡尋找純策略納什均衡的一個(gè)簡(jiǎn)單方法是檢查每個(gè)玩家的每種策略組合,看看是否有任何一方可以通過(guò)改變策略來(lái)改善自己的處境。如果沒(méi)有,那么當(dāng)前的策略組合就是一個(gè)納什均衡。3.2.1步驟解析列出所有可能的策略組合計(jì)算每個(gè)組合下的收益評(píng)估是否可以通過(guò)改變策略提高收益3.3純策略納什均衡的存在性并非所有博弈都有純策略納什均衡。例如,在某些情況下,只有當(dāng)玩家采用混合策略時(shí)才能達(dá)到均衡。然而,對(duì)于有限的兩人零和博弈,至少存在一個(gè)納什均衡點(diǎn)。3.4案例研究:囚徒困境囚徒困境是一個(gè)經(jīng)典的例子,展示了為什么即使在雙方都能從合作中獲益的情況下,個(gè)人理性也可能導(dǎo)致集體不理想的結(jié)局。在這個(gè)游戲中,兩名嫌疑人被拘留并分別審問(wèn)。他們面臨的選擇是保持沉默(合作)還是背叛對(duì)方。無(wú)論另一方如何選擇,背叛總是比合作更有利,但兩人都背叛會(huì)導(dǎo)致最差的結(jié)果。第四章:混合策略納什均衡4.1混合策略的定義混合策略是指玩家在每個(gè)回合中隨機(jī)選擇行動(dòng),而不是始終選擇相同的確定性策略。這意味著玩家會(huì)根據(jù)一定的概率分布來(lái)決定采取哪種策略。4.2如何計(jì)算混合策略納什均衡找到混合策略納什均衡需要確保沒(méi)有玩家可以通過(guò)改變自己的策略分布來(lái)提高預(yù)期收益。這通常涉及到解一系列方程組,以確定每個(gè)玩家的最佳概率分布。4.2.1步驟解析列出所有純策略組合及其對(duì)應(yīng)的支付設(shè)置變量表示每種策略的概率構(gòu)建并求解線(xiàn)性方程組玩家A\玩家BB選T1的概率B選T2的概率A選S1的概率P(S1,T1)P(S1,T2)A選S2的概率P(S2,T1)P(S2,T2)4.3實(shí)際案例研究考慮一個(gè)簡(jiǎn)單的剪刀石頭布游戲。假設(shè)兩位玩家A和B都采用混合策略,即每位玩家都有1/3的概率選擇剪刀、石頭或布。在這種情況下,任何一方都無(wú)法通過(guò)單方面調(diào)整策略概率來(lái)改善其預(yù)期收益,從而形成一個(gè)混合策略納什均衡。4.4混合策略納什均衡的重要性在許多實(shí)際情境中,純策略納什均衡可能不存在或者不唯一,而混合策略納什均衡提供了一種解決方法。它不僅擴(kuò)展了博弈論的應(yīng)用范圍,還為理解不確定性和風(fēng)險(xiǎn)提供了理論基礎(chǔ)。第五章:擴(kuò)展形式的博弈5.1擴(kuò)展形式博弈的表示方法擴(kuò)展形式博弈(ExtensiveFormGames)是一種用于描述序列決策過(guò)程的方法。與策略形式博弈不同,它能夠捕捉到游戲中時(shí)間順序的影響。5.2決策樹(shù)與信息集在擴(kuò)展形式博弈中,決策樹(shù)是一個(gè)關(guān)鍵工具,用于描繪每個(gè)玩家在不同階段的選擇路徑。此外,信息集幫助我們理解哪些信息是可用的以及何時(shí)可用。5.2.1構(gòu)建決策樹(shù)確定游戲的起始點(diǎn)添加每個(gè)決策節(jié)點(diǎn)連接各節(jié)點(diǎn)形成分支標(biāo)記每個(gè)終端節(jié)點(diǎn)的收益5.3子博弈完美納什均衡子博弈完美納什均衡(SubgamePerfectNashEquilibrium,SPNE)要求每個(gè)子博弈中的策略都是納什均衡。這避免了非理性威脅的存在,并確保了均衡策略在整個(gè)游戲中的一致性。5.3.1計(jì)算SPNE識(shí)別所有子博弈為每個(gè)子博弈找到納什均衡回溯至初始節(jié)點(diǎn),驗(yàn)證整體策略是否構(gòu)成均衡5.4應(yīng)用實(shí)例:談判中的承諾問(wèn)題在商業(yè)談判中,參與者可能會(huì)做出某些承諾,但這些承諾只有在其對(duì)未來(lái)行為產(chǎn)生影響時(shí)才具有可信度。通過(guò)分析擴(kuò)展形式博弈,可以評(píng)估不同承諾的有效性及其對(duì)談判結(jié)果的影響。第六章:重復(fù)博弈6.1重復(fù)博弈的基本概念重復(fù)博弈指的是同一博弈被多次重復(fù)進(jìn)行的情況。與一次性博弈相比,重復(fù)博弈允許參與者基于之前的經(jīng)驗(yàn)調(diào)整策略,增加了合作的可能性。6.2針對(duì)不同類(lèi)型的重復(fù)博弈策略分析根據(jù)重復(fù)次數(shù)的不同,重復(fù)博弈可分為有限次重復(fù)博弈和無(wú)限次重復(fù)博弈。不同的重復(fù)結(jié)構(gòu)會(huì)導(dǎo)致不同的最優(yōu)策略選擇。6.2.1有限次重復(fù)博弈觸發(fā)策略:一旦對(duì)手背叛,立即轉(zhuǎn)向懲罰性的策略。寬容策略:即使對(duì)方偶爾背叛,仍保持一定程度的合作。6.3合作與背叛的長(zhǎng)期影響在重復(fù)博弈中,合作往往比背叛更能帶來(lái)長(zhǎng)期利益。然而,實(shí)現(xiàn)這一目標(biāo)需要建立信任機(jī)制,并設(shè)計(jì)有效的激勵(lì)措施以促進(jìn)合作行為。6.3.1合作的條件透明的信息交流明確的規(guī)則與懲罰機(jī)制長(zhǎng)期互動(dòng)的機(jī)會(huì)6.4典型案例:囚徒困境的重復(fù)版本在重復(fù)囚徒困境中,如果博弈足夠長(zhǎng)且雙方都采用適當(dāng)?shù)牟呗?,如“以牙還牙”策略,則可以實(shí)現(xiàn)持續(xù)的合作。這種策略鼓勵(lì)初始合作,并在對(duì)方背叛后立即報(bào)復(fù),隨后恢復(fù)合作,以此來(lái)維持穩(wěn)定的合作關(guān)系。第七章:零和博弈7.1零和博弈的特點(diǎn)與分類(lèi)零和博弈是一種特殊類(lèi)型的博弈,在這種博弈中,一個(gè)參與者的收益必然等于另一個(gè)參與者的損失。換句話(huà)說(shuō),所有參與者收益的總和為零。特性描述收益分配參與者之間收益總和為零策略互動(dòng)對(duì)抗性強(qiáng),一方所得即另一方所失應(yīng)用領(lǐng)域經(jīng)濟(jì)、軍事、競(jìng)技體育等7.2極小極大定理極小極大定理(MinimaxTheorem)是零和博弈中的一個(gè)重要概念,它指出在兩人有限零和博弈中,存在一個(gè)納什均衡點(diǎn),該點(diǎn)可以通過(guò)最小化對(duì)手的最大可能收益來(lái)找到。7.2.1定理內(nèi)容玩家A的目標(biāo):最大化其最小可能收益。玩家B的目標(biāo):最小化其最大可能損失。7.3解決零和博弈的方法解決零和博弈通常涉及尋找最優(yōu)策略組合,這可以通過(guò)線(xiàn)性規(guī)劃或直接計(jì)算支付矩陣中的值來(lái)實(shí)現(xiàn)。7.3.1線(xiàn)性規(guī)劃方法定義變量表示每種策略的概率建立目標(biāo)函數(shù)添加約束條件求解線(xiàn)性規(guī)劃問(wèn)題7.4實(shí)際案例分析考慮一個(gè)簡(jiǎn)單的撲克游戲,兩位玩家通過(guò)下注和棄牌來(lái)進(jìn)行對(duì)抗。在這個(gè)游戲中,每位玩家的策略選擇直接影響對(duì)方的收益,因此是一個(gè)典型的零和博弈。通過(guò)對(duì)不同策略組合的分析,可以找到最佳策略以確保在長(zhǎng)期中獲得最大收益。第八章:合作博弈8.1合作博弈的基礎(chǔ)理論合作博弈關(guān)注的是如何在參與者之間分配合作帶來(lái)的總收益。與非合作博弈不同,合作博弈假設(shè)參與者能夠達(dá)成協(xié)議并共同行動(dòng)以實(shí)現(xiàn)集體利益最大化。8.2核心與穩(wěn)定集核心(Core)是指一組分配方案,其中沒(méi)有任何子集能通過(guò)脫離聯(lián)盟而獲得更高的收益。穩(wěn)定集(StableSet)則是指一系列合理的分配方案,它們相互支持且不存在優(yōu)于其他方案的情況。8.2.1核心的性質(zhì)個(gè)體理性:每個(gè)成員至少獲得獨(dú)立行動(dòng)時(shí)的收益。群體穩(wěn)定性:沒(méi)有子群能通過(guò)脫離聯(lián)盟獲得更高收益。8.3分配方案與夏普利值夏普利值(ShapleyValue)提供了一種公平分配合作收益的方法。它基于每個(gè)參與者對(duì)聯(lián)盟貢獻(xiàn)的邊際價(jià)值來(lái)確定分配比例。8.3.1夏普利值的計(jì)算確定所有可能的聯(lián)盟組合計(jì)算每個(gè)參與者在各聯(lián)盟中的邊際貢獻(xiàn)根據(jù)邊際貢獻(xiàn)加權(quán)平均得出最終分配8.4案例研究:企業(yè)間的合作在一個(gè)由多家公司組成的供應(yīng)鏈網(wǎng)絡(luò)中,各家公司通過(guò)資源共享和技術(shù)合作來(lái)提升整體競(jìng)爭(zhēng)力。通過(guò)應(yīng)用合作博弈理論,可以設(shè)計(jì)出合理的利潤(rùn)分配機(jī)制,激勵(lì)各方積極參與合作,從而實(shí)現(xiàn)共贏局面。第九章:談判理論9.1談判問(wèn)題的形式化描述談判理論探討的是當(dāng)兩個(gè)或多個(gè)參與者就資源分配進(jìn)行協(xié)商時(shí)的行為模式。談判過(guò)程可以被形式化為一個(gè)博弈,其中每個(gè)參與者都有自己的偏好和策略。9.2納什談判解納什談判解(NashBargainingSolution)提出了一種理想化的解決方案,旨在最大化雙方的聯(lián)合收益,同時(shí)考慮到各自的威脅點(diǎn)(即不達(dá)成協(xié)議時(shí)各自能獲得的最佳結(jié)果)。9.2.1計(jì)算納什談判解確定雙方的威脅點(diǎn)構(gòu)建效用函數(shù)求解使聯(lián)合效用最大化的分配方案9.3影響談判結(jié)果的因素談判結(jié)果受多種因素影響,包括但不限于信息不對(duì)稱(chēng)、權(quán)力分布、信任程度以及談判技巧。了解這些因素有助于制定更有效的談判策略。9.3.1關(guān)鍵因素分析信息透明度:充分的信息共享有助于減少誤解和沖突。談判力量對(duì)比:較強(qiáng)的談判地位往往帶來(lái)更有利的結(jié)果。信任關(guān)系:建立互信是長(zhǎng)期合作的基礎(chǔ)。9.4實(shí)際案例:跨國(guó)公司的并購(gòu)談判在全球化背景下,跨國(guó)公司之間的并購(gòu)活動(dòng)日益頻繁。成功的并購(gòu)談判不僅需要精確評(píng)估雙方的價(jià)值,還需考慮文化差異、法律環(huán)境等因素。通過(guò)運(yùn)用談判理論,可以幫助雙方找到平衡點(diǎn),達(dá)成互利共贏的協(xié)議。第十章:拍賣(mài)理論10.1拍賣(mài)的基本類(lèi)型與規(guī)則拍賣(mài)是一種通過(guò)競(jìng)爭(zhēng)性出價(jià)來(lái)分配商品或服務(wù)的機(jī)制。根據(jù)拍賣(mài)規(guī)則的不同,可以分為多種類(lèi)型,如英式拍賣(mài)、荷蘭式拍賣(mài)、密封第一價(jià)格拍賣(mài)和密封第二價(jià)格拍賣(mài)等。拍賣(mài)類(lèi)型規(guī)則描述英式拍賣(mài)競(jìng)標(biāo)者公開(kāi)加價(jià),最高出價(jià)者獲勝荷蘭式拍賣(mài)價(jià)格從高到低遞減,第一個(gè)接受者獲勝密封第一價(jià)格所有競(jìng)標(biāo)者同時(shí)提交一次報(bào)價(jià),最高者勝出并支付其報(bào)價(jià)密封第二價(jià)格類(lèi)似于密封第一價(jià)格,但勝出者支付第二高的報(bào)價(jià)10.2不同拍賣(mài)機(jī)制下的策略選擇在不同的拍賣(mài)機(jī)制下,參與者的最優(yōu)策略會(huì)有所不同。例如,在英式拍賣(mài)中,參與者可能會(huì)選擇逐步提高報(bào)價(jià)以保持競(jìng)爭(zhēng)力;而在密封第一價(jià)格拍賣(mài)中,則需要仔細(xì)評(píng)估對(duì)手的可能報(bào)價(jià),并據(jù)此調(diào)整自己的出價(jià)。10.2.1英式拍賣(mài)策略初期試探:開(kāi)始時(shí)觀察他人出價(jià)。適時(shí)加價(jià):當(dāng)接近心理價(jià)位時(shí)逐步增加出價(jià)。避免過(guò)度競(jìng)爭(zhēng):防止因情緒化出價(jià)過(guò)高。10.3拍賣(mài)設(shè)計(jì)中的博弈論應(yīng)用拍賣(mài)設(shè)計(jì)不僅涉及經(jīng)濟(jì)學(xué)原理,還涉及到復(fù)雜的博弈論問(wèn)題。如何設(shè)計(jì)一個(gè)既能最大化賣(mài)家收益又能保證公平性的拍賣(mài)機(jī)制是一個(gè)重要的研究領(lǐng)域。10.3.1關(guān)鍵考慮因素信息不對(duì)稱(chēng):買(mǎi)家對(duì)商品價(jià)值的認(rèn)知差異。激勵(lì)相容性:確保誠(chéng)實(shí)報(bào)價(jià)是最優(yōu)策略。市場(chǎng)效率:商品應(yīng)分配給對(duì)其估值最高的買(mǎi)家。10.4實(shí)際案例分析:頻譜拍賣(mài)頻譜資源是電信行業(yè)的重要資產(chǎn),各國(guó)政府通常通過(guò)拍賣(mài)方式分配這些稀缺資源。美國(guó)聯(lián)邦通信委員會(huì)(FCC)曾采用多輪次拍賣(mài)機(jī)制成功分配頻譜,既提高了資源利用效率,也增加了國(guó)家財(cái)政收入。第十一章:演化博弈論11.1演化穩(wěn)定策略的概念**演化穩(wěn)定策略(ESS)**是指在一個(gè)種群中,如果大多數(shù)個(gè)體都采取這種策略,則任何突變策略都無(wú)法入侵該種群。ESS提供了一個(gè)解釋生物行為和社會(huì)現(xiàn)象的新視角。11.2動(dòng)態(tài)模型與復(fù)制者方程為了理解ESS在種群中的傳播過(guò)程,演化博弈論引入了動(dòng)態(tài)模型,特別是復(fù)制者方程。該方程描述了不同策略在種群中的頻率隨時(shí)間變化的情況。11.2.1復(fù)制者方程解析基本形式:dx/dt=x(1-x)(u-v),其中x表示某一策略的比例,u和v分別為該策略與其他策略相遇時(shí)的平均收益。穩(wěn)定性分析:通過(guò)計(jì)算固定點(diǎn)及其穩(wěn)定性判斷是否為ESS。11.3生物學(xué)與社會(huì)科學(xué)中的應(yīng)用實(shí)例演化博弈論不僅應(yīng)用于生物學(xué)領(lǐng)域,解釋動(dòng)物行為和社會(huì)結(jié)構(gòu),還在社會(huì)科學(xué)中找到了廣泛應(yīng)用,如經(jīng)濟(jì)學(xué)、政治學(xué)等,用于分析人類(lèi)決策模式。11.3.1經(jīng)濟(jì)學(xué)中的應(yīng)用市場(chǎng)競(jìng)爭(zhēng):企業(yè)間的價(jià)格戰(zhàn)可以通過(guò)演化博弈論模型進(jìn)行預(yù)測(cè)。合作與背叛:重復(fù)囚徒困境展示了長(zhǎng)期合作的可能性。11.4案例研究:鷹鴿博弈鷹鴿博弈是演化博弈論中的經(jīng)典例子,它模擬了兩個(gè)物種在爭(zhēng)奪有限資源時(shí)的行為選擇。通過(guò)分析不同策略組合下的收益情況,可以找到哪種策略更有利于生存繁衍。第十二章:不完全信息博弈12.1不完全信息的引入與處理在現(xiàn)實(shí)生活中,很多博弈都存在信息不對(duì)稱(chēng)的問(wèn)題,即某些參與者擁有其他人不知道的信息。這類(lèi)博弈被稱(chēng)為不完全信息博弈,需要特別的方法來(lái)處理。12.2貝葉斯納什均衡貝葉斯納什均衡是解決不完全信息博弈的一種方法,它假設(shè)每個(gè)參與者基于自己擁有的私人信息和其他人的可能行動(dòng)做出最佳反應(yīng)。12.2.1計(jì)算貝葉斯納什均衡定義玩家的類(lèi)型空間確定各類(lèi)型的概率分布尋找每種類(lèi)型下的最優(yōu)策略12.3信號(hào)博弈信號(hào)博弈是一種特殊類(lèi)型的不完全信息博弈,其中一
最新文檔
- 2024年度浙江省護(hù)師類(lèi)之主管護(hù)師每日一練試卷A卷含答案
- 2024年度浙江省護(hù)師類(lèi)之主管護(hù)師考前沖刺模擬試卷B卷含答案
- 2024年度浙江省二級(jí)造價(jià)工程師之建設(shè)工程造價(jià)管理基礎(chǔ)知識(shí)每日一練試卷B卷含答案
- 2024年度浙江省二級(jí)造價(jià)工程師之建設(shè)工程造價(jià)管理基礎(chǔ)知識(shí)模擬試題(含答案)
- 接訪(fǎng)流程培訓(xùn)
- 護(hù)理醫(yī)療安全措施
- 人教版七年級(jí)下期末專(zhuān)題復(fù)習(xí)專(zhuān)題一相交線(xiàn)與平行線(xiàn)(含解析)
- 老年心理護(hù)理舉例講解
- 醫(yī)院保安培訓(xùn)
- 考研行管面試題及答案
- 樹(shù)枝狀水系長(zhǎng)江亞馬孫河
- 地鐵公司運(yùn)營(yíng)培訓(xùn)課件:光纖通信基礎(chǔ)
- GB/T 40219-2021拉曼光譜儀通用規(guī)范
- 事故回溯報(bào)告模板
- GB/T 24218.6-2010紡織品非織造布試驗(yàn)方法第6部分:吸收性的測(cè)定
- GB/T 13663.3-2018給水用聚乙烯(PE)管道系統(tǒng)第3部分:管件
- GB/T 1167-1996過(guò)渡配合螺紋
- 鋼框架結(jié)構(gòu)優(yōu)秀畢業(yè)設(shè)計(jì)計(jì)算書(shū)
- 市政工程監(jiān)理規(guī)劃范本
- 2022年南京中華中等專(zhuān)業(yè)學(xué)校教師招聘筆試題庫(kù)及答案解析
- 2021年廣東省歷史中考試題及答案
評(píng)論
0/150
提交評(píng)論