完全信息靜態(tài)博弈:納什均衡.ppt_第1頁
完全信息靜態(tài)博弈:納什均衡.ppt_第2頁
完全信息靜態(tài)博弈:納什均衡.ppt_第3頁
完全信息靜態(tài)博弈:納什均衡.ppt_第4頁
完全信息靜態(tài)博弈:納什均衡.ppt_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

wuweiwei100 博弈分析的目的是預測博弈的均衡結果 即給定每個參與人都是理性的 什么是所有參與人最優(yōu)的策略組合 納什均衡是完全信息靜態(tài)博弈解的一般概念 也是所有其他類型博弈解的基本要求 我們先介紹幾種納什均衡解的特殊情況 再定義一般意義下的納什均衡 完全信息靜態(tài)博弈 納什均衡 wuweiwei100 一 占優(yōu)策略均衡 什么是 占優(yōu)策略均衡 占優(yōu)策略均衡求解舉例對 囚徒困境 模型結果的說明 囚徒困境 模型的應用 囚徒困境 與社會福利 wuweiwei100 1 什么是 占優(yōu)策略均衡 一般來說 由于每個參與人的得益是博弈中所有參與人的策略的函數 因此每個參與人的最優(yōu)策略選擇依賴于所有其他參與人的策略選擇 但在一些特殊的博弈中 一個參與人的最優(yōu)策略可能可以不依賴于其他參與人的策略選擇 也就是說 不論其他參與人選擇什么策略 他的最優(yōu)策略是唯一的 這樣的最優(yōu)策略被稱為 占優(yōu)策略 如果一個博弈中 某個參與人有占優(yōu)策略 那么該參與人的其他可選擇策略就被稱為 劣策略 在一個博弈中 如果所有參與人都有占優(yōu)策略存在 那么占優(yōu)策略均衡是可以預測到的唯一的均衡 因為沒有一個理性的參與人會選擇劣策略 wuweiwei100 例囚徒困境博弈 乙 招不招 不招 招 甲 wuweiwei100 對于甲來說 不論乙選擇 招 還是 不招 他選擇 招 都比選擇 不招 為好 因此 招 是占優(yōu)策略 不招 是相對于 招 的劣戰(zhàn)略 他不會選擇劣戰(zhàn)略 類似的 招 也是乙的占優(yōu)策略 所以 在 囚徒困境 模型里 招 招 是占優(yōu)策略均衡 wuweiwei100 2 占優(yōu)策略均衡求解舉例 下面這個博弈是否存在占優(yōu)策略均衡 乙 甲 a b a b 對于甲而言 不論乙選擇什么 a都是甲的占優(yōu)策略 類似的 a也是乙的占優(yōu)策略 所以 a a 是這個博弈的占優(yōu)策略均衡 wuweiwei100 3 對 囚徒困境 博弈結果的說明 如果每個人都選擇不招 各被判刑1年 顯然比都判刑8年好 但在這樣的一次博弈中 這個結果達不到 因為它不滿足個人理性的要求 不招 不招 不是一個均衡 即使兩個囚徒在作案之前建立一個攻守同盟也沒有用 因為事到臨頭沒有人有積極性去遵守這個協(xié)定 這反映了一個深刻的問題 即合作與利己之間的沖突 合作的結果會使博弈各方的狀況更好 但由于追求利己 使得共同利益無法達到最大化 個人理性和集體理性的沖突 wuweiwei100 4 囚徒困境 博弈的應用 應用一價格戰(zhàn) 乙 甲 a b a b 出售同類產品的商家之間本來可以通過共同將價格維持在高位而獲利 但實際上卻是相互殺價 結果都賺不到錢 百事可樂 低價 高價 可口可樂 低價 高價 wuweiwei100 應用二軍備競賽 美蘇爭霸的 囚徒困境 20多年前 美國和蘇聯(lián)是世界上的兩個超級大國 他們相互對壘 假定每一方都有兩種策略 一個是擴軍 發(fā)展戰(zhàn)略核武器等 另一個是裁軍 直至不設軍備 擴軍所需軍費為2000億美元 徹底裁軍則軍費為0 如果一方裁軍 另一方擴軍 則裁軍方會遭受很大損失 甚至喪失主權 我們簡單地把這種情況下裁軍方的得益記作 即負無窮大 假定擴軍方掠奪到一個有限數額的財富10000億美元 由于付出2000億美元軍費 則擴軍方的得益是8000億美元 wuweiwei100 美蘇兩國如果不搞軍備競賽 各自把資源用于民品生產 不是很好嗎 問題是 如果我把資源用于民品生產 而你增加軍費支出 我不就受到威脅嗎 這樣對我不好 納什均衡是兩國都大量增加軍費預算 兩國的社會福利都變得更糟 蘇聯(lián) 美國 擴軍 裁軍 擴軍 裁軍 軍備競賽博弈 wuweiwei100 應用三公共產品的供給 設想有兩戶相居為鄰的農家 十分需要有一條好路從居住地通往公路 修一條路的成本為4 每個農家從修好的路上獲得的好處為3 如果兩戶居民共同出資聯(lián)合修路 并平均分攤修路成本 則每戶居民獲得凈的好處 得益 為3 4 2 1 當只有一戶人家單獨出資修路時 修路的居民獲得的得益為3 4 1 虧損 搭便車 不出資但仍然可以使用修好的路的另一戶人家獲得得益3 0 3 wuweiwei100 修路博弈 張三 修 不修 修 不修 李四 wuweiwei100 我們看到 對兩家居民來說 修路 都是劣戰(zhàn)略 因而他們都不會出資修路 這里 為了解決這條新路的建設問題 需要政府強制性地分別向每家征稅2單位 然后投入4單位資金修好這條對大家都有好處的路 并使兩家居民的生活水平都得到改善 wuweiwei100 這就是我們看到的為什么大多數路 橋等公共設施都是由政府出資修建的原因 同樣的道理 國防 教育 社會保障 環(huán)境衛(wèi)生等都由政府承擔資金投入 私人一般沒有積極性承擔這方面服務的積極性和能力 wuweiwei100 應用四寡頭競爭 設想在一個鎮(zhèn)上只有兩個居民 杰克和吉爾 擁有能生產飲用水的水井 每周六 杰克和吉爾決定抽取多少加侖水 帶到鎮(zhèn)上 并以市場所能承受的價格出售 為了簡單起見 假設杰克和吉爾可以沒有成本地想抽取多少水就抽取多少水 鎮(zhèn)上水的需求可以表示如下 wuweiwei100 小鎮(zhèn)水需求情況 wuweiwei100 如果兩人合作 結成卡特爾 則能夠達到總收益的最大化 即兩人總共生產60加侖 二人平均劃分市場的話 每人將生產30加侖 以每加侖60美元的價格出售 總收益為3600美元 每人得到1800美元收益 但是 追求私利的結果是兩人將各生產40加侖 各獲得收益1600美元 寡頭博弈 wuweiwei100 世界石油的大部分生產國家形成了一個卡特爾 稱為世界石油輸出國組織 OPEC 歐佩克于1960年成立 目前共有12個成員國 它們是 阿爾及利亞 伊朗 伊拉克 科威特 利比亞 尼日利亞 卡塔爾 沙特阿拉伯 阿聯(lián)酋 委內瑞拉 安哥拉 厄瓜多爾 此外 過往成員包括印度尼西亞和加蓬 這些國家控制了世界石油儲藏量的四分之三 正如任何一個卡特爾一樣 歐佩克努力確定每個成員國的生產水平 力圖通過協(xié)調減少產量來提高其產品的價格 歐佩克想維持石油的高價格 但是 每個成員都受到增加生產以得到更大利潤份額的誘惑 因此 歐佩克成員常常就減少產量達成協(xié)議 然后又私下違背協(xié)議 wuweiwei100 應用五做廣告 當兩個企業(yè)用廣告來吸引相同的顧客時 它們面臨與囚犯兩難處境類似的問題 考慮兩家煙草公司萬寶路和駱駝面臨的決策 wuweiwei100 廣告博弈 駱駝 做廣告 不做廣告 做廣告 不做廣告 萬寶路 wuweiwei100 盡管兩家企業(yè)都不做廣告狀況會更好 但是兩家都選擇了做廣告 1971年 國會通過了禁止在電視上做香煙廣告的法律 令許多觀察者奇怪的是 煙草公司并沒有利用它們政治上相當大的影響力去反對這項法律 這項法律為煙草公司做了一件它們自己做不到的事 它通過強制實現了低廣告高利潤的合作 結果解決了囚犯的兩難處境問題 wuweiwei100 5 囚徒困境 與社會福利 囚犯的兩難處境描述生活中的許多情況 并說明了 即使合作使每個參與者的狀況變好 要維持合作也是困難的 這種缺乏合作從整個社會角度來看是一個問題嗎 回答取決于環(huán)境 警察審問兩個嫌犯的情況下 嫌犯之間缺乏合作是合意的 因為它使警察可以制止更多的犯罪行為 這種情況對囚犯來說是兩難處境 但對社會其他人來說是一種福音 在企圖維持壟斷利潤的寡頭情況下 缺乏合作是合意的 因為壟斷結果對寡頭是好的 但對物品的消費者是壞的 而在軍備競賽中 非合作均衡對社會和參與者都是不好的 wuweiwei100 二 重復剔除的占優(yōu)均衡 在每個參與人都有占優(yōu)策略的情況下 占優(yōu)策略均衡是一個非常合理的預測 不過 在絕大多數博弈中 占優(yōu)策略均衡是不存在的 但在有些博弈中 我們仍可以應用占優(yōu)的邏輯找出均衡 重復剔除嚴格劣策略 的思路 智豬博弈 智豬博弈 的應用對重復剔除的占優(yōu)均衡的說明 wuweiwei100 1 重復剔除嚴格劣策略 的思路 嚴格劣策略重復剔除博弈1 A 左 中 上 下 B 右 對A來講 沒有占有策略 因此該例沒有占優(yōu)策略均衡 觀察B 無論A選 上 還是 下 右 的得益嚴格少于 中 的得益 我們說B的 右 策略嚴格劣于 中 策略 理性的B不會選擇它 因此可將之剔除 得到的得益矩陣為 wuweiwei100 此時 A的 下 策略相對其 上 策略是嚴格劣的 再把它剔除出去 得到得益矩陣為 嚴格劣策略重復剔除博弈2 A 左 中 上 下 B wuweiwei100 這時 明顯可以看出 最后的均衡策略是 上 中 A B各自得益為1和3 嚴格劣策略重復剔除博弈3 A 左 中 上 B wuweiwei100 總結 重復剔除嚴格劣策略 思路 首先找出某個參與人的嚴格劣策略 假定其存在 把這個劣策略剔除掉 重新構造一個不包含已剔除策略的新的博弈 然后再剔除這個新的博弈中某個參與人的嚴格劣策略 繼續(xù)這個過程 一直到只剩下一個唯一的策略組合為止 這個唯一剩下的策略組合就是這個博弈的均衡解 稱為 重復剔除的占優(yōu)均衡 wuweiwei100 2 智豬博弈 豬圈中有一頭大豬和一頭小豬 在豬圈的一端設有一個按鈕 每按一下 位于豬圈另一端的食槽中就會有8單位的豬食進槽 但每按一下按鈕會耗去2單位的成本 如果大豬先到食槽 則大豬吃到7單位食物 小豬僅能吃到1單位食物 如果兩豬同時到食槽 則大豬吃5單位 小豬吃3單位食物 如果小豬先到 大豬 小豬各吃4單位食物 乙 甲 a b a b 小豬 大豬 按 等待 按 等待 wuweiwei100 首先剔除小豬的劣策略 按 此時 等待 成為大豬的劣策略 將之剔除 剩下的唯一策略組合 按 等待 是這個博弈唯一的均衡 結果是大豬選擇 按 小豬選擇 等待 得益分別為2和4個單位 wuweiwei100 3 智豬博弈 的應用 應用一大股東與小股民的角色差異股份公司里 股東應承擔起監(jiān)督經理的職能 但是 監(jiān)督成本是很高的 這里 大股東相當于智豬博弈中的大豬 小股東相當于小豬 大股東因為利益攸關會擔當起搜集信息監(jiān)督經理的責任 小股東則 搭便車 坐享其成 wuweiwei100 應用二公共產品的提供 囚徒困境博弈解釋了各家經濟實力大致相當情形下公共品的提供問題 如果雙方經濟實力相差很大 可以用智豬博弈來解釋 村里住兩戶人家 一戶富 一戶窮 有一條路年久失修 這時候 富戶一般會承擔起修路的責任 窮戶則很少這樣干 因為富戶家常常是高朋滿座 坐車坐轎的都來 而窮戶家只是自己穿著舊鞋走路 路修好了他走起來舒服 路修不好他也無所謂 wuweiwei100 4 對重復剔除的占優(yōu)均衡的說明 參與人B 參與人A L R U D U L 是重復剔除的占優(yōu)均衡 因為 A百分之百地確信B是理性的因而會選擇L 那么U是A的最優(yōu)選擇 但是 即使有千分之一的概率B會選擇R 則D就優(yōu)于U 重復剔除的占優(yōu)均衡不僅要求每個參與人是理性的 而且要求 理性 是參與人的共同知識 即所有人知道所有人是理性的 所有人知道所有人知道所有人是理性的 如此等等 wuweiwei100 三 納什均衡 納什均衡的含義對納什均衡含義的強化理解納什均衡的價值納什均衡 占優(yōu)策略均衡 重復剔除的占優(yōu)均衡三者的關系劃線法 wuweiwei100 1 納什均衡的含義 含義 各博弈方都不愿單獨改變策略 因為單獨改變沒好處 的策略組合 乙 招不招 不招 招 甲 囚徒困境博弈 wuweiwei100 用納什均衡的含義檢驗以前的例子 A 左 中 上 下 B 右 張三 修 不修 修 不修 李四 wuweiwei100 2 對納什均衡含義的強化理解 設想有一個居民點 居民住宅沿著一條公路均勻地排開 如下圖 現在有兩家雜貨鋪要在這個居民點開張 他們賣的東西一樣 價格也完全一樣 那么 兩家雜貨鋪開在什么地方好呢 1 4 1 2 3 4 1 店鋪選址 wuweiwei100 居民到哪個雜貨鋪買東西就看哪個離自己比較近 每個雜貨鋪都希望靠自己比較近的居民多一些 位于左邊的要往右靠 位于右邊的要往左靠 最后兩家雜貨鋪都緊挨著位于中點1 2的位置 這是納什均衡的位置 誰都不想偏離中點 wuweiwei100 3 納什均衡的價值 納什均衡的價值主要在于它有一些非常重要的性質 一致預測性 就是其中最重要的性質之一 一致預測性 是指這樣一種性質 如果所有博弈方都預測一個特定的博弈結果會出現 那么所有的博弈方都不會利用該預測或者這種預測能力 選擇與預測結果不一致的策略 即沒有哪個博弈方有偏離這個預測結果的愿望 因此這個預測結果最終真會成為博弈的結果 只有納什均衡才具有一致預測的性質 任何非納什均衡的預測都不是一致預測 因此一致預測是納什均衡的本質屬性 如果一個博弈的所有博弈方都預測博弈結果是某個納什均衡 那么由于納什均衡策略組合中各博弈方的策略都是對其他博弈方策略的最優(yōu)選擇 因此任一博弈方都不會單獨改變策略 因此預測的結果會成為博弈的最終結果 wuweiwei100 4 納什均衡與占優(yōu)策略均衡 重復剔除的占優(yōu)均衡 每一個占優(yōu)策略均衡 重復剔除的占優(yōu)均衡一定是納什均衡 但并非每一個納什均衡都是占優(yōu)策略均衡或重復剔除的占優(yōu)均衡 納什均衡一定是在重復剔除嚴格劣策略過程中沒有被剔除掉的策略組合 但沒有被剔除掉的策略組合不一定是納什均衡 除非它是唯一的 在進行博弈分析之前先通過重復剔除嚴格劣策略方法來簡化博弈是可行的 wuweiwei100 5 劃線法 劃線法 在每個博弈方對其他博弈方每個策略的最佳對策對應的得益下劃線 B左中右 A 下 中 上 wuweiwei100 劃線法練習 有兩個納什均衡 涉及動態(tài)博弈知識 以后會提到 進入者 默許 打擊 進入 不進入 在位者 靜態(tài)市場進入博弈 wuweiwei100 猜硬幣博弈 各博弈方的利益和偏好始終不一致 在通常策略的基礎上沒有納什均衡 這類博弈可以稱為 嚴格競爭博弈 蓋硬幣方 正面 反面 正面 反面 猜硬幣方 wuweiwei100 情侶博弈 特點 各博弈方的利益有很大一致性 有多個納什均衡 大海 足球 芭蕾 足球 芭蕾 麗娟 wuweiwei100 情侶博弈問題舉例 情侶博弈與決策有什么關系呢 這種合作比不合作好 但是在合作的大局下又不免有小算盤的對局 不就是情侶博弈嗎 陳明 德語 法語 德語 法語 鐘信 美國 巴頓 蒙帥 巴頓 蒙帥 英國 wuweiwei100 四 混合策略納什均衡 嚴格競爭博弈和混合策略納什均衡多重均衡博弈和混合策略納什均衡 wuweiwei100 1 嚴格競爭博弈和混合策略納什均衡 猜硬幣博弈的多次重復中 博弈方決策應遵循兩個原則 一是不能讓對方知道自己的策略選擇 二是要避免自己的選擇帶有規(guī)律性 否則對手就可以輕易戰(zhàn)勝你 很顯然 當兩個博弈方都以1 2的概率隨機選擇正面 反面時 雙方都無法根據對方的選擇方式 選擇自己的策略獲得利益 從而達到一種穩(wěn)定 或說均衡 博弈方以一定的概率分布在可選策略中隨機選擇的決策方式成為 混合策略 則原來意義上的策略稱為 純策略 策略擴展到包括混合策略時 納什均衡概念仍然成立 如果混合策略組合構成一個納什均衡 稱為 混合策略納什均衡 猜硬幣博弈中博弈雙方都以 1 2 1 2 的概率分布隨機選擇正面和反面的混合策略組合就是一個混合策略納什均衡 wuweiwei100 尋找混合策略納什均衡的思路 令各博弈方隨機選擇純策略的概率分布 滿足使其他博弈方采用不同策略的期望得益相同 從而計算出各個博弈方隨機選擇各純策略的概率 在猜硬幣博弈中 設蓋硬幣方出正面的概率為p 出反面的概率為1 p 則猜硬幣方猜正面的期望得益為p 1 1 p 1 2p 1 猜反面的期望得益是p 1 1 p 1 1 2p 另二者相等 得p 1 2 蓋硬幣方的混合策略是以 1 2 1 2 的概率隨機選擇正面和反面 類似的 可以計算出猜硬幣方的混合策略 wuweiwei100 例社會福利博弈 政府想幫助流浪漢 但前提是后者必須試圖尋找工作 而流浪漢只有在得不到政府救濟時才會尋找工作 社會福利博弈 政府 找工作 游蕩 救濟 不救濟 流浪漢 得到混合策略納什均衡 政府以0 5的概率分別選擇救濟和不救濟 流浪漢以0 2的概率選擇找工作 0 8的概率選擇游蕩 每個參與人的混合策略都是給定對方混合策略時的最優(yōu)選擇 wuweiwei100 例為什么偷稅漏稅的一般是中小企業(yè) 大企業(yè)會老老實實地交稅 稅務部門不會對所有企業(yè)的交稅情況每一次都去檢查 因為這樣做的成本太高 得不償失 所以 稅務部門總是隨機地對企業(yè)的交稅情況進行檢查 企業(yè)也是隨機地在交稅與偷漏稅之間進行選擇 稅收部門與企業(yè)間進行的是混合戰(zhàn)略博弈 因為如果企業(yè)總是交稅 稅務部門就最好不檢查 但給定不檢查 企業(yè)就會偷漏稅 所以 兩者只有稅務部門在隨機地檢查與不檢查 企業(yè)隨機地在偷漏稅與交稅之間選擇 才會達成均衡 wuweiwei100 對于大企業(yè) 因一旦偷稅就數目巨大 所以 稅務部門在隨機檢查時放在大企業(yè)上的可能性就大一些 而給定稅務部門檢查大企業(yè)的可能性較大 大企業(yè)偷漏稅的行為就較少 否則就容易被逮個正著 所以 偷漏稅較多的就是一些中小企業(yè) 大企業(yè)納稅的積極性較高 同樣 大人物或有錢人納稅的積極性應較高 至于我國在過去一段時期有錢人反而不交稅的現象主要源于制度不健全或已有的制度得不到貫徹所致 同樣的道理 在犯罪或對錯誤的監(jiān)督懲罰博弈中 也是混合博弈 人們可能總是大錯不犯小錯不斷 wuweiwei100 2 多重均衡博弈和混合策略納什均衡 情侶博弈中 博弈雙方的利益具有一致性 他們都不害怕對方猜到自己的選擇 因此決策思路與嚴格競爭博弈不同 但是 由于有兩個納什均衡 而且兩人對這兩個納什均衡的偏好明顯不同 因此 當兩人從自身的最大利益出發(fā)獨立同時決策時 在純策略的范圍內 也是無法對博弈雙方的選擇提出確定性建議的 需要考慮混合策略的可能性 wuweiwei100 情侶博弈 大海 足球 芭蕾 足球 芭蕾 麗娟 設p為麗娟選擇芭蕾的概率 如果她不想讓大海利用自己的選擇傾向占上風 則自己的概率選擇應使大海選擇兩種策略的期望得益相同 1 p 2 p 0 1 p 1 p 1 p 0 75 同樣 設大海選擇足球的概率為 則其選擇也要使麗娟選兩種策略的期望得益相同 1 1 1 0 1 2 0 75 wuweiwei100 當麗娟以 0 75 0 25 的概率隨機選擇芭蕾和足球 大海以 0 75 0 25 的概率隨機選擇足球和芭蕾時 雙方都無法通過單獨改變策略而提高利益 因此這一概率分布的組合構成一個混合策略納什均衡 該混合策略納什均衡給麗娟帶來的期望得益是 1 p 1 p 0 1 p 1 1 p 1 2 0 5給大海帶來的期望得益是 1 p 2 p 0 1 p 1 1 p 1 1 0 5 這個結果明顯不如兩人能交流協(xié)商 任何一方遷就另一方時雙方的得益好 那時任何一方都至少得1 如果不強行設定雙方不能交流的博弈規(guī)則 這種博弈問題一般不應該用上述博弈方式解決 wuweiwei100 練習制式問題 生活中有許多與情侶博弈類似的博弈問題 制式問題就是典型的一例 電子設備往往有不同的相關技術標準 稱之為不同的制式 如果生產相關電子設備的廠商采用相同的制式 那么產品之間就能相互匹配 這對于推廣各自的產品和在生產經營中進行合作很有幫助 設兩個廠商同時計劃引進彩電生產線 彩電有A B兩種制式 這時兩廠商之間就有一個選擇制式的博弈問題 得益矩陣表示如下 wuweiwei100 該博弈也有兩個純策略納什均衡 A A 和 B B 廠商1偏好后一個均衡 廠商2偏好前一個均衡 因此 究竟哪個納什均衡能出現也沒有必然的結論 這又是一個混合策略問題 廠商1 A B A B 廠商2 容易解出該博弈的混合策略納什均衡 即廠商1以概率分布 0 4 0 6 隨機選擇A和B 廠商2以概率分布 2 3 1 3 隨機選擇A和B 在該混合策略納什均衡下 雙方期望得益分別為0 67和1 2 如果協(xié)商 雙方采用純策略納什均衡中的任意一個 雙方得益都比混合策略的期望得益要高 wuweiwei100 五 納什均衡的存在性和多重性 納什均衡的存在性 納什定理納什均衡的多重性 wuweiwei100 通俗地講 納什定理說的是 每一個有限博弈都至少有一個納什均衡 但可能包含混合策略 納什均衡具有兩個重要性質 一致預測性和普遍存在性 正因為普遍存在性 納什均衡是博弈結果的 一致預測 的性質才有意義 納什均衡才會成為分析博弈和預測博弈結果的中心概念和基本出發(fā)點 1 納什均衡的存在性 納什定理 wuweiwei100 不同均衡概念之間的關系 混合策略納什均衡 純策略納什均衡 重復剔除占優(yōu)均衡 占優(yōu)策略均衡 wuweiwei100 2 納什均衡的多重性 一個博弈中存在的納什均衡不止一個時 就是一個多重納什均衡的博弈問題 如前所述 對大多數多重納什均衡博弈來說 引進混合策略并沒有解決問題 因為混合策略本身不一定比純策略更好 而且對于確定哪個純策略更好也沒有作用 因此有必要對多重納什均衡導致的選擇問題作進一步探討 wuweiwei100 帕累托上策均衡 有些博弈中雖然存在多個納什均衡 但是可能這些納什均衡有明顯的優(yōu)劣差異 所有博弈方都偏好其中同一個納什均衡 這時各博弈方的選擇就會是一致的 各方不但自己會選擇該納什均衡的策略 而且可以預料其他博弈方也會選擇該納什均衡的策略 因此不會有選擇困難 wuweiwei100 例戰(zhàn)爭與和平博弈 該博弈有兩個純策略納什均衡 戰(zhàn)爭 戰(zhàn)爭 和 和平 和平 其中 和平 和平 構成帕累托上策均衡 國家1 戰(zhàn)爭 和平 戰(zhàn)爭 和平 國家2 wuweiwe

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論