《博弈論教程(第三版)》10第七章 零和博弈_第1頁
《博弈論教程(第三版)》10第七章 零和博弈_第2頁
《博弈論教程(第三版)》10第七章 零和博弈_第3頁
《博弈論教程(第三版)》10第七章 零和博弈_第4頁
《博弈論教程(第三版)》10第七章 零和博弈_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第七章零和博弈7-1零和博弈與非零和博弈7-2最小最大方法7-3直線交叉法7-4霍特林模型7-5對抗性排序零和博弈:每一局博弈的總支付,即雙方得失之和總是0。二人“常和”博弈:每局雙方得失之和雖然不是零,卻是一個常數(shù)。

例如雙方每進行一局博弈,除了他們之間的輸贏支付外,還要向提供游戲器具或者場所的第三方交納一定的租金,則每局雙方得失之和就是一個負的常數(shù);又如每進行一局博弈,除了他們之間的輸贏支付外,雙方還可以得到來自第三方的一定數(shù)量的獎勵,則每局雙方得失之和就是一個正的常數(shù)。7-1零和博弈與非零和博弈常和博弈:二人常和博弈;多人常和博弈非零和博弈:變和博弈(不包括常和博弈)7-1零和博弈與非零和博弈設G是一個n人常和博弈,那么按照定義,在G的每種對局下博弈的n個參與人的支付的總和,是一個常數(shù)。n人常和博弈的偏零因子:常數(shù)的n分之一。常和博弈的每個支付都減去這個博弈的偏零因子,那么每種對局下博弈的所有參與人的支付總和為零。對于n人常和博弈G,每個支付中減去這個博弈的偏零因子,把它轉換成一個零和博弈,記作G’。G’是G的歸零博弈。研究二人零和博弈時,只要研究一個人的支付矩陣即可。7-2最小最大方法尋求二人零和博弈的純策略納什均衡:

馮.諾依曼提出最小最大方法基礎想法:局中人在進行零和博弈時對他們?nèi)〉煤媒Y果的機會抱“悲觀”的態(tài)度。你的對手會選擇一個使你獲得盡可能差的支付的策略。你的對手也會想,你會在所有可能選擇的策略中,選擇一個對他最不利的策略。假定給出的是行局中人的支付矩陣。行局中人的角度,希望博弈的結果是支付盡可能大的那個矩陣位置,而列局中人則希望博弈的結果是支付盡可能小的那個位置。行局中人:對他所能選擇的每個行策略,列局中人都將選擇該行中數(shù)字最小的那列。因此,行局個人應該選擇在列局中人所選擇的這些每行的最小的數(shù)字中最大的數(shù)字所對應的那行,就是選擇“最小”中的“最大”,maximin。列局中人:minmax最大最小—最小最大方法(最小最大法):零和博弈中求解純策略納什均衡的方法,能找出所有純策略納什均衡。最小最大方法與相對優(yōu)勢策略下劃線法一樣,都是尋找同時行動博弈的純策略納什均衡的一種方法,但是,上面那樣的最小最大方法的適用范圍要窄一些,只適用于零和博弈,對于非零和博弈它就束手無策了。其中的原因在于,在非零和博弈中,可能存在共同利益,從而選擇一個你可能得到的所有最小支付中的最大者,不一定是你的最優(yōu)反應,因為你的對手所選擇的最優(yōu)策略未必是使你獲得最差支付的策略。注意7-3直線交叉法最小最大方法,只適用于尋找零和博弈中的純策略納什均衡,如果一個博弈不存在純策略納什均衡,我們就需要把上述方法予以擴展,以便找出混合策略的納什均衡。當Q翻出紅牌時,P的p混合策略所產(chǎn)生的期望支付是p-(1-p)=2p-1;當Q選擇出黑牌時,P使用p混合策略的期望支付是1-2p。找出P的最大最小策略,即在p的所有可能取值中找出能最大化P可能得到的最小支付的p值。擴展的最大最小法在均衡狀態(tài)下,對于每一個可能的p混合的值,P會預期Q總是選擇對Q自己最有利的行動。由于這是一個零和博弈,對Q而言最好的行動意味著對P而言是最不利的行動。因此,對于任何一個具體的p值,P總是預期Q會選擇與圖中兩條直線中處于較低位置的直線所對應的行動。當P選擇出紅牌的概率小于50%時(即p<0.5),P預期Q會選擇出紅牌。再從列局中人Q的角度來探討:

對于任意給定的q值,Q都會預期P采取對P自己最有利即對Q最不利的行動。從圖上看也就是說,如果q的取值位于兩條直線交點的左方,則P會選擇出黑牌;如果q的取值位于兩條直線交點的右方,則P會選擇出紅牌。

p*=0.5,q*=1/2=0.5,找出P和Q的最優(yōu)策略選擇后,我們接下來要做的事情就是把這兩個策略選擇放在一起,并證明它們構成這個博弈的納什均衡。當然,證明的思路仍然體現(xiàn)納什均衡的精髓:單獨偏離沒有好處。

給定P選擇p=0.5的p混合策略,此時Q無論是選擇出紅牌還是出黑牌,他所得到的期望支付都是0,這與他采取q混合策略時所得到的支付是相同的,因此,Q沒有激勵偏離給定的q混合策略的選擇。

給定Q選擇q=0.5的q混合策略,P選擇出紅牌或出黑牌的純策略,或者兩者混合的策略所得到的期望支付都是0。因此,他沒有激勵偏離給定的p=0.5的混合策略選擇。

合起來,這兩個混合策略是P和Q相互間的最優(yōu)反應,因此也就構成這個博弈的納什均衡7-4霍特林模型

設想在一個一字形排開的旅游地,有兩臺冷飲售賣機在兜攬生意。假設兩臺冷飲售賣機賣一樣的冷飲,價格也完全一樣,但是各自獨立,相互競爭。如果是三家獨立的冷飲售賣機在爭生意,他們就會轉來轉去轉個不停,不會出現(xiàn)穩(wěn)定的對局。冷飲售賣機定位問題,改編自大半個世紀以前美國經(jīng)濟學家霍特林(HaroldHotelling)提出來的雜貨鋪定位問題。美國經(jīng)濟學家和政治學家,運用霍特林模型,說明西方兩黨政治的部分現(xiàn)象。生活中的例子:等候出租車7-5對抗性排序零和博弈囚徒困境情侶博弈

囚徒困境和情侶博弈都有可能協(xié)調(diào)到雙贏的結果,可稱為協(xié)調(diào)博弈(gamesofcoordination)。廣義協(xié)調(diào)博弈包括所有能夠協(xié)調(diào)出雙贏對局的博弈,即使是囚徒困境那樣需要附加條件并且多次重復才能夠協(xié)調(diào)出雙贏結果的博弈。狹義的協(xié)調(diào)博弈,只指個體利益與集體利益一致的博弈,只指對于參與人來說合作總比不合作好的博弈。胖子進門博弈與情侶博弈有不同:雙方選擇不同的純策略,才是共

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論