博弈論的分類

上傳人：小*** IP屬地：天津上傳時(shí)間：2022-07-14 格式：DOC 頁數(shù)：6 大?。?8KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩1頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、須要求傅弈方互相認(rèn)識(shí)彼此的決策行為，即每個(gè)參與者都能預(yù)見其他參與者的均衡策略。當(dāng)一個(gè)博弈中的參與者達(dá)到納什均衡狀態(tài)時(shí)，任何一個(gè)參與者都不能獨(dú)自的改變本身的策略行為以增大自身的收益而不影響其他參與者的策略行為。因此，納什均衡表示的是瞎弈的穩(wěn)態(tài)性，一旦達(dá)到納什均衡狀態(tài)，表明該瞎弈各個(gè)參與者之間達(dá)到均衡狀態(tài)，不再進(jìn)行策略行為的選擇。而納什均衡也存在不足之處，納什均衡的狀態(tài)并不一定是唯一的，在有些實(shí)際問題中會(huì)存在多個(gè)納什均衡。2.2.6帕累托最優(yōu)帕累托最優(yōu)(ParetoOptimality),也稱為帕累托效率(ParetoEfficiency,PE)。這個(gè)概念是由意大利經(jīng)濟(jì)學(xué)家維弗靂多帕累托在關(guān)于經(jīng)濟(jì)

2、效率和收入分配的一篇論文中提出,在經(jīng)濟(jì)學(xué)、工程學(xué)和社會(huì)科學(xué)中有著廣泛的應(yīng)用。帕累托最優(yōu)是博弈論中非常重要的概念，指的是資源分配的一種最優(yōu)的狀態(tài)，在不使任何參與者情況變壞的情況下，不可能再使某些參與者的處境變好。在一個(gè)基本的傅弈11nnG=ssuu中，由每個(gè)I専弈方的策略行為組成的策略集合()111sS,如果不存在任何的策略行為集合()212Ss使得:0()221111ininUssMUssieN(2.2)則稱策略集合()111ss為該博弈的帕累托最優(yōu)。當(dāng)在某個(gè)博弈中，瞎弈參與者達(dá)到帕累托最優(yōu)狀態(tài)后，不可能再有更多的帕累托改進(jìn)的余地，帕累托最優(yōu)是公平與效率的“理想王國”。與納什均衡不同的是，帕累

3、托最優(yōu)是從合作的角度出發(fā)，各博弈參與者互相交換各自的信息，從而獲得整體最優(yōu)的效益；而納什均衡只是表示一種均衡狀態(tài)，各博弈參與者只從自己的角度出發(fā)，選擇自己的最優(yōu)行策略，而并不考慮其他參與者策略行為的選擇，是一種自私的行為策略選擇。由此可見，納什均衡只是博弈參與者達(dá)到平衡的一種狀態(tài),而并不是一種帕累托最優(yōu)，不是一種完美的結(jié)局。2.2.7超模博弈托普基斯(Topkis)在1979年提出了超模博弈模型(SupermodelGames)思23,指出若瞎弈參與者的效益函數(shù)是超模的，則該傅弈過程為超模博弈。超模博弈的定義：如果任意兩個(gè)博弈參與者1a和Ja,1Ja$a,他們的效用函數(shù)滿足南京郵電大學(xué)碩士研究

4、生學(xué)位論文第二章功率控制技術(shù)及博弈論18參與者的效率、公平和公正。研究的是瞎弈參與者通過合作的方式在一定的約束條件下如何分配所獲得收益，合作傅弈論也可稱為聯(lián)盟傅弈，其存在的兩個(gè)基本條件是：通過聯(lián)盟的方式，系統(tǒng)所獲得收益多于參與者單獨(dú)所獲得的收益和。在聯(lián)盟內(nèi)部，應(yīng)存在具有帕累托改進(jìn)性質(zhì)的分配規(guī)則，即每個(gè)參與者都能獲得比不加入聯(lián)盟時(shí)多一些的收益。合作博弈所包含的本身特性決定了這兩個(gè)基本條件是否可以順利滿足并實(shí)現(xiàn)，即在聯(lián)盟結(jié)構(gòu)中各參與者的信息是可以互換的，必須遵循共同的約朿協(xié)議。而在非合作博弈模型中，每個(gè)參與者單獨(dú)選擇策略行為，并不遵循保證整體效用的共同準(zhǔn)則。合作傅弈按照合作之后的收益變化可分為本質(zhì)

5、性的合作和非本質(zhì)性的合作,若合作之后各傅弈參與者及整體的收益有所增加，則此合作瞎弈是本質(zhì)性的，即合作后該聯(lián)盟存在凈增收益；若合作之后各瞎弈參與者及整體的收益并沒有增加反而下降，則此合作傅弈為非本質(zhì)性的。合作傅弈與非合作傅弈區(qū)別主要在于合作博弈是研究各參與者達(dá)成合作時(shí)如何分配合作所得到的收益，即收益分配問題。而非合作博弈是研究參與者在利益相互影響的情況下如何選擇策略行為使自己的收益最大，即策略行為選擇問題。合作瞎弈強(qiáng)調(diào)的是聯(lián)盟內(nèi)部各參與者之間的信息互通，只有通過各參與者之間信息的互相交換，合作才可進(jìn)行。2.2.5納什均衡在經(jīng)濟(jì)學(xué)中，均衡指的是各相關(guān)變量處于穩(wěn)定狀態(tài)。在傅弈論中，可以通過均衡來判定

6、傅弈的穩(wěn)態(tài)性，也可以判定算法是否收斂。約翰納什在20世紀(jì)50年代發(fā)表了兩篇關(guān)于非合作博弈的文章22,對(duì)均衡解的思想作了闡述，并提供了證明均衡解存在性和唯一性的依據(jù)，即納什均衡(NashEqulibrium,NE)。納什均衡是判定非合作博弈是否達(dá)到穩(wěn)定狀態(tài)的重要依據(jù)，奠定了現(xiàn)代t専弈論發(fā)展的基礎(chǔ)。在一個(gè)基本的博弈11nnG=ssuu中，由每個(gè)I専弈方的策略行為組成的策略集合()1,若任一博弈方的策略行為都是其他博弈方策略集合()111,，,，11n的最佳策略行為，即0()111111liiiniiijinusssssusssss+2(2.1)對(duì)1J1ses都成立，則可認(rèn)為()*1SS為基本博弈G

7、的一個(gè)“納什均衡”。由上可以看出，納什均衡是所有博弈方的最優(yōu)策略行為集合，此時(shí)的每一個(gè)傅弈參與者的策略行為都是對(duì)其他參與者策略行為的最優(yōu)反應(yīng)，達(dá)到平衡的狀態(tài)。要實(shí)現(xiàn)納什均衡，必172.2.4博弈論的分類實(shí)際中可從不同的方面對(duì)博弈進(jìn)行劃分，比如依據(jù)博弈參與者的數(shù)量多少，可分為雙人傅弈和多人博弈；依據(jù)博弈參與者選擇決策行為的先后順序，可分為動(dòng)態(tài)傅弈(DynamicGame)和靜態(tài)傅弈(StaticGame)；依據(jù)博弈參與者對(duì)其他參與者所了解信息的多少，可分為完全信息博弈(GamewithCompleteInformation)和不完全信息傅弈(GamewithlncompleteInformati

8、on)；依據(jù)博弈參與者相互的合作關(guān)系，可分為非合作博弈(Non-CooperativeGameTheory)和合作I専弈(CooperativeGameTheory)o如表2.1所示表示了常見的博弈分類。表2.1博弈的分類分類依據(jù)傅弈類型參與者數(shù)量雙人傅弈；多人博弈傅弈次序動(dòng)態(tài)博弈；靜態(tài)博弈參與者信息完全信息博弈；不完全信息博弈合作關(guān)系非合作傅弈；合作博弈近年來博弈論的主要研究方向?yàn)榉呛献鞲缔募昂献鞑┺?。在非合作傅弈中，根?jù)博弈參與者的行為次序及在博弈中所獲信息的不同，可將非合作t専弈劃分為：完全信息靜態(tài)瞎弈、不完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈和不完全信息動(dòng)態(tài)博弈。其中，完全信息靜態(tài)博弈是由

9、納什提出的，對(duì)應(yīng)的均衡即為納什均衡；不完全信息靜態(tài)博弈由海薩尼在1967年提出，在對(duì)其他博弈參與者類型進(jìn)行預(yù)測(cè)時(shí)，需采用貝葉斯法則，因此對(duì)應(yīng)的均衡為貝葉斯納什均衡；賽爾頓在1965年提出了完全信息動(dòng)態(tài)博弈，將完整博弈劃分成若干個(gè)子博弈，所對(duì)應(yīng)的均衡為子博弈精煉納什均衡；不完全信息動(dòng)態(tài)瞎弈由賽爾頓在1975年提出，所對(duì)應(yīng)的均衡為精煉貝葉斯納什均衡。如表2.2所示。表2.2博弈按參與者信息的分類時(shí)間次序信息靜態(tài)動(dòng)態(tài)完全信息約翰納什納什均衡賽爾頓子傅弈精煉納什均衡不完全信息海薩尼貝葉斯納什均衡賽爾頓精煉貝葉斯納什均衡在合作瞎弈中,每個(gè)博弈參與者釆取的是一種合作的方式，或者說是一種妥協(xié)，目的是通過合作

10、的方式使得每個(gè)博弈參與者及整個(gè)系統(tǒng)的收益都達(dá)到最優(yōu)。合作t専弈注重的是整體南京郵電大學(xué)碩士研究生學(xué)位論文第二章功率控制技術(shù)及傅弈論的值單調(diào)不減，即：(2.3)則稱該傅弈模型為超模的。由托普基斯的不動(dòng)點(diǎn)定理可以得知納什均衡的存在性,即超模傅弈至少最在一個(gè)納什均衡點(diǎn)。而一個(gè)超模t専弈中的所有均衡點(diǎn)構(gòu)成一個(gè)格，若其中一對(duì)均衡點(diǎn)己知，則其他納什均衡點(diǎn)可通過計(jì)算得出。超模瞎弈的概念在博弈論中非常重要，在超模瞎弈中，每個(gè)傅弈方增加其策略行為所引起的邊際效用隨著其他博弈方策略行為的遞增而增加。在博弈中，對(duì)最優(yōu)反應(yīng)的反應(yīng)是遞增的，所以博弈參與者的策略行為是“策略互補(bǔ)”的。當(dāng)有兩個(gè)博弈方參與時(shí)，對(duì)變量進(jìn)行變化以

11、后也可以釆用超模博弈模型進(jìn)行分析遞減的最優(yōu)反應(yīng)的情況。2.3本章小結(jié)功率控制技術(shù)作為認(rèn)知無線電的關(guān)鍵技術(shù)，在保證接收端信干比的前提下，盡可能的降低每個(gè)認(rèn)知用戶的發(fā)射功率，減少系統(tǒng)間的相互干擾,使系統(tǒng)容量最大化。通過功率控制技術(shù)，使得網(wǎng)絡(luò)中用戶間的相互干擾達(dá)到最小，而且降低了終端的能源消耗。本章首先介紹介紹了功率技術(shù)的分類，包括開環(huán)、閉環(huán)功率控制及集中式、分布式功率控制技術(shù)等。然后，詳細(xì)闡述了博弈論的基本知識(shí)，包括博弈論的基本概念、分類及基本模型，并介紹了博弈論中的重要理論：納什均衡及帕累托最優(yōu)，為研究基于博弈的認(rèn)知無線電功率控制技術(shù)奠定了理論基礎(chǔ)。傅弈論包含自身的博弈模型，其中，一個(gè)完整的傅弈

12、模型包含3個(gè)基本組成部分，即博弈參與方(Player)策略行為集合(Strategyset)及效用函數(shù)(UtilityFunction,UF)。由此，可以從5個(gè)方面來對(duì)t専弈論的基本模型做詳細(xì)的描述，即G=P,A,S,I,UoP(player),W弈的參與者，也可稱為“局中人”“博弈方”，是指在博弈中獨(dú)立決策、獨(dú)立承擔(dān)后果，并且使自身利益達(dá)到最好來選擇策略行為的決策主體。其中，博弈的參與者可以是個(gè)人也可以是團(tuán)體組織。無論參與者是個(gè)人還是團(tuán)體，一旦參與博弈，各參與方互相平等，都必須按照一定的博弈規(guī)則確定自己的策略行為。A(action),所有博弈參與者的策略行為組成部分。指在傅弈過程中，每個(gè)參與

13、者在與其他參與者進(jìn)行傅弈時(shí)，可選擇的行為策略。對(duì)于博弈局中人來說，在不同的博弈過程中可以選擇的策略行為是不同的，即使同屬于一個(gè)博弈過程中,可選擇的策略行為也是不同的，可能是一種或是多種，其至無限多種。S(strategies),博弈的次序。在實(shí)際的許許多多傅弈決策中，當(dāng)有許多博弈局中人需要進(jìn)行決策行為時(shí)，有時(shí)這些博弈參與者需要在同一時(shí)間做出決策行為，以保證傅弈方的公平性，而有時(shí)傅弈參與者的決策行為要有不同的先后順序，而且有的博弈參與者需要做出多次決策行為。因此，在傅弈中，需要定義傅弈參與者之間的次序，如果兩個(gè)傅弈僅僅次序不同，那么他們是不同的瞎弈。I(information),博弈信息。在傅弈中，信息的掌握對(duì)于博弈方非常重要，信息掌握的越多，傅弈參與者的決策行為就越準(zhǔn)確。因此，傅弈參與者應(yīng)盡可能的掌握更多的傅弈信息，在傅弈選擇決策行為時(shí)更為主動(dòng)，從而確保決策行為的準(zhǔn)確性。U(utility),博弈參與者的效用，乂稱為收益。是指傅弈參與者選擇策略行為后所獲得的收益，對(duì)于每個(gè)瞎弈參與者來說是其策略行為的函數(shù)，是參與者最注重的

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論的分類

文檔簡介

溫馨提示

最新文檔

評(píng)論

博弈論的分類

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔