擴(kuò)展式博弈改寫策略式_第1頁(yè)
擴(kuò)展式博弈改寫策略式_第2頁(yè)
擴(kuò)展式博弈改寫策略式_第3頁(yè)
擴(kuò)展式博弈改寫策略式_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

擴(kuò)展式博弈改寫策略式《擴(kuò)展式博弈改寫策略式》篇一在博弈論中,擴(kuò)展式博弈(ExtensiveFormGame)是一種描述博弈過(guò)程的詳細(xì)方式,它包含了所有參與者的信息,包括他們的行動(dòng)順序、信息集以及支付函數(shù)。擴(kuò)展式博弈的改寫策略式(StrategicFormRepresentation)是將擴(kuò)展式博弈轉(zhuǎn)換為策略式博弈(StrategicFormGame)的過(guò)程,其中每個(gè)參與者選擇一個(gè)策略,而策略是參與者在所有可能的信息集上采取的行動(dòng)的函數(shù)。改寫策略式的過(guò)程通常涉及以下幾個(gè)步驟:1.策略集的定義:為每個(gè)參與者定義策略集,這些策略是參與者在所有可能的信息集上采取的行動(dòng)的函數(shù)。在擴(kuò)展式博弈中,參與者的行動(dòng)通常依賴于他們觀察到的信息,因此在策略式中,策略需要編碼這些信息依賴關(guān)系。2.策略的表示:策略可以用多種方式表示,包括但不限于決策樹(shù)、規(guī)則表、函數(shù)等。在策略式中,通常使用函數(shù)來(lái)表示策略,其中輸入是參與者的信息集,輸出是參與者的行動(dòng)。3.支付函數(shù)的轉(zhuǎn)換:擴(kuò)展式博弈中的支付函數(shù)通常與策略的順序選擇有關(guān)。在策略式中,需要定義一個(gè)支付函數(shù),該函數(shù)接受所有參與者的策略作為輸入,并返回每個(gè)參與者的支付。4.均衡點(diǎn)的識(shí)別:在擴(kuò)展式博弈中,均衡點(diǎn)可能與行動(dòng)的順序有關(guān)。在策略式中,需要重新定義均衡概念,例如納什均衡,并確定在新的表示下哪些是均衡點(diǎn)。5.簡(jiǎn)化與提煉:策略式通常比擴(kuò)展式博弈更簡(jiǎn)潔,因?yàn)樗橄罅诵袆?dòng)的順序和信息集。然而,這可能導(dǎo)致一些信息的丟失,因此在轉(zhuǎn)換過(guò)程中需要小心地保持關(guān)鍵信息的完整性。例如,考慮一個(gè)簡(jiǎn)單的擴(kuò)展式博弈,其中有兩個(gè)參與者A和B,他們各自有兩個(gè)行動(dòng){L,R}。參與者的行動(dòng)順序是A先行動(dòng),然后是B。A的信息集是{L,R},B的信息集是{A_L,A_R},其中A_L表示A選擇了L,A_R表示A選擇了R。支付函數(shù)如下:△如果A選擇L,B選擇L,則A得到2,B得到1。△如果A選擇L,B選擇R,則A得到3,B得到0?!魅绻鸄選擇R,B選擇L,則A得到0,B得到3。△如果A選擇R,B選擇R,則A得到1,B得到2。為了改寫策略式,我們可以定義以下策略:△A的策略是f_A(I_A),其中I_A是A的信息集。△B的策略是f_B(I_B),其中I_B是B的信息集。支付函數(shù)可以改寫為:△Payoff(f_A,f_B)=2iff_A(L)andf_B(L)△Payoff(f_A,f_B)=3iff_A(L)andf_B(R)△Payoff(f_A,f_B)=0iff_A(R)andf_B(L)△Payoff(f_A,f_B)=1iff_A(R)andf_B(R)在策略式中,我們需要找到這樣的策略組合,使得沒(méi)有參與者可以通過(guò)單方面改變策略來(lái)提高他們的支付,這對(duì)應(yīng)于納什均衡的概念。在擴(kuò)展式博弈中,由于行動(dòng)的順序,可能存在多個(gè)均衡點(diǎn)。在策略式中,我們需要確保這些均衡點(diǎn)在新的表示下仍然成立,或者確定新的均衡點(diǎn)。通過(guò)這種方式,擴(kuò)展式博弈的改寫策略式提供了一個(gè)更簡(jiǎn)潔的博弈表示,同時(shí)保持了足夠的細(xì)節(jié)來(lái)分析參與者的行為和均衡點(diǎn)。這種轉(zhuǎn)換對(duì)于理論研究和實(shí)際應(yīng)用中的博弈分析都是非常有用的。《擴(kuò)展式博弈改寫策略式》篇二在擴(kuò)展式博弈中,參與者的行動(dòng)通常以樹(shù)狀結(jié)構(gòu)表示,其中每個(gè)節(jié)點(diǎn)代表一個(gè)參與者的行動(dòng)選擇,而每條邊則表示另一個(gè)參與者的反應(yīng)。這種表示方法雖然直觀,但對(duì)于某些類型的博弈,特別是那些涉及大量行動(dòng)和參與者或者具有復(fù)雜結(jié)構(gòu)的大型博弈,可能難以有效分析和解決。在這種情況下,將擴(kuò)展式博弈改寫為策略式表示可能是一種更有效的方法。策略式表示是一種簡(jiǎn)化的表示方法,它將參與者的策略作為基本元素,而不是具體的行動(dòng)。在策略式表示中,每個(gè)參與者都有一個(gè)策略函數(shù),該函數(shù)指定在給定的信息集上應(yīng)該采取的行動(dòng)。這種表示方法可以大大簡(jiǎn)化博弈的分析,因?yàn)樗试S我們忽略不必要的細(xì)節(jié),專注于參與者的決策規(guī)則。改寫擴(kuò)展式博弈為策略式表示通常涉及以下幾個(gè)步驟:1.確定策略空間:首先,需要確定每個(gè)參與者的策略空間。策略空間是所有可能策略的集合,其中每個(gè)策略是參與者在給定信息集上選擇行動(dòng)的規(guī)則。2.定義信息集:在策略式表示中,信息集是參與者在做出決策時(shí)所考慮的所有可用信息。這包括對(duì)手的行動(dòng)、公共信息以及可能的歷史信息。3.構(gòu)建策略函數(shù):每個(gè)參與者都有一個(gè)策略函數(shù),它將信息集映射到特定的行動(dòng)。策略函數(shù)可以是確定性的,也可以是概率性的,這取決于博弈的性質(zhì)和參與者的不確定性。4.分析策略互動(dòng):在改寫為策略式表示后,可以更容易地分析參與者之間的策略互動(dòng),以及這些策略如何影響博弈的均衡點(diǎn)和結(jié)果。5.尋找均衡點(diǎn):策略式表示使得尋找均衡點(diǎn)(如納什均衡)變得更加直觀,因?yàn)閰⑴c者可以通過(guò)比較策略函數(shù)來(lái)評(píng)估對(duì)方的反應(yīng)。6.評(píng)估和優(yōu)化:最后,可以通過(guò)評(píng)估不同策略組合的預(yù)期效用來(lái)優(yōu)化參與者的策略,從而找到更有利的均衡點(diǎn)。例如,考慮一個(gè)簡(jiǎn)單的兩人零和博弈,其中每個(gè)參與者都有兩個(gè)行動(dòng)選項(xiàng):A或B。在擴(kuò)展式博弈中表示中,這會(huì)形成一個(gè)四節(jié)點(diǎn)樹(shù),每個(gè)參與者的選擇形成一條分支。然而,在策略式表示中,我們只需要描述每個(gè)參與者的策略:例如,參與者1可能會(huì)選擇“如果參與者2選擇A,那么我選擇B;如果參與者2選擇

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論