擴展式博弈改寫策略式

上傳人：1*** IP屬地：江蘇上傳時間：2024-04-08 格式：DOCX 頁數(shù)：4 大小：19.99KB 積分：7.2 舉報 版權(quán)申訴

全文預覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

擴展式博弈改寫策略式《擴展式博弈改寫策略式》篇一在博弈論中，擴展式博弈（ExtensiveFormGame）是一種描述博弈過程的詳細方式，它包含了所有參與者的信息，包括他們的行動順序、信息集以及支付函數(shù)。擴展式博弈的改寫策略式（StrategicFormRepresentation）是將擴展式博弈轉(zhuǎn)換為策略式博弈（StrategicFormGame）的過程，其中每個參與者選擇一個策略，而策略是參與者在所有可能的信息集上采取的行動的函數(shù)。改寫策略式的過程通常涉及以下幾個步驟：1.策略集的定義：為每個參與者定義策略集，這些策略是參與者在所有可能的信息集上采取的行動的函數(shù)。在擴展式博弈中，參與者的行動通常依賴于他們觀察到的信息，因此在策略式中，策略需要編碼這些信息依賴關(guān)系。2.策略的表示：策略可以用多種方式表示，包括但不限于決策樹、規(guī)則表、函數(shù)等。在策略式中，通常使用函數(shù)來表示策略，其中輸入是參與者的信息集，輸出是參與者的行動。3.支付函數(shù)的轉(zhuǎn)換：擴展式博弈中的支付函數(shù)通常與策略的順序選擇有關(guān)。在策略式中，需要定義一個支付函數(shù)，該函數(shù)接受所有參與者的策略作為輸入，并返回每個參與者的支付。4.均衡點的識別：在擴展式博弈中，均衡點可能與行動的順序有關(guān)。在策略式中，需要重新定義均衡概念，例如納什均衡，并確定在新的表示下哪些是均衡點。5.簡化與提煉：策略式通常比擴展式博弈更簡潔，因為它抽象了行動的順序和信息集。然而，這可能導致一些信息的丟失，因此在轉(zhuǎn)換過程中需要小心地保持關(guān)鍵信息的完整性。例如，考慮一個簡單的擴展式博弈，其中有兩個參與者A和B，他們各自有兩個行動{L,R}。參與者的行動順序是A先行動，然后是B。A的信息集是{L,R}，B的信息集是{A_L,A_R}，其中A_L表示A選擇了L，A_R表示A選擇了R。支付函數(shù)如下：△如果A選擇L，B選擇L，則A得到2，B得到1?！魅绻鸄選擇L，B選擇R，則A得到3，B得到0?！魅绻鸄選擇R，B選擇L，則A得到0，B得到3?！魅绻鸄選擇R，B選擇R，則A得到1，B得到2。為了改寫策略式，我們可以定義以下策略：△A的策略是f_A(I_A)，其中I_A是A的信息集?！鰾的策略是f_B(I_B)，其中I_B是B的信息集。支付函數(shù)可以改寫為：△Payoff(f_A,f_B)=2iff_A(L)andf_B(L)△Payoff(f_A,f_B)=3iff_A(L)andf_B(R)△Payoff(f_A,f_B)=0iff_A(R)andf_B(L)△Payoff(f_A,f_B)=1iff_A(R)andf_B(R)在策略式中，我們需要找到這樣的策略組合，使得沒有參與者可以通過單方面改變策略來提高他們的支付，這對應于納什均衡的概念。在擴展式博弈中，由于行動的順序，可能存在多個均衡點。在策略式中，我們需要確保這些均衡點在新的表示下仍然成立，或者確定新的均衡點。通過這種方式，擴展式博弈的改寫策略式提供了一個更簡潔的博弈表示，同時保持了足夠的細節(jié)來分析參與者的行為和均衡點。這種轉(zhuǎn)換對于理論研究和實際應用中的博弈分析都是非常有用的?！稊U展式博弈改寫策略式》篇二在擴展式博弈中，參與者的行動通常以樹狀結(jié)構(gòu)表示，其中每個節(jié)點代表一個參與者的行動選擇，而每條邊則表示另一個參與者的反應。這種表示方法雖然直觀，但對于某些類型的博弈，特別是那些涉及大量行動和參與者或者具有復雜結(jié)構(gòu)的大型博弈，可能難以有效分析和解決。在這種情況下，將擴展式博弈改寫為策略式表示可能是一種更有效的方法。策略式表示是一種簡化的表示方法，它將參與者的策略作為基本元素，而不是具體的行動。在策略式表示中，每個參與者都有一個策略函數(shù)，該函數(shù)指定在給定的信息集上應該采取的行動。這種表示方法可以大大簡化博弈的分析，因為它允許我們忽略不必要的細節(jié)，專注于參與者的決策規(guī)則。改寫擴展式博弈為策略式表示通常涉及以下幾個步驟：1.確定策略空間：首先，需要確定每個參與者的策略空間。策略空間是所有可能策略的集合，其中每個策略是參與者在給定信息集上選擇行動的規(guī)則。2.定義信息集：在策略式表示中，信息集是參與者在做出決策時所考慮的所有可用信息。這包括對手的行動、公共信息以及可能的歷史信息。3.構(gòu)建策略函數(shù)：每個參與者都有一個策略函數(shù)，它將信息集映射到特定的行動。策略函數(shù)可以是確定性的，也可以是概率性的，這取決于博弈的性質(zhì)和參與者的不確定性。4.分析策略互動：在改寫為策略式表示后，可以更容易地分析參與者之間的策略互動，以及這些策略如何影響博弈的均衡點和結(jié)果。5.尋找均衡點：策略式表示使得尋找均衡點（如納什均衡）變得更加直觀，因為參與者可以通過比較策略函數(shù)來評估對方的反應。6.評估和優(yōu)化：最后，可以通過評估不同策略組合的預期效用來優(yōu)化參與者的策略，從而找到更有利的均衡點。例如，考慮一個簡單的兩人零和博弈，其中每個參與者都有兩個行動選項：A或B。在擴展式博弈中表示中，這會形成一個四節(jié)點樹，每個參與者的選擇形成一條分支。然而，在策略式表示中，我們只需要描述每個參與者的策略：例如，參與者1可能會選擇“如果參與者2選擇A，那么我選擇B；如果參與者2選擇

人人文庫> 全部分類> 應用文書 > 技術(shù)指導

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

擴展式博弈改寫策略式

文檔簡介

溫馨提示

最新文檔

評論

擴展式博弈改寫策略式

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔