




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1025擴展式可理性化心靈有其莫明的理由。Blaise Pascal擴展式博弈中,參與人可以在博弈進程中收集信息更新其主觀先驗信念,故而其信息比標準式博弈豐富得多。由此,研究擴展式博弈中的可理性化比之相應(yīng)的標準式博弈要復(fù)雜得多。有兩種方法可用于剔除那些不會被理性的主體所選擇的策略:逆向歸納法和前向歸納法。后者相對奇特(盡管更能自圓其說),將在第9章討論。作為迄今最受歡迎的分析技巧,逆向歸納法使用反復(fù)剔除弱劣策略的辦法,來獲得子博弈完美納什均衡該均衡在所有的子博弈中都是納什均衡。若擴展式博弈有唯一的子博弈完美納什均衡,則我們就稱之為一般的。在本章中,我們提出形式邏輯工具并展示Robert Aum
2、ann關(guān)于CKR隱含著逆向歸納法的著名證明(Aumann,1995)。這一定理曾廣遭批評,也廣受誤解。我想澄清其中的一些問題,這些問題對于當前的博弈理論至關(guān)重要。我的結(jié)論是,Aumann完全正確,真正的罪魁是CKR自身。5.1逆向歸納法與劣策略在完美信息(即每個信息集中只有一個節(jié)點)擴展式博弈中,逆向歸納法的操作步驟如下。選擇任意終端節(jié)點T,并找到其父節(jié)點,即節(jié)點v。假設(shè)參與人i在節(jié)點v進行選擇,并假設(shè)參與人i在節(jié)點v的最大贏利從終點節(jié)'T獲得。擦去從v點開始的所有枝,則v就成為一個終點,然后把'的贏利綁定到新的終端節(jié)點v。103同時,記錄下i在v點的行動,這樣你就可以在分析完
3、畢后刻畫出i的均衡策略。對原博弈的所有終端節(jié)點重復(fù)上述程序,之后,你就會得到一個比原博弈少一級的擴展式博弈。好了,請不斷重復(fù)上述過程。若最后的博弈樹在每個節(jié)點都只有一個可能的行動,則當你把為每個參與人記錄下的行動組合起來的時候,你就得到了一個納什均衡。由于我們是從博弈的終端節(jié)點向后推移的,故我們稱此為逆向歸納法。請注意,當參與人在多個節(jié)點行動,逆向歸納將剔除弱劣策略,因而也就有可能剔除掉使用弱劣策略的納什均衡。而且, 乍看起來,逆向歸納比標準式博弈的可理性化(§4.6)更強,后者等價于重復(fù)剔除嚴格劣策略。圖5.1 逆向歸納的一個例子原書p103, Figure 5.1考慮圖5.1逆向
4、歸納的一個例子。我們從標記為(0,0)的終端節(jié)點開始,回溯到左邊的Bob節(jié)點。在該節(jié)點,由于1>0,故w劣于c,于是我們擦去Bob出招為w的枝及與其關(guān)聯(lián)的贏利。我們再到原博弈樹另一個終端節(jié)點(4,4),回溯到右邊的Bob節(jié)點。在該節(jié)點,c劣于w,于是我們擦去劣勢節(jié)點及其贏利。然后,我們將逆向歸納法運用到這個更小的博弈樹上當然,現(xiàn)在這已是再簡單不過的了。我們找到第一個終點(9,1),它直接回溯到Alice的選擇節(jié)點。104這里,c是劣的,于是我們擦去該枝及其贏利。于是就得到了解:Alice選擇w,Bob選擇cw,而贏利為(9,1)。從這個例子可明顯看到,利用逆向歸納法并剔除弱劣策略,我們剔
5、除了納什均衡c,ww。這是因為,我們假定Bob出招c去應(yīng)對Alice的w,而剔除了Bob的弱劣策略ww和wc。我們稱c,ww乃不可置信的威脅。逆向歸納法剔除了不可置信的威脅。5.2子博弈完美令v為擴展式博弈G的一個信息集,該信息集由單一節(jié)點構(gòu)成。令H為包含有v的節(jié)點群的最小集合類,滿足如下條件:當h'H時,h'的所有后續(xù)節(jié)點皆屬于H,且與h'位于同一信息集的所有節(jié)點皆屬于H。我們把從博弈G繼承而來的信息結(jié)構(gòu)、枝以及贏利賦予給H,而H中的參與人正好是博弈G中在H的某些信息集上行動的參與人子集。顯然,H乃一擴展式博弈,我們稱H為G的子博弈。若H是博弈G的子博弈,該子博弈以v
6、為根節(jié)點,那么G的每一個到達v的純策略組合都會在H中有一個副本sH,規(guī)定H中的參與人運用sH在H的每個節(jié)點上做出的選擇要與其運用sG在G的每個同樣的節(jié)點上做出的選擇相同。我們稱sH是sG對子博弈H的約束。假設(shè)G=1s1+ksk(ii=1 )是到達H的根節(jié)點v的一個混合策略;并令I(lǐng)1,k為指標集,滿足當且僅當si到達h時有iI。令=iIi 。那么,H=iI(i/)si 就是定義于H上的混合策略,即所謂的G對H的約束。由于G會到達v,故>0,而系數(shù)i/ 代表的是在到達h的條件下出招為si的概率。很明顯,若sG是博弈G的純策略納什均衡,而H是G的子博弈且H的根節(jié)點可由sG達到,那么sG對H的約
7、束sH必定是H中的納什均衡。然而,如果sG不能到達H的根節(jié)點,那么sG對H的約束就不一定是H中的納什均衡。原因在于,若某個節(jié)點不能由sG達到,那么在該節(jié)點進行選擇的參與人之贏利就并不取決于其在G中的選擇,但它卻會依賴于他在H中的選擇。當一個擴展式博弈對每個子博弈的約束都是子博弈的納什均衡時,我們才說該擴展式博弈的納什均衡是子博弈完美的。105容易發(fā)現(xiàn),同時行動博弈將沒有嚴格子博弈(一個博弈總是其自身的子博弈;我們稱整個博弈為非嚴格子博弈),因為對于至少一位參與人其所有的節(jié)點都在同一個信息集中。同樣,在自然率先行動的博弈中,如果至少有一位參與人不清楚自然的選擇,那么也沒有嚴格子博弈。在另一個極端
8、,完美信息(即每個信息集都只有單個元素)的博弈中,每個非終端節(jié)點都是子博弈的根節(jié)點。這使得我們可以用逆向歸納法尋找其子博弈完美納什均衡,如§5.1所述。這一推理路線表明,逆向歸納法一般由反復(fù)剔除弱劣策略以及剔除非子博弈完美納什均衡所構(gòu)成。5.3子博弈均衡和不可信威脅圖(原書p105,無圖表序號)右圖的博弈有一個純策略納什均衡Rr,其中Alice贏得2而Bob贏得1。這個均衡是子博弈完美的,因為從Bob在v2處* 原書是“從vB處”,從右圖看則應(yīng)為v2。本段落下一個v2(原文為vB)與此同誤。譯者注選擇的子博弈中,對于Bob來說r是贏利最大化的選擇。該均衡也是通過逆向歸納法選擇出來的。
9、不過,還有一個納什均衡,即Ll,此時Alice贏得1而Bob贏得5。Bob會更偏好后一個均衡,若果他能以某種方法誘導(dǎo)Alice相信自己會選擇l,則她的最佳反應(yīng)就會是L。然而,當Bob告訴Alice自己決意選l時,如果Alice認為Bob是理性的,她就很清楚一旦博弈達到v2時他事實上會選擇r。因而,Ll被認為是不合情理的納什均衡,與此相反,子博弈完美納什均衡倒是深受博弈論理論家的重視。5.4意外考試 一群博弈論專家曾經(jīng)開設(shè)了一門周一到周五集中授課的邏輯課程。幾周之后,教授宣布,下周的某天將有一次意外考試。每個學(xué)員都在心里思忖“考試不可能在下周五,否則就不是意外”。*因為若周五考試,則周一到周四必
10、不考;但周一到周四不曾考試,學(xué)生就會毫不意外地知道周五一定會考。譯者注基于同樣的推理,每個人都得出結(jié)論,考試不可能在下周四、下周三、下周二或者下周一。因此每個學(xué)生都斷定,教授錯了?;谙嗤耐茢啵總€同學(xué)都得出結(jié)論:考試不可能在下周的周四,周三,周二,周一。每個同學(xué)都斷定,老師錯了。106結(jié)果教授選擇下周二考試,所有學(xué)生都深感意外。這是所謂的“意外考試”或“突擊測驗悖論”這一著名邏輯問題的版本之一。對該問題諸多解決方法的概述,請參閱Chow(1998)。解釋五花八門,但沒有哪個解被人們接受。有不少中肯的分析運用了標準邏輯或形式邏輯,去證明教授的命題是自指的或自相矛盾。既然無效命題毫無意義,教授
11、預(yù)測正確也就不存在什么悖論。逆向歸納法表明,考試不會發(fā)生。但是,如果學(xué)員堅信這一點,那么考試就會是一個意外,不管它發(fā)生在哪一天。因此,逆向歸納法中的不合邏輯可以讓理性的學(xué)員信服,教授的推測的確是合理的。但是,逆向歸納法的不合邏輯究竟是什么?我提出這個悖論是想說明利用逆向歸納法的非形式邏輯之風(fēng)險。下面我們將提出更具分析性的精確方法。5.5邏輯悖論的共同知識若主體就一個命題集合做出推斷時,排除了所有與該集合不相容的狀態(tài),我們不妨說這個主體是推理正確的。那么,我們以慣用的方式來定義主體集合i=1,n的邏輯性共同知識(CKL)如下:對于任意整數(shù)集i1,ik1,n,i1知道i2知道知道ik-1知道ik是
12、推理正確的。一位父親有690 000美元要留給他的孩子Alice和Bob,這兩人都不知父親的財產(chǎn)規(guī)模。他決定給一個孩子340 000美元,給另一個350 000美元,概率各為1 / 2。不過,他不想讓得到較少金額的孩子覺得自己被輕視,至少在他的有生之年是如此。于是他告訴孩子:“我將從集合S1,100中隨機選擇兩個數(shù)字,隨機指派給你們每人一個數(shù)字,并給予你們一筆遺產(chǎn),價值等于所指派數(shù)字乘以10000美元。知道自己被指派的數(shù)字并能肯定算出你比你兄弟繼承得更多或更少。”父親令S=34,35,他對自己聲明的實質(zhì)很自信,我們視這個聲明為三個人的共同知識。107在邏輯性共同知識假設(shè)下,Alice思量了自己
13、的處境,推理如下:“父親很清楚,如果是1S或者100S,其中一個數(shù)會以正概率被選擇指派給我,此時我就能肯定自己在繼承權(quán)重的相對位置?!盇lice知道父親知道她是推理正確的,所以她知道1S且100S。但是,Alice推斷,她的父親知道她知道他知道她是合乎邏輯的,于是她斷定,父親知道他不能在S中包含2或99。但是,Alice通過CKL很清楚這一點,所以她斷定父親不會在S中包含3或98。完成這個遞歸論證,Alice認為S一定為空。然而,父親將數(shù)字34給了一個孩子,將35給了另一個孩子,他們誰也不知道誰的更大。因此,父親先前的說法是正確的,而Alice的推理是錯誤的。于是我們得到結(jié)論:在上述背景下,關(guān)
14、于邏輯性的共同知識是無效的。當父親把35放到S中,CKL就失效了,因為35已經(jīng)被CKL排除了。乍看起來,CKL是邏輯性的一種無礙大局的延伸,甚至通常不會在上述問題中被提及,但實際上它會導(dǎo)致錯誤的推理,故必須拋棄。在這方面,CKL很像CKR,CKR乍看起來是理性的一個無礙大局的延伸,但事實上往往適得其反。5.6重復(fù)囚徒困境圖表,原書P107假設(shè)Alice和Bob進行囚犯困境對局,其中一個階段展示在右圖,共進行100次。常識告訴我們,參與人至少會合作95輪,實驗證據(jù)確實支持這一看法(Andreoni 和Miller 1993)。但是,逆向歸納法論證表明,參與人恰恰是在第一輪就會背叛。要明白這一點,
15、請注意到參與人會在第100輪背叛。既然如此,他們在第99輪的任何努力都無法延長合作,故他們都將在第99輪背叛。這一論證重復(fù)99次,我們便看到,他們都將在第一輪就選擇背叛。雖然逆向歸納法通常消除了弱重復(fù)劣策略,但在本例中它只是消除了嚴格重復(fù)劣策略,故根據(jù)前面章節(jié)之分析,唯一的可理性化策略就是徹底背叛的納什均衡。這對可理性化概念提出了一個問題,該問題至少同前面章節(jié)中標準式博弈情形的問題一樣棘手。108不過,對于逆向歸納法的邏輯何以會打上折扣,本例中的擴展式提供了一種觀點。逆向歸納法完全以與先前章節(jié)中相同的方式依存于CKR。不過,當前的例子中,每個參與人第一次都選擇C,兩人都知道CKR是無效的。在重
16、復(fù)囚徒困境的終點,參與人已多次選擇C。由于這些終點在給定CKR時并不能達到,故我們無法在終點假設(shè)存在CKR。上述針對逆向歸納法的批評由Binmore (1987), Bicchieri (1989), Pettit and Sugden (1989), Basu(1990), and Reny (1993)等人提出。然而,上述批評并不正確。逆向歸納法的論證只是反證法的一個經(jīng)典例子:假設(shè)一個命題,并證明該命題是錯誤的。在本例中,我們假定擁有CKR,然后通過反證法說明不會到達第100輪。這種論證沒有漏洞。但是,把對“CKR暗含著逆向歸納法”這一命題的批評,建立在“如果CKR失效將發(fā)生什么”這一基礎(chǔ)
17、上,是不合邏輯的。對CKR暗含著逆向歸納法這一命題的不嚴密的批評,其誤導(dǎo)性的吸引力在于這樣的觀察:每個參與人第一輪選擇C,每個參與人知道CKR是失效的,因而在剩下的博弈中每個人都可自由采取符合自身利益的做法。例如,兩人都可以采用針鋒相對的戰(zhàn)略,在一輪中選擇C,然后在接下來的每一輪則照搬對手先前的行動,除了在博弈逼近100個回合終點時選擇D之外。上述觀點完全正確,但并非CKR暗含著逆向歸納這一命題的批判。的確,假設(shè)擁有CKR,在任何階段,參與人都不會選擇C。如同我在接下來所主張的,逆向歸納法的問題是,CKR并非可以廣泛接受的假設(shè),因此逆向歸納法在理性背景下并不總是合理的。5.7蜈蚣博弈在Rose
18、nthal的蜈蚣博弈中,Alice和Bob開始時每人有2美,輪流出招。在第一輪,Alice可以選擇背叛(2)而竊取Bob的2美元,博弈將就此結(jié)束;當然,Alice也可選擇合作(C)而不竊取,那么老天爺將給她1美元。爾后,Bob可以選擇背叛(D)從Alice竊取2美元,109博弈將就此結(jié)束,或者他也可以選擇合作(C)而老天爺給他1美元。這一過程反復(fù)進行,直到有人背叛,或者100輪全部結(jié)束。該博弈的博弈樹如圖5.2所示。正式而言,蜈蚣博弈簡化后的標準式可以描述如下:Alice選擇1到101之間的某個奇數(shù)ka,Bob選擇2到100之間的某個kb,若kb=100則追加上選項C或D。兩個選擇中較低者,比
19、如說k*,決定著贏利。若k*=100,則贏利(k*,C)=(52,52)而贏利k*,D=(50,53)。否則,若k*為奇數(shù),則贏利為(4+ (k*-1)/2,(k*-1)/2);若k*為偶數(shù),則贏利為(k*/2,3+k*/2)。你可以核對一下,上述選擇產(chǎn)生的贏利正好如前所述。要確定該博弈中的策略,請注意Alice和Bob各有50步行動,在每一步每個人都可以選擇D或C。我們因而可以用50個字母C或D的序列來描述每個人的策略,這意味著每個人有250=1125899906842624種純策略。當然,一旦有人第一次選了D,之后他做何選擇不會再影響博弈的贏利,所以與贏利有關(guān)的唯一問題,如果有的話,就是博
20、弈進行到第幾輪將有人第一次選擇D。這為每個參與人留下了51個策略。我們可以把逆向歸納法運用到該博弈,找到該博弈唯一的子博弈完美納什均衡,即兩位參與人選擇伊始就立即背叛。要弄明白這一點,請注意在最后一輪Bob將會背叛,故而Alice也將在她最后一步背叛。但進而Bob將在其倒數(shù)第二步背叛,如同Alice在她的倒數(shù)第二步背叛一樣。類似推理適用于所有輪次,證明了唯一的子博弈完美均衡中Bob和Alice將在第一步行動就背叛。圖5.2 Rosenthal的蜈蚣博弈原書P109,Figure 5.2當然,常識告訴你,這不是現(xiàn)實中的參與人在此種局勢下的行事方式,經(jīng)驗證據(jù)印證了你的直覺(McKelvey Pal
21、frey 1992)??雌饋恚?10罪魁禍首就是子博弈完美,因為逆向歸納法只找出子博弈完美均衡。然而,這不是問題所在。罪魁禍首乃是納什均衡的標準本身,因為在任何一個納什均衡中,Alice都會在第1輪就背叛。盡管逆向歸納法并未捕捉到人們在蜈蚣博弈中的行為,但標準式可理性化倒做得不錯,因為它表明,合作持續(xù)到將近博弈結(jié)束并不會與CKR相沖突。這是因為,Bob所有的純策略都是標準式可理性化的,除了kb=(100,C)之外;同樣,Alice所有的純策略也都是標準式可理性化的,除了ka=101(即每一輪都合作)之外。為了弄清楚這一點,我們可以證明博弈有一個混合策略納什均衡,其中Bob選擇kb=2 以及他除
22、(100,C)之外的其他任何一個純策略,而Alice選擇ka=1。這表明,對于Bob,除了(100,C)之外的所有純策略都是可理性化的。Alice的ka=101嚴格劣于使用ka=99和ka=1的混合策略,但她的其他純策略都是Bob某些可理性化純策略的最優(yōu)反應(yīng)。這表明,Alice的上述純策略本身就是可理性化的。這并未解釋為什么現(xiàn)實中的人們會一直合作到逼近博弈的尾聲,但它確實表明,標準式中人們這樣做并未與CKR相沖突。不過,這也算是一點小小的安慰吧,既然只有在忽略參與人肯定擁有的信息這些信息嵌入在博弈擴展式結(jié)構(gòu)中時,合作才與CKR兼容。在附加信息的背景下,CKR當然隱含著逆向歸納法的有效性,故此可
23、以斷定,CKR確保了在第一輪的背叛。5.8 逆向歸納法路徑之外的CKR失效圖5.3 短小的蜈蚣博弈原書p110,figure 5.3本節(jié)提出一個正式的認識論觀點來支持如下論斷:在一個一般性的擴展式博弈中,CKR背離了博弈完美的博弈路徑。這是Aumann(1995)關(guān)于CKR隱含著逆向歸納法的一般性證明之引申,111只不過我們把這一證明用于一個非常簡單的博弈,其中的直覺是相對清晰的。圖5.3刻畫了一個非常簡單的蜈蚣博弈(§5.7),由Alice(A)和Bob(B)對陣,其中Alice在A1和A3行動,而Bob在B2行動。令RA與RB分別表示“Alice是理性的”和“Bob是理性的”,令
24、KA和KB為知識算子,并且令A(yù)和B分別為Alice與Bob的贏利。關(guān)于何謂理性以及何謂一個主體“知道某事”的斷言,我們在以后的章節(jié)會講得更多。就目前而言,我們只是簡單地假設(shè)理性的參與人總是選擇最優(yōu)回應(yīng),我們假定Kpp(即,若主體知道某事,則某事就是真的),且我們假設(shè)KpK(pq)Kq(即,若主體知道p,則知道p蘊含著q,則主體知道q)。我們假設(shè)兩參與人皆知道博弈的全部規(guī)則,既然博弈是一個完美信息博弈,當博弈進行到某個特定的節(jié)點,這種情況就會成為共同知識。我們有A3RAd3,讀作“在節(jié)點A3,若Alice是理性的,她將選擇d3?!边@是正確的,因為a3(A=2)且d3(A=3),由于上述含義可輕易
25、從博弈規(guī)則推導(dǎo)出,故Alice知道它們,于是又KA(a3A=2)KA(d3(A=3)。這一論斷意味著A3RA=d3。現(xiàn)在,若Bob知道Alice是理性的,并且,若博弈規(guī)則為共同只是,則有a2KBa2KBd3KB(B=1)。而且,d2KBd2KB(B=3)?,F(xiàn)在,若Alice在A1知道Bob是理性的,且Bob在B2知道她是理性的,則有KA(a1d2),于是有KA(a1(A=0)。然而,KA(d1(A=1)。因此,既然Alice在A1是理性的,她將會選擇d1。簡言之,我們有RAKARBKBRAd1 (5.1)從而我們就證明了,若存在兩個層次的彼此的理性知識,則逆向歸納法解是有效地。但這預(yù)設(shè)了假設(shè)集
26、是一致的;即,假設(shè)集假定我們無法從這些假設(shè)去證明Alice會選擇a1。請注意,若Alice選擇a1,則式(5.1)的前提就是錯的,而 Bob很清楚這一點,這意味著 (5.2)一句話,若Alice選擇a1,則Bob要么不知道Alice是理性的,要么不知道Alice知道Bob是理性的,要么不知道Alice知道Bob知道Alice是理性的。112蘊含著KBRA的一層次相互知識,剔除了第一種情況;蘊含著KBKARB的二層次相互知識,剔除了第二種情況。因此,若Alice選擇a1,情況必是;即Alice的選擇違背了理性的第三層次相互知識,因而違背了理性的共同知識。只要保留兩個層次以上的理性的相互知識,我們
27、便可斷定,第一個節(jié)點之后的節(jié)點是不可能達到的。在上述博弈中也不例外。正如我們在上一節(jié)所述且將要在§5.11證明的,在所有具有唯一子博弈完美均衡的完美信息有限擴展式博弈中,博弈中理性的共同知識可以成立的那些節(jié)點,必與逆向歸納的博弈路徑相依相伴。當前這個例子中,只有兩個這樣的節(jié)點,根節(jié)點和第一個終點節(jié)點。5.9無限的囚徒困境如何進行圖表,原書p112無編號在重復(fù)有限次的階段性博弈中,假定貝葉斯理性(§1.5),避免逆向歸納,并運用決策論來確定參與人行為,這些做法是合理的。例如,考慮囚犯困境(§2.10),其階段性博弈如右所示,贏利滿足T>R>P>S,
28、博弈重復(fù)進行,直到有人背叛或玩滿100輪即結(jié)束。逆向歸納法意味著,兩位參與人都將在第一輪就背叛,的確,這是博弈唯一的納什均衡。但是,第一個參與人可能會暗想,“如果我的對手和我都選擇D,我們都只能獲得P。我愿意合作至少95輪,如果我的對手是個聰明人,他也將愿意合作多輪。我估計我的對手也會這樣推理。這樣我們就會堅持賺到95輪。如果我錯估了對手,我僅僅損失S-P,看來冒險一試是值得的;因為要是我沒錯估對手,我就可以撈到大把錢回家。更正式地,假定我的推測是,我的對手將合作到第k輪然后以概率gk背叛。那么,我應(yīng)選擇在第m輪背叛以最大化下式m=i=1m-1i-1R+Sgi+m-1R+Pgm+m-1R+T1
29、-Gm (5.3)113這里,Gm=g1+gm。上式中第一項表示對手率先背叛時我得到的贏利,第二項表示大家同時背叛時我的贏利,最后一項是我先背叛時我的贏利。對于所有合理的概率分布,在很多情況下,最大化上式表明應(yīng)合作許多輪。例如,假定gk均勻分布于m=1,99輪。具體而言,不妨假設(shè)T,R,P,S=(4,2,1,0)。那么,運用方程(5.3)可以檢驗,合作到98輪是一個最優(yōu)反應(yīng)。的確,假定你預(yù)料對手在第1輪以0.95的概率背叛否則在第2至第99輪以同等的概率背叛,則背叛的最優(yōu)時機仍是第98輪。顯然,逆向歸納假設(shè)并不合理,除非你深信你的對手極可能是一個死硬堅持逆向歸納的人。接下來我心中暗想“我的對手
30、也能像我一樣展開上述推理,所以他會至少合作到第98輪。因而,我應(yīng)該令m=97。但是,我的對手當然也知道這一點,所以他肯定會在第96輪背叛,這種情況下毫無疑問我應(yīng)該在第95輪背叛?!蓖评淼睦Ь吵霈F(xiàn)了。這種自相矛盾的推理表明,我們設(shè)置問題的方式存在某些失誤。如果gk分布是合理的,那我就該運用它。運用這種分布去證明它是不可運用的錯誤分布,乃是自相矛盾的。而理性的對手也深知這一點,所以我猜他會重返第一層次的分析,即是說合作至少會持續(xù)到第95輪。從而,我們兩個理性的愚公在博弈中將合作很多輪,而不是照納什均衡行事。然而,我和對手關(guān)于對方何時背叛具有相同的貝葉斯先驗信念(§1.5),假定這是共同知
31、識。有時也稱此為Harsanyi一致性(Harsanyi 1967)。那么很顯然,我們都將在一開始就背叛,因為逆向歸納結(jié)論嚴格源于貝葉斯推理:兼容于共同先驗信念之共同知識的唯一的先驗信念就是在第一輪即背叛。然而,本例中我們沒有合情合理的理由去假定Harsanyi一致性。上述論證強化了我們的結(jié)論:CKR沒什么神圣不可侵犯。經(jīng)典博弈理論家主張,理性要求參與人運用逆向歸納法,但情況并非如此。如果兩個參與人是理性的,且都知道對方是理性的,而且每個人也都知道對方的推測,那么他們將按照唯一的納什均衡采取行動(§8.4)。114但正如我們所見,我們或許能彼此合理斷定:我們對他人的推測確實一無所知,
32、但我們所知道的足夠進行許多輪的合作。5.10知識的形式邏輯就參與人何以取得主觀先驗信念而言,決策理論中的Savage模型乃是不可知論。人們?nèi)绾芜M行博弈,取決于他們對其他參與人的信念抱有怎樣的信念,包括他們對其他參與人對他們的信念所抱有的信念,如此等等。為了分析應(yīng)對這種情況,我們提出一個正式模型,去說明一個人“知道”有關(guān)世界的事實意味著什么?自然狀態(tài)由一個有限的可能世界的總體構(gòu)成,其子集稱為事件。當E時事件E發(fā)生。當Alice處于狀態(tài),她只知道她屬于多個狀態(tài)的一個子集PA;即,PA是實際狀態(tài)為時Alice所認為的可能狀態(tài)集合。若PA,我們就說Alice在狀態(tài)知道事件E,因為對于Alice知道可能
33、的每一個狀態(tài)',有'E。給定可能性算子P,我們用KE=|PE定義出相應(yīng)的知識算子K。請注意,KE是一個事件,包括如下所有狀態(tài):在這些狀態(tài)中個體知道事件E。容易驗證,知識滿足如下性質(zhì):(K1) K= 全知性(K2a) KEF=KEKF(K2b) EFKEKE(K3) KEE 知識(K4) KE=KKE 透明性(K5) 否定內(nèi)省性其中“”意思是“非”,即邏輯否定。請注意,K2a蘊含著K2b。要看清這一點,不妨假定K2a和EF。則有,KE=KEF=KEKF,故KEKE,K2b得證。性質(zhì)K3,通常被稱為知識公理,意即所知必為真(若抽走這一原理,我們就得到信念模型而不是知識模型),可以直
34、接由P1推導(dǎo)出來。性質(zhì)K4,即透明性公理,說的是若你知道某事,則你自己知道你知道某事。性質(zhì)K5說的是,若你不知道某事,則你知道你不知道某事。這并不是太直觀的表述,但它使得我們可以合乎句法地規(guī)定知識算子的性質(zhì),而無需考慮它關(guān)于可能世界和可能性算子P的語義學(xué)解釋。115我們證明,經(jīng)由PE=EP,把算子P的定義從狀態(tài)擴展到事件,K5就可從P1和P2中推導(dǎo)出,從而,對于任一事件E,且,在這個意義上,知識和可能性算子是二元的。先看第一層,再看第二層,假定。我們須證明PE。如果這不成立,則,這意味著,而這兩者卻是矛盾的。要證明K5,可將其寫成PKEKE,假定PKE。則PKE,故KE。上述證明可以顛倒過來證
35、明等式。正如我們在§4.1所見,我們可以從個人的知識算子K中,重新獲得其可能性算子P,因為P=E|KE (5.4)要驗證上式,請注意=KE,則PE,故式(5.4)左邊包含于右邊。此外,若'不屬于右邊,則對于某些KE的E,'E,故PE,故'P。從而,式(5.4)的右邊包含于左邊。若行動主體在每個狀態(tài)E都知道E,我們稱事件E對該主體是不證自明的。因而,當KE=E,即對于每個E有PE時,E完全是不證自明的。很明顯,自身是不證自明的,而且,若E和F是不證自明的,則EF就是不證自明的。從而,對于每個種狀態(tài),P是包含的極小的不證自明事件。每一個不證自明的事件,都是極小不證
36、自明事件的并集。極小不證自明事件與分劃P的單元保持一致。5.11逆向歸納法與擴展式的CKR在本節(jié),我們將說明一點點形式邏輯何以可澄清有關(guān)理性行為和選擇的大問題。我們以逆向歸納法為例,展示Aumann(1995)的證明:在一般的完美信息擴展式博弈中,只有在那些位于逆向歸納路徑中的博弈樹節(jié)點上,理性的共同知識才有可能成立。考慮一個有限的完美信息一般擴展式認知博弈G(對于每個參與人,在博弈的終點的贏利兩兩不等,該博弈就是“一般”的)。116純策略組合s在每一個非終點節(jié)點v指派一個行動sv。的確,若si是參與人i的純策略組合,若i在節(jié)點v上行動,則sv=siv。我們以b表示唯一的逆向歸納法策略組合。因
37、此,若參與人i在節(jié)點v行動,則ivb>iv(b/av) 對于 avbv (5.5)其中iv(s)是策略組合s下參與人i從節(jié)點v開始(甚至是從博弈開始,即便v不能達到)的贏利;而s/tv表示在節(jié)點v做出選擇的參與人的策略組合s,在節(jié)點v以行動t代替了行動siv。為了在上述框架中詳細闡釋貝葉斯理性,不妨假設(shè)參與人在狀態(tài)選擇純策略組合s()。那么,對于由i做出選擇的每一個節(jié)點v,以及對于每個純策略tiSi,若我們有 (5.6)則我們就說i是貝葉斯理性的;即,i不知道在節(jié)點v存在比si()更好的策略。理性的共同知識,我們記為CKR,指的是對于所有的參與人i,Ri是共同知識。請注意,這一定義某種程
38、度上弱于貝葉斯理性,后者要求參與人對于事件有主觀先驗信念并在這些先驗信念約束下最大化其效用。令I(lǐng)v 為在節(jié)點v選擇bv這一事件。則Iv=|sv=bv (5.7)故選擇了逆向歸納這一事件I可簡單表示為I=vIv理性的共同知識蘊含著逆向歸納法這一說法,就可以簡單地表達為:定理5.1 CKRI證明:我們首先證明,在每一個終點節(jié)點v,CKRIv。我們有117第一行是令ti=bi從式(5.6)推出的。第二行從如下事實推出:v是i進行選擇的一個終點節(jié)點,故ivb=_iv(s/bi)且ivs=iv(b/si)。 由于i在v點進行選擇,Iv是i的知識分劃單元的并集,故Iv對于i是不證自明的,因為Iv=KiIv
39、。于是我們有。通過否定內(nèi)生性質(zhì)(K5),這意味著。上述論證證明,與CKR相容的每一種狀態(tài)中,參與人必須在每個終點節(jié)點展開逆向歸納行動。請注意,上述論證無需對第五章所謂的“逆向歸納謬誤”負責(zé),因為上述論證確實沒有假定參與人使用逆向歸納法所不能達到的終點節(jié)點會被達到。事實上,上述論證沒有做出關(guān)于某些節(jié)點會被達到或不會被達到的任何假定。證明的其余部分通過數(shù)學(xué)歸納法進行。在參與人i進行選擇的節(jié)點v,假設(shè)對于v之后所有的節(jié)點,有CKRIw。則我們可記為CKRKiI>v=w>vKiIw,其中w>v表示博弈樹中節(jié)點v之后的節(jié)點w。令ti=bi,通過式(5.6),于是我們有:現(xiàn)在iv(s)只
40、取決于sv和s>v,即s對v之后的節(jié)點的約束。于是我們記其中第一層包含關(guān)系源于如下事實:對于I>v,有iv(s/bi)= iv(b/sv)。因而,這里,對最終包含關(guān)系的論證如前文一樣。上述定理并未宣稱理性的參與人始終選擇子博弈完美均衡。相反,它表明,若參與人行動導(dǎo)向了非逆向歸納路徑上的某個節(jié)點,則在該節(jié)點及博弈樹中任何后續(xù)的節(jié)點上,理性的共同知識將無法獲得。參與人這種做法也沒什么不理性,因為就理性主體在博弈中如何行動,他的想法有可能基于CKR之外的考慮。另一種說法是,CKR乃是一個事件,而并非前提(§4.14)。在某些情況下CKR成立,但這并非因為CKR意味著結(jié)局,而是結(jié)
41、局意味著CKR。1185.12 理性與擴展式CKR經(jīng)典博弈論主張,僅有唯一子博弈完美均衡的完美信息擴展式博弈中,理性參與人必選擇這一均衡。但在1987年至1993年間,幾篇頗有影響的論文對此提出了質(zhì)疑。在許多博弈理論家看來,Aumann(1995)為傳統(tǒng)智慧所作的辯護,也只是對上述批評徒勞無功和蒼白乏力的回應(yīng)。針對Aumann的分析,關(guān)鍵的批評由Binmore(1996)陳述如下:使得理性參與人保守在均衡路徑的是,他對于自己偏離均衡的后果之考量。然而,假若他背離均衡路徑,他就是在非理性地行動。其他的參與人在謀劃其對背離均衡行為的反應(yīng)時若不把這一非理性跡象納入考慮,那也就太蠢了。Aumann堅持認為,倘若博弈樹中偏離逆向歸納路徑的節(jié)點被達到,他的論斷對于參與人將如何行動并不會說明什么。但是,對于偏離逆向歸納路徑會有什么后果說明不了什么,那么顯而易見,對于保守在逆向歸納路徑的理性也就說明不了什么。(p.135)同樣,BenPorath(1997)斷言:Aumann假定,在每一個節(jié)點x,存在這樣的共同知識:參與人將會在x點開始的子博弈中理性地行動。甚至,對于在最初存在的CKR下不能達到的節(jié)點x,也
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河壩防護施工合同范本
- 房屋租賃合同(可編輯)
- 項目部施工員工作總結(jié)
- 2023年云南單獨招生考試數(shù)學(xué)真題試卷
- 2018年釀酒技術(shù)單招考試樣卷(空白卷)
- 預(yù)防手術(shù)患者深靜脈血栓
- 備考2025年成人學(xué)位英語模擬測試題及答案解析3
- 洛陽職業(yè)技術(shù)學(xué)院《康復(fù)生理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年北京市第156中學(xué)高三歷史試題下學(xué)期第一次聯(lián)考試題含解析
- 江西省上饒市玉山一中等六校中學(xué)2025屆高考語文試題仿真卷:語文試題試卷(5)含解析
- 小班安全《咬人的縫隙》
- 產(chǎn)品試產(chǎn)評審確認表
- 2017年高考語文全國卷Ⅰ古代詩歌閱讀歐陽修《禮部貢院閱進士就試》試題分析
- (完整版)大學(xué)物理緒論
- 水電站運行規(guī)程與設(shè)備管理
- 分泌性中耳炎急慢性中耳炎
- 大學(xué)《獸醫(yī)臨床診斷學(xué)》期末復(fù)習(xí)要點、作業(yè)、習(xí)題庫及期末考試試題解析
- 外貿(mào)出口商業(yè)發(fā)票(CI)模板
- 2023年遼寧專升本統(tǒng)考《計算機應(yīng)用基礎(chǔ)》高頻核心題庫300題(含答案)
- 煤礦建設(shè)安全規(guī)范
- 風(fēng)險管理與保險智慧樹知到答案章節(jié)測試2023年上海財經(jīng)大學(xué)
評論
0/150
提交評論