人工智能-博弈樹的搜索_第1頁(yè)
人工智能-博弈樹的搜索_第2頁(yè)
人工智能-博弈樹的搜索_第3頁(yè)
人工智能-博弈樹的搜索_第4頁(yè)
人工智能-博弈樹的搜索_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

?●○

?●○

?●○

?●○●

?○●

?○●

?○●

?○2.3博弈樹搜索人工智能-博弈樹的搜索第1頁(yè)20世紀(jì)60年代,研制出西洋跳棋和國(guó)際象棋博弈程序到達(dá)了大師級(jí)水平。1958約翰?麥卡錫提出博弈樹搜索算法1997年,IBM企業(yè)研制“深藍(lán)”國(guó)際象棋程序,采取博弈樹搜索算法,該程序戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫。1.概述人工智能-博弈樹的搜索第2頁(yè)正在與深藍(lán)下棋卡斯帕羅夫人工智能-博弈樹的搜索第3頁(yè)博弈問(wèn)題特點(diǎn):雙人對(duì)弈,輪番走步。信息完備,雙方所得到信息是一樣。零和,即對(duì)一方有利棋,對(duì)另一方必定是不利,不存在對(duì)雙方都有利或無(wú)利棋。1.概述人工智能-博弈樹的搜索第4頁(yè)博弈特征兩個(gè)棋手交替地走棋;比賽最終止果,是贏、輸和平局中一個(gè);可用圖搜索技術(shù)進(jìn)行,但效率很低;博弈過(guò)程,是尋找置對(duì)手于必?cái)B(tài)過(guò)程;雙方都無(wú)法干預(yù)對(duì)方選擇。1.概述人工智能-博弈樹的搜索第5頁(yè)2.Grundy博弈下棋雙方是對(duì)立,命名博弈雙方,一方為“正方”,這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);另一方為“反方”,這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。正方和反方是交替走步,所以MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。人工智能-博弈樹的搜索第6頁(yè)2.Grundy博弈Grundy博弈是一個(gè)分錢幣游戲。有一堆數(shù)目為N錢幣,由兩位選手輪番進(jìn)行分堆,要求每個(gè)選手每次只把其中某一堆分成數(shù)目不等兩小堆。比如,選手甲把N分成兩堆后,輪到選手乙就能夠挑其中一堆來(lái)分,如此進(jìn)行下去,直到有一位選手先無(wú)法把錢幣再分成不相等兩堆時(shí)就得認(rèn)輸。人工智能-博弈樹的搜索第7頁(yè)2.Grundy博弈設(shè)初始狀態(tài)為(7,MIN),建立問(wèn)題狀態(tài)空間圖,圖中全部終止點(diǎn)均表示該選手必輸情況,取勝方目標(biāo)是設(shè)法使棋局發(fā)展為結(jié)束在對(duì)方走步時(shí)終止點(diǎn)上。人工智能-博弈樹的搜索第8頁(yè)MIN先走M(jìn)AX必勝2.Grundy博弈人工智能-博弈樹的搜索第9頁(yè)結(jié)點(diǎn)A是MAX搜索目標(biāo),而結(jié)點(diǎn)B,C則為MIN搜索目標(biāo)。2.Grundy博弈人工智能-博弈樹的搜索第10頁(yè)搜索策略要考慮問(wèn)題是:對(duì)MIN走步后每一個(gè)MAX結(jié)點(diǎn),必須證實(shí)MAX對(duì)MIN可能走每一個(gè)棋局對(duì)弈后能獲勝,即MAX必須考慮應(yīng)付MIN全部招法,這是一個(gè)與含意,所以含有MAX符號(hào)結(jié)點(diǎn)可看成與結(jié)點(diǎn)。

2.Grundy博弈人工智能-博弈樹的搜索第11頁(yè)對(duì)MAX走步后每一個(gè)MIN結(jié)點(diǎn),只須證實(shí)MAX有一步能走贏就能夠,即MAX只要考慮能走出一步棋使MIN無(wú)法招架就成,所以含有MIN符號(hào)結(jié)點(diǎn)可看成或結(jié)點(diǎn)。2.Grundy博弈人工智能-博弈樹的搜索第12頁(yè)對(duì)弈過(guò)程搜索圖展現(xiàn)出與或圖表示形式。實(shí)現(xiàn)一個(gè)取勝策略就是搜索一個(gè)解圖問(wèn)題,解圖就代表一個(gè)完整博弈策略。2.Grundy博弈人工智能-博弈樹的搜索第13頁(yè)中國(guó)象棋一盤棋平均走50步,總狀態(tài)數(shù)約為10161次方。假設(shè)1毫微秒走一步,約需10145次方年。結(jié)論:不可能窮舉。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第14頁(yè)對(duì)各個(gè)局面進(jìn)行評(píng)定評(píng)定目標(biāo):對(duì)后面狀態(tài)提前進(jìn)行考慮,而且以各種狀態(tài)評(píng)定值為基礎(chǔ)作出最好走棋選擇。評(píng)定方法:用評(píng)價(jià)函數(shù)對(duì)棋局進(jìn)行評(píng)定。贏評(píng)定值設(shè)為+∞,輸評(píng)定值設(shè)為-∞,平局評(píng)定值設(shè)為0。評(píng)定標(biāo)準(zhǔn):因?yàn)橄缕咫p方是對(duì)立,只能選擇其中一方為評(píng)定標(biāo)準(zhǔn)方。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第15頁(yè)MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)命名博弈雙方,一方為“正方”,對(duì)每個(gè)狀態(tài)評(píng)定都是對(duì)應(yīng)于該方輸贏。比如,贏2個(gè),輸1個(gè)等,都是指正方。正方每走一步,都在選擇使自己贏得更多節(jié)點(diǎn),所以這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第16頁(yè)另一方為“反方”,對(duì)每個(gè)狀態(tài)評(píng)定都是對(duì)應(yīng)于對(duì)手輸贏。比如,贏2個(gè),輸一個(gè),其實(shí)是指自己輸2個(gè),贏1個(gè)。反方每走一步,都在選擇使對(duì)手輸?shù)酶喙?jié)點(diǎn),所以這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第17頁(yè)因?yàn)檎胶头捶绞墙惶孀卟?,所以MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第18頁(yè)正方(MAX節(jié)點(diǎn))從全部子節(jié)點(diǎn)中,選取含有最大評(píng)定值節(jié)點(diǎn)。反方(MIN節(jié)點(diǎn))從其全部子節(jié)點(diǎn)中,選取含有最小評(píng)定值節(jié)點(diǎn)。重復(fù)進(jìn)行這種選取,就能夠得到雙方各個(gè)節(jié)點(diǎn)評(píng)定值。這種確定棋步方法,稱為極小極大搜索法。

3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第19頁(yè)3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第20頁(yè)5-333-3022-30-23541-30689-3MINMAX0MAXMIN3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第21頁(yè)015-333-3022-30-23541-30689-30-33-3-3-21-36-3031601MAXMINMAXMIN3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第22頁(yè)

在九宮格棋盤上,兩位選手輪番在棋盤上擺各自棋子(每次一枚),誰(shuí)先取得三線結(jié)果就取勝。設(shè)程序方MAX棋子用(×)表示,MAX先走。對(duì)手MIN棋子用(o)表示。比如:3.極小極大搜索過(guò)程MIN取勝人工智能-博弈樹的搜索第23頁(yè)

預(yù)計(jì)函數(shù)f(p)=(全部空格都放上MAX棋子之后,MAX三子成線數(shù))-(全部空格都放上MIN棋子之后,MIN三子成線總數(shù))

若P是MAX獲勝格局,則f(p)=+∞;若P是MIN獲勝格局,則f(p)=-∞。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第24頁(yè)3.極小極大搜索過(guò)程預(yù)計(jì)函數(shù)值f(p)=6-4=2預(yù)計(jì)函數(shù)f(p)=(全部空格都放上MAX棋子之后,MAX三子成線(行、列、對(duì)角)數(shù))-(全部空格都放上MIN棋子之后,MIN三子成線(行、列、對(duì)角)總數(shù))當(dāng)前棋局f(p)=2人工智能-博弈樹的搜索第25頁(yè)3.極小極大搜索過(guò)程一字棋第一階段搜索樹人工智能-博弈樹的搜索第26頁(yè)3.極小極大搜索過(guò)程一字棋第二階段搜索樹人工智能-博弈樹的搜索第27頁(yè)3.極小極大搜索過(guò)程一字棋第三階段搜索樹人工智能-博弈樹的搜索第28頁(yè)

設(shè)有一個(gè)擺放三個(gè)子棋盤殘局,以下列圖所表示,〇和╳在結(jié)束前有三步棋能夠走,而且設(shè)走第一步是╳。這時(shí)存在著三個(gè)空格A,B,C,用博弈樹搜索算法判斷應(yīng)該把棋子放到哪一格內(nèi)。

AB╳╳╳〇〇C〇棋盤殘局舉例:3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第29頁(yè)AB╳╳╳〇〇C〇╳B╳╳╳〇〇C〇╳〇╳╳╳〇〇C〇╳B╳╳╳〇〇〇〇0A╳╳╳╳〇〇C〇〇╳╳╳╳〇〇C〇A╳╳╳╳〇〇〇〇AB╳╳╳〇〇╳〇〇B╳╳╳〇〇╳〇A〇╳╳╳〇〇╳〇-1-

0-

10-

-

0MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第30頁(yè)

對(duì)于棋盤殘局中╳來(lái)說(shuō),最好選擇,是將╳放在C位置上,這時(shí)能夠造成平局局面。

3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第31頁(yè)-剪支法引入在極小極大法中,必須求出全部終端節(jié)點(diǎn)評(píng)定值,當(dāng)預(yù)先考慮棋步比較多時(shí),計(jì)算量會(huì)大大增加。為了提升搜索效率,引入了經(jīng)過(guò)對(duì)評(píng)定值上下限進(jìn)行預(yù)計(jì),從而降低需進(jìn)行評(píng)定節(jié)點(diǎn)范圍

-剪支法。4.-搜索過(guò)程人工智能-博弈樹的搜索第32頁(yè)

作為正方出現(xiàn)MAX節(jié)點(diǎn),假設(shè)它MIN子節(jié)點(diǎn)有N個(gè),那么當(dāng)它第一個(gè)MIN子節(jié)點(diǎn)評(píng)定值為時(shí),則對(duì)于其它子節(jié)點(diǎn),假如有高過(guò),就取那最高值作為該MAX節(jié)點(diǎn)評(píng)定值;假如沒(méi)有,則該MAX節(jié)點(diǎn)評(píng)定值為??傊揗AX節(jié)點(diǎn)評(píng)定值不會(huì)低于,這個(gè)就稱為該MAX節(jié)點(diǎn)評(píng)定下限值。4.-搜索過(guò)程

MAX節(jié)點(diǎn)評(píng)定下限值

人工智能-博弈樹的搜索第33頁(yè)MIN節(jié)點(diǎn)評(píng)定上限值

作為反方出現(xiàn)MIN節(jié)點(diǎn),假設(shè)它MAX子節(jié)點(diǎn)有N個(gè),那么當(dāng)它第一個(gè)MAX子節(jié)點(diǎn)評(píng)定值為時(shí),則對(duì)于其它子節(jié)點(diǎn),假如有低于,就取那個(gè)低于值作為該MIN節(jié)點(diǎn)評(píng)定值;假如沒(méi)有,則該MIN節(jié)點(diǎn)評(píng)定值取??傊?,該MIN節(jié)點(diǎn)評(píng)定值不會(huì)高過(guò),這個(gè)就稱為該MIN節(jié)點(diǎn)評(píng)定上限值。4.-搜索過(guò)程人工智能-博弈樹的搜索第34頁(yè)

剪支法

MAX節(jié)點(diǎn)

MIN節(jié)點(diǎn)=

剪支ABCD4.-搜索過(guò)程

設(shè)MAX節(jié)點(diǎn)下限為,則其全部MIN子節(jié)點(diǎn)中,其評(píng)定值上限小于等于節(jié)點(diǎn),其以下部分搜索都能夠停頓了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。人工智能-博弈樹的搜索第35頁(yè)

設(shè)MIN節(jié)點(diǎn)上限為,則其全部MAX子節(jié)點(diǎn)中,其評(píng)定值下限大于等于節(jié)點(diǎn),其以下部分搜索都能夠停頓了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。MAX節(jié)點(diǎn)

MIN節(jié)點(diǎn)=

剪支ABCD4.-搜索過(guò)程

剪支法

人工智能-博弈樹的搜索第36頁(yè)ABCDEFGHIJKLNOM4.-搜索過(guò)程MAX節(jié)點(diǎn)MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)35652164人工智能-博弈樹的搜索第37頁(yè)MAX節(jié)點(diǎn)(5,

)35652164(6,

)(2,

)(-,5)(-,2)(5,

)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)

剪支

剪支ABCDEFGHIJKLNOMMAX節(jié)點(diǎn)4.-搜索過(guò)程人工智能-博弈樹的搜索第38頁(yè)一字棋第一階段

-剪支方法4.-搜索過(guò)程人工智能-博弈樹的搜索第39頁(yè)4.-搜索過(guò)程極大節(jié)點(diǎn)下界為。極小節(jié)點(diǎn)上界為。剪支條件:后輩節(jié)點(diǎn)值≤祖先節(jié)點(diǎn)值時(shí),剪支后輩節(jié)點(diǎn)值≥祖先節(jié)點(diǎn)值時(shí),剪支簡(jiǎn)記為:極小≤極大,剪支極大≥極小,剪支人工智能-博弈樹的搜索第40頁(yè)4.-搜索過(guò)程86-31453-3503-3022-30-2309-300-303305411-31661abcdefghijkmnMAXMINMAXMIN人工智能-博弈樹的搜索第41頁(yè)改進(jìn)方法

使用

-剪支技術(shù),當(dāng)不滿足剪支條件(即

)時(shí)或

值比

值大不了多少或極相近時(shí),這時(shí)也能夠進(jìn)行剪支,方便有條件把搜索集中到會(huì)帶來(lái)更大效果其它路徑上,這就是中止對(duì)效益不大一些子樹搜索,以提升搜索效率。

4.-搜索過(guò)程人工智能-博弈樹的搜索第42頁(yè)

不嚴(yán)格限制搜索深度。當(dāng)?shù)诌_(dá)深度限制時(shí),如出現(xiàn)博弈格局有可能發(fā)生較大改變時(shí),則應(yīng)多搜索幾層,使格局進(jìn)入較穩(wěn)定狀態(tài)后再中止,這么可使倒推值計(jì)算結(jié)果比較合理,防止考慮不充分產(chǎn)生影響,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論