




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
?●○
?●○
?●○
?●○●
?○●
?○●
?○●
?○2.3博弈樹搜索人工智能-博弈樹的搜索第1頁(yè)20世紀(jì)60年代,研制出西洋跳棋和國(guó)際象棋博弈程序到達(dá)了大師級(jí)水平。1958約翰?麥卡錫提出博弈樹搜索算法1997年,IBM企業(yè)研制“深藍(lán)”國(guó)際象棋程序,采取博弈樹搜索算法,該程序戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫。1.概述人工智能-博弈樹的搜索第2頁(yè)正在與深藍(lán)下棋卡斯帕羅夫人工智能-博弈樹的搜索第3頁(yè)博弈問(wèn)題特點(diǎn):雙人對(duì)弈,輪番走步。信息完備,雙方所得到信息是一樣。零和,即對(duì)一方有利棋,對(duì)另一方必定是不利,不存在對(duì)雙方都有利或無(wú)利棋。1.概述人工智能-博弈樹的搜索第4頁(yè)博弈特征兩個(gè)棋手交替地走棋;比賽最終止果,是贏、輸和平局中一個(gè);可用圖搜索技術(shù)進(jìn)行,但效率很低;博弈過(guò)程,是尋找置對(duì)手于必?cái)B(tài)過(guò)程;雙方都無(wú)法干預(yù)對(duì)方選擇。1.概述人工智能-博弈樹的搜索第5頁(yè)2.Grundy博弈下棋雙方是對(duì)立,命名博弈雙方,一方為“正方”,這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);另一方為“反方”,這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。正方和反方是交替走步,所以MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。人工智能-博弈樹的搜索第6頁(yè)2.Grundy博弈Grundy博弈是一個(gè)分錢幣游戲。有一堆數(shù)目為N錢幣,由兩位選手輪番進(jìn)行分堆,要求每個(gè)選手每次只把其中某一堆分成數(shù)目不等兩小堆。比如,選手甲把N分成兩堆后,輪到選手乙就能夠挑其中一堆來(lái)分,如此進(jìn)行下去,直到有一位選手先無(wú)法把錢幣再分成不相等兩堆時(shí)就得認(rèn)輸。人工智能-博弈樹的搜索第7頁(yè)2.Grundy博弈設(shè)初始狀態(tài)為(7,MIN),建立問(wèn)題狀態(tài)空間圖,圖中全部終止點(diǎn)均表示該選手必輸情況,取勝方目標(biāo)是設(shè)法使棋局發(fā)展為結(jié)束在對(duì)方走步時(shí)終止點(diǎn)上。人工智能-博弈樹的搜索第8頁(yè)MIN先走M(jìn)AX必勝2.Grundy博弈人工智能-博弈樹的搜索第9頁(yè)結(jié)點(diǎn)A是MAX搜索目標(biāo),而結(jié)點(diǎn)B,C則為MIN搜索目標(biāo)。2.Grundy博弈人工智能-博弈樹的搜索第10頁(yè)搜索策略要考慮問(wèn)題是:對(duì)MIN走步后每一個(gè)MAX結(jié)點(diǎn),必須證實(shí)MAX對(duì)MIN可能走每一個(gè)棋局對(duì)弈后能獲勝,即MAX必須考慮應(yīng)付MIN全部招法,這是一個(gè)與含意,所以含有MAX符號(hào)結(jié)點(diǎn)可看成與結(jié)點(diǎn)。
2.Grundy博弈人工智能-博弈樹的搜索第11頁(yè)對(duì)MAX走步后每一個(gè)MIN結(jié)點(diǎn),只須證實(shí)MAX有一步能走贏就能夠,即MAX只要考慮能走出一步棋使MIN無(wú)法招架就成,所以含有MIN符號(hào)結(jié)點(diǎn)可看成或結(jié)點(diǎn)。2.Grundy博弈人工智能-博弈樹的搜索第12頁(yè)對(duì)弈過(guò)程搜索圖展現(xiàn)出與或圖表示形式。實(shí)現(xiàn)一個(gè)取勝策略就是搜索一個(gè)解圖問(wèn)題,解圖就代表一個(gè)完整博弈策略。2.Grundy博弈人工智能-博弈樹的搜索第13頁(yè)中國(guó)象棋一盤棋平均走50步,總狀態(tài)數(shù)約為10161次方。假設(shè)1毫微秒走一步,約需10145次方年。結(jié)論:不可能窮舉。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第14頁(yè)對(duì)各個(gè)局面進(jìn)行評(píng)定評(píng)定目標(biāo):對(duì)后面狀態(tài)提前進(jìn)行考慮,而且以各種狀態(tài)評(píng)定值為基礎(chǔ)作出最好走棋選擇。評(píng)定方法:用評(píng)價(jià)函數(shù)對(duì)棋局進(jìn)行評(píng)定。贏評(píng)定值設(shè)為+∞,輸評(píng)定值設(shè)為-∞,平局評(píng)定值設(shè)為0。評(píng)定標(biāo)準(zhǔn):因?yàn)橄缕咫p方是對(duì)立,只能選擇其中一方為評(píng)定標(biāo)準(zhǔn)方。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第15頁(yè)MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)命名博弈雙方,一方為“正方”,對(duì)每個(gè)狀態(tài)評(píng)定都是對(duì)應(yīng)于該方輸贏。比如,贏2個(gè),輸1個(gè)等,都是指正方。正方每走一步,都在選擇使自己贏得更多節(jié)點(diǎn),所以這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第16頁(yè)另一方為“反方”,對(duì)每個(gè)狀態(tài)評(píng)定都是對(duì)應(yīng)于對(duì)手輸贏。比如,贏2個(gè),輸一個(gè),其實(shí)是指自己輸2個(gè),贏1個(gè)。反方每走一步,都在選擇使對(duì)手輸?shù)酶喙?jié)點(diǎn),所以這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第17頁(yè)因?yàn)檎胶头捶绞墙惶孀卟?,所以MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第18頁(yè)正方(MAX節(jié)點(diǎn))從全部子節(jié)點(diǎn)中,選取含有最大評(píng)定值節(jié)點(diǎn)。反方(MIN節(jié)點(diǎn))從其全部子節(jié)點(diǎn)中,選取含有最小評(píng)定值節(jié)點(diǎn)。重復(fù)進(jìn)行這種選取,就能夠得到雙方各個(gè)節(jié)點(diǎn)評(píng)定值。這種確定棋步方法,稱為極小極大搜索法。
3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第19頁(yè)3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第20頁(yè)5-333-3022-30-23541-30689-3MINMAX0MAXMIN3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第21頁(yè)015-333-3022-30-23541-30689-30-33-3-3-21-36-3031601MAXMINMAXMIN3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第22頁(yè)
在九宮格棋盤上,兩位選手輪番在棋盤上擺各自棋子(每次一枚),誰(shuí)先取得三線結(jié)果就取勝。設(shè)程序方MAX棋子用(×)表示,MAX先走。對(duì)手MIN棋子用(o)表示。比如:3.極小極大搜索過(guò)程MIN取勝人工智能-博弈樹的搜索第23頁(yè)
預(yù)計(jì)函數(shù)f(p)=(全部空格都放上MAX棋子之后,MAX三子成線數(shù))-(全部空格都放上MIN棋子之后,MIN三子成線總數(shù))
若P是MAX獲勝格局,則f(p)=+∞;若P是MIN獲勝格局,則f(p)=-∞。3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第24頁(yè)3.極小極大搜索過(guò)程預(yù)計(jì)函數(shù)值f(p)=6-4=2預(yù)計(jì)函數(shù)f(p)=(全部空格都放上MAX棋子之后,MAX三子成線(行、列、對(duì)角)數(shù))-(全部空格都放上MIN棋子之后,MIN三子成線(行、列、對(duì)角)總數(shù))當(dāng)前棋局f(p)=2人工智能-博弈樹的搜索第25頁(yè)3.極小極大搜索過(guò)程一字棋第一階段搜索樹人工智能-博弈樹的搜索第26頁(yè)3.極小極大搜索過(guò)程一字棋第二階段搜索樹人工智能-博弈樹的搜索第27頁(yè)3.極小極大搜索過(guò)程一字棋第三階段搜索樹人工智能-博弈樹的搜索第28頁(yè)
設(shè)有一個(gè)擺放三個(gè)子棋盤殘局,以下列圖所表示,〇和╳在結(jié)束前有三步棋能夠走,而且設(shè)走第一步是╳。這時(shí)存在著三個(gè)空格A,B,C,用博弈樹搜索算法判斷應(yīng)該把棋子放到哪一格內(nèi)。
AB╳╳╳〇〇C〇棋盤殘局舉例:3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第29頁(yè)AB╳╳╳〇〇C〇╳B╳╳╳〇〇C〇╳〇╳╳╳〇〇C〇╳B╳╳╳〇〇〇〇0A╳╳╳╳〇〇C〇〇╳╳╳╳〇〇C〇A╳╳╳╳〇〇〇〇AB╳╳╳〇〇╳〇〇B╳╳╳〇〇╳〇A〇╳╳╳〇〇╳〇-1-
0-
10-
-
0MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第30頁(yè)
對(duì)于棋盤殘局中╳來(lái)說(shuō),最好選擇,是將╳放在C位置上,這時(shí)能夠造成平局局面。
3.極小極大搜索過(guò)程人工智能-博弈樹的搜索第31頁(yè)-剪支法引入在極小極大法中,必須求出全部終端節(jié)點(diǎn)評(píng)定值,當(dāng)預(yù)先考慮棋步比較多時(shí),計(jì)算量會(huì)大大增加。為了提升搜索效率,引入了經(jīng)過(guò)對(duì)評(píng)定值上下限進(jìn)行預(yù)計(jì),從而降低需進(jìn)行評(píng)定節(jié)點(diǎn)范圍
-剪支法。4.-搜索過(guò)程人工智能-博弈樹的搜索第32頁(yè)
作為正方出現(xiàn)MAX節(jié)點(diǎn),假設(shè)它MIN子節(jié)點(diǎn)有N個(gè),那么當(dāng)它第一個(gè)MIN子節(jié)點(diǎn)評(píng)定值為時(shí),則對(duì)于其它子節(jié)點(diǎn),假如有高過(guò),就取那最高值作為該MAX節(jié)點(diǎn)評(píng)定值;假如沒(méi)有,則該MAX節(jié)點(diǎn)評(píng)定值為??傊揗AX節(jié)點(diǎn)評(píng)定值不會(huì)低于,這個(gè)就稱為該MAX節(jié)點(diǎn)評(píng)定下限值。4.-搜索過(guò)程
MAX節(jié)點(diǎn)評(píng)定下限值
人工智能-博弈樹的搜索第33頁(yè)MIN節(jié)點(diǎn)評(píng)定上限值
作為反方出現(xiàn)MIN節(jié)點(diǎn),假設(shè)它MAX子節(jié)點(diǎn)有N個(gè),那么當(dāng)它第一個(gè)MAX子節(jié)點(diǎn)評(píng)定值為時(shí),則對(duì)于其它子節(jié)點(diǎn),假如有低于,就取那個(gè)低于值作為該MIN節(jié)點(diǎn)評(píng)定值;假如沒(méi)有,則該MIN節(jié)點(diǎn)評(píng)定值取??傊?,該MIN節(jié)點(diǎn)評(píng)定值不會(huì)高過(guò),這個(gè)就稱為該MIN節(jié)點(diǎn)評(píng)定上限值。4.-搜索過(guò)程人工智能-博弈樹的搜索第34頁(yè)
剪支法
MAX節(jié)點(diǎn)
MIN節(jié)點(diǎn)=
剪支ABCD4.-搜索過(guò)程
設(shè)MAX節(jié)點(diǎn)下限為,則其全部MIN子節(jié)點(diǎn)中,其評(píng)定值上限小于等于節(jié)點(diǎn),其以下部分搜索都能夠停頓了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。人工智能-博弈樹的搜索第35頁(yè)
設(shè)MIN節(jié)點(diǎn)上限為,則其全部MAX子節(jié)點(diǎn)中,其評(píng)定值下限大于等于節(jié)點(diǎn),其以下部分搜索都能夠停頓了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。MAX節(jié)點(diǎn)
MIN節(jié)點(diǎn)=
剪支ABCD4.-搜索過(guò)程
剪支法
人工智能-博弈樹的搜索第36頁(yè)ABCDEFGHIJKLNOM4.-搜索過(guò)程MAX節(jié)點(diǎn)MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)35652164人工智能-博弈樹的搜索第37頁(yè)MAX節(jié)點(diǎn)(5,
)35652164(6,
)(2,
)(-,5)(-,2)(5,
)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)
剪支
剪支ABCDEFGHIJKLNOMMAX節(jié)點(diǎn)4.-搜索過(guò)程人工智能-博弈樹的搜索第38頁(yè)一字棋第一階段
-剪支方法4.-搜索過(guò)程人工智能-博弈樹的搜索第39頁(yè)4.-搜索過(guò)程極大節(jié)點(diǎn)下界為。極小節(jié)點(diǎn)上界為。剪支條件:后輩節(jié)點(diǎn)值≤祖先節(jié)點(diǎn)值時(shí),剪支后輩節(jié)點(diǎn)值≥祖先節(jié)點(diǎn)值時(shí),剪支簡(jiǎn)記為:極小≤極大,剪支極大≥極小,剪支人工智能-博弈樹的搜索第40頁(yè)4.-搜索過(guò)程86-31453-3503-3022-30-2309-300-303305411-31661abcdefghijkmnMAXMINMAXMIN人工智能-博弈樹的搜索第41頁(yè)改進(jìn)方法
使用
-剪支技術(shù),當(dāng)不滿足剪支條件(即
)時(shí)或
值比
值大不了多少或極相近時(shí),這時(shí)也能夠進(jìn)行剪支,方便有條件把搜索集中到會(huì)帶來(lái)更大效果其它路徑上,這就是中止對(duì)效益不大一些子樹搜索,以提升搜索效率。
4.-搜索過(guò)程人工智能-博弈樹的搜索第42頁(yè)
不嚴(yán)格限制搜索深度。當(dāng)?shù)诌_(dá)深度限制時(shí),如出現(xiàn)博弈格局有可能發(fā)生較大改變時(shí),則應(yīng)多搜索幾層,使格局進(jìn)入較穩(wěn)定狀態(tài)后再中止,這么可使倒推值計(jì)算結(jié)果比較合理,防止考慮不充分產(chǎn)生影響,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 西安理工大學(xué)高科學(xué)院《生物醫(yī)學(xué)安全與法規(guī)》2023-2024學(xué)年第二學(xué)期期末試卷
- 廈門城市職業(yè)學(xué)院《護(hù)理倫理學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年去年語(yǔ)文會(huì)考試題及答案
- 2025年面試題排序分類及答案
- 2025年飛船太空考試試題及答案
- 2025年超聲科三基試題及答案
- 2025年貴州藥廠面試試題及答案
- 2025年集成電路省賽試題及答案
- 2025年安徽蚌埠中考英語(yǔ)試題及答案
- 2025年客運(yùn)培訓(xùn)考試題及答案
- 2024年單招考試題
- 人教版三年級(jí)下冊(cè)勞動(dòng)教育《清潔教室衛(wèi)生》
- DL∕T 802.8-2014 電力電纜用導(dǎo)管技術(shù)條件 第8部分:埋地用改性聚丙烯塑料單壁波紋電纜導(dǎo)管
- 反賄賂與反腐敗管理制度
- 2024屆北京市海淀區(qū)小學(xué)英語(yǔ)五年級(jí)第二學(xué)期期末質(zhì)量檢測(cè)試題含解析
- 鄉(xiāng)村振興相關(guān)知識(shí)備考試題庫(kù)(含答案)
- G -B- 43630-2023 塔式和機(jī)架式服務(wù)器能效限定值及能效等級(jí)(正式版)
- QC/T 1091-2023 客車空氣凈化裝置 (正式版)
- 2024年節(jié)水知識(shí)競(jìng)賽考試題及答案
- 《子路、曾皙、冉有、公西華侍坐》練習(xí)及參考答案
- 2024年江蘇醫(yī)藥職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)完整
評(píng)論
0/150
提交評(píng)論