人工智能博弈樹的搜索(45張)課件_第1頁
人工智能博弈樹的搜索(45張)課件_第2頁
人工智能博弈樹的搜索(45張)課件_第3頁
人工智能博弈樹的搜索(45張)課件_第4頁
人工智能博弈樹的搜索(45張)課件_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2.3博弈樹搜索第1頁,共46頁。20世紀(jì)60年代,研制出的西洋跳棋和國際象棋的博弈程序達(dá)到了大師級(jí)的水平。1958約翰麥卡錫提出博弈樹搜索算法1997年,IBM公司研制的“深藍(lán)”國際象棋 程序,采用博弈樹搜索算法,該程序戰(zhàn)勝了國際象棋世界冠軍卡斯帕羅夫。1.概述第2頁,共46頁。正在與深藍(lán)下棋的卡斯帕羅夫第3頁,共46頁。博弈問題特點(diǎn):雙人對(duì)弈,輪流走步。信息完備,雙方所得到的信息是一樣的。零和,即對(duì)一方有利的棋,對(duì)另一方肯定是不利的,不存在對(duì)雙方均有利或無利的棋。1.概述第4頁,共46頁。博弈的特性兩個(gè)棋手交替地走棋 ;比賽的最終結(jié)果,是贏、輸和平局中的一種;可用圖搜索技術(shù)進(jìn)行,但效率很低

2、;博弈的過程,是尋找置對(duì)手于必?cái)B(tài)的過程;雙方都無法干預(yù)對(duì)方的選擇。1.概述第5頁,共46頁。2.Grundy 博弈下棋的雙方是對(duì)立的,命名博弈的雙方,一方為“正方”,這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);另一方為“反方”,這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。正方和反方是交替走步的,因此MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。第6頁,共46頁。2.Grundy 博弈Grundy博弈是一個(gè)分錢幣的游戲。有 一堆數(shù)目為N的錢幣,由兩位選手輪流進(jìn)行分堆,要求每個(gè)選手每次只把其中某一堆分成數(shù)目不等的兩小堆。例如,選手甲把N分成兩堆后,輪到選手乙就可以挑其中一堆來分,如此進(jìn)行下去,直到有一位選手先無法把錢幣再分成不相等的兩堆時(shí)

3、就得認(rèn)輸。第7頁,共46頁。2.Grundy 博弈設(shè)初始狀態(tài)為(7,MIN),建立問題的狀態(tài)空間圖,圖中所有終結(jié)點(diǎn)均表示該選手必輸?shù)那闆r,取勝方的目標(biāo)是設(shè)法使棋局發(fā)展為結(jié)束在對(duì)方走步時(shí)的終結(jié)點(diǎn)上。第8頁,共46頁。MIN先走M(jìn)AX必勝2.Grundy 博弈第9頁,共46頁。結(jié)點(diǎn)A是MAX的搜索目標(biāo),而結(jié)點(diǎn)B,C則為MIN的搜索目標(biāo)。2.Grundy 博弈第10頁,共46頁。搜索策略要考慮的問題是:對(duì)MIN走步后的每一個(gè)MAX結(jié)點(diǎn),必須證明MAX對(duì)MIN可能走的每一個(gè)棋局對(duì)弈后能獲勝,即MAX必須考慮應(yīng)付MIN的所有招法,這是一個(gè)與的含意,因此含有MAX符號(hào)的結(jié)點(diǎn)可看成與結(jié)點(diǎn)。 2.Grundy

4、 博弈第11頁,共46頁。對(duì)MAX走步后的每一個(gè)MIN結(jié)點(diǎn),只須證明MAX有一步能走贏就可以,即MAX只要考慮能走出一步棋使MIN無法招架就成,因此含有MIN符號(hào)的結(jié)點(diǎn)可看成或結(jié)點(diǎn)。2.Grundy 博弈第12頁,共46頁。對(duì)弈過程的搜索圖呈現(xiàn)出與或圖表示的形式。實(shí)現(xiàn)一種取勝的策略就是搜索一個(gè)解圖的問題,解圖就代表一種完整的博弈策略。 2.Grundy 博弈第13頁,共46頁。中國象棋一盤棋平均走50步,總狀態(tài)數(shù)約為10的161次方。假設(shè)1毫微秒走一步,約需10的145次方年。結(jié)論:不可能窮舉。3.極小極大搜索過程第14頁,共46頁。對(duì)各個(gè)局面進(jìn)行評(píng)估評(píng)估的目的:對(duì)后面的狀態(tài)提前進(jìn)行考慮,并且

5、以各種狀態(tài)的評(píng)估值為基礎(chǔ)作出最好的走棋選擇。 評(píng)估的方法:用評(píng)價(jià)函數(shù)對(duì)棋局進(jìn)行評(píng)估。贏的評(píng)估值設(shè)為+,輸?shù)脑u(píng)估值設(shè)為-,平局的評(píng)估值設(shè)為0。 評(píng)估的標(biāo)準(zhǔn):由于下棋的雙方是對(duì)立的,只能選擇其中一方為評(píng)估的標(biāo)準(zhǔn)方。3.極小極大搜索過程第15頁,共46頁。MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)命名博弈的雙方,一方為“正方”,對(duì)每個(gè)狀態(tài)的評(píng)估都是對(duì)應(yīng)于該方的輸贏的。例如,贏2個(gè),輸1個(gè)等,都是指正方的。正方每走一步,都在選擇使自己贏得更多的節(jié)點(diǎn),因此這類節(jié)點(diǎn)稱為“MAX”節(jié)點(diǎn);3.極小極大搜索過程第16頁,共46頁。另一方為“反方”,對(duì)每個(gè)狀態(tài)的評(píng)估都是對(duì)應(yīng)于對(duì)手的輸贏的。例如,贏2個(gè),輸一個(gè),其實(shí)是指自己輸2個(gè),贏

6、1個(gè)的。反方每走一步,都在選擇使對(duì)手輸?shù)酶嗟墓?jié)點(diǎn),因此這類節(jié)點(diǎn)稱為“MIN”節(jié)點(diǎn)。3.極小極大搜索過程第17頁,共46頁。由于正方和反方是交替走步的,因此MAX節(jié)點(diǎn)和MIN節(jié)點(diǎn)會(huì)交替出現(xiàn)。3.極小極大搜索過程第18頁,共46頁。正方(MAX節(jié)點(diǎn))從所有子節(jié)點(diǎn)中,選取具有最大評(píng)估值的節(jié)點(diǎn)。反方(MIN節(jié)點(diǎn))從其所有子節(jié)點(diǎn)中,選取具有最小評(píng)估值的節(jié)點(diǎn)。反復(fù)進(jìn)行這種選取,就可以得到雙方各個(gè)節(jié)點(diǎn)的評(píng)估值。這種確定棋步的方法,稱為極小極大搜索法。 3.極小極大搜索過程第19頁,共46頁。3.極小極大搜索過程第20頁,共46頁。5-333-3022-30-23541-30689-3MINMAX0MAXM

7、IN3.極小極大搜索過程第21頁,共46頁。015-333-3022-30-23541-30689-30-33-3-3-21-36-3031601MAXMINMAXMIN3.極小極大搜索過程第22頁,共46頁。 在九宮格棋盤上,兩位選手輪流在棋盤上擺各自的 棋子(每次一枚),誰先取得三線的結(jié)果就取勝。 設(shè)程序方MAX的棋子用()表示, MAX先走。 對(duì)手MIN的棋子用(o)表示。 例如:3.極小極大搜索過程MIN取勝第23頁,共46頁。 估計(jì)函數(shù) f(p)=(所有空格都放上MAX的棋子之后,MAX的三子成線數(shù))(所有空格都放上MIN的棋子之后,MIN的三子成線的總數(shù)) 若P是MAX獲勝的格局,

8、則f(p)=+ ; 若P是MIN獲勝的格局,則f(p)- 。3.極小極大搜索過程第24頁,共46頁。3.極小極大搜索過程估計(jì)函數(shù)值 f(p)=6-4=2估計(jì)函數(shù) f(p)=(所有空格都放上MAX的棋子之后,MAX的三子成線(行、列、對(duì)角)數(shù))(所有空格都放上MIN的棋子之后,MIN的三子成線(行、列、對(duì)角)的總數(shù))當(dāng)前棋局f(p)=2第25頁,共46頁。3.極小極大搜索過程一字棋第一階段搜索樹第26頁,共46頁。3.極小極大搜索過程一字棋第二階段搜索樹第27頁,共46頁。3.極小極大搜索過程一字棋第三階段搜索樹第28頁,共46頁。 設(shè)有一個(gè)擺放三個(gè)子的棋盤殘局,如下圖所示,和在結(jié)束前有三步棋可

9、以走,而且設(shè)走第一步的是 。這時(shí)存在著三個(gè)空格A,B,C,用博弈樹搜索算法判斷應(yīng)該把棋子放到哪一格內(nèi)。 ABC棋盤殘局舉例:3.極小極大搜索過程第29頁,共46頁。ABCBCCB0ACCAABBA-1-0-10-0MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)3.極小極大搜索過程第30頁,共46頁。 對(duì)于棋盤殘局中的來說,最好的選擇,是將放在C的位置上,這時(shí)可以導(dǎo)致平局局面。 3.極小極大搜索過程第31頁,共46頁。-剪支法的引入 在極小極大法中,必須求出所有終端節(jié)點(diǎn)的評(píng)估值,當(dāng)預(yù)先考慮的棋步比較多時(shí),計(jì)算量會(huì)大大增加。為了提高搜索的效率,引入了通過對(duì)評(píng)估值的上下限進(jìn)行估計(jì),從而減少需進(jìn)行評(píng)估的節(jié)點(diǎn)范圍的-剪支

10、法。4. -搜索過程第32頁,共46頁。 作為正方出現(xiàn)的MAX節(jié)點(diǎn),假設(shè)它的MIN子節(jié)點(diǎn)有N個(gè),那么當(dāng)它的第一個(gè)MIN子節(jié)點(diǎn)的評(píng)估值為時(shí),則對(duì)于其它的子節(jié)點(diǎn),如果有高過的,就取那最高的值作為該MAX節(jié)點(diǎn)的評(píng)估值;如果沒有,則該MAX節(jié)點(diǎn)的評(píng)估值為。 總之,該MAX節(jié)點(diǎn)的評(píng)估值不會(huì)低于,這個(gè)就稱為該MAX節(jié)點(diǎn)的評(píng)估下限值。4. -搜索過程 MAX節(jié)點(diǎn)的評(píng)估下限值 第33頁,共46頁。 MIN節(jié)點(diǎn)的評(píng)估上限值 作為反方出現(xiàn)的MIN節(jié)點(diǎn),假設(shè)它的MAX子節(jié)點(diǎn)有N個(gè),那么當(dāng)它的第一個(gè)MAX子節(jié)點(diǎn)的評(píng)估值為時(shí),則對(duì)于其它子節(jié)點(diǎn),如果有低于的,就取那個(gè)低于的值作為該MIN節(jié)點(diǎn)的評(píng)估值;如果沒有,則該MIN

11、節(jié)點(diǎn)的評(píng)估值取。 總之,該MIN節(jié)點(diǎn)的評(píng)估值不會(huì)高過,這個(gè)就稱為該MIN節(jié)點(diǎn)的評(píng)估上限值。4. -搜索過程第34頁,共46頁。剪支法 MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)=剪支ABCD4. -搜索過程 設(shè)MAX節(jié)點(diǎn)的下限為,則其所有的MIN子節(jié)點(diǎn)中,其評(píng)估值的上限小于等于的節(jié)點(diǎn),其以下部分的搜索都可以停止了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。第35頁,共46頁。 設(shè)MIN節(jié)點(diǎn)的上限為,則其所有的MAX子節(jié)點(diǎn)中,其評(píng)估值的下限大于等于的節(jié)點(diǎn),其以下部分的搜索都可以停止了,即對(duì)這部分節(jié)點(diǎn)進(jìn)行了剪支。MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)=剪支ABCD4. -搜索過程剪支法 第36頁,共46頁。A B CDEFG H I J K L N O

12、 M4. -搜索過程MAX節(jié)點(diǎn)MAX節(jié)點(diǎn)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)35652164第37頁,共46頁。MAX節(jié)點(diǎn)(5,)35652164(6,)(2,)(-,5)(-,2)(5,)MIN節(jié)點(diǎn)終端節(jié)點(diǎn)剪支剪支A B CDEFG H I J K L N O MMAX節(jié)點(diǎn)4. -搜索過程第38頁,共46頁。一字棋第一階段-剪支方法4. -搜索過程第39頁,共46頁。4. -搜索過程極大節(jié)點(diǎn)的下界為。極小節(jié)點(diǎn)的上界為。剪支的條件:后輩節(jié)點(diǎn)的值祖先節(jié)點(diǎn)的值時(shí), 剪支后輩節(jié)點(diǎn)的 值祖先節(jié)點(diǎn)的值時(shí), 剪支簡記為:極小極大, 剪支極大極小, 剪支第40頁,共46頁。4. -搜索過程86-31453-3503-3022

13、-30-2309-300-303305411-31661abcdefghijkmnMAXMINMAXMIN第41頁,共46頁。改進(jìn)方法 使用-剪支技術(shù),當(dāng)不滿足剪支條件(即)時(shí)或值比值大不了多少或極相近時(shí),這時(shí)也可以進(jìn)行剪支,以便有條件把搜索集中到會(huì)帶來更大效果的其他路徑上,這就是中止對(duì)效益不大的一些子樹的搜索,以提高搜索效率。 4. -搜索過程第42頁,共46頁。 不嚴(yán)格限制搜索的深度。當(dāng)?shù)竭_(dá)深度限制時(shí),如出現(xiàn)博弈格局有可能發(fā)生較大變化時(shí),則應(yīng)多搜索幾層,使格局進(jìn)入較穩(wěn)定狀態(tài)后再中止,這樣可使倒推值計(jì)算的結(jié)果比較合理,避免考慮不充分產(chǎn)生的影響,這是等候狀態(tài)平穩(wěn)后中止搜索的方法。 4. -搜索

14、過程第43頁,共46頁。當(dāng)算法給出所選的走步后,不要馬上停止搜索,而是在原先估計(jì)可能的路徑上再往前搜索幾步,再次檢驗(yàn)會(huì)不會(huì)出現(xiàn)意外,這是一種增添輔助搜索的方法。 4. -搜索過程第44頁,共46頁。對(duì)某些博弈的開局階段和殘局階段,往往總結(jié)了一些固定的對(duì)弈模式,因此可以利用這些知識(shí)編好走步表,以便在開局和結(jié)局時(shí)使用查表法。只是在進(jìn)入中盤階段后,再調(diào)用其他有效的搜索算法,來選擇最優(yōu)的走步。4. -搜索過程第45頁,共46頁。1、不是井里沒有水,而是你挖的不夠深。不是成功來得慢,而是你努力的不夠多。2、孤單一人的時(shí)間使自己變得優(yōu)秀,給來的人一個(gè)驚喜,也給自己一個(gè)好的交代。3、命運(yùn)給你一個(gè)比別人低的起

15、點(diǎn)是想告訴你,讓你用你的一生去奮斗出一個(gè)絕地反擊的故事,所以有什么理由不努力!4、心中沒有過分的貪求,自然苦就少??诶锊徽f多余的話,自然禍就少。腹內(nèi)的食物能減少,自然病就少。思緒中沒有過分欲,自然憂就少。大悲是無淚的,同樣大悟無言。緣來盡量要惜,緣盡就放。人生本來就空,對(duì)人家笑笑,對(duì)自己笑笑,笑著看天下,看日出日落,花謝花開,豈不自在,哪里來的塵埃!5、心情就像衣服,臟了就拿去洗洗,曬曬,陽光自然就會(huì)蔓延開來。陽光那么好,何必自尋煩惱,過好每一個(gè)當(dāng)下,一萬個(gè)美麗的未來抵不過一個(gè)溫暖的現(xiàn)在。6、無論你正遭遇著什么,你都要從落魄中站起來重振旗鼓,要繼續(xù)保持熱忱,要繼續(xù)保持微笑,就像從未受傷過一樣。

16、7、生命的美麗,永遠(yuǎn)展現(xiàn)在她的進(jìn)取之中;就像大樹的美麗,是展現(xiàn)在它負(fù)勢(shì)向上高聳入云的蓬勃生機(jī)中;像雄鷹的美麗,是展現(xiàn)在它搏風(fēng)擊雨如蒼天之魂的翱翔中;像江河的美麗,是展現(xiàn)在它波濤洶涌一瀉千里的奔流中。8、有些事,不可避免地發(fā)生,陰晴圓缺皆有規(guī)律,我們只能坦然地接受;有些事,只要你愿意努力,矢志不渝地付出,就能慢慢改變它的軌跡。9、與其埋怨世界,不如改變自己。管好自己的心,做好自己的事,比什么都強(qiáng)。人生無完美,曲折亦風(fēng)景。別把失去看得過重,放棄是另一種擁有;不要經(jīng)常艷羨他人,人做到了,心悟到了,相信屬于你的風(fēng)景就在下一個(gè)拐彎處。10、有些事想開了,你就會(huì)明白,在世上,你就是你,你痛痛你自己,你累累

17、你自己,就算有人同情你,那又怎樣,最后收拾殘局的還是要靠你自己。11、人生的某些障礙,你是逃不掉的。與其費(fèi)盡周折繞過去,不如勇敢地攀登,或許這會(huì)鑄就你人生的高點(diǎn)。12、有些壓力總是得自己扛過去,說出來就成了充滿負(fù)能量的抱怨。尋求安慰也無濟(jì)于事,還徒增了別人的煩惱。13、認(rèn)識(shí)到我們的所見所聞都是假象,認(rèn)識(shí)到此生都是虛幻,我們才能真正認(rèn)識(shí)到佛法的真相。錢多了會(huì)壓死你,你承受得了嗎?帶,帶不走,放,放不下。時(shí)時(shí)刻刻發(fā)悲心,饒益眾生為他人。14、夢(mèng)想總是跑在我的前面。努力追尋它們,為了那一瞬間的同步,這就是動(dòng)人的生命奇跡。15、懶惰不會(huì)讓你一下子跌倒,但會(huì)在不知不覺中減少你的收獲;勤奮也不會(huì)讓你一夜成功,但會(huì)在不知不覺中積累你的成果。人生需

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論