游戲人工智能開(kāi)發(fā)決策之6種方法

上傳人：9*** IP屬地：湖北上傳時(shí)間：2021-11-04 格式：DOCX 頁(yè)數(shù)：14 大?。?49.33KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩9頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、游戲人工智能開(kāi)發(fā)之6種決策方法人工智能遵循著：感知->思考->行動(dòng)決策方法：有限狀態(tài)機(jī)（Finite-State Machines），分層狀態(tài)機(jī)（Hierarchical Finite-State Machines），行為樹（Behavior Trees），效用系統(tǒng)（Utility Systems），目標(biāo)導(dǎo)向型行動(dòng)計(jì)劃（Goal-Oriented Action Planners），分層任務(wù)網(wǎng)絡(luò)（Hierarchical Task Networks）一、有限狀態(tài)機(jī)有限狀態(tài)機(jī)是目前游戲AI中最常見(jiàn)的行為模型。狀態(tài)機(jī)的代碼簡(jiǎn)單又快速，使用上強(qiáng)大、靈活、計(jì)算開(kāi)銷小。狀

2、態(tài)機(jī)的一個(gè)好處是可以可視化，如下圖所示：圖中有四個(gè)狀態(tài)：巡邏(patrol)，查看(investigate)，攻擊(attack)，逃走(flee)，我們把實(shí)心圓當(dāng)做初始狀態(tài)。簡(jiǎn)要過(guò)程：假設(shè)NPC士兵正在保衛(wèi)他的陣地，當(dāng)前狀態(tài)為巡邏，當(dāng)他聽(tīng)到什么動(dòng)靜時(shí)就會(huì)轉(zhuǎn)到查看狀態(tài)，跑到聲音源去查看，如果看到敵人就轉(zhuǎn)到攻擊狀態(tài)，如果沒(méi)看到過(guò)一段時(shí)間又會(huì)回到巡邏狀態(tài)。在攻擊狀態(tài)中如果血值低下就會(huì)進(jìn)入逃跑狀態(tài)。如果擊敗了敵人，又會(huì)回到巡邏狀態(tài)。狀態(tài)機(jī)狀態(tài)類的一個(gè)主要結(jié)構(gòu)如下，onEnter函數(shù)就相當(dāng)于unity中的Start()函數(shù)，在類開(kāi)始時(shí)調(diào)用，作為對(duì)舊狀態(tài)的過(guò)度和新?tīng)顟B(tài)產(chǎn)生的開(kāi)始，比如當(dāng)從巡邏轉(zhuǎn)向攻擊狀態(tài)

3、時(shí)，可以在攻擊狀態(tài)的開(kāi)始讓NPC大喊“發(fā)現(xiàn)敵人！進(jìn)攻！”等等。onUpdate()就相當(dāng)于unity中的Update(),你可以讓它每幀都執(zhí)行，或者幾秒鐘執(zhí)行一次，是循環(huán)執(zhí)行的，每次執(zhí)行時(shí)間間隔由你來(lái)決定。onExit()就是在退出一個(gè)狀態(tài)之前要執(zhí)行的，比如，殺死敵人之后由攻擊狀態(tài)轉(zhuǎn)向巡邏狀態(tài)之前，讓NPC做一個(gè)歡呼手勢(shì)并大叫勝利了。FSMTransition列表為將要轉(zhuǎn)到的所有可能的狀態(tài)。1. class FSMState2. 3. virtual void onEnter();4. virtual void onUpdate();5.

4、60; virtual void onExit();6. list<FSMTransition> transitions;7. ;每個(gè)狀態(tài)還存儲(chǔ)著FSMTransition的類，代表能從當(dāng)前狀態(tài)可以轉(zhuǎn)到的狀態(tài)1. class FSMTransition2. 3. virtual bool isValid();4. virtual FSMState* getNextState();5. virtual void onTransition();6. 當(dāng)轉(zhuǎn)換條件滿足時(shí)isValid(

5、)返回true，比如當(dāng)發(fā)現(xiàn)敵人NPC就從巡邏狀態(tài)轉(zhuǎn)到攻擊，getNextState()返回將要轉(zhuǎn)到的狀態(tài)，onTransition()是狀態(tài)之間轉(zhuǎn)換的過(guò)渡，和上面說(shuō)的onEnter()差不多。最后是有限狀態(tài)機(jī)類FiniteStateMachine1. class FiniteStateMachine2. 3. void update();4. list<FSMState> states;5. FSMState* initialState;6. FSMState* activeState;

6、7. 有限狀態(tài)機(jī)類包含一個(gè)包含所有狀態(tài)的列表states，initialState為初始狀態(tài)，activeState為當(dāng)前狀態(tài)。偽代碼如下：1. 在 activeState.transtitions中循環(huán)調(diào)用isValid()，檢測(cè)是否符合達(dá)到下一狀態(tài)的條件2. 如果符合轉(zhuǎn)換條件3. 調(diào)用activeState.on Exit()，退出當(dāng)前狀態(tài)4. 設(shè)置activeState 為 validTransition.getNextState()，把當(dāng)前狀態(tài)賦值為下一狀態(tài)5. 調(diào)用activeState.onEnter()，下一狀態(tài)的開(kāi)始6. 如果不符合轉(zhuǎn)換條件，調(diào)用activ

7、eState.onUpdate()，讓NPC執(zhí)行當(dāng)前狀態(tài)需要做的事在編寫有限狀態(tài)機(jī)的代碼只前最好畫一個(gè)上面的草圖，這樣既可以明確轉(zhuǎn)換關(guān)系，又可以不漏掉該有的狀態(tài)。二、分層有限狀態(tài)機(jī)有限狀態(tài)機(jī)雖然好，但是它有很大的缺點(diǎn)，當(dāng)狀態(tài)少的時(shí)候可以運(yùn)用自如，當(dāng)狀態(tài)多的時(shí)候10個(gè)以上就已經(jīng)結(jié)構(gòu)非常復(fù)雜，而且容易出錯(cuò)。如果我們讓NPC巡邏兩個(gè)地方，比如安全的室內(nèi)，和門口。如果我們想在一個(gè)狀態(tài)上附加一些狀況，例如當(dāng)NPC在巡邏時(shí)，讓他接一個(gè)電話然后再恢復(fù)巡邏，此時(shí)如果使用有限狀態(tài)機(jī)的話我們必須要新建一個(gè)打電話的狀態(tài)來(lái)做過(guò)渡，但是此時(shí)的巡邏有兩個(gè)，所以能接到電話的狀態(tài)也有兩個(gè)，然后加了兩個(gè)相同的狀態(tài)，很多這樣的重

8、復(fù)的小狀態(tài)使得狀態(tài)機(jī)越來(lái)越復(fù)雜。如下圖：這時(shí)，我們可以用分層有限狀態(tài)機(jī)來(lái)解決這個(gè)問(wèn)題，把多個(gè)狀態(tài)機(jī)歸為一層，如下圖，把巡邏安全處和門口歸為看守建筑，這樣我們只需要有一個(gè)打電話狀態(tài)就可以了。分層有限狀態(tài)機(jī)增加了一個(gè)滯后，在有限狀態(tài)機(jī)中并沒(méi)有，在一個(gè)普通的有限狀態(tài)機(jī)中，是從初始狀態(tài)開(kāi)始的，在分層有限狀態(tài)機(jī)中是一個(gè)嵌套的狀態(tài)。注意上圖有H的圈，代表歷史狀態(tài)（history state），當(dāng)我們第一次進(jìn)入嵌套狀態(tài)->看守建筑時(shí)，歷史狀態(tài)H表示為初始狀態(tài)，之后歷史狀態(tài)H表示為最近處在的一個(gè)狀態(tài)。在我們的例子中：初始狀態(tài)就是看守建筑，然后進(jìn)入看到手機(jī)按住這個(gè)嵌套，巡邏安全處是初始狀態(tài)。當(dāng)從巡邏安全處

9、轉(zhuǎn)換到巡邏門口這個(gè)狀態(tài)時(shí)，H歷史狀態(tài)就轉(zhuǎn)變?yōu)檠策夐T口狀態(tài)，此時(shí)來(lái)電話了，轉(zhuǎn)換到接電話狀態(tài)，接電話結(jié)束，我們回到嵌套狀態(tài)中的歷史狀態(tài)，此時(shí)為巡邏門口，可見(jiàn)H歷史狀態(tài)就是一個(gè)臨時(shí)的，便于嵌套外的狀態(tài)返回到之前的嵌套內(nèi)的小狀態(tài)，以不至于出錯(cuò)，或者換回了別的狀態(tài)，如果接完電話回到巡邏安全處，那就出大錯(cuò)了。分層有限狀態(tài)機(jī)，就這樣避免了重復(fù)狀態(tài)，可以實(shí)現(xiàn)更大的更復(fù)雜的狀態(tài)。實(shí)例：Halo2使用了這一技術(shù)，如下圖：可見(jiàn)：把使用手雷、掩蔽、防御歸為自衛(wèi)，交戰(zhàn)部分使用了多層嵌套，但是原理是一樣的，向尸體設(shè)計(jì)和搜查尸體歸為戰(zhàn)后處理。在撤退和閑置部分只有一個(gè)行為被嵌套，但是日后可以繼續(xù)添加行為，可擴(kuò)展性良好。至于如

10、何在嵌套的層里對(duì)行為進(jìn)行選擇，可以就按這個(gè)順序執(zhí)行，也可以加上權(quán)重優(yōu)先級(jí)，或者你想讓他執(zhí)行哪個(gè)通過(guò)代碼來(lái)控制。三、行為樹行為樹是樹型結(jié)構(gòu)的，每個(gè)節(jié)點(diǎn)都代表了一個(gè)行為，每個(gè)行為都可以有子行為。所有行為都有一個(gè)先決條件，就是產(chǎn)生的這些行為的條件。整個(gè)算法先從樹的根部開(kāi)始，然后開(kāi)始檢查每一個(gè)先決條件。樹的每一層只可以執(zhí)行一個(gè)行為，所以當(dāng)一個(gè)行為正在執(zhí)行，它的兄弟節(jié)點(diǎn)都不會(huì)被檢查，但是它們的子節(jié)點(diǎn)還是要檢查的。相反如果一個(gè)行為的先決條件當(dāng)前并不滿足，則跳過(guò)判斷它的子節(jié)點(diǎn)，繼續(xù)判斷它的兄弟節(jié)點(diǎn)。一個(gè)樹全部檢查完畢之后，決定執(zhí)行優(yōu)先級(jí)最大的，然后再依次執(zhí)行每個(gè)動(dòng)作。1. 使根節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn)2. 當(dāng)存在當(dāng)前

11、節(jié)點(diǎn)3. 判斷當(dāng)前節(jié)點(diǎn)的先決條件4. 如果先決條件返回true5. 把節(jié)點(diǎn)加到執(zhí)行清單6. 使子節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn)7. 否則8. 使兄弟節(jié)點(diǎn)為當(dāng)前節(jié)點(diǎn)9. 執(zhí)行執(zhí)行清單上的所有行為不同于狀態(tài)機(jī)，行為樹是無(wú)狀態(tài)的，不需要記下之前執(zhí)行的行為，只是判斷行為該不該執(zhí)行。行為樹的節(jié)點(diǎn)之間是不相關(guān)的，刪除或增加節(jié)點(diǎn)，對(duì)其他節(jié)點(diǎn)都無(wú)影響。所以，可擴(kuò)展性也是行為樹的一個(gè)優(yōu)勢(shì)。另外還可以為決策樹添加靈活性與隨機(jī)性，父節(jié)點(diǎn)可以隨機(jī)決定是否檢查子節(jié)點(diǎn)。缺點(diǎn)：決策樹做的選擇并不一定是最優(yōu)的，結(jié)果也不一定是我們想要的。而且決策每次都要從根部往下判斷選擇行為節(jié)點(diǎn)，比狀態(tài)機(jī)要耗費(fèi)時(shí)間。每次決策都要經(jīng)過(guò)大量的條件判斷語(yǔ)句，會(huì)變

12、得非常慢。另外還有一個(gè)問(wèn)題，例如：一個(gè)農(nóng)民要收割作物，敵人出現(xiàn)了，農(nóng)民逃跑，逃出了距離敵人的一定范圍之后，又回去收割作物，走到敵人的范圍又逃出，這樣來(lái)回往復(fù)，是一個(gè)弊端，可以根據(jù)情況來(lái)寫代碼避免，否則會(huì)被玩家*的。四、效用系統(tǒng)人工智能的邏輯->電腦的邏輯，是基于簡(jiǎn)單的bool問(wèn)題，比如：“我能看到敵人嗎？”，“我有彈藥嗎”，是簡(jiǎn)單的是或者不是的問(wèn)題，所以做出的行為通常是極端化的，一個(gè)單一的行動(dòng)。比如：1. if (CanSeeEnemy()2. 3. AttackEnemy();4. 5. if (OutOfAmmo()6. 7. Relo

13、ad();8. 9. 即時(shí)有多條件的行為，bool判斷帶來(lái)的也是一個(gè)單一的行動(dòng)。10. if (OutOfAmmo() && CanSeeEnemy()11. 12. Hide();13. 所以有些情況，只是做這些布爾判斷是不合適的，會(huì)遺漏很多情況，判斷也不妥當(dāng)。比如：我們可能需要同時(shí)考慮與敵人的距離、有多少?gòu)椝?、饑餓程度、HP值，等等。這些判斷條件能映射出許多動(dòng)作，比我們單一的判斷做不做這個(gè)動(dòng)作要好很多。utility-based system，基于效用的系統(tǒng)，會(huì)根據(jù)權(quán)重、比率、隊(duì)列和許多需要考慮的事項(xiàng)來(lái)做出最優(yōu)選擇，使AI比普通的行為樹更有頭腦。根據(jù)

14、上面的例子，使用效用系統(tǒng)我們的AI可以做出我們想要的動(dòng)作，并根據(jù)當(dāng)前情況做出不同強(qiáng)度的動(dòng)作，使AI真實(shí)、更具可能性，也不再是只有一個(gè)正確的選擇了。決策樹就是對(duì)AI說(shuō)，“只是你將要做的一個(gè)行為”，效用系統(tǒng)就是對(duì)AI說(shuō)：“這些是你可能要做的行為”Sims模擬人生的人工智能就是使用的效用系統(tǒng)（sims的人工智能讓我膜拜至今），在sims中，小人結(jié)合當(dāng)前環(huán)境和自身的狀態(tài)，來(lái)做出行動(dòng)的選擇。例如：小人“非常餓”結(jié)合環(huán)境“沒(méi)有食物”會(huì)比只有“有一點(diǎn)餓”更加吸引人的眼球。如果“有一點(diǎn)餓”小人會(huì)以接近“美食”為第一執(zhí)行行為。注意，這里的“美食（的美味程度）”、“食物很少（食物儲(chǔ)備程度）”、“一點(diǎn)餓（餓的程度）

15、”，都是一個(gè)有范圍的數(shù)值（常用的是0-1的浮點(diǎn)值）。當(dāng)需要選擇新的行為時(shí)，我們通過(guò)分?jǐn)?shù)（上面說(shuō)的各種程度）來(lái)選擇相對(duì)最優(yōu)的選擇，或者加上一個(gè)隨機(jī)值再選擇，使得接近優(yōu)選的幾個(gè)選擇都有一定幾率（幾率可根據(jù)所加隨機(jī)值決定）被選中。五、目標(biāo)導(dǎo)向型行動(dòng)計(jì)劃GOAP來(lái)源于STRIPS方法，這兩種都是讓AI創(chuàng)造他們自己的方法去解決問(wèn)題，我們提供給它一系列可能的動(dòng)作作為對(duì)這個(gè)世界的描述，和每個(gè)動(dòng)作使用的先決條件，和行動(dòng)帶來(lái)的影響。AI擁有一個(gè)初始狀態(tài)和他需要達(dá)到的目標(biāo)。有一組目標(biāo)，AI可以通過(guò)優(yōu)先級(jí)或當(dāng)前狀態(tài)選擇一個(gè)。計(jì)劃系統(tǒng)決定一個(gè)動(dòng)作序列來(lái)滿足當(dāng)前目標(biāo)，計(jì)劃出一個(gè)像路徑一樣的能最簡(jiǎn)單達(dá)到目標(biāo)狀態(tài)的動(dòng)作序列

16、。GOAP是一個(gè)反向鏈接搜索，從要實(shí)現(xiàn)的目標(biāo)開(kāi)始，找到什么動(dòng)作能實(shí)現(xiàn)目標(biāo)，在尋找剛才動(dòng)作的先決條件，一直往前推，知道達(dá)到你的當(dāng)前（初始）狀態(tài)。這種反向鏈接搜索替代了啟發(fā)式的前向鏈接搜索。偽代碼：1. 把目標(biāo)加到未解決事件列表2. 對(duì)于每個(gè)為解決事件（for）3. 移除這個(gè)為解決事件4. 找到達(dá)成事件的動(dòng)作5. 如果動(dòng)作的先決條件已經(jīng)滿足6. 增加動(dòng)作到計(jì)劃中7. 往回推需要達(dá)到先決條件的動(dòng)作到計(jì)劃中8. 否則9. 添加該先決條件到未解決時(shí)間中例如：我們建立一個(gè)NPC士兵，把它的目標(biāo)設(shè)為殺死其他敵人，我們?cè)O(shè)置它的目標(biāo)為Target.Dead。為了讓目標(biāo)去死，NPC必須要有一個(gè)武器用來(lái)射擊，這是一

17、個(gè)先決條件，但是現(xiàn)在NPC并沒(méi)有正在裝備的武器，NPC就需要執(zhí)行找到武器這個(gè)動(dòng)作，如果NPC有武器庫(kù)，他就會(huì)從武器庫(kù)中拿一個(gè)，如果病沒(méi)有武器庫(kù)，就需要尋路去找一個(gè)武器裝備了。得到武器裝備之后就要找到敵人，實(shí)現(xiàn)方式多種多樣，徒步尋找、或者NPC周圍有車也可以開(kāi)著車去尋找。我么發(fā)現(xiàn)，我們給NPC大量的動(dòng)作選擇，讓NPC自己決定該做什么，因而產(chǎn)生動(dòng)態(tài)不可預(yù)知又有趣的行為，而且表現(xiàn)得很自然，比開(kāi)發(fā)者創(chuàng)建行為好多了。六、分層任務(wù)網(wǎng)絡(luò)HTN也是尋找一個(gè)計(jì)劃來(lái)讓AI執(zhí)行，不同之處在于怎樣找出這個(gè)計(jì)劃。開(kāi)始擁有一個(gè)初始狀態(tài)和一個(gè)跟任務(wù)代表我們需要解決的問(wèn)題。原理是最高級(jí)的任務(wù)分解成更小的任務(wù)再繼續(xù)分解直到我們

18、解決問(wèn)題。每個(gè)高級(jí)任務(wù)都有很多方式被完成，當(dāng)前世界狀態(tài)決定高級(jí)任務(wù)要分解成哪組小任務(wù)。HTN與GOAP相反，HTN是前向鏈接搜索，是從當(dāng)前狀態(tài)一直推到目標(biāo)狀態(tài)，向前推直到問(wèn)題解決。世界狀態(tài)分散成幾種屬性，它的HP、精力，敵人的HP、相距距離，計(jì)劃根據(jù)這些來(lái)制定。我們有兩種任務(wù)：原始任務(wù)和復(fù)合任務(wù)。原始任務(wù)是可以只解決問(wèn)題的任務(wù)，也就是可以直接達(dá)到目標(biāo)的任務(wù)。在游戲中，它可以為開(kāi)火、裝填子彈、移動(dòng)到掩蔽物。這些人物可以影響世界狀態(tài)，開(kāi)火這個(gè)任務(wù)需要先有子彈，并執(zhí)行裝填子彈這個(gè)任務(wù)。復(fù)合任務(wù)是高級(jí)別的任務(wù)，可以看作方法。一個(gè)方法是一組任務(wù)可以完成復(fù)合任務(wù)，這一組任務(wù)是由先決條件決定的。復(fù)合任務(wù)讓HTN推斷出世界并且決定該做什么動(dòng)作。使用復(fù)合任務(wù)，我們就能構(gòu)建一個(gè)HTN域，這個(gè)域是一大層任務(wù)，

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

游戲人工智能開(kāi)發(fā)決策之6種方法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

游戲人工智能開(kāi)發(fā)決策之6種方法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔