計(jì)算機(jī)學(xué)院研究生《人工智能引論》課件_第1頁(yè)
計(jì)算機(jī)學(xué)院研究生《人工智能引論》課件_第2頁(yè)
計(jì)算機(jī)學(xué)院研究生《人工智能引論》課件_第3頁(yè)
計(jì)算機(jī)學(xué)院研究生《人工智能引論》課件_第4頁(yè)
計(jì)算機(jī)學(xué)院研究生《人工智能引論》課件_第5頁(yè)
已閱讀5頁(yè),還剩84頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、浙江大學(xué)計(jì)算機(jī)學(xué)院研究生人工智能引論課件第13講 智能Agent及多Agent系統(tǒng)Chapter 13 Intelligent Agent & Multi-Agent Systems徐從富浙江大學(xué)人工智能研究所2003年第一稿2005年10月修改補(bǔ)充2007年10月第二次修改1內(nèi)容概述2. 分布式問(wèn)題求解3. Agent4. Agent理論5. Agent結(jié)構(gòu)6. Agent通信7. Agent的協(xié)調(diào)與協(xié)作8. 多Agent環(huán)境MAGE9. 面向Agent的軟件技術(shù) Mobile Agent 若干前沿問(wèn)題討論213.1 概述 分布式人工智能(DAI)主要研究在邏輯上或物理上分散的智能系統(tǒng)如何并

2、行的、相互協(xié)作地實(shí)現(xiàn)問(wèn)題求解。 兩種解決問(wèn)題的方法:自頂向下:分布式問(wèn)題求解自底向上:基于Agent的方法3 DAI系統(tǒng)的特色系統(tǒng)中的數(shù)據(jù)、知識(shí), 以及控制不但在邏輯上, 而且在物理上是分布的, 既沒(méi)有全局控制, 也沒(méi)有全局的數(shù)據(jù)存儲(chǔ)。各個(gè)求解機(jī)構(gòu)由計(jì)算機(jī)網(wǎng)絡(luò)互連, 在問(wèn)題求解過(guò)程中, 通信代價(jià)要比求解問(wèn)題的代價(jià)低得多。系統(tǒng)中諸機(jī)構(gòu)能夠相互協(xié)作, 來(lái)求解單個(gè)機(jī)構(gòu)難以解決, 甚至不能解決的任務(wù)。4DAI系統(tǒng)的主要優(yōu)點(diǎn)提高問(wèn)題求解能力提高問(wèn)題求解效率擴(kuò)大應(yīng)用范圍降低軟件的復(fù)雜性513.2 分布式問(wèn)題求解特點(diǎn):數(shù)據(jù)、知識(shí)、控制均分布在系統(tǒng)的各節(jié)點(diǎn)上,既無(wú)全局控制,也無(wú)全局?jǐn)?shù)據(jù)和知識(shí)存儲(chǔ)。兩種協(xié)作方式

3、: 任務(wù)分擔(dān) 結(jié)果共享613.2.1 分布式問(wèn)題求解系統(tǒng)分類根據(jù)組織結(jié)構(gòu),分布式問(wèn)題求解系統(tǒng)可以分為三類: 層次結(jié)構(gòu)類 平行結(jié)構(gòu)類 混合結(jié)構(gòu)類713.2.2 分布式問(wèn)題求解過(guò)程分布式問(wèn)題求解過(guò)程可以分為四步: 任務(wù)分解 任務(wù)分配 子問(wèn)題求解 結(jié)果綜合8分布式問(wèn)題求解系統(tǒng)中協(xié)作的分類 按節(jié)點(diǎn)間協(xié)作量的多少,協(xié)作分為三類: 全協(xié)作系統(tǒng) 無(wú)協(xié)作系統(tǒng) 半?yún)f(xié)作系統(tǒng)常用的通信方式有: 共享全局存儲(chǔ)器 信息傳遞 黑板模型913.3 智能Agent及多Agent系統(tǒng) 多Agent系統(tǒng)主要研究在邏輯上或物理上分離的多個(gè)Agent協(xié)調(diào)其智能行為,即知識(shí)、目標(biāo)、意圖及規(guī)劃等,實(shí)現(xiàn)問(wèn)題求解??梢钥醋魇且环N由底向上設(shè)計(jì)

4、的系統(tǒng)。10Agent的思想智能Agent的幾個(gè)典型的實(shí)例:Microsoft的Office助手計(jì)算機(jī)病毒(破壞Agent)計(jì)算機(jī)游戲或模擬中的智能角色貿(mào)易和談判Agent(如Ebay的拍賣Agent)網(wǎng)絡(luò)蜘蛛Web Spider(搜索引擎中的數(shù)據(jù)搜集和索引Agent,如Google) 11Agent概念的出現(xiàn)面向過(guò)程的方法面向?qū)嶓w的方法面向?qū)ο蟮姆椒嫦駻gent的方法軟件開發(fā)方法的進(jìn)化12Agent的定義 在計(jì)算機(jī)和人工智能領(lǐng)域中,Agent可以看作是一個(gè)實(shí)體,它通過(guò)傳感器感知環(huán)境,通過(guò)效應(yīng)器作用于環(huán)境。13Agent的強(qiáng)定義 基于某種場(chǎng)景,并具有靈活、自主的行為能力,以滿足設(shè)計(jì)目標(biāo)的計(jì)算

5、機(jī)系統(tǒng)。14Agent的弱定義 滿足如下特征的基于硬件或(更經(jīng)常是)軟件的計(jì)算機(jī)系統(tǒng):自主性(Autonomy)社會(huì)性(Social ability)反應(yīng)性(Reactivity)主動(dòng)性(Pro-activeness)(或稱“前 瞻性”)基于場(chǎng)景性(Situatedness)靈活性(Flexibility)15移動(dòng)性(Mobility)理性(Rationality)此外,許多學(xué)者還提出一些其它特性:誠(chéng)實(shí)性(Veracity)友好性(Benevolence)長(zhǎng)壽性(或時(shí)間連貫性) 自適應(yīng)性(Adaptability) 16Agent的特性Agent弱概念:自治性、社會(huì)能力(可通信性)、反應(yīng)能力、

6、自發(fā)行為Agent強(qiáng)概念:知識(shí)、信念、意圖、承諾等心智狀態(tài)其它屬性:長(zhǎng)壽性、移動(dòng)性、推理能力、規(guī)劃能力、學(xué)習(xí)和適應(yīng)能力、誠(chéng)實(shí)、善意、理性1713.4 Agent理論 智能Agent的理論模型研究主要從邏輯、行為、心理、社會(huì)等角度出發(fā),對(duì)智能Agent的本質(zhì)進(jìn)行描述,為智能Agent系統(tǒng)創(chuàng)建奠定基礎(chǔ)。18可能世界模型(Possible Worlds Model) 地位:Agent理論基礎(chǔ)的開創(chuàng)性工作之一。思想:將Agent的知識(shí)、信念等特征化為一 系列“可能世界”,在可能世界模型中包括對(duì)象、屬性及其關(guān)系。優(yōu)點(diǎn):理論基礎(chǔ)(特別是模態(tài)邏輯)比較完善。缺點(diǎn):存在“邏輯萬(wàn)能”(Logical Omnis

7、cience)問(wèn)題。 19“意圖系統(tǒng)”(Intentional System) 作用:用于描述其行為可用信念、愿望等理性智慧來(lái)預(yù)測(cè)的實(shí)體。分為:一階和二階兩種形式。對(duì)象、屬性及其關(guān)系。20“意圖姿態(tài)”(Intentional Stance) 意義:?jiǎn)l(fā)AI學(xué)者將信念(Belief)、愿望(Desire)、承諾(Commitment)等人類特有的思想和概念應(yīng)用于Agent。 2113.4.1 理性Agent(BDI模型)思想:認(rèn)為Agent行為可由信念、愿望和意圖來(lái)表達(dá)作用:已成為經(jīng)典模型,并被廣泛采用Belief信念,Agent對(duì)環(huán)境的基本看法。Desire愿望,Agent想要實(shí)現(xiàn)的狀態(tài),即目

8、標(biāo)。Intention意圖,目標(biāo)的子集。2213.4.2 BDIAgent模型BDIAgent模型可以通過(guò)下列要素描述:一組關(guān)于世界的信念;Agent當(dāng)前打算達(dá)到的一組目標(biāo);一個(gè)規(guī)劃庫(kù),描述怎樣達(dá)到目標(biāo)和怎樣改變信念;一個(gè)意圖結(jié)構(gòu),描述Agent當(dāng)前怎樣達(dá)到它的目標(biāo)和改變信念。23BDI解釋器BDI-Interpreterinitialize-state();dooptions := option-generator(event-queue, B, G, I);selected-options := deliberate(options, B, G, I);update-intentions(

9、selected-options, I);execute(I);get-new-external-events();drop-successful-attitudes(B,G,I);drop-impossible-attitudes(B,G,I);until quit2413.4.3 RAO邏輯框架目標(biāo):以一種自然的方式描述多Agent系統(tǒng)中關(guān)于別的Agent的狀態(tài)的推理過(guò)程。系統(tǒng)的分類:由于多Agent系統(tǒng)太復(fù)雜,建立一種通用的推理模式的想法是不現(xiàn)實(shí)的,有必要對(duì)系統(tǒng)分類以便區(qū)別對(duì)待。常識(shí)的獲得:和單個(gè)Agent情形一樣,常識(shí)問(wèn)題是阻礙推理的大難題。2513.4.4 換位推理思想:模仿語(yǔ)言學(xué)中

10、的虛擬語(yǔ)氣,即為了對(duì)某個(gè)Agent在某種場(chǎng)景下的狀態(tài)或行為進(jìn)行推測(cè),設(shè)想自己處于那種場(chǎng)景時(shí)的狀態(tài)或行為,再把這種設(shè)想結(jié)果作為被猜測(cè)Agent的狀態(tài)或行為。作用:使得一Agent對(duì)其它Agent的狀態(tài)和行為的推理過(guò)程變得簡(jiǎn)單明了。 2613.4.5 動(dòng)作理論情景演算是描述動(dòng)作的主要的形式框架。 在情景演算中引入了狀態(tài)和動(dòng)作的概念,并利用兩條邏輯公理來(lái)描述動(dòng)作與狀態(tài)的關(guān)系。一條公理描述一個(gè)動(dòng)作在滿足什么條件的狀態(tài)之下可能發(fā)生,另外一條描述在一個(gè)狀態(tài)之下某個(gè)動(dòng)作發(fā)生以后當(dāng)前狀態(tài)如何改變。2713.4.6 “言語(yǔ)行為”理論(Speech Acts Theory) 地位:這是多Agent交互(通信)的重

11、要理論基礎(chǔ)之一。 思想:任何行為都可以等價(jià)地表示為言語(yǔ)行為(既任何行為的含義都可用言語(yǔ)來(lái)表達(dá)),甚至認(rèn)為所有的行為都是言語(yǔ)行為。作用:大大簡(jiǎn)化了Agent之間交互的復(fù)雜度。 28規(guī)劃庫(kù)的形式化表示環(huán)境狀態(tài):State = P1, P2, Pn 目標(biāo): Goal=動(dòng)作模板: Act_template = Agent能力: Ability= 2913.5 Agent結(jié)構(gòu)Agent結(jié)構(gòu)需要解決的問(wèn)題包括:Agent由那些模塊組成,模塊之間如何交互信息,Agent感知到的信息如何影響它的行為和內(nèi)部狀態(tài),如何將這些模塊用軟件或硬件的方式組合起來(lái)形成一個(gè)有機(jī)的整體。30Agent基本結(jié)構(gòu)環(huán)境Agent感知

12、作用黑箱軟件Agent31智能Agent的工作過(guò)程環(huán)境交互信息融合信息處理作用交互感知作用32Agent骨架程序function Skeleton-Agent(percept) return actionstatic: memory /* Agent的世界記憶 */memory Update- Memory(memory,percept)action Choose-Best-Action(memory)memory Update-Memory(memory,action)return action33Agent的分類 根據(jù)人類思維的層次模型,可以將Agent分成四類:反應(yīng)Agent形象思維Ag

13、ent抽象思維Agent復(fù)合式Agent 形象思維Agent和抽象思維Agent也可以合稱為認(rèn)知Agent3413.5.1 反應(yīng)Agent環(huán)境當(dāng)前世界傳感器動(dòng) 作效應(yīng)器條件-動(dòng)作規(guī)則Agent35反應(yīng)Agent程序function Reactive-Agent(percept) returns action static: rules, /* 一組條件-動(dòng)作規(guī)則 */ state Interpret-Input(percept) rule Rule-Match(state,rules) action Rule-Actionrule return action3613.5.2 認(rèn)知Agent環(huán)境

14、信息融合傳感器動(dòng) 作效應(yīng)器Agent規(guī) 劃知識(shí)庫(kù)目標(biāo)內(nèi)部狀態(tài)37認(rèn)知Agent程序function Cognitive-Agent(percept) returns actionstatic: environment, /* 描述當(dāng)前世界環(huán)境 */ kb, /* 知識(shí)庫(kù) */ environment Update-World-Model(environment,percept) state Update-Mental-State(environment,state) action Decision-Making(state,kb) environment Update-World-Model(

15、environment,action) return action38BDI結(jié)構(gòu)知識(shí)信念規(guī)劃 意 圖目 標(biāo)愿 望3913.5.3 復(fù)合式Agent決策生成規(guī) 劃反 射建 模通 信感 知行 動(dòng)其他智能Agent智能Agent外部世界預(yù)測(cè)協(xié)作與協(xié)商動(dòng)作請(qǐng)求或應(yīng)答信息一般情況緊急情況和簡(jiǎn)單情況40規(guī)劃模塊世界的模型(包括其他 Agent的模型)經(jīng) 驗(yàn) 庫(kù)目標(biāo)集合局 部 規(guī) 劃 器決 策 生 成重新規(guī)劃規(guī)劃規(guī)劃目標(biāo)41建模模塊世界的模型(包括其他 Agent的模型)模 型 庫(kù)模 型 生 成 和 維 護(hù)預(yù) 測(cè)規(guī)劃決策生成感 知通 信建模42通信模塊詞 法 庫(kù)語(yǔ) 法 庫(kù)詞 義 庫(kù)物理通信語(yǔ)言生成語(yǔ)言理解通

16、信4313.6 Agent通信策 略對(duì) 話消 息黑 板協(xié) 議通信協(xié)作協(xié) 議44Agent通信中的主要問(wèn)題語(yǔ)義:全部有關(guān)的Agent必須知道通信語(yǔ)言的語(yǔ)義,消息的語(yǔ)義內(nèi)容知識(shí)是分布式問(wèn)題求解的核心部分。言語(yǔ)行為:通信語(yǔ)言也是一種動(dòng)作,說(shuō)話是為了使世界的狀態(tài)發(fā)生改變。交互協(xié)議:Agent之間消息交換的典型模式通信語(yǔ)言:傳遞消息的標(biāo)準(zhǔn)語(yǔ)法。Foundation for Intelligent Physical Agents http:/45Agent間的消息傳遞消息發(fā)送/傳輸服務(wù)器轉(zhuǎn)換到傳輸格式從傳輸格式轉(zhuǎn)換消息M言語(yǔ)行為意圖I目標(biāo)GAgent i消息MAgent j46本體論(Ontology)本

17、體論是概念化的明確的表示和描述。對(duì)某一領(lǐng)域中的概念有共同理解,可以提高交流和協(xié)作的效率,從而提高了軟件的重用性。47言語(yǔ)行為有關(guān)言語(yǔ)行為理論的研究主要集中在如何劃分不同類型的言語(yǔ)行為。在Agent通信語(yǔ)言的研究中,言語(yǔ)行為理論主要用來(lái)考慮Agent之間可以交互的信息類型。48FIPA通信動(dòng)作庫(kù)Accept Proposal接受提議Agree同意Cancel取消Call for Proposal要求提議Confirm確認(rèn)Disconfirm確認(rèn)為否定Failure失敗Inform通知Inform If通知 是否Inform Ref通知 有關(guān)對(duì)象Not Understood不理解49Propaga

18、te傳播Propose提議Proxy代理Query If詢問(wèn) 是否Query Ref詢問(wèn) 有關(guān)對(duì)象Refuse拒絕(請(qǐng)求)Reject Proposal拒絕提議Request請(qǐng)求Request When請(qǐng)求 某個(gè)條件下執(zhí)行Request Whenever請(qǐng)求 一旦某個(gè)條件成立就執(zhí)行Subscribe預(yù)定詳細(xì)說(shuō)明:http:/repository/cas.html50交互協(xié)議Agent之間的會(huì)話常常形成典型模式,這種情況下某些消息序列是可知的,這些消息交換的典型模式稱為協(xié)議。Agent間交互的理想情況:Agent充分地理解消息的含意和意圖,然后根據(jù)自身的信念、目標(biāo)等心智狀態(tài),做出相應(yīng)的回答比較實(shí)

19、際的實(shí)現(xiàn):預(yù)先規(guī)范這些協(xié)議,規(guī)定好消息的順序。51FIPA 英國(guó)拍賣協(xié)議52通信語(yǔ)言KQML:由美國(guó)ARPA的知識(shí)共享計(jì)劃中提出,規(guī)定了消息格式和消息傳送系統(tǒng),為多Agent系統(tǒng)通信和協(xié)商提供了一種通用框架。ACL:由FIPA制定的一種規(guī)范。與KQML非常相似53KQML一個(gè)例子:(ask-all: senderA: receiverB: in-reply-toido: reply-withidl: languageProlog: ontologyfoo: content“bar (X, Y)”)54FIPA ACL(inform: sender agent1: receiver hpl-au

20、ction-server: content (price (bid good02) 150): in-reply-to round-4: reply-with bid04: language s1: ontology hpl-auction)消息結(jié)構(gòu)開始通信動(dòng)作類型消息參數(shù)消息內(nèi)容表達(dá)式參數(shù)表達(dá)式55XMLeXtensible Markup Language 可擴(kuò)展標(biāo)記語(yǔ)言 XML是用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語(yǔ)言。XML文件本身只是將文件資料結(jié)構(gòu)化。例如:下面的ACL消息(inform:sender jklabrou:receiver grosof:content (CPU libr

21、etto50 pentium):ontology laptop:language kif)56轉(zhuǎn)換為XML格式后如下:informjklabrougrosof57laptop(CPU libretto50 pentium)kif5813.Agent的協(xié)調(diào)與協(xié)作協(xié)調(diào)(coordination)與協(xié)作(cooperation)是多Agent研究的核心問(wèn)題之一。協(xié)調(diào)是指一組智能Agent完成一些集體活動(dòng)時(shí)相互作用的性質(zhì)。協(xié)作是非對(duì)抗的Agent之間保持行為協(xié)調(diào)的一個(gè)特例。59協(xié)調(diào)多Agent系統(tǒng)中的協(xié)調(diào)是指多個(gè)Agent為了以一致、和諧的方式工作而進(jìn)行交互的過(guò)程。進(jìn)行協(xié)調(diào)是希望避免Agent之間的死

22、鎖或活鎖。死鎖指多個(gè)Agent無(wú)法進(jìn)行各自的下一步動(dòng)作;活鎖指多個(gè)Agent不斷工作卻無(wú)任何進(jìn)展。60協(xié)作目前針對(duì)Agent協(xié)作的研究大體上可分為兩類:將其它領(lǐng)域研究多實(shí)體行為的方法和技術(shù)用于Agent協(xié)作的研究。如對(duì)策論和力學(xué)研究。從Agent的目標(biāo)、意圖、規(guī)劃等心智態(tài)度出發(fā)來(lái)研究多Agent間的協(xié)作。61協(xié)作規(guī)劃協(xié)作的動(dòng)機(jī):某個(gè)Agent相信通過(guò)協(xié)作能帶來(lái)好處(如提高效率,完成以往單獨(dú)無(wú)法完成的任務(wù))多個(gè)Agent在交流的過(guò)程中,發(fā)現(xiàn)它們能夠通過(guò)協(xié)作來(lái)實(shí)現(xiàn)更大的目標(biāo)。62協(xié)作過(guò)程產(chǎn)生需求、確定目標(biāo)協(xié)作規(guī)劃、求解協(xié)作結(jié)構(gòu)尋求協(xié)作伙伴選擇協(xié)作方案實(shí)現(xiàn)目標(biāo)評(píng)估結(jié)果6313.8 多Agent環(huán)境M

23、AGEMAGE的主要特點(diǎn):運(yùn)行于分布式網(wǎng)絡(luò)環(huán)境用java編寫使用模塊化的能力通過(guò)ADL來(lái)描述并生成AgentAgent之間通過(guò)ACL通信6413.9 面向Agent的軟件技術(shù)在面向Agent的軟件開發(fā)方法中,應(yīng)用程序編寫為軟件Agent,這些Agent之間通過(guò)Agent通信語(yǔ)言可以進(jìn)行比普通消息傳遞更規(guī)范、更明確的通訊。65Agent與對(duì)象的異同共同點(diǎn):都具有封裝性、繼承性和多態(tài)性。對(duì)象的內(nèi)部狀態(tài)映射為Agent的心智狀態(tài)?;ゲ僮鳌2煌c(diǎn):Agent具有自治性,對(duì)象只能被動(dòng)的被調(diào)用。Agent之間交互使用通信語(yǔ)言,對(duì)象之間交互是通過(guò)互相調(diào)用方法。66AO與OO對(duì)象是對(duì)現(xiàn)實(shí)世界中的被動(dòng)實(shí)體的抽象

24、,Agent是對(duì)主動(dòng)實(shí)體的很好的抽象。Agent支持用于表示智能的結(jié)構(gòu),如信念、承諾等。Agent支持基于言語(yǔ)行為理論的高級(jí)交互,不同于對(duì)象之間頻繁的消息發(fā)送和接收。對(duì)象是通過(guò)外部來(lái)進(jìn)行控制的(白箱控制),相反,Agent有自治性,不能直接從外部進(jìn)行控制(黑箱控制)。67主要的基于Agent的方法Gaia方法:Wooldridge,Jennings和Kinny在1999年提出了面向Agent分析與設(shè)計(jì)的Gaia方法學(xué)。 多Agent工程方法學(xué):Wood和DeLoach提出了多Agent工程方法學(xué)MaSE。 AUML: Odell等人提出了對(duì)UML語(yǔ)言的擴(kuò)充AgentUML語(yǔ)言AUML語(yǔ)言。68

25、Gaia方法 Gaia是一種同時(shí)支持微觀級(jí)(Agent結(jié)構(gòu))和宏觀級(jí)(Agent社會(huì)與組織結(jié)構(gòu))的Agent開發(fā)的一般方法。分析過(guò)程第一步是找到系統(tǒng)中的角色,第二步是對(duì)角色之間的交互進(jìn)行建模。每個(gè)角色包含四個(gè)屬性:責(zé)任、許可、活動(dòng)和協(xié)議設(shè)計(jì)階段第一步是把角色映射到一定的Agent類型,然后對(duì)不同的Agent類型創(chuàng)建適當(dāng)?shù)腁gent實(shí)例;第二步是確定一個(gè)和多個(gè)Agent中角色所需要的服務(wù)模塊;最后一步是為Agent之間的通信表示建立熟人模塊。 69MaSEMaSE在一般性及應(yīng)用領(lǐng)域上類似于Gaia,MaSE的目的是引導(dǎo)設(shè)計(jì)者怎樣從初始的系統(tǒng)規(guī)范說(shuō)明到Agent系統(tǒng)的實(shí)現(xiàn)。 MaSE在邏輯上被分為

26、七段流水線:捕獲目標(biāo)、應(yīng)用用例、精練角色、創(chuàng)建Agent類、構(gòu)造會(huì)話、編譯Agent類、系統(tǒng)設(shè)計(jì)。 70AUMLOdell、Parunak和Bauer提出了Agent交互協(xié)議AIP的三層表示方法。該方法不僅需要表達(dá)語(yǔ)義的修改,而且需要UML可視化語(yǔ)言的修改。AUML已經(jīng)被提交給UML標(biāo)準(zhǔn)委員會(huì),作為一個(gè)建議包含在UML2.0中。7113.10 Mobile Agentl節(jié)約網(wǎng)絡(luò)帶寬 移動(dòng)Agent直接在數(shù)據(jù)端執(zhí)行處理,與客戶端不需要進(jìn)行中間結(jié)果的傳輸,只返回最后的結(jié)果。 l 提供實(shí)時(shí)的遠(yuǎn)程交互 在一些遠(yuǎn)程控制系統(tǒng)中,如外太空探測(cè)器的控制、網(wǎng)絡(luò)的時(shí)延使得遠(yuǎn)程實(shí)時(shí)控制變得不可能,發(fā)送Mobile

27、Agent實(shí)行遠(yuǎn)端的本地控制可解決該問(wèn)題。72 l 支持離線計(jì)算 用戶派遣出Mobile Agent程序后,可以斷開網(wǎng)絡(luò)連接,而Agent將在網(wǎng)絡(luò)上自主運(yùn)行。Agent完成任務(wù)后,當(dāng)它發(fā)現(xiàn)用戶設(shè)備重新連上網(wǎng)絡(luò)時(shí),就返回計(jì)算結(jié)果。 l實(shí)現(xiàn)載荷卸載 對(duì)于一些計(jì)算能力弱的設(shè)備,如個(gè)人數(shù)字助理,可以把計(jì)算打包成Agent程序,發(fā)送到計(jì)算能力強(qiáng)的設(shè)備上進(jìn)行計(jì)算。 73 l 提供定制化服務(wù) 使用Agent,客戶端可以根據(jù)服務(wù)器端提供的底層操作函數(shù),編寫滿足自己特定需要的服務(wù)程序,然后發(fā)送到服務(wù)器端運(yùn)行。 l 易于分發(fā)服務(wù) 在采用Mobile Agent技術(shù)的分布式應(yīng)用中,服務(wù)的更改變得非常簡(jiǎn)單,比如在電信

28、網(wǎng)的管理中,當(dāng)業(yè)務(wù)需要改變時(shí),只需把新的服務(wù)程序發(fā)送到相應(yīng)的服務(wù)節(jié)點(diǎn)上,用不著人力去一個(gè)一個(gè)節(jié)點(diǎn)地安裝。74 l 增加應(yīng)用的強(qiáng)壯性 移動(dòng)Agent的工作方式減少了應(yīng)用對(duì)網(wǎng)絡(luò)連接可靠性的要求,它的自主性又使它具備對(duì)環(huán)境的反應(yīng)能力,因此能建立更容錯(cuò)的分布系統(tǒng)。 l 提供平臺(tái)無(wú)關(guān)性 移動(dòng)Agent是跨平臺(tái)運(yùn)行的。移動(dòng)代理應(yīng)用編程不存在程序的移植問(wèn)題,便于應(yīng)用的快速開發(fā)。 l 提供更自然的電子商務(wù)模式 用移動(dòng)Agent代表用戶參與電子交易,買家可在網(wǎng)上自由尋找賣者,查詢商品種類,商談價(jià)格,賣家也可主動(dòng)上門向買家推薦商品。7513.11 若干前沿問(wèn)題討論當(dāng)前AI中存在的“鴻溝”解決“鴻溝”的主要思路完全

29、自主Agent完全自主Agent的關(guān)鍵技術(shù)完全自主Agent的典型應(yīng)用7613.11.1 當(dāng)前AI中存在的“鴻溝”Stuart J. Russell的觀點(diǎn)在1995年獲得IJCAI-95的“Computers and Thought Award”杰出青年大獎(jiǎng)時(shí)所作的學(xué)術(shù)報(bào)告Rationality and Intelligence 指出“AI是一個(gè)由其研究的問(wèn)題而非方法所定義的領(lǐng)域?!保ā癆I is a field defined by its problems, not its methods.” Stuart J. Russell, 1995)77當(dāng)前AI中存在的“鴻溝”(續(xù)1)當(dāng)前,AI中

30、存在的最大問(wèn)題是:如何填補(bǔ)基于抽象、非底層表示(Ungrounded representations)的高層推理(High-level reasoning)與建立底層表示(Grounded representations)的傳感數(shù)據(jù)解釋(Interpreting raw sensor data)之間的“鴻溝”。 78當(dāng)前AI中存在的“鴻溝”(續(xù)2)2001年,Stanford大學(xué)計(jì)算機(jī)系的年輕教授Daphne Koller在獲得IJCAI-01的“Computers and Thought Award”杰出青年大獎(jiǎng)時(shí)所作的學(xué)術(shù)報(bào)告 傳統(tǒng)AI中被廣泛采用的分析、分解方法正面臨著很大的挑戰(zhàn):在解決

31、復(fù)雜問(wèn)題時(shí),人們往往很自然地采用分而治之的方法,將其分解為每個(gè)“小片”(Fragmentation),等每個(gè)“小片”都取得進(jìn)展后,再進(jìn)行綜合集成以得到最終的結(jié)果。但遺憾的是,往往每個(gè)子問(wèn)題都各自分家且相互遠(yuǎn)離,而且是離得越來(lái)越遠(yuǎn),最后很難將它們綜合集成起來(lái)。 79當(dāng)前AI中存在的“鴻溝”(續(xù)3)“In AI, as in many communities, we have the tendency to divide a problem into well-defined pieces, and make progress on each one. But as we make progres

32、s, the problems tend to move away from each other.” Daphne Koller, 2001 8013.11.2 解決鴻溝的主要思路Daphne Koller教授圍繞著如何解決上述問(wèn)題(即填補(bǔ)高層推理與底層數(shù)據(jù)解釋之間的“鴻溝”),提出一種解決方法,就是建立連接的三座“概念橋梁”(Conceptual bridges),分別是:表示(Representation)推理(Reasoning)學(xué)習(xí)(Learning) 81解決鴻溝的主要思路(續(xù)1)另一種代表性的解決方法是,美國(guó)德克薩斯大學(xué)奧斯汀分校(University of Texas at A

33、ustin)的Peter Stone在2007年獲得IJCAI-07的“Computers and Thought Award”杰出青年大獎(jiǎng)時(shí)所作的學(xué)術(shù)報(bào)告 Peter Stone. Learning and multiagent reasoning for autonomous agents. In: Proceedings of 2007 International Joint Conference on Artificial Intelligence (IJCAI-07), pp.13-30. 82解決鴻溝的主要思路(續(xù)2)建立完全自主的Agents(Complete autonomou

34、s agents),這些Agents具有高度的魯棒性和靈活性,它們可感知環(huán)境,進(jìn)行高層認(rèn)知和決策,在環(huán)境中進(jìn)行自主執(zhí)行,即具有學(xué)習(xí)、交互、組合及合作等能力。他認(rèn)為這種研究方法可分為兩條基本路線:基本算法研究,主要包括機(jī)器學(xué)習(xí)、多Agents系統(tǒng)(MAS);應(yīng)用研究,主要包括實(shí)現(xiàn)面向特定的復(fù)雜環(huán)境的完全自主Agents,以及從面向特定應(yīng)用的自主Agents實(shí)現(xiàn)中總結(jié)發(fā)現(xiàn)普遍規(guī)律。 83解決鴻溝的主要思路(續(xù)3)美國(guó)華盛頓大學(xué)的Pedro Domings教授提出的馬爾可夫邏輯網(wǎng)絡(luò)(Markov Logic Networks)將謂詞邏輯與統(tǒng)計(jì)學(xué)習(xí)方法有機(jī)地結(jié)合起來(lái)可填補(bǔ)AI中存在的高層與底層之間的鴻

35、溝8413.11.3 完全自主Agent的關(guān)鍵技術(shù)Peter Stone還指出,自從1983年Tom Mitchell獲得“Computers and Thought Award”杰出青年大獎(jiǎng)并做了關(guān)于機(jī)器學(xué)習(xí)的學(xué)術(shù)報(bào)告后,從機(jī)器學(xué)習(xí)的觀點(diǎn)來(lái)看,面向分類和預(yù)測(cè)的有監(jiān)督學(xué)習(xí)(Supervised learning)方法得到了極大發(fā)展,并涌現(xiàn)出很多通用的工具包。同時(shí),面向數(shù)據(jù)聚類的無(wú)監(jiān)督學(xué)習(xí)(Unsupervised learning)方法也取得了很大進(jìn)展。然而,從自主Agents的觀點(diǎn)來(lái)看,最近出現(xiàn)的增強(qiáng)學(xué)習(xí)(Reinforcement learning)似乎更加重要,因?yàn)樵鰪?qiáng)學(xué)習(xí)在很多序列決策問(wèn)題中能夠自主收集所需要的訓(xùn)練數(shù)據(jù),學(xué)習(xí)到將狀態(tài)映射為行為的策略,并從延遲獎(jiǎng)賞中(Delayed reward)學(xué)習(xí)如何選擇正確的行為,它實(shí)現(xiàn)了探索(Exploration)與開發(fā)(Exploitation)之間的權(quán)衡。8513.11.4

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論