浙江大學(xué)計算機學(xué)院研究生《人工智能引論》課件_第1頁
浙江大學(xué)計算機學(xué)院研究生《人工智能引論》課件_第2頁
浙江大學(xué)計算機學(xué)院研究生《人工智能引論》課件_第3頁
浙江大學(xué)計算機學(xué)院研究生《人工智能引論》課件_第4頁
浙江大學(xué)計算機學(xué)院研究生《人工智能引論》課件_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

浙江高校計算機學(xué)院探討生《人工智能引論》課件第13講智能Agent及多Agent系統(tǒng)Chapter13IntelligentAgent&Multi-AgentSystems徐從富浙江高校人工智能探討所2003年第一稿2005年10月修改補充2007年10月其次次修改1內(nèi)容概述2.分布式問題求解3.Agent4.Agent理論5.Agent結(jié)構(gòu)6.Agent通信7.Agent的協(xié)調(diào)與協(xié)作8.多Agent環(huán)境MAGE9.面對Agent的軟件技術(shù)MobileAgent若干前沿問題探討213.1概述分布式人工智能(DAI)主要探討在邏輯上或物理上分散的智能系統(tǒng)如何并行的、相互協(xié)作地實現(xiàn)問題求解。兩種解決問題的方法:自頂向下:分布式問題求解自底向上:基于Agent的方法3

DAI系統(tǒng)的特色系統(tǒng)中的數(shù)據(jù)、學(xué)問,以及限制不但在邏輯上,而且在物理上是分布的,既沒有全局限制,也沒有全局的數(shù)據(jù)存儲。各個求解機構(gòu)由計算機網(wǎng)絡(luò)互連,在問題求解過程中,通信代價要比求解問題的代價低得多。系統(tǒng)中諸機構(gòu)能夠相互協(xié)作,來求解單個機構(gòu)難以解決,甚至不能解決的任務(wù)。4DAI系統(tǒng)的主要優(yōu)點提高問題求解實力提高問題求解效率擴大應(yīng)用范圍降低軟件的困難性513.2分布式問題求解特點:數(shù)據(jù)、學(xué)問、限制均分布在系統(tǒng)的各節(jié)點上,既無全局限制,也無全局?jǐn)?shù)據(jù)和學(xué)問存儲。兩種協(xié)作方式:任務(wù)分擔(dān)結(jié)果共享613.2.1分布式問題求解系統(tǒng)分類依據(jù)組織結(jié)構(gòu),分布式問題求解系統(tǒng)可以分為三類:層次結(jié)構(gòu)類平行結(jié)構(gòu)類混合結(jié)構(gòu)類713.2.2分布式問題求解過程分布式問題求解過程可以分為四步:任務(wù)分解任務(wù)支配子問題求解結(jié)果綜合8分布式問題求解系統(tǒng)中協(xié)作的分類按節(jié)點間協(xié)作量的多少,協(xié)作分為三類:全協(xié)作系統(tǒng)無協(xié)作系統(tǒng)半?yún)f(xié)作系統(tǒng)常用的通信方式有:共享全局存儲器信息傳遞黑板模型913.3智能Agent及多Agent系統(tǒng)多Agent系統(tǒng)主要探討在邏輯上或物理上分別的多個Agent協(xié)調(diào)其智能行為,即學(xué)問、目標(biāo)、意圖及規(guī)劃等,實現(xiàn)問題求解??梢钥醋魇且环N由底向上設(shè)計的系統(tǒng)。10Agent的思想智能Agent的幾個典型的實例:Microsoft的Office助手計算機病毒(破壞Agent)計算機游戲或模擬中的智能角色貿(mào)易和談判Agent(如Ebay的拍賣Agent)網(wǎng)絡(luò)蜘蛛WebSpider(搜尋引擎中的數(shù)據(jù)搜集和索引Agent,如Google)11Agent概念的出現(xiàn)面對過程的方法面對實體的方法面對對象的方法面對Agent的方法軟件開發(fā)方法的進化12Agent的定義在計算機和人工智能領(lǐng)域中,Agent可以看作是一個實體,它通過傳感器感知環(huán)境,通過效應(yīng)器作用于環(huán)境。13Agent的強定義基于某種場景,并具有靈敏、自主的行為實力,以滿足設(shè)計目標(biāo)的計算機系統(tǒng)。14Agent的弱定義滿足如下特征的基于硬件或(更常常是)軟件的計算機系統(tǒng):自主性(Autonomy)社會性(Socialability)反應(yīng)性(Reactivity)主動性(Pro-activeness)(或稱“前瞻性”)基于場景性(Situatedness)靈敏性(Flexibility)15移動性(Mobility)理性(Rationality)此外,很多學(xué)者還提出一些其它特性:懇切性(Veracity)友好性(Benevolence)長壽性(或時間連貫性)自適應(yīng)性(Adaptability)16Agent的特性Agent弱概念:自治性、社會實力(可通信性)、反應(yīng)實力、自發(fā)行為Agent強概念:學(xué)問、信念、意圖、承諾等心智狀態(tài)其它屬性:長壽性、移動性、推理實力、規(guī)劃實力、學(xué)習(xí)和適應(yīng)實力、懇切、善意、理性1713.4Agent理論智能Agent的理論模型探討主要從邏輯、行為、心理、社會等角度動身,對智能Agent的本質(zhì)進行描述,為智能Agent系統(tǒng)創(chuàng)建奠定基礎(chǔ)。18可能世界模型(PossibleWorldsModel)

地位:Agent理論基礎(chǔ)的開創(chuàng)性工作之一。思想:將Agent的學(xué)問、信念等特征化為一系列“可能世界”,在可能世界模型中包括對象、屬性及其關(guān)系。優(yōu)點:理論基礎(chǔ)(特殊是模態(tài)邏輯)比較完善。缺點:存在“邏輯萬能”(LogicalOmniscience)問題。19“意圖系統(tǒng)”(IntentionalSystem)

作用:用于描述其行為可用信念、愿望等理性才智來預(yù)料的實體。分為:一階和二階兩種形式。對象、屬性及其關(guān)系。20“意圖姿態(tài)”(IntentionalStance)意義:啟發(fā)AI學(xué)者將信念(Belief)、愿望(Desire)、承諾(Commitment)等人類特有的思想和概念應(yīng)用于Agent。

2113.4.1理性Agent(BDI模型)思想:認(rèn)為Agent行為可由信念、愿望和意圖來表達(dá)作用:已成為經(jīng)典模型,并被廣泛接受Belief——信念,Agent對環(huán)境的基本看法。Desire——愿望,Agent想要實現(xiàn)的狀態(tài),即目標(biāo)。Intention——意圖,目標(biāo)的子集。2213.4.2BDIAgent模型BDIAgent模型可以通過下列要素描述:一組關(guān)于世界的信念;Agent當(dāng)前準(zhǔn)備達(dá)到的一組目標(biāo);一個規(guī)劃庫,描述怎樣達(dá)到目標(biāo)和怎樣變更信念;一個意圖結(jié)構(gòu),描述Agent當(dāng)前怎樣達(dá)到它的目標(biāo)和變更信念。23BDI說明器BDI-Interpreterinitialize-state();do options:=option-generator(event-queue,B,G,I); selected-options:=deliberate(options,B,G,I); update-intentions(selected-options,I); execute(I); get-new-external-events(); drop-successful-attitudes(B,G,I); drop-impossible-attitudes(B,G,I);untilquit2413.4.3RAO邏輯框架目標(biāo):以一種自然的方式描述多Agent系統(tǒng)中關(guān)于別的Agent的狀態(tài)的推理過程。系統(tǒng)的分類:由于多Agent系統(tǒng)太困難,建立一種通用的推理模式的想法是不現(xiàn)實的,有必要對系統(tǒng)分類以便區(qū)分對待。常識的獲得:和單個Agent情形一樣,常識問題是阻礙推理的大難題。2513.4.4換位推理思想:仿照語言學(xué)中的虛擬語氣,即為了對某個Agent在某種場景下的狀態(tài)或行為進行推想,設(shè)想自己處于那種場景時的狀態(tài)或行為,再把這種設(shè)想結(jié)果作為被揣測Agent的狀態(tài)或行為。作用:使得一Agent對其它Agent的狀態(tài)和行為的推理過程變得簡潔明白。2613.4.5動作理論情景演算是描述動作的主要的形式框架。在情景演算中引入了狀態(tài)和動作的概念,并利用兩條邏輯公理來描述動作與狀態(tài)的關(guān)系。一條公理描述一個動作在滿足什么條件的狀態(tài)之下可能發(fā)生,另外一條描述在一個狀態(tài)之下某個動作發(fā)生以后當(dāng)前狀態(tài)如何變更。2713.4.6“言語行為”理論(SpeechActsTheory)

地位:這是多Agent交互(通信)的重要理論基礎(chǔ)之一。思想:任何行為都可以等價地表示為言語行為(既任何行為的含義都可用言語來表達(dá)),甚至認(rèn)為全部的行為都是言語行為。作用:大大簡化了Agent之間交互的困難度。28規(guī)劃庫的形式化表示環(huán)境狀態(tài):State={P1,P2,…Pn}目標(biāo):Goal=<State,weightiness>動作模板:Act_template=<name,roles,preconditions,effects,resources>Agent實力:Ability=<Act_template,role,cost>2913.5Agent結(jié)構(gòu)Agent結(jié)構(gòu)須要解決的問題包括:Agent由那些模塊組成,模塊之間如何交互信息,Agent感知到的信息如何影響它的行為和內(nèi)部狀態(tài),如何將這些模塊用軟件或硬件的方式組合起來形成一個有機的整體。30Agent基本結(jié)構(gòu)環(huán)境Agent感知作用黑箱軟件Agent31智能Agent的工作過程環(huán)境交互信息融合信息處理作用交互感知作用32Agent骨架程序functionSkeleton-Agent(percept)returnactionstatic:memory/*Agent的世界記憶*/memory←Update-Memory(memory,percept)action←Choose-Best-Action(memory)memory←Update-Memory(memory,action)returnaction33Agent的分類依據(jù)人類思維的層次模型,可以將Agent分成四類:反應(yīng)Agent形象思維Agent抽象思維Agent復(fù)合式Agent形象思維Agent和抽象思維Agent也可以合稱為認(rèn)知Agent3413.5.1反應(yīng)Agent環(huán)境當(dāng)前世界傳感器動作效應(yīng)器條件-動作規(guī)則Agent35反應(yīng)Agent程序functionReactive-Agent(percept)returnsactionstatic:rules,/*一組條件-動作規(guī)則*/state←Interpret-Input(percept)rule←Rule-Match(state,rules)action←Rule-Action[rule]returnaction3613.5.2認(rèn)知Agent環(huán)境信息融合傳感器動作效應(yīng)器Agent規(guī)劃學(xué)問庫目標(biāo)內(nèi)部狀態(tài)37認(rèn)知Agent程序functionCognitive-Agent(percept)returnsaction static:environment,/*描述當(dāng)前世界環(huán)境*/ kb,/*學(xué)問庫*/environment←Update-World-Model(environment,percept)state←Update-Mental-State(environment,state)action←Decision-Making(state,kb)environment←Update-World-Model(environment,action)returnaction38BDI結(jié)構(gòu)知識信念規(guī)劃意圖目標(biāo)愿望3913.5.3復(fù)合式Agent決策生成規(guī)劃反射建模通信感知行動其他智能Agent智能Agent外部世界預(yù)料協(xié)作與協(xié)商動作懇求或應(yīng)答信息一般情況緊急情況和簡單狀況40規(guī)劃模塊世界的模型(包括其他

Agent的模型)經(jīng)驗庫目標(biāo)集合局部規(guī)劃器決策生成重新規(guī)劃規(guī)劃規(guī)劃目標(biāo)41建模模塊世界的模型(包括其他

Agent的模型)模型庫模型生成和維護預(yù)測規(guī)劃決策生成感知通信建模42通信模塊詞法庫語法庫詞義庫物理通信語言生成語言理解通信4313.6Agent通信策略對話消息黑板協(xié)議通信協(xié)作協(xié)議44Agent通信中的主要問題語義:全部有關(guān)的Agent必需知道通信語言的語義,消息的語義內(nèi)容學(xué)問是分布式問題求解的核心部分。言語行為:通信語言也是一種動作,說話是為了使世界的狀態(tài)發(fā)生變更。交互協(xié)議:Agent之間消息交換的典型模式通信語言:傳遞消息的標(biāo)準(zhǔn)語法。FoundationforIntelligentPhysicalAgents://45Agent間的消息傳遞消息發(fā)送/傳輸服務(wù)器轉(zhuǎn)換到傳輸格式從傳輸格式轉(zhuǎn)換消息M言語行為意圖I目標(biāo)GAgenti消息MAgentj46本體論(Ontology)本體論是概念化的明確的表示和描述。對某一領(lǐng)域中的概念有共同理解,可以提高溝通和協(xié)作的效率,從而提高了軟件的重用性。47言語行為有關(guān)言語行為理論的探討主要集中在如何劃分不同類型的言語行為。在Agent通信語言的探討中,言語行為理論主要用來考慮Agent之間可以交互的信息類型。48FIPA通信動作庫AcceptProposal 接受提議Agree 同意Cancel 取消CallforProposal 要求提議Confirm 確認(rèn)Disconfirm 確認(rèn)為否定Failure 失敗Inform 通知InformIf 通知是否InformRef 通知有關(guān)對象NotUnderstood 不理解49Propagate 傳播Propose 提議Proxy 代理QueryIf 詢問是否QueryRef 詢問有關(guān)對象Refuse 拒絕(懇求)RejectProposal 拒絕提議Request 懇求RequestWhen 懇求某個條件下執(zhí)行RequestWhenever 懇求一旦某個條件成立就執(zhí)行Subscribe 預(yù)定具體說明::///repository/cas.html50交互協(xié)議Agent之間的會話常常形成典型模式,這種狀況下某些消息序列是可知的,這些消息交換的典型模式稱為協(xié)議。Agent間交互的志向狀況:Agent充分地理解消息的含意和意圖,然后依據(jù)自身的信念、目標(biāo)等心智狀態(tài),做出相應(yīng)的回答比較實際的實現(xiàn):預(yù)先規(guī)范這些協(xié)議,規(guī)定好消息的依次。51FIPA英國拍賣協(xié)議52通信語言KQML:由美國ARPA的學(xué)問共享支配中提出,規(guī)定了消息格式和消息傳送系統(tǒng),為多Agent系統(tǒng)通信和協(xié)商供應(yīng)了一種通用框架。ACL:由FIPA制定的一種規(guī)范。與KQML特殊相像53KQML一個例子:(ask-all :sender A :receiver B :in-reply-to ido :reply-with idl :language Prolog :ontology foo :content “bar(X,Y)”)54FIPAACL(inform :senderagent1 :receiverhpl-auction-server :content (price(bidgood02)150) :in-reply-toround-4 :reply-withbid04 :languages1 :ontologyhpl-auction)消息結(jié)構(gòu)起先通信動作類型消息參數(shù)消息內(nèi)容表達(dá)式參數(shù)表達(dá)式55XML—eXtensibleMarkupLanguage

可擴展標(biāo)記語言

XML是用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語言。XML文件本身只是將文件資料結(jié)構(gòu)化。

例如:下面的ACL消息

(inform :senderjklabrou :receivergrosof :content(CPUlibretto50pentium) :ontologylaptop :languagekif)56轉(zhuǎn)換為XML格式后如下:<?xmlversion="pre-1.0"?><!DOCTYPEfipa_aclSYSTEM"fipa_acl.dtd"><message> <messagetype> inform </messagetype> <messageparameter> <senderlink=":///?jklabrou"> jklabrou </sender> </messageparameter> <messageparameter> <receiverlink="://research.ibm/people/g/grosof/"> grosof </receiver> </messageparameter>57 <messageparameter> <ontologylink=":///?jklabrou/ontology/laptop.html"> laptop </ontology> </messageparameter> <messageparameter> <content> (CPUlibretto50pentium) </content> </messageparameter> <messageparameter> <languagelink=":///kif.html"> kif </language> </messageparameter></message>5813.7Agent的協(xié)調(diào)與協(xié)作協(xié)調(diào)(coordination)與協(xié)作(cooperation)是多Agent探討的核心問題之一。協(xié)調(diào)是指一組智能Agent完成一些集體活動時相互作用的性質(zhì)。協(xié)作是非對抗的Agent之間保持行為協(xié)調(diào)的一個特例。59協(xié)調(diào)多Agent系統(tǒng)中的協(xié)調(diào)是指多個Agent為了以一樣、和諧的方式工作而進行交互的過程。進行協(xié)調(diào)是希望避開Agent之間的死鎖或活鎖。死鎖指多個Agent無法進行各自的下一步動作;活鎖指多個Agent不斷工作卻無任何進展。60協(xié)作目前針對Agent協(xié)作的探討大體上可分為兩類:將其它領(lǐng)域探討多實體行為的方法和技術(shù)用于Agent協(xié)作的探討。如對策論和力學(xué)探討。從Agent的目標(biāo)、意圖、規(guī)劃等心智看法動身來探討多Agent間的協(xié)作。61協(xié)作規(guī)劃協(xié)作的動機:某個Agent信任通過協(xié)作能帶來好處(如提高效率,完成以往單獨無法完成的任務(wù))多個Agent在溝通的過程中,發(fā)覺它們能夠通過協(xié)作來實現(xiàn)更大的目標(biāo)。62協(xié)作過程產(chǎn)生需求、確定目標(biāo)協(xié)作規(guī)劃、求解協(xié)作結(jié)構(gòu)尋求協(xié)作伙伴選擇協(xié)作方案實現(xiàn)目標(biāo)評估結(jié)果6313.8多Agent環(huán)境MAGEMAGE的主要特點:運行于分布式網(wǎng)絡(luò)環(huán)境用java編寫運用模塊化的實力通過ADL來描述并生成AgentAgent之間通過ACL通信6413.9面對Agent的軟件技術(shù)在面對Agent的軟件開發(fā)方法中,應(yīng)用程序編寫為軟件Agent,這些Agent之間通過Agent通信語言可以進行比一般消息傳遞更規(guī)范、更明確的通訊。65Agent與對象的異同共同點:都具有封裝性、繼承性和多態(tài)性。對象的內(nèi)部狀態(tài)映射為Agent的心智狀態(tài)?;ゲ僮?。不同點:Agent具有自治性,對象只能被動的被調(diào)用。Agent之間交互運用通信語言,對象之間交互是通過相互調(diào)用方法。66AO與OO對象是對現(xiàn)實世界中的被動實體的抽象,Agent是對主動實體的很好的抽象。Agent支持用于表示智能的結(jié)構(gòu),如信念、承諾等。Agent支持基于言語行為理論的高級交互,不同于對象之間常見的消息發(fā)送和接收。對象是通過外部來進行限制的(白箱限制),相反,Agent有自治性,不能干脆從外部進行限制(黑箱限制)。67主要的基于Agent的方法Gaia方法:Wooldridge,Jennings和Kinny在1999年提出了面對Agent分析與設(shè)計的Gaia方法學(xué)。多Agent工程方法學(xué):Wood和DeLoach提出了多Agent工程方法學(xué)MaSE。AUML:Odell等人提出了對UML語言的擴充——AgentUML語言AUML語言。68Gaia方法

Gaia是一種同時支持微觀級(Agent結(jié)構(gòu))和宏觀級(Agent社會與組織結(jié)構(gòu))的Agent開發(fā)的一般方法。分析過程第一步是找到系統(tǒng)中的角色,其次步是對角色之間的交互進行建模。每個角色包含四個屬性:責(zé)任、許可、活動和協(xié)議設(shè)計階段第一步是把角色映射到確定的Agent類型,然后對不同的Agent類型創(chuàng)建適當(dāng)?shù)腁gent實例;其次步是確定一個和多個Agent中角色所須要的服務(wù)模塊;最終一步是為Agent之間的通信表示建立熟人模塊。69MaSEMaSE在一般性及應(yīng)用領(lǐng)域上類似于Gaia,MaSE的目的是引導(dǎo)設(shè)計者怎樣從初始的系統(tǒng)規(guī)范說明到Agent系統(tǒng)的實現(xiàn)。MaSE在邏輯上被分為七段流水線:捕獲目標(biāo)、應(yīng)用用例、精練角色、創(chuàng)建Agent類、構(gòu)造會話、編譯Agent類、系統(tǒng)設(shè)計。70AUMLOdell、Parunak和Bauer提出了Agent交互協(xié)議AIP的三層表示方法。該方法不僅須要表達(dá)語義的修改,而且須要UML可視化語言的修改。AUML已經(jīng)被提交給UML標(biāo)準(zhǔn)委員會,作為一個建議包含在UML2.0中。7113.10MobileAgentl

節(jié)約網(wǎng)絡(luò)帶寬移動Agent干脆在數(shù)據(jù)端執(zhí)行處理,與客戶端不須要進行中間結(jié)果的傳輸,只返回最終的結(jié)果。l

供應(yīng)實時的遠(yuǎn)程交互在一些遠(yuǎn)程限制系統(tǒng)中,如外太空探測器的限制、網(wǎng)絡(luò)的時延使得遠(yuǎn)程實時限制變得不行能,發(fā)送MobileAgent實行遠(yuǎn)端的本地限制可解決該問題。72

l

支持離線計算用戶派遣出MobileAgent程序后,可以斷開網(wǎng)絡(luò)連接,而Agent將在網(wǎng)絡(luò)上自主運行。Agent完成任務(wù)后,當(dāng)它發(fā)覺用戶設(shè)備重新連上網(wǎng)絡(luò)時,就返回計算結(jié)果。l

實現(xiàn)載荷卸載對于一些計算實力弱的設(shè)備,如個人數(shù)字助理,可以把計算打包成Agent程序,發(fā)送到計算實力強的設(shè)備上進行計算。

73l供應(yīng)定制化服務(wù)運用Agent,客戶端可以依據(jù)服務(wù)器端供應(yīng)的底層操作函數(shù),編寫滿足自己特定須要的服務(wù)程序,然后發(fā)送到服務(wù)器端運行。l易于分發(fā)服務(wù)在接受MobileAgent技術(shù)的分布式應(yīng)用中,服務(wù)的更變更得特殊簡潔,比如在電信網(wǎng)的管理中,當(dāng)業(yè)務(wù)須要變更時,只需把新的服務(wù)程序發(fā)送到相應(yīng)的服務(wù)節(jié)點上,用不著人力去一個一個節(jié)點地安裝。74l增加應(yīng)用的強壯性移動Agent的工作方式削減了應(yīng)用對網(wǎng)絡(luò)連接牢靠性的要求,它的自主性又使它具備對環(huán)境的反應(yīng)實力,因此能建立更容錯的分布系統(tǒng)。l供應(yīng)平臺無關(guān)性移動Agent是跨平臺運行的。移動代理應(yīng)用編程不存在程序的移植問題,便于應(yīng)用的快速開發(fā)。l供應(yīng)更自然的電子商務(wù)模式用移動Agent代表用戶參與電子交易,買家可在網(wǎng)上自由找尋賣者,查詢商品種類,商談價格,賣家也可主動上門向買家舉薦商品。7513.11若干前沿問題探討當(dāng)前AI中存在的“鴻溝”解決“鴻溝”的主要思路完全自主Agent完全自主Agent的關(guān)鍵技術(shù)完全自主Agent的典型應(yīng)用7613.11.1當(dāng)前AI中存在的“鴻溝”StuartJ.Russell的觀點在1995年獲得IJCAI-95的“ComputersandThoughtAward”杰出青年大獎時所作的學(xué)術(shù)報告《RationalityandIntelligence》指出“AI是一個由其探討的問題而非方法所定義的領(lǐng)域?!保ā癆Iisafielddefinedbyitsproblems,notitsmethods.”——StuartJ.Russell,1995)77當(dāng)前AI中存在的“鴻溝”(續(xù)1)當(dāng)前,AI中存在的最大問題是:如何填補基于抽象、非底層表示(Ungroundedrepresentations)的高層推理(High-levelreasoning)與建立底層表示(Groundedrepresentations)的傳感數(shù)據(jù)說明(Interpretingrawsensordata)之間的“鴻溝”。78當(dāng)前AI中存在的“鴻溝”(續(xù)2)2001年,Stanford高校計算機系的年輕教授DaphneKoller在獲得IJCAI-01的“ComputersandThoughtAward”杰出青年大獎時所作的學(xué)術(shù)報告?zhèn)鹘y(tǒng)AI中被廣泛接受的分析、分解方法正面臨著很大的挑戰(zhàn):在解決困難問題時,人們往往很自然地接受分而治之的方法,將其分解為每個“小片”(Fragmentation),等每個“小片”都取得進展后,再進行綜合集成以得到最終的結(jié)果。但缺憾的是,往往每個子問題都各自分家且相互遠(yuǎn)離,而且是離得越來越遠(yuǎn),最終很難將它們綜合集成起來。79當(dāng)前AI中存在的“鴻溝”(續(xù)3)“InAI,asinmanycommunities,wehavethetendencytodivideaproblemintowell-definedpieces,andmakeprogressoneachone.Butaswemakeprogress,theproblemstendtomoveawayfromeachother.”——DaphneKoller,2001

8013.11.2解決鴻溝的主要思路DaphneKoller教授圍圍著如何解決上述問題(即填補高層推理與底層數(shù)據(jù)說明之間的“鴻溝”),提出一種解決方法,就是建立連接的三座“概念橋梁”(Conceptualbridges),分別是:表示(Representation)推理(Reasoning)學(xué)習(xí)(Learning)81解決鴻溝的主要思路(續(xù)1)另一種代表性的解決方法是,美國德克薩斯高校奧斯汀分校(UniversityofTexasatAustin)的PeterStone在2007年獲得IJCAI-07的“ComputersandThoughtAward”杰出青年大獎時所作的學(xué)術(shù)報告PeterStone.Learningandmultiagentreasoningforautonomousagents.In:Proceedingsof2007InternationalJointConferenceonArtificialIntelligence(IJCAI-07),pp.13-30.82解決鴻溝的主要思路(續(xù)2)建立完全自主的Agents(Completeautonomousagents),這些Agents具有高度的魯棒性和靈敏性,它們可感知環(huán)境,進行高層認(rèn)知和決策,在環(huán)境中進行自主執(zhí)行,即具有學(xué)習(xí)、交互、組合及合作等實力。他認(rèn)為這種探討方法可分為兩條基本路途:基本算法探討,主要包括機器學(xué)習(xí)、多Agents系統(tǒng)(MAS);應(yīng)用探討,主要包括實現(xiàn)面對特定的困難環(huán)境的完全自主Agents,以及從面對特定應(yīng)用的自主Agents實現(xiàn)中總結(jié)發(fā)覺普遍規(guī)律。83解決鴻溝的主要思路(續(xù)3)美國華盛頓高校的PedroDomings教授提出的馬爾可夫邏輯網(wǎng)絡(luò)(MarkovLogicNetworks)將謂詞邏輯與統(tǒng)計學(xué)習(xí)方法有機地結(jié)合起來可填補AI中存在的高層與底層之間的鴻溝8413.11.3完全自主Agent的關(guān)鍵技術(shù)PeterStone還指出,自從1983年TomMitchell獲得“ComputersandThoughtAward”杰出青年大獎并做了關(guān)于機器學(xué)習(xí)的學(xué)術(shù)報告后,從機器學(xué)習(xí)的觀點來看,面對分類和預(yù)料的有監(jiān)督學(xué)習(xí)(Supervisedlearning)方法得到了極大發(fā)展,并涌現(xiàn)出很多通用的工具包。同時,面對數(shù)據(jù)聚類的無監(jiān)督學(xué)習(xí)(Unsupervisedlearning)方法也取得了很大進展。然而,從自主Agents的觀點來看,最近出現(xiàn)的增加學(xué)習(xí)(Reinforcementlearning)似乎更加重要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論