人工智能02智能體_第1頁
人工智能02智能體_第2頁
人工智能02智能體_第3頁
人工智能02智能體_第4頁
人工智能02智能體_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章智能體教材ArtificialIntelligence–Amodernapproach(2013)

S.RussellandP.Norvig

人工智能—一種現(xiàn)代方法(第二版)學(xué)校發(fā)的教材參考概率推理、機(jī)器學(xué)習(xí)部分理性的行動(dòng):MaximizeYour

ExpectedUtility使目標(biāo)期望值最大化!智能體Anagentisanythingthatcanbeviewedasperceivingitsenvironmentthroughsensorsandactinguponthatenvironmentthroughactuators。一個(gè)智能體是能通過傳感器來感知周圍環(huán)境并通過執(zhí)行器來行動(dòng)的任何東西。Agentsincludehumans,robots,softbots(軟件機(jī)器人),

thermostats(自動(dòng)調(diào)溫器),etc.

Humanagent人類智能體:

eyes,ears,andotherorgansforsensors;

hands,legs,mouth,andotherbodypartsforactuators

Roboticagent機(jī)器人智能體:

camerasandinfraredrangefinders(紅外測(cè)距儀)forsensors;

variousmotors(馬達(dá))foractuators智能體和環(huán)境Theagentfunction(智能體函數(shù))

mapsfrompercepthistories(感知序列)

toactions(行動(dòng)):

[f:P*→A]

Theagentprogram(智能體程序)

runsonthephysicalarchitectureto

producef

agent=architecture(體系結(jié)構(gòu))+program(程序)

兩地點(diǎn)真空吸塵器世界Percepts:locationandcontents,e.g.,[A,Dirty]

Actions:Left,Right,Suck,NoOp

真空吸塵智能體Whatistherightfunction?

Canitbeimplemented(應(yīng)用)inasmallagentprogram?

理性智能體Anagentshouldstriveto“dotherightthing”,basedonwhatit

canperceiveandtheactionsitcanperform.Therightactionis

theonethatwillcausetheagenttobemostsuccessful對(duì)的行動(dòng)就是使智能體更加成功的行動(dòng)

Performancemeasure(性能度量):Anobjectivecriterion(客觀標(biāo)準(zhǔn))forsuccessofanagent'sbehavior

E.g.,performancemeasureofavacuum-cleaneragentcould

be:

灰塵清理量

耗電量

噪音產(chǎn)生量,etc.理性智能體RationalAgent:Foreachpossibleperceptsequence,a

rationalagentshouldselectanactionthatisexpected

tomaximizeitsperformancemeasure,giventhe

evidenceprovidedbytheperceptsequenceand

whateverbuilt-inknowledgetheagenthas.

理性智能體:對(duì)于每一個(gè)可能的感知序列,理性智

能體應(yīng)該基于已知的感知序列提供的信息,和智能

體已有的先驗(yàn)知識(shí),選擇能夠使它的性能度量最大

化的行為。

理性智能體理性與全知(all-knowingwithinfiniteknowledge)

是截然不同的Agentscanperformactionsinordertomodifyfuture

perceptssoastoobtainusefulinformation

(informationgathering,exploration)

智能體會(huì)為了獲取有用信息而采取行動(dòng)——信息收集

Anagentisautonomousifitsbehaviorisdetermined

byitsownexperience(withabilitytolearnand

adapt)

理性智能體應(yīng)該能夠自主地學(xué)習(xí),以彌補(bǔ)不全面或

不正確的先驗(yàn)知識(shí)。理性智能體Arationalagentchooseswhicheveractionmaximizestheexpectedvalueoftheperformancemeasuregiventheperceptsequencetodate

Rational≠omniscient(全知的)

—perceptsmaynotsupplyallrelevantinformation

Rational≠clairvoyant(洞察力)

—actionoutcomesmaynotbeasexpected

Hence,rational≠successfulRational?exploration探索,learning學(xué)習(xí),autonomy自主性Agent:自動(dòng)駕駛汽車Performancemeasure性能度量:safety,destination,profits,legality,comfort,…

Environment環(huán)境:streets/freeways,traffic,pedestrians,weather,…

Actuators執(zhí)行器:steering,accelerator,brake,horn,speaker/display,…

Sensors傳感器:video,accelerometers,gauges,enginesensors,keyboard,GPS,…任務(wù)環(huán)境PEAS

任務(wù)環(huán)境屬性完全可觀察(vs.部分可觀察):如果一直智能體的傳感器每個(gè)時(shí)間節(jié)點(diǎn)上都能讓它訪問獲取環(huán)境的完整狀態(tài)

確定性的(vs.隨機(jī)的):如果環(huán)境的下一個(gè)狀態(tài)完全決定于當(dāng)前的狀態(tài)和智能體執(zhí)行的動(dòng)作.(如果環(huán)境是確定性的,除非有其它智能體活動(dòng)的影響,那么我們稱該環(huán)境是策略的)

片段式的(vs.延續(xù)式的)

:智能體的經(jīng)驗(yàn)被分成了一個(gè)個(gè)原子片段(每個(gè)片段的組成包含了智能體所感知的信息以及進(jìn)而執(zhí)行的單個(gè)行動(dòng)),and行動(dòng)的選擇只取決于當(dāng)前片段自身.

如裝配線上檢測(cè)次品零件的機(jī)器人只需要把每次決策建立在當(dāng)前零件基礎(chǔ)上,

不用考慮以前的決策。任務(wù)環(huán)境屬性靜態(tài)的

(vs.動(dòng)態(tài)的):如果環(huán)境在智能體思考的時(shí)候不會(huì)變化.(如果環(huán)境本身不隨時(shí)間的流逝變化,但智能體的性能評(píng)價(jià)隨時(shí)間變化,那么我們稱這個(gè)環(huán)境是半動(dòng)態(tài)的)

離散的(vs.連續(xù)的):包含有限個(gè)數(shù)的獨(dú)特狀態(tài).下棋、開車

單智能體

(vs.多智能體):Anagentoperatingby

itselfinanenvironment.任務(wù)環(huán)境屬性任務(wù)環(huán)境屬性取決于任務(wù)環(huán)境是如何定義的

Therealworldis(ofcourse)部分可觀察的,隨機(jī)的,延續(xù)式的,動(dòng)態(tài)的,連續(xù)的,多智能體的~

智能體函數(shù)和程序Anagentiscompletelyspecifiedbytheagent

functionmappingperceptsequencestoactions

Oneagentfunction(orasmallequivalenceclass)isrational

目標(biāo):findawaytoimplementtherationalagent

functionconcisely

Table-lookupagent\input{algorithms/table-agent-algorithm}

缺陷:

空間大

創(chuàng)建表的時(shí)間太長(zhǎng)

沒有自主性

即使采用學(xué)習(xí)的方法,智能體在有限時(shí)間

內(nèi)無法學(xué)習(xí)所有表項(xiàng)

智能體類型四種基本的智能體程序,按通用性遞增排序:

—simplereflexagents簡(jiǎn)單反射型智能體

—reflexagentswithstate基于模型的反射型智能體

—goal-basedagents基于目標(biāo)的智能體

—utility-basedagents基于效用的智能體

Allthesecanbeturnedintolearningagents學(xué)習(xí)智能體簡(jiǎn)單反射型智能體基于模型的反射型智能體基于目標(biāo)的智能體基于效用的智能體學(xué)習(xí)智能體SummaryAgentsinteractwithenvironmentsthroughactuatorsandsensorsTheagentfunctiondescribeswhattheagentdoesinallcircumstancesTheperformancemeasureevaluatestheenvironmentsequenceAperfectlyrationalagentmaximizesexpectedperformanceAgentprogramsimplement(some)agentfunctionsPEASdescriptionsdefinetaske

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論