人工智能02智能體

上傳人：建*** IP屬地：河北上傳時(shí)間：2024-03-02 格式：PPTX 頁數(shù)：24 大?。?80.41KB 積分：35 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩19頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章智能體教材ArtificialIntelligence–Amodernapproach(2013)

S.RussellandP.Norvig

人工智能—一種現(xiàn)代方法(第二版)學(xué)校發(fā)的教材參考概率推理、機(jī)器學(xué)習(xí)部分理性的行動(dòng)：MaximizeYour

ExpectedUtility使目標(biāo)期望值最大化！智能體Anagentisanythingthatcanbeviewedasperceivingitsenvironmentthroughsensorsandactinguponthatenvironmentthroughactuators。一個(gè)智能體是能通過傳感器來感知周圍環(huán)境并通過執(zhí)行器來行動(dòng)的任何東西。Agentsincludehumans,robots,softbots（軟件機(jī)器人）,

thermostats（自動(dòng)調(diào)溫器）,etc.

Humanagent人類智能體:

eyes,ears,andotherorgansforsensors;

hands,legs,mouth,andotherbodypartsforactuators

Roboticagent機(jī)器人智能體:

camerasandinfraredrangefinders（紅外測(cè)距儀）forsensors;

variousmotors(馬達(dá))foractuators智能體和環(huán)境Theagentfunction（智能體函數(shù)）

mapsfrompercepthistories（感知序列）

toactions（行動(dòng)）:

[f:P*→A]

Theagentprogram（智能體程序）

runsonthephysicalarchitectureto

producef

agent=architecture（體系結(jié)構(gòu)）+program（程序）

兩地點(diǎn)真空吸塵器世界Percepts:locationandcontents,e.g.,[A,Dirty]

Actions:Left,Right,Suck,NoOp

真空吸塵智能體Whatistherightfunction?

Canitbeimplemented（應(yīng)用）inasmallagentprogram?

理性智能體Anagentshouldstriveto“dotherightthing”,basedonwhatit

canperceiveandtheactionsitcanperform.Therightactionis

theonethatwillcausetheagenttobemostsuccessful對(duì)的行動(dòng)就是使智能體更加成功的行動(dòng)

Performancemeasure（性能度量）:Anobjectivecriterion（客觀標(biāo)準(zhǔn)）forsuccessofanagent'sbehavior

E.g.,performancemeasureofavacuum-cleaneragentcould

be：

灰塵清理量

耗電量

噪音產(chǎn)生量,etc.理性智能體RationalAgent:Foreachpossibleperceptsequence,a

rationalagentshouldselectanactionthatisexpected

tomaximizeitsperformancemeasure,giventhe

evidenceprovidedbytheperceptsequenceand

whateverbuilt-inknowledgetheagenthas.

理性智能體：對(duì)于每一個(gè)可能的感知序列，理性智

能體應(yīng)該基于已知的感知序列提供的信息，和智能

體已有的先驗(yàn)知識(shí)，選擇能夠使它的性能度量最大

化的行為。

理性智能體理性與全知(all-knowingwithinfiniteknowledge)

是截然不同的Agentscanperformactionsinordertomodifyfuture

perceptssoastoobtainusefulinformation

(informationgathering,exploration)

智能體會(huì)為了獲取有用信息而采取行動(dòng)——信息收集

Anagentisautonomousifitsbehaviorisdetermined

byitsownexperience(withabilitytolearnand

adapt)

理性智能體應(yīng)該能夠自主地學(xué)習(xí)，以彌補(bǔ)不全面或

不正確的先驗(yàn)知識(shí)。理性智能體Arationalagentchooseswhicheveractionmaximizestheexpectedvalueoftheperformancemeasuregiventheperceptsequencetodate

Rational≠omniscient(全知的)

—perceptsmaynotsupplyallrelevantinformation

Rational≠clairvoyant(洞察力)

—actionoutcomesmaynotbeasexpected

Hence,rational≠successfulRational?exploration探索,learning學(xué)習(xí),autonomy自主性Agent：自動(dòng)駕駛汽車Performancemeasure性能度量：safety,destination,profits,legality,comfort,…

Environment環(huán)境：streets/freeways,traffic,pedestrians,weather,…

Actuators執(zhí)行器：steering,accelerator,brake,horn,speaker/display,…

Sensors傳感器：video,accelerometers,gauges,enginesensors,keyboard,GPS,…任務(wù)環(huán)境PEAS

任務(wù)環(huán)境屬性完全可觀察(vs.部分可觀察):如果一直智能體的傳感器每個(gè)時(shí)間節(jié)點(diǎn)上都能讓它訪問獲取環(huán)境的完整狀態(tài)

確定性的(vs.隨機(jī)的):如果環(huán)境的下一個(gè)狀態(tài)完全決定于當(dāng)前的狀態(tài)和智能體執(zhí)行的動(dòng)作.(如果環(huán)境是確定性的，除非有其它智能體活動(dòng)的影響，那么我們稱該環(huán)境是策略的)

片段式的(vs.延續(xù)式的)

:智能體的經(jīng)驗(yàn)被分成了一個(gè)個(gè)原子片段(每個(gè)片段的組成包含了智能體所感知的信息以及進(jìn)而執(zhí)行的單個(gè)行動(dòng)),and行動(dòng)的選擇只取決于當(dāng)前片段自身.

如裝配線上檢測(cè)次品零件的機(jī)器人只需要把每次決策建立在當(dāng)前零件基礎(chǔ)上，

不用考慮以前的決策。任務(wù)環(huán)境屬性靜態(tài)的

(vs.動(dòng)態(tài)的):如果環(huán)境在智能體思考的時(shí)候不會(huì)變化.(如果環(huán)境本身不隨時(shí)間的流逝變化，但智能體的性能評(píng)價(jià)隨時(shí)間變化，那么我們稱這個(gè)環(huán)境是半動(dòng)態(tài)的)

離散的(vs.連續(xù)的):包含有限個(gè)數(shù)的獨(dú)特狀態(tài).下棋、開車

單智能體

(vs.多智能體):Anagentoperatingby

itselfinanenvironment.任務(wù)環(huán)境屬性任務(wù)環(huán)境屬性取決于任務(wù)環(huán)境是如何定義的

Therealworldis(ofcourse)部分可觀察的,隨機(jī)的,延續(xù)式的,動(dòng)態(tài)的,連續(xù)的,多智能體的~

智能體函數(shù)和程序Anagentiscompletelyspecifiedbytheagent

functionmappingperceptsequencestoactions

Oneagentfunction(orasmallequivalenceclass)isrational

目標(biāo):findawaytoimplementtherationalagent

functionconcisely

Table-lookupagent\input{algorithms/table-agent-algorithm}

缺陷:

空間大

創(chuàng)建表的時(shí)間太長(zhǎng)

沒有自主性

即使采用學(xué)習(xí)的方法，智能體在有限時(shí)間

內(nèi)無法學(xué)習(xí)所有表項(xiàng)

智能體類型四種基本的智能體程序，按通用性遞增排序:

—simplereflexagents簡(jiǎn)單反射型智能體

—reflexagentswithstate基于模型的反射型智能體

—goal-basedagents基于目標(biāo)的智能體

—utility-basedagents基于效用的智能體

Allthesecanbeturnedintolearningagents學(xué)習(xí)智能體簡(jiǎn)單反射型智能體基于模型的反射型智能體基于目標(biāo)的智能體基于效用的智能體學(xué)習(xí)智能體SummaryAgentsinteractwithenvironmentsthroughactuatorsandsensorsTheagentfunctiondescribeswhattheagentdoesinallcircumstancesTheperformancemeasureevaluatestheenvironmentsequenceAperfectlyrationalagentmaximizesexpectedperformanceAgentprogramsimplement(some)agentfunctionsPEASdescriptionsdefinetaske

人人文庫> 全部分類> 教育資料 > 作文作品

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人工智能02智能體

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人工智能02智能體

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔