版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章智能體教材ArtificialIntelligence–Amodernapproach(2013)
S.RussellandP.Norvig
人工智能—一種現(xiàn)代方法(第二版)學(xué)校發(fā)的教材參考概率推理、機(jī)器學(xué)習(xí)部分理性的行動(dòng):MaximizeYour
ExpectedUtility使目標(biāo)期望值最大化!智能體Anagentisanythingthatcanbeviewedasperceivingitsenvironmentthroughsensorsandactinguponthatenvironmentthroughactuators。一個(gè)智能體是能通過傳感器來感知周圍環(huán)境并通過執(zhí)行器來行動(dòng)的任何東西。Agentsincludehumans,robots,softbots(軟件機(jī)器人),
thermostats(自動(dòng)調(diào)溫器),etc.
Humanagent人類智能體:
eyes,ears,andotherorgansforsensors;
hands,legs,mouth,andotherbodypartsforactuators
Roboticagent機(jī)器人智能體:
camerasandinfraredrangefinders(紅外測(cè)距儀)forsensors;
variousmotors(馬達(dá))foractuators智能體和環(huán)境Theagentfunction(智能體函數(shù))
mapsfrompercepthistories(感知序列)
toactions(行動(dòng)):
[f:P*→A]
Theagentprogram(智能體程序)
runsonthephysicalarchitectureto
producef
agent=architecture(體系結(jié)構(gòu))+program(程序)
兩地點(diǎn)真空吸塵器世界Percepts:locationandcontents,e.g.,[A,Dirty]
Actions:Left,Right,Suck,NoOp
真空吸塵智能體Whatistherightfunction?
Canitbeimplemented(應(yīng)用)inasmallagentprogram?
理性智能體Anagentshouldstriveto“dotherightthing”,basedonwhatit
canperceiveandtheactionsitcanperform.Therightactionis
theonethatwillcausetheagenttobemostsuccessful對(duì)的行動(dòng)就是使智能體更加成功的行動(dòng)
Performancemeasure(性能度量):Anobjectivecriterion(客觀標(biāo)準(zhǔn))forsuccessofanagent'sbehavior
E.g.,performancemeasureofavacuum-cleaneragentcould
be:
灰塵清理量
耗電量
噪音產(chǎn)生量,etc.理性智能體RationalAgent:Foreachpossibleperceptsequence,a
rationalagentshouldselectanactionthatisexpected
tomaximizeitsperformancemeasure,giventhe
evidenceprovidedbytheperceptsequenceand
whateverbuilt-inknowledgetheagenthas.
理性智能體:對(duì)于每一個(gè)可能的感知序列,理性智
能體應(yīng)該基于已知的感知序列提供的信息,和智能
體已有的先驗(yàn)知識(shí),選擇能夠使它的性能度量最大
化的行為。
理性智能體理性與全知(all-knowingwithinfiniteknowledge)
是截然不同的Agentscanperformactionsinordertomodifyfuture
perceptssoastoobtainusefulinformation
(informationgathering,exploration)
智能體會(huì)為了獲取有用信息而采取行動(dòng)——信息收集
Anagentisautonomousifitsbehaviorisdetermined
byitsownexperience(withabilitytolearnand
adapt)
理性智能體應(yīng)該能夠自主地學(xué)習(xí),以彌補(bǔ)不全面或
不正確的先驗(yàn)知識(shí)。理性智能體Arationalagentchooseswhicheveractionmaximizestheexpectedvalueoftheperformancemeasuregiventheperceptsequencetodate
Rational≠omniscient(全知的)
—perceptsmaynotsupplyallrelevantinformation
Rational≠clairvoyant(洞察力)
—actionoutcomesmaynotbeasexpected
Hence,rational≠successfulRational?exploration探索,learning學(xué)習(xí),autonomy自主性Agent:自動(dòng)駕駛汽車Performancemeasure性能度量:safety,destination,profits,legality,comfort,…
Environment環(huán)境:streets/freeways,traffic,pedestrians,weather,…
Actuators執(zhí)行器:steering,accelerator,brake,horn,speaker/display,…
Sensors傳感器:video,accelerometers,gauges,enginesensors,keyboard,GPS,…任務(wù)環(huán)境PEAS
任務(wù)環(huán)境屬性完全可觀察(vs.部分可觀察):如果一直智能體的傳感器每個(gè)時(shí)間節(jié)點(diǎn)上都能讓它訪問獲取環(huán)境的完整狀態(tài)
確定性的(vs.隨機(jī)的):如果環(huán)境的下一個(gè)狀態(tài)完全決定于當(dāng)前的狀態(tài)和智能體執(zhí)行的動(dòng)作.(如果環(huán)境是確定性的,除非有其它智能體活動(dòng)的影響,那么我們稱該環(huán)境是策略的)
片段式的(vs.延續(xù)式的)
:智能體的經(jīng)驗(yàn)被分成了一個(gè)個(gè)原子片段(每個(gè)片段的組成包含了智能體所感知的信息以及進(jìn)而執(zhí)行的單個(gè)行動(dòng)),and行動(dòng)的選擇只取決于當(dāng)前片段自身.
如裝配線上檢測(cè)次品零件的機(jī)器人只需要把每次決策建立在當(dāng)前零件基礎(chǔ)上,
不用考慮以前的決策。任務(wù)環(huán)境屬性靜態(tài)的
(vs.動(dòng)態(tài)的):如果環(huán)境在智能體思考的時(shí)候不會(huì)變化.(如果環(huán)境本身不隨時(shí)間的流逝變化,但智能體的性能評(píng)價(jià)隨時(shí)間變化,那么我們稱這個(gè)環(huán)境是半動(dòng)態(tài)的)
離散的(vs.連續(xù)的):包含有限個(gè)數(shù)的獨(dú)特狀態(tài).下棋、開車
單智能體
(vs.多智能體):Anagentoperatingby
itselfinanenvironment.任務(wù)環(huán)境屬性任務(wù)環(huán)境屬性取決于任務(wù)環(huán)境是如何定義的
Therealworldis(ofcourse)部分可觀察的,隨機(jī)的,延續(xù)式的,動(dòng)態(tài)的,連續(xù)的,多智能體的~
智能體函數(shù)和程序Anagentiscompletelyspecifiedbytheagent
functionmappingperceptsequencestoactions
Oneagentfunction(orasmallequivalenceclass)isrational
目標(biāo):findawaytoimplementtherationalagent
functionconcisely
Table-lookupagent\input{algorithms/table-agent-algorithm}
缺陷:
空間大
創(chuàng)建表的時(shí)間太長(zhǎng)
沒有自主性
即使采用學(xué)習(xí)的方法,智能體在有限時(shí)間
內(nèi)無法學(xué)習(xí)所有表項(xiàng)
智能體類型四種基本的智能體程序,按通用性遞增排序:
—simplereflexagents簡(jiǎn)單反射型智能體
—reflexagentswithstate基于模型的反射型智能體
—goal-basedagents基于目標(biāo)的智能體
—utility-basedagents基于效用的智能體
Allthesecanbeturnedintolearningagents學(xué)習(xí)智能體簡(jiǎn)單反射型智能體基于模型的反射型智能體基于目標(biāo)的智能體基于效用的智能體學(xué)習(xí)智能體SummaryAgentsinteractwithenvironmentsthroughactuatorsandsensorsTheagentfunctiondescribeswhattheagentdoesinallcircumstancesTheperformancemeasureevaluatestheenvironmentsequenceAperfectlyrationalagentmaximizesexpectedperformanceAgentprogramsimplement(some)agentfunctionsPEASdescriptionsdefinetaske
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年在煤礦青工運(yùn)動(dòng)會(huì)上講話(2篇)
- 掘進(jìn)工作面綜合防塵規(guī)定(3篇)
- 安全生產(chǎn)月活動(dòng)工作方案模版(3篇)
- 2024年醫(yī)務(wù)人員醫(yī)德醫(yī)風(fēng)總結(jié)樣本(2篇)
- 縣森林防火應(yīng)急預(yù)案(2篇)
- 2024年單項(xiàng)工程施工合同標(biāo)準(zhǔn)版本(3篇)
- 2024年家具銷售合同參考樣本(2篇)
- 教師節(jié)促銷活動(dòng)方案范例(2篇)
- 剪板機(jī)作業(yè)安全規(guī)程模版(3篇)
- 保衛(wèi)工作實(shí)施方案例文(4篇)
- 第45屆世界技能大賽焊接項(xiàng)目全國(guó)選拔賽技術(shù)工作文件
- 藥品經(jīng)營(yíng)使用和質(zhì)量監(jiān)督管理辦法2024年宣貫培訓(xùn)課件
- 《老年人生活照護(hù)》試卷B卷及答案
- 課程設(shè)計(jì)幾種排序算法
- 北京市第四中學(xué)2024-2025學(xué)年七年級(jí)上學(xué)期期中生物學(xué)試題(含答案)
- 學(xué)前教育法學(xué)習(xí)重點(diǎn)1
- 體育教師先進(jìn)個(gè)人事跡材料
- 夏縣縣城污水處理提質(zhì)增效-一廠一策-系統(tǒng)化整治方案
- 幼兒園中班健康《運(yùn)動(dòng)過后》課件
- 2025屆江蘇省蘇州市第一中學(xué)物理高三第一學(xué)期期末學(xué)業(yè)水平測(cè)試模擬試題含解析
- 門衛(wèi)室承包合同
評(píng)論
0/150
提交評(píng)論