代理人和環(huán)境ppt課件_第1頁
代理人和環(huán)境ppt課件_第2頁
代理人和環(huán)境ppt課件_第3頁
代理人和環(huán)境ppt課件_第4頁
代理人和環(huán)境ppt課件_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、大綱代理人和環(huán)境理性PEASPerformance measure, Environment, Acturators, Sensors環(huán)境類別代理人類別代理人定義:任何的東西,可以經(jīng)由感應(yīng)器感遭到環(huán)境,經(jīng)由行動器來對環(huán)境做出反應(yīng)。人類代理人:眼睛,耳朵,其他的器官,可以來作為感應(yīng)的。手,腳其他的器官,可以來作為行動器官的。機(jī)器代理人:攝影機(jī),溫度計,可以來作為感應(yīng)的。 機(jī)器手臂,輪子可以來作為行動器官的。 理性代理人代理人的架構(gòu)代理人的功能和程式:代理人是以代理人功能(agent function)為其特徵的,此function將感知轉(zhuǎn)換為行動一個代理人的功能是理性的(rational)目標(biāo):

2、找出一個方法來將理性代理人的功能正確的實作出來代理人和環(huán)境代理人函數(shù)將感知到的歷史對應(yīng)到行動。 F:P*A代理人程式執(zhí)行在實際的設(shè)備中以產(chǎn)生F帶查表代理人缺點:宏大的表格建表所要花的時間需求很大沒有自動化甚至假設(shè)是需求學(xué)習(xí),也要花很多時間來看表格智慧代理人的結(jié)構(gòu)代理人=硬體結(jié)構(gòu)+程式代理人程式:將函數(shù):感知行動實做出來.硬體結(jié)構(gòu):一個設(shè)備能夠執(zhí)行代理人程式的代理人型態(tài)根本的型態(tài):簡單反射的代理人模型基礎(chǔ)的反射代理人目標(biāo)基礎(chǔ)的代理人效能基礎(chǔ)的代理人學(xué)習(xí)代理人反射代理人反射代理人:沒有記憶動作:根據(jù)目前的狀態(tài)來決定要採取的行動.反射代理人反射代理人反射代理人例如:吸塵器自動駕駛計程車問題:人類的所

3、作的動作是基於學(xué)習(xí)後的反應(yīng)或是自然的反射動作?反射代理人反射代理人的動作雖然很簡單.但是彼此間的相互的反應(yīng)會呵斥複雜的模型.好處:快速.健全挑戰(zhàn):夠複雜?智慧?反射代理人問題:將自動吸塵器的位置感應(yīng)器移除後.會發(fā)生什麼?(在不同的環(huán)境中)模型基礎(chǔ)的反射代理人紀(jì)錄一些內(nèi)部狀態(tài)(已過已經(jīng)發(fā)生的.或之前所採取的行動)需求紀(jì)錄兩種的知識在代理人的實作方法:在這世界中發(fā)生的事.和代理人是有間接相關(guān)的代理人所採取的行動會對世界呵斥怎樣的影響.模型基礎(chǔ)的反射代理人模型基礎(chǔ)的反射代理人目標(biāo)基礎(chǔ)的代理人代理人需求有一些目標(biāo)排序的資訊.例如:自動駕駛計程車(如何使得長期目標(biāo)能達(dá)到.小目標(biāo)的做法的選擇.)目標(biāo)基礎(chǔ)的

4、代理人目標(biāo)基礎(chǔ)的代理人挑戰(zhàn):能否夠好了?效能基礎(chǔ)代理人目標(biāo)基礎(chǔ)代理人不夠好.因為其無法產(chǎn)生出高品質(zhì)的行為.例如:自動駕駛計程車.除了要達(dá)到目的地外.還要考慮什麼要素?目標(biāo)基礎(chǔ)代理人運用了2分法來作判斷?效能基礎(chǔ)代理人效能基礎(chǔ)代理人將一個狀態(tài)對應(yīng)到真實的數(shù)字.來代表該目標(biāo)能被滿足的程度.效能基礎(chǔ)代理人學(xué)習(xí)代理人四種組成元素:評論者學(xué)習(xí)元素表現(xiàn)元素問題產(chǎn)生器學(xué)習(xí)代理人行動代理人行動代理人是一種程式.能從一個機(jī)器上移植到另一個機(jī)器上.可以在跨平臺的環(huán)境上執(zhí)行.例如:JAVA需求有代理人能夠執(zhí)行的環(huán)境行動代理人好處:減少溝通的花費非同步的計算行動代理人兩種類型:單點行動代理人(從一地移植到另一地)多點

5、行動代理人(在網(wǎng)路上的漫遊)行動代理人應(yīng)用:分散式資料擷取Voip行動代理人PEASPEAS: Performance measure(表現(xiàn)評量), Environment(環(huán)境), Actuators(行動器), Sensors(接納器)例如:考慮taxi driver:Performance measureEnvironmentActuatorsSensorsPEASConsider, e.g., the task of designing an automated taxi driver:Performance measure: Safe, fast, legal, comfortabl

6、e trip, maximize profitsEnvironment: Roads, other traffic, pedestrians, customersActuators: Steering wheel, accelerator, brake, signal, hornSensors: Cameras, sonar, speedometer, GPS, odometer, engine sensors, keyboardPEASAgent: Medical diagnosis systemPerformance measure: Healthy patient, minimize c

7、osts, lawsuitsEnvironment: Patient, hospital, staffActuators: Screen display (questions, tests, diagnoses, treatments, referrals)Sensors: Keyboard (entry of symptoms, findings, patients answers)PEASAgent: Part-picking robotPerformance measure: Percentage of parts in correct binsEnvironment: Conveyor

8、 belt with parts, binsActuators: Jointed arm and handSensors: Camera, joint angle sensorsPEASAgent: Interactive English tutorPerformance measure: Maximize students score on testEnvironment: Set of studentsActuators: Screen display (exercises, suggestions, corrections)Sensors: KeyboardEnvironment typ

9、es(全域觀察)Fully observable (vs. partially observable): 一個agent的接納器能否可以一次就可以看完一切的環(huán)境狀態(tài) (可決定的)Deterministic (vs. stochastic): 環(huán)境的下一個狀態(tài)完全是根據(jù)於目前的狀態(tài)以及目前所採取的行動 ,不會遭到其他agent的影響。(片段的)Episodic (vs. sequential): 一個agent的經(jīng)驗可以被分成多個片段,而agent要做決定時,只需求根據(jù)根據(jù)這個片裡的感知來做就好了。Environment types(靜態(tài)的)Static (vs. dynamic): 當(dāng)一個ag

10、ent在思索說下一步要如何做的時候,環(huán)境在此時是不會改變的。(離散的)Discrete (vs. continuous): 有限數(shù)目的不同,清楚的感知和行動。 (單一代理人)Single agent (vs. multiagent)Environment typesChess with Chess without Taxi driving a clocka clockFully observableYesYesNo DeterministicStrategicStrategicNo Episodic NoNoNo Static SemiYes No DiscreteYes YesNoSingle agentNoNoNo The en

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論