智聯(lián)網(wǎng)汽車技術(shù) 課件 6.6自動(dòng)駕駛行為決策_(dá)第1頁(yè)
智聯(lián)網(wǎng)汽車技術(shù) 課件 6.6自動(dòng)駕駛行為決策_(dá)第2頁(yè)
智聯(lián)網(wǎng)汽車技術(shù) 課件 6.6自動(dòng)駕駛行為決策_(dá)第3頁(yè)
智聯(lián)網(wǎng)汽車技術(shù) 課件 6.6自動(dòng)駕駛行為決策_(dá)第4頁(yè)
智聯(lián)網(wǎng)汽車技術(shù) 課件 6.6自動(dòng)駕駛行為決策_(dá)第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

自動(dòng)駕駛行為決策項(xiàng)目三汽車決策控制系統(tǒng)任務(wù)6路徑規(guī)劃系統(tǒng)主講人:楊時(shí)川智能網(wǎng)聯(lián)汽車技術(shù)課程導(dǎo)入自動(dòng)駕駛汽車?yán)眯袨闆Q策系統(tǒng)在復(fù)雜多變的道路環(huán)境中,根據(jù)各種條件自主做出繼續(xù)直行、轉(zhuǎn)彎、減速、變道等決策,它模擬人類駕駛員的思維邏輯,讓汽車獲得獨(dú)立思考和決策的能力。學(xué)習(xí)目標(biāo)學(xué)習(xí)自動(dòng)駕駛汽車行為決策的作用、說(shuō)明其工作流程、概述兩種主要決策方法01理解決策系統(tǒng)的作用和工作流程02解釋兩種決策方法的原理、優(yōu)缺點(diǎn)、以及未來(lái)發(fā)展趨勢(shì)03學(xué)習(xí)任務(wù)根據(jù)所學(xué)知識(shí),為一輛自動(dòng)駕駛汽車設(shè)計(jì)一個(gè)簡(jiǎn)單的決策系統(tǒng)01激活舊知人工智能技術(shù)是如何應(yīng)用于自動(dòng)駕駛汽車的,主要用于哪些方面呢?感知決策控制激活舊知人工智能讓汽車擁有獨(dú)立感知環(huán)境、做出決策的能力!汽車需要根據(jù)導(dǎo)航路線和環(huán)境,自己做出繼續(xù)直行、轉(zhuǎn)彎、變道等決策。探索新知無(wú)人駕駛汽車擁有自己的一套規(guī)劃和決策的系統(tǒng),行為決策就是這套系統(tǒng)的大腦無(wú)人駕駛汽車根據(jù)路網(wǎng)信息和用戶終點(diǎn)設(shè)置完成全局規(guī)劃時(shí),車輛在行駛的過(guò)程中需要檢測(cè)和調(diào)整自身的行駛軌跡,在保證遵守交通規(guī)則的同時(shí)還可以躲避障礙物和行人,達(dá)到人類駕駛行為的要求,完成規(guī)劃的任務(wù)。探索新知

無(wú)人駕駛汽車通過(guò)攝像頭或雷達(dá)等各類傳感器對(duì)真實(shí)環(huán)境進(jìn)行感知與建模,形成環(huán)境模型與局部地圖,GPS和慣性導(dǎo)航系統(tǒng)再根據(jù)環(huán)境模型和局部地圖進(jìn)行定位與建圖,形成全局地圖,然后輸入至行為決策與路徑規(guī)劃模塊,形成局部路徑傳至運(yùn)動(dòng)控制模塊,從而使車輛的運(yùn)動(dòng)狀態(tài)發(fā)生改變,依次循環(huán)。探索新知定義在接收到全局路徑后,自動(dòng)駕駛車輛結(jié)合從感知模塊得到的環(huán)境信息(其他車輛與行人,障礙物,以及道路上的交通規(guī)則信息),考慮周邊環(huán)境、動(dòng)靜態(tài)障礙物、車輛匯入以及讓行規(guī)則等,與無(wú)人駕駛庫(kù)中的經(jīng)驗(yàn)知識(shí)等進(jìn)行匹配,作出適合當(dāng)前交通環(huán)境之下的具體行為決策(選擇變道超車還是跟隨)。行為決策層(BehavioralLayer)探索新知典型算法類型基于強(qiáng)化學(xué)習(xí)的行為決策方法基于規(guī)則的行為決策方法探索新知典型算法類型其主要是將無(wú)人車的運(yùn)動(dòng)行為進(jìn)行劃分,根據(jù)當(dāng)前任務(wù)路線、交通環(huán)境、交通法規(guī)以及駕駛規(guī)則知識(shí)庫(kù)等建立行為規(guī)則庫(kù),對(duì)不同的環(huán)境狀態(tài)進(jìn)行行為決策邏輯推理,對(duì)駕駛員的行為進(jìn)行輸出,同時(shí)接受運(yùn)動(dòng)規(guī)劃層對(duì)當(dāng)前執(zhí)行情況的反饋情況進(jìn)行實(shí)時(shí)動(dòng)態(tài)調(diào)整。基于規(guī)則的行為決策方法全局路徑規(guī)劃層當(dāng)前任務(wù)路線交通狀況駕駛規(guī)則知識(shí)庫(kù)行為決策邏輯推理運(yùn)動(dòng)規(guī)劃層駕駛行為輸出當(dāng)前行為執(zhí)行情況探索新知典型算法類型在基于規(guī)則的行為決策中,有限狀態(tài)機(jī)法是最經(jīng)典也是最具有代表性的方法,其具有實(shí)用性強(qiáng)、可靠性高和邏輯推理清晰等特點(diǎn)。探索新知典型算法類型有限狀態(tài)機(jī):一種離散的數(shù)學(xué)模型,用來(lái)研究有限個(gè)狀態(tài)以及狀態(tài)之間的轉(zhuǎn)移01有限狀態(tài)集合03狀態(tài)轉(zhuǎn)移規(guī)則集合02輸入集合探索新知典型算法類型有限狀態(tài)機(jī):一種離散的數(shù)學(xué)模型,用來(lái)研究有限個(gè)狀態(tài)以及狀態(tài)之間的轉(zhuǎn)移狀態(tài)轉(zhuǎn)移事件動(dòng)作四大要素探索新知典型算法類型超車頂層狀態(tài)機(jī)超車頂層狀態(tài)下的子狀態(tài)機(jī)在超車頂層狀態(tài)機(jī)下設(shè)置了超車子狀態(tài)機(jī),對(duì)超車過(guò)程中不同駕駛階段下的轉(zhuǎn)換進(jìn)行邏輯建模。探索新知典型算法類型左換道準(zhǔn)備為超車子狀態(tài)機(jī)的默認(rèn)初始狀態(tài),在左右換向狀態(tài)下,無(wú)人車將開啟相應(yīng)的轉(zhuǎn)向信號(hào)燈,產(chǎn)生一定的轉(zhuǎn)向偏移,以此來(lái)提示后方車輛。探索新知典型算法類型

并行超越主要用于車輛進(jìn)行超車的階段,指導(dǎo)車輛在超車過(guò)程中的速度變化、方向盤角度變化等,并指導(dǎo)車輛在超車完成后及時(shí)返回原來(lái)的車道,減少在整個(gè)超車過(guò)程中的安全風(fēng)險(xiǎn)。無(wú)人車會(huì)根據(jù)其左后或右后車輛是否避讓的狀態(tài)來(lái)決定是否進(jìn)行下一步的超車計(jì)劃探索新知典型算法類型利用各種學(xué)習(xí)算法來(lái)進(jìn)行決策,利用無(wú)人車配備的各種傳感器,來(lái)感知周邊的環(huán)境信息,傳遞給強(qiáng)化學(xué)習(xí)決策系統(tǒng),此時(shí)強(qiáng)化學(xué)習(xí)決策系統(tǒng)的作用就相當(dāng)于人腦,來(lái)對(duì)各類信息進(jìn)行分析和處理,并結(jié)合經(jīng)驗(yàn)來(lái)對(duì)無(wú)人駕駛汽車做出行為決策?;趶?qiáng)化學(xué)習(xí)算法的行為決策方法探索新知典型算法類型結(jié)合深度學(xué)習(xí)算法的“感知能力”和強(qiáng)化學(xué)習(xí)算法的“決策能力”,為復(fù)雜駕駛場(chǎng)景的感知決策問(wèn)題提供解決方案。是端到端感知和決策控制系統(tǒng)感知(深度學(xué)習(xí))決策(強(qiáng)化學(xué)習(xí))從環(huán)境中獲取目標(biāo)觀測(cè)信息提供當(dāng)前環(huán)境下狀態(tài)信息將當(dāng)前狀態(tài)映射到相應(yīng)動(dòng)作基于預(yù)期匯報(bào)評(píng)判動(dòng)作價(jià)值探索新知典型算法類型1智能體與環(huán)境交互得到觀測(cè)信息,并利用深度學(xué)習(xí)識(shí)別觀測(cè)信息的特征2基于預(yù)期回報(bào)評(píng)判動(dòng)作價(jià)值,并根據(jù)相應(yīng)策略將當(dāng)前狀態(tài)映射到相應(yīng)動(dòng)作3隨動(dòng)作變化而導(dǎo)致智能體與環(huán)境交互得到的觀測(cè)信息發(fā)生變化,進(jìn)入三者的循環(huán)最終得出目標(biāo)的最優(yōu)策略探索新知典型算法類型國(guó)內(nèi)百度公司的端到端系統(tǒng)使用長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Longshorttermmemorynetwork,LSTM)算法實(shí)現(xiàn)車輛縱向決策與控制,使用卷積神經(jīng)網(wǎng)絡(luò)深度強(qiáng)化學(xué)習(xí)模型實(shí)現(xiàn)車輛的橫向決策與控制,同時(shí)實(shí)現(xiàn)了對(duì)車輛橫縱方向上的駕駛行為決策與車輛控制。長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)算法探索新知典型算法類型自動(dòng)駕駛汽車公司W(wǎng)aymo通過(guò)模擬駕駛及道路測(cè)試來(lái)獲取了大量的數(shù)據(jù)對(duì)其基于學(xué)習(xí)算法的行為決策系統(tǒng)進(jìn)行訓(xùn)練,使得該系統(tǒng)對(duì)物體的檢測(cè)性能得到了極大地提高,還可以對(duì)障礙物進(jìn)行語(yǔ)義理解等。探索新知典型算法類型基于規(guī)則的行為決策具有易于搭建和調(diào)整,實(shí)時(shí)性好,應(yīng)用簡(jiǎn)單等優(yōu)點(diǎn),但由于其難以適應(yīng)所有情況,需要進(jìn)行針對(duì)性調(diào)整,其行為規(guī)則庫(kù)易重疊而失效,有限狀態(tài)機(jī)難以覆蓋車輛可能遇到的所有工況而導(dǎo)致決策錯(cuò)誤。探索新知典型算法類型基于強(qiáng)化學(xué)習(xí)的行為決策由于其強(qiáng)大的數(shù)據(jù)訓(xùn)練集,可以減小環(huán)境的不確定性因素帶來(lái)的影響,但是它需要大量的數(shù)據(jù)來(lái)進(jìn)行預(yù)處理,計(jì)算量大,實(shí)時(shí)性差。探索新知典型算法類型隨著科學(xué)技術(shù)的突飛猛進(jìn),以及近些年人工智能、強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)等的快速發(fā)展,結(jié)合上訴兩種方法的優(yōu)勢(shì),頂層采用基于規(guī)則的決策,底層采用強(qiáng)化學(xué)習(xí)等算法,可以發(fā)揮學(xué)習(xí)算法的優(yōu)勢(shì),增強(qiáng)場(chǎng)景的遍歷深度,兩種

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論