AI大模型賦能人形機器人邁向人工智能的一大步_第1頁
AI大模型賦能人形機器人邁向人工智能的一大步_第2頁
AI大模型賦能人形機器人邁向人工智能的一大步_第3頁
AI大模型賦能人形機器人邁向人工智能的一大步_第4頁
AI大模型賦能人形機器人邁向人工智能的一大步_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

請務必閱讀正文之后的免責條款部分產(chǎn)業(yè)深度2023.05.192023.05.19AI大模型賦能人形機器人,邁向通用人工智能的一大步摘要:作者:肖群稀電話格證書編號:S0880522120001作者:鮑雁辛電話箱:baoyanxin@資格證書編號:S0880513070005AI大模型賦能人形機器人,邁向通用人工智能的一大步摘要:作者:肖群稀電話格證書編號:S0880522120001作者:鮑雁辛電話箱:baoyanxin@資格證書編號:S0880513070005解、多語種識別、多輪對話、情緒識別、模糊語義識別等通用語言任務上,C備品類、算法、實時算力要求更高。4)運動控制:類似于工業(yè)機器人產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分2of27 33 3 4 8 8 9 3.人形,讓機器人的運動執(zhí)行更加通用 3.1.1.電驅(qū)成本低、易于維護、控制精度高,商業(yè)化潛力高 3.2.1.波士頓動力Atlas:深度相機+ 3.2.2.特斯拉Optimus: 3.3.運動控制:尚未形成通用的控制器解決方案 3.3.1.運動控制算法:思路相似,均為離線行為庫和實時調(diào)整.223.3.2.運動控制器:多為自主設(shè)計,不同廠商需求差異大 4.投資結(jié)論及產(chǎn)業(yè)鏈梳理 產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分3of271.通用——解決機器人高需求和低滲透率的矛盾到通用服務機器人商業(yè)化落地的前提是產(chǎn)品能提供真實價值,真實價值的判斷在于機器人我們認為原因在于:目前大多數(shù)服務機器人都或多或少的存在場景適應性的問題,如無法適應環(huán)境變化,環(huán)境變化后,用戶無法通過簡單操作實現(xiàn)場景適配;智能化與,且當需要變更時,仍需現(xiàn)場部署工程師進行操作。以商超場景為例:發(fā)生碰撞、跌落、無法靠近作業(yè)。對于依賴視覺傳感器的機器人來說,要在普通光線、黑暗、過曝等光照條件都能穩(wěn)定運行難度較大。以上問題在工業(yè)機器人領(lǐng)域同樣存在,影響了工業(yè)機器人滲透率的提升,直到協(xié)作機器人的出現(xiàn)。2022年全球協(xié)作機器人市場規(guī)模89.5億元人民幣,預計2022~2028年市場規(guī)模將以22.05%的增速達到30協(xié)作機器人也可以被認為是服務機器人,因為他們旨在與人類并肩作戰(zhàn)。傳統(tǒng)機器人在柵欄后與人分開作業(yè),完成的工作也有限,例如焊接、噴涂、吊裝等。協(xié)作機器人更靈活,更智能,更容易合作,更具有適應能力,使汽車、電子等制造行業(yè)能夠?qū)⒆詣踊瘮U展到最終產(chǎn)品組裝,完成任務(例如拋光和施涂涂層)以及質(zhì)量1.2.如何讓機器人更加通用?使機器人更加通用,需要機器人的感知能力、思考和決策能力、行動執(zhí)行能力的全面提升。我們認為GPT(預訓練大預言模導航是主流應用方案。計算機視覺的發(fā)展經(jīng)歷了基于以特征描述子代表的傳統(tǒng)視覺方法、以CNN卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學習技術(shù),目前于研究探索階段,人形機器人的場景相對工業(yè)機器人更通用、更復雜,視覺大模型大模型的強擬合能力使得人形機器人在進行目標識別、避障、三維重建、語義分割等任務時具備更高的精確度;另一方面,大模型解決了深度學習技術(shù)過分依賴單一任務數(shù)據(jù)分布,場景泛化效果不佳的問題,通用視覺大模型通過大量數(shù)據(jù)學到更多的通用知識,并遷移到下游任務中,基于海量數(shù)據(jù)獲得的預訓練模型具有較好的知產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分4of27景中應用,即使是機器人抓取,基于計算機視覺,仍然是在限定場景中,算法僅用于識別物體,如何做、做什么仍需要人的定義。要讓機器人通用,叫他就知道去拿水壺,接水,然后澆花,這是需要常識才能完成的事情。如何能讓機器人擁有常識?在大模型出現(xiàn)之前,這個問題幾乎是無解的。大模型讓機器人可以擁人類工具和環(huán)境的適應性,不用再為了機器人而造工具。執(zhí)行能力讓機器人的執(zhí)行能力更加通用。機器人執(zhí)行任務時所處的環(huán)境是按照人類的體型建造起來的:建筑、道路、設(shè)施、工具等,這個世界是為了方便人類這種人形生物才這樣設(shè)計。如果出現(xiàn)了某種新形態(tài)的機器人,人們就必須重新設(shè)計一套機器人適應的全新環(huán)境。設(shè)計在某個特定范圍內(nèi)執(zhí)行任務的機器人相對容易,如果想要提高機器人的通用性,就必須選擇可以作為分身的人形機器人。此外,人類與人形機器人更容易有情感上的交流,人形機器人會讓人感到親近。日本機器人專家森昌弘的假設(shè)指出:由于機器人與人類在外表、動作上相似,所以人類亦會對機器人產(chǎn)生正面的情感。1.3.人形機器人進入商業(yè)化前夜形機器人的商業(yè)形態(tài)。我們對人形機器人發(fā)展過程中有代表性的產(chǎn)品進行了梳理:團隊研發(fā)出世界上第一臺真人大小的人形智能機器人——WABOT-1。該機器人有產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分5of27各種人類肢體動作之外,還可以預先設(shè)定動作,并依據(jù)人類的聲音、手勢等指令,數(shù)據(jù)來源:樂博機器人、國泰君安證券研究數(shù)據(jù)來源:樂博機器人、國泰君安證券研究頭與國立先進工業(yè)科學技術(shù)研究院(AIST)和川崎重工株式會社共同研發(fā)的通用家數(shù)據(jù)來源:樂博機器人、國泰君安證券研究產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分6of27波士頓動力最早因研發(fā)的BigDog而被世界聞名,機器人到人形機器人,有著明顯的軍事化應用的路線特征。波士頓動力是一家典型的技術(shù)驅(qū)動的公司,從機械結(jié)構(gòu)、算法步態(tài)控制、動力系統(tǒng)耗能等方面對機器人持續(xù)迭代更新,核心在于發(fā)展腿式機器人以適應不同環(huán)境的使用,技術(shù)關(guān)鍵在于動力數(shù)據(jù)來源:公司官網(wǎng)、國泰君安證券研究列是AgilityRobotics公司在物流領(lǐng)域商業(yè)化的嘗試,公司是從俄勒岡州立大學(OSU)拆分出來的機器人公司,致力于研發(fā)和制造雙足機器人,前后開發(fā)了數(shù)據(jù)來源:Aleteia、國泰君安證券研究式機器人的首次嘗試。2022年8月,小種人類語義情緒,分辨85種環(huán)境語義;搭產(chǎn)業(yè)深度數(shù)據(jù)來源:優(yōu)必選、國泰君安證券研究數(shù)據(jù)來源:TeslaInvestorday2023、國泰君安證券研究年面世。索菲婭皮膚由Frubber仿生材料制成,基于語音識別、計算機視覺技術(shù),后,能對著鏡子眨眼、抿嘴、皺眉、微笑。阿梅卡能夠自由進行幾十種仿人類的肢體運動,被認為是“世界上最逼真機器人”。數(shù)據(jù)來源:Aleteia、國泰君安證券研究數(shù)據(jù)來源:視覺中國、國泰君安證券研究請務必閱讀正文之后的免責條款部分7of27產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分8of27我們選擇了7款有代表性的人形機器人,從驅(qū)動、感知、控制器三個方面進Atlas系列ICUB3WalkerX45kg48kg4041-部三枚攝像頭(魚眼+左+右)激光傳感外部計算機集群+總控板卡+DSP負-三臺計算機數(shù)據(jù)來源:本田官網(wǎng)、波士頓動力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國泰君安證券研究2.AI大模型+人形機器人:給機器人提供常識2、GPT-3、GPT-4模型的出現(xiàn),模型的參數(shù)量級實現(xiàn)了遷移學習是預訓練模型的主要思想,當目標場景數(shù)據(jù)不足時,先在數(shù)據(jù)量大的公開場景中的小數(shù)據(jù)集進行微調(diào),使模型達到要求的性能。預訓練模型極大地減少了模產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分9of27數(shù)據(jù)來源:IBMDeveloper、國泰君安證券研究大模型的發(fā)展過程和趨勢:從參數(shù)規(guī)模上看,大模型經(jīng)歷了從預訓練模型、大規(guī)模從數(shù)據(jù)模態(tài)來看,大模型正在從文本、語音、視覺等單一模態(tài)大模型,向著多種模數(shù)據(jù)來源:百度、國泰君安證券研究感知、決策、控制閉環(huán),大大提升機器人的“智慧”程度:語言交互。例如,機器人可以通過ChatGPT來理解人類指令進行相應的動作。自然語言是人類最通用的交互媒介,語音作為自然語言的載體將會是機器人擬人化的關(guān)鍵任務。盡管深度學習的出現(xiàn)已經(jīng)自然語言處理、語音生成技術(shù)為構(gòu)成模塊的語音交互技術(shù)推向相對成熟情況。語言大模型為機器人的自主語音交互難題提供了解決方現(xiàn)出了不亞于人類的理解力和語言生成能力。在以請務必閱讀正文之后的免責條款部分10of27視覺:視覺大模型賦能人形機器人識別更精確,場景更通用。計算機視覺的發(fā)展經(jīng)歷了基于以特征描述子代表的傳統(tǒng)視覺方法、以CNN卷積神學習技術(shù),目前通用的視覺大模型正處于研究探索階段。一方面,大參數(shù)量模型的強擬合能力使得人形機器人在進行目標識別、避障、三維重建、語義分割等任務時具備更高的精確度;另一方面,通用大模型解決了過去以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學習技術(shù)過分依賴單一任務數(shù)據(jù)分布,場景泛化效果不佳的問題,通用視覺大模型通過大量數(shù)據(jù)學到更多的通用知識,并遷移到下游任務中,基于海量數(shù)據(jù)獲得的預訓練模型具有較好的知識完備性,大大提升場景泛化效果。人形機器人的場景相決策:通用語言、環(huán)境感知能力是自動化決策的基礎(chǔ),多模態(tài)大模型契合人形機器人的決策需求。單一模態(tài)智能無法解決設(shè)計多模態(tài)信息的決策問題,如“語音告知機器人去取桌子上綠色蘋果”的任務。多模態(tài)統(tǒng)一建模,目的是增強模型的跨模態(tài)語義對齊能力,使模型逐步標準化,使得機器人能綜合視覺、語音、文本多維度信息,實現(xiàn)各感官融合決策的能力?;诙嗄B(tài)的預訓練大模型或?qū)⒊蔀槿斯ぶ悄芑A(chǔ)設(shè)施,增強機器人可完成任務的多樣性與通用性,讓其不只局限于文本和圖像等單個部分,而是多應用相容,拓展單一智能為融合智能,使機器人能結(jié)合其感知到產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分11of27數(shù)據(jù)來源:北京大學多媒體信息研究室、國泰君安證券研究機器人的感知、決策、動作形成閉環(huán),達到自我控制的目的。事實上,近來微軟團隊已經(jīng)嘗試將ChatGPT應用于機器人控制的場景中,通過的推動下,機器人編程的門檻將會慢慢降低,最終實現(xiàn)自我編程、自我控制,并完2.3.OpenAI和微軟將大語言模型應用于機器人機器人環(huán)節(jié)和事后經(jīng)驗回訪基線實施,并用來訓練在物理機器人上工作的模型。22數(shù)據(jù)來源:IBMDeveloper、國泰君安證券研究產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分12of27這項研究的目標是觀察ChatGPT是否可以超越文本思考用,并在后端講高級函數(shù)庫鏈接到各個平臺,場景和工具的現(xiàn)有庫和API。結(jié)果證對話系統(tǒng)中輸出相關(guān)操作,不需要生成代碼。這樣,人類可以實現(xiàn)無縫部署各種平人類在機器人pipeline中的任務主要是行設(shè)計,并且應該從機器人的控制棧或感知庫映射到現(xiàn)有的低層次具體實現(xiàn)。為高些函數(shù)可用。提示還可以包含有關(guān)任務約束的信息,或者Ch產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分13of27ChatGPT可以以zero-shot的方式解決簡單的機器人任務。對于簡單的法的大部分關(guān)鍵模塊,但需要人工反饋無人機朝向等信息。人工反饋高級的自然語在其“代碼“輸出中構(gòu)建感知-動作循環(huán),實現(xiàn)估計相對物體角度、探索未知環(huán)境、輸出僅返回向前的運動距離和轉(zhuǎn)彎角度,實現(xiàn)了用“對話系統(tǒng)”指導機器人一步步產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分14of273.人形,讓機器人的運動執(zhí)行更加通用是為了讓機器人的執(zhí)行能力更加通用。機器人執(zhí)行任務時所處的環(huán)境是按照人類的體型建造起來的:建筑、道路、設(shè)施、工具等,這個世界是為了方便人類這種人形生物才這樣設(shè)計。如果出現(xiàn)了某種新形態(tài)的機器人,人們就必須重新設(shè)計一套機器人適應的全新環(huán)境。設(shè)計在某個特定范圍內(nèi)執(zhí)行任務的機器人相對容易,如果想要提高機器人的通用性,就必須選擇可以作為分身的人形機器人。本章選擇兩個代表波士頓動力Altas定位于技術(shù)的前瞻性研究,側(cè)重探索技術(shù)應用的可能性而非商業(yè)化。從硬件架構(gòu)來看,Altas具備出色的動頓動力當前主要考量因素,Altas項目更多作為一個研究平臺供研究者進行學術(shù)試特斯拉Optimus發(fā)心于人形機器人的規(guī)?;?、商業(yè)化、標準化,商業(yè)化的目標驅(qū)產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分15of27Altas200萬美元的運動(跑酷、后空翻等)大電池組:52V、較低成本實現(xiàn),相對動態(tài)性能數(shù)據(jù)來源:BostonDynamics、TeslaAIDay2022、國泰君安證券研究3.1.1.電驅(qū)成本低、易于維護、控制精度高,商業(yè)化潛力高比電氣驅(qū)動,液壓驅(qū)動輸出力矩大、功率密度高和過載能力強,因而能滿足波士頓時容易出現(xiàn)漏液等問題、可維護性差。一方面,商用場景下高后空翻等)屬于非必要行為,另一方面,隨著電驅(qū)系統(tǒng)功率密度和響應速度的不斷提升,我們認為結(jié)合電驅(qū)成本低、易于維護且技術(shù)應用成熟的優(yōu)勢,基于電驅(qū)的人Atlas系列優(yōu)必選-WalkerX本田ASIMO液壓驅(qū)動電機驅(qū)動電機驅(qū)動電機驅(qū)動電機驅(qū)動電機驅(qū)動電機驅(qū)動Atlas的液壓動力源21個模組驅(qū)機+諧波減速+驅(qū)動控14個旋轉(zhuǎn)執(zhí)行器、均由電機+減速器流檢測/扭力傳感數(shù)據(jù)來源:本田官網(wǎng)、波士頓動力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國泰君安證券研究數(shù)據(jù)來源:Ofweek、國泰君安證券研究產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分16of273.1.2.波士頓動力Atlas:采用“液壓驅(qū)動”方案電液經(jīng)由流體管線連接至各液壓泵,可實現(xiàn)快速響應和精確力控,其高瞬時功率密度的液壓驅(qū)動器能支持機器人實現(xiàn)奔跑、跳躍、后空翻等復雜動作,機器人的結(jié)構(gòu)數(shù)據(jù)來源:MOOG、國泰君安證券研究數(shù)據(jù)來源:BostonDynamics、國泰君安證券研究3.1.3.特斯拉Optimus:采用“電動驅(qū)動”節(jié)部分采用減速器/絲桿+伺服電機的傳動方式,共計數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究人,線性執(zhí)行器和微型伺服電機是人形機器人新需求,具體看:產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分17of27數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究-2*2=4-286數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究,以上均為國泰君安根據(jù)發(fā)布會信息隨著更多廠商的涌入,其執(zhí)行器方案可能存在差異,若線性執(zhí)行器被旋轉(zhuǎn)執(zhí)行器替--286數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究,以上均為國泰君安根據(jù)發(fā)布會信息產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分18of27行器空間利用率高、能提供較大的推動力。我們猜測,線性執(zhí)行器基于力矩電機結(jié)合行星滾柱絲杠的方案將應用于線性執(zhí)行器關(guān)節(jié)(髖、膝、踝、肘、腕)中,預計2*2=4數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究,以上均為國泰君安根據(jù)發(fā)布會信息行星滾柱絲杠以其高承載、高剛度、長壽命的特點或成為人形機器人線性執(zhí)行器的絲杠一體式伺服電動缸。我們認為下肢髖、膝、踝關(guān)節(jié)及上肢的肘關(guān)節(jié)的伺服電缸采用高承載、高剛度的行星滾柱絲杠作為傳動裝置可能性比較大。行星滾柱絲杠結(jié)構(gòu)復雜、加工難度大因而成本很高,通過調(diào)整設(shè)計、工藝方案適配人形機器人的需數(shù)據(jù)來源:博特精工、國泰君安證券研究機械手:Optimus單手包括6個執(zhí)行器,可實現(xiàn)11個自的數(shù)目小于其自由度數(shù)目,因為機械手本身高自由度數(shù)目的特性,出于提高系統(tǒng)設(shè)計的集成性、緊湊性和降低成本、更出于簡化后續(xù)運動控制的考慮,設(shè)計者們會減欠驅(qū)動方案。通過通過機械結(jié)構(gòu)的優(yōu)化實現(xiàn)以較少的執(zhí)行機構(gòu)驅(qū)動更多的自由度,產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分19of27君安證券研究1.從機電系統(tǒng)硬件層面上來說,系統(tǒng)的整體集成性太差:在現(xiàn)有電機和機械傳動方案下,全驅(qū)動機械手往往是“龐然大物”2.上層的運動控制系統(tǒng)繁瑣及冗雜:所需控制關(guān)節(jié)與執(zhí)行器眾多的緣故,與欠驅(qū)動方案相比缺乏抓取物體的“形狀自適應性”3.缺乏抗外界沖擊的柔性:這一點在機械手實際運用當中相當重要,尤其是針對【手指關(guān)一次較大的沖擊往往意味著損壞一個關(guān)節(jié)電機;4.設(shè)計復雜以及成本過高:20多個電機及機械傳動的設(shè)計與成本再怎么精打細算1.機電系統(tǒng)硬件上系統(tǒng)的集成度高:整體系統(tǒng)簡潔高效,體積小,質(zhì)量輕,目前適2.上層運動控制系統(tǒng)簡潔高效:以PISA饋閉環(huán),就能實現(xiàn)對絕大多數(shù)物體的抓握。欠驅(qū)動的機械特性能夠使得手指自動適應物體的形狀,具備很好的”形狀自3.具備良好的抗外界沖擊柔性:欠驅(qū)動的特4.設(shè)計簡潔以及成本低廉:與全驅(qū)動方案相比1.欠驅(qū)動機械手的缺點在于功能性不足,尤其是對于精度要求比較高的手指精巧控數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究。注:以上均為國泰君安根據(jù)發(fā)布會信息推測機械手驅(qū)動方案差異較大,電機的輕量化、低成本是關(guān)鍵。機械傳動結(jié)構(gòu)上,機械構(gòu)緊湊和抓取力強的要求,因此電機應具有尺寸小、質(zhì)量輕、精度高、扭矩大的特點。空心杯電機結(jié)構(gòu)緊湊、能量密度高、能耗低,和人形機器人機械手需求契合度產(chǎn)業(yè)深度極大的靈活性,可以極大簡化設(shè)計難度和系統(tǒng)的復雜性,更高的運動自由度、靈活性、適應性和人機交數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究。注:以上均為國泰君安根據(jù)發(fā)布會信息推測特斯拉Optimus機械手采取電機+腱繩驅(qū)動的方式,可能對手部傳動方案進行優(yōu)化。盡管繩驅(qū)給機械手帶來了極大的靈活性,且可以極大簡化設(shè)計難度和系統(tǒng)的復雜性,但其可靠性、傳動效率都低于傳統(tǒng)連桿、齒輪齒條等方式,可能是研發(fā)團隊數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究數(shù)據(jù)來源:Bebionic、國泰君安證券研究3.2.環(huán)境感知:深度相機+激光雷達VS純視覺方案IMU等,對應機器人感知系統(tǒng)的不同傳感器類別。SLAM(是發(fā)展比較成熟、應用廣泛的定位技術(shù),它是機器人通過對各種傳感器數(shù)據(jù)進行采集和計算,生成對其自身位置姿態(tài)的定位和場描述為:機器人在未知環(huán)境中從一個未知位置開始移動,在移動過程中根據(jù)位置估計和傳感器數(shù)據(jù)進行自身定位,同時建造增量式地圖。獲取定位和地圖后,再根據(jù)請務必閱讀正文之后的免責條款部分20of27產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分21of27Atlas系列WalkerX本田ASIMO激光雷達+深度相機,兩個攝像頭放置純視覺方案,頭部搭基于AI交互相機,采用多目立體視覺、搭4個深度相機+j兩個攝像頭作為視覺傳Atlas使用ToF深度相機以在眼球內(nèi),以每載三枚攝像頭(魚眼通過MiSense視配全向聽覺和慣性、測激光雷達,支持感器,激光傳感器和紅每秒15幀的頻率生成點秒15幀的速攝像頭+左右攝像覺空間系統(tǒng)自研的距等全方位的感知系搭載額外的感知外傳感器結(jié)合用于探測云,基于多平面分割算法度捕獲圖像,分頭通過全景分割+三維重建算法,能元件和支持強化地面的地面上的障礙從點云中提取環(huán)境表面,辨率自研的三維重建算法實現(xiàn)8m內(nèi)深度信導航技術(shù),實現(xiàn)自主路學習功能以及相物、超聲波傳感器超聲進行步態(tài)規(guī)劃實現(xiàn)環(huán)境感知心1%的精度徑規(guī)劃關(guān)應用波傳感器用于測量周圍物體數(shù)據(jù)來源:本田官網(wǎng)、波士頓動力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國泰君安證券研究3.2.1.波士頓動力Atlas:深度相機+激光雷達波士頓動力Atlas感知方案融合深度相機和激光雷達,基于多平面分割算法實現(xiàn)步型,搭建HydraNet神經(jīng)網(wǎng)絡(luò)模型,優(yōu)化視覺算法,完成了自動駕駛純視覺系統(tǒng)的法從點云中提取環(huán)境表面,數(shù)據(jù)經(jīng)過映射后完成對周邊物體的識別。之后,工控機基于識別到的表面和物體信息進行步態(tài)規(guī)劃,以實現(xiàn)避障、探測地面狀況以和巡航法的頂尖機構(gòu),主要研發(fā)人形機器人行走所數(shù)據(jù)來源:BostonDynamics、國泰君安證券研究數(shù)據(jù)來源:BostonDynamics、國泰君安證券研究規(guī)劃3.2.2.特斯拉Optimus:純視覺方案,成本更低特斯拉Optimus環(huán)境感知采用基于攝像頭的純視覺方案,移植特斯拉全自動駕駛案相比激光雷達等感知設(shè)備成本更低,但對算力要求高。機器人繼承了Autopilot算法框架,通過重新采集數(shù)據(jù)訓練適用于機器人的神經(jīng)網(wǎng)絡(luò),以實現(xiàn)環(huán)境的三維重產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分22of27數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究3.3.運動控制:尚未形成通用的控制器解決方案制能力及感知計算能力要求較高,且不同廠商的執(zhí)行器數(shù)量和類別差異較大,未來運控算法或成為廠商核心競爭力,且自研可能性較大;此外人形機器人控制方案,對于客戶應用場景的了解程度及工藝要求也是重要因素,目前下游場景分散,單獨Atlas系列優(yōu)必選-WalkerX本田ASIMO接收來自激光雷達和深度相根據(jù)離線運動庫通過專有的機器人軟件框動作指定非基于系統(tǒng),方案包括水平反應控制、機的數(shù)據(jù),基于離線行為庫和制器根據(jù)傳感器信息實時調(diào)架——機器人操作系統(tǒng)應而是遠端控制,使用模型預測控制實現(xiàn)行為控制,ARCHER的學習型算實際運動過程采集IMU、關(guān)于動捕和逆運動學映射構(gòu)成身控制器控制身法體系。用一臺相機捕ASIMO可實現(xiàn)預測運動節(jié)位置傳感器數(shù)據(jù)進行實時體完成動作活性控制、穩(wěn)定控制算法獲并處理圖像,對失敗控制,可計算轉(zhuǎn)彎的向心調(diào)整和動作優(yōu)化自適應操作的嘗試分析,找出最佳的射擊角度、軌跡等免跌倒數(shù)據(jù)來源:本田官網(wǎng)、波士頓動力官網(wǎng)、優(yōu)必選官網(wǎng)、Tesla官網(wǎng)、小米官網(wǎng)、軟銀官網(wǎng)、國泰君安證券研究3.3.1.運動控制算法:思路相似,均為離線行為庫和實時調(diào)整指定行為目標后,從行為庫中選擇盡可能接近目標的行為,獲得理論上可行的動態(tài)產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分23of27分參數(shù)(力、姿勢、關(guān)節(jié)動作時間等)的細節(jié),以適應真實環(huán)境同理想的差異和其數(shù)據(jù)來源:6thWorkshoponLeggedRobotsICRA'22、國泰君安證券研究制器根據(jù)傳感器信息實時調(diào)整優(yōu)化行為,控制算步態(tài)控制算法中,運動規(guī)劃器首先基于預期路徑,生成參考軌跡,確定機器人模型的動力學參數(shù)??刂破骰趥鞲衅鲾?shù)據(jù)對機器人進行姿態(tài)估計,根據(jù)現(xiàn)實環(huán)境和理想模型的差異,對機器人行為參數(shù)進行校正,得到真實行為。此外,在連續(xù)的步態(tài)身的協(xié)調(diào)擺臂運動,實現(xiàn)自然擺臂、大跨步以及盡可能的直膝行走,提高行走效率特斯拉技術(shù)人員表示Optimus的平衡問題可能需要1數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究產(chǎn)業(yè)深度請務必閱讀正文之后的免責條款部分24of27數(shù)據(jù)來源:TeslaAIDay2022、國泰君安證券研究3.3.2.運動控制器:多為自主設(shè)計,不同廠商需求差異大人形機器人采集并處理多種模態(tài)數(shù)據(jù),執(zhí)行機構(gòu)復雜程度遠高于工業(yè)機器人,對控制器實時算力、集成度要求高。人形機器人傳感器類型、數(shù)量遠超工業(yè)機現(xiàn)閉環(huán)控制等等,流程相對繁雜,數(shù)據(jù)維度、數(shù)據(jù)量均高于工業(yè)機器人,對算力要求高。工業(yè)機器人一般通過外接的圖像采集卡和圖像處理軟件實現(xiàn)識別儲等有不同的需求,因此控制器的組成有差異,以自主設(shè)計為主。我們認為人形機器人控制器采用分布式控制系統(tǒng)的方案可能性較大,即由一個核心控制器和多個小Atlas系列歐洲ICUBOptimus優(yōu)必選本田ASIMO搭載三臺NUC/工控頭部PC104主板,對集成所有傳感器特斯拉的FSD芯片集成控制器包括一個多核異構(gòu)搭載兩個多核控制器位于軀體,由四機完成運控系統(tǒng)的和電機狀態(tài)信息的各種數(shù)據(jù)流進行同了三個4核CPU、兩個處理器硬件平臺,支持多CPU用于控制個運行著VxWorks實種三種總線,最多3塊主時操作系統(tǒng)的處理器構(gòu)控板卡同步運行,可選用模塊化設(shè)計并LAN或Wi-Fi等時的計算在外部的計算機集群中完成碼器等部件ARM/DSP/X86多種類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論