海外人形機器人巨頭深度剖析

上傳人：y*** IP屬地：廣東上傳時間：2024-01-03 格式：DOC 頁數(shù)：10 大?。?29.50KB 積分：5.88 舉報 版權(quán)申訴

已閱讀5頁，還剩5頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

海外人形機器人巨頭深度剖析1.特斯拉：由人類打造、為人類服務(wù)的機器人1.1.后人工智能時代機器人將取代人類進行重復(fù)性勞動Optimus定位為解放勞動力，可替代4億崗位。特斯拉的人形機器人項目Optimus（擎天柱）最早于2021年AIDay上公布（早期名稱為TeslaBot），定位為解放勞動力的通用型機器人。人形機器人作為模仿人類的擬態(tài)物，相比機械臂等傳統(tǒng)機器人，能無縫在眾多場景替代人類工作。馬斯克表示，在后人工智能時代機器人將取代人類進行重復(fù)性勞動，生產(chǎn)力充足的前景下可行的經(jīng)濟模式是政府實行全民補貼，而體力勞動將成為個人的選擇。根據(jù)世界銀行數(shù)據(jù)，2022年全球勞動人口約34.3億人，勞動力人口已呈現(xiàn)下降趨勢，據(jù)麥肯錫報告預(yù)測，到2030年全球約4億人的崗位將會被自動化機器人替代，即11.7%的勞動者會被機器人所取代。以O(shè)ptimus單價2萬美元計算，長期全球人形機器人市場天花板達8萬億美元，是一個龐大的藍海市場。高自由度結(jié)構(gòu)與精細控制初步具備實用性。目前Optimus原型機身高約172cm，體重約57kg，力量能單手舉起一架鋼琴。其身體共有28個自由度（下一代預(yù)計超過200個自由度），采用了更加靈活的彈簧負載設(shè)計與6種類型執(zhí)行器，關(guān)節(jié)采用仿生學(xué)關(guān)節(jié)設(shè)計，模擬人類關(guān)節(jié)與肌腱形態(tài)，手部是Optimus最大亮點，采用人體工程學(xué)設(shè)計，擁有11個自由度（下一代預(yù)期27個），相比之下工業(yè)機器人全身一般僅有4到6個自由度。特斯拉已于演示視頻中展示了精細手部動作，在Dojo超算的支持下Optimus利用動作捕捉對人類活動方式進行學(xué)習(xí)，可抓取雜物，力道控制精細，甚至不會打碎雞蛋。根據(jù)特斯拉介紹，Optimus已經(jīng)在特斯拉弗里蒙特工廠試驗簡單工作，如移動零件或用扳手將螺栓固定在汽車上。1.2.自動駕駛的終極形態(tài)，F(xiàn)SD自動駕駛-超算-機器人三位一體人形機器人是自動駕駛技術(shù)的終極形態(tài)。自動駕駛的本質(zhì)就是有輪子的機器人，特斯拉已經(jīng)打通了FSD軟件（完全自動駕駛）和機器人的底層模塊，特斯拉在FSD上的積累將使得人形機器人全面受益。特斯拉將FSD從其汽車轉(zhuǎn)移到了機器人，并經(jīng)過調(diào)整以適應(yīng)機器人的身體和不同的工作環(huán)境。特斯拉主要通過對人進行真實世界任務(wù)的運動捕捉，如提起物體、行走等，然后使用反向運動學(xué)技術(shù)讓Optimus重復(fù)這些動作，同時應(yīng)用了在線動作適應(yīng)技術(shù)，使這些任務(wù)更加靈活，并能根據(jù)環(huán)境進行調(diào)整。同時由于采用了相同的FSD系統(tǒng)，機器人可直接復(fù)用電動車成熟的視覺系統(tǒng)，由于特斯拉決定采用同樣的攝像頭方案，而不是LIDAR傳感器，因此可直接移植到人形機器人上。自動駕駛為機器人搭建技術(shù)框架。機器人的反饋機制本質(zhì)上是與自動駕駛相同的架構(gòu)，即感知層-決策層-執(zhí)行層。特斯拉在汽車上使用自研的HW硬件與FSD軟件，而機器人的感知層和決策層可直接復(fù)用自動駕駛技術(shù)，特斯拉基于Transformer的BEV方案結(jié)合時序隊列與OccupancyNetwork，實現(xiàn)包含空間和時間的4D感知，即使在純視覺方案下仍能實現(xiàn)高效的環(huán)境感知。在決策層上，模型訓(xùn)練階段的數(shù)據(jù)標(biāo)注和模擬環(huán)境同樣可復(fù)用于機器人上，因此Optimus能在立項僅一年就拿出展示機型，遠快于其他人形機器人廠商，軟件層面上只需要更多優(yōu)質(zhì)的訓(xùn)練數(shù)據(jù)積累就能快速提高運動能力。Dojo超算——云端訓(xùn)練AI的基石。超級計算機Dojo基于特斯拉自研的7nmD1芯片，具備采集、訓(xùn)練和進化的能力，能夠更理想的采集道路交通標(biāo)識、生物形象、路面情況等信息。該芯片將354個獨立處理器封裝在一起，產(chǎn)生362TFLOPS的計算和440MB的內(nèi)部靜態(tài)隨機存取存儲器存儲。在保持完全可編程性的同時，DOJO強調(diào)資源分配和極高帶寬的互連，使其能夠從小型系統(tǒng)一直擴展到exaFLOP超級計算機。在產(chǎn)品形態(tài)上，Dojo的最終落地單位是名為ExaPOD的超級計算集群，它集成了3000顆D1芯片，包含120個訓(xùn)練瓦片，最終能夠?qū)崿F(xiàn)高達1.1EFlops的BF16/CFP8峰值算力。2023年7月特斯拉Dojo正式投產(chǎn)，預(yù)期到2024年2月，特斯拉算力規(guī)模將進入全球前五，2024年10月總規(guī)模將達到100Exa-Flops，相當(dāng)于30萬塊英偉達A100顯卡的算力總和。Dojo超算為機器人提供最強AI大腦。超級計算機Dojo被特斯拉稱為PureLearningMachine（純學(xué)習(xí)機器），特斯拉FSD芯片最大的優(yōu)勢就是只有一個客戶，而Dojo也是同樣的設(shè)計思路，它是一種專為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練而生的可拓展系統(tǒng)。傳統(tǒng)CPU和GPU都不是為機器學(xué)習(xí)而設(shè)計的，在Dojo之前的超級計算機主要由專業(yè)的計算機設(shè)備制造商研發(fā)、集中在國家級實驗室，主要用途在中長期天氣預(yù)報、油氣勘探、物理模擬、量子力學(xué)等超大型計算應(yīng)用場景；相比之下，Dojo的應(yīng)用場景主要是以視頻和圖像數(shù)據(jù)訓(xùn)練AI，專為自動駕駛和機器人訓(xùn)練使用。原本在A100陣列上需要進行一周的自動駕駛學(xué)習(xí)任務(wù)，在Dojo上可能只需要2至3天就能完成，而人形機器人由于高自由度以及四肢協(xié)作，訓(xùn)練數(shù)據(jù)體量遠大于自動駕駛，根據(jù)特斯拉數(shù)據(jù)顯示，在同樣的成本之下，Dojo超級計算機相比英偉達A100能夠?qū)崿F(xiàn)4倍的性能、能耗比提升1.3倍。技術(shù)整合帶來人形機器人奇點。Optimus采用了與Tesla車輛相同的芯片，支持Wi-Fi、LTE鏈接和音頻交流，其系統(tǒng)軟硬件的安全性保障也正在不斷提升，通過量產(chǎn)與技術(shù)發(fā)展控制制造成本，而軟件復(fù)用汽車FSD系統(tǒng)、算力調(diào)用Dojo超算，在規(guī)?；a(chǎn)后預(yù)計遠期成本遠低于一輛汽車。Optimus的版本迭代十分之快，會遠超汽車等產(chǎn)品，自2021年AIDay公布一年后已改進到第二代，在2023年5月的股東大會演示視頻上第二代人形Optimus已能流暢行走。據(jù)證券時報，馬斯克在2022AIDay上透露，Optimus有望在3-5年間量產(chǎn)上市，預(yù)期產(chǎn)量可以達到數(shù)百萬臺，預(yù)估Optimus機器人穩(wěn)定生產(chǎn)后的價格將達到2萬美元以下。1.3.未來展望：仍在等待GPT時刻的到來機器人領(lǐng)域仍在等待著“大腦”的進化。GPT模型的自然語言處理已經(jīng)匯聚了自回歸變換器+下一個詞預(yù)測+強化學(xué)習(xí)高級特征的“配方”。然而，對于人形機器人的技術(shù)而言，還沒有算法能夠達到同樣的效果。目前Optimus可期待的應(yīng)用場景還是重復(fù)性的小場景工作，因為FSD模型無法對未知信息進行預(yù)測，近日特斯拉Optimus的官方推特賬號上傳了新的演示視頻，Optimus能夠僅依靠視覺來對物體進行分類，還能完成難度更大的瑜伽動作，采用了類似于特斯拉自動駕駛技術(shù)FSD12的端到端神經(jīng)網(wǎng)絡(luò)控制：視頻輸入，控制輸出，并由此來控制各個部件和關(guān)節(jié)的移動。谷歌Deepmind已在測試多模態(tài)模型RT-2控制機器人，內(nèi)嵌120億參數(shù)PaLM-E模型以及550億參數(shù)PaLI-X模型的RT-2在陌生任務(wù)中的平均準確率相比RT-1翻倍，達到62%。如果行業(yè)能打造出“RobotGPT”的基座模型，實現(xiàn)零樣本或少樣本學(xué)習(xí)，則能在更復(fù)雜乃至陌生的環(huán)境中執(zhí)行任務(wù)，實現(xiàn)人形機器人的智能涌現(xiàn)。Optimus初步落地可期，應(yīng)用想象力擴大。根據(jù)馬斯克發(fā)言，Optimus預(yù)計將于今年11月進行行走測試，之后在生產(chǎn)穩(wěn)定后開始加速，明年進入工廠測試實際工作。此外，Optimus的核心硬件模塊化同樣有巨大的應(yīng)用潛力，透過將Neuralink腦機接口植入物與機器人手臂或腿結(jié)合，可構(gòu)成優(yōu)秀的假肢，為被截肢的人提供一個優(yōu)秀的機器人身體，可能只需要6萬美元。2.波士頓動力：機器人領(lǐng)域的頂尖實驗室2.1.最強動態(tài)性能的跑酷機器人Atlas機器人領(lǐng)域三十年積累，造就最靈活人形機器人。波士頓動力（BostonDynamics）由麻省理工學(xué)院副教授馬克·雷波特于1992年創(chuàng)立，最初的機器人是為美軍研制的大狗（BigDog）機器人，可在廢墟、泥地、雪地、水中行走，奠定了Atlas運動能力的基礎(chǔ)。波士頓動力目前最先進的機器人Atlas身高1.5米，體重80kg，速度1.5m/s，依靠28個液壓執(zhí)行器實現(xiàn)各種高難度運動，足部踝關(guān)節(jié)由兩個直線執(zhí)行器并聯(lián)驅(qū)動，髖關(guān)節(jié)和手臂多是伺服擺動缸。Atlas不僅擁有卓越的物理機動性，更因其高級的控制系統(tǒng)和算法而獨立于眾，多次在演示中展現(xiàn)出近乎超乎人類的運動與平衡能力。2.2.創(chuàng)新硬件與算法沉淀，Atlas實現(xiàn)卓越運動性能Atlas以高性能電液驅(qū)動系統(tǒng)、復(fù)雜的AI算法和多模態(tài)視覺感知實現(xiàn)優(yōu)異運動性能：強大運動性能得益于獨特液壓驅(qū)動。不同于多數(shù)機器人采用電驅(qū)，Atlas為了獲得最強的機動性采用液壓伺服驅(qū)動，具有高負載驅(qū)動特性，即使是高難度動作如后空翻等依然能平穩(wěn)落地。Atlas機器人全身有28個自由度，在多個液壓關(guān)節(jié)與算法的協(xié)調(diào)配合下，Atlas已經(jīng)可以熟練的完成垂直起跳、跨越障礙、后空翻，甚至完成整套的舞蹈以及手腳都參與的跑酷功能。離線模板與在線精細控制構(gòu)成獨特運動算法。Atlas的離線軌跡庫模板包含了眾多預(yù)設(shè)的最優(yōu)運動方案，會向決策層MPC（模型預(yù)測控制）提示最佳的解決方案選擇，此后MPC利用機器人的動力學(xué)模型來預(yù)測其未來的動作。這種控制器的核心工作機制是優(yōu)化計算，確定機器人當(dāng)前應(yīng)該進行的最優(yōu)動作，從而隨著時間的推移產(chǎn)生最佳行為。當(dāng)遇到如環(huán)境改變、腳滑等實時因素時，MPC會調(diào)整機器人的發(fā)力、姿勢和動作的發(fā)生時機來適應(yīng)。此外，MPC還能跨行為邊界預(yù)測下一步的行動，例如知悉跳躍后要進行后空翻，它便會自動創(chuàng)建行為之間的過渡，確保動作連貫。在MPC3.0版本中，Atlas已能主動使用參數(shù)已知的工具，在官方演示視頻中Atlas用木板搭了一座橋通過障礙。TOF+預(yù)設(shè)地圖構(gòu)成Atlas的“眼睛”。在感知層，Atlas使用TOF深度相機每秒生成15幀的環(huán)境點云，這些點云基于大規(guī)模的測距集合。它的感知軟件采用多平面分割算法從點云中提取平面，并將此信息輸入到映射系統(tǒng)中，為Atlas構(gòu)建通過相機看到的各種對象的模型。當(dāng)Atlas執(zhí)行擴展的跑酷行為時，波士頓動力的研發(fā)團隊為其提供了一張高級地圖，指明了它應(yīng)該前往的地方和沿途應(yīng)該執(zhí)行的動作。盡管這張地圖并不完全與真實路線的幾何形狀匹配，但它提供了障礙模板和注釋動作的近似描述，Atlas則利用這些稀疏信息進行導(dǎo)航，并用實時感知數(shù)據(jù)來填補細節(jié)。2.3.從機械狗Spot開始，商業(yè)化前路漫長機械狗Spot率先開啟商業(yè)化之路。Spot是波士頓動力2015年2月發(fā)布的四足機器人，身高僅一米有余。SpotMini是Spot機器人的更加小型且防水的版本，加上機器臂重量29.5kg，一次充電可以跑90分鐘，相比波士頓動力其他液壓結(jié)構(gòu)驅(qū)動的機器人，SpotMini是純電動的，因此是波士頓動力最安靜的機器人之一，搭配多種傳感器，可以完成各項復(fù)雜的動作以及巡航，如無人區(qū)巡邏、尋找氣體泄露、公園安保等。SpotMini是公司商業(yè)化探索的第一步，于2020年6月開始公開發(fā)售，每只定價74,500美元，折合人民幣超過50萬元。Spotmini整體的設(shè)計以高集成度、高任務(wù)作業(yè)能力為主，繼承了波士頓動力其他機器人的高運動能力，最優(yōu)異的性能就是樓梯攀爬，其采用全視覺方案構(gòu)建全局地圖，進一步選擇合適的落足點避開臺階邊緣以及不安全的落足區(qū)域。難以降本量產(chǎn)約束商業(yè)化落地。波士頓動力從學(xué)術(shù)領(lǐng)域?qū)嶒炇艺Q生，因此機器人的設(shè)計多是不計成本以性能為導(dǎo)向，早期為美國國防高級研究計劃局承包項目，由于商業(yè)化進程不及預(yù)期，被谷歌收購后又經(jīng)歷兩度易主，2017年6月軟銀接手、2021年6月由現(xiàn)代汽車接管。根據(jù)Analytic

人人文庫> 全部分類> 應(yīng)用文書 > 研究報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

海外人形機器人巨頭深度剖析

文檔簡介

溫馨提示

最新文檔

評論

海外人形機器人巨頭深度剖析

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔