海外人形機器人巨頭深度剖析_第1頁
海外人形機器人巨頭深度剖析_第2頁
海外人形機器人巨頭深度剖析_第3頁
海外人形機器人巨頭深度剖析_第4頁
海外人形機器人巨頭深度剖析_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

海外人形機器人巨頭深度剖析1.特斯拉:由人類打造、為人類服務(wù)的機器人1.1.后人工智能時代機器人將取代人類進行重復(fù)性勞動Optimus定位為解放勞動力,可替代4億崗位。特斯拉的人形機器人項目Optimus(擎天柱)最早于2021年AIDay上公布(早期名稱為TeslaBot),定位為解放勞動力的通用型機器人。人形機器人作為模仿人類的擬態(tài)物,相比機械臂等傳統(tǒng)機器人,能無縫在眾多場景替代人類工作。馬斯克表示,在后人工智能時代機器人將取代人類進行重復(fù)性勞動,生產(chǎn)力充足的前景下可行的經(jīng)濟模式是政府實行全民補貼,而體力勞動將成為個人的選擇。根據(jù)世界銀行數(shù)據(jù),2022年全球勞動人口約34.3億人,勞動力人口已呈現(xiàn)下降趨勢,據(jù)麥肯錫報告預(yù)測,到2030年全球約4億人的崗位將會被自動化機器人替代,即11.7%的勞動者會被機器人所取代。以O(shè)ptimus單價2萬美元計算,長期全球人形機器人市場天花板達8萬億美元,是一個龐大的藍海市場。高自由度結(jié)構(gòu)與精細控制初步具備實用性。目前Optimus原型機身高約172cm,體重約57kg,力量能單手舉起一架鋼琴。其身體共有28個自由度(下一代預(yù)計超過200個自由度),采用了更加靈活的彈簧負載設(shè)計與6種類型執(zhí)行器,關(guān)節(jié)采用仿生學(xué)關(guān)節(jié)設(shè)計,模擬人類關(guān)節(jié)與肌腱形態(tài),手部是Optimus最大亮點,采用人體工程學(xué)設(shè)計,擁有11個自由度(下一代預(yù)期27個),相比之下工業(yè)機器人全身一般僅有4到6個自由度。特斯拉已于演示視頻中展示了精細手部動作,在Dojo超算的支持下Optimus利用動作捕捉對人類活動方式進行學(xué)習(xí),可抓取雜物,力道控制精細,甚至不會打碎雞蛋。根據(jù)特斯拉介紹,Optimus已經(jīng)在特斯拉弗里蒙特工廠試驗簡單工作,如移動零件或用扳手將螺栓固定在汽車上。1.2.自動駕駛的終極形態(tài),F(xiàn)SD自動駕駛-超算-機器人三位一體人形機器人是自動駕駛技術(shù)的終極形態(tài)。自動駕駛的本質(zhì)就是有輪子的機器人,特斯拉已經(jīng)打通了FSD軟件(完全自動駕駛)和機器人的底層模塊,特斯拉在FSD上的積累將使得人形機器人全面受益。特斯拉將FSD從其汽車轉(zhuǎn)移到了機器人,并經(jīng)過調(diào)整以適應(yīng)機器人的身體和不同的工作環(huán)境。特斯拉主要通過對人進行真實世界任務(wù)的運動捕捉,如提起物體、行走等,然后使用反向運動學(xué)技術(shù)讓Optimus重復(fù)這些動作,同時應(yīng)用了在線動作適應(yīng)技術(shù),使這些任務(wù)更加靈活,并能根據(jù)環(huán)境進行調(diào)整。同時由于采用了相同的FSD系統(tǒng),機器人可直接復(fù)用電動車成熟的視覺系統(tǒng),由于特斯拉決定采用同樣的攝像頭方案,而不是LIDAR傳感器,因此可直接移植到人形機器人上。自動駕駛為機器人搭建技術(shù)框架。機器人的反饋機制本質(zhì)上是與自動駕駛相同的架構(gòu),即感知層-決策層-執(zhí)行層。特斯拉在汽車上使用自研的HW硬件與FSD軟件,而機器人的感知層和決策層可直接復(fù)用自動駕駛技術(shù),特斯拉基于Transformer的BEV方案結(jié)合時序隊列與OccupancyNetwork,實現(xiàn)包含空間和時間的4D感知,即使在純視覺方案下仍能實現(xiàn)高效的環(huán)境感知。在決策層上,模型訓(xùn)練階段的數(shù)據(jù)標(biāo)注和模擬環(huán)境同樣可復(fù)用于機器人上,因此Optimus能在立項僅一年就拿出展示機型,遠快于其他人形機器人廠商,軟件層面上只需要更多優(yōu)質(zhì)的訓(xùn)練數(shù)據(jù)積累就能快速提高運動能力。Dojo超算——云端訓(xùn)練AI的基石。超級計算機Dojo基于特斯拉自研的7nmD1芯片,具備采集、訓(xùn)練和進化的能力,能夠更理想的采集道路交通標(biāo)識、生物形象、路面情況等信息。該芯片將354個獨立處理器封裝在一起,產(chǎn)生362TFLOPS的計算和440MB的內(nèi)部靜態(tài)隨機存取存儲器存儲。在保持完全可編程性的同時,DOJO強調(diào)資源分配和極高帶寬的互連,使其能夠從小型系統(tǒng)一直擴展到exaFLOP超級計算機。在產(chǎn)品形態(tài)上,Dojo的最終落地單位是名為ExaPOD的超級計算集群,它集成了3000顆D1芯片,包含120個訓(xùn)練瓦片,最終能夠?qū)崿F(xiàn)高達1.1EFlops的BF16/CFP8峰值算力。2023年7月特斯拉Dojo正式投產(chǎn),預(yù)期到2024年2月,特斯拉算力規(guī)模將進入全球前五,2024年10月總規(guī)模將達到100Exa-Flops,相當(dāng)于30萬塊英偉達A100顯卡的算力總和。Dojo超算為機器人提供最強AI大腦。超級計算機Dojo被特斯拉稱為PureLearningMachine(純學(xué)習(xí)機器),特斯拉FSD芯片最大的優(yōu)勢就是只有一個客戶,而Dojo也是同樣的設(shè)計思路,它是一種專為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練而生的可拓展系統(tǒng)。傳統(tǒng)CPU和GPU都不是為機器學(xué)習(xí)而設(shè)計的,在Dojo之前的超級計算機主要由專業(yè)的計算機設(shè)備制造商研發(fā)、集中在國家級實驗室,主要用途在中長期天氣預(yù)報、油氣勘探、物理模擬、量子力學(xué)等超大型計算應(yīng)用場景;相比之下,Dojo的應(yīng)用場景主要是以視頻和圖像數(shù)據(jù)訓(xùn)練AI,專為自動駕駛和機器人訓(xùn)練使用。原本在A100陣列上需要進行一周的自動駕駛學(xué)習(xí)任務(wù),在Dojo上可能只需要2至3天就能完成,而人形機器人由于高自由度以及四肢協(xié)作,訓(xùn)練數(shù)據(jù)體量遠大于自動駕駛,根據(jù)特斯拉數(shù)據(jù)顯示,在同樣的成本之下,Dojo超級計算機相比英偉達A100能夠?qū)崿F(xiàn)4倍的性能、能耗比提升1.3倍。技術(shù)整合帶來人形機器人奇點。Optimus采用了與Tesla車輛相同的芯片,支持Wi-Fi、LTE鏈接和音頻交流,其系統(tǒng)軟硬件的安全性保障也正在不斷提升,通過量產(chǎn)與技術(shù)發(fā)展控制制造成本,而軟件復(fù)用汽車FSD系統(tǒng)、算力調(diào)用Dojo超算,在規(guī)?;a(chǎn)后預(yù)計遠期成本遠低于一輛汽車。Optimus的版本迭代十分之快,會遠超汽車等產(chǎn)品,自2021年AIDay公布一年后已改進到第二代,在2023年5月的股東大會演示視頻上第二代人形Optimus已能流暢行走。據(jù)證券時報,馬斯克在2022AIDay上透露,Optimus有望在3-5年間量產(chǎn)上市,預(yù)期產(chǎn)量可以達到數(shù)百萬臺,預(yù)估Optimus機器人穩(wěn)定生產(chǎn)后的價格將達到2萬美元以下。1.3.未來展望:仍在等待GPT時刻的到來機器人領(lǐng)域仍在等待著“大腦”的進化。GPT模型的自然語言處理已經(jīng)匯聚了自回歸變換器+下一個詞預(yù)測+強化學(xué)習(xí)高級特征的“配方”。然而,對于人形機器人的技術(shù)而言,還沒有算法能夠達到同樣的效果。目前Optimus可期待的應(yīng)用場景還是重復(fù)性的小場景工作,因為FSD模型無法對未知信息進行預(yù)測,近日特斯拉Optimus的官方推特賬號上傳了新的演示視頻,Optimus能夠僅依靠視覺來對物體進行分類,還能完成難度更大的瑜伽動作,采用了類似于特斯拉自動駕駛技術(shù)FSD12的端到端神經(jīng)網(wǎng)絡(luò)控制:視頻輸入,控制輸出,并由此來控制各個部件和關(guān)節(jié)的移動。谷歌Deepmind已在測試多模態(tài)模型RT-2控制機器人,內(nèi)嵌120億參數(shù)PaLM-E模型以及550億參數(shù)PaLI-X模型的RT-2在陌生任務(wù)中的平均準確率相比RT-1翻倍,達到62%。如果行業(yè)能打造出“RobotGPT”的基座模型,實現(xiàn)零樣本或少樣本學(xué)習(xí),則能在更復(fù)雜乃至陌生的環(huán)境中執(zhí)行任務(wù),實現(xiàn)人形機器人的智能涌現(xiàn)。Optimus初步落地可期,應(yīng)用想象力擴大。根據(jù)馬斯克發(fā)言,Optimus預(yù)計將于今年11月進行行走測試,之后在生產(chǎn)穩(wěn)定后開始加速,明年進入工廠測試實際工作。此外,Optimus的核心硬件模塊化同樣有巨大的應(yīng)用潛力,透過將Neuralink腦機接口植入物與機器人手臂或腿結(jié)合,可構(gòu)成優(yōu)秀的假肢,為被截肢的人提供一個優(yōu)秀的機器人身體,可能只需要6萬美元。2.波士頓動力:機器人領(lǐng)域的頂尖實驗室2.1.最強動態(tài)性能的跑酷機器人Atlas機器人領(lǐng)域三十年積累,造就最靈活人形機器人。波士頓動力(BostonDynamics)由麻省理工學(xué)院副教授馬克·雷波特于1992年創(chuàng)立,最初的機器人是為美軍研制的大狗(BigDog)機器人,可在廢墟、泥地、雪地、水中行走,奠定了Atlas運動能力的基礎(chǔ)。波士頓動力目前最先進的機器人Atlas身高1.5米,體重80kg,速度1.5m/s,依靠28個液壓執(zhí)行器實現(xiàn)各種高難度運動,足部踝關(guān)節(jié)由兩個直線執(zhí)行器并聯(lián)驅(qū)動,髖關(guān)節(jié)和手臂多是伺服擺動缸。Atlas不僅擁有卓越的物理機動性,更因其高級的控制系統(tǒng)和算法而獨立于眾,多次在演示中展現(xiàn)出近乎超乎人類的運動與平衡能力。2.2.創(chuàng)新硬件與算法沉淀,Atlas實現(xiàn)卓越運動性能Atlas以高性能電液驅(qū)動系統(tǒng)、復(fù)雜的AI算法和多模態(tài)視覺感知實現(xiàn)優(yōu)異運動性能:強大運動性能得益于獨特液壓驅(qū)動。不同于多數(shù)機器人采用電驅(qū),Atlas為了獲得最強的機動性采用液壓伺服驅(qū)動,具有高負載驅(qū)動特性,即使是高難度動作如后空翻等依然能平穩(wěn)落地。Atlas機器人全身有28個自由度,在多個液壓關(guān)節(jié)與算法的協(xié)調(diào)配合下,Atlas已經(jīng)可以熟練的完成垂直起跳、跨越障礙、后空翻,甚至完成整套的舞蹈以及手腳都參與的跑酷功能。離線模板與在線精細控制構(gòu)成獨特運動算法。Atlas的離線軌跡庫模板包含了眾多預(yù)設(shè)的最優(yōu)運動方案,會向決策層MPC(模型預(yù)測控制)提示最佳的解決方案選擇,此后MPC利用機器人的動力學(xué)模型來預(yù)測其未來的動作。這種控制器的核心工作機制是優(yōu)化計算,確定機器人當(dāng)前應(yīng)該進行的最優(yōu)動作,從而隨著時間的推移產(chǎn)生最佳行為。當(dāng)遇到如環(huán)境改變、腳滑等實時因素時,MPC會調(diào)整機器人的發(fā)力、姿勢和動作的發(fā)生時機來適應(yīng)。此外,MPC還能跨行為邊界預(yù)測下一步的行動,例如知悉跳躍后要進行后空翻,它便會自動創(chuàng)建行為之間的過渡,確保動作連貫。在MPC3.0版本中,Atlas已能主動使用參數(shù)已知的工具,在官方演示視頻中Atlas用木板搭了一座橋通過障礙。TOF+預(yù)設(shè)地圖構(gòu)成Atlas的“眼睛”。在感知層,Atlas使用TOF深度相機每秒生成15幀的環(huán)境點云,這些點云基于大規(guī)模的測距集合。它的感知軟件采用多平面分割算法從點云中提取平面,并將此信息輸入到映射系統(tǒng)中,為Atlas構(gòu)建通過相機看到的各種對象的模型。當(dāng)Atlas執(zhí)行擴展的跑酷行為時,波士頓動力的研發(fā)團隊為其提供了一張高級地圖,指明了它應(yīng)該前往的地方和沿途應(yīng)該執(zhí)行的動作。盡管這張地圖并不完全與真實路線的幾何形狀匹配,但它提供了障礙模板和注釋動作的近似描述,Atlas則利用這些稀疏信息進行導(dǎo)航,并用實時感知數(shù)據(jù)來填補細節(jié)。2.3.從機械狗Spot開始,商業(yè)化前路漫長機械狗Spot率先開啟商業(yè)化之路。Spot是波士頓動力2015年2月發(fā)布的四足機器人,身高僅一米有余。SpotMini是Spot機器人的更加小型且防水的版本,加上機器臂重量29.5kg,一次充電可以跑90分鐘,相比波士頓動力其他液壓結(jié)構(gòu)驅(qū)動的機器人,SpotMini是純電動的,因此是波士頓動力最安靜的機器人之一,搭配多種傳感器,可以完成各項復(fù)雜的動作以及巡航,如無人區(qū)巡邏、尋找氣體泄露、公園安保等。SpotMini是公司商業(yè)化探索的第一步,于2020年6月開始公開發(fā)售,每只定價74,500美元,折合人民幣超過50萬元。Spotmini整體的設(shè)計以高集成度、高任務(wù)作業(yè)能力為主,繼承了波士頓動力其他機器人的高運動能力,最優(yōu)異的性能就是樓梯攀爬,其采用全視覺方案構(gòu)建全局地圖,進一步選擇合適的落足點避開臺階邊緣以及不安全的落足區(qū)域。難以降本量產(chǎn)約束商業(yè)化落地。波士頓動力從學(xué)術(shù)領(lǐng)域?qū)嶒炇艺Q生,因此機器人的設(shè)計多是不計成本以性能為導(dǎo)向,早期為美國國防高級研究計劃局承包項目,由于商業(yè)化進程不及預(yù)期,被谷歌收購后又經(jīng)歷兩度易主,2017年6月軟銀接手、2021年6月由現(xiàn)代汽車接管。根據(jù)Analytic

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論