




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
具身智能AI行業(yè)市場分析1、產(chǎn)業(yè)鏈圖理解傳感器+大模型+具身智能1.1從框圖開始理解具身智能AI它尤其適用于描述L2-L3-L4自動(dòng)駕駛的智能化處理方式。而自動(dòng)駕駛是“具身智能”重要落地場景。最上面是“傳感后融合“,傳感器數(shù)據(jù)處理后再融合、預(yù)測、決策、控制。中間是“傳感前融合“,即數(shù)據(jù)先同步和融合后,再預(yù)測、決策、控制。下面近似為“端到端”,大大增加了預(yù)測、規(guī)劃、控制的數(shù)據(jù)處理。如果這個(gè)問題擴(kuò)張到更大的范疇,例如增加AI推理+理解+運(yùn)動(dòng),把機(jī)器人也繪制進(jìn)去,就得到下面的“具身智能產(chǎn)業(yè)鏈圖”。1.2傳感器:機(jī)器人傳感器值得一提的是,2020-2022年是智能汽車傳感器獲得高關(guān)注的階段,尤其“硬件預(yù)埋”趨勢下。2022-2023年是機(jī)器人傳感器獲得高關(guān)注的階段。1.3AI3D視覺:NeRF,三維重建新范式NeRF,即NeuralRadianceFields(神經(jīng)輻射場)。其通俗理解:給予海量不同視角的二維圖,合成同一場景不同視角下的圖像。還可以通俗理解為X-Y-Z到三維極坐標(biāo)的轉(zhuǎn)化,第三視角到第一視角的轉(zhuǎn)化。NeRF提出的隱式表達(dá)以空間點(diǎn)的坐標(biāo)和觀察者的視角、位置作為輸入,輸出則是點(diǎn)的RGB信息和占用密度。占用密度這一點(diǎn)與占用函數(shù)相似,但沒有像占用函數(shù)那樣粗暴地用0和1表示一個(gè)點(diǎn)是否被占用,而是用0~1之間的數(shù)字表示點(diǎn)被占用的程度這樣可以大幅減少計(jì)算量。輻射場:如果我們從一個(gè)角度向一個(gè)靜態(tài)空間發(fā)射一條射線,我們可以查詢到這條射線在空間中每個(gè)點(diǎn)(x,y,z)的密度ρ,以及該位置在射線角度(θ,φ)下呈現(xiàn)出來的顏色c(c=(R,G,B))。即F(x,y,z,θ,φ)→(R,G,B,ρ)。密度是用來計(jì)算權(quán)重的,對點(diǎn)上的顏色做加權(quán)求和就可以呈現(xiàn)像素顏色。給定F(x,y,z,θ,φ)直接查表獲得RGB值和密度,給體渲染方法。體渲染:對上述輻射場的密度和顏色做積分,就可以得到像素的顏色,并遍歷所有像素,這個(gè)視角下的圖像就渲染出來了。1.4AI3D感知:BEV,可用于具身智能感知BEV鳥瞰圖。BEV的全稱是Bird’seyeview(鳥瞰圖),我們以特斯拉為例:特斯拉車型使用多個(gè)攝像頭采集圖像,并進(jìn)行有效的融合。系統(tǒng)直接通過將所有攝像頭采集圖像通過矯正后,統(tǒng)一輸入到神經(jīng)網(wǎng)絡(luò)來提取特征。然后利用大模型的Transformer,將這些特征進(jìn)行關(guān)聯(lián),之后再投影到一個(gè)向量空間之中。BEV的通俗理解:把不同視角的觀察合成一個(gè)“天眼模式”整體圖,了解全局。尤其圖像是2D傳感,通過連續(xù)序列,恢復(fù)出3D信息。這種方式的優(yōu)點(diǎn)有:減少硬件傳感器、提高純視覺精度、可復(fù)用多種數(shù)據(jù)源(甚至多模態(tài)),缺點(diǎn)是成本高。1)這種鳥瞰圖仿佛就是開了一個(gè)整體視角,讓車輛能夠把近處的感知統(tǒng)一放到一個(gè)平面中,盡可能的增大了感知的范圍和冗余度。2)但缺點(diǎn)是成本,2023年,如果要做BEV的城市輔助駕駛,可能需要投入超過百億元。3)BEV可以結(jié)合國內(nèi)的傳感器優(yōu)勢。盡管國外通常利于AI軟件優(yōu)化智能駕駛,國內(nèi)通常利用激光雷達(dá)等傳感器優(yōu)化智能駕駛,但BEV可以融合激光雷達(dá)的點(diǎn)云,做到盡量統(tǒng)一。下圖就是一個(gè)案例:主要有兩個(gè)分支將點(diǎn)云數(shù)據(jù)轉(zhuǎn)換為BEV表示。上分支提取3D空間中的點(diǎn)云特征,提供更準(zhǔn)確的檢測結(jié)果。下分支提取2D空間中的BEV特征(原始點(diǎn)云轉(zhuǎn)換),提供更高效的網(wǎng)絡(luò)。1.5AI3D感知:占用網(wǎng)絡(luò)占用網(wǎng)絡(luò)OccupancyNetwork。Tesla在2022年10月的AIDay中展現(xiàn)了OccupancyNetwork感知技術(shù)?;镜乃枷胧菍⑷S空間劃分成體素(voxel),通過0/1賦值對voxel進(jìn)行二分類:有物體的voxel賦值為1,表示voxel被物體占據(jù);沒有物體的voxel被賦值為0。當(dāng)然實(shí)際中的賦值可以是概率值,表示voxel存在物體的概率,這個(gè)概率也可以理解成密度或者透明度。OccupancyNetwork的通俗理解:兩維的鳥瞰BEV,變?yōu)槿S的鳥瞰。而增加運(yùn)動(dòng)序列預(yù)測。Voxel的使用:1)voxel其實(shí)是計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺中早期使用的三維重建表達(dá)方式,主要用于一些對精度要求不是很高的場景進(jìn)行三維建模。2)Voxel的屬性除了是否被占據(jù),還包含語義信息和速度信息(OccupancyFlow)等。其中速度信息是一個(gè)三維向量,用于表述voxel運(yùn)動(dòng)的速度和方向,類似于2D圖像中的光流(OpticalFlow)。這可以用于判斷物體是否運(yùn)動(dòng)。Occupancy和OccupancyFlow都是底層層次信息,非常適合表示非剛體(non-rigid)場景。3)一個(gè)應(yīng)用領(lǐng)域是汽車AI,還一個(gè)領(lǐng)域是CT醫(yī)學(xué)圖像。Voxel的表達(dá)方法存在分辨率、內(nèi)存占用大、渲染效率的問題,在三維重建領(lǐng)域早已經(jīng)被mesh所取代。但近些年來,隨著深度學(xué)習(xí)在三維重建領(lǐng)域中的興起,voxel的重建方案重新興起(以上來自《自動(dòng)駕駛之心》2023年1月觀點(diǎn))。在恢復(fù)空間特征后,融合、恢復(fù)高分辨率、復(fù)雜輸出是關(guān)鍵。特斯拉采用暫時(shí)對齊(TemporalAlignment)將不同時(shí)序的特征,對齊后融合。進(jìn)而采用反卷積上采樣,恢復(fù)高分辨率。畢竟是分割3D空間的每個(gè)voxel,信息量更加稠密,低分辨率可能會(huì)導(dǎo)致性能受限。接下來就是占用網(wǎng)絡(luò)的預(yù)測輸出(VolumeOutputs)。后面則可以做更多高級語義非任務(wù)和輸出(比如:OccupancyFlow,Semantic,Shape,RoadSurface等)??梢愿鶕?jù)特斯拉在CVPR2022workshop的演講、特斯拉歷次AI發(fā)布會(huì)的披露,了解細(xì)節(jié)。占用網(wǎng)絡(luò)有雙重監(jiān)督信號(hào)。第一是直接占用值的監(jiān)督,第二是NeRF渲染的監(jiān)督。智能汽車軟件進(jìn)步還包括端到端能力、多模態(tài)、大模型規(guī)控算法等。2023年5月,特斯拉推出FSDv1.4,要現(xiàn)FSD端到端能力,即包含高速領(lǐng)航、城市道路領(lǐng)航和泊車的智駕功能。2023年6月,多模態(tài)神經(jīng)網(wǎng)絡(luò)可能成為后續(xù)特斯拉亮點(diǎn),如攝像視頻、地圖、導(dǎo)航、IMU(慣性測量單元)、GPS等。雖然國內(nèi)的傳感器方案較為領(lǐng)先,預(yù)計(jì)會(huì)越來越多的借鑒Transformer、BEV、占用網(wǎng)絡(luò)等技術(shù)。2023年6月,理想汽車家庭科技日的發(fā)布,可以作為國內(nèi)汽車大模型發(fā)展的縮影:1)ADMax3.0基于BEV架構(gòu)的車端感知模型已經(jīng)可以在絕大多數(shù)路段實(shí)時(shí)生成穩(wěn)定的道路結(jié)構(gòu)信息,奠定擺脫高精地圖依賴的基礎(chǔ)。2)不止感知算法層面,規(guī)控算法也使用了大模型技術(shù)。3)其NOA技術(shù)架構(gòu)特點(diǎn)可以理解為:使用NPN特征和TIN網(wǎng)絡(luò)增強(qiáng)BEV大模型,做到不依賴高精地圖,識(shí)別萬物;使用模仿學(xué)習(xí)讓規(guī)控算法做出更加擬人的決策;全自動(dòng)、全閉環(huán)的訓(xùn)練平臺(tái)支撐大模型持續(xù)進(jìn)化。1.6從AI感知,到端到端+具身智能(感知+預(yù)測+推理+理解+運(yùn)動(dòng))2023年6月,《Planning-orientedAutonomousDriving》(以路徑規(guī)劃為導(dǎo)向的自動(dòng)駕駛)獲得本屆CVPR2023年最佳論文獎(jiǎng)(BestPaperAward),其涉及的是自動(dòng)駕駛大模型,很多思路可以同時(shí)用于未來智聯(lián)汽車、具身智能機(jī)器人。而上述難點(diǎn)1)識(shí)別控制相關(guān)軟件、2)基于感知的運(yùn)動(dòng)、5)學(xué)習(xí)與控制交叉,也在本篇論文的思路中有所涉及。從分塊優(yōu)化,變成一體化AI優(yōu)化,即“端到端”。在過去自動(dòng)駕駛AI中,一般將認(rèn)為劃分為多模塊,例如感知、預(yù)測、路徑規(guī)劃等。論文提出的“端到端”,即一體化訓(xùn)練、一體化AI(論文提出UnifiedAutonomousDriving,即UniAD)。它把感知、預(yù)測、規(guī)劃等三大類主任務(wù)、多種子任務(wù)(目標(biāo)檢測、目標(biāo)跟蹤、場景建圖、軌跡預(yù)測、柵格預(yù)測和路徑規(guī)劃)整合到統(tǒng)一的端到端網(wǎng)絡(luò)框架下。例如:1)在backbone環(huán)節(jié),特征提取,其中涉及BEV和多模態(tài)等大模型技術(shù)。將一系列多相機(jī)圖像輸入特征提取器,并將生成的特征通過BEVFormer中的現(xiàn)成BEV編碼器轉(zhuǎn)換為統(tǒng)一鳥瞰圖(BEV)特征。UniAD并不局限于特定的BEV編碼器,并且可以利用其他替代方案通過長期時(shí)間融合或多模態(tài)融合來提取更豐富的BEV表示。2)在感知環(huán)節(jié),目標(biāo)檢測與跟蹤模塊可以實(shí)現(xiàn)對動(dòng)態(tài)元素的特征提取、幀間物體跟蹤。檢測和跟蹤agents。MapFormer將mapqueries作為道路元素(例如,車道和分隔線)的語義抽象(semanticabstractions),并對地圖進(jìn)行全景分割。3)預(yù)測模塊,實(shí)現(xiàn)動(dòng)靜態(tài)元素交互與長時(shí)序軌跡預(yù)測,而且已經(jīng)有“聯(lián)合訓(xùn)練AI”。占據(jù)柵格預(yù)測模塊實(shí)現(xiàn)了短時(shí)序全場景BEV、實(shí)例級預(yù)測。由于每個(gè)單元的動(dòng)作都會(huì)顯著影響場景中的其他,因此該模塊對所有考慮的單元進(jìn)行聯(lián)合預(yù)測。4)在規(guī)劃模塊,基于軌跡預(yù)測,做防碰撞,其中涉及占用網(wǎng)絡(luò)(Occupancynetwork)等大模型技術(shù)?;谧陨淼能壽E預(yù)測和基于占據(jù)柵格的碰撞優(yōu)化并使自己遠(yuǎn)離OccFormer預(yù)測的占用區(qū)域(occupiedregions)以避免碰撞。此前,端對端AI訓(xùn)練很容易出現(xiàn)的問題是:由于涉及環(huán)節(jié)太多、系統(tǒng)太復(fù)雜,很容易出現(xiàn)“局部最優(yōu)”和“梯度下降”問題。我們本來以為會(huì)用殘差網(wǎng)絡(luò)(ResNet)增加反饋參數(shù),來幫助自動(dòng)駕駛大模型的訓(xùn)練。而論文提出的“聯(lián)合訓(xùn)練AI”,即預(yù)測聯(lián)合訓(xùn)練、預(yù)測規(guī)劃一體訓(xùn)練,實(shí)現(xiàn)了“類似全局優(yōu)化”,而“子任務(wù)”的引入也細(xì)化了環(huán)節(jié)。這篇論文的趨勢可能會(huì)改變具身智能(智聯(lián)汽車+機(jī)器人+智能家居)的AI軟件訓(xùn)練方式:嘗試端對端,并用一系列聯(lián)合訓(xùn)練,來防止局部最優(yōu),達(dá)到更好的效果。1.7具身智能:AI推理+理解,例如谷歌+微軟等作為科技巨頭,微軟的chatGPT也在努力滲透硬件載體,例如機(jī)器人軟件領(lǐng)域。而這些,恰恰將AI從感知,推進(jìn)到推理和理解范疇。ChatGPT在人機(jī)交互的4大潛在應(yīng)用。1)Zero-shottaskplanning。根據(jù)自然語言指令,生成適用于不同機(jī)器人平臺(tái)和任務(wù)的代碼,無需任何預(yù)先訓(xùn)練或微調(diào)。這種能力可以讓用戶快速地探索不同的機(jī)器人方案,而不需要了解底層的編程細(xì)節(jié)。場景:機(jī)械臂操作、無人機(jī)導(dǎo)航、家庭助理機(jī)器人等。優(yōu)點(diǎn):可以實(shí)現(xiàn)跨平臺(tái)、跨任務(wù)的機(jī)器人控制缺點(diǎn):可能存在代碼錯(cuò)誤或效率低下的風(fēng)險(xiǎn)。2)Userontheloop交互式對話,以解決復(fù)雜的機(jī)器人任務(wù),例如需要多步驟或多個(gè)目標(biāo)的任務(wù)。用戶可以通過對話提供高層次的反饋、指導(dǎo)或修改指令,而ChatGPT可以根據(jù)用戶的意圖和上下文調(diào)整代碼或行為。這種能力可以讓用戶更靈活地控制機(jī)器人,而不需要一次性給出完整的指令。場景:機(jī)器人協(xié)作、機(jī)器人教學(xué)、機(jī)器人規(guī)劃等。優(yōu)點(diǎn):可以提高機(jī)器人任務(wù)的成功率和魯棒性。缺點(diǎn):可能需要更多的對話輪次或用戶干預(yù)。3)Perception-actionloopsChatGPT可以利用視覺信息來指導(dǎo)機(jī)器人的動(dòng)作,例如識(shí)別物體、估計(jì)距離、規(guī)避障礙等??梢酝ㄟ^XML標(biāo)簽或其他格式來接收和處理圖像數(shù)據(jù),并生成相應(yīng)的代碼或動(dòng)作序列。這種能力可以讓機(jī)器人更好地適應(yīng)復(fù)雜和動(dòng)態(tài)的環(huán)境,而不需要預(yù)先定義所有可能的情況。適用場景包括機(jī)器人導(dǎo)航、機(jī)器人抓取、機(jī)器人搜索等。優(yōu)點(diǎn)是可以增強(qiáng)機(jī)器人的感知和決策能力。缺點(diǎn)是可能存在視覺誤識(shí)別或動(dòng)作不準(zhǔn)確的風(fēng)險(xiǎn)。4)Reasoningandcommon-senseroboticstasksChatGPT可以利用常識(shí)知識(shí)和推理能力來解決一些需要邏輯、幾何或數(shù)學(xué)思維的機(jī)器人任務(wù),例如計(jì)算角度、判斷方向、選擇最優(yōu)路徑等。ChatGPT可以通過自然語言或數(shù)學(xué)表達(dá)式來表達(dá)和解決這些問題,并生成相應(yīng)的代碼或動(dòng)作序列。這種能力可以讓機(jī)器人更智能地執(zhí)行一些抽象或難以描述的任務(wù),而不需要用戶提供過多的細(xì)節(jié)。適用場景包括機(jī)器人推理、機(jī)器人游戲、機(jī)器人創(chuàng)造等。優(yōu)點(diǎn)是可以拓展機(jī)器人的應(yīng)用范圍和難度。缺點(diǎn)是可能存在常識(shí)錯(cuò)誤或推理失敗的風(fēng)險(xiǎn)。谷歌的PaLM-E會(huì)利于具身智能(EmbodiedAI)的發(fā)展。一方面,具身智能主要涉及機(jī)器人的感知、規(guī)劃、控制、導(dǎo)航等上層部分。另一方面,具身AI不再像傳統(tǒng)AI僅從圖像、視頻、文本等數(shù)據(jù)庫中學(xué)習(xí),而是基于自身傳感器(多是視覺傳感器)感知環(huán)境并通過與環(huán)境交互進(jìn)行學(xué)習(xí)。大模型AI發(fā)展后,其對具身智能的提升至少包括:1)通過抽象的自然語言直接對機(jī)械智能控制。2)Zeroshot下的CV能力:圖像分類、語義分割、目標(biāo)檢測、實(shí)例分割、物體追蹤。3)更多跨模態(tài)的理解能力。其中,PaLM-E目前一大特色就是跨模態(tài)。PaLM-E(562Billionparameters)=PalM(540B)+ViT(VisionTransformer,22B)。它本身是個(gè)多模態(tài)的大模型,不僅能理解文本,還能理解圖片(因?yàn)榧恿薞iT),可以理解圖片中的語義信息。Few-shotprompt可以看懂笑話(左上角),zero-shot可以具有圖文思維鏈。1.8具身智能:AI理解+運(yùn)動(dòng)上述微軟、谷歌等AI功能,似乎和運(yùn)動(dòng)執(zhí)行、路徑規(guī)劃等更加聚焦的智能關(guān)聯(lián)度低,而以UCLA論文《DesignofaHighlyDynamicHumanoidRobot》、《DevelopmentandReal-TimeOptimization-basedControlofaFull-sizedHumanoidforDynamicWalkingandRunning》為例,涉及這些軟件較為深入。這些會(huì)啟發(fā)我們2023H2甚至未來多年,機(jī)器人軟件、AI大模型的一些趨勢。計(jì)算單元分為控制安全接口、控制接口、攝像感知接口、硬件接口等,均涉及軟件。它們對AI機(jī)器人軟件的涉及包括:1)穩(wěn)定性問題,可以歸納為識(shí)別、控制相關(guān)軟件。ARTEMIS的最初動(dòng)機(jī)是一個(gè)可以進(jìn)行超動(dòng)態(tài)運(yùn)動(dòng)的平臺(tái)。本論文側(cè)重于這項(xiàng)努力的第一步,有力地行走和奔跑的能力。后續(xù)希望滿足跳躍/轉(zhuǎn)身等復(fù)雜問題,需要做一些延展。例如:其一為推廣運(yùn)動(dòng)生成流水線,使其不需要專家知識(shí)和平臺(tái)經(jīng)驗(yàn)(可以歸納為zero-shot經(jīng)驗(yàn)的運(yùn)動(dòng)生成),其二為提高穩(wěn)定性的軟件(跟蹤潛在復(fù)雜和快速變化的魯棒控制器)。2)路徑規(guī)劃。當(dāng)前已經(jīng)有一定“泛化”能力,希望后續(xù)發(fā)展身體控制/路徑規(guī)劃/跨平臺(tái)運(yùn)動(dòng)(沒有感知數(shù)據(jù)、地面上存在重大障礙物時(shí),ARTEMIS也能夠保持平衡并在遇到意外時(shí)避免掉落。這是因?yàn)锳RTEMIS的運(yùn)動(dòng)堆棧的反應(yīng)性質(zhì))。但下一步可以在沒有運(yùn)算指引的情況下,通過身體控制、路徑規(guī)劃等,實(shí)現(xiàn)高效的運(yùn)動(dòng)(ARTEMIS可以穩(wěn)健地從A點(diǎn)移動(dòng)到B點(diǎn),但走哪條路仍然是一個(gè)未完成的任務(wù))。如果這樣做成,不僅限于ARTEMIS,還為混合系統(tǒng)的路徑規(guī)劃領(lǐng)域開辟路徑。3)基于感知的運(yùn)動(dòng),下一步有兩個(gè)路徑,一個(gè)是多步驟足跡規(guī)劃,一個(gè)是狀態(tài)估計(jì)。當(dāng)前基于環(huán)境的運(yùn)動(dòng)有一定進(jìn)展。當(dāng)前先感知數(shù)據(jù),以告知機(jī)器人腳可以定位的安全區(qū)域,這可以從頭部的立體相機(jī)或位于其身體的兩個(gè)立體相機(jī)獲得。感知數(shù)據(jù)可用后,下一個(gè)挑戰(zhàn)是呆在安全區(qū)域。一個(gè)解決方法是,更長的足跡規(guī)劃;另一個(gè)解決方法是,態(tài)估計(jì)。目前機(jī)器人浮動(dòng)底座的位置狀態(tài)不可觀察,導(dǎo)致坐標(biāo)系漂移。若將感知數(shù)據(jù)與定位上下文中的狀態(tài)估計(jì)結(jié)合,則所有狀態(tài)都變得可觀察。盡管這是當(dāng)前領(lǐng)先的設(shè)計(jì),但也做出下一步機(jī)器人軟件發(fā)展的趨勢展望:4)把物理接觸建模,在抓取/碰撞等任務(wù)中,問題會(huì)放大。工作控制器中,模擬建模和實(shí)際物理情況,經(jīng)常有差距。模擬與現(xiàn)實(shí)之間的差距經(jīng)常在學(xué)習(xí)社區(qū)中討論,但在機(jī)器人技術(shù)中卻很少被強(qiáng)調(diào)。這個(gè)問題可能會(huì)在碰撞檢查很重要的其他機(jī)器人領(lǐng)域反復(fù)出現(xiàn),例如靈巧操作和抓取領(lǐng)域。5)學(xué)習(xí)與控制交叉口。硬件上做上述測試,成本太高。在考慮魯棒性或隨機(jī)性的作品,但另一種方法可能是在管道中采用基于機(jī)器學(xué)習(xí)AI的方法。而且可以推測,一旦AI訓(xùn)練資源足夠,很可能后續(xù)的動(dòng)作會(huì)更加多樣。因?yàn)檎撐奶岬?,“模型相關(guān)的計(jì)算負(fù)擔(dān),模型中的非線性通常會(huì)禁止它們在在線規(guī)劃和控制中的使用”(“Additionally,nonlinearitiesinthemodelsoftenprohibittheirusageinonlineplanningandcontrolbecauseofthecomputationalburdenassociatedwiththem“)。6)人機(jī)交互(HRI)。ARTEMIS也可以成為一個(gè)有趣的平臺(tái),可用于探討超動(dòng)態(tài)運(yùn)動(dòng)以外的主題,其中之一就是人機(jī)交互。7)合成運(yùn)動(dòng),也就是連續(xù)運(yùn)動(dòng)反映的意圖和情緒。運(yùn)動(dòng)發(fā)生的規(guī)模和速度可以暗示接下來的運(yùn)動(dòng)是什么。此外,運(yùn)動(dòng)的空間和時(shí)間方面的差異也可以表示情緒和意圖。而其中1)識(shí)別控制相關(guān)軟件、2)基于感知的運(yùn)動(dòng)、5)學(xué)習(xí)與控制交叉,正是下一章節(jié)論文涉及的。1.9具身智能的零樣本嘗試:如李飛飛VoxPoser解決需要預(yù)定義動(dòng)作、機(jī)器無法直接被LLM(大語言模型)操控問題。2023年7月《VoxPoser:Composable3DValueMapsforRoboticManipulationwithLanguageModels》中,指出:1)很多訓(xùn)練需要預(yù)訓(xùn)練、預(yù)定義。大語言模型LLM雖然取得了進(jìn)展,但大多數(shù)人仍然依賴預(yù)定義的動(dòng)作原語來與環(huán)境進(jìn)行物理交互,這仍然是一個(gè)主要瓶頸。2)大語言模型直接輸出控制不可行。文本通常由高維空間中的高頻控制信號(hào)驅(qū)動(dòng),而機(jī)器人運(yùn)動(dòng)無法直接達(dá)到高維高頻率。本論文的解決思路是利用LLM的優(yōu)點(diǎn)。LLM在自由形式語言教學(xué)中,擅長推斷可能性和約束條件。而且,通過LLM可以具備代碼編寫能力。代碼能力可以與視覺語言模型(VLM)交互,以組成3D價(jià)值圖,將知識(shí)根植于觀察空間。然后將組合的值映射為機(jī)器人的軌跡(專業(yè)說法是,基于模型的、零樣本、具有動(dòng)態(tài)擾動(dòng)魯棒性的閉環(huán)機(jī)器人軌跡)。論文將這種方法稱為VOXPOSER。這是一種從LLM中提取可能性和約束的公式,用于在3D觀察空間中組成體素(Voxel1)值圖,以引導(dǎo)機(jī)器人與環(huán)境交互。具體來看:1)從指令語言中,輸出語言的可供性和約束;2)轉(zhuǎn)化成PYTHON代碼;3)代碼調(diào)用API;4)API操縱3D體素(Voxel);5)AI的獎(jiǎng)勵(lì)機(jī)制(正文指出,有效地提供觀察空間中的“密集獎(jiǎng)勵(lì)”,能夠在每一步都重新規(guī)劃)訓(xùn)練動(dòng)作;6)路徑規(guī)劃期目標(biāo)函數(shù),并合成路徑。1.10具身智能的泛化嘗試:谷歌RT1、RT2我們分析了2022年12月《RT-1:ROBOTICSTRANSFORMERFORREAL-WORLDCONTROLATSCALE》、2023年7月《RT-2:Vision-Language-ActionModelsTransferWebKnowledgetoRoboticControl》,做一些分析。2022年12月《RT-1:ROBOTICSTRANSFORMERFORREAL-WORLDCONTROLATSCALE》,指出:1)難點(diǎn)是可擴(kuò)展和大容量。AI在視覺、NLP等領(lǐng)域已經(jīng)成功,從孤立的小規(guī)模數(shù)據(jù)模型轉(zhuǎn)向大型通用模型(預(yù)訓(xùn)練過)。后續(xù),要點(diǎn)是開放式任務(wù)不可知訓(xùn)練,以及能夠吸收大規(guī)模數(shù)據(jù),形成高容量架構(gòu)。2)難點(diǎn)是機(jī)器人的多任務(wù)模型。在有監(jiān)督學(xué)習(xí)中,消除對大型特定任務(wù)數(shù)據(jù)集的訓(xùn)練很有意義,但對于多任務(wù)訓(xùn)練很難。在機(jī)器人領(lǐng)域,希望訓(xùn)練一個(gè)強(qiáng)力的、大型的多任務(wù)骨干模型。具體來說:3)對圖像和語言,轉(zhuǎn)為標(biāo)記Token。模型建立在Transformer架構(gòu)上,以圖像和任務(wù)描述的歷史作為輸入,并直接輸出標(biāo)記化的動(dòng)作。4)依賴圖像和語言的預(yù)訓(xùn)練,這是后續(xù)可以改善的。圖像通過ImageNet預(yù)訓(xùn)練的EfficientNet-B3(Tan&Le,2019)模型,該模型以6幅分辨率為300×300的圖像作為輸入,并從最終卷積層輸出形狀為9×9×512的空間特征圖。對于語言的預(yù)訓(xùn)練,先通過Universal語句編碼器嵌入(Cer等人,2018)。然后轉(zhuǎn)為FiLM層(Perez等,2018)的輸入。該層被添加到預(yù)訓(xùn)練的EfficientNet中,以調(diào)節(jié)圖像編碼器。5)經(jīng)過TokenLearner,到標(biāo)記化動(dòng)作。上述指令被轉(zhuǎn)換后,通過FiLM層調(diào)節(jié)預(yù)先訓(xùn)練的EfficientNet。生成的視覺語言標(biāo)記由TokenLearner精簡,輸入到Transformer中,輸出標(biāo)記化動(dòng)作。2023年7月《RT-2:Vision-Language-ActionModelsTransferWebKnowledgetoRoboticControl》。1)增加互聯(lián)網(wǎng)學(xué)習(xí)能力,利于擴(kuò)展。論文指出:研究了如何將基于互聯(lián)網(wǎng)規(guī)模數(shù)據(jù)訓(xùn)練的視覺語言模型直接納入端到端機(jī)器人控制中。并使RT-2能夠從互聯(lián)網(wǎng)規(guī)模的訓(xùn)練中獲得一系列緊急能力。這利于解釋機(jī)器人訓(xùn)練數(shù)據(jù)中不存在的命令的能力(例如將對象放置在特定數(shù)字或圖標(biāo)上),以及響應(yīng)用戶命令執(zhí)行基本推理的能力(如例如拾取最小或最大的對象或最接近另一對象的對象)。2)增加有效率的“泛化“能力。論文指出:為了將自然語言響應(yīng)和機(jī)器人動(dòng)作都適應(yīng)相同的格式,將動(dòng)作表示為文本標(biāo)記,并以與自然語言標(biāo)記相同的方式將其直接合并到模型的訓(xùn)練集中。正文稱之為視覺語言動(dòng)作模型(VLA)。值得注意的是,本文的VLA/VLM與李飛飛團(tuán)隊(duì)定義的VLM的含義有相似之處,均為visionlanguageactionmodel,只是VLA更強(qiáng)調(diào)動(dòng)作action。3)強(qiáng)調(diào)了動(dòng)作微調(diào)。為了使視覺語言模型能夠控制機(jī)器人,必須訓(xùn)練它們輸出動(dòng)作。論文采取了一種直接的方法來解決這個(gè)問題,將動(dòng)作表示為模型輸出中的標(biāo)記(類似語言標(biāo)記)。動(dòng)作空間主要包括機(jī)器人末端執(zhí)行器的六自由度(6DoF)位置和旋轉(zhuǎn)位移。連續(xù)維度(除離散終止命令外)被均勻地離散為256個(gè)倉。因此,機(jī)器人動(dòng)作可以使用離散倉的序數(shù)表示為8個(gè)整數(shù)。為了使用這些離散化的動(dòng)作將視覺語言微調(diào)為VLA(視覺語言動(dòng)作模型),需要將模型的現(xiàn)有標(biāo)記化中的標(biāo)記與離散動(dòng)作倉相關(guān)聯(lián)??梢姡篟T-2的發(fā)展,將“具身智能”的智能化繼續(xù)推進(jìn)。它1)延續(xù)了RT-1的多模態(tài)(視覺、指令、動(dòng)作一體化智能),與李飛飛團(tuán)隊(duì)VoxPoser的VLM思路有相似之處。2)泛化和延展性大大增加,但在“0樣本”和動(dòng)作自由度上,依然有空間。3)投資者2022-2023年機(jī)器人投資標(biāo)的主要是減速器、傳感器等硬件,預(yù)計(jì)未來會(huì)走向大模型軟件等標(biāo)的。1.11產(chǎn)業(yè)鏈小結(jié)可見:1)2020-2022年,大智聯(lián)汽車的傳感器環(huán)節(jié)是產(chǎn)業(yè)鏈重點(diǎn)。2)2022-2023年,大機(jī)器人成為重點(diǎn),催化劑為特斯拉機(jī)器人的進(jìn)展。3)2022H2至今,軟件能力、智慧能力,得到大幅度增強(qiáng),主要是大模型的研發(fā)、營銷、工程化落地加速。2、兩大關(guān)鍵問題本章討論兩大關(guān)鍵問題:耦合/解耦,鐘擺效應(yīng)。2.1軟硬件耦合或解耦:可能是兩套體系部分投資者認(rèn)為具身智能會(huì)“解耦“,即軟件、硬件(甚至制造和生產(chǎn)等)分離。我們認(rèn)為:可能是兩套體系。尤其“東方式”、“西方式”產(chǎn)業(yè)鏈不同。我們的科技TMT價(jià)值鏈往往屬于“東方式”。我們每個(gè)環(huán)節(jié)的價(jià)值鏈都相對平均,體現(xiàn)“行行出狀元”,也與“共同富?!备悠鹾?。這樣為了變強(qiáng)變大,往往需要在零件/產(chǎn)品/IT服務(wù)/品牌均較為出色,才能成為國內(nèi)tmt領(lǐng)軍。這樣會(huì)促進(jìn)“硬件+軟件+生產(chǎn)一體化”,也會(huì)促進(jìn)tmt領(lǐng)軍直接接觸客戶。而“西方式”的tmt往往是“解耦“的,某個(gè)細(xì)分領(lǐng)域成為世界領(lǐng)先即可,即使當(dāng)前甚至較長時(shí)間不盈利。一旦持續(xù)收入較快增長,預(yù)計(jì)會(huì)在某個(gè)時(shí)間扭虧為盈,利潤率快速提升(例如NFT、chatGPT、軟件等較為虛擬的事物在西方更流行)。2.2鐘擺效應(yīng)正是由于“解耦”與“耦合”,均在較長時(shí)間內(nèi)存在,但市場往往一段時(shí)間只傾斜一個(gè),這就形成認(rèn)知的鐘擺。最終兩種路徑往往互相學(xué)習(xí)、借鑒,形成“折中”的形態(tài)。3、下一步:現(xiàn)金流和工程化當(dāng)前情況下,具身智能和AI軟件的工程化落地是關(guān)鍵。我們從歷史經(jīng)驗(yàn)中發(fā)現(xiàn),現(xiàn)金流好的公司,創(chuàng)新勝率明顯更高。工程化能力雖然難以量化,但凈營業(yè)周期往往是很好的代替,就是經(jīng)營周轉(zhuǎn)能力。往往反映了“研發(fā)+產(chǎn)品+工程+銷售+話語權(quán)”。3.1“倉廩實(shí)而知禮節(jié)”:適用于具身智能+AIGC從當(dāng)前互聯(lián)網(wǎng)、互聯(lián)網(wǎng)+,都可以發(fā)現(xiàn):有較好的現(xiàn)金流,對創(chuàng)新的勝率明顯提高。這也適用于具身智能、AIGC。眾所眾知,1995-2001年“信息高速公路”,帶來了產(chǎn)業(yè)和股票都較大表現(xiàn)。但此后為“泡沫破裂”、“去偽存真”。最后崛起的代表例如微軟、亞馬遜、思科、英特爾;讓人惋惜的代表包括網(wǎng)景公司、Webvan、雅虎等。1)網(wǎng)景公司Netscape。微軟在于網(wǎng)景競爭中逐漸處于上風(fēng)。1998年11月24日,美國在線以42億美元、免稅換股的方式,收購網(wǎng)景。而在2000年美國在線又與時(shí)代華納合并。2007年12月28日,美國在線在博客表示將停止網(wǎng)景瀏覽器的開發(fā)2)雅虎。1998年,雅虎本來有機(jī)會(huì)收購當(dāng)時(shí)的谷歌雛形——“BackRub(網(wǎng)絡(luò)爬蟲)”項(xiàng)目,谷歌創(chuàng)始人拉里·佩奇和謝爾蓋·布林要價(jià)100萬美元將項(xiàng)目賣給雅虎。但當(dāng)時(shí)的雅虎只愿意在搜索方面跟它合作。2006年,雅虎報(bào)價(jià)10億美元收購Facebook,但最終收購價(jià)下調(diào)至8.5億美元,雅虎沒有收購。2008年,微軟出價(jià)446億美金試圖收購雅虎,但沒有成功。我們認(rèn)為,雅虎對技術(shù)的關(guān)注度高低、對長期發(fā)展的關(guān)注高低,決定了這幾次決策。3)Webvan。Webvan是一家美國的網(wǎng)上雜貨零售商,曾經(jīng)一度非常著名。當(dāng)時(shí),Webvan一度開支巨大。Webvan斥資10億美元建設(shè)先進(jìn)的倉庫,但這并不能迅速帶來回報(bào)。Webvan在2001年宣布破產(chǎn)。我們認(rèn)為,1995-2001年生存下來、甚至最終發(fā)展壯大為互聯(lián)網(wǎng)領(lǐng)軍的:第一點(diǎn)是長期主義,體驗(yàn)在戰(zhàn)略和研發(fā)。1997年亞馬遜的貝索斯開始寫致股東的信,希望創(chuàng)造一種“經(jīng)久不衰的特許經(jīng)營權(quán)”機(jī)制,一種通過釋放互聯(lián)網(wǎng)的力量,這體現(xiàn)著長期主義。這種精神,在最終互聯(lián)網(wǎng)領(lǐng)軍上均有體現(xiàn)。第二點(diǎn)是安全邊際,主要通過現(xiàn)金流體現(xiàn)。相關(guān)公司1996-2006年財(cái)務(wù)情況驗(yàn)證了安全邊際的重要性:即使網(wǎng)景公司如日中天時(shí),自由現(xiàn)金流也不佳。即使亞馬遜還在起步階段,2002年起自由現(xiàn)金流已經(jīng)是正數(shù)。3.2技術(shù)和工程能力的財(cái)務(wù)篩選工程化能力雖然難以量化,但凈營業(yè)周期往往是很好的代替,就是經(jīng)營周轉(zhuǎn)能力。往往反映了“研發(fā)+產(chǎn)品+工程+銷售+話語權(quán)”。4、重點(diǎn)公司分析4.1螢石網(wǎng)絡(luò):工程能力強(qiáng)+2C機(jī)器人螢石網(wǎng)絡(luò)短中長期邏輯均有較大看點(diǎn):短期看,半年報(bào)業(yè)績超預(yù)期且高增有望持續(xù);中期看,“SaaS+AI”拉動(dòng)新增量,螢石云有望非線性加速;長期看,面向具身智能積極備戰(zhàn),有望成為2C機(jī)器人“國家隊(duì)”。首先,公司近期發(fā)布2023半年報(bào),利潤大超預(yù)期:2023上半年收入22.85億元,同比增長9.3%;歸母凈利潤2.59億元,同比增長70.3%。其中23Q2收入12.06億元,同比增長14.1%,歸母凈利潤1.67億元,同比增長100%。我們在業(yè)績前瞻中預(yù)測23Q2收入12億元、歸母凈利潤1.25億元,實(shí)際收入完全符合預(yù)期,利潤大超預(yù)期。23Q2毛利率同比大幅提升8.6pct至44.6%,是利潤超預(yù)期的主要推動(dòng)力。我們認(rèn)為原因在于:1)公司通過對采購和訂單管理精細(xì)化,使得供應(yīng)鏈成本下降;2)上半年主要電子元器件價(jià)格處于下行周期;3)收入結(jié)構(gòu)上,毛利率水平偏低的專業(yè)客戶占比下降、高毛利率的物聯(lián)網(wǎng)云平臺(tái)業(yè)務(wù)占比提升、海外業(yè)務(wù)占比提升。以上1)、3)兩點(diǎn)因素將在長周期維度上,持續(xù)提升公司毛利率中樞。其次,“SaaS+AI”拉動(dòng)新增量,螢石云有望非線性加速。此前云服務(wù)付費(fèi)率不高(根據(jù)公司年報(bào),2022年C端持有螢石設(shè)備的年度累計(jì)活躍用戶數(shù)約2100萬,持有螢石設(shè)備的年度累計(jì)付費(fèi)用戶數(shù)約227萬,付費(fèi)率約10.8%),主要由于能力單一(云存儲(chǔ)占絕對大頭)。當(dāng)前變化正在發(fā)生,2022年底公司推出了首款老人看護(hù)服務(wù)套包,此外面向?qū)櫸锟醋o(hù)、兒童看護(hù)等特殊場景將持續(xù)推出SaaS化訂閱的AI算法包,通過為客戶提供增量價(jià)值、切中用戶剛需,實(shí)現(xiàn)云業(yè)務(wù)付費(fèi)率、ARPU值的上行。并且在未來有望結(jié)合AI大模型,在改善體驗(yàn)的同時(shí)增加收費(fèi)點(diǎn),進(jìn)一步提升云服務(wù)收入增速和占比。第三,面向具身智能積極備戰(zhàn),有望成為2C機(jī)器人“國家隊(duì)”。我們認(rèn)為,公司發(fā)展具身智能已集齊多重有利因素:1)起步早、能力全。公司在2023半年報(bào)中,明確表示“針對C端具身智能機(jī)器人方面做積極的布局沉淀和前瞻性預(yù)研?!苯刂辽习肽暝谘械?大項(xiàng)目中,多數(shù)與具身智能相關(guān),其中技術(shù)涉及硬件的運(yùn)動(dòng)控制、軟件的導(dǎo)航算法,以及大模型、云邊融合等,均將為2C機(jī)器人的研發(fā)奠定基礎(chǔ)。在智能服務(wù)機(jī)器人產(chǎn)品線上,目前公司已經(jīng)布局了清潔機(jī)器人和陪伴機(jī)器人,未來產(chǎn)品線有望持續(xù)豐富。2)云能力+制造能力,兩道護(hù)城河。一方面,公司憑借稀缺的云服務(wù)能力,能夠?yàn)橹悄芗揖雍蜋C(jī)器人注入智慧的靈魂,提升用戶體驗(yàn),并實(shí)現(xiàn)快速迭代進(jìn)化;另一方面,公司不斷強(qiáng)化制造能力,包括IPO募投的螢石智能制造重慶基地項(xiàng)目,將為2C機(jī)器人降低成本、快速迭代帶來關(guān)鍵優(yōu)勢,有望更快實(shí)現(xiàn)“更低成本-更高市占-更多數(shù)據(jù)-更大競爭優(yōu)勢”的飛輪,在C端具身智能領(lǐng)域占據(jù)領(lǐng)先位置。3)既有國家隊(duì)身份,又富有管理活力。螢石實(shí)控人為中電科,又背靠實(shí)力強(qiáng)勁的母公司,C端機(jī)器人“國家隊(duì)”身份下容易獲得各方資源支持;同時(shí),公司管理團(tuán)隊(duì)在長期的市場競爭中,已經(jīng)充分證明了戰(zhàn)略和管理能力,并擁有高度市場化的激勵(lì)機(jī)制。此外,公司在線上線下、國內(nèi)國際渠道全面布局,助力上述邏輯加速兌現(xiàn)。1)國內(nèi)電商渠道方面,加大在常規(guī)的電商平臺(tái)上直播和優(yōu)質(zhì)達(dá)人帶貨,還積極開拓抖音等內(nèi)容興趣電商的直播渠道銷售;2)國內(nèi)線下渠道方面,公司形成了直營旗艦店、經(jīng)銷商專賣店、下沉市場堡壘店等多層次的終端渠道架構(gòu),積極布局線下專賣體驗(yàn)店,助力全屋智能系統(tǒng)業(yè)務(wù);3)海外渠道方面,上半年在零售連鎖賣場、家居建材類連鎖店、專業(yè)經(jīng)銷渠道和街邊店等多渠道中均取得了較好的增長,目前已在多個(gè)國家和地區(qū)實(shí)現(xiàn)線上與線下多渠道覆蓋。4.2柏楚電子(申萬機(jī)械):具身智能領(lǐng)軍。切割主業(yè)高速成長+焊接新品或迎放量期公司上市前主業(yè)為激光切割設(shè)備運(yùn)控系統(tǒng),上市后公司縱向延伸智能激光切割頭業(yè)務(wù)、橫向拓展智能焊接機(jī)器人控制系統(tǒng)業(yè)務(wù)。(一)業(yè)務(wù)1:激光切割系統(tǒng)-柏楚方案降低行業(yè)準(zhǔn)入門檻,綜合市占率持續(xù)提升運(yùn)動(dòng)控制系統(tǒng)是激光切割設(shè)備、自動(dòng)化生產(chǎn)設(shè)備的關(guān)鍵功能部件,一個(gè)完整的激光切割流程包括:第一步,使用控制系統(tǒng)提供商提供的激光專用設(shè)計(jì)軟件或第三方工業(yè)設(shè)計(jì)軟件如AutoCAD、Solidworks等繪制零件、裝配體的加工圖紙;第二步,將加工圖紙通過軟件進(jìn)行后期圖形處理及排版,生成加工的機(jī)床代碼;第三步,激光切割機(jī)床根據(jù)代碼指令執(zhí)行切割任務(wù),整個(gè)切割過程中涉及圖形編輯、工藝設(shè)置及具體加工工藝選擇、運(yùn)動(dòng)控制、切割頭和激光器等外設(shè)控制、加工控制、切割頭與切割部件之間焦距控制及隨動(dòng)等各環(huán)節(jié),最終完成零件、裝配體的加工。激光切割過程所需的關(guān)鍵技術(shù)包括CAD、CAM、NC、傳感器技術(shù)等硬件設(shè)計(jì)技術(shù):1)CAD技術(shù):通過計(jì)算機(jī)建?;驈膱D紙讀取數(shù)字模型,進(jìn)行圖形識(shí)別、編輯和優(yōu)化處理,生成零件并將零件通過計(jì)算機(jī)輔助在板材或型材上進(jìn)行排版,并輸出待加工模型;2)CAM技術(shù):根據(jù)工藝要求,通過計(jì)算機(jī)輔助生成所需的刀路軌跡以及光路、氣路、焦點(diǎn)等控制參數(shù)和自動(dòng)化加工模型,并生成指令;3)NC技術(shù):可以實(shí)現(xiàn)根據(jù)生成的機(jī)床代碼指令執(zhí)行具體加工工序的功能,具體涉及加工過程中的運(yùn)動(dòng)/加工控制、切割頭和激光器等外部設(shè)備控制等;4)傳感器技術(shù):通過傳感器技術(shù)實(shí)現(xiàn)切割過程中溫度、濕度、壓力、光電、視覺、氣壓、激光加工頭與被切割板材之間的間距等因素的控制,從而優(yōu)化激光加工效率,提高智能化水平;5)硬件設(shè)計(jì)技術(shù):針對激光行業(yè)特殊需求,定制開發(fā)相應(yīng)硬件產(chǎn)品,合理的硬件設(shè)計(jì)和專業(yè)的檢測手段可以起到提高切割穩(wěn)定性及抗干擾能力的作用。柏楚產(chǎn)品推出后重新定義激光加工行業(yè)標(biāo)準(zhǔn)、降低切割設(shè)備操作門檻及學(xué)習(xí)成本。公司核心技術(shù)自主研發(fā),完整地掌握了激光切割控制系統(tǒng)研發(fā)所需的CAD技術(shù)、CAM技術(shù)、NC技術(shù)、傳感器技術(shù)和硬件設(shè)計(jì)技術(shù)五大類關(guān)鍵技術(shù)。在柏楚電子推出“CAD、CAM和NC三合一激光切割控制系統(tǒng)”和“網(wǎng)絡(luò)通訊式隨動(dòng)系統(tǒng)”兩項(xiàng)技術(shù)變革前,國際激光切割的完整流程通常為:利用AutoCAD、Solidworks等專用CAD設(shè)計(jì)軟件繪制零件圖,然后再導(dǎo)入美國SigmaNest或西班牙Lantek等專業(yè)排樣軟件中進(jìn)行零件后處理和排版,生成加工文件后導(dǎo)入德國倍福、德國PA、西門子等數(shù)控系統(tǒng)中,搭配德國Precitec的電容隨動(dòng)系統(tǒng)進(jìn)行后續(xù)加工操作。柏楚電子推出上述技術(shù)變革后,為下游激光設(shè)備制造商提供了一站式的解決方案,重新定義了我國激光加工行業(yè)的標(biāo)準(zhǔn),用戶可以在柏楚電子的控制系統(tǒng)中同時(shí)實(shí)現(xiàn)上述激光加工的全部流程,大幅降低激光切割設(shè)備的操作門檻和學(xué)習(xí)成本,簡化激光切割設(shè)備的裝機(jī)和調(diào)試過程。柏楚電子在激光切割領(lǐng)域保持強(qiáng)競爭力。1)中低功率激光切割控制系統(tǒng):柏楚電子的中低功率產(chǎn)品在穩(wěn)定性、可靠性、精度、速度、易用性等各方面均具備明顯優(yōu)勢,市場占有率約為60%。2)高功率激光切割控制系統(tǒng):目前國際廠商依然占據(jù)絕對優(yōu)勢,為中國市場主導(dǎo)者,柏楚2021年市占率約17%,近年隨著國內(nèi)高功率激光切割市場發(fā)展及柏楚產(chǎn)品日益成熟,柏楚份額持續(xù)提升中。(二)業(yè)務(wù)2:智能切割頭-搭載高功率切割設(shè)備,滲透率提升+國產(chǎn)替代切割頭充當(dāng)“四肢”的角色,與控制系統(tǒng)實(shí)現(xiàn)協(xié)同互補(bǔ)。激光切割控制系統(tǒng)與智能激光切割頭是大腦與四肢的關(guān)系,兩者軟硬結(jié)合,需要在信息收集、傳輸、反饋的同步性和精密性上達(dá)到很高的契合。切割頭在激光切割中的工作流程是:激光器產(chǎn)生激光,通過外光路傳輸,在切割頭內(nèi)經(jīng)聚焦鏡聚焦后,作用于被加工材料表面,將材料氣化或者在切割氣體輔助下形成熔池,以實(shí)現(xiàn)吹散被激光融化的金屬熔渣或助燃。由于高功率激光切割的工作環(huán)境惡劣,設(shè)備需要在高溫、高濕、粉塵污染大的環(huán)境下運(yùn)行,外部環(huán)境和切割頭內(nèi)部任何微小的變化都會(huì)對設(shè)備性能和切割效果產(chǎn)生較大影響,因此及時(shí)將工況信息傳遞回控制系統(tǒng),由控制系統(tǒng)進(jìn)行實(shí)時(shí)調(diào)整,有助于最大程度保證激光切割設(shè)備的工作效率。柏楚電子智能切割頭產(chǎn)品與高功率軟件搭載銷售,客戶認(rèn)可度高、銷售額快速提升。目前我國整機(jī)制造廠商使用的高功率激光切割頭和三維激光切割頭主要依賴進(jìn)口,主要供應(yīng)廠商分別為德國Precitec和德國LT。且德國廠商生產(chǎn)的切割頭的傳感器數(shù)據(jù)無法與國產(chǎn)的激光切割系統(tǒng)進(jìn)行實(shí)時(shí)的通訊,從而無法實(shí)現(xiàn)智能的閉環(huán)控制策略。公司激光切割頭具備安裝、調(diào)試簡易,傳感器齊全,將是目前市場為數(shù)不多的具備與國外同類產(chǎn)品競爭力的國產(chǎn)智能切割頭。從產(chǎn)業(yè)層面來看,公司原有主業(yè)激光切割頭軟件和智能激光切割頭在激光切割設(shè)備整機(jī)制造中屬于平行工序的關(guān)系,下游客戶高度重合?;诠驹诳刂葡到y(tǒng)細(xì)分領(lǐng)域內(nèi)的龍頭位置,公司拓展智能激光切割頭具有渠道優(yōu)勢,且客戶對于切割頭評價(jià)反饋較高,子公司波刺自動(dòng)化(切割頭業(yè)務(wù)主體)營收快速增長。2020年波刺自動(dòng)化子公司營收進(jìn)0.11億元,2023年上半年?duì)I收達(dá)到1.54億。(三)業(yè)務(wù)3:智能焊接機(jī)器人控制系統(tǒng)-機(jī)器換人大勢所趨、柏楚產(chǎn)品或迎放量期鋼構(gòu)非標(biāo)場景屬性,倒逼智能焊接機(jī)器人需求。智能焊接機(jī)器人產(chǎn)品為電弧焊焊接機(jī)器人。按照機(jī)器人加工路徑生成的方式不同,焊接機(jī)器人產(chǎn)品可以分為示教焊接機(jī)器人和智能焊接機(jī)器人兩類。示教焊接機(jī)器人主要需要人工示教來編輯焊縫的加工的路徑;智能焊接機(jī)器人通過離線編程來生成焊縫加工路徑。目前國內(nèi)焊接行業(yè)自動(dòng)化水平較低,現(xiàn)有進(jìn)口產(chǎn)品成本過高,且對操作調(diào)試人員的技術(shù)能力具備較高的要求。而隨著我國鋼結(jié)構(gòu)產(chǎn)業(yè)的持續(xù)快速發(fā)展,鋼構(gòu)產(chǎn)品產(chǎn)量增加將直接帶動(dòng)鋼構(gòu)焊接市場需求。與此同時(shí),焊工工種的持續(xù)短缺,使得鋼構(gòu)企業(yè)對于焊接自動(dòng)化解決方案的需求與日俱增,智能焊接機(jī)器人替代人工為行業(yè)趨勢。完整的鋼結(jié)構(gòu)零件焊接加工流程及公司核心技術(shù)在焊接工藝的應(yīng)用情況如下:第一步、從Tekla,Revit等建筑設(shè)計(jì)軟件里導(dǎo)出需要焊接的鋼結(jié)構(gòu)零件模型。第二步、對鋼結(jié)構(gòu)零件模型進(jìn)行編輯,設(shè)置焊縫,生成坡口并設(shè)置焊道順序。第三步、在數(shù)字孿生系統(tǒng)中編輯機(jī)器人焊接動(dòng)作,進(jìn)行運(yùn)動(dòng)仿真,確認(rèn)加工路徑正確沒有碰撞。并生成焊接加工站運(yùn)行指令。第四步、3D相機(jī)掃描整個(gè)工件,對工件進(jìn)行識(shí)別和空間定位,并校正焊縫的加工位置數(shù)據(jù)。然后機(jī)器人根據(jù)焊接指令運(yùn)動(dòng)到焊縫起始位置進(jìn)行焊接。焊接過程涉及機(jī)器人姿態(tài)自適應(yīng)調(diào)整,動(dòng)態(tài)規(guī)劃路徑以及自動(dòng)避障,焊接工藝選擇匹配,焊縫跟蹤傳感器控制,圖像信號(hào)處理,焊縫跟蹤過程以及焊接工藝動(dòng)作實(shí)時(shí)調(diào)整,最終完成零件的焊接。切割與焊接為上下道工序,柏楚切割場景積累技術(shù)工藝可部分復(fù)用于焊接場景。切割與焊接在鋼結(jié)構(gòu)產(chǎn)品生產(chǎn)制造中屬于上下游工序的關(guān)系。由于焊接與切割在CAD技術(shù)、CAM技術(shù)、NC技術(shù)、傳感器技術(shù)和硬件設(shè)計(jì)在智能制造和自動(dòng)化領(lǐng)域的共通性,公司在切割領(lǐng)域所積累的核心技術(shù)儲(chǔ)備為進(jìn)軍智能焊接機(jī)器人及控制系統(tǒng)領(lǐng)域奠定了堅(jiān)實(shí)的基礎(chǔ)。目前,國產(chǎn)焊接機(jī)器人大多數(shù)為需要人工示教的半自動(dòng)化模式,公司通過開發(fā)工件視覺定位系統(tǒng)、智能焊縫跟蹤系統(tǒng)通過視覺傳感器識(shí)別工件和焊縫,智能焊接離線編程、控制系統(tǒng)通過CAD技術(shù)、CAM技術(shù)、NC技術(shù)進(jìn)行焊接機(jī)器人加工工藝控制,達(dá)到取代人工示教模式進(jìn)行自動(dòng)化智能焊接的效果。當(dāng)前下游鋼構(gòu)企業(yè)迫于產(chǎn)能及成本壓力,對于智能焊接機(jī)器人需求迫切,隨著公司產(chǎn)品成熟度提升及積極市場推廣,未來焊接產(chǎn)品或?qū)⒂瓉矸帕科凇?.3德賽西威(tmt&汽車):從中國領(lǐng)先tier1走向世界級德賽西威是中國領(lǐng)先的汽車tier1,從事智能座艙、智能駕駛、智能互聯(lián)業(yè)務(wù)。預(yù)計(jì)未來要沖擊成為世界級tier1公司成長來自乘用車銷量、智能化滲透率、智能化ASP、客戶結(jié)構(gòu)四重因子的成長。收入增長的持續(xù)強(qiáng)勁驗(yàn)證了滲透率和ASP的增加。現(xiàn)金流的優(yōu)秀、減配壓力下較強(qiáng)的毛利率(剔除匯兌影響)體現(xiàn)優(yōu)質(zhì)客戶結(jié)構(gòu)的增加。而2023年5月開始,車市恢復(fù)狀態(tài)中。2)2023H2-2024,預(yù)計(jì)德賽西威即將迎來IPU02增長、第四代座艙電子、高階ADAS量產(chǎn)、ADAS出海等新型機(jī)會(huì)。4.4虹軟科技:工程化能力強(qiáng)+車載AI虹軟科技在AI底層視覺優(yōu)化較好,適用于手機(jī)+車載+VRAR+商戶AIGC等領(lǐng)域。伴隨特斯拉視覺AI大模型熱議,投資者尋找BEV路線圖的標(biāo)的。而虹軟科技官方網(wǎng)站實(shí)際披露了虛擬BEV幫助停車。我們認(rèn)為BE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 閱讀課題立項(xiàng)申報(bào)書模板
- 幼兒早期閱讀課題申報(bào)書
- 買賣運(yùn)營車輛合同范本
- 咖啡承包勞務(wù)合同范例
- 合同范例國標(biāo)規(guī)范
- 課題申報(bào)書選題依據(jù)
- 共同委托審計(jì)合同范本
- 單項(xiàng)承攬合同范例
- 借用工合同范本
- 員工合同范本 江西個(gè)體
- SZSD01 0012-2024智能交通大數(shù)據(jù)底座數(shù)據(jù)采集規(guī)范
- 經(jīng)典廣告歌曲大全(109首)
- 環(huán)保儀器培訓(xùn)
- 2024年全國職業(yè)院校技能大賽中職(大數(shù)據(jù)應(yīng)用與服務(wù)賽項(xiàng))考試題庫(含答案)
- 2024湖南省水利廳直屬事業(yè)單位招聘擬聘用人員歷年高頻難、易錯(cuò)點(diǎn)500題模擬試題附帶答案詳解
- 《計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)》課程教案(完整版)
- 追覓在線測評題
- 調(diào)崗未到崗解除勞動(dòng)合同通知書
- 金屬材料課程設(shè)計(jì)作業(yè)
- 2023年古文中的化學(xué)知識(shí)歸納及相關(guān)練習(xí)題(含答案)
- 《基礎(chǔ)寫作》試卷及答案
評論
0/150
提交評論