具身智能AI行業(yè)市場分析

上傳人：白*** IP屬地：湖南上傳時(shí)間：2023-09-27 格式：DOCX 頁數(shù)：31 大?。?.01MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩26頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

具身智能AI行業(yè)市場分析1、產(chǎn)業(yè)鏈圖理解傳感器+大模型+具身智能1.1從框圖開始理解具身智能AI它尤其適用于描述L2-L3-L4自動(dòng)駕駛的智能化處理方式。而自動(dòng)駕駛是“具身智能”重要落地場景。最上面是“傳感后融合“，傳感器數(shù)據(jù)處理后再融合、預(yù)測、決策、控制。中間是“傳感前融合“，即數(shù)據(jù)先同步和融合后，再預(yù)測、決策、控制。下面近似為“端到端”，大大增加了預(yù)測、規(guī)劃、控制的數(shù)據(jù)處理。如果這個(gè)問題擴(kuò)張到更大的范疇，例如增加AI推理+理解+運(yùn)動(dòng)，把機(jī)器人也繪制進(jìn)去，就得到下面的“具身智能產(chǎn)業(yè)鏈圖”。1.2傳感器：機(jī)器人傳感器值得一提的是，2020-2022年是智能汽車傳感器獲得高關(guān)注的階段，尤其“硬件預(yù)埋”趨勢下。2022-2023年是機(jī)器人傳感器獲得高關(guān)注的階段。1.3AI3D視覺：NeRF，三維重建新范式NeRF，即NeuralRadianceFields（神經(jīng)輻射場)。其通俗理解：給予海量不同視角的二維圖，合成同一場景不同視角下的圖像。還可以通俗理解為X-Y-Z到三維極坐標(biāo)的轉(zhuǎn)化，第三視角到第一視角的轉(zhuǎn)化。NeRF提出的隱式表達(dá)以空間點(diǎn)的坐標(biāo)和觀察者的視角、位置作為輸入，輸出則是點(diǎn)的RGB信息和占用密度。占用密度這一點(diǎn)與占用函數(shù)相似，但沒有像占用函數(shù)那樣粗暴地用0和1表示一個(gè)點(diǎn)是否被占用，而是用0~1之間的數(shù)字表示點(diǎn)被占用的程度這樣可以大幅減少計(jì)算量。輻射場：如果我們從一個(gè)角度向一個(gè)靜態(tài)空間發(fā)射一條射線，我們可以查詢到這條射線在空間中每個(gè)點(diǎn)（x,y,z）的密度ρ，以及該位置在射線角度(θ,φ)下呈現(xiàn)出來的顏色c（c=(R,G,B)）。即F(x,y,z,θ,φ)→(R,G,B,ρ)。密度是用來計(jì)算權(quán)重的，對點(diǎn)上的顏色做加權(quán)求和就可以呈現(xiàn)像素顏色。給定F(x,y,z,θ,φ)直接查表獲得RGB值和密度，給體渲染方法。體渲染：對上述輻射場的密度和顏色做積分，就可以得到像素的顏色，并遍歷所有像素，這個(gè)視角下的圖像就渲染出來了。1.4AI3D感知：BEV，可用于具身智能感知BEV鳥瞰圖。BEV的全稱是Bird’seyeview（鳥瞰圖），我們以特斯拉為例：特斯拉車型使用多個(gè)攝像頭采集圖像，并進(jìn)行有效的融合。系統(tǒng)直接通過將所有攝像頭采集圖像通過矯正后，統(tǒng)一輸入到神經(jīng)網(wǎng)絡(luò)來提取特征。然后利用大模型的Transformer，將這些特征進(jìn)行關(guān)聯(lián)，之后再投影到一個(gè)向量空間之中。BEV的通俗理解：把不同視角的觀察合成一個(gè)“天眼模式”整體圖，了解全局。尤其圖像是2D傳感，通過連續(xù)序列，恢復(fù)出3D信息。這種方式的優(yōu)點(diǎn)有：減少硬件傳感器、提高純視覺精度、可復(fù)用多種數(shù)據(jù)源（甚至多模態(tài)），缺點(diǎn)是成本高。1）這種鳥瞰圖仿佛就是開了一個(gè)整體視角，讓車輛能夠把近處的感知統(tǒng)一放到一個(gè)平面中，盡可能的增大了感知的范圍和冗余度。2）但缺點(diǎn)是成本，2023年，如果要做BEV的城市輔助駕駛，可能需要投入超過百億元。3）BEV可以結(jié)合國內(nèi)的傳感器優(yōu)勢。盡管國外通常利于AI軟件優(yōu)化智能駕駛，國內(nèi)通常利用激光雷達(dá)等傳感器優(yōu)化智能駕駛，但BEV可以融合激光雷達(dá)的點(diǎn)云，做到盡量統(tǒng)一。下圖就是一個(gè)案例：主要有兩個(gè)分支將點(diǎn)云數(shù)據(jù)轉(zhuǎn)換為BEV表示。上分支提取3D空間中的點(diǎn)云特征，提供更準(zhǔn)確的檢測結(jié)果。下分支提取2D空間中的BEV特征（原始點(diǎn)云轉(zhuǎn)換），提供更高效的網(wǎng)絡(luò)。1.5AI3D感知：占用網(wǎng)絡(luò)占用網(wǎng)絡(luò)OccupancyNetwork。Tesla在2022年10月的AIDay中展現(xiàn)了OccupancyNetwork感知技術(shù)?；镜乃枷胧菍⑷S空間劃分成體素（voxel），通過0/1賦值對voxel進(jìn)行二分類：有物體的voxel賦值為1，表示voxel被物體占據(jù)；沒有物體的voxel被賦值為0。當(dāng)然實(shí)際中的賦值可以是概率值，表示voxel存在物體的概率，這個(gè)概率也可以理解成密度或者透明度。OccupancyNetwork的通俗理解：兩維的鳥瞰BEV，變?yōu)槿S的鳥瞰。而增加運(yùn)動(dòng)序列預(yù)測。Voxel的使用：1）voxel其實(shí)是計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺中早期使用的三維重建表達(dá)方式，主要用于一些對精度要求不是很高的場景進(jìn)行三維建模。2）Voxel的屬性除了是否被占據(jù)，還包含語義信息和速度信息（OccupancyFlow）等。其中速度信息是一個(gè)三維向量，用于表述voxel運(yùn)動(dòng)的速度和方向，類似于2D圖像中的光流（OpticalFlow）。這可以用于判斷物體是否運(yùn)動(dòng)。Occupancy和OccupancyFlow都是底層層次信息，非常適合表示非剛體(non-rigid)場景。3）一個(gè)應(yīng)用領(lǐng)域是汽車AI，還一個(gè)領(lǐng)域是CT醫(yī)學(xué)圖像。Voxel的表達(dá)方法存在分辨率、內(nèi)存占用大、渲染效率的問題，在三維重建領(lǐng)域早已經(jīng)被mesh所取代。但近些年來，隨著深度學(xué)習(xí)在三維重建領(lǐng)域中的興起，voxel的重建方案重新興起（以上來自《自動(dòng)駕駛之心》2023年1月觀點(diǎn)）。在恢復(fù)空間特征后，融合、恢復(fù)高分辨率、復(fù)雜輸出是關(guān)鍵。特斯拉采用暫時(shí)對齊（TemporalAlignment）將不同時(shí)序的特征，對齊后融合。進(jìn)而采用反卷積上采樣，恢復(fù)高分辨率。畢竟是分割3D空間的每個(gè)voxel,信息量更加稠密，低分辨率可能會(huì)導(dǎo)致性能受限。接下來就是占用網(wǎng)絡(luò)的預(yù)測輸出（VolumeOutputs）。后面則可以做更多高級語義非任務(wù)和輸出（比如：OccupancyFlow,Semantic，Shape，RoadSurface等）?？梢愿鶕?jù)特斯拉在CVPR2022workshop的演講、特斯拉歷次AI發(fā)布會(huì)的披露，了解細(xì)節(jié)。占用網(wǎng)絡(luò)有雙重監(jiān)督信號(hào)。第一是直接占用值的監(jiān)督，第二是NeRF渲染的監(jiān)督。智能汽車軟件進(jìn)步還包括端到端能力、多模態(tài)、大模型規(guī)控算法等。2023年5月，特斯拉推出FSDv1.4，要現(xiàn)FSD端到端能力，即包含高速領(lǐng)航、城市道路領(lǐng)航和泊車的智駕功能。2023年6月，多模態(tài)神經(jīng)網(wǎng)絡(luò)可能成為后續(xù)特斯拉亮點(diǎn)，如攝像視頻、地圖、導(dǎo)航、IMU（慣性測量單元）、GPS等。雖然國內(nèi)的傳感器方案較為領(lǐng)先，預(yù)計(jì)會(huì)越來越多的借鑒Transformer、BEV、占用網(wǎng)絡(luò)等技術(shù)。2023年6月，理想汽車家庭科技日的發(fā)布，可以作為國內(nèi)汽車大模型發(fā)展的縮影:1）ADMax3.0基于BEV架構(gòu)的車端感知模型已經(jīng)可以在絕大多數(shù)路段實(shí)時(shí)生成穩(wěn)定的道路結(jié)構(gòu)信息，奠定擺脫高精地圖依賴的基礎(chǔ)。2)不止感知算法層面，規(guī)控算法也使用了大模型技術(shù)。3）其NOA技術(shù)架構(gòu)特點(diǎn)可以理解為：使用NPN特征和TIN網(wǎng)絡(luò)增強(qiáng)BEV大模型，做到不依賴高精地圖，識(shí)別萬物；使用模仿學(xué)習(xí)讓規(guī)控算法做出更加擬人的決策；全自動(dòng)、全閉環(huán)的訓(xùn)練平臺(tái)支撐大模型持續(xù)進(jìn)化。1.6從AI感知，到端到端+具身智能（感知+預(yù)測+推理+理解+運(yùn)動(dòng)）2023年6月，《Planning-orientedAutonomousDriving》（以路徑規(guī)劃為導(dǎo)向的自動(dòng)駕駛）獲得本屆CVPR2023年最佳論文獎(jiǎng)（BestPaperAward），其涉及的是自動(dòng)駕駛大模型，很多思路可以同時(shí)用于未來智聯(lián)汽車、具身智能機(jī)器人。而上述難點(diǎn)1）識(shí)別控制相關(guān)軟件、2）基于感知的運(yùn)動(dòng)、5）學(xué)習(xí)與控制交叉，也在本篇論文的思路中有所涉及。從分塊優(yōu)化，變成一體化AI優(yōu)化，即“端到端”。在過去自動(dòng)駕駛AI中，一般將認(rèn)為劃分為多模塊，例如感知、預(yù)測、路徑規(guī)劃等。論文提出的“端到端”，即一體化訓(xùn)練、一體化AI（論文提出UnifiedAutonomousDriving，即UniAD）。它把感知、預(yù)測、規(guī)劃等三大類主任務(wù)、多種子任務(wù)（目標(biāo)檢測、目標(biāo)跟蹤、場景建圖、軌跡預(yù)測、柵格預(yù)測和路徑規(guī)劃）整合到統(tǒng)一的端到端網(wǎng)絡(luò)框架下。例如：1）在backbone環(huán)節(jié)，特征提取，其中涉及BEV和多模態(tài)等大模型技術(shù)。將一系列多相機(jī)圖像輸入特征提取器，并將生成的特征通過BEVFormer中的現(xiàn)成BEV編碼器轉(zhuǎn)換為統(tǒng)一鳥瞰圖(BEV)特征。UniAD并不局限于特定的BEV編碼器，并且可以利用其他替代方案通過長期時(shí)間融合或多模態(tài)融合來提取更豐富的BEV表示。2）在感知環(huán)節(jié)，目標(biāo)檢測與跟蹤模塊可以實(shí)現(xiàn)對動(dòng)態(tài)元素的特征提取、幀間物體跟蹤。檢測和跟蹤agents。MapFormer將mapqueries作為道路元素（例如，車道和分隔線）的語義抽象(semanticabstractions)，并對地圖進(jìn)行全景分割。3）預(yù)測模塊，實(shí)現(xiàn)動(dòng)靜態(tài)元素交互與長時(shí)序軌跡預(yù)測，而且已經(jīng)有“聯(lián)合訓(xùn)練AI”。占據(jù)柵格預(yù)測模塊實(shí)現(xiàn)了短時(shí)序全場景BEV、實(shí)例級預(yù)測。由于每個(gè)單元的動(dòng)作都會(huì)顯著影響場景中的其他，因此該模塊對所有考慮的單元進(jìn)行聯(lián)合預(yù)測。4）在規(guī)劃模塊，基于軌跡預(yù)測，做防碰撞，其中涉及占用網(wǎng)絡(luò)（Occupancynetwork）等大模型技術(shù)?；谧陨淼能壽E預(yù)測和基于占據(jù)柵格的碰撞優(yōu)化并使自己遠(yuǎn)離OccFormer預(yù)測的占用區(qū)域(occupiedregions)以避免碰撞。此前，端對端AI訓(xùn)練很容易出現(xiàn)的問題是：由于涉及環(huán)節(jié)太多、系統(tǒng)太復(fù)雜，很容易出現(xiàn)“局部最優(yōu)”和“梯度下降”問題。我們本來以為會(huì)用殘差網(wǎng)絡(luò)（ResNet）增加反饋參數(shù)，來幫助自動(dòng)駕駛大模型的訓(xùn)練。而論文提出的“聯(lián)合訓(xùn)練AI”，即預(yù)測聯(lián)合訓(xùn)練、預(yù)測規(guī)劃一體訓(xùn)練，實(shí)現(xiàn)了“類似全局優(yōu)化”，而“子任務(wù)”的引入也細(xì)化了環(huán)節(jié)。這篇論文的趨勢可能會(huì)改變具身智能（智聯(lián)汽車+機(jī)器人+智能家居）的AI軟件訓(xùn)練方式：嘗試端對端，并用一系列聯(lián)合訓(xùn)練，來防止局部最優(yōu)，達(dá)到更好的效果。1.7具身智能：AI推理+理解，例如谷歌+微軟等作為科技巨頭，微軟的chatGPT也在努力滲透硬件載體，例如機(jī)器人軟件領(lǐng)域。而這些，恰恰將AI從感知，推進(jìn)到推理和理解范疇。ChatGPT在人機(jī)交互的4大潛在應(yīng)用。1）Zero-shottaskplanning。根據(jù)自然語言指令，生成適用于不同機(jī)器人平臺(tái)和任務(wù)的代碼，無需任何預(yù)先訓(xùn)練或微調(diào)。這種能力可以讓用戶快速地探索不同的機(jī)器人方案，而不需要了解底層的編程細(xì)節(jié)。場景：機(jī)械臂操作、無人機(jī)導(dǎo)航、家庭助理機(jī)器人等。優(yōu)點(diǎn)：可以實(shí)現(xiàn)跨平臺(tái)、跨任務(wù)的機(jī)器人控制缺點(diǎn)：可能存在代碼錯(cuò)誤或效率低下的風(fēng)險(xiǎn)。2）Userontheloop交互式對話，以解決復(fù)雜的機(jī)器人任務(wù)，例如需要多步驟或多個(gè)目標(biāo)的任務(wù)。用戶可以通過對話提供高層次的反饋、指導(dǎo)或修改指令，而ChatGPT可以根據(jù)用戶的意圖和上下文調(diào)整代碼或行為。這種能力可以讓用戶更靈活地控制機(jī)器人，而不需要一次性給出完整的指令。場景：機(jī)器人協(xié)作、機(jī)器人教學(xué)、機(jī)器人規(guī)劃等。優(yōu)點(diǎn)：可以提高機(jī)器人任務(wù)的成功率和魯棒性。缺點(diǎn)：可能需要更多的對話輪次或用戶干預(yù)。3）Perception-actionloopsChatGPT可以利用視覺信息來指導(dǎo)機(jī)器人的動(dòng)作，例如識(shí)別物體、估計(jì)距離、規(guī)避障礙等?？梢酝ㄟ^XML標(biāo)簽或其他格式來接收和處理圖像數(shù)據(jù)，并生成相應(yīng)的代碼或動(dòng)作序列。這種能力可以讓機(jī)器人更好地適應(yīng)復(fù)雜和動(dòng)態(tài)的環(huán)境，而不需要預(yù)先定義所有可能的情況。適用場景包括機(jī)器人導(dǎo)航、機(jī)器人抓取、機(jī)器人搜索等。優(yōu)點(diǎn)是可以增強(qiáng)機(jī)器人的感知和決策能力。缺點(diǎn)是可能存在視覺誤識(shí)別或動(dòng)作不準(zhǔn)確的風(fēng)險(xiǎn)。4）Reasoningandcommon-senseroboticstasksChatGPT可以利用常識(shí)知識(shí)和推理能力來解決一些需要邏輯、幾何或數(shù)學(xué)思維的機(jī)器人任務(wù)，例如計(jì)算角度、判斷方向、選擇最優(yōu)路徑等。ChatGPT可以通過自然語言或數(shù)學(xué)表達(dá)式來表達(dá)和解決這些問題，并生成相應(yīng)的代碼或動(dòng)作序列。這種能力可以讓機(jī)器人更智能地執(zhí)行一些抽象或難以描述的任務(wù)，而不需要用戶提供過多的細(xì)節(jié)。適用場景包括機(jī)器人推理、機(jī)器人游戲、機(jī)器人創(chuàng)造等。優(yōu)點(diǎn)是可以拓展機(jī)器人的應(yīng)用范圍和難度。缺點(diǎn)是可能存在常識(shí)錯(cuò)誤或推理失敗的風(fēng)險(xiǎn)。谷歌的PaLM-E會(huì)利于具身智能（EmbodiedAI）的發(fā)展。一方面，具身智能主要涉及機(jī)器人的感知、規(guī)劃、控制、導(dǎo)航等上層部分。另一方面，具身AI不再像傳統(tǒng)AI僅從圖像、視頻、文本等數(shù)據(jù)庫中學(xué)習(xí)，而是基于自身傳感器（多是視覺傳感器）感知環(huán)境并通過與環(huán)境交互進(jìn)行學(xué)習(xí)。大模型AI發(fā)展后，其對具身智能的提升至少包括：1）通過抽象的自然語言直接對機(jī)械智能控制。2）Zeroshot下的CV能力：圖像分類、語義分割、目標(biāo)檢測、實(shí)例分割、物體追蹤。3）更多跨模態(tài)的理解能力。其中，PaLM-E目前一大特色就是跨模態(tài)。PaLM-E(562Billionparameters)=PalM(540B)+ViT(VisionTransformer,22B)。它本身是個(gè)多模態(tài)的大模型，不僅能理解文本，還能理解圖片（因?yàn)榧恿薞iT），可以理解圖片中的語義信息。Few-shotprompt可以看懂笑話（左上角），zero-shot可以具有圖文思維鏈。1.8具身智能：AI理解+運(yùn)動(dòng)上述微軟、谷歌等AI功能，似乎和運(yùn)動(dòng)執(zhí)行、路徑規(guī)劃等更加聚焦的智能關(guān)聯(lián)度低，而以UCLA論文《DesignofaHighlyDynamicHumanoidRobot》、《DevelopmentandReal-TimeOptimization-basedControlofaFull-sizedHumanoidforDynamicWalkingandRunning》為例，涉及這些軟件較為深入。這些會(huì)啟發(fā)我們2023H2甚至未來多年，機(jī)器人軟件、AI大模型的一些趨勢。計(jì)算單元分為控制安全接口、控制接口、攝像感知接口、硬件接口等，均涉及軟件。它們對AI機(jī)器人軟件的涉及包括：1）穩(wěn)定性問題，可以歸納為識(shí)別、控制相關(guān)軟件。ARTEMIS的最初動(dòng)機(jī)是一個(gè)可以進(jìn)行超動(dòng)態(tài)運(yùn)動(dòng)的平臺(tái)。本論文側(cè)重于這項(xiàng)努力的第一步，有力地行走和奔跑的能力。后續(xù)希望滿足跳躍/轉(zhuǎn)身等復(fù)雜問題，需要做一些延展。例如：其一為推廣運(yùn)動(dòng)生成流水線，使其不需要專家知識(shí)和平臺(tái)經(jīng)驗(yàn)（可以歸納為zero-shot經(jīng)驗(yàn)的運(yùn)動(dòng)生成），其二為提高穩(wěn)定性的軟件（跟蹤潛在復(fù)雜和快速變化的魯棒控制器）。2）路徑規(guī)劃。當(dāng)前已經(jīng)有一定“泛化”能力，希望后續(xù)發(fā)展身體控制/路徑規(guī)劃/跨平臺(tái)運(yùn)動(dòng)（沒有感知數(shù)據(jù)、地面上存在重大障礙物時(shí)，ARTEMIS也能夠保持平衡并在遇到意外時(shí)避免掉落。這是因?yàn)锳RTEMIS的運(yùn)動(dòng)堆棧的反應(yīng)性質(zhì)）。但下一步可以在沒有運(yùn)算指引的情況下，通過身體控制、路徑規(guī)劃等，實(shí)現(xiàn)高效的運(yùn)動(dòng)(ARTEMIS可以穩(wěn)健地從A點(diǎn)移動(dòng)到B點(diǎn)，但走哪條路仍然是一個(gè)未完成的任務(wù))。如果這樣做成，不僅限于ARTEMIS，還為混合系統(tǒng)的路徑規(guī)劃領(lǐng)域開辟路徑。3）基于感知的運(yùn)動(dòng)，下一步有兩個(gè)路徑，一個(gè)是多步驟足跡規(guī)劃，一個(gè)是狀態(tài)估計(jì)。當(dāng)前基于環(huán)境的運(yùn)動(dòng)有一定進(jìn)展。當(dāng)前先感知數(shù)據(jù)，以告知機(jī)器人腳可以定位的安全區(qū)域，這可以從頭部的立體相機(jī)或位于其身體的兩個(gè)立體相機(jī)獲得。感知數(shù)據(jù)可用后，下一個(gè)挑戰(zhàn)是呆在安全區(qū)域。一個(gè)解決方法是，更長的足跡規(guī)劃；另一個(gè)解決方法是，態(tài)估計(jì)。目前機(jī)器人浮動(dòng)底座的位置狀態(tài)不可觀察，導(dǎo)致坐標(biāo)系漂移。若將感知數(shù)據(jù)與定位上下文中的狀態(tài)估計(jì)結(jié)合，則所有狀態(tài)都變得可觀察。盡管這是當(dāng)前領(lǐng)先的設(shè)計(jì)，但也做出下一步機(jī)器人軟件發(fā)展的趨勢展望：4）把物理接觸建模，在抓取/碰撞等任務(wù)中，問題會(huì)放大。工作控制器中，模擬建模和實(shí)際物理情況，經(jīng)常有差距。模擬與現(xiàn)實(shí)之間的差距經(jīng)常在學(xué)習(xí)社區(qū)中討論，但在機(jī)器人技術(shù)中卻很少被強(qiáng)調(diào)。這個(gè)問題可能會(huì)在碰撞檢查很重要的其他機(jī)器人領(lǐng)域反復(fù)出現(xiàn)，例如靈巧操作和抓取領(lǐng)域。5）學(xué)習(xí)與控制交叉口。硬件上做上述測試，成本太高。在考慮魯棒性或隨機(jī)性的作品，但另一種方法可能是在管道中采用基于機(jī)器學(xué)習(xí)AI的方法。而且可以推測，一旦AI訓(xùn)練資源足夠，很可能后續(xù)的動(dòng)作會(huì)更加多樣。因?yàn)檎撐奶岬?，“模型相關(guān)的計(jì)算負(fù)擔(dān)，模型中的非線性通常會(huì)禁止它們在在線規(guī)劃和控制中的使用”（“Additionally,nonlinearitiesinthemodelsoftenprohibittheirusageinonlineplanningandcontrolbecauseofthecomputationalburdenassociatedwiththem“）。6）人機(jī)交互（HRI）。ARTEMIS也可以成為一個(gè)有趣的平臺(tái)，可用于探討超動(dòng)態(tài)運(yùn)動(dòng)以外的主題，其中之一就是人機(jī)交互。7）合成運(yùn)動(dòng)，也就是連續(xù)運(yùn)動(dòng)反映的意圖和情緒。運(yùn)動(dòng)發(fā)生的規(guī)模和速度可以暗示接下來的運(yùn)動(dòng)是什么。此外，運(yùn)動(dòng)的空間和時(shí)間方面的差異也可以表示情緒和意圖。而其中1）識(shí)別控制相關(guān)軟件、2）基于感知的運(yùn)動(dòng)、5）學(xué)習(xí)與控制交叉，正是下一章節(jié)論文涉及的。1.9具身智能的零樣本嘗試：如李飛飛VoxPoser解決需要預(yù)定義動(dòng)作、機(jī)器無法直接被LLM（大語言模型）操控問題。2023年7月《VoxPoser:Composable3DValueMapsforRoboticManipulationwithLanguageModels》中，指出：1）很多訓(xùn)練需要預(yù)訓(xùn)練、預(yù)定義。大語言模型LLM雖然取得了進(jìn)展，但大多數(shù)人仍然依賴預(yù)定義的動(dòng)作原語來與環(huán)境進(jìn)行物理交互，這仍然是一個(gè)主要瓶頸。2）大語言模型直接輸出控制不可行。文本通常由高維空間中的高頻控制信號(hào)驅(qū)動(dòng)，而機(jī)器人運(yùn)動(dòng)無法直接達(dá)到高維高頻率。本論文的解決思路是利用LLM的優(yōu)點(diǎn)。LLM在自由形式語言教學(xué)中，擅長推斷可能性和約束條件。而且，通過LLM可以具備代碼編寫能力。代碼能力可以與視覺語言模型（VLM）交互，以組成3D價(jià)值圖，將知識(shí)根植于觀察空間。然后將組合的值映射為機(jī)器人的軌跡（專業(yè)說法是，基于模型的、零樣本、具有動(dòng)態(tài)擾動(dòng)魯棒性的閉環(huán)機(jī)器人軌跡）。論文將這種方法稱為VOXPOSER。這是一種從LLM中提取可能性和約束的公式，用于在3D觀察空間中組成體素（Voxel1）值圖，以引導(dǎo)機(jī)器人與環(huán)境交互。具體來看：1)從指令語言中，輸出語言的可供性和約束；2)轉(zhuǎn)化成PYTHON代碼；3)代碼調(diào)用API；4)API操縱3D體素（Voxel）；5）AI的獎(jiǎng)勵(lì)機(jī)制（正文指出，有效地提供觀察空間中的“密集獎(jiǎng)勵(lì)”，能夠在每一步都重新規(guī)劃）訓(xùn)練動(dòng)作；6）路徑規(guī)劃期目標(biāo)函數(shù)，并合成路徑。1.10具身智能的泛化嘗試：谷歌RT1、RT2我們分析了2022年12月《RT-1:ROBOTICSTRANSFORMERFORREAL-WORLDCONTROLATSCALE》、2023年7月《RT-2:Vision-Language-ActionModelsTransferWebKnowledgetoRoboticControl》，做一些分析。2022年12月《RT-1:ROBOTICSTRANSFORMERFORREAL-WORLDCONTROLATSCALE》，指出：1）難點(diǎn)是可擴(kuò)展和大容量。AI在視覺、NLP等領(lǐng)域已經(jīng)成功，從孤立的小規(guī)模數(shù)據(jù)模型轉(zhuǎn)向大型通用模型（預(yù)訓(xùn)練過）。后續(xù)，要點(diǎn)是開放式任務(wù)不可知訓(xùn)練，以及能夠吸收大規(guī)模數(shù)據(jù)，形成高容量架構(gòu)。2）難點(diǎn)是機(jī)器人的多任務(wù)模型。在有監(jiān)督學(xué)習(xí)中，消除對大型特定任務(wù)數(shù)據(jù)集的訓(xùn)練很有意義，但對于多任務(wù)訓(xùn)練很難。在機(jī)器人領(lǐng)域，希望訓(xùn)練一個(gè)強(qiáng)力的、大型的多任務(wù)骨干模型。具體來說：3）對圖像和語言，轉(zhuǎn)為標(biāo)記Token。模型建立在Transformer架構(gòu)上，以圖像和任務(wù)描述的歷史作為輸入，并直接輸出標(biāo)記化的動(dòng)作。4）依賴圖像和語言的預(yù)訓(xùn)練，這是后續(xù)可以改善的。圖像通過ImageNet預(yù)訓(xùn)練的EfficientNet-B3（Tan&Le，2019）模型，該模型以6幅分辨率為300×300的圖像作為輸入，并從最終卷積層輸出形狀為9×9×512的空間特征圖。對于語言的預(yù)訓(xùn)練，先通過Universal語句編碼器嵌入（Cer等人，2018）。然后轉(zhuǎn)為FiLM層（Perez等，2018）的輸入。該層被添加到預(yù)訓(xùn)練的EfficientNet中，以調(diào)節(jié)圖像編碼器。5）經(jīng)過TokenLearner，到標(biāo)記化動(dòng)作。上述指令被轉(zhuǎn)換后，通過FiLM層調(diào)節(jié)預(yù)先訓(xùn)練的EfficientNet。生成的視覺語言標(biāo)記由TokenLearner精簡，輸入到Transformer中，輸出標(biāo)記化動(dòng)作。2023年7月《RT-2:Vision-Language-ActionModelsTransferWebKnowledgetoRoboticControl》。1）增加互聯(lián)網(wǎng)學(xué)習(xí)能力，利于擴(kuò)展。論文指出：研究了如何將基于互聯(lián)網(wǎng)規(guī)模數(shù)據(jù)訓(xùn)練的視覺語言模型直接納入端到端機(jī)器人控制中。并使RT-2能夠從互聯(lián)網(wǎng)規(guī)模的訓(xùn)練中獲得一系列緊急能力。這利于解釋機(jī)器人訓(xùn)練數(shù)據(jù)中不存在的命令的能力（例如將對象放置在特定數(shù)字或圖標(biāo)上），以及響應(yīng)用戶命令執(zhí)行基本推理的能力（如例如拾取最小或最大的對象或最接近另一對象的對象）。2）增加有效率的“泛化“能力。論文指出：為了將自然語言響應(yīng)和機(jī)器人動(dòng)作都適應(yīng)相同的格式，將動(dòng)作表示為文本標(biāo)記，并以與自然語言標(biāo)記相同的方式將其直接合并到模型的訓(xùn)練集中。正文稱之為視覺語言動(dòng)作模型（VLA）。值得注意的是，本文的VLA/VLM與李飛飛團(tuán)隊(duì)定義的VLM的含義有相似之處，均為visionlanguageactionmodel，只是VLA更強(qiáng)調(diào)動(dòng)作action。3）強(qiáng)調(diào)了動(dòng)作微調(diào)。為了使視覺語言模型能夠控制機(jī)器人，必須訓(xùn)練它們輸出動(dòng)作。論文采取了一種直接的方法來解決這個(gè)問題，將動(dòng)作表示為模型輸出中的標(biāo)記（類似語言標(biāo)記）。動(dòng)作空間主要包括機(jī)器人末端執(zhí)行器的六自由度（6DoF）位置和旋轉(zhuǎn)位移。連續(xù)維度（除離散終止命令外）被均勻地離散為256個(gè)倉。因此，機(jī)器人動(dòng)作可以使用離散倉的序數(shù)表示為8個(gè)整數(shù)。為了使用這些離散化的動(dòng)作將視覺語言微調(diào)為VLA(視覺語言動(dòng)作模型)，需要將模型的現(xiàn)有標(biāo)記化中的標(biāo)記與離散動(dòng)作倉相關(guān)聯(lián)?？梢姡篟T-2的發(fā)展，將“具身智能”的智能化繼續(xù)推進(jìn)。它1）延續(xù)了RT-1的多模態(tài)（視覺、指令、動(dòng)作一體化智能），與李飛飛團(tuán)隊(duì)VoxPoser的VLM思路有相似之處。2）泛化和延展性大大增加，但在“0樣本”和動(dòng)作自由度上，依然有空間。3）投資者2022-2023年機(jī)器人投資標(biāo)的主要是減速器、傳感器等硬件，預(yù)計(jì)未來會(huì)走向大模型軟件等標(biāo)的。1.11產(chǎn)業(yè)鏈小結(jié)可見：1）2020-2022年，大智聯(lián)汽車的傳感器環(huán)節(jié)是產(chǎn)業(yè)鏈重點(diǎn)。2）2022-2023年，大機(jī)器人成為重點(diǎn)，催化劑為特斯拉機(jī)器人的進(jìn)展。3）2022H2至今，軟件能力、智慧能力，得到大幅度增強(qiáng)，主要是大模型的研發(fā)、營銷、工程化落地加速。2、兩大關(guān)鍵問題本章討論兩大關(guān)鍵問題：耦合/解耦，鐘擺效應(yīng)。2.1軟硬件耦合或解耦：可能是兩套體系部分投資者認(rèn)為具身智能會(huì)“解耦“，即軟件、硬件（甚至制造和生產(chǎn)等）分離。我們認(rèn)為：可能是兩套體系。尤其“東方式”、“西方式”產(chǎn)業(yè)鏈不同。我們的科技TMT價(jià)值鏈往往屬于“東方式”。我們每個(gè)環(huán)節(jié)的價(jià)值鏈都相對平均，體現(xiàn)“行行出狀元”，也與“共同富?！备悠鹾?。這樣為了變強(qiáng)變大，往往需要在零件/產(chǎn)品/IT服務(wù)/品牌均較為出色，才能成為國內(nèi)tmt領(lǐng)軍。這樣會(huì)促進(jìn)“硬件+軟件+生產(chǎn)一體化”，也會(huì)促進(jìn)tmt領(lǐng)軍直接接觸客戶。而“西方式”的tmt往往是“解耦“的，某個(gè)細(xì)分領(lǐng)域成為世界領(lǐng)先即可，即使當(dāng)前甚至較長時(shí)間不盈利。一旦持續(xù)收入較快增長，預(yù)計(jì)會(huì)在某個(gè)時(shí)間扭虧為盈，利潤率快速提升（例如NFT、chatGPT、軟件等較為虛擬的事物在西方更流行）。2.2鐘擺效應(yīng)正是由于“解耦”與“耦合”，均在較長時(shí)間內(nèi)存在，但市場往往一段時(shí)間只傾斜一個(gè)，這就形成認(rèn)知的鐘擺。最終兩種路徑往往互相學(xué)習(xí)、借鑒，形成“折中”的形態(tài)。3、下一步：現(xiàn)金流和工程化當(dāng)前情況下，具身智能和AI軟件的工程化落地是關(guān)鍵。我們從歷史經(jīng)驗(yàn)中發(fā)現(xiàn)，現(xiàn)金流好的公司，創(chuàng)新勝率明顯更高。工程化能力雖然難以量化，但凈營業(yè)周期往往是很好的代替，就是經(jīng)營周轉(zhuǎn)能力。往往反映了“研發(fā)+產(chǎn)品+工程+銷售+話語權(quán)”。3.1“倉廩實(shí)而知禮節(jié)”：適用于具身智能+AIGC從當(dāng)前互聯(lián)網(wǎng)、互聯(lián)網(wǎng)+，都可以發(fā)現(xiàn)：有較好的現(xiàn)金流，對創(chuàng)新的勝率明顯提高。這也適用于具身智能、AIGC。眾所眾知，1995-2001年“信息高速公路”，帶來了產(chǎn)業(yè)和股票都較大表現(xiàn)。但此后為“泡沫破裂”、“去偽存真”。最后崛起的代表例如微軟、亞馬遜、思科、英特爾；讓人惋惜的代表包括網(wǎng)景公司、Webvan、雅虎等。1）網(wǎng)景公司Netscape。微軟在于網(wǎng)景競爭中逐漸處于上風(fēng)。1998年11月24日，美國在線以42億美元、免稅換股的方式，收購網(wǎng)景。而在2000年美國在線又與時(shí)代華納合并。2007年12月28日，美國在線在博客表示將停止網(wǎng)景瀏覽器的開發(fā)2）雅虎。1998年，雅虎本來有機(jī)會(huì)收購當(dāng)時(shí)的谷歌雛形——“BackRub（網(wǎng)絡(luò)爬蟲）”項(xiàng)目，谷歌創(chuàng)始人拉里·佩奇和謝爾蓋·布林要價(jià)100萬美元將項(xiàng)目賣給雅虎。但當(dāng)時(shí)的雅虎只愿意在搜索方面跟它合作。2006年，雅虎報(bào)價(jià)10億美元收購Facebook，但最終收購價(jià)下調(diào)至8.5億美元，雅虎沒有收購。2008年，微軟出價(jià)446億美金試圖收購雅虎，但沒有成功。我們認(rèn)為，雅虎對技術(shù)的關(guān)注度高低、對長期發(fā)展的關(guān)注高低，決定了這幾次決策。3）Webvan。Webvan是一家美國的網(wǎng)上雜貨零售商，曾經(jīng)一度非常著名。當(dāng)時(shí)，Webvan一度開支巨大。Webvan斥資10億美元建設(shè)先進(jìn)的倉庫，但這并不能迅速帶來回報(bào)。Webvan在2001年宣布破產(chǎn)。我們認(rèn)為，1995-2001年生存下來、甚至最終發(fā)展壯大為互聯(lián)網(wǎng)領(lǐng)軍的：第一點(diǎn)是長期主義，體驗(yàn)在戰(zhàn)略和研發(fā)。1997年亞馬遜的貝索斯開始寫致股東的信，希望創(chuàng)造一種“經(jīng)久不衰的特許經(jīng)營權(quán)”機(jī)制,一種通過釋放互聯(lián)網(wǎng)的力量，這體現(xiàn)著長期主義。這種精神，在最終互聯(lián)網(wǎng)領(lǐng)軍上均有體現(xiàn)。第二點(diǎn)是安全邊際，主要通過現(xiàn)金流體現(xiàn)。相關(guān)公司1996-2006年財(cái)務(wù)情況驗(yàn)證了安全邊際的重要性：即使網(wǎng)景公司如日中天時(shí)，自由現(xiàn)金流也不佳。即使亞馬遜還在起步階段，2002年起自由現(xiàn)金流已經(jīng)是正數(shù)。3.2技術(shù)和工程能力的財(cái)務(wù)篩選工程化能力雖然難以量化，但凈營業(yè)周期往往是很好的代替，就是經(jīng)營周轉(zhuǎn)能力。往往反映了“研發(fā)+產(chǎn)品+工程+銷售+話語權(quán)”。4、重點(diǎn)公司分析4.1螢石網(wǎng)絡(luò)：工程能力強(qiáng)+2C機(jī)器人螢石網(wǎng)絡(luò)短中長期邏輯均有較大看點(diǎn)：短期看，半年報(bào)業(yè)績超預(yù)期且高增有望持續(xù)；中期看，“SaaS+AI”拉動(dòng)新增量，螢石云有望非線性加速；長期看，面向具身智能積極備戰(zhàn)，有望成為2C機(jī)器人“國家隊(duì)”。首先，公司近期發(fā)布2023半年報(bào)，利潤大超預(yù)期：2023上半年收入22.85億元，同比增長9.3%；歸母凈利潤2.59億元，同比增長70.3%。其中23Q2收入12.06億元，同比增長14.1%，歸母凈利潤1.67億元，同比增長100%。我們在業(yè)績前瞻中預(yù)測23Q2收入12億元、歸母凈利潤1.25億元，實(shí)際收入完全符合預(yù)期，利潤大超預(yù)期。23Q2毛利率同比大幅提升8.6pct至44.6%，是利潤超預(yù)期的主要推動(dòng)力。我們認(rèn)為原因在于：1）公司通過對采購和訂單管理精細(xì)化，使得供應(yīng)鏈成本下降；2）上半年主要電子元器件價(jià)格處于下行周期；3）收入結(jié)構(gòu)上，毛利率水平偏低的專業(yè)客戶占比下降、高毛利率的物聯(lián)網(wǎng)云平臺(tái)業(yè)務(wù)占比提升、海外業(yè)務(wù)占比提升。以上1）、3）兩點(diǎn)因素將在長周期維度上，持續(xù)提升公司毛利率中樞。其次，“SaaS+AI”拉動(dòng)新增量，螢石云有望非線性加速。此前云服務(wù)付費(fèi)率不高（根據(jù)公司年報(bào)，2022年C端持有螢石設(shè)備的年度累計(jì)活躍用戶數(shù)約2100萬，持有螢石設(shè)備的年度累計(jì)付費(fèi)用戶數(shù)約227萬，付費(fèi)率約10.8%），主要由于能力單一（云存儲(chǔ)占絕對大頭）。當(dāng)前變化正在發(fā)生，2022年底公司推出了首款老人看護(hù)服務(wù)套包，此外面向?qū)櫸锟醋o(hù)、兒童看護(hù)等特殊場景將持續(xù)推出SaaS化訂閱的AI算法包，通過為客戶提供增量價(jià)值、切中用戶剛需，實(shí)現(xiàn)云業(yè)務(wù)付費(fèi)率、ARPU值的上行。并且在未來有望結(jié)合AI大模型，在改善體驗(yàn)的同時(shí)增加收費(fèi)點(diǎn)，進(jìn)一步提升云服務(wù)收入增速和占比。第三，面向具身智能積極備戰(zhàn)，有望成為2C機(jī)器人“國家隊(duì)”。我們認(rèn)為，公司發(fā)展具身智能已集齊多重有利因素：1）起步早、能力全。公司在2023半年報(bào)中，明確表示“針對C端具身智能機(jī)器人方面做積極的布局沉淀和前瞻性預(yù)研?！苯刂辽习肽暝谘械?大項(xiàng)目中，多數(shù)與具身智能相關(guān)，其中技術(shù)涉及硬件的運(yùn)動(dòng)控制、軟件的導(dǎo)航算法，以及大模型、云邊融合等，均將為2C機(jī)器人的研發(fā)奠定基礎(chǔ)。在智能服務(wù)機(jī)器人產(chǎn)品線上，目前公司已經(jīng)布局了清潔機(jī)器人和陪伴機(jī)器人，未來產(chǎn)品線有望持續(xù)豐富。2）云能力+制造能力，兩道護(hù)城河。一方面，公司憑借稀缺的云服務(wù)能力，能夠?yàn)橹悄芗揖雍蜋C(jī)器人注入智慧的靈魂，提升用戶體驗(yàn)，并實(shí)現(xiàn)快速迭代進(jìn)化；另一方面，公司不斷強(qiáng)化制造能力，包括IPO募投的螢石智能制造重慶基地項(xiàng)目，將為2C機(jī)器人降低成本、快速迭代帶來關(guān)鍵優(yōu)勢，有望更快實(shí)現(xiàn)“更低成本-更高市占-更多數(shù)據(jù)-更大競爭優(yōu)勢”的飛輪，在C端具身智能領(lǐng)域占據(jù)領(lǐng)先位置。3）既有國家隊(duì)身份，又富有管理活力。螢石實(shí)控人為中電科，又背靠實(shí)力強(qiáng)勁的母公司，C端機(jī)器人“國家隊(duì)”身份下容易獲得各方資源支持；同時(shí)，公司管理團(tuán)隊(duì)在長期的市場競爭中，已經(jīng)充分證明了戰(zhàn)略和管理能力，并擁有高度市場化的激勵(lì)機(jī)制。此外，公司在線上線下、國內(nèi)國際渠道全面布局，助力上述邏輯加速兌現(xiàn)。1）國內(nèi)電商渠道方面，加大在常規(guī)的電商平臺(tái)上直播和優(yōu)質(zhì)達(dá)人帶貨，還積極開拓抖音等內(nèi)容興趣電商的直播渠道銷售；2）國內(nèi)線下渠道方面，公司形成了直營旗艦店、經(jīng)銷商專賣店、下沉市場堡壘店等多層次的終端渠道架構(gòu)，積極布局線下專賣體驗(yàn)店，助力全屋智能系統(tǒng)業(yè)務(wù)；3）海外渠道方面，上半年在零售連鎖賣場、家居建材類連鎖店、專業(yè)經(jīng)銷渠道和街邊店等多渠道中均取得了較好的增長，目前已在多個(gè)國家和地區(qū)實(shí)現(xiàn)線上與線下多渠道覆蓋。4.2柏楚電子（申萬機(jī)械）：具身智能領(lǐng)軍。切割主業(yè)高速成長+焊接新品或迎放量期公司上市前主業(yè)為激光切割設(shè)備運(yùn)控系統(tǒng)，上市后公司縱向延伸智能激光切割頭業(yè)務(wù)、橫向拓展智能焊接機(jī)器人控制系統(tǒng)業(yè)務(wù)。（一）業(yè)務(wù)1：激光切割系統(tǒng)-柏楚方案降低行業(yè)準(zhǔn)入門檻，綜合市占率持續(xù)提升運(yùn)動(dòng)控制系統(tǒng)是激光切割設(shè)備、自動(dòng)化生產(chǎn)設(shè)備的關(guān)鍵功能部件，一個(gè)完整的激光切割流程包括：第一步，使用控制系統(tǒng)提供商提供的激光專用設(shè)計(jì)軟件或第三方工業(yè)設(shè)計(jì)軟件如AutoCAD、Solidworks等繪制零件、裝配體的加工圖紙；第二步，將加工圖紙通過軟件進(jìn)行后期圖形處理及排版，生成加工的機(jī)床代碼；第三步，激光切割機(jī)床根據(jù)代碼指令執(zhí)行切割任務(wù)，整個(gè)切割過程中涉及圖形編輯、工藝設(shè)置及具體加工工藝選擇、運(yùn)動(dòng)控制、切割頭和激光器等外設(shè)控制、加工控制、切割頭與切割部件之間焦距控制及隨動(dòng)等各環(huán)節(jié)，最終完成零件、裝配體的加工。激光切割過程所需的關(guān)鍵技術(shù)包括CAD、CAM、NC、傳感器技術(shù)等硬件設(shè)計(jì)技術(shù)：1）CAD技術(shù)：通過計(jì)算機(jī)建?；驈膱D紙讀取數(shù)字模型，進(jìn)行圖形識(shí)別、編輯和優(yōu)化處理，生成零件并將零件通過計(jì)算機(jī)輔助在板材或型材上進(jìn)行排版，并輸出待加工模型；2）CAM技術(shù)：根據(jù)工藝要求，通過計(jì)算機(jī)輔助生成所需的刀路軌跡以及光路、氣路、焦點(diǎn)等控制參數(shù)和自動(dòng)化加工模型，并生成指令；3）NC技術(shù)：可以實(shí)現(xiàn)根據(jù)生成的機(jī)床代碼指令執(zhí)行具體加工工序的功能，具體涉及加工過程中的運(yùn)動(dòng)/加工控制、切割頭和激光器等外部設(shè)備控制等；4）傳感器技術(shù)：通過傳感器技術(shù)實(shí)現(xiàn)切割過程中溫度、濕度、壓力、光電、視覺、氣壓、激光加工頭與被切割板材之間的間距等因素的控制，從而優(yōu)化激光加工效率，提高智能化水平；5）硬件設(shè)計(jì)技術(shù)：針對激光行業(yè)特殊需求，定制開發(fā)相應(yīng)硬件產(chǎn)品，合理的硬件設(shè)計(jì)和專業(yè)的檢測手段可以起到提高切割穩(wěn)定性及抗干擾能力的作用。柏楚產(chǎn)品推出后重新定義激光加工行業(yè)標(biāo)準(zhǔn)、降低切割設(shè)備操作門檻及學(xué)習(xí)成本。公司核心技術(shù)自主研發(fā)，完整地掌握了激光切割控制系統(tǒng)研發(fā)所需的CAD技術(shù)、CAM技術(shù)、NC技術(shù)、傳感器技術(shù)和硬件設(shè)計(jì)技術(shù)五大類關(guān)鍵技術(shù)。在柏楚電子推出“CAD、CAM和NC三合一激光切割控制系統(tǒng)”和“網(wǎng)絡(luò)通訊式隨動(dòng)系統(tǒng)”兩項(xiàng)技術(shù)變革前，國際激光切割的完整流程通常為：利用AutoCAD、Solidworks等專用CAD設(shè)計(jì)軟件繪制零件圖，然后再導(dǎo)入美國SigmaNest或西班牙Lantek等專業(yè)排樣軟件中進(jìn)行零件后處理和排版，生成加工文件后導(dǎo)入德國倍福、德國PA、西門子等數(shù)控系統(tǒng)中，搭配德國Precitec的電容隨動(dòng)系統(tǒng)進(jìn)行后續(xù)加工操作。柏楚電子推出上述技術(shù)變革后，為下游激光設(shè)備制造商提供了一站式的解決方案，重新定義了我國激光加工行業(yè)的標(biāo)準(zhǔn)，用戶可以在柏楚電子的控制系統(tǒng)中同時(shí)實(shí)現(xiàn)上述激光加工的全部流程，大幅降低激光切割設(shè)備的操作門檻和學(xué)習(xí)成本，簡化激光切割設(shè)備的裝機(jī)和調(diào)試過程。柏楚電子在激光切割領(lǐng)域保持強(qiáng)競爭力。1）中低功率激光切割控制系統(tǒng)：柏楚電子的中低功率產(chǎn)品在穩(wěn)定性、可靠性、精度、速度、易用性等各方面均具備明顯優(yōu)勢，市場占有率約為60%。2）高功率激光切割控制系統(tǒng)：目前國際廠商依然占據(jù)絕對優(yōu)勢，為中國市場主導(dǎo)者，柏楚2021年市占率約17%，近年隨著國內(nèi)高功率激光切割市場發(fā)展及柏楚產(chǎn)品日益成熟，柏楚份額持續(xù)提升中。（二）業(yè)務(wù)2：智能切割頭-搭載高功率切割設(shè)備，滲透率提升+國產(chǎn)替代切割頭充當(dāng)“四肢”的角色，與控制系統(tǒng)實(shí)現(xiàn)協(xié)同互補(bǔ)。激光切割控制系統(tǒng)與智能激光切割頭是大腦與四肢的關(guān)系，兩者軟硬結(jié)合，需要在信息收集、傳輸、反饋的同步性和精密性上達(dá)到很高的契合。切割頭在激光切割中的工作流程是：激光器產(chǎn)生激光，通過外光路傳輸，在切割頭內(nèi)經(jīng)聚焦鏡聚焦后，作用于被加工材料表面，將材料氣化或者在切割氣體輔助下形成熔池，以實(shí)現(xiàn)吹散被激光融化的金屬熔渣或助燃。由于高功率激光切割的工作環(huán)境惡劣，設(shè)備需要在高溫、高濕、粉塵污染大的環(huán)境下運(yùn)行，外部環(huán)境和切割頭內(nèi)部任何微小的變化都會(huì)對設(shè)備性能和切割效果產(chǎn)生較大影響，因此及時(shí)將工況信息傳遞回控制系統(tǒng)，由控制系統(tǒng)進(jìn)行實(shí)時(shí)調(diào)整，有助于最大程度保證激光切割設(shè)備的工作效率。柏楚電子智能切割頭產(chǎn)品與高功率軟件搭載銷售，客戶認(rèn)可度高、銷售額快速提升。目前我國整機(jī)制造廠商使用的高功率激光切割頭和三維激光切割頭主要依賴進(jìn)口，主要供應(yīng)廠商分別為德國Precitec和德國LT。且德國廠商生產(chǎn)的切割頭的傳感器數(shù)據(jù)無法與國產(chǎn)的激光切割系統(tǒng)進(jìn)行實(shí)時(shí)的通訊，從而無法實(shí)現(xiàn)智能的閉環(huán)控制策略。公司激光切割頭具備安裝、調(diào)試簡易，傳感器齊全，將是目前市場為數(shù)不多的具備與國外同類產(chǎn)品競爭力的國產(chǎn)智能切割頭。從產(chǎn)業(yè)層面來看，公司原有主業(yè)激光切割頭軟件和智能激光切割頭在激光切割設(shè)備整機(jī)制造中屬于平行工序的關(guān)系，下游客戶高度重合?；诠驹诳刂葡到y(tǒng)細(xì)分領(lǐng)域內(nèi)的龍頭位置，公司拓展智能激光切割頭具有渠道優(yōu)勢，且客戶對于切割頭評價(jià)反饋較高，子公司波刺自動(dòng)化（切割頭業(yè)務(wù)主體）營收快速增長。2020年波刺自動(dòng)化子公司營收進(jìn)0.11億元，2023年上半年?duì)I收達(dá)到1.54億。（三）業(yè)務(wù)3：智能焊接機(jī)器人控制系統(tǒng)-機(jī)器換人大勢所趨、柏楚產(chǎn)品或迎放量期鋼構(gòu)非標(biāo)場景屬性，倒逼智能焊接機(jī)器人需求。智能焊接機(jī)器人產(chǎn)品為電弧焊焊接機(jī)器人。按照機(jī)器人加工路徑生成的方式不同，焊接機(jī)器人產(chǎn)品可以分為示教焊接機(jī)器人和智能焊接機(jī)器人兩類。示教焊接機(jī)器人主要需要人工示教來編輯焊縫的加工的路徑；智能焊接機(jī)器人通過離線編程來生成焊縫加工路徑。目前國內(nèi)焊接行業(yè)自動(dòng)化水平較低，現(xiàn)有進(jìn)口產(chǎn)品成本過高，且對操作調(diào)試人員的技術(shù)能力具備較高的要求。而隨著我國鋼結(jié)構(gòu)產(chǎn)業(yè)的持續(xù)快速發(fā)展，鋼構(gòu)產(chǎn)品產(chǎn)量增加將直接帶動(dòng)鋼構(gòu)焊接市場需求。與此同時(shí)，焊工工種的持續(xù)短缺，使得鋼構(gòu)企業(yè)對于焊接自動(dòng)化解決方案的需求與日俱增，智能焊接機(jī)器人替代人工為行業(yè)趨勢。完整的鋼結(jié)構(gòu)零件焊接加工流程及公司核心技術(shù)在焊接工藝的應(yīng)用情況如下：第一步、從Tekla，Revit等建筑設(shè)計(jì)軟件里導(dǎo)出需要焊接的鋼結(jié)構(gòu)零件模型。第二步、對鋼結(jié)構(gòu)零件模型進(jìn)行編輯，設(shè)置焊縫，生成坡口并設(shè)置焊道順序。第三步、在數(shù)字孿生系統(tǒng)中編輯機(jī)器人焊接動(dòng)作，進(jìn)行運(yùn)動(dòng)仿真，確認(rèn)加工路徑正確沒有碰撞。并生成焊接加工站運(yùn)行指令。第四步、3D相機(jī)掃描整個(gè)工件，對工件進(jìn)行識(shí)別和空間定位，并校正焊縫的加工位置數(shù)據(jù)。然后機(jī)器人根據(jù)焊接指令運(yùn)動(dòng)到焊縫起始位置進(jìn)行焊接。焊接過程涉及機(jī)器人姿態(tài)自適應(yīng)調(diào)整，動(dòng)態(tài)規(guī)劃路徑以及自動(dòng)避障，焊接工藝選擇匹配，焊縫跟蹤傳感器控制，圖像信號(hào)處理，焊縫跟蹤過程以及焊接工藝動(dòng)作實(shí)時(shí)調(diào)整，最終完成零件的焊接。切割與焊接為上下道工序，柏楚切割場景積累技術(shù)工藝可部分復(fù)用于焊接場景。切割與焊接在鋼結(jié)構(gòu)產(chǎn)品生產(chǎn)制造中屬于上下游工序的關(guān)系。由于焊接與切割在CAD技術(shù)、CAM技術(shù)、NC技術(shù)、傳感器技術(shù)和硬件設(shè)計(jì)在智能制造和自動(dòng)化領(lǐng)域的共通性，公司在切割領(lǐng)域所積累的核心技術(shù)儲(chǔ)備為進(jìn)軍智能焊接機(jī)器人及控制系統(tǒng)領(lǐng)域奠定了堅(jiān)實(shí)的基礎(chǔ)。目前，國產(chǎn)焊接機(jī)器人大多數(shù)為需要人工示教的半自動(dòng)化模式，公司通過開發(fā)工件視覺定位系統(tǒng)、智能焊縫跟蹤系統(tǒng)通過視覺傳感器識(shí)別工件和焊縫，智能焊接離線編程、控制系統(tǒng)通過CAD技術(shù)、CAM技術(shù)、NC技術(shù)進(jìn)行焊接機(jī)器人加工工藝控制，達(dá)到取代人工示教模式進(jìn)行自動(dòng)化智能焊接的效果。當(dāng)前下游鋼構(gòu)企業(yè)迫于產(chǎn)能及成本壓力，對于智能焊接機(jī)器人需求迫切，隨著公司產(chǎn)品成熟度提升及積極市場推廣，未來焊接產(chǎn)品或?qū)⒂瓉矸帕科凇?.3德賽西威（tmt&汽車）：從中國領(lǐng)先tier1走向世界級德賽西威是中國領(lǐng)先的汽車tier1，從事智能座艙、智能駕駛、智能互聯(lián)業(yè)務(wù)。預(yù)計(jì)未來要沖擊成為世界級tier1公司成長來自乘用車銷量、智能化滲透率、智能化ASP、客戶結(jié)構(gòu)四重因子的成長。收入增長的持續(xù)強(qiáng)勁驗(yàn)證了滲透率和ASP的增加。現(xiàn)金流的優(yōu)秀、減配壓力下較強(qiáng)的毛利率（剔除匯兌影響）體現(xiàn)優(yōu)質(zhì)客戶結(jié)構(gòu)的增加。而2023年5月開始，車市恢復(fù)狀態(tài)中。2）2023H2-2024，預(yù)計(jì)德賽西威即將迎來IPU02增長、第四代座艙電子、高階ADAS量產(chǎn)、ADAS出海等新型機(jī)會(huì)。4.4虹軟科技：工程化能力強(qiáng)+車載AI虹軟科技在AI底層視覺優(yōu)化較好，適用于手機(jī)+車載+VRAR+商戶AIGC等領(lǐng)域。伴隨特斯拉視覺AI大模型熱議，投資者尋找BEV路線圖的標(biāo)的。而虹軟科技官方網(wǎng)站實(shí)際披露了虛擬BEV幫助停車。我們認(rèn)為BE

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

具身智能AI行業(yè)市場分析

文檔簡介

溫馨提示

最新文檔

評論

具身智能AI行業(yè)市場分析

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔