人工智能行業(yè)市場簡析1_第1頁
人工智能行業(yè)市場簡析1_第2頁
人工智能行業(yè)市場簡析1_第3頁
人工智能行業(yè)市場簡析1_第4頁
人工智能行業(yè)市場簡析1_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

人工智能行業(yè)市場簡析一、AI算力將在邊端云端靈活分配邊緣計算在萬物互聯(lián)場景中至關重要邊緣計算是一種分布式計算架構(gòu),將數(shù)據(jù)處理能力和應用程序部署在更接近數(shù)據(jù)源的位置,以提高響應性,增強安全性和保護用戶隱私(參考邊緣計算聯(lián)盟(ECC)的定義)。所謂邊緣,一般包括:設備邊緣和云邊緣。設備邊緣:一般包括直接的終端設備以及一些異構(gòu)加速卡、邊緣網(wǎng)關等設備。云邊緣:一般是在設備邊緣和中心云之間,比如就近部署的邊緣云節(jié)點/邊緣IDC。萬物互聯(lián)場景中,云端處理存在時延較長、成本較高、涉及數(shù)據(jù)隱私等問題,引入邊緣計算至關重要。邊緣AI將與云端AI相互補充邊緣AI將AI能力引入到邊緣計算場景。相較于云端集中的AI資源池運算,邊緣AI具有實時響應、增加隱私性、持續(xù)改進等優(yōu)勢。邊緣AI與云端集中的AI是相互補充、相互關聯(lián)的關系,而非替代關系。高通公司表態(tài)向智能邊緣計算公司升級,提出混合AI架構(gòu)2022年5月的世界智能科技創(chuàng)新合作峰會上,高通公司中國區(qū)董事長孟樸強調(diào)了混合AI重要性。在5G加持下,隨著生成式AI的飛速普及和計算需求的日益增長,混合處理的重要性空前凸顯?;旌螦I架構(gòu)可以根據(jù)模型和查詢需要的復雜度等因素,選擇不同的方式在云端和邊緣終端之間分配并協(xié)同處理AI工作負載。以終端側(cè)AI為中心的混合AI架構(gòu)中,端側(cè)設備作為錨點,可以運行數(shù)十億參數(shù)的模型,復雜的模型則可以跨云端和終端進行運行,根據(jù)需要在用戶無縫感知的情況下,使用云端計算。AI算力預計將靈活分配我們認為AI算力將綜合考慮硬件能力、成本等因素,在邊端和云端靈活分配,簡單涵蓋:邊端AI小模型場景:本地跑一些語音識別、圖像識別等算法復雜度比較低、對算力要求比較小的AI模型,同時也可以通過API調(diào)用云端AI算力/應用來實現(xiàn)更加豐富的AI功能。邊端AI大模型場景:直接在邊緣側(cè)運行AI大模型。這類場景我們認為可能會率先在手機、PC、智能駕駛、具身智能、元宇宙、工業(yè)控制等自身具備一定算力基礎的場景落地。聯(lián)邦學習等方法研究在邊緣計算架構(gòu)下進行分布式訓練聯(lián)邦學習FL(FederatedLearning,FL)采用分布式學習架構(gòu),使得神經(jīng)網(wǎng)絡模型在移動邊緣計算(MEC)架構(gòu)下可以進行分布式訓練,參與學習的客戶端無需上傳本地數(shù)據(jù),只需將訓練后的模型參數(shù)更新上傳,再由邊緣服務器節(jié)點聚合、更新參數(shù)并下發(fā)給參與學習的客戶端。由于不需要共享和傳輸原始數(shù)據(jù),采用類似集群的通信結(jié)構(gòu),F(xiàn)L更適合于移動終端等大規(guī)模、廣分布的部署環(huán)境。二、大模型向邊緣端滲透初見端倪大模型在邊緣端滲透的條件:模型壓縮+算力提升大模型向邊緣端滲透,需要算法、硬件協(xié)同優(yōu)化,模型壓縮和邊緣側(cè)計算性能提升是兩大關鍵。模型壓縮:比如GPT-175B模型約有1750億參數(shù),以半精度(FP16)格式計算,至少占320GB存儲空間。模型壓縮是大模型向邊緣滲透的其中一個重要條件。計算性能提升:包括算力、顯存、功耗等多方面的硬件綜合能力。目前在這兩個方向上,我們都可以看到不錯的進展預期,大模型在邊緣端滲透初見端倪。模型壓縮:包含量化、蒸餾、剪枝等多種方式模型壓縮主要包括ModelQuantization模型量化、knowledgedistillation知識蒸餾、ModelPruning模型剪枝、Low-RankAdaptation低秩適應、weightsharing權值共享、architecturesearch結(jié)構(gòu)搜索等方式。模型壓縮:SparseGPT可以一次性修剪至少50%的稀疏性奧地利科技學院等機構(gòu)的研究者提出SparseGPT,可以在100億-1000億參數(shù)的模型規(guī)模上有效地運作。SparseGPT將剪枝問題簡化為一組極其大規(guī)模的稀疏回歸實例,基于新的近似稀疏回歸求解器用于解決分層壓縮問題,效率足以在幾個小時內(nèi)使用單個GPU在175B參數(shù)的GPT模型上執(zhí)行。SparseGPT可以在OPT家族的1750億參數(shù)變量中剪枝到高達60%的均勻分層稀疏性。模型壓縮:逐步蒸餾法用7.7億參數(shù)蒸餾超過5400億的大語言模型5月3日,華盛頓大學與Google一起公布逐步蒸餾(Distillingstep-by-step)法,可使用更少的數(shù)據(jù)來做模型的蒸餾(據(jù)論文描述,平均只需要之前方法的一半數(shù)據(jù),最好的情況只需要15%的數(shù)據(jù)就可以達到類似的效果),并可獲得更小規(guī)模的模型(最多可比原模型小2000倍,即可獲得大模型差不多的效果)。模型壓縮:開源模型原駝可以做到ChatGPT99%的能力華盛頓大學發(fā)布開源大模型原駝(Guanaco),自動測試分數(shù)達到ChatGPT的99.3%,并且同時發(fā)布新方法QLoRA,把微調(diào)大模型的顯存需求從>780GB降低到<48GB,以Meta的美洲駝LLaMA為基礎,得到原駝650億參數(shù)版只需要48GB顯存單卡微調(diào)24小時,330億參數(shù)版只需要24GB顯存單卡(消費級RTX3090或RTX4090顯卡即可滿足)微調(diào)12小時。算力提升:包括算力、顯存、功耗等多維度算力:Transformer模型更加依賴大算力的支撐。參考壁仞科技數(shù)據(jù),對于40個字的文本序列,進行一次Bert推理需要7Gflops,由中文翻譯到英文的Seq2Seq模型需要20Gflops。標準版BERT模型參數(shù)量是3.4億個參數(shù)。顯存:以一個100億參數(shù)模型,F(xiàn)P16精度為例,參數(shù)量需要20GB內(nèi)存(10B*2Bytes),梯度需要20GB內(nèi)存(10B*2Bytes),優(yōu)化器狀態(tài)需要40GB內(nèi)存(10B*2Bytes*2),總計需要80GB內(nèi)存。功耗:隨著算力的提升,帶來功耗提升,對于芯片的散熱要求將明顯提升,同時不同場景對于設備耗電量、待機時長等也都有不同要求。當前進展:手機、PC端已經(jīng)出現(xiàn)邊緣大模型場景落地手機:ChatGPT已推出IOS應用,安卓版后續(xù)也會發(fā)布。高通在搭載第二代驍龍8移動平臺的Android智能手機上部署StableDiffusion(參數(shù)超10億個),在15秒內(nèi)執(zhí)行20步推理,生成一張512x512像素的圖像。PC:微軟和高通、英特爾在AI領域展開合作,部署推出搭載AI引擎的PC產(chǎn)品。具身智能:英偉達創(chuàng)始人黃仁勛表示AI下一個浪潮將是“具身智能”,并且公布了多模態(tài)具身人工智能系統(tǒng)NvidiaVIMA。三、產(chǎn)業(yè)鏈新增AI,強化算力與連接邊緣計算市場快速增長STLPartners數(shù)據(jù)顯示,邊緣計算潛在市場將在10年內(nèi)以48%的復合年增長率從2020年的90億美元增長到2030年的4450億美元,其中邊緣基礎設施的增長速度是最快的。億歐智庫數(shù)據(jù)顯示,2021年我國邊緣計算市場規(guī)模已經(jīng)達到427.9億元,其中邊緣硬件市場規(guī)模為281.7億元,邊緣軟件與服務市場規(guī)模達146.2億元,2021-2025年中國邊緣計算產(chǎn)業(yè)規(guī)模預計年復合增速達到46.81%,2025年邊緣計算市場整體規(guī)模將達1987.68億元。邊緣計算產(chǎn)業(yè)鏈:新增AI,強化算力與連接從產(chǎn)業(yè)鏈角度,邊緣AI核心在于引入邊緣側(cè)的AI能力,進一步增強邊緣側(cè)的算力能力、連接能力。重點包括AI芯片、算力模組、邊緣網(wǎng)關/服務器/控制器等硬件、AI算法/邊緣計算平臺等軟件環(huán)節(jié)。AI芯片:專門用于處理AI大量計算任務的模塊AI芯片是指專門用于處理人工智能應用中的大量計算任務的模塊,其他非計算任務則更多仍由CPU負責。從技術架構(gòu)來看,Al芯片主要分為GPU、FPGA、ASIC三大類。其中,GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA和ASIC則分別是針對人工智能需求特征的半定制和全定制芯片。典型AI運算通常需要CPU或者ARM內(nèi)核來執(zhí)行調(diào)度處理,大量的并行計算靠GPU、FPGA或ASIC來完成。模組:標準化的模組形態(tài)可以有效滿足物聯(lián)網(wǎng)碎片化需求無線模組是物聯(lián)網(wǎng)中的連接器件,無線模組將芯片、存儲器、功放器件等集成在一塊線路板上,實現(xiàn)無線電波收發(fā)、信道噪聲過濾及模擬信號與數(shù)字信號之間相互轉(zhuǎn)換,并提供標準接口的功能模塊,終端借助無線模組可以實現(xiàn)通信或定位。物聯(lián)網(wǎng)的碎片化需求,基于芯片的開發(fā)技術門檻高,客戶會選用標準的模組,直接使用模組的標準硬件接口和嵌入式應用協(xié)議,不必關心底層邏輯,只要做好應用側(cè)適配。智能控制器:家電等場景實現(xiàn)智能化的“大腦”智能控制器和邊緣節(jié)點算力同樣直接相關。在智能家居、家電、工業(yè)控制等場景中,智能控制器是其實現(xiàn)智能化的大腦。AI帶動下游智能化能力提升,智能場景的功能及其交互方式將更加豐富,包括機器視覺、語音識別等AI算法將更多與應用場景結(jié)合,同時控制器中也將引入算力芯片等,對于智能控制器的需求量和ASP也將會是直接正向的帶動。四、圍繞受益環(huán)節(jié)、兼顧彈性選標的用量和成本維度量化算力彈性算力用量:不同場景對于算力的需求有所不同,智能家居等場景典型算力需求小于1Tops,自動駕駛隨著級別升高算力需求在20Tops~4000Tops。AI大模型往終端滲透有望進一步提升算力需求。算力成本:單位算力成本與芯片研發(fā)成本、制造成本、出貨規(guī)模、算力規(guī)模等直接相關,同時也需要考慮配套的存儲、應用開發(fā)等環(huán)節(jié)。結(jié)合勢乘資本的數(shù)據(jù),我們簡單量化匡算算力成本為5元/Tops-10元/Tops,相對總體算力越高,單位成本越低。廣和通:已推出基于高通QCS8250的高算力AI模組廣和通是全球蜂窩物聯(lián)網(wǎng)通信模組頭部企業(yè),在PC、FWA等垂直行業(yè)蜂窩模組市場份額領先,收購銳凌無線后車載通信模組躋身全球第一梯隊。2022年公司收入56.46億元,歸母凈利潤3.64億元。公司積極布局算力模組,已經(jīng)推出基于高通QCS8250芯片平臺的高算力AI模組SCA825-W,可全面提供高達15TOPS的算力支持;FM1605G模組與安提國際AI邊緣計算平臺AN810-XNX成功聯(lián)調(diào)。公司算力模組目前在支付和車載領域應用比較多,并積極拓展邊緣算力終端設備、機器人、IPC安防、工業(yè)檢測和控制等領域,有望充分受益邊緣AI發(fā)展。拓邦股份:積極布局AI、機器人等新領域拓邦股份是國內(nèi)智能控制器頭部廠商,以電控、電機、電池、電源、物聯(lián)網(wǎng)平臺的“四電一網(wǎng)”技術為核心,面向家電、工具、新能源、工業(yè)、智能解決方案等五大行業(yè)提供各種定制化解決方案,已形成家電、電動工具、新能源“三足鼎立、并駕齊驅(qū)”局面。2022年公司收入88.75億元,歸母凈利潤5.83億元。公司積極布局AI、機器人等新領域。公司持續(xù)推動T-smart一站式解決方案落地于不同智能家居場景,并且完成了主流IoT生態(tài)網(wǎng)關產(chǎn)品的開發(fā)認證。在掃地機器人、商用炒菜機器人、服務機器人等領域持續(xù)投入,已具備AI、IOT、運動控制、BMS、電機驅(qū)動、Slam、路徑規(guī)劃等技術積累,產(chǎn)品涵蓋控制器等零部件、ODM/自主品牌整機產(chǎn)品。網(wǎng)宿科技:積極發(fā)掘邊緣計算在AI上的資源和服務潛力網(wǎng)宿科技圍繞CDN及邊緣計算、云安全兩大核心主業(yè),以及私有云/混合云、MSP、液冷等新業(yè)務方向,不斷完善產(chǎn)品矩陣。2022年公司收入50.84

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論