版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能行業(yè)市場(chǎng)簡(jiǎn)析一、AI算力將在邊端云端靈活分配邊緣計(jì)算在萬物互聯(lián)場(chǎng)景中至關(guān)重要邊緣計(jì)算是一種分布式計(jì)算架構(gòu),將數(shù)據(jù)處理能力和應(yīng)用程序部署在更接近數(shù)據(jù)源的位置,以提高響應(yīng)性,增強(qiáng)安全性和保護(hù)用戶隱私(參考邊緣計(jì)算聯(lián)盟(ECC)的定義)。所謂邊緣,一般包括:設(shè)備邊緣和云邊緣。設(shè)備邊緣:一般包括直接的終端設(shè)備以及一些異構(gòu)加速卡、邊緣網(wǎng)關(guān)等設(shè)備。云邊緣:一般是在設(shè)備邊緣和中心云之間,比如就近部署的邊緣云節(jié)點(diǎn)/邊緣IDC。萬物互聯(lián)場(chǎng)景中,云端處理存在時(shí)延較長(zhǎng)、成本較高、涉及數(shù)據(jù)隱私等問題,引入邊緣計(jì)算至關(guān)重要。邊緣AI將與云端AI相互補(bǔ)充邊緣AI將AI能力引入到邊緣計(jì)算場(chǎng)景。相較于云端集中的AI資源池運(yùn)算,邊緣AI具有實(shí)時(shí)響應(yīng)、增加隱私性、持續(xù)改進(jìn)等優(yōu)勢(shì)。邊緣AI與云端集中的AI是相互補(bǔ)充、相互關(guān)聯(lián)的關(guān)系,而非替代關(guān)系。高通公司表態(tài)向智能邊緣計(jì)算公司升級(jí),提出混合AI架構(gòu)2022年5月的世界智能科技創(chuàng)新合作峰會(huì)上,高通公司中國(guó)區(qū)董事長(zhǎng)孟樸強(qiáng)調(diào)了混合AI重要性。在5G加持下,隨著生成式AI的飛速普及和計(jì)算需求的日益增長(zhǎng),混合處理的重要性空前凸顯?;旌螦I架構(gòu)可以根據(jù)模型和查詢需要的復(fù)雜度等因素,選擇不同的方式在云端和邊緣終端之間分配并協(xié)同處理AI工作負(fù)載。以終端側(cè)AI為中心的混合AI架構(gòu)中,端側(cè)設(shè)備作為錨點(diǎn),可以運(yùn)行數(shù)十億參數(shù)的模型,復(fù)雜的模型則可以跨云端和終端進(jìn)行運(yùn)行,根據(jù)需要在用戶無縫感知的情況下,使用云端計(jì)算。AI算力預(yù)計(jì)將靈活分配我們認(rèn)為AI算力將綜合考慮硬件能力、成本等因素,在邊端和云端靈活分配,簡(jiǎn)單涵蓋:邊端AI小模型場(chǎng)景:本地跑一些語(yǔ)音識(shí)別、圖像識(shí)別等算法復(fù)雜度比較低、對(duì)算力要求比較小的AI模型,同時(shí)也可以通過API調(diào)用云端AI算力/應(yīng)用來實(shí)現(xiàn)更加豐富的AI功能。邊端AI大模型場(chǎng)景:直接在邊緣側(cè)運(yùn)行AI大模型。這類場(chǎng)景我們認(rèn)為可能會(huì)率先在手機(jī)、PC、智能駕駛、具身智能、元宇宙、工業(yè)控制等自身具備一定算力基礎(chǔ)的場(chǎng)景落地。聯(lián)邦學(xué)習(xí)等方法研究在邊緣計(jì)算架構(gòu)下進(jìn)行分布式訓(xùn)練聯(lián)邦學(xué)習(xí)FL(FederatedLearning,FL)采用分布式學(xué)習(xí)架構(gòu),使得神經(jīng)網(wǎng)絡(luò)模型在移動(dòng)邊緣計(jì)算(MEC)架構(gòu)下可以進(jìn)行分布式訓(xùn)練,參與學(xué)習(xí)的客戶端無需上傳本地?cái)?shù)據(jù),只需將訓(xùn)練后的模型參數(shù)更新上傳,再由邊緣服務(wù)器節(jié)點(diǎn)聚合、更新參數(shù)并下發(fā)給參與學(xué)習(xí)的客戶端。由于不需要共享和傳輸原始數(shù)據(jù),采用類似集群的通信結(jié)構(gòu),F(xiàn)L更適合于移動(dòng)終端等大規(guī)模、廣分布的部署環(huán)境。二、大模型向邊緣端滲透初見端倪大模型在邊緣端滲透的條件:模型壓縮+算力提升大模型向邊緣端滲透,需要算法、硬件協(xié)同優(yōu)化,模型壓縮和邊緣側(cè)計(jì)算性能提升是兩大關(guān)鍵。模型壓縮:比如GPT-175B模型約有1750億參數(shù),以半精度(FP16)格式計(jì)算,至少占320GB存儲(chǔ)空間。模型壓縮是大模型向邊緣滲透的其中一個(gè)重要條件。計(jì)算性能提升:包括算力、顯存、功耗等多方面的硬件綜合能力。目前在這兩個(gè)方向上,我們都可以看到不錯(cuò)的進(jìn)展預(yù)期,大模型在邊緣端滲透初見端倪。模型壓縮:包含量化、蒸餾、剪枝等多種方式模型壓縮主要包括ModelQuantization模型量化、knowledgedistillation知識(shí)蒸餾、ModelPruning模型剪枝、Low-RankAdaptation低秩適應(yīng)、weightsharing權(quán)值共享、architecturesearch結(jié)構(gòu)搜索等方式。模型壓縮:SparseGPT可以一次性修剪至少50%的稀疏性?shī)W地利科技學(xué)院等機(jī)構(gòu)的研究者提出SparseGPT,可以在100億-1000億參數(shù)的模型規(guī)模上有效地運(yùn)作。SparseGPT將剪枝問題簡(jiǎn)化為一組極其大規(guī)模的稀疏回歸實(shí)例,基于新的近似稀疏回歸求解器用于解決分層壓縮問題,效率足以在幾個(gè)小時(shí)內(nèi)使用單個(gè)GPU在175B參數(shù)的GPT模型上執(zhí)行。SparseGPT可以在OPT家族的1750億參數(shù)變量中剪枝到高達(dá)60%的均勻分層稀疏性。模型壓縮:逐步蒸餾法用7.7億參數(shù)蒸餾超過5400億的大語(yǔ)言模型5月3日,華盛頓大學(xué)與Google一起公布逐步蒸餾(Distillingstep-by-step)法,可使用更少的數(shù)據(jù)來做模型的蒸餾(據(jù)論文描述,平均只需要之前方法的一半數(shù)據(jù),最好的情況只需要15%的數(shù)據(jù)就可以達(dá)到類似的效果),并可獲得更小規(guī)模的模型(最多可比原模型小2000倍,即可獲得大模型差不多的效果)。模型壓縮:開源模型原駝可以做到ChatGPT99%的能力華盛頓大學(xué)發(fā)布開源大模型原駝(Guanaco),自動(dòng)測(cè)試分?jǐn)?shù)達(dá)到ChatGPT的99.3%,并且同時(shí)發(fā)布新方法QLoRA,把微調(diào)大模型的顯存需求從>780GB降低到<48GB,以Meta的美洲駝LLaMA為基礎(chǔ),得到原駝650億參數(shù)版只需要48GB顯存單卡微調(diào)24小時(shí),330億參數(shù)版只需要24GB顯存單卡(消費(fèi)級(jí)RTX3090或RTX4090顯卡即可滿足)微調(diào)12小時(shí)。算力提升:包括算力、顯存、功耗等多維度算力:Transformer模型更加依賴大算力的支撐。參考壁仞科技數(shù)據(jù),對(duì)于40個(gè)字的文本序列,進(jìn)行一次Bert推理需要7Gflops,由中文翻譯到英文的Seq2Seq模型需要20Gflops。標(biāo)準(zhǔn)版BERT模型參數(shù)量是3.4億個(gè)參數(shù)。顯存:以一個(gè)100億參數(shù)模型,F(xiàn)P16精度為例,參數(shù)量需要20GB內(nèi)存(10B*2Bytes),梯度需要20GB內(nèi)存(10B*2Bytes),優(yōu)化器狀態(tài)需要40GB內(nèi)存(10B*2Bytes*2),總計(jì)需要80GB內(nèi)存。功耗:隨著算力的提升,帶來功耗提升,對(duì)于芯片的散熱要求將明顯提升,同時(shí)不同場(chǎng)景對(duì)于設(shè)備耗電量、待機(jī)時(shí)長(zhǎng)等也都有不同要求。當(dāng)前進(jìn)展:手機(jī)、PC端已經(jīng)出現(xiàn)邊緣大模型場(chǎng)景落地手機(jī):ChatGPT已推出IOS應(yīng)用,安卓版后續(xù)也會(huì)發(fā)布。高通在搭載第二代驍龍8移動(dòng)平臺(tái)的Android智能手機(jī)上部署StableDiffusion(參數(shù)超10億個(gè)),在15秒內(nèi)執(zhí)行20步推理,生成一張512x512像素的圖像。PC:微軟和高通、英特爾在AI領(lǐng)域展開合作,部署推出搭載AI引擎的PC產(chǎn)品。具身智能:英偉達(dá)創(chuàng)始人黃仁勛表示AI下一個(gè)浪潮將是“具身智能”,并且公布了多模態(tài)具身人工智能系統(tǒng)NvidiaVIMA。三、產(chǎn)業(yè)鏈新增AI,強(qiáng)化算力與連接邊緣計(jì)算市場(chǎng)快速增長(zhǎng)STLPartners數(shù)據(jù)顯示,邊緣計(jì)算潛在市場(chǎng)將在10年內(nèi)以48%的復(fù)合年增長(zhǎng)率從2020年的90億美元增長(zhǎng)到2030年的4450億美元,其中邊緣基礎(chǔ)設(shè)施的增長(zhǎng)速度是最快的。億歐智庫(kù)數(shù)據(jù)顯示,2021年我國(guó)邊緣計(jì)算市場(chǎng)規(guī)模已經(jīng)達(dá)到427.9億元,其中邊緣硬件市場(chǎng)規(guī)模為281.7億元,邊緣軟件與服務(wù)市場(chǎng)規(guī)模達(dá)146.2億元,2021-2025年中國(guó)邊緣計(jì)算產(chǎn)業(yè)規(guī)模預(yù)計(jì)年復(fù)合增速達(dá)到46.81%,2025年邊緣計(jì)算市場(chǎng)整體規(guī)模將達(dá)1987.68億元。邊緣計(jì)算產(chǎn)業(yè)鏈:新增AI,強(qiáng)化算力與連接從產(chǎn)業(yè)鏈角度,邊緣AI核心在于引入邊緣側(cè)的AI能力,進(jìn)一步增強(qiáng)邊緣側(cè)的算力能力、連接能力。重點(diǎn)包括AI芯片、算力模組、邊緣網(wǎng)關(guān)/服務(wù)器/控制器等硬件、AI算法/邊緣計(jì)算平臺(tái)等軟件環(huán)節(jié)。AI芯片:專門用于處理AI大量計(jì)算任務(wù)的模塊AI芯片是指專門用于處理人工智能應(yīng)用中的大量計(jì)算任務(wù)的模塊,其他非計(jì)算任務(wù)則更多仍由CPU負(fù)責(zé)。從技術(shù)架構(gòu)來看,Al芯片主要分為GPU、FPGA、ASIC三大類。其中,GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA和ASIC則分別是針對(duì)人工智能需求特征的半定制和全定制芯片。典型AI運(yùn)算通常需要CPU或者ARM內(nèi)核來執(zhí)行調(diào)度處理,大量的并行計(jì)算靠GPU、FPGA或ASIC來完成。模組:標(biāo)準(zhǔn)化的模組形態(tài)可以有效滿足物聯(lián)網(wǎng)碎片化需求無線模組是物聯(lián)網(wǎng)中的連接器件,無線模組將芯片、存儲(chǔ)器、功放器件等集成在一塊線路板上,實(shí)現(xiàn)無線電波收發(fā)、信道噪聲過濾及模擬信號(hào)與數(shù)字信號(hào)之間相互轉(zhuǎn)換,并提供標(biāo)準(zhǔn)接口的功能模塊,終端借助無線模組可以實(shí)現(xiàn)通信或定位。物聯(lián)網(wǎng)的碎片化需求,基于芯片的開發(fā)技術(shù)門檻高,客戶會(huì)選用標(biāo)準(zhǔn)的模組,直接使用模組的標(biāo)準(zhǔn)硬件接口和嵌入式應(yīng)用協(xié)議,不必關(guān)心底層邏輯,只要做好應(yīng)用側(cè)適配。智能控制器:家電等場(chǎng)景實(shí)現(xiàn)智能化的“大腦”智能控制器和邊緣節(jié)點(diǎn)算力同樣直接相關(guān)。在智能家居、家電、工業(yè)控制等場(chǎng)景中,智能控制器是其實(shí)現(xiàn)智能化的大腦。AI帶動(dòng)下游智能化能力提升,智能場(chǎng)景的功能及其交互方式將更加豐富,包括機(jī)器視覺、語(yǔ)音識(shí)別等AI算法將更多與應(yīng)用場(chǎng)景結(jié)合,同時(shí)控制器中也將引入算力芯片等,對(duì)于智能控制器的需求量和ASP也將會(huì)是直接正向的帶動(dòng)。四、圍繞受益環(huán)節(jié)、兼顧彈性選標(biāo)的用量和成本維度量化算力彈性算力用量:不同場(chǎng)景對(duì)于算力的需求有所不同,智能家居等場(chǎng)景典型算力需求小于1Tops,自動(dòng)駕駛隨著級(jí)別升高算力需求在20Tops~4000Tops。AI大模型往終端滲透有望進(jìn)一步提升算力需求。算力成本:?jiǎn)挝凰懔Τ杀九c芯片研發(fā)成本、制造成本、出貨規(guī)模、算力規(guī)模等直接相關(guān),同時(shí)也需要考慮配套的存儲(chǔ)、應(yīng)用開發(fā)等環(huán)節(jié)。結(jié)合勢(shì)乘資本的數(shù)據(jù),我們簡(jiǎn)單量化匡算算力成本為5元/Tops-10元/Tops,相對(duì)總體算力越高,單位成本越低。廣和通:已推出基于高通QCS8250的高算力AI模組廣和通是全球蜂窩物聯(lián)網(wǎng)通信模組頭部企業(yè),在PC、FWA等垂直行業(yè)蜂窩模組市場(chǎng)份額領(lǐng)先,收購(gòu)銳凌無線后車載通信模組躋身全球第一梯隊(duì)。2022年公司收入56.46億元,歸母凈利潤(rùn)3.64億元。公司積極布局算力模組,已經(jīng)推出基于高通QCS8250芯片平臺(tái)的高算力AI模組SCA825-W,可全面提供高達(dá)15TOPS的算力支持;FM1605G模組與安提國(guó)際AI邊緣計(jì)算平臺(tái)AN810-XNX成功聯(lián)調(diào)。公司算力模組目前在支付和車載領(lǐng)域應(yīng)用比較多,并積極拓展邊緣算力終端設(shè)備、機(jī)器人、IPC安防、工業(yè)檢測(cè)和控制等領(lǐng)域,有望充分受益邊緣AI發(fā)展。拓邦股份:積極布局AI、機(jī)器人等新領(lǐng)域拓邦股份是國(guó)內(nèi)智能控制器頭部廠商,以電控、電機(jī)、電池、電源、物聯(lián)網(wǎng)平臺(tái)的“四電一網(wǎng)”技術(shù)為核心,面向家電、工具、新能源、工業(yè)、智能解決方案等五大行業(yè)提供各種定制化解決方案,已形成家電、電動(dòng)工具、新能源“三足鼎立、并駕齊驅(qū)”局面。2022年公司收入88.75億元,歸母凈利潤(rùn)5.83億元。公司積極布局AI、機(jī)器人等新領(lǐng)域。公司持續(xù)推動(dòng)T-smart一站式解決方案落地于不同智能家居場(chǎng)景,并且完成了主流IoT生態(tài)網(wǎng)關(guān)產(chǎn)品的開發(fā)認(rèn)證。在掃地機(jī)器人、商用炒菜機(jī)器人、服務(wù)機(jī)器人等領(lǐng)域持續(xù)投入,已具備AI、IOT、運(yùn)動(dòng)控制、BMS、電機(jī)驅(qū)動(dòng)、Slam、路徑規(guī)劃等技術(shù)積累,產(chǎn)品涵蓋控制器等零部件、ODM/自主品牌整機(jī)產(chǎn)品。網(wǎng)宿科技:積極發(fā)掘邊緣計(jì)算在AI上的資源和服務(wù)潛力網(wǎng)宿科技圍繞CDN及邊緣計(jì)算、云安全兩大核心主業(yè),以及私有云/混合云、MSP、液冷等新業(yè)務(wù)方向,不斷完善產(chǎn)品矩陣。2022年公司收入50.84
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院老人康復(fù)理療師考核獎(jiǎng)懲制度
- 【地球課件】地基基礎(chǔ)設(shè)計(jì)理論與荷載
- 九年級(jí)歷史期末試卷答題卡-教案課件-初中歷史九年級(jí)上冊(cè)部編版
- 房屋租賃的合同(2篇)
- 《食品安全和營(yíng)養(yǎng)》課件
- 2025年拉薩貨運(yùn)從業(yè)資格證模擬試題題庫(kù)及答案大全
- 2025年揚(yáng)州貨運(yùn)從業(yè)資格證考些什么內(nèi)容
- 2024年土地承包合同終止后的土地經(jīng)營(yíng)權(quán)租賃協(xié)議6篇
- 中國(guó)古代禮儀文明課件-婚禮
- 2025年沈陽(yáng)經(jīng)營(yíng)性道路客貨運(yùn)輸駕駛員從業(yè)資格考試
- 文學(xué)概論2024年 知到智慧樹網(wǎng)課答案
- 基于PLC的自動(dòng)運(yùn)料小車經(jīng)典設(shè)計(jì)
- 工程設(shè)計(jì)合理化建議
- 【分層訓(xùn)練】五年級(jí)上冊(cè)數(shù)學(xué)單元測(cè)試-第六單元 組合圖形的面積(培優(yōu)卷) 北師大版(含答案)
- MOOC 勞動(dòng)教育-常熟理工學(xué)院 中國(guó)大學(xué)慕課答案
- MOOC 管理會(huì)計(jì)工具與應(yīng)用-江蘇理工學(xué)院 中國(guó)大學(xué)慕課答案
- 《公路工程信息模型應(yīng)用統(tǒng)一標(biāo)準(zhǔn)》(JTG-T2420-2021)
- 2024-2030年中國(guó)廚電廚具行業(yè)發(fā)展前景預(yù)測(cè)及投資戰(zhàn)略咨詢報(bào)告
- 高一上學(xué)期期末考試語(yǔ)文試卷(圖片版含答案)
- 【川教版】《生命 生態(tài) 安全》二上第14課 思維真奇妙 課件
- 機(jī)電產(chǎn)品個(gè)人銷售年終總結(jié)
評(píng)論
0/150
提交評(píng)論