版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
證券研究報(bào)告海外2024年01月09日AI
PC&AI手機(jī)專題報(bào)告:AIGC向端側(cè)下沉成趨勢(shì),有望引領(lǐng)新一輪硬件創(chuàng)新評(píng)級(jí):推薦(維持)相關(guān)報(bào)告最近一年走勢(shì)《海外行業(yè)動(dòng)態(tài)研究:大模型端側(cè)落地成趨勢(shì),聯(lián)想集團(tuán)率先協(xié)同合作伙伴構(gòu)建AI生態(tài)(推薦)*海外*陳夢(mèng)竹》——2023-12-2815%10%滬深300恒生指數(shù)《海外行業(yè)動(dòng)態(tài)研究:谷歌發(fā)布原生多模態(tài)大模型Gemini及新一代TPU系統(tǒng)CloudTPUv5p(推薦)*海外*陳夢(mèng)竹》——2023-12-085%《游戲行業(yè)政策事件點(diǎn)評(píng):監(jiān)管處于征求意見稿階段,關(guān)注后續(xù)落實(shí)力度(推薦)*海外*陳夢(mèng)竹,尹芮》——2023-12-250%-5%-10%-15%-20%《AIGC專題報(bào)告:站在當(dāng)前時(shí)點(diǎn),怎么看AIGC板塊投資邏輯(推薦)*海外*陳夢(mèng)竹》——2023-12-20《2024年海外科技策略前瞻——底部向上,三大關(guān)鍵詞:AI、出海、空間計(jì)算(推薦)*海外*陳夢(mèng)竹,張娟娟,尹芮》——2023-12-192022/12/282023/04/272023/08/252023/12/23相對(duì)滬深300表現(xiàn)表現(xiàn)1M3M12M恒生指數(shù)10.9%8.5%-0.6%3.3%-14.3%-11.8%滬深3002核心提要p
從手機(jī)和PC的發(fā)展史來看,AIGC的賦能可能會(huì)將二者帶入全新的發(fā)展階段。就手機(jī)而言,我們總結(jié)其發(fā)展路徑是:強(qiáng)調(diào)通信功能→智能手機(jī)→個(gè)人助理。手機(jī)相較于PC是更加貼近用戶生活的終端設(shè)備,因而用戶天然會(huì)產(chǎn)生這種需求,但現(xiàn)階段的手機(jī)智能化程度不足,因而搭載大模型并發(fā)展出更多功能或成為一種趨勢(shì);PC早期能夠普及正是因?yàn)槠渖a(chǎn)力工具的定位,AIGC作為生成式AI自然會(huì)與生產(chǎn)力工具相匹配以幫助用戶提高生產(chǎn)效率,因而AIPC也順勢(shì)興起。p
從硬件角度來看,AIPC/Phone需要解決三個(gè)問題:其一,用什么加速推理?其二,高規(guī)格大模型如何裝載到設(shè)備里去?其三,推理作為高功耗任務(wù),設(shè)備的散熱系統(tǒng)應(yīng)當(dāng)如何配合?由此衍生出我們對(duì)PC及手機(jī)處理器、內(nèi)存和散熱系統(tǒng)的探討。?
對(duì)于問題一,目前的AIPC/Phone廠商均已給出答案,過去在端側(cè)做深度學(xué)習(xí)或者機(jī)器學(xué)習(xí)通常會(huì)使用GPU作為計(jì)算單元,但隨著AIGC在端側(cè)落地,人工智能任務(wù)專用處理器也順勢(shì)而生。GPU雖然相較于CPU擁有更強(qiáng)的并行計(jì)算能力,但其處理神經(jīng)網(wǎng)絡(luò)仍然效率偏低,且功耗較高。NPU相較于GPU的優(yōu)化主要集中在與CPU的交互方面,NPU做的是張量計(jì)算,如果說GPU是把矩陣看做一個(gè)“計(jì)算單位”,那么NPU就是把神經(jīng)網(wǎng)絡(luò)看做一個(gè)“計(jì)算單位”,由此,NPU擁有了更優(yōu)的能耗比。我們認(rèn)為未來可能是CPU、GPU、NPU三U并存的時(shí)代,以GPU發(fā)展史作為參考,未來NPU可能也會(huì)同GPU一樣,逐漸成為PC和手機(jī)必備的硬件之一,目前NPU仍然與CPU集成在一起,未來可能也會(huì)發(fā)展出擁有獨(dú)立內(nèi)存的類似于獨(dú)顯的形態(tài),并成為PC產(chǎn)品定位的重要標(biāo)準(zhǔn)(如現(xiàn)在的高性能本、游戲本通常是獨(dú)顯,而輕薄本、商務(wù)本則一般為核顯)。目前NPU的發(fā)展仍處于早期階段,我們認(rèn)為其重點(diǎn)主要是走量,即在PC上普及這一硬件;未來隨著NPU逐漸為用戶所接受并對(duì)性能提出更高要求,參考GPU,則可能會(huì)帶來更多的溢價(jià)空間,這一收入我們認(rèn)為主要是在上游硬件廠商(NPU供應(yīng)商)、大模型供應(yīng)商和終端設(shè)備生產(chǎn)商之間分配。?
對(duì)于問題二,目前PC和手機(jī)的內(nèi)存相對(duì)較小,對(duì)大模型的承載能力有限,而大模型又是達(dá)到一定參數(shù)量級(jí)才會(huì)有智能的涌現(xiàn),因而為了使大模型給用戶帶來更好的體驗(yàn),一方面需要對(duì)模型進(jìn)行裁剪和量化,另一方面也需要拔高設(shè)備的內(nèi)存配置,使其在存儲(chǔ)、傳輸和計(jì)算方面更加平衡。目前在終端設(shè)備落地的大模型仍然是以數(shù)十億參數(shù)量級(jí)的為主,就性能方面尚有提升空間,未來高規(guī)格大模型產(chǎn)品化勢(shì)必會(huì)對(duì)終端設(shè)備的內(nèi)存提出更高要求。?
對(duì)于問題三,作為電子設(shè)備領(lǐng)域的重要一環(huán),PC和手機(jī)的散熱問題一直備受關(guān)注,作為高算力AI芯片的NPU會(huì)對(duì)設(shè)備的散熱系統(tǒng)提出更高要求,因而隨著搭載在AIPC和AIPhone上的模型規(guī)格不斷提升,NPU性能釋放可能會(huì)更加激進(jìn),我們認(rèn)為這將帶來電子產(chǎn)品散熱方案的更新?lián)Q代以及相關(guān)上下游的投資機(jī)會(huì)。p
大模型在端側(cè)落地,主要受益方包括硬件(如NPU等)設(shè)計(jì)制造廠商、大模型提供商和終端設(shè)備生產(chǎn)商。盡管目前AIPC及AIPhone仍處于商業(yè)化早期階段,但論及其商業(yè)模式,我們認(rèn)為終端設(shè)備生產(chǎn)商可能是核心,原因如下:終端設(shè)備生產(chǎn)商是唯一直接對(duì)客的角色;此外,其亦須基于軟硬件廠商協(xié)同構(gòu)筑的底層生態(tài)(如Intel和微軟的合作)將大模型預(yù)先裝載進(jìn)終端設(shè)備產(chǎn)品,這一生產(chǎn)過程的差異化競(jìng)爭(zhēng)主要集中在散熱模組設(shè)計(jì)、硬件組裝能力和模型蒸餾水平等方面。從收入來看,終端設(shè)備生產(chǎn)商一方面可基于NPU這一新硬件對(duì)產(chǎn)品進(jìn)行提價(jià),另一方面向用戶收取大模型及相關(guān)應(yīng)用的服務(wù)費(fèi);從成本來看,終端設(shè)備生產(chǎn)商一方面須向硬件設(shè)計(jì)制造商采購(gòu)基礎(chǔ)部件,另一方面須向大模型提供商支付模型調(diào)用費(fèi)。總結(jié)來說,終端設(shè)備生產(chǎn)商作為中間人,將模型、硬件和C端用戶串聯(lián)起來,賺取差價(jià)的同時(shí)也賺取服務(wù)費(fèi)(如對(duì)于企業(yè)用戶,賣設(shè)備的同時(shí)還提供模型部署服務(wù)),由此,終端設(shè)備生產(chǎn)商可能會(huì)終結(jié)此先大模型在云端通過API接口或類ChatGPT應(yīng)用提供服務(wù)時(shí)以大模型廠商為核心的單一商業(yè)模式時(shí)代,并成為爭(zhēng)搶流量入口的新生力量。3行業(yè)評(píng)級(jí)&投資建議&風(fēng)險(xiǎn)提示p
行業(yè)評(píng)級(jí)&投資建議:AI技術(shù)不斷演進(jìn),大模型持續(xù)迭代并表現(xiàn)出向端側(cè)下沉的趨勢(shì),我們看好AIPC和AI手機(jī)的投資機(jī)會(huì),維持行業(yè)“推薦”評(píng)級(jí)。硬件方面,建議關(guān)注芯片和內(nèi)存廠商,如英特爾、AMD、高通、海光信息、聯(lián)發(fā)科、通富微電、聚辰股份和兆易創(chuàng)新等;模型方面,建議關(guān)注微軟、谷歌、Meta等;終端設(shè)備方面,建議關(guān)注市場(chǎng)份額占比較高的PC/手機(jī)提供商及代工廠,如聯(lián)想集團(tuán)、華碩、戴爾科技、惠普、小米集團(tuán)-W、三星電子、仁寶電腦、廣達(dá)、緯創(chuàng)、英業(yè)達(dá)和光大同創(chuàng)等。p
風(fēng)險(xiǎn)提示:AIPC/手機(jī)商業(yè)化拓展不及預(yù)期;技術(shù)跨越替代,顛覆現(xiàn)有技術(shù)路徑;行業(yè)競(jìng)爭(zhēng)加劇風(fēng)險(xiǎn);行業(yè)估值回調(diào)風(fēng)險(xiǎn);各公司并不具備完全可比性,對(duì)標(biāo)的相關(guān)資料和數(shù)據(jù)僅供參考。4目錄一、PC/手機(jī)發(fā)展史及AIPC/手機(jī)必要性的探討.....................................................................................................................................................7PC發(fā)展史:圖形用戶界面與鼠標(biāo)驅(qū)動(dòng)開啟生產(chǎn)工具可能,迅馳時(shí)刻突破移動(dòng)限制手機(jī)發(fā)展史梳理:無線手機(jī)誕生,歷經(jīng)1G到2G,模擬信號(hào)到數(shù)字信號(hào)的發(fā)展手機(jī)發(fā)展史梳理:iPhone開啟智能手機(jī)新時(shí)代,移動(dòng)互聯(lián)網(wǎng)方興未艾AIPC/手機(jī)作為端側(cè)相較于云端能夠解決數(shù)據(jù)安全、延遲等問題AIPC/手機(jī)作為去中心化的服務(wù)模式能夠幫助云端分擔(dān)算力成本各大廠商相繼布局,AI終端浪潮蓄勢(shì)待發(fā),多款產(chǎn)品有望2024年上線AIPC或成為更高效的生產(chǎn)力工具,AI手機(jī)或進(jìn)化為用戶人格化的智能助理基于滲透率對(duì)AIPC出貨量及增量收入空間的測(cè)算二、從硬件角度看AIPC/手機(jī)潛在的投資機(jī)會(huì).......................................................................................................................................................16CPU架構(gòu):ARM與X86之爭(zhēng)GPU發(fā)展史:誕生于專用性需求,作為輔助處理器執(zhí)行并行計(jì)算任務(wù)2023年NVIDIA桌面專業(yè)級(jí)GPU一覽NPU:誕生于神經(jīng)網(wǎng)絡(luò)計(jì)算的需求,相較于GPU同時(shí)兼顧專用性和能耗比不同于GPU與CPU的頻繁交互,NPU加速神經(jīng)網(wǎng)絡(luò)計(jì)算效率更高手機(jī)端:處理器高度集成,在現(xiàn)有制程工藝下加入NPU或須在性能釋放上做出讓步手機(jī)端:處理器高度集成,在現(xiàn)有制程工藝下加入NPU或須在性能釋放上做出讓步(續(xù))驍龍8Gen3讓手機(jī)運(yùn)行大模型提速,驍龍XElite助力高通切入AIPC賽道Intel發(fā)布首款集成式NPU,MeteorLake架構(gòu)或帶領(lǐng)數(shù)億臺(tái)PC進(jìn)入AI時(shí)代NPU處理人工智能任務(wù)具有低功耗高效率優(yōu)勢(shì),三顆U協(xié)同助力優(yōu)化PCAI加速PC搭載NPU成為AIPC時(shí)代開啟的重要標(biāo)志,疊加Windows系統(tǒng)迭代或?qū)頁(yè)Q機(jī)潮目前端側(cè)芯片算力對(duì)推理任務(wù)支持度的測(cè)算:文本類型任務(wù)目前端側(cè)芯片算力對(duì)推理任務(wù)支持度的測(cè)算:圖像類型任務(wù)相較于算力,未來PC和手機(jī)端搭載高規(guī)格模型最大的挑戰(zhàn)或來自于內(nèi)存為支持端側(cè)運(yùn)行高規(guī)格大模型,AIPC的散熱模組可能會(huì)迎來重構(gòu)5目錄大模型在端側(cè)落地或使AIPC/手機(jī)廠商成為這一服務(wù)模式下的流量入口三、AIPC/手機(jī)產(chǎn)業(yè)鏈相關(guān)標(biāo)的........................................................................................................................................................................33聯(lián)想集團(tuán):率先推出首款A(yù)IPC概念機(jī),預(yù)計(jì)將于2024年下半年推出聯(lián)想集團(tuán):發(fā)布AIPhone和功能性產(chǎn)品AITwin,后者同時(shí)賦能個(gè)人與企業(yè)用戶vivo:藍(lán)科技+6nm自研影像芯片V3+聯(lián)發(fā)科天璣9300助力打造AI手機(jī)X100系列小米:計(jì)劃在終端接入輕量化本地大模型,與WPSAI達(dá)成深度合作谷歌:正式發(fā)布Pixel8及Pixel8Pro手機(jī),在Android14上推出AI功能Humane:推出專為與大語言模型交互而生的新式可穿戴設(shè)備AIPinAIPC/手機(jī)產(chǎn)業(yè)鏈相關(guān)標(biāo)的..............................................................................................................................................................................40行業(yè)評(píng)級(jí)&投資建議&風(fēng)險(xiǎn)提示6一、PC/手機(jī)發(fā)展史及AI
PC/手機(jī)必要性的探討7PC發(fā)展史:圖形用戶界面與鼠標(biāo)驅(qū)動(dòng)開啟生產(chǎn)工具可能,迅馳時(shí)刻突破移動(dòng)限制1971~19821983~20022003~20232024年及以后隨著計(jì)算機(jī)性能的提升、體積的減小、成本的下降,個(gè)人PC產(chǎn)品出現(xiàn)。圖形用戶界面被引入PC,鼠標(biāo)驅(qū)動(dòng)引發(fā)交互形式的革命,PC開始大規(guī)模商業(yè)化落地并成為生產(chǎn)力工具。芯片組技術(shù)使PC具備移動(dòng)性以及無線上網(wǎng)等功能。此外,GPU開始廣泛用于個(gè)人PC,GPU計(jì)算時(shí)代由此開啟。AIPC時(shí)代,NPU通過廣泛應(yīng)用于人工智能任務(wù)或幫助作為生產(chǎn)力工具的PC加速變革。2003年,Intel推出迅馳平臺(tái),將PentiumM處理器、Intel芯片組和802.11無線網(wǎng)絡(luò)模塊三者集成在一起,普及了筆記本無線網(wǎng)絡(luò)的應(yīng)用,也加速了筆記本向輕薄化的發(fā)展。19831971第一臺(tái)個(gè)人PC:Datapoint22002023年9月19日,Intel正式發(fā)布基于Intel4制程工藝的首個(gè)處理器平臺(tái)——MeteorLake,該架構(gòu)首次將人工智能加速引擎(NPU)集成到PC處理器,由此,GPU、NPU、CPU等核心之間相互協(xié)同以承載對(duì)應(yīng)的AI算力。據(jù)Intel的AIPC加速計(jì)劃,其將在2025年前為超過100萬臺(tái)PC帶來AI特性,并由計(jì)劃于12月14日發(fā)布的Intel酷睿Ultra處理器率先推動(dòng)。第一臺(tái)使用GUI的電腦:AppleLisa2006年,NVIDIA發(fā)布首個(gè)通用GPU計(jì)算架構(gòu)Tesla,其采用全新的CUDA架構(gòu),支持使用C語言進(jìn)行GPU編程,可以用于通用數(shù)據(jù)并行計(jì)算。代表產(chǎn)品為G80。硬件方面:Lisa是一臺(tái)一體機(jī),12英寸單色屏幕,分辨率為720×365像素。其使用的CPU是摩托羅拉68000,運(yùn)行頻率為5MHz,內(nèi)存為1MB,擁有2個(gè)軟盤和1個(gè)5MB的硬盤。此外,蘋果自行設(shè)計(jì)出MMU以進(jìn)行內(nèi)存管理(操作系統(tǒng)因此得以支持多任務(wù)處理,即可以同時(shí)運(yùn)行多個(gè)程序)。軟件方面:Lisa首創(chuàng)“雙擊鼠標(biāo)”的交互形式,如雙擊圖標(biāo)會(huì)打開一個(gè)新窗口,通過標(biāo)題欄可以拖動(dòng)窗口直至用戶釋放按鈕等;此外,Lisa捆綁了操作系統(tǒng)LisaOS和一個(gè)包含7個(gè)應(yīng)用程序的辦公套件,后者包含文字GPU:負(fù)責(zé)高性能、高吞吐場(chǎng)景,適用于融合了AI的媒體/3D/渲染通道。NPU:在低功耗的狀態(tài)下,實(shí)現(xiàn)高效的AI終端化應(yīng)用,適用于持續(xù)的AI。CPU:響應(yīng)速度快,適用于輕量級(jí)、1981IBM5150搭載Intel8088處理器與微軟的DOS1.0操作系統(tǒng)
處理、電子表格等應(yīng)用。筆記本代表:Thinkpad系列
基于G80的獨(dú)顯:GeForce8800
單次推理的低延遲AI任務(wù)。資料:砍柴網(wǎng),oldcomputers官網(wǎng),《新媒體前沿》,IBM官網(wǎng),聯(lián)想集團(tuán)官方公眾號(hào),36氪,cnBeta,熱點(diǎn)科技,騰訊云開8發(fā)者社區(qū),創(chuàng)業(yè)邦,倍優(yōu)產(chǎn)業(yè)觀察公眾號(hào),雷科技,IT之家,驅(qū)動(dòng)之家,聯(lián)想官網(wǎng),國(guó)海證券研究所手機(jī)發(fā)展史梳理:無線手機(jī)誕生,歷經(jīng)1G到2G,模擬信號(hào)到數(shù)字信號(hào)的發(fā)展世代年代第一代(1G)1980s~1990s無線、模擬信號(hào)第二代(2G)1990s~2006關(guān)鍵詞數(shù)字信號(hào)、內(nèi)置游戲所謂移動(dòng),即無線。第一代移動(dòng)通訊的特征是手機(jī)與基站之間通過模擬信號(hào)進(jìn)行傳輸,僅能進(jìn)行通話。缺陷是安全性和抗干擾能力差,且由于沒有國(guó)際的通用標(biāo)準(zhǔn),國(guó)際漫游成為問題。使用數(shù)字信號(hào)的2G移動(dòng)通信擁有安全性更高、頻譜利用率高、功能不僅限于通話、標(biāo)準(zhǔn)相對(duì)統(tǒng)一的優(yōu)勢(shì)。但其功能仍然相對(duì)單一,且網(wǎng)絡(luò)容量仍然較為有限。特性代表廠商摩托羅拉摩托羅拉、愛立信、諾基亞代表產(chǎn)品2000.011983.06摩托羅拉19871995.01愛立信GH33719951999.10諾基亞3210諾基亞7110摩托羅拉3200(“大哥大”)第一臺(tái)進(jìn)入中國(guó)市場(chǎng)的手機(jī)摩托羅拉8900、9900第一款揭蓋式手機(jī)第一款WAP的手機(jī),首次把手機(jī)和互聯(lián)網(wǎng)連接在一起DynaTAC8000X中國(guó)大陸出現(xiàn)的第一款GSM手機(jī)第一款內(nèi)置天線機(jī)型9資料:中關(guān)村在線,北京通信業(yè)公眾號(hào),國(guó)海證券研究所手機(jī)發(fā)展史梳理:iPhone開啟智能手機(jī)新時(shí)代,移動(dòng)互聯(lián)網(wǎng)方興未艾世代年代第三代(3G)2007~2010s第四代(4G)2010s~2020s第五代(5G)2020s~關(guān)鍵詞智能手機(jī)、操作系統(tǒng)、移動(dòng)互聯(lián)網(wǎng)更快更穩(wěn)定、流媒體萬物互聯(lián)、AIGCiOS和Android先后問世,第三代移動(dòng)通信3G網(wǎng)絡(luò)與2G相比,能夠提供更先進(jìn)的服務(wù)功能并擁有更高的網(wǎng)絡(luò)容量。在數(shù)據(jù)傳輸上,3G手機(jī)能夠?qū)崿F(xiàn)無線寬帶接第四代移動(dòng)通信4G相較于3G擁有更高的數(shù)據(jù)傳輸速率,
高網(wǎng)速、低時(shí)延、高容量的特性通過全面和安全的IP解決方案,4G能使手機(jī)用戶實(shí)現(xiàn)在任何時(shí)間、任何地點(diǎn)接收語音、數(shù)據(jù)和流媒體,手游、使5G網(wǎng)絡(luò)相較于4G擁有萬物互聯(lián)的能力,端側(cè)大模型的發(fā)展或助力智能手機(jī)發(fā)展出更多功能。特性入或接近無線帶寬接入,類似一個(gè)范圍更大的WiFi網(wǎng)絡(luò)。
長(zhǎng)短視頻、社媒直播、移動(dòng)支付等得以迅速普及。代表廠商蘋果、三星等蘋果、、OPPO、vivo、小米、三星、、榮耀等代表產(chǎn)品20082008.102023.08HUAWEIMate602023.10小米14第二代iPhone3GG1(HTCDream)2007上市僅三天,iPhone
第一款采用Android操作系3G就售出100萬部
統(tǒng)的手機(jī)2015.092018.10HUAWEIMate202019.04搭載麒麟芯片+鴻蒙
首款搭載小米澎湃OS
OS的手機(jī)第一代iPhoneiPhone6sOPPOReno資料:中關(guān)村在線,北京通信業(yè)公眾號(hào),中國(guó)新聞網(wǎng),環(huán)球網(wǎng),新浪手機(jī),雷科技,ZAKER,每日經(jīng)濟(jì)新聞,蘋果官網(wǎng),官10網(wǎng),OPPO官網(wǎng),小米官網(wǎng),國(guó)海證券研究所AI
PC/手機(jī)作為端側(cè)相較于云端能夠解決數(shù)據(jù)安全、延遲等問題p
AIPC/手機(jī)作為端側(cè)大模型解決方案,能夠幫助解決數(shù)據(jù)安全及隱私泄露等問題。對(duì)個(gè)人用戶而言,可通過訪問本地?cái)?shù)據(jù)形成其數(shù)字孿生,大模型成為用戶的個(gè)性化助理;對(duì)企業(yè)用戶而言,可通過公司內(nèi)網(wǎng)訪問企業(yè)數(shù)據(jù)庫(kù)以實(shí)現(xiàn)智能化協(xié)同辦公。云端通用模型不具備服務(wù)某一領(lǐng)域的能力,需要接入數(shù)據(jù)后才具有專業(yè)能力,這意味著企業(yè)為獲得行業(yè)模型,須將關(guān)鍵性資產(chǎn)——數(shù)據(jù)上傳至云端,而一旦訓(xùn)練完成的模型被全行業(yè)共享,則意味著一定程度上企業(yè)競(jìng)爭(zhēng)壁壘的消弭,由此催生出各企業(yè)在數(shù)據(jù)墻內(nèi)訓(xùn)練專用模型的需求,AIPC/手機(jī)應(yīng)運(yùn)而生。p
絕大多數(shù)應(yīng)用場(chǎng)景下用戶對(duì)推理的時(shí)效性要求較高,在云端進(jìn)行推理再將結(jié)果傳回端和邊緣因物理距離而不可避免存在延遲,AIPC/手機(jī)直接面向終端用戶,因此能很大程度上緩解這一問題,為用戶帶來更好的使用體驗(yàn)。AIPC/Phone本地知識(shí)庫(kù)壓縮大模型核心是從本地提取信息,從而構(gòu)建個(gè)性化的知識(shí)庫(kù)。以聯(lián)想集團(tuán)的AITwin為例,個(gè)人AITwin能夠在支持人工智能的設(shè)備和邊緣設(shè)備上構(gòu)建本地知識(shí)庫(kù),設(shè)備就好像是用戶的數(shù)字延伸;企業(yè)級(jí)AITwin是一系列企業(yè)級(jí)人工智能應(yīng)用的總和,它能夠從企業(yè)或組織內(nèi)部的智能設(shè)備、智能邊緣和私有云上提取相關(guān)信息,歸納整合為判斷和結(jié)論,并提出建議。AIPC發(fā)展初期NPU的算力有限,僅支持?jǐn)?shù)十億參數(shù)量的大模型,難以帶動(dòng)云端動(dòng)則千億參數(shù)量級(jí)的大模型,為使模型能夠被搭載在端側(cè)且盡可能不犧牲用戶體驗(yàn),大模型壓縮技術(shù)至關(guān)重要,其實(shí)質(zhì)是通過裁剪和量化的方法兼顧模型大小和性能。聯(lián)想集團(tuán)與合作伙伴協(xié)同打造的Hybrid
AI解決方案,該方案中存在三種性質(zhì)不同的模型,即PublicFM、PrivateFM和PersonalFM,三種模型分別運(yùn)行在不同的場(chǎng)景下,如PublicFM運(yùn)行在云端服務(wù)器上,PrivateFM運(yùn)行在企業(yè)私有或家庭服務(wù)器上,PersonalFM運(yùn)行在PC或手機(jī)等終端智能設(shè)備上。11資料:極客公園,聯(lián)想集團(tuán)官方,聯(lián)想集團(tuán)官方公眾號(hào),熱點(diǎn)科技,IT之家,國(guó)海證券研究所AI
PC/手機(jī)作為去中心化的服務(wù)模式能夠幫助云端分擔(dān)算力成本p
將大模型部署在端側(cè)和邊緣可能會(huì)帶來公有云、私有云和本地?cái)?shù)據(jù)中心市場(chǎng)需求,以及云、端和邊緣算力的平衡。生成式AI在誕生之初主要通過云端以付費(fèi)API接口的形式向用戶提供服務(wù),過去市場(chǎng)對(duì)算力的關(guān)注多集中于云服務(wù)提供商以及大模型訓(xùn)練階段,但云端算力相對(duì)有限,在高峰期難以滿足所有用戶的推理需求,因而提高端側(cè)和邊緣算力,為推理加速成為市場(chǎng)新的焦點(diǎn)。通過智能終端(如AIPC/手機(jī))和邊緣設(shè)備為云端分擔(dān)算力成本或使云、端、邊緣算力需求走向平衡。落地方式服務(wù)模式對(duì)應(yīng)模型主要通過API付費(fèi)接口和類ChatGPT應(yīng)用提供服務(wù),前者面向B端用戶,后者面向C端用戶云端中心化服務(wù)模式公共大模型私有大模型&個(gè)人大模型主要通過各種智能終端,如AIPC/Phone提供服務(wù),直接面向C端用戶非中心化服務(wù)模式非中心化服務(wù)模式協(xié)同助力生成式AI落地邊緣主要通過邊緣服務(wù)器提供服務(wù),面向B端用戶私有大模型12資料:和訊網(wǎng),國(guó)海證券研究所各大廠商相繼布局,AI終端浪潮蓄勢(shì)待發(fā),多款產(chǎn)品有望2024年上線時(shí)間公司惠普百度宏碁相關(guān)布局2023年5月2023年5月2023年6月正在開發(fā)支持AI的PC,新型號(hào)產(chǎn)品最早可能在2024年投放市場(chǎng)。百度旗下小度科技宣布將進(jìn)軍手機(jī)市場(chǎng),并發(fā)布旗下首款智能手機(jī),整合小度AI技術(shù)能力。預(yù)計(jì)將把AIGC或其他AI應(yīng)用導(dǎo)入到終端設(shè)備上,相關(guān)AI筆記本方案會(huì)在2024、2025年陸續(xù)推出。榮耀與AMD共同召開媒體溝通會(huì),宣布將在2023年發(fā)布首款搭載AI引擎的筆記本電腦榮耀MagicXPro系列銳龍版;榮耀CEO趙明宣稱,榮耀將在智能手機(jī)端推動(dòng)部署端側(cè)大模型,以此作為新一輪產(chǎn)品技術(shù)攻堅(jiān)的起點(diǎn)。2023年7月2023年7月榮耀蘋果建立了自己的大型語言模型Ajax,并推出代號(hào)為“蘋果GPT”的內(nèi)部聊天機(jī)器人,用于測(cè)試Ajax的功能;蘋果每年將在人工智能的研究上投入10億美元,目前正在對(duì)Siri進(jìn)行改造,更智能的新版本Siri有望于2024年問世。2023年8月2023年8月2023年8月戴爾小米宣布將與英偉達(dá)合作推出生成式人工智能解決方案,幫助客戶在本地快速安全地構(gòu)建生成式人工智能(GenAI)模型。小愛同學(xué)正式升級(jí)生成式大模型,已經(jīng)開始測(cè)試,小米很快會(huì)推出端側(cè)AI大模型應(yīng)用。將大模型深度整合進(jìn)手機(jī)系統(tǒng),實(shí)現(xiàn)更高層次的融合,智慧助手小藝接入AI大模型能力,可以進(jìn)行自然對(duì)話、會(huì)議紀(jì)要和輔助文案生成、圖片二次創(chuàng)作等。OPPO安第斯智能云團(tuán)隊(duì)打造了基于混合云架構(gòu)的生成式大語言模型OAndesGPT。10月11日,OPPO宣布基于AndesGPT大模型打造的新版AI助手——新小布1.0開啟了第一輪公測(cè)。2023年10月OPPO2023年10月2023年10月谷歌三星發(fā)布新一代智能手機(jī)Pixel8系列,Pixel8Pro是第一款可以直接在設(shè)備上運(yùn)行谷歌AI模型的手機(jī)。計(jì)劃將GalaxyS24,GalaxyS24+和GalaxyS24Ultra打造成“有史以來最智能的AI手機(jī)”,超越老對(duì)手谷歌和蘋果,預(yù)計(jì)將于2024年年初發(fā)布。發(fā)布自研AI大模型矩陣,其中包括十億、百億、千億三個(gè)不同參數(shù)量級(jí)的5款自研大模型,同時(shí)位列C-Eval、CMMLU雙榜的全球中文榜單榜首,其中,70億模型是面向手機(jī)打造的端云兩用模型,vivo自研AI大模型將會(huì)首次應(yīng)用在即將發(fā)布的OriginOS4系統(tǒng)中。2023年10月vivo資料券研究所:格隆匯,電商報(bào),和訊網(wǎng),華爾街見聞,IT之家,前瞻網(wǎng),快科技,澎湃新聞,鈦媒體APP,環(huán)球網(wǎng)科技,新京報(bào),國(guó)海證13AI
PC或成為更高效的生產(chǎn)力工具,AI
手機(jī)或進(jìn)化為用戶人格化的智能助理AI
PCAI
手機(jī)會(huì)議助手/同聲傳譯菜譜推薦設(shè)計(jì)/制圖P圖照片精修文檔/電子郵件整理及撰寫自動(dòng)調(diào)節(jié)智能家居服務(wù)模式應(yīng)用開發(fā)輔助日程差旅安排/報(bào)銷旅游助手來電/短信處報(bào)表規(guī)整/數(shù)理?yè)?jù)分析購(gòu)物助手/商品推薦以對(duì)性能要求較高的高強(qiáng)度辦公場(chǎng)景為主以輕生活場(chǎng)景為主,功能上更加精細(xì)化14資料:國(guó)海證券研究所基于滲透率對(duì)AI
PC出貨量及增量收入空間的測(cè)算p
我們基于滲透率對(duì)AIPC的出貨量進(jìn)行測(cè)算,據(jù)Canalys,2024年全年P(guān)C出貨量預(yù)計(jì)將達(dá)到2.67億臺(tái),我們參考這一數(shù)據(jù)對(duì)PC出貨量進(jìn)行情景假設(shè),在四種不同情景下分別為2.4/2.6/2.8/3.0億臺(tái);同樣對(duì)AIPC滲透率進(jìn)行情景假設(shè),在七種不同情景下分別為5%/10%/20%/30%/40%/50%/60%。通過測(cè)算可知,AIPC出貨量區(qū)間為0.12~1.80億臺(tái)。對(duì)AIPC的提價(jià)水平進(jìn)行假設(shè),在AIPC提價(jià)1000元/臺(tái)和1500元/臺(tái)兩種不同情景下的增量市場(chǎng)空間分別為120~1800億元及180~2700億元。AIPC滲透率假設(shè)IDC預(yù)測(cè)的AIPC在中國(guó)PC市場(chǎng)未來幾年的滲透率AIPC出貨量預(yù)期(單位:億臺(tái))情景一5%情景二10%0.240.260.280.30情景三20%0.480.520.560.60情景四30%0.720.780.840.90情景五40%0.961.041.12情景六50%1.201.301.401.50情景七60%1.441.561.681.8085%100%80%60%40%20%0%80%75%55%情景一情景二2.42.62.83.00.120.130.140.15PC出貨量假設(shè)(單位:億臺(tái))8%情景三情景四2023E2024E2025E2026E2027E1.20AIPC滲透率假設(shè)若AIPC提價(jià)1000元/臺(tái)帶來的增量市場(chǎng)空間(單位:億元)情景一情景一情景二情景三情景四30%720情景五40%960情景六50%1200130014001500情景七5%12013014015010%24026028030020%48052056060060%14401560168018002.42.62.83.0情景二780104011201200PC出貨量(單位:億臺(tái))情景三840情景四900AIPC滲透率假設(shè)情景四30%若AIPC提價(jià)1500元/臺(tái)帶來的增量市場(chǎng)空間(單位:億元)情景一情景一5%情景二10%360情景三20%720情景五40%1440156016801800情景六50%1800195021002250情景七60%2.42.62.83.018010802160234025202700情景二1953907801170PC出貨量(單位:億臺(tái))情景三2104208401260情景四225450900135015資料:IT之家,Canalys,《AIPC產(chǎn)業(yè)(中國(guó))白皮書》,國(guó)海證券研究所二、從硬件角度看AI
PC/手機(jī)潛在的投資機(jī)會(huì)16CPU架構(gòu):ARM與X86之爭(zhēng)架構(gòu)ARMX86專利權(quán)歸屬ARMIntel、AMD精簡(jiǎn)指令集(Reduced
Instruction
Set
Computers,RISC):基礎(chǔ)指令集較少,衍生指令由基礎(chǔ)指令組合而來。以乘法計(jì)算指令為例,精簡(jiǎn)指令集在執(zhí)行計(jì)算時(shí),會(huì)將其分作4個(gè)單周期
復(fù)雜指令集(Complex
Instruction
Set
Computers,CISC):經(jīng)過長(zhǎng)指令,即:①將內(nèi)存A數(shù)據(jù)加載到寄存器,②將內(nèi)存B數(shù)據(jù)加載到寄存器,③調(diào)用兩個(gè)寄存器中的數(shù)據(jù)進(jìn)行乘法計(jì)算,④將最終計(jì)算結(jié)果存入內(nèi)存A期發(fā)展,各種為特定應(yīng)用而生的擴(kuò)展指令集層出不窮,指令集非常豐富。以乘法計(jì)算指令為例,復(fù)雜指令集在執(zhí)行計(jì)算時(shí),會(huì)將其視作1個(gè)指令,該指令需要多個(gè)處理器的時(shí)鐘周期才能完成,相較于精簡(jiǎn)指令集的每一個(gè)單周期指令,這是一個(gè)長(zhǎng)指令,一旦開始就必須執(zhí)行完畢而無法在中途叫停,而精簡(jiǎn)指令集各單周期指令之間可以不是連續(xù)執(zhí)行的復(fù)雜度目前除ARM外,應(yīng)用于路由器的MIPS架構(gòu)和應(yīng)用于移動(dòng)設(shè)備的RISC-V架構(gòu)(開源)均屬于精簡(jiǎn)指令集指令長(zhǎng)度固定可變相對(duì)較低,由于“硬件軟件化”,因此對(duì)編譯器等軟件的設(shè)計(jì)要求較高,
高,由于“軟件硬件化”,因此對(duì)軟件開發(fā)者友好,但對(duì)硬件開發(fā)者而硬件設(shè)計(jì)難度編譯后的程序體積也較大→成本相對(duì)低廉言要求較高→成本相對(duì)高昂性能相對(duì)更強(qiáng),功耗大,對(duì)散熱要求高PC及服務(wù)器端特性低功耗高能效適用領(lǐng)域智能手機(jī)、平板電腦及可穿戴設(shè)備等移動(dòng)端處理制程工藝為配合其應(yīng)用場(chǎng)景,ARM架構(gòu)處理器目前普遍采用5nm~7nm的制程工藝
X86架構(gòu)處理器目前普遍采用7nm~10nm的制程工藝最早見于ARM架構(gòu),性能核與功效核并存的設(shè)計(jì)很好地兼顧了耗電與性異構(gòu)計(jì)算大小核設(shè)計(jì)處理器代表廠商X86架構(gòu)也逐漸開始采用這種設(shè)計(jì)思路以應(yīng)對(duì)不同使用場(chǎng)景能之間的平衡高通、三星、聯(lián)發(fā)科、海思、蘋果等Intel、AMD、海光信息、兆芯等17資料:智趣東西,51CTO,量子位,芯智訊,只談科技,環(huán)球時(shí)報(bào),國(guó)海證券研究所GPU發(fā)展史:誕生于專用性需求,作為輔助處理器執(zhí)行并行計(jì)算任務(wù)p
圖像處理催生出專用處理器需求,GPU的設(shè)計(jì)初衷正是為了應(yīng)對(duì)批量同類任務(wù)的高并行執(zhí)行,隨著工藝的發(fā)展,GPU開始不斷在個(gè)人PC以及移動(dòng)設(shè)備上普及,甚至于隨著其性能呈指數(shù)級(jí)增長(zhǎng),獨(dú)顯勢(shì)頭漸起。處理器特性CPUGPU實(shí)時(shí)響應(yīng),對(duì)緩存要求高,
對(duì)任務(wù)進(jìn)行批處理,對(duì)緩計(jì)算效率相對(duì)較低整型運(yùn)算存要求低,計(jì)算效率高浮點(diǎn)運(yùn)算運(yùn)算方式計(jì)算模式
串行計(jì)算(任務(wù)類型多樣)
并行計(jì)算(任務(wù)類型單一)擅長(zhǎng)領(lǐng)域
資源調(diào)配、系統(tǒng)控制等
數(shù)值計(jì)算、圖像處理等CPUGPUControl:控制器ALU:運(yùn)算器Cache:緩存DRAM:存儲(chǔ)器p
消費(fèi)級(jí)GPU的發(fā)展歷程:集顯核顯獨(dú)顯其與核顯的區(qū)別是擁有獨(dú)立的顯存,不會(huì)占用系統(tǒng)內(nèi)存,一般是單獨(dú)插在主板相應(yīng)的接口上,其相較于核顯擁有更好的性能和散熱表現(xiàn),常見于游戲本和工作站。集成在主板北橋上,由于集成在主板上,因此與CPU之間的協(xié)調(diào)效率不高,在性能方面有一定的局限性。將GPU集成在CPU內(nèi)部,這種設(shè)計(jì)使兩者的協(xié)調(diào)效率得到了明顯的提升,是目前市面上常見的消費(fèi)級(jí)GPU存在形式之一。注:CPU進(jìn)入“后摩爾時(shí)代”,使其在性能升級(jí)和優(yōu)化層面面臨較大限制;與此同時(shí),GPU仍然遵循摩爾定律預(yù)言的性能呈指數(shù)級(jí)增長(zhǎng)。18資料:51CTO,科Way,智通財(cái)經(jīng),電腦裝配網(wǎng),太平洋消費(fèi)網(wǎng),國(guó)海證券研究所2023年NVIDIA桌面專業(yè)級(jí)GPU一覽GPU規(guī)格性能GPU光追核心(RT
Core)
(Tensor
Core)AI核心單精度性能(TFLOPS)AI運(yùn)算性能(TFLOPS)CUDA核心18,17610,75210,2408,1927,1686,1443,328896顯存容量
顯存帶寬NVLink雙精度加速ECCNVIDIA
RTX
6000NVIDIA
RTX
A6000NVIDIA
RTX
A5500NVIDIA
RTX
A5000NVIDIA
RTX
A4500NVIDIA
RTX
A4000NVIDIA
RTX
A2000NVIDIA
T1000142(3rd
Gen)
568(4th
Gen)48GB48GB24GB24GB20GB16GB960GB/s768GB/s768GB/s768GB/s640GB/s448GB/s288GB/s160GB/s80GB/s91.138.734.127.823.719.27.91457309.7272.8222.2189.2153.463.9√√√√√√√84(2nd
Gen)80(2nd
Gen)64(2nd
Gen)56(2nd
Gen)48(2nd
Gen)26(2nd
Gen)336(3rd
Gen)320(3rd
Gen)256(3rd
Gen)224(3rd
Gen)192(3rd
Gen)104(3rd
Gen)√√√√6GB/12GB4GB/8GB2.5NVIDIA
T4003844GB1Quadro
GV1005,12064032GB870GB/s√14.8√118.5√19資料:螢火蟲測(cè)評(píng)薈,國(guó)海證券研究所NPU:誕生于神經(jīng)網(wǎng)絡(luò)計(jì)算的需求,相較于GPU同時(shí)兼顧專用性和能耗比p
NPU(NeuralnetworkProcessingUnit),即神經(jīng)網(wǎng)絡(luò)處理單元,可在電路層模擬人類神經(jīng)元和突觸,并用深度學(xué)習(xí)指令集直接處理大規(guī)模的神經(jīng)元和突觸,一條指令完成一組神經(jīng)元的處理。相較于CPU和GPU的馮諾依曼結(jié)構(gòu),NPU通過突觸權(quán)重實(shí)現(xiàn)存儲(chǔ)和計(jì)算一體化,從而提高運(yùn)行效率。NPU是ASIC芯片的一種,目前主要應(yīng)用于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)等人工智能任務(wù)。AI芯片類型GPUASICFPGAApplicationSpecificIntegratedCircuit,即專用集成電路,有全定制和半定制兩種設(shè)計(jì)方式。ASIC芯片可根據(jù)終端功能的不同分為TPU、DPU、VPU和NPU等。其中,TPU為張量處理器,專用于機(jī)器學(xué)習(xí),如Field-ProgrammableGate
Array,即現(xiàn)場(chǎng)可編程門陣列,其是作為專用集成電路領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)簡(jiǎn)介圖形處理單元Google于2016年5月研發(fā)針對(duì)Tensorflow平臺(tái)的可編程AI;DPU即DataProcessingUnit,可作為數(shù)據(jù)中心等計(jì)算場(chǎng)景的加速引擎;VPU即VideoProcessingUnit,是智能視頻處理ASIC芯片非常適合人工智能相關(guān)的應(yīng)用場(chǎng)景。整體而言,①現(xiàn)場(chǎng)可編程性(靈活性):可使FPGA通過編程實(shí)現(xiàn)任意芯片的邏輯功能,這也是其被稱為“萬能芯片”的原因。邏輯芯片如ASIC類似于一張出廠時(shí)就寫有數(shù)據(jù)且不可擦除的CD,用戶只需要放在CD播放器里就可以聽到音樂;而FPGA類似于一張空白的CD,需要用戶自己使用刻錄機(jī)燒寫數(shù)據(jù)內(nèi)容到盤里,且用戶可以擦除上面的數(shù)據(jù),反復(fù)刻錄;②開發(fā)周期短:邏輯芯片如ASIC制造流程包括邏輯實(shí)現(xiàn)、布線處理和流片等多個(gè)步驟,而FPGA無需布線、掩膜和定制流片等,因而可以簡(jiǎn)化開發(fā)流程,縮短開發(fā)周期①性能相對(duì)較強(qiáng):例如NVIDIA首款專門為深度學(xué)習(xí)設(shè)計(jì)的芯片TeslaP100數(shù)據(jù)處理速度是其2014年推出GPU系列的12倍;Google為機(jī)器學(xué)習(xí)定制的芯片TPU將硬件性能提升至相當(dāng)于當(dāng)前芯片按照摩爾定律發(fā)展特性通用性相對(duì)較好
7年后的水平;②體積小重量輕:ASIC芯片作為集成電路技術(shù)與特定用戶的整機(jī)或系統(tǒng)技術(shù)緊密結(jié)合的產(chǎn)物,與通用集成電路相比具有體積更小、重量更輕等優(yōu)點(diǎn)能耗成本高低低高較高高中較高高算力代表廠商N(yùn)VIDIA、AMDGoogle、Intel、NVIDIA、寒武紀(jì)、瀾起科技、海思、地平線等Intel、AMD、百度等20資料:電子工程專輯,半導(dǎo)體圈,電子工程世界,浪潮企業(yè)級(jí)解決方案,格隆匯,十大品牌網(wǎng),芯智訊,國(guó)海證券研究所不同于GPU與CPU的頻繁交互,NPU加速神經(jīng)網(wǎng)絡(luò)計(jì)算效率更高GPU的加速NPU的加速FPGA內(nèi)部架構(gòu)圖p
GPU僅執(zhí)行矩陣乘法和加法的并行計(jì)算,神經(jīng)網(wǎng)絡(luò)p
NPU與GPU的區(qū)別在于每層神經(jīng)元的計(jì)算結(jié)果不用輸出到主內(nèi)存,而是按照神經(jīng)網(wǎng)絡(luò)的連接直接傳遞到下層神經(jīng)元繼續(xù)計(jì)算,因此其在運(yùn)算性能和功耗上都得到很大提升。p
FPGA與CPU、GPU以及以NPU為代表的ASIC芯片等的核心區(qū)別是:其底層邏輯運(yùn)算單元的連線和邏輯布局未固化,因而能夠滿足用戶自行設(shè)計(jì)、研制和生產(chǎn)集成電路的需求。模型的構(gòu)建和數(shù)據(jù)流的傳輸仍然在CPU上進(jìn)行。p
流程:?
CPU加載權(quán)重?cái)?shù)據(jù),按照代碼構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,將每層的矩陣運(yùn)算通過CUDA或OpenCL等類庫(kù)接口傳送到GPU上實(shí)現(xiàn)并行計(jì)算,輸出結(jié)果;?
CPU調(diào)度下層神經(jīng)元組矩陣數(shù)據(jù)計(jì)算,直至神經(jīng)網(wǎng)絡(luò)輸出層計(jì)算完成,得到最終結(jié)果。p
流程:p
FPGA的構(gòu)成:CPU在整個(gè)運(yùn)行過程中主要是負(fù)責(zé)數(shù)據(jù)的加載和業(yè)務(wù)流程的控制,其將編譯好的神經(jīng)網(wǎng)絡(luò)模型文件和權(quán)重文件交由NPU后即等待最終結(jié)果的輸出。?
可編程邏輯塊(CLB):可編程電路,是實(shí)現(xiàn)邏輯功能的基本單元,通常規(guī)則排列成一個(gè)陣列,散布于整個(gè)芯片中。?
輸入/輸出模塊(IOB):可編程電路,主要完成芯片上的邏輯與外部引腳的接口。p
CPU與GPU如何交互:?
獲取GPU信息,配置GPUid;?
加載神經(jīng)元參數(shù)到GPU;?
GPU加速神經(jīng)網(wǎng)絡(luò)計(jì)算;?
接收GPU計(jì)算結(jié)果。p
NPU與GPU如何交互:?
向NPU傳入模型文件,得到模型task;?
獲取task的輸入輸出信息;?
拷貝輸入數(shù)據(jù)到模型內(nèi)存中;?
運(yùn)行模型,得到輸出數(shù)據(jù)。?
可編程互連資源(PIR):可編程電路。?
靜態(tài)存儲(chǔ)器(SRAM):用于存放編程數(shù)據(jù)。p
主要應(yīng)用于智能手機(jī)、便攜式移動(dòng)設(shè)備及汽車等。21資料:51CTO,半導(dǎo)體圈,國(guó)海證券研究所手機(jī)端:處理器高度集成,在現(xiàn)有制程工藝下加入NPU或須在性能釋放上做出讓步CPUAI相關(guān)(TPU/NPU
etc.)廠商產(chǎn)品線最新型號(hào)制程GPU代表機(jī)型核心數(shù)量核心頻率(GHz)驍龍400系列(適用于入門級(jí)和低端手機(jī),性能較低,適合日常使用)Adreno613955MHz驍龍4Gen24nm雙核A78+六核A552.2+2.0-Redmi12、RedmiNote12R驍龍600系列(適用于中端手機(jī),性能較強(qiáng),能夠滿足大部分用戶的需求)驍龍6Gen14nm4nm四核A78+四核A552.2+1.8Adreno710AI性能增加3倍AI性能提升2倍榮耀X50、iQOOZ8X高通驍龍700系列(適用于高端手機(jī),性能更強(qiáng),適合游戲和多媒體應(yīng)用)單核X2+單核A710+四核A510Adreno725580MHzrealmeGTNeo5SE、RedmiNote12Turbo、小米POCOF5驍龍7+Gen22.91+2.49+1.8Hexagon芯片:新增對(duì)于INT4精度AI計(jì)算的支持,與INT8相比,INT4將帶來60%的能效提升和90%的AI推理性能提升小米13/小米13Pro/小米13Ultra、vivoX90Pro+/XFold2、榮耀Magic5/5Pro/5至臻版、三星GalaxyS23/S23+/S23Ultra驍龍800系列(適用于旗艦手機(jī),性能最強(qiáng),能夠處理高負(fù)荷的任務(wù))單核X3+雙核A715+雙核A710+三核A510Adreno740680MHz驍龍8Gen24nm3.2+2.8+2.8+2.06核,峰值性能提升20%,光線追蹤性能達(dá)到4倍NPU性能提升2倍,具有16核(35TOPS)的神經(jīng)網(wǎng)絡(luò)引擎,可加速機(jī)器學(xué)習(xí)A17ProA163nm4nm6核(2性能核4能效核)
3.78+2.11iPhone15Pro/15ProMax蘋果系列Apple
A具有16核(17TOPS)的神經(jīng)引擎,可加速機(jī)器學(xué)習(xí)iPhone14Pro/14ProMax、iPhone15、iPhone15Plus6核(2大核4小核)3.46+2.025核HUAWEIMate60/Mate60Pro/Mate60Pro+、HUAWEIMateX58核(1超大核3大核4小核)Maleoon910308~750MHz麒麟9000S麒麟9000E-2.62+2.15+1.533.13+2.54+2.05-海思麒麟系列8核(1超大核3大核4能效核)Mali-G78MP22,8核NPU采用雙核設(shè)計(jì)(一大核一小核)5nmHUAWEIMate40注:表格內(nèi)容為根據(jù)公開資料信息匯總整合而成,或與實(shí)際參數(shù)存在出入,僅供參考。22資料:驅(qū)動(dòng)之家,快科技,高通官方,天極網(wǎng),九鋒網(wǎng),AI奇點(diǎn),新智元,IT之家,國(guó)海證券研究所手機(jī)端:處理器高度集成,在現(xiàn)有制程工藝下加入NPU或須在性能釋放上做出讓步(續(xù))CPUAI相關(guān)(TPU/NPU
etc.)廠商產(chǎn)品線最新型號(hào)制程GPU代表機(jī)型核心數(shù)量核心頻率(GHz)Mali-G57MC2天璣6000系列天璣6100+6nm雙核A76+六核A552.2+2.0--realme11x天璣7000系列(入門級(jí))Mali-G610MC4天璣7200Ultra天璣82004nm4nm雙核A715+六核A510四核A78+四核A55--聯(lián)發(fā)科RedmiK60E、vivoS16Pro、vivoV27Pro、RedmiNote12TPro(Ultra)、vivoS17Pro、OPPOReno10Pro、小米Civi3(Ultra)天璣8000系列(中高端)Mali-G610MC6950MHz3.1+2.0MediaTekAPU580MediaTekAPU690賦能AI超級(jí)分辨率(AI-SR)和AI降噪(AI-NR)等應(yīng)用的省電技術(shù)天璣9000系列(旗艦級(jí))單核X3+三核A715+四核A510Immortalis-G715iQOONeo8Pro、vivoX90s、RedmiK60至尊版、小米13TPro天璣9200+Exynos1380Exynos22004nm3.35+3.0+2.02.4+2.0Mali-G68MP5608MHz內(nèi)置AI引擎,其增強(qiáng)型NPU的算力為4.9TOPS5nmLPE四核A78+四核A55GalaxyA54、GalaxyM54三星谷歌系列Exynos其NPU具有乘法累加運(yùn)算(MAC)操作功能,相較于上一代AI性能提升一倍以上,且支持FP16、INT8、INT16等數(shù)據(jù)格式Xclipse9201.3GHz(AMD單核X2+三核A710+四核A510GalaxyS22、GalaxyS22+、GalaxyS22Ultra4nm4LPE5nm2.8+2.52+1.822.85+2.35+1.8RDNA2)搭載神經(jīng)網(wǎng)絡(luò)處理器Next-genTensorProcessingUnit(TPU)雙核X1+雙核A78+四核A55Mali-G710MP7,8核Tensor
G2Pixel7/7Pro注:表格內(nèi)容為根據(jù)公開資料信息匯總整合而成,或與實(shí)際參數(shù)存在出入,僅供參考。23資料:驅(qū)動(dòng)之家,聯(lián)發(fā)科官網(wǎng),三星官網(wǎng),新品問問,IT之家,國(guó)海證券研究所驍龍8Gen3讓手機(jī)運(yùn)行大模型提速,驍龍
X
Elite助力高通切入AI
PC賽道p
高通在2023驍龍技術(shù)峰會(huì)上發(fā)布用于AI手機(jī)的驍龍8Gen3和用于AIPC的驍龍X
Elite,率先成為同時(shí)搶占生成式AI應(yīng)用落地的兩個(gè)端側(cè)賽道的芯片廠商。就手機(jī)端而言,搭載了驍龍8Gen3的手機(jī)運(yùn)行StableDiffusion模型,只用0.6秒即在本地生成了一張圖像,其相較于驍龍8Gen2的15秒很大程度上優(yōu)化了移動(dòng)終端生成式AI的推理速度;就PC端而言,高通開創(chuàng)性地推出驍龍XElite平臺(tái),該處理器不僅拓展了生成式AI應(yīng)用的廣度,也是高通強(qiáng)勢(shì)切入PC市場(chǎng)的重要舉措。HexagonNPU——雙平臺(tái)并進(jìn)AI手機(jī)AIPC驍龍8Gen3采用的高通AI引擎擁有面向移動(dòng)終端的強(qiáng)大HexagonNPU,集成了升級(jí)后的硬件加速單元、微切片推理單元、加強(qiáng)張量、標(biāo)量和矢量單元,所有單元共享2倍帶寬的大容量共享內(nèi)存。同時(shí)支持INT8+INT16的混合精度以及INT4、INT8、INT16和FP16的所有精度。據(jù)機(jī)器之心報(bào)道,其性能較前代提升98%,能效提升40%。驍龍8Gen3首次支持運(yùn)行100億參數(shù)的模型,規(guī)模邁入百億量級(jí)。同時(shí)將StableDiffusion生成圖像的時(shí)間降到了1秒之內(nèi),創(chuàng)下最快速度。在跑Meta大語言模型Llama2-7B時(shí),驍龍8Gen3每秒可以生成20個(gè)token,同樣是手機(jī)終端側(cè)最快之一。驍龍XElite處理器采用4nm制程工藝,集成定制的高通OryonCPU,據(jù)機(jī)器之心報(bào)道,其運(yùn)行速度是Intel12核處理器的2倍,功耗比Intel競(jìng)品低68%,高峰時(shí)段的運(yùn)行速度比蘋果M2快了50%。驍龍XElite專為AI打造,其采用業(yè)界領(lǐng)先的、集成HexagonNPU的高通AI引擎,異構(gòu)算力高達(dá)75TOPS,支持在終端側(cè)運(yùn)行超過130億參數(shù)的生成式AI模型,面向70億參數(shù)大模型每秒生成30個(gè)token,AI處理速度是競(jìng)品的4.5倍。據(jù)高通官方,搭載驍龍XElite的PC預(yù)計(jì)將于2024年中面市。24資料:機(jī)器之心,高通官網(wǎng),國(guó)海證券研究所Intel發(fā)布首款集成式NPU,Meteor
Lake架構(gòu)或帶領(lǐng)數(shù)億臺(tái)PC進(jìn)入AI時(shí)代p
MeteorLake是Intel首款集成了NPU的處理器產(chǎn)品,能在PC上實(shí)現(xiàn)高能效本地推理。在CPU和GPU之外,NPU能以更好的能效比實(shí)現(xiàn)對(duì)人工智能任務(wù)不同維度的加速,如視頻會(huì)議時(shí)的背景虛化、眼睛角度矯正以及對(duì)人的追蹤等。通過低功耗的人工智能加速模塊,可以一定程度降低CPU和GPU的使用,以換取筆記本更好的電池續(xù)航。MeteorLake被分為四個(gè)部分:SoC、IO、CPU和GPU,NPUAI加速引擎內(nèi)置于SoC模塊。GPU、NPU、CPU如何分工協(xié)作適合高性能、高吞吐需求的AI工作,如融合了AI的媒體/3D/渲染通道等。GPUNPU低功耗的AI引擎,適用于持續(xù)的AI工作。CPU響應(yīng)快,適用于輕量級(jí)、低延遲需求的AI工作。NPU支持的神經(jīng)網(wǎng)絡(luò)生成式AI+NLP計(jì)算機(jī)視覺圖像分類圖像增強(qiáng)協(xié)作轉(zhuǎn)換器編碼器風(fēng)格轉(zhuǎn)移超分辨率背景分割大型語言模型(LLaMAV2)生成對(duì)抗網(wǎng)絡(luò)物體檢測(cè)圖像分割深度提取自動(dòng)重新構(gòu)圖眼睛注視矯正音頻降噪圖像生成(StableDiffusion)音頻生成語音轉(zhuǎn)文本25資料:機(jī)核,熱點(diǎn)科技,盒六網(wǎng),國(guó)海證券研究所NPU處理人工智能任務(wù)具有低功耗高效率優(yōu)勢(shì),三顆U協(xié)同助力優(yōu)化PCAI加速Stable目前,Intel已經(jīng)開始與軟件開發(fā)商接觸以推動(dòng)終端AI的生態(tài)應(yīng)用,例如,通過Diffusion中Unet+、Unet-構(gòu)成的圖像生成在NPU上具備最低的功耗和最高的效率,而如果讓NPU和GPU配合承擔(dān)一部分工作,則能在最短的時(shí)間內(nèi)完成任務(wù)。WindowsStudioEffects調(diào)用NPU,以使Teams通過OpenVINO引擎實(shí)現(xiàn)人物背景虛化;AdobePhotoshop調(diào)用DirectML進(jìn)行AI加速等。p
OpenVINO是Intel研發(fā)的專門用于優(yōu)化和部署人工智能推理的工具包,能夠通過CPU、GPU和NPU資源的動(dòng)態(tài)調(diào)整以實(shí)現(xiàn)AI加速。應(yīng)用ONNXRT(開源)AIAPIDirectMLOpenVINO(Intel)NPUUMD驅(qū)動(dòng)程序軟件堆棧庫(kù)、編譯器驅(qū)動(dòng)程序MLAS庫(kù)MKLDNN庫(kù)GPUUMD驅(qū)動(dòng)程序WDDMKMD驅(qū)動(dòng)程序MCDMKMD驅(qū)動(dòng)程序NPU固件顯卡固件硬件CPUGPUNPU26資料:盒六網(wǎng),國(guó)海證券研究所PC搭載NPU成為AI
PC時(shí)代開啟的重要標(biāo)志,疊加Windows系統(tǒng)迭代或?qū)頁(yè)Q機(jī)潮p
NPU作為人工智能相關(guān)任務(wù)專用引擎成為PC的核心零部件之一為AIGC在端側(cè)落地打開可能性,是AI時(shí)代PC產(chǎn)品的重要革新。NPU相較于GPU擁有更優(yōu)的能耗比,這意味著隨著NPU在PC上普及,其與GPU的分工或?qū)⒏用鞔_。此先作為圖像處理專用芯片的GPU亦常用于深度學(xué)習(xí)相關(guān)領(lǐng)域,對(duì)矩陣加乘的并行計(jì)算能力使GPU在NPU之前一直是AI模型訓(xùn)練和推理倚賴的重要硬件單元。隨著Transformer成為L(zhǎng)LM的主流架構(gòu),并將CV和NLP這兩個(gè)研究分支統(tǒng)一起來,神經(jīng)網(wǎng)絡(luò)成為構(gòu)建AI模型的基本單元,NPU作為張量處理器能夠在更短的時(shí)間內(nèi)完成大規(guī)模神經(jīng)網(wǎng)絡(luò)計(jì)算任務(wù),因而其相較于GPU是更適合人工智能相關(guān)任務(wù)的加速引擎。NPU將作為端側(cè)重要的基礎(chǔ)設(shè)施之一為PC端搭載大模型提供前提條件,其普及標(biāo)志著AIPC時(shí)代的來臨。p
PC出貨量高企往往與Windows操作系統(tǒng)的重要版本更新相伴相生,考慮到WindowsCopilot和內(nèi)置于PC的本地大模型在功能上互為補(bǔ)充,微軟預(yù)計(jì)于2024年發(fā)布的Windows12操作系統(tǒng)有望成為推動(dòng)換機(jī)潮的另一個(gè)重要因素。內(nèi)置于PC的大模型主要是從本地如硬盤中提取用戶信息進(jìn)行推理,而WindowsCopilot更多的還是從云端如OneDrive中獲得數(shù)據(jù),在某些對(duì)數(shù)據(jù)私密性要求較高的場(chǎng)景下前者相對(duì)適用,但內(nèi)置于PC的大模型和WindowsCopilot并不完全是競(jìng)對(duì)關(guān)系,而是相互補(bǔ)充,從而為終端用戶提供更好的AIPC使用體驗(yàn)。2009~2023
PC季度出貨量(in
million
units)100
Windows
7Windows
8Windows
8.1Windows
10Windows
1190807060504027資料:微軟官網(wǎng),PChome電腦之家,稀土掘金,快科技,國(guó)海證券研究所目前端側(cè)芯片算力對(duì)推理任務(wù)支持度的測(cè)算:文本類型任務(wù)p
根據(jù)經(jīng)驗(yàn)公式,大模型在推理過程中每個(gè)token需要進(jìn)行約2N次計(jì)算,其中N為模型參數(shù)量。我們假設(shè)推理時(shí)的硬件利用率為50%,模型參數(shù)量分別為5B/50B/150B。?
AI芯片算力為10TOPS時(shí)完成各種任務(wù)所需時(shí)長(zhǎng)的測(cè)算(單位:秒):長(zhǎng)生短(如提取摘要)情景二短生長(zhǎng)(如內(nèi)容創(chuàng)作)情景二情景(英文)文本模型參數(shù)量情景一情景三10000情景一情景三10000輸入輸出2000100500050075075075050505010001000100010050002502502505B5.656.0168.014.7146.7440.028.7286.7860.02.813.6136.0408.027.3273.3820.050B28.084.0150B?
AI芯片算力為30TOPS時(shí)完成各種任務(wù)所需時(shí)長(zhǎng)的測(cè)算(單位:秒):長(zhǎng)生短(如提取摘要)情景二短生長(zhǎng)(如內(nèi)容創(chuàng)作)情景二情景(英文)文本模型參數(shù)量情景一情景三情景一情景三輸入輸出20001005000500100001005000100005B1.94.99.695.6286.70.99.34.545.3136.09.191.150B18.756.048.9146.7150B28.0273.3?
AI芯片算力為100TOPS時(shí)完成各種任務(wù)所需時(shí)長(zhǎng)的測(cè)算(單位:秒):長(zhǎng)生短(如提取摘要)情景二短生長(zhǎng)(如內(nèi)容創(chuàng)作)情景二情景(英文)文本情景一情景三情景一情景三輸入輸出20001005000500100001005000100005B0.65.61.52.90.32.88.41.42.7模型參數(shù)量50B14.744.028.786.013.640.827.382.0150B16.828資料:OneFlow,國(guó)海證券研究所目前端側(cè)芯片算力對(duì)推理任務(wù)支持度的測(cè)算:圖像類型任務(wù)p
基本思路和假設(shè)同上,模型參數(shù)量分別為7B/15B/50B。根據(jù)OpenAI,1張高分辨率圖像=85+170*(圖像分辨率/512×512)tokens。?
AI芯片算力為10TOPS時(shí)完成各種任務(wù)所需時(shí)長(zhǎng)的測(cè)算(單位:秒):圖像分辨率情景(高分辨率)圖像模型參數(shù)量情景一512×5120.7情景二1024×10242.1情景三分辨率7B512×1024/1024×5121.22.68.515B50B1.54.65.115.3?
AI芯片算力為30TOPS時(shí)完成各種任務(wù)所需時(shí)長(zhǎng)的測(cè)算(單位:秒):圖像分辨率情景二1024×10240.7情景(高分辨率)圖像情景一512×5120.2情景三分辨率7B512×1024/1024×5120.40.92.8模型參數(shù)量15B50B0.51.51.75.1?
AI芯片算力為100TOPS時(shí)完成各種任務(wù)所需時(shí)長(zhǎng)的測(cè)算(單位:秒):圖像分辨率情景二1024×10240.2情景(高分辨率)圖像情景一512×5120.1情景三分辨率7B512×1024/1024×5120.10.30.9模型參數(shù)量15B50B0.20.50.51.529資料:OpenAI官網(wǎng),國(guó)海證券研究所相較于算力,未來PC和手機(jī)端搭載高規(guī)格模型最大的挑戰(zhàn)或來自于內(nèi)存p
大模型的落地不僅需要算力的配合,更需要足夠的內(nèi)存空間用于部署。目前在端側(cè)落地的大模型以數(shù)十億量級(jí)參數(shù)為主,更高規(guī)格的模型由于需要更多的內(nèi)存占用,因而從短期來看難以實(shí)現(xiàn)產(chǎn)品化。解決路徑方面,在NPU高度集成的情況下,需要拔高終端本身的內(nèi)存配置;若未來NPU同GPU一樣獨(dú)立出來,則需要進(jìn)一步發(fā)展其顯存以使芯片的存儲(chǔ)、傳輸和計(jì)算能力達(dá)到平衡,從而為終端模型運(yùn)行在理想狀態(tài)下提供全方位支持。?
以vivo為例,探討不同規(guī)格模型的運(yùn)行內(nèi)存占用情況(目前手機(jī)主流的運(yùn)行內(nèi)存檔位是8G~12G):參數(shù)量1B(經(jīng)優(yōu)化后的)內(nèi)存占用對(duì)手機(jī)內(nèi)存配置的最低要求目前市面上的手機(jī)基本都能運(yùn)行這一規(guī)格的模型8G落地情況1G4G-已實(shí)現(xiàn)產(chǎn)品化,但性能較差,難以滿足用戶需求已實(shí)現(xiàn)產(chǎn)品化,是vivo目前的最優(yōu)解決方案未實(shí)現(xiàn)產(chǎn)品化7B13B12G內(nèi)存的手機(jī)也難以保證使用體驗(yàn)?
以LLama2(有7B、13B和70B三個(gè)版本,是搭載在端側(cè)的主力模型之一)為例,探討模型參數(shù)量、數(shù)據(jù)精度和內(nèi)存占用情況的關(guān)系:數(shù)據(jù)精度內(nèi)存占用情況(G)INT4INT8FP16FP327B3.36.513.026.1參數(shù)量13B70B6.112.165.224.248.432.6130.4260.830資料:騰訊科技,新智元,高通中國(guó),菜鳥筆記,國(guó)海證券研究所為支持端側(cè)運(yùn)行高規(guī)格大模型,AI
PC的散熱模組可能會(huì)迎來重構(gòu)p
散熱能力是高算力芯片的一個(gè)主要瓶頸,隨著搭載在AIPC和AI手機(jī)上的模型規(guī)格不斷提升,NPU性能釋放可能會(huì)更加激進(jìn),為配合硬件升級(jí),相較于傳統(tǒng)PC/手機(jī),AIPC/手機(jī)可能會(huì)給出全新的散熱解決方案。從數(shù)據(jù)中心來看,關(guān)鍵痛點(diǎn)是耗電和散熱,在芯片的有限體積內(nèi),如何將高集成、高能量密度產(chǎn)生的熱值和熱效應(yīng)準(zhǔn)確計(jì)算并順利排出,已經(jīng)成為多源異構(gòu)芯片3D封裝中最具挑戰(zhàn)性的問題。目前的消費(fèi)電子終端,手機(jī)方面,不銹鋼VC均熱板開始逐漸取代銅VC均熱板成為散熱主力;PC的散熱方案一般以組合的形式呈現(xiàn),而散熱模組(ThermalModule)從結(jié)構(gòu)上看主要包括散熱底座、熱管、散熱鰭片、散熱風(fēng)扇等物件?,F(xiàn)階段PC的散熱技術(shù)簡(jiǎn)介這種技術(shù)利用熱量對(duì)流擴(kuò)散的特性,以空氣為導(dǎo)體順應(yīng)風(fēng)速的流動(dòng),帶走PC硬件所產(chǎn)生的熱量。這種技術(shù)的優(yōu)勢(shì)在于實(shí)用性風(fēng)冷散熱技術(shù)液冷散熱技術(shù)強(qiáng),任何硬件都可以運(yùn)用風(fēng)冷散熱進(jìn)行降溫,同時(shí)安裝也較為簡(jiǎn)單,僅需將風(fēng)扇安置在相應(yīng)的硬件上方即可。并且它還具備安全性高、易維護(hù)、不易損壞三大特點(diǎn)。水冷散熱一般由熱交換器、循環(huán)系統(tǒng)、水箱、水泵以及關(guān)鍵的水來構(gòu)成。常規(guī)來說,水本身的導(dǎo)熱性不如風(fēng)冷散熱,但水的流動(dòng)特性所帶來的熱量傳導(dǎo)效率超越風(fēng)冷的速度,進(jìn)而創(chuàng)造出更快的散熱效果,再配合制冷液和高功率制冷系統(tǒng),就使得具備更大熱容量的水,帶來了更高的散熱效率。同時(shí)水冷系統(tǒng)的散熱特性更加穩(wěn)定,不會(huì)因?yàn)殚L(zhǎng)時(shí)間運(yùn)行而產(chǎn)生散熱瓶頸期。?
散熱鰭片:簡(jiǎn)稱散熱片,是直接與芯片接觸的介質(zhì),直接吸收熱量。散熱鰭片的材質(zhì)對(duì)于散熱效果有不同影響,如,鋁制鰭片的成本低,散熱效果較好,而銅制鰭片導(dǎo)熱更快??紤]到鋁制鰭片需要達(dá)到一定規(guī)模體積且需要一定數(shù)量熱管才能完全發(fā)揮作用,因此在筆記本電腦中,銅制鰭片會(huì)更為合適。此外,散熱鰭片的表面積大小也會(huì)影響最終的散熱效果,表面積越大,散熱效果越好。?
熱管:其散熱效率主要與直徑、數(shù)量、長(zhǎng)度、彎曲程度以及扁平程度有關(guān)。通常而言銅管越扁,熱對(duì)流越慢,導(dǎo)熱性能越差。2根熱管足以應(yīng)對(duì)大部分不超頻家用以及辦公電腦CPU滿負(fù)載的發(fā)熱量,高端CPU則需要配置4~8根導(dǎo)熱銅管。綜合而言,熱管從芯片到鰭片的距離越短、直徑越粗、彎折次數(shù)越少、彎折角度越小、數(shù)量越多,散熱性能越好。這種技術(shù)一般是作為風(fēng)冷和水冷的補(bǔ)充。VC真空腔均熱板通常被置于芯片和銅質(zhì)熱管之間,相較于固態(tài)金屬或者傳統(tǒng)銅質(zhì)熱管所帶來的金屬傳導(dǎo)散熱,它將散熱面積覆蓋得更大,讓熱量得以更均勻地導(dǎo)出(真空腔均熱板通過腔內(nèi)導(dǎo)熱紋理擴(kuò)大了熱交換面積,讓高溫區(qū)域的熱量以蒸汽的形式迅速均勻地導(dǎo)出)VC均溫板散熱技術(shù)31資料:集微網(wǎng),中國(guó)財(cái)富網(wǎng),鴻富瀚科技官網(wǎng),國(guó)海證券研究所大模型在端側(cè)落地或使AI
PC/手機(jī)廠商成為這一服務(wù)模式下的流量入口p
大模型在端側(cè)落地的主要受益方包括硬件(以NPU為主)設(shè)計(jì)制造商、大模型提供商以及終端設(shè)備(AIPC/手機(jī))廠商,其中終端設(shè)備廠商作為唯一直接面向C端用戶的角色,可能會(huì)成為這一服務(wù)模式下的流量入口。大模型的兩種商業(yè)模式產(chǎn)業(yè)鏈邏輯在云端通過付費(fèi)API接口或類ChatGPT應(yīng)用提供服務(wù)在端側(cè)通過AIPC/手機(jī)提供服務(wù)企業(yè)用戶大模型提供商企業(yè)用戶個(gè)人用戶算力提供商大模型提供商核心終端設(shè)備廠商核心個(gè)人用戶硬件設(shè)計(jì)制造商預(yù)先搭載大模型/大模型商店等(可能也會(huì)上線自研模型),重點(diǎn)是打通從硬件到操作系統(tǒng)再到大模型的整個(gè)鏈條,并通過獨(dú)家組裝、設(shè)計(jì)、優(yōu)化以及模型蒸餾等能力使模型發(fā)揮出最佳性能生態(tài)構(gòu)建插件商店/GPTs應(yīng)用商店等,重點(diǎn)是深挖開發(fā)者社區(qū)對(duì)終端設(shè)備廠商而言,一方面可就NPU對(duì)產(chǎn)品進(jìn)行提價(jià);另一方面可能會(huì)向用戶收取大模型及相關(guān)應(yīng)用的服務(wù)費(fèi)。成本主要由硬件采購(gòu)成本以及向大模型提供商支付的費(fèi)用構(gòu)成。綜合看來,終端設(shè)備廠商主要扮演中間人角色,負(fù)責(zé)將整個(gè)產(chǎn)業(yè)鏈條串聯(lián)起來,并基于其組裝、設(shè)計(jì)、優(yōu)化以及服務(wù)能力賺取“差價(jià)”利潤(rùn)對(duì)大模型提供商而言,就API接口,采取按量計(jì)費(fèi)模式;就類ChatGPT應(yīng)用,采取訂閱制;就插件商店和GPTs應(yīng)用商店,采取收入抽成模式。成本主要由GPU采購(gòu)成本、模型訓(xùn)練成本(如電費(fèi)等)、數(shù)據(jù)成本(或有)以及人力成本構(gòu)成變現(xiàn)與收入分配32資料:機(jī)器之能,ChatGPT官網(wǎng),國(guó)海證券研究所三、AI
PC/手機(jī)產(chǎn)業(yè)鏈相關(guān)標(biāo)的33聯(lián)想集團(tuán):率先推出首款A(yù)I
PC概念機(jī),預(yù)計(jì)將于2024年下半年推出p
2023年10月,聯(lián)想集團(tuán)在第九屆聯(lián)想創(chuàng)新科技大會(huì)上展示了其人工智能個(gè)人電腦(AIPC)產(chǎn)品,該產(chǎn)品預(yù)計(jì)將于2024年下半年推出。據(jù)聯(lián)想官方,其AIPC能夠創(chuàng)建個(gè)性化的本地知識(shí)庫(kù),并通過模型壓縮技術(shù)運(yùn)行個(gè)人大模型,實(shí)現(xiàn)用戶與人工智能的自然交互。AIPC的兩層內(nèi)涵AIPoweredComputing,AI驅(qū)動(dòng)的計(jì)算,指包括PC、平板、手機(jī)、汽車、服務(wù)AIPersonalComputer,即AI個(gè)人電腦,是新一代智能終端產(chǎn)品器等各類端和邊緣側(cè)全方位地搭載AI相關(guān)的能力,是更廣泛的一個(gè)概念內(nèi)嵌AI功能,通過大模型壓縮技術(shù),可以創(chuàng)建個(gè)性化本地知識(shí)庫(kù),能運(yùn)行個(gè)人模型,和用戶實(shí)現(xiàn)自然交互作為工作助手,安排會(huì)議、寫文檔或者提煉總結(jié)要點(diǎn)基于電腦上的照片和視頻,直接剪輯生成內(nèi)容34資料:財(cái)聯(lián)社,36Kr,聯(lián)想TechWorld2023大會(huì),砍柴網(wǎng),國(guó)海證券研究所聯(lián)想集團(tuán):發(fā)布AI
Phone和功能性產(chǎn)品AI
Twin,后者同時(shí)賦能個(gè)人與企業(yè)用戶p
就個(gè)人用戶而言,AITwin被定義為用戶在數(shù)字世界的延伸,其本質(zhì)上是基于本地知識(shí)庫(kù)生成的屬于個(gè)人的專有大模型,其能夠在最大范圍內(nèi)了解用戶的思維方式并給出解決方案。由于AITwin只會(huì)被存儲(chǔ)在本地化的設(shè)備或家庭服務(wù)器上,個(gè)人數(shù)據(jù)不會(huì)被共享或上傳至公有云平臺(tái),因此用戶的個(gè)人隱私和數(shù)據(jù)安全能夠得到有效保護(hù);企業(yè)級(jí)AITwin涵蓋一系列企業(yè)級(jí)人工智能應(yīng)用,其能夠打通企業(yè)內(nèi)部各類智能設(shè)備、邊緣和私有云,聯(lián)動(dòng)各種企業(yè)級(jí)軟件,綜合和分析各類信息并給出最優(yōu)建議。例如,企業(yè)級(jí)AITwin可以綜合考慮企業(yè)的差旅政策、審批流程與員工的個(gè)人信息和偏好,為用戶指定一個(gè)合理的計(jì)劃。AITwin類型個(gè)人企業(yè)級(jí)定位個(gè)人助理企業(yè)級(jí)智能應(yīng)用的組合PC、私有服務(wù)器等運(yùn)行終端PC、手機(jī)、汽車等智能終端AIPhone手語翻譯解決方案35資料:36Kr,聯(lián)想TechWorld2023大會(huì),極客網(wǎng),國(guó)海證券研究所vivo:藍(lán)科技+6nm自研影像芯片V3+聯(lián)發(fā)科天璣9300助力打造AI手機(jī)X100系列p
2023年11月13日,vivo發(fā)布新品X100系列,該系列作為vivo旗下全新的AI手機(jī),落地終端側(cè)70億參數(shù)大語言模型,跑通端側(cè)130億參數(shù)模型。?
藍(lán)晶芯片技術(shù)棧:結(jié)合vivo自研影像芯片的能力,以軟硬一體化設(shè)計(jì)為用戶帶來更?
CPU:全大核架構(gòu),4×Cortex-X4超大核+4×Cortex-A720大核強(qiáng)大的性能體驗(yàn)?
GPU:Immortalis-G720,性能大幅提升46%,功耗降低40%?
藍(lán)海續(xù)航系統(tǒng):打造更大容量、更快閃充、更輕薄體積的電池技術(shù),同時(shí)開創(chuàng)了開源、降耗、提效的全新模式,滿足用戶對(duì)手機(jī)續(xù)航的新需求?
藍(lán)心大模型:由5款vivo自研大模型組成的矩陣,分別覆蓋十億、百億、千億三個(gè)參數(shù)量級(jí)?
AI處理器:APU790,基于聯(lián)發(fā)科開發(fā)的混合精度INT4量化技術(shù)和內(nèi)存硬件壓縮技術(shù)NeuroPilotCompression,天璣9300可支持端側(cè)運(yùn)行10億、70億、130億AI大語言模型,并且率先實(shí)現(xiàn)在移動(dòng)芯片上運(yùn)行330億
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 水和廢水監(jiān)測(cè)儀相關(guān)行業(yè)投資方案范本
- 小學(xué)國(guó)慶節(jié)活動(dòng)方案博客
- 《海的女兒》讀后感
- 鄉(xiāng)村醫(yī)生主要先進(jìn)事跡(6篇)
- 鄉(xiāng)鎮(zhèn)老齡工作總結(jié)范文
- 中秋節(jié)活動(dòng)心得體會(huì)(5篇)
- 新學(xué)期學(xué)習(xí)計(jì)劃范例匯編7篇
- 在銀行的實(shí)習(xí)報(bào)告范文錦集七篇
- 世博會(huì)觀后感
- 高等數(shù)學(xué)教程 上冊(cè) 第4版 習(xí)題及答案 P146 第6章 定積分及其應(yīng)用
- 2024新能源光伏電站運(yùn)行規(guī)程和檢修規(guī)程
- 三年級(jí)美術(shù)上冊(cè)全冊(cè)教案(湘教版)
- 2024版成人術(shù)中非計(jì)劃低體溫預(yù)防與護(hù)理培訓(xùn)課件
- 綜合素質(zhì)評(píng)價(jià)平臺(tái)建設(shè)方案-2024
- GB/T 44539-2024螢石技術(shù)規(guī)范
- 廣東省珠海市紫荊中學(xué)2025屆高二數(shù)學(xué)第一學(xué)期期末達(dá)標(biāo)檢測(cè)試題含解析
- 2024屋頂分布式光伏場(chǎng)站設(shè)備運(yùn)維規(guī)程
- 北師大版數(shù)學(xué)一上 3.1《一共有多少》教學(xué)設(shè)計(jì)
- 2024-2030年全球及中國(guó)電弧故障檢測(cè)裝置(AFDD)行業(yè)市場(chǎng)現(xiàn)狀供需分析及市場(chǎng)深度研究發(fā)展前景及規(guī)劃可行性分析研究報(bào)告
- GB/T 44395-2024激光雷達(dá)測(cè)風(fēng)數(shù)據(jù)可靠性評(píng)價(jià)技術(shù)規(guī)范
- 廣東省深圳市2023-2024學(xué)年高一上學(xué)期語文期中試卷(含答案)
評(píng)論
0/150
提交評(píng)論