




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 AI芯片產(chǎn)業(yè)深度研究報告 一、人工智能芯片發(fā)展現(xiàn)狀及趨勢1、深度學(xué)習(xí)算法對芯片要求更為苛刻,通用 CPU 性價比相對較差經(jīng)歷了 60 多年的起起伏伏之后,人工智能終于迎來了第三次爆發(fā)。第三次爆發(fā)的核心引爆點(diǎn)是深度學(xué)習(xí)算法的出現(xiàn),但其背后的支撐是數(shù)據(jù)和算力。對整個 AI 行業(yè)來講,算法、數(shù)據(jù)和算力三大基本要素中,數(shù)據(jù)尤其是海量數(shù)據(jù)的獲取和處理難度在下降,算法也在深度學(xué)習(xí)模型的基礎(chǔ)上不斷優(yōu)化,而負(fù)責(zé)將數(shù)據(jù)和深度算法統(tǒng)一協(xié)調(diào)起來的芯片能否獲得大的飛躍,成為市場關(guān)注的焦點(diǎn)。深度學(xué)習(xí)算法對芯片性能需求主要表現(xiàn)在三個方面:一、海量數(shù)據(jù)在計算和存儲單元之間的高速通信需求。這不但需要芯片具備強(qiáng)大的緩存和片上
2、存儲能力,而且還需要計算和存儲單元之間有較大的通信帶寬。二、專用計算能力需求高。深度學(xué)習(xí)算法中有大量卷積、殘差網(wǎng)絡(luò)、全連接等特殊計算需要處理,還需要提升運(yùn)算速度,降低功耗。三、海量數(shù)據(jù)自身處理同樣也對芯片提出了新的要求,尤其是非結(jié)構(gòu)化數(shù)據(jù)的增多,對傳統(tǒng)芯片結(jié)構(gòu)造成了較大的壓力。通用 CPU 在深度學(xué)習(xí)中可用但效率較低。比如在圖像處理領(lǐng)域,主要用到的是 CNN(卷積神經(jīng)網(wǎng)絡(luò)),在自然語言識別、語音處理等領(lǐng)域,主要用到的是 RNN(循環(huán)神經(jīng)網(wǎng)絡(luò)),雖然這兩種算法模型有著較大的區(qū)別,但本質(zhì)上都是向量和矩陣運(yùn)算,主要是加法和乘法,輔助一些除法和指數(shù)運(yùn)算。傳統(tǒng) CPU 可用于做上述運(yùn)算,但是 CPU 還
3、有大量的計算邏輯控制單元,這些單元在 AI 計算中是用不上的,造成了 CPU 在 AI 計算中的性價比較低。2、GPU、FPGA 以及 ASIC 各有優(yōu)劣,成為當(dāng)前 AI 芯片行業(yè)的主流正因為 CPU 在 AI 計算上的弱點(diǎn),給了可以實現(xiàn)海量并行計算且能夠?qū)M(jìn)行計算加速的 AI 芯片留下了市場空間。從廣義上講,面向 AI 計算的芯片都可以稱為 AI 芯片,包括基于傳統(tǒng)架構(gòu)的 GPU、FPGA以及 ASIC(專用芯片),也包括正在研究但離商用還有較大差距的類腦芯片、可重構(gòu) AI 芯片等。云端訓(xùn)練芯片市場較為集中,而推理市場云、邊兩端均有大量企業(yè)參與按照部署位置劃分,AI 芯片可以分為云端芯片和邊
4、緣端芯片。云端芯片部署位置包括公有云、私有云或者混合云等基礎(chǔ)設(shè)施,主要用于處理海量數(shù)據(jù)和大規(guī)模計算,而且還要能夠支持語音、圖片、視頻等非結(jié)構(gòu)化應(yīng)用的計算和傳輸,一般情況下都是用多個處理器并行完成相關(guān)任務(wù);邊緣端 AI 芯片主要應(yīng)用于嵌入式、移動終端等領(lǐng)域,如攝像頭、智能手機(jī)、邊緣服務(wù)器、工控設(shè)備等,此類芯片一般體積小、耗電低,性能要求略低,一般只需具備一兩種 AI 能力。按照承擔(dān)的任務(wù)分,AI 芯片可以劃分為訓(xùn)練芯片和推理芯片。訓(xùn)練是指通過大量標(biāo)記過的數(shù)據(jù)在平臺上進(jìn)行“學(xué)習(xí)”,并形成具備特定功能的神經(jīng)網(wǎng)絡(luò)模型;推理則是利用已經(jīng)訓(xùn)練好的模型輸入新數(shù)據(jù)通過計算得到各種結(jié)論。訓(xùn)練芯片對算力、精度要求
5、非常之高,而且還需要具備一定的通用性,以適應(yīng)多種算法的訓(xùn)練;推理芯片更加注重綜合能力,包括算力能耗、時延、成本等因素。綜合來看,訓(xùn)練芯片由于對算力的特殊要求,只適合在云端部署,而且多采用的是“CPU+加速芯片”類似的異構(gòu)模式,加速芯片可以是 GPU,也可以是 FPGA 或者是 ASIC 專用芯片。AI 訓(xùn)練芯片市場集中度高,英偉達(dá)和谷歌領(lǐng)先,英特爾和 AMD 正在積極切入。推理在云端和終端都可進(jìn)行,市場門檻相對較低,市場參與者較多。云端推理芯片除了傳統(tǒng)的英偉達(dá)、谷歌、賽靈思等芯片大廠外,Groq等國際新興力量也在加入競爭,國內(nèi)寒武紀(jì)、比特大陸也有不錯表現(xiàn);終端推理芯片市場較為分散,場景各異,參
6、與者除了英偉達(dá)、英特爾、ARM 和高通之外,國內(nèi)企業(yè)如寒武紀(jì)、地平線、云知聲、云天勵飛等在各自細(xì)分領(lǐng)域均有所建樹。GPU 擅長云端訓(xùn)練,但需與 CPU 異構(gòu)、功耗高且推理效率一般GPU(Graphics Processing Unit)是一種由大量核心組成的大規(guī)模并行計算架構(gòu),專為同時處理多重任務(wù)而設(shè)計的芯片。正是由于其具備良好的矩陣計算能力和并行計算優(yōu)勢,最早被用于 AI 計算,并在云端獲得大量應(yīng)用。GPU 中超過 80%部分為運(yùn)算單元(ALU),而 CPU 僅有 20%,因此 GPU更擅長于大規(guī)模并行運(yùn)算。以英偉達(dá)的 GPU TITAN X 為例,該產(chǎn)品在深度學(xué)習(xí)中所需訓(xùn)練時間只有CPU
7、的 1/10 不到。但 GPU 用于云端訓(xùn)練也有短板,GPU 需要同 CPU 進(jìn)行異構(gòu),通過 CPU 調(diào)用才能工作,而且本身功耗非常高。同時,GPU 在推理方面需要對單項輸入進(jìn)行處理時,并行計算的優(yōu)勢未必能夠得到很好的發(fā)揮,會出現(xiàn)較多的資源浪費(fèi)。CPU與GPU架構(gòu)對比FPGA 芯片算力強(qiáng)、靈活度高,但技術(shù)難度大國內(nèi)差距較為明顯FPGA(Field-Programmable Gate Array)即現(xiàn)場可編程門陣列,該芯片集成了大量的基本門電路以及存儲器,其靈活性介于 CPU、GPU 等通用處理器和專用集成電路 ASIC 之間,在硬件固定之前,允許使用者靈活使用軟件進(jìn)行編程。FPGA 在出廠時是
8、“萬能芯片”,用戶可根據(jù)自身需求,用硬件描述語言對 FPGA 的硬件電路進(jìn)行設(shè)計;每完成一次燒錄,F(xiàn)PGA 內(nèi)部的硬件電路就有了確定的連接方式,具有了一定的功能;輸入的數(shù)據(jù)只需要依次經(jīng)過各個門電路,就可以得到輸出結(jié)果。FPGA 應(yīng)用于 AI 有以下優(yōu)勢:(1)算力強(qiáng)勁。由于 FPGA 可以同時進(jìn)行數(shù)據(jù)并行和任務(wù)并行計算,在處理特定應(yīng)用時效果更加明顯,對于某一個特定的運(yùn)算,F(xiàn)PGA 可以通過編輯重組電路,生成專用電路,大幅壓縮計算周期。從賽靈思推出的 FPGA 產(chǎn)品看,其吞吐量和時延指標(biāo)都好于 CPU 和 GPU 產(chǎn)品。(2)功耗優(yōu)勢明顯。FPGA 能耗比是CPU的10倍以上、GPU的3倍。由于
9、在 FPGA 中沒有取指令與指令譯碼操作,沒有這部分功耗;而在復(fù)雜指令集(X86)的 CPU 中僅僅譯碼就占整個芯片能耗的約 50%,在 GPU 里取指與譯碼也會消耗 10%至 20%的能耗。(3)靈活性好。使用通用處理器或 ASIC 難以實現(xiàn)的下層硬件控制操作技術(shù),利用 FPGA 可以很方便的實現(xiàn),從而為算法的功能實現(xiàn)和優(yōu)化留出了更大空間。(4)成本相對 ASIC 具備一定優(yōu)勢。FPGA 一次性成本(光刻掩模制作成本)遠(yuǎn)低于 ASIC,在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定需要不斷迭代改進(jìn)的情況下,利用具備可重構(gòu)特性的FPGA 芯片來實現(xiàn)半定制的人工智能芯片是最佳選擇。正因為存在上述優(yōu)勢
10、,F(xiàn)PGA 被廣泛用于 AI 云端和終端的推理。國外包括亞馬遜、微軟都推出了基于 FPGA 的云計算服務(wù),而國內(nèi)包括騰訊云、阿里云均在 2017 年推出了基于 FPGA 的服務(wù),百度大腦也使用了 FPGA 芯片。從市場格局上看,全球 FPGA 長期被 Xilinx(賽靈思)、Intel(英特爾)、Lattice(萊迪思)、Microsemi(美高森美)四大巨頭壟斷。其中,賽靈思和英特爾合計占到市場的 90%左右,賽靈思的市場份額超過 50%,國內(nèi)廠商剛剛起步,差距較大。專用芯片(ASIC)深度學(xué)習(xí)算法加速應(yīng)用增多,可提供更高能效表現(xiàn)和計算效率ASIC(Application Specific
11、Integrated Circuits),即專用芯片,是一種為特定目的、面向特定用戶需求設(shè)計的定制芯片,具備性能更強(qiáng)、體積小、功耗低、可靠性更高等優(yōu)點(diǎn)。在大規(guī)模量產(chǎn)的情況下,還具備成本低的特點(diǎn)。ASIC 與 GPU、FPGA 不同,GPU、FPGA 除了是一種技術(shù)路線之外,還是實實在在的確定產(chǎn)品,而 ASIC 只是一種技術(shù)路線或者方案,其呈現(xiàn)出的最終形態(tài)與功能也是多種多樣的。近年來,越來越多的公司開始采用 ASIC 芯片進(jìn)行深度學(xué)習(xí)算法加速,其中表現(xiàn)最為突出的 ASIC 就是 Google 的TPU(張量處理芯片)。TPU 是谷歌為提升 AI 計算能力同時大幅降低功耗而專門設(shè)計的芯片。該芯片正
12、式發(fā)布于 2016 年 5月。TPU 之所以稱為 AI 專用芯片,是因為它是專門針對 TensorFlow 等機(jī)器學(xué)習(xí)平臺而打造,該芯片可以在相同時間內(nèi)處理更復(fù)雜、更強(qiáng)大的機(jī)器學(xué)習(xí)模型。谷歌通過數(shù)據(jù)中心測試顯示,TPU 平均比當(dāng)時的 GPU 或 CPU 快 15-30 倍,性能功耗比(TFOPS/Watt)高出約 30-80 倍。但是,ASIC 一旦制造完成以后就不能修改了,且研發(fā)周期較長、商業(yè)應(yīng)用風(fēng)險較大,目前只有大企業(yè)或背靠大企業(yè)的團(tuán)隊愿意投入到它的完整開發(fā)中。國外主要是谷歌在主導(dǎo),國內(nèi)企業(yè)寒武紀(jì)開發(fā)的 Cambricon 系列處理器也廣泛受到關(guān)注。其中,華為海思的麒麟 980 處理器所搭
13、載的 NPU 就是寒武紀(jì)的處理器 IP。3、短期內(nèi) GPU 仍將是 AI 芯片主導(dǎo),長期看三大技術(shù)路線將呈現(xiàn)并行態(tài)勢短期內(nèi) GPU 仍將主導(dǎo) AI 芯片市場,F(xiàn)PGA 的使用將更為廣泛GPU 短期將延續(xù) AI 芯片的領(lǐng)導(dǎo)地位。GPU 作為市場上 AI 計算最成熟、應(yīng)用最廣泛的通用型芯片,應(yīng)用潛力較大。憑借其強(qiáng)大的計算能力、較高的通用性,GPU 將繼續(xù)占領(lǐng) AI 芯片的主要市場份額。當(dāng)前,兩大 GPU 廠商都還在不斷升級架構(gòu)并推出新品,深度學(xué)習(xí)性能提升明顯,未來應(yīng)用的場景將更為豐富。英偉達(dá)憑借著其在矩陣運(yùn)算上的優(yōu)勢,率先推出了專為深度學(xué)習(xí)優(yōu)化的 Pascal GPU,而且針對 GPU 在深度學(xué)習(xí)
14、上的短板,2018 年推出了 Volta 架構(gòu),正在完成加速-運(yùn)算-AI 構(gòu)建的閉環(huán);AMD 針對深度學(xué)習(xí),2018 年推出 Radeon Instinct 系列,未來將應(yīng)用于數(shù)據(jù)中心、超算等 AI 基礎(chǔ)設(shè)施上。我們預(yù)計,在效率和場景應(yīng)用要求大幅提升之前,作為數(shù)據(jù)中心和大型計算力支撐的主力軍,GPU 仍具有很大的優(yōu)勢。FPGA 是短期內(nèi) AI 芯片市場上的重要增長點(diǎn),F(xiàn)PGA 的最大優(yōu)勢在于可編程帶來的配置靈活性,在當(dāng)前技術(shù)與運(yùn)用都在快速更迭的時期,F(xiàn)PGA 具有明顯的實用性。企業(yè)通過 FPGA 可以有效降低研發(fā)調(diào)試成本,提高市場響應(yīng)能力,推出差異化產(chǎn)品。在專業(yè)芯片發(fā)展得足夠完善之前,F(xiàn)PGA
15、 是最好的過渡產(chǎn)品,正因為如此,科技巨頭紛紛布局云計算+FPGA 的平臺。隨著 FPGA 的開發(fā)者生態(tài)逐漸豐富,適用的編程語言增加,F(xiàn)PGA 運(yùn)用會更加廣泛。因此短期內(nèi),F(xiàn)PGA 作為兼顧效率和靈活性的硬件選擇仍將是熱點(diǎn)所在。長期來看 GPU、FPGA 以及 ASIC 三大類技術(shù)路線將并存GPU 主要方向是高級復(fù)雜算法和通用型人工智能平臺。(1)高端復(fù)雜算法實現(xiàn)方向。由于 GPU 本身就具備高性能計算優(yōu)勢,同時對于指令的邏輯控制上可以做的更復(fù)雜,在面向復(fù)雜 AI 計算的應(yīng)用方面具有較大優(yōu)勢。(2)通用型的人工智能平臺方向。GPU 由于通用性強(qiáng),性能較高,可以應(yīng)用于大型人工智能平臺夠高效地完成不
16、同種類的調(diào)用需求。FPGA 未來在垂直行業(yè)有著較大的空間。由于在靈活性方面的優(yōu)勢,F(xiàn)PGA 對于部分市場變化迅速的行業(yè)最為實用。同時,F(xiàn)PGA 的高端器件中也可以逐漸增加 DSP、ARM 核等高級模塊,以實現(xiàn)較為復(fù)雜的算法。隨著 FPGA 應(yīng)用生態(tài)的逐步成熟,F(xiàn)PGA 的優(yōu)勢也會逐漸為更多用戶所認(rèn)可,并得以廣泛應(yīng)用。ASIC 長遠(yuǎn)來看非常適用于人工智能,尤其是應(yīng)對未來爆發(fā)的面向應(yīng)用場景的定制化芯片需求。ASIC的潛力體現(xiàn)在,AI 算法廠商有望通過算法嵌入切入該領(lǐng)域,以進(jìn)入如安防、智能駕駛等場景。由于其具備高性能低消耗的特點(diǎn),可以基于多個人工智能算法進(jìn)行定制,以應(yīng)對不同的場景,未來在訓(xùn)練和推理市
17、場上都有較大空間。4、國內(nèi)外 AI 芯片市場需求將保持較快增長勢頭,云端、邊緣均具備潛力近年來,伴隨著全球 AI 產(chǎn)業(yè)的快速增長,AI 芯片需求大幅上升。按照 Gartner 最新數(shù)據(jù),2018 年全球 AI 芯片市場規(guī)模達(dá)到 42.7 億美元。未來幾年,全球各大芯片企業(yè)、互聯(lián)網(wǎng)巨頭、初創(chuàng)企業(yè)都將在該市場上進(jìn)行角逐,預(yù)計到 2023 年全球市場規(guī)模將達(dá)到 323 億美元。未來五年(2019-2023年)平均增速約為 50%,其中數(shù)據(jù)中心、個人終端、物聯(lián)網(wǎng)芯片均是增長的重點(diǎn)。相比之下中金公司研究部公布的一組數(shù)據(jù)則更為樂觀,該數(shù)據(jù)顯示,2017年,整體AI芯片市場規(guī)模達(dá)到62.7億美元,其中云端訓(xùn)
18、練AI芯片20.2億美元,云端推理芯片3.4億美元,邊緣計算AI芯片39.1億美元;到2022年,整體AI芯片市場規(guī)模將會達(dá)到596.2億美元,CAGR57%,其中云端訓(xùn)練AI芯片172.1億美元,CAGR 53.5%,云端推斷芯片71.9億美元,CAGR 84.1%,邊緣計算AI芯片352.2億美元,CAGR 55.2%。國內(nèi)人工智能芯片行業(yè)發(fā)展仍處在起步階段。長期以來,我國在 CPU、GPU 和 DSP 設(shè)計上一直處于追趕狀態(tài),絕大多數(shù)芯片依靠國外的 IP 核進(jìn)行設(shè)計,自主創(chuàng)新能力不足。但我們也看到,國內(nèi)人工智能產(chǎn)業(yè)的快速發(fā)展,也為國內(nèi)芯片產(chǎn)業(yè)實現(xiàn)換道超車創(chuàng)造了機(jī)會。由于國內(nèi)外在芯片生態(tài)上
19、并未形成壟斷,國內(nèi)芯片設(shè)計廠商尤其是專用芯片設(shè)計廠商,同國外競爭對手還處在同一起跑線上。目前國內(nèi)人工智能芯片市場呈現(xiàn)出百花齊放的態(tài)勢。AI 芯片的應(yīng)用領(lǐng)域廣泛分布在金融證券、商品推薦、安防、消費(fèi)機(jī)器人、智能駕駛、智能家居等眾多領(lǐng)域,催生了大量的人工智能創(chuàng)業(yè)企業(yè),如地平線、深鑒科技、寒武紀(jì)、云知聲、云天勵飛等。我們認(rèn)為,未來隨著國內(nèi)人工智能市場的快速發(fā)展,生態(tài)建設(shè)的完善,國內(nèi) AI 芯片企業(yè)將有著更大的發(fā)展空間,未來 5 年的市場規(guī)模增速將超過全球平均水平。二、 AI 芯片主要應(yīng)用場景1、數(shù)據(jù)中心(云端)數(shù)據(jù)中心是 AI 訓(xùn)練芯片應(yīng)用的最主要場景,主要涉及芯片是 GPU 和專用芯片(ASIC)。
20、如前所述,GPU 在云端訓(xùn)練過程中得到廣泛應(yīng)用。目前,全球主流的硬件平臺都在使用英偉達(dá)的 GPU 進(jìn)行加速,AMD 也在積極參與。亞馬遜網(wǎng)絡(luò)服務(wù) AWS EC2、Google Cloud Engine(GCE)、IBM Softlayer、Hetzner、Paperspace 、LeaderGPU、阿里云、平安云等計算平臺都使用了英偉達(dá)的 GPU 產(chǎn)品提供深度學(xué)習(xí)算法訓(xùn)練服務(wù)。在云端推理市場上,由于芯片更加貼近應(yīng)用,市場更多關(guān)注的是響應(yīng)時間,需求也更加的細(xì)分。除了主流的 CPU+GPU 異構(gòu)之外,還可通過 CPU+FPGA/ASIC 進(jìn)行異構(gòu)。目前英偉達(dá)在該市場依然保持著領(lǐng)軍位置。主要原因是:
21、GPU強(qiáng)大的并行計算能力(相比CPU)、通用性以及成熟的開發(fā)環(huán)境。但是GPU也并非是完美無缺的解決方案,明顯的缺點(diǎn)如:高能耗以及高昂的價格。相比之下,F(xiàn)PGA的低延遲、低功耗、可編程性優(yōu)勢(適用于傳感器數(shù)據(jù)預(yù)處理工作以及小型開發(fā)試錯升級迭代階段)和 ASIC 的特定優(yōu)化和效能優(yōu)勢(適用于在確定性執(zhí)行模型)也正在凸顯,賽靈思、谷歌、Wave Computing、Groq、寒武紀(jì)、比特大陸等企業(yè)市場空間也在擴(kuò)大。來自IDC和Gartner的數(shù)據(jù)也顯示,全球AI服務(wù)器及AI芯片市場規(guī)模自2016年到都將保持持續(xù)的高速增長,而與此同時全球云端AI芯片當(dāng)中GPU的市場份額呈現(xiàn)出持續(xù)下滑的趨勢,預(yù)計到20
22、22年云端訓(xùn)練GPU占比將降至60%,云端推理GPU占比更是只有30%。2、移動終端智能手機(jī)在經(jīng)歷了近10年的高速增長后,市場已趨于飽和,出貨增速趨近于0,行業(yè)逐漸轉(zhuǎn)為存量市場。近年來,一批國產(chǎn)廠商在產(chǎn)品質(zhì)量上逐漸達(dá)到了第一梯隊的水平,進(jìn)一步加劇了頭部市場的競爭。為實現(xiàn)差異化競爭,各廠商加大手機(jī)AI功能的開發(fā),通過在手機(jī)SoC芯片中加入AI引擎,調(diào)配現(xiàn)有計算單元來實現(xiàn)AI計算,或者直接加入AI協(xié)處理器,實現(xiàn)在低功耗情況下AI功能的高效運(yùn)行。隨著未來競爭進(jìn)一步加劇,以及產(chǎn)量上升所帶來的成本下降,預(yù)計AI芯片將會進(jìn)一步滲透進(jìn)入到中等機(jī)型市場,市場空間廣闊。移動端AI芯片市場不止于智能手機(jī),潛在市場
23、還包括:智能手環(huán)/手表、VR/AR眼鏡等市場。AI芯片在圖像及語音方面的能力可能會帶來未來人機(jī)交互方式的改變并進(jìn)一步提升顯示屏、攝像頭的能力,有可能在未來改變移動端產(chǎn)品。以往通過云數(shù)據(jù)中心做手機(jī)端AI推理任務(wù)面臨網(wǎng)絡(luò)帶寬延遲瓶頸的問題,嚴(yán)重影響用戶使用體驗,而CPU適合邏輯運(yùn)算,但并不適合AI并行運(yùn)算任務(wù),目前市場上流行在SoC中增加協(xié)處理器或?qū)S眉铀賳卧獊韴?zhí)行AI任務(wù)。以智能手機(jī)為代表的移動互聯(lián)網(wǎng)終端是一個多傳感器融合的綜合數(shù)據(jù)處理平臺,AI芯片需要具備通用性,能夠處理多類型任務(wù)能力。由于移動終端依靠電池驅(qū)動,而受制于電池倉大小和電池能量密度限制,芯片設(shè)計在追求算力的同時對功耗有著嚴(yán)格的限制
24、,可以開發(fā)專用的ASIC芯片或者是使用功耗較低的DSP作為AI處理單元。目前手機(jī)芯片市場存在以下情況:1)、AI應(yīng)用場景、功能有限;2)、AI芯片廠商一般向SoC廠提供IP并收取授權(quán)費(fèi),需要AI-IP與整塊SoC進(jìn)行良好的匹配,而創(chuàng)業(yè)公司缺少與SoC廠商合作經(jīng)驗;3)、傳統(tǒng)手機(jī)SoC廠商和IP廠商都在開發(fā)自己的AI加速器,傳統(tǒng)IP巨頭可以采取IP打包銷售的方式推廣其AI-IP產(chǎn)品。相比之下新進(jìn)廠商在成本、功能、產(chǎn)品線、匹配度等都不占優(yōu)的情況下很難在該領(lǐng)域存活。新進(jìn)廠商應(yīng)加強(qiáng)其軟件方面優(yōu)勢,并加深與手機(jī)廠商合作共同進(jìn)行手機(jī)AI功能開發(fā)。3、自動駕駛自動駕駛汽車裝備了大量的傳感器、攝像頭、雷達(dá)、激
25、光雷達(dá)等車輛自主運(yùn)行需要的部件,每秒都會產(chǎn)生大量的數(shù)據(jù),對芯片算力有很高的要求, 但受限于時延及可靠性,有關(guān)車輛控制的計算不能再依托云端進(jìn)行,高算力、快速響應(yīng)的車輛端人工智能推理芯片必不可少。目前,自動駕駛所使用的芯片主要基于 GPU、FPGA 和 ASIC 三條技術(shù)路線。但由于自動駕駛算法仍在快速更迭和進(jìn)化,因此大多自動駕駛芯片使用 GPU+FPGA 的解決方案。未來算法穩(wěn)定后,ASIC將成為主流。根據(jù)美國汽車工程師協(xié)會(SAE)將自動駕駛按照車輛行駛對于系統(tǒng)依賴程度分為L0L5六個級別,L0為車輛行駛完全依賴駕駛員操縱,L3級以上系統(tǒng)即可在特定情況下實現(xiàn)駕駛員脫手操作,而L5級則是在全場景
26、下車輛行駛完全實現(xiàn)對系統(tǒng)的依賴。目前商業(yè)化乘用車車型中僅有Audi A8、Tesla、凱迪拉克等部分車型可實現(xiàn)L2、3級ADAS。預(yù)計在左右,隨著傳感器、車載處理器等產(chǎn)品的進(jìn)一步完善,將會有更多的L3級車型出現(xiàn)。而L4、5級自動駕駛預(yù)計將會率先在封閉園區(qū)中的商用車平臺上實現(xiàn)應(yīng)用落地,更廣泛的乘用車平臺高級別自動駕駛,需要伴隨著技術(shù)、政策、基礎(chǔ)設(shè)施建設(shè)的進(jìn)一步完善,預(yù)計至少在2025年2030年以后才會出現(xiàn)在一般道路上。目前汽車電子控制系統(tǒng)是分布式ECU架構(gòu),不同的信息娛樂、車身、車輛運(yùn)動和動力總成系統(tǒng)及其細(xì)分功能分別由不同獨(dú)立的ECU單元進(jìn)行獨(dú)立控制,部分高檔車型上的ECU數(shù)量超過100個。未
27、來隨著汽車進(jìn)入L3級以上的高級別自動駕駛時代,隨著車載傳感器數(shù)量及其所產(chǎn)生的數(shù)據(jù)量劇增,分布式電子系統(tǒng)難以滿足對大量、多元的傳感器數(shù)據(jù)進(jìn)行高效融合處理,并綜合所有傳感器數(shù)據(jù)做出車輛控制決策等一系列操作需求。要滿足以上功能需求,汽車電子系統(tǒng)由需要向著域控制器(DCU)、多域控制器(MDC)等集中化方向發(fā)展,未來,汽車電子操控系統(tǒng)將會進(jìn)一步向著集中化、軟硬件解耦及平臺化方向發(fā)展,汽車將會由統(tǒng)一的超算平臺對傳感器數(shù)據(jù)進(jìn)行處理、融合、決策最終實現(xiàn)高級別的自動駕駛功能。伴隨人工智能技術(shù)在視覺領(lǐng)域的應(yīng)用,基于視覺技術(shù)的自動駕駛方案逐漸變?yōu)榭赡?,這需要在傳統(tǒng)行車電腦平臺上添加用于視覺算法處理的AI芯片。自動
28、駕駛汽車計算單元設(shè)計需要考慮算力、功耗體積等問題,出于硬件資源最優(yōu)化應(yīng)用,往往采取異構(gòu)計算平臺設(shè)計方案,及“CPU+XPU”(XPU包括:DSP/GPU/FPGA/ASIC),其中可采取DSP用于圖像特征提取任務(wù)、GPU/FPGA/ASIC等計算單元用于目標(biāo)識別、追蹤任務(wù)等,而CPU則會用于定位、決策等邏輯運(yùn)算任務(wù)。目前最典型的產(chǎn)品如英偉達(dá)的DRIVE PX系列及后續(xù)的Xavier、Pegasus等。除硬件計算平臺外,英偉達(dá)為客戶提供配套的軟件平臺及開放的上層傳感器布局和自定義模塊使得客戶能夠根據(jù)自身需要進(jìn)行二次開發(fā),其還為客戶提供感知、制圖以及行駛策略等解決方案。目前其產(chǎn)品已經(jīng)被包括ZF、B
29、osch、Audi、Benz以及Tesla等Tier1s、OEMs廠商及諸多自動駕駛創(chuàng)業(yè)公司采用作為其處理器方案所使用。在全部的邊緣計算場景中,用于自動駕駛的計算芯片設(shè)計難度最大,這主要體現(xiàn)在:1)算力要求高, L3級以上自動駕駛需要復(fù)數(shù)種類的傳感器實現(xiàn)傳感器冗余,包括:612顆單目攝像頭、312臺毫米波雷達(dá)、5臺以內(nèi)的激光雷達(dá)等(不同方案配置側(cè)重不同),因此產(chǎn)生的數(shù)據(jù)量極大( 估計L5級一天可產(chǎn)生數(shù)據(jù)量4000GB),在車輛高速行駛的情況下系統(tǒng)需要能夠快速對數(shù)據(jù)進(jìn)行處理;2)汽車平臺同樣是由電池供電,因此對于計算單元功耗有較高的要求,早期計算平臺功耗大、產(chǎn)熱也較大,對于系統(tǒng)的續(xù)航及穩(wěn)定性都有
30、較大的印象;3)汽車電子需要滿足ASIL-D車規(guī)級電子產(chǎn)品設(shè)計標(biāo)準(zhǔn),而使自動駕駛所需要的中央處理器達(dá)到ASIL-D級設(shè)計標(biāo)準(zhǔn)難度更大。目前自動駕駛市場尚處于發(fā)展早期,市場環(huán)境不夠成熟,但以英偉達(dá)、Intel(Mobileye、Altera)等科技巨頭為代表的廠商已經(jīng)投入巨資在該領(lǐng)域開發(fā)出了相關(guān)的硬件產(chǎn)品及配套軟件技術(shù)。人工智能芯片創(chuàng)業(yè)公司應(yīng)該加強(qiáng)與OEMs、Tier1或產(chǎn)業(yè)聯(lián)盟合作為其提供AI芯片+軟件工具鏈的全套解決方案。AI 芯片用于自動駕駛之后,對傳統(tǒng)的汽車電子市場沖擊較大,傳統(tǒng)的汽車電子巨頭(恩智浦、英飛凌、意法半導(dǎo)體、瑞薩)雖然在自動駕駛芯片市場有所斬獲,但風(fēng)頭遠(yuǎn)不及英特爾、英偉達(dá)、
31、高通甚至是特斯拉。國內(nèi)初創(chuàng)企業(yè)如地平線、眼擎科技、寒武紀(jì)也都在積極參與。在自動駕駛芯片領(lǐng)域進(jìn)展最快以及競爭力最強(qiáng)的是英特爾和英偉達(dá),英特爾強(qiáng)在能耗,英偉達(dá)則在算力和算法平臺方面優(yōu)勢明顯。英特爾進(jìn)入自動駕駛芯片市場雖然較晚,但通過一系列大手筆收購確立了其在自動駕駛市場上的龍頭地位。2016 年,公司出資 167 億美元收購了 FPGA 龍頭 Altera;2017 年 3 月以 153 億美元天價收購以色列 ADAS 公司 Mobileye,該公司憑借著 EyeQ 系列芯片占據(jù)了全球 ADAS 70%左右的市場,為英特爾切入自動駕駛市場創(chuàng)造了條件。收購?fù)瓿芍螅⑻貭栃纬闪送暾淖詣玉{駛云到端的
32、算力方案英特爾凌動/至強(qiáng)+Mobileye EyeQ+Altera FPGA。英特爾收購 Mobileye 之后,后者也直接推出了 EyeQ5,支持 L4-L5 自動駕駛,預(yù)計在 2020 年量產(chǎn)。英偉達(dá)在汽車AI芯片的競爭中不落下風(fēng)。英偉達(dá)在2015年推出了世界首款車載超級計算機(jī)Drive PX,緊接著 2016 年推出 Drive PX2,2018 年推出新一代超級計算機(jī) Drive Xavier,同年,基于雙 Drive Xavier 芯片針對自動駕駛出租車業(yè)務(wù)的 Drive PX Pegasu 計算平臺面世。2019 CES 上,英偉達(dá)推出了全球首款商用 L2+自動駕駛系統(tǒng) NVIDI
33、A DRIVE AutoPilot。DRIVE AutoPilot 的核心是 Xavier 系統(tǒng)級芯片。該芯片處理器算力高達(dá)每秒 30 萬億次,已經(jīng)投產(chǎn)。4、安防安防市場是全球及國內(nèi) AI 最為確定以及最大的市場,尤其是 AI 中的圖像識別和視頻處理技術(shù)正在全面影響安防產(chǎn)業(yè)。其中,在安防產(chǎn)品中,攝像頭、交換機(jī)、IPC(網(wǎng)絡(luò)攝像機(jī))、硬盤刻錄機(jī)、各類服務(wù)器等設(shè)備都需要芯片,這些芯片也決定了整個安防系統(tǒng)的整體功能、技術(shù)指標(biāo)、能耗以及成本。在安防芯片中,最為關(guān)注的還是四類與監(jiān)控相關(guān)的芯片(ISP 芯片、DVR SoC 芯片、IPC SoC芯片、NVR SoC 芯片)。ISP 芯片(Image Sig
34、nal Processing,圖像信號處理)主要負(fù)責(zé)對前端攝像頭所采集的原始圖像信號進(jìn)行處理;DVR(DigitalVideoRecorder,數(shù)字硬盤錄像機(jī))SoC 芯片主要用于模擬音視頻的數(shù)字化、編碼壓縮與存儲;IPC (IP Camera,IP 攝像機(jī))SoC 芯片通常集成了嵌入式處理器(CPU)、圖像信號處理(ISP)模塊、視音頻編碼模塊、網(wǎng)絡(luò)接口模塊等,具備入侵探測、人數(shù)統(tǒng)計、車輛逆行、丟包檢測等一些簡單的視頻分析功能;NVR (Network Video Recorder,網(wǎng)絡(luò)硬盤錄像機(jī)) SoC 芯片主要用于視頻數(shù)據(jù)的分析與存儲,功能相對單一,但由于多與 IPC 聯(lián)合使用,市場增
35、長也較快。通常情況下,安防視頻監(jiān)控模擬攝像機(jī)的核心部件包括一顆圖像傳感器和一顆 ISP 芯片,安防視頻監(jiān)控網(wǎng)絡(luò)攝像機(jī)的核心部件包括一顆圖像傳感器和一顆 IPC SoC 芯片。單從國內(nèi)來看,未來國內(nèi)視頻監(jiān)控行業(yè)增速仍將保持 12%-15%左右的水平增長,其中網(wǎng)絡(luò)監(jiān)控設(shè)備增長更為迅速,相關(guān)芯片產(chǎn)品需求十分旺盛。安防 AI 芯片市場上,除了傳統(tǒng)芯片以及安防廠商,還有大量的創(chuàng)業(yè)企業(yè)在涌入。國外芯片廠商主要有英偉達(dá)、英特爾、安霸、TI、索尼、特威、三星、谷歌等;國內(nèi)廠商主要有海思(華為)、國科微、中星微、北京君正、富瀚微、景嘉微、寒武紀(jì)、深鑒科技、云天勵飛、中科曙光等。英偉達(dá)、英特爾等企業(yè)憑借著通用處理
36、器以及物聯(lián)網(wǎng)解決方案的優(yōu)勢,長期與安防巨頭如???、大華、博世等保持緊密聯(lián)系;國內(nèi)寒武紀(jì)、地平線、云天勵飛等企業(yè),都有 AI 芯片產(chǎn)品面世,海思本身就有安防攝像機(jī) SoC 芯片,在新加入 AI 模塊之后,競爭力進(jìn)一步提升。從安防行業(yè)發(fā)展的趨勢來看,隨著 5G 和物聯(lián)網(wǎng)的快速落地,“云邊結(jié)合”將是行業(yè)最大的趨勢,云端芯片國內(nèi)企業(yè)預(yù)計很難有所突破,但是邊緣側(cè)尤其是視頻處理相關(guān) AI 芯片還是有較大潛力,國產(chǎn)化替代將加速。但也看到,AI 芯片離在安防領(lǐng)域?qū)崿F(xiàn)大規(guī)??焖俾涞厝杂芯嚯x。除了功耗和算力約束外,工程化難度大也是困擾行業(yè)的重要因素,尤其是在安防這種產(chǎn)業(yè)鏈長而高度碎片化的產(chǎn)業(yè),新技術(shù)落地需要長時間
37、的積累與打磨,以及人力資源的不斷投入。5、智能家居智能家居近年來也成為人工智能重要的落地場景。從技術(shù)應(yīng)用上講,人類 90%的信息輸出是通過語音,80%的是通過視覺,智能家居領(lǐng)域應(yīng)用最多的就是智能語音交互技術(shù)。近年來,正是看到語音交互技術(shù)與智能家居深度融合的潛力,谷歌、蘋果、微軟均將其作為進(jìn)入智能家居領(lǐng)域的重要切入口,發(fā)布了多款軟硬件平臺,如亞馬遜推出的智能音箱設(shè)備。國內(nèi)智能語音龍頭企業(yè)科大訊飛較早就切入了該領(lǐng)域,聯(lián)合地產(chǎn)商推出了硬件平臺魔飛(MORFEI)平臺,電視、咖啡機(jī)、電燈、空調(diào)、熱水器等產(chǎn)品都能通過融入相關(guān)平臺實現(xiàn)智能化。當(dāng)前,無論是智能音箱還是其他智能家居設(shè)備,智能功能都是在云端來實
38、現(xiàn),但云端存在著語音交互時延的問題,對網(wǎng)絡(luò)的需求限制了設(shè)備的使用空間,而且由此還帶來了數(shù)據(jù)與隱私危機(jī)。為了讓設(shè)備使用場景不受局限,用戶體驗更好,端側(cè)智能已成為一種趨勢,語音 AI 芯片也隨之切入端側(cè)市場。國內(nèi)主要語音技術(shù)公司憑借自身在語音識別、自然語言處理、語音交互設(shè)計等技術(shù)上的積累,開始轉(zhuǎn)型做 AI 語音芯片集成及提供語音交互解決方案,包括云知聲、出門問問、思必馳以及 Rokid。市場上主流的 AI 語音芯片,一般都內(nèi)置了為語音識別而優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)加速方案,以實現(xiàn)語音離線識別。隨著算法的精進(jìn),部分企業(yè)的語音識別能力得到了較快提升,尤其是在遠(yuǎn)場識別、語音分析和語義理解等方面都取得了重要進(jìn)展
39、。云知聲在 2018 年 5 月,推出語音 AI 芯片雨燕,并在研發(fā)多模態(tài)芯片,以適應(yīng)物聯(lián)網(wǎng)場景,目前公司芯片產(chǎn)品已經(jīng)廣泛用于智能家電如空調(diào)之中;出門問問也在 2018 年推出了 AI 語音芯片模組“問芯”MobvoiA1;Rokid 也發(fā)在 2018 年發(fā)布了 AI 語音芯片 KAMINO18;思必馳利用其聲紋識別等技術(shù)優(yōu)勢,2019 年初推出基于雙 DSP 架構(gòu)的語音處理專用芯片 TH1520,具有完整語音交互功能,能實現(xiàn)語音處理、語音識別、語音播報等功能。由于語音芯片市場過于細(xì)碎,需要企業(yè)根據(jù)場景和商業(yè)模式需要設(shè)計出芯片產(chǎn)品,這對傳統(tǒng)的通用芯片企業(yè)的商業(yè)模式是一種顛覆,以致于在 2018
40、 年以前都很少有芯片巨頭進(jìn)入該領(lǐng)域,這也給了國內(nèi)語音芯片企業(yè)較大的施展空間。而對算法公司來說,通過進(jìn)入芯片市場,進(jìn)而通過解決方案直接面向客戶和應(yīng)用場景,通過實戰(zhàn)數(shù)據(jù)來訓(xùn)練和優(yōu)化算法。6、機(jī)器人機(jī)器人是人工智能行業(yè)最早的落地形態(tài),也是現(xiàn)在和將來重要的應(yīng)用方向。機(jī)器人主要包括兩類制造環(huán)境下的工業(yè)機(jī)器人和非制造環(huán)境下的服務(wù)機(jī)器人。工業(yè)機(jī)器人主要是面向工業(yè)領(lǐng)域的多關(guān)節(jié)機(jī)械手或多自由度機(jī)器人。服務(wù)機(jī)器人則是除工業(yè)機(jī)器人之外的、用于非制造業(yè)并服務(wù)于人類的各種先進(jìn)機(jī)器人。隨著云物移大智等信息及智能化技術(shù)的發(fā)展,機(jī)器人在某些領(lǐng)域的工作效率高于人類,并在工業(yè)和服務(wù)場景中得到了大量應(yīng)用。據(jù)國際機(jī)器人聯(lián)盟統(tǒng)計,20
41、17 年,全球工業(yè)機(jī)器人產(chǎn)量達(dá)到 38.1 萬臺,同比增長 30%,預(yù)計 2018-2021 年全球工業(yè)機(jī)器人產(chǎn)量將保持 10%以上增速增長,2021 年產(chǎn)量預(yù)計將達(dá)到 63.0 萬臺。中國是全球最大的工業(yè)機(jī)器人生產(chǎn)國,2017 年產(chǎn)量達(dá)到 13.79 萬臺,同比大幅增長 60%。服務(wù)機(jī)器人主要用于物流、防務(wù)、公共服務(wù)、醫(yī)療等領(lǐng)域,雖然規(guī)模不大,但是增長迅速。2017 年全球產(chǎn)量為 10.95 萬臺,同比大幅增長 85%。預(yù)計 2018 年全球?qū)I(yè)服務(wù)機(jī)器人產(chǎn)量將達(dá)到 16.53 萬臺,同比增長 32%,2019-2021 年平均增速將保持在 21%左右。機(jī)器人尤其是國內(nèi)產(chǎn)業(yè)規(guī)模的快速擴(kuò)大,將
42、大幅帶動國內(nèi)機(jī)器人相關(guān)智能芯片產(chǎn)業(yè)的發(fā)展。機(jī)器人由控制、傳感、驅(qū)動和電源四大裝置構(gòu)成,其中控制裝置是機(jī)器人的“大腦”,核心是 AI 芯片。機(jī)器人芯片需要具備強(qiáng)大的數(shù)據(jù)計算、自主判斷思考和執(zhí)行能力,國外廠商如高通、英特爾、英偉達(dá)都在積極部署該領(lǐng)域,國內(nèi)企業(yè)目前處于追趕狀態(tài),相關(guān)企業(yè)包括瑞芯微、珠海全志、炬力等。三、AI芯片行業(yè)產(chǎn)業(yè)鏈及商業(yè)模式半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈長,具有資本和技術(shù)壁壘雙高的行業(yè)特點(diǎn)半導(dǎo)體行業(yè)產(chǎn)業(yè)鏈從上游到下游大體可分為:設(shè)計軟件(EDA)、設(shè)備、材料(晶圓及耗材)、IC設(shè)計、代工、封裝等。Fabless與IDM廠商負(fù)責(zé)芯片設(shè)計工作,其中IDM廠商是指集成了設(shè)計、制造、封裝、銷售等全流
43、程的廠商,一般是一些科技巨頭公司,F(xiàn)abless廠商相比IDM規(guī)模更小,一般只負(fù)責(zé)芯片設(shè)計工作。分工模式(Fabless-Foundry)的出現(xiàn)主要是由于芯片制程工藝的不斷發(fā)展,工藝研發(fā)費(fèi)用及產(chǎn)線投資升級費(fèi)用大幅上升導(dǎo)致一般芯片廠商難以覆蓋成本,而 Foundry廠商則是統(tǒng)一對Fabless和IDM的委外訂單進(jìn)行流片,形成規(guī)?;a(chǎn)優(yōu)勢,保證盈利的同時不斷投資研發(fā)新的制程工藝,是摩爾定律的主要推動者。當(dāng)前在半導(dǎo)體產(chǎn)業(yè)鏈中,我國在上游軟件、設(shè)備、高端原材料以及代工制造與全球一線廠商差距較大,而在封裝環(huán)節(jié)擁有長電、華天、通富微等行業(yè)前十企業(yè),今年來在IC設(shè)計領(lǐng)域也逐漸涌現(xiàn)了以海思為代表的一批優(yōu)秀企
44、業(yè)。半導(dǎo)體行業(yè)商業(yè)模式主要可分為:IP授權(quán)與流片生產(chǎn)模式行業(yè)主要存在兩種商業(yè)模式IP授權(quán)和流片模式。其中在IP授權(quán)模式中,IP設(shè)計公司將自己設(shè)計的芯片功能單元,如:CPU、GPU、DSP、NPU等,授權(quán)給其他的IC設(shè)計公司,如華為海思麒麟970、980芯片獲得了寒武紀(jì)NPU的IP授權(quán)。被授權(quán)方將會向授權(quán)方支付一筆授權(quán)費(fèi)來獲得IP,并在最終芯片產(chǎn)品銷售中,以芯片最終售價的1%3%向授權(quán)方支付版稅。授權(quán)費(fèi)用實現(xiàn)IP開發(fā)成本的覆蓋,而版稅作為IP設(shè)計公司的盈利。但正如手機(jī)芯片市場,優(yōu)質(zhì)的IP資源往往集中在科技巨頭手中,擁有單一或少量IP的創(chuàng)業(yè)公司往往因為自身IP競爭力不足、或是難以提供具有綜合競爭力
45、的完整解決方案而最終落得被收購或退出市場的境地。流片生產(chǎn)模式雖然前期投入較大,但一款成功的產(chǎn)品將會使公司獲得豐厚的利潤,一般芯片產(chǎn)品定價采取8:20原則,即硬件成本:最終產(chǎn)品售價=8:20。該比率可能會隨廠商對市場話語權(quán)不同而上下波動,因此一款成功的芯片銷售毛利應(yīng)在60%以上。但公司是否能夠最終實現(xiàn)盈利,還需要在毛利中進(jìn)一步扣除前期研發(fā)費(fèi)用。芯片設(shè)計需要廠商承擔(dān)昂貴的EDA費(fèi)用及高昂的人力成本芯片整體設(shè)計制造流程大體包括:1)IC設(shè)計公司進(jìn)行芯片架構(gòu)設(shè)計,2)將設(shè)計完成的芯片“圖紙”文件交由Foundry廠商進(jìn)行流片,3)裸片將會交由OSAT廠商進(jìn)行封裝,4)產(chǎn)品銷售。研發(fā)費(fèi)用主要包括:研發(fā)團(tuán)
46、隊人力成本、EDA軟件及IP授權(quán)費(fèi)用及其他場地租金、水電費(fèi)用等。其中,人力成本占研發(fā)成本主要部分,項目開發(fā)效率與資深工程師數(shù)量正相關(guān),國內(nèi)資深芯片設(shè)計工程師年薪一般在50100萬元之間。EDA工具是芯片設(shè)計工具,是發(fā)展超大型集成電路的基石,EDA工具可有效提升產(chǎn)品良率。目前,該領(lǐng)域被海外廠商高度壟斷,CR3大于70%。EDA廠商主要是通過向IC設(shè)計公司進(jìn)行軟件授權(quán)獲取盈利,根據(jù)調(diào)研,20人的研發(fā)團(tuán)隊設(shè)計一款芯片所需要的EDA工具采購費(fèi)用在100萬美元/年左右(包括EDA和LPDDR等IP購買成本)。英偉達(dá)開發(fā)Xavier,動用了2000個工程師,開發(fā)費(fèi)用共計20以美金,Xlinix ACAP動
47、用了1500個工程師,開發(fā)費(fèi)用總共10億美金。芯片設(shè)計技術(shù)積累+市場洞察力=芯片產(chǎn)品市場推廣成功與否在IP授權(quán)和流片生產(chǎn)兩大類商業(yè)模式中,IP授權(quán)由于不涉及芯片制造,僅需要考慮研發(fā)費(fèi)用,資金占用相對小、風(fēng)險較低。流片除前期的研發(fā)投入以外,還需要向代工廠支付巨額的代工費(fèi)用,對資金占用極大,需要芯片銷售達(dá)到一定量級才能分?jǐn)偟羟捌诰揞~投入實現(xiàn)盈利,若期間出現(xiàn)流片失敗(即流片未達(dá)設(shè)計期望性能指標(biāo))或者市場推廣失利等情況,芯片設(shè)計廠商需要承擔(dān)前期巨額的研發(fā)和制造投入、費(fèi)用損失。芯片單位硬件成本主要包含掩膜、封裝、測試和晶圓成本,并受到制程工藝、產(chǎn)量、芯片面積等多因素的影響。我們簡要測算16nm制程工藝下
48、,不同產(chǎn)量不同面積的芯片單位成本,可以看出芯片單位硬件成本隨芯片面積、產(chǎn)量上升逐漸下降。因此,一款芯片能否獲得廣大的市場認(rèn)可,并擁有較長的產(chǎn)品生命周期,實現(xiàn)芯片產(chǎn)品的規(guī)模銷售和生產(chǎn)顯著決定了企業(yè)的盈虧情況。四、國內(nèi)外AI芯片企業(yè)融資概況從2012年開始,英偉達(dá)將其GPU產(chǎn)品應(yīng)用于AI并行運(yùn)算應(yīng)用中,人們意識到了AI芯片的巨大潛力,傳統(tǒng)半導(dǎo)體行業(yè)巨頭、科技巨頭和眾多創(chuàng)業(yè)團(tuán)隊紛紛加入到該領(lǐng)域的產(chǎn)品研發(fā)中來。國內(nèi)創(chuàng)業(yè)公司多成立于15年以后,從2017年開始大量的AI計算芯片產(chǎn)品陸續(xù)發(fā)布,產(chǎn)品逐步開始實現(xiàn)落地。傳統(tǒng)的半導(dǎo)體巨頭和科技巨頭也在布局AI芯片領(lǐng)域,除自主研發(fā)以外,基于資金優(yōu)勢通過對外投資收購
49、優(yōu)質(zhì)資產(chǎn)及創(chuàng)業(yè)團(tuán)隊等手段加速自身的AI芯片業(yè)務(wù)發(fā)展,典型代表如Intel,大手筆收購了包括Altera、Nervana、Movidius以及Mobileye在內(nèi)的多家AI芯片企業(yè),阿里巴巴也通過先后投資、收購布局AI芯片的開發(fā)。國內(nèi)大量的AI芯片創(chuàng)業(yè)公司都是在2015-2017年成立,新增企業(yè)數(shù)量減少。資本方面,受到宏觀經(jīng)濟(jì)影響雖然行業(yè)內(nèi)投融資事件相比2017年同比增長了32%,但行業(yè)整體投融資金額驟減,但頭部企業(yè)在依然持續(xù)獲得投資人青睞,多家企業(yè)創(chuàng)造了估值新高。五、國內(nèi)外 AI 芯片廠商概覽1、整體排名近年來,各類勢力均在發(fā)力 AI 芯片,參與者包括傳統(tǒng)芯片設(shè)計、IT 廠商、技術(shù)公司、互聯(lián)網(wǎng)
50、以及初創(chuàng)企業(yè)等,產(chǎn)品覆蓋了 CPU、GPU、FPGA 、ASIC 等。在市場調(diào)研機(jī)構(gòu) Compass Intelligence 發(fā)布的 AI Chipset Index TOP24 榜單中,前十依然是歐美韓日企業(yè),國內(nèi)芯片企業(yè)如華為海思、聯(lián)發(fā)科、Imagination(2017 年被中國資本收購)、寒武紀(jì)、地平線機(jī)器人等企業(yè)進(jìn)入該榜單,其中華為海思排 12 位,寒武紀(jì)排 23 位,地平線機(jī)器人排 24 位。2、芯片企業(yè)芯片設(shè)計企業(yè)依然是當(dāng)前 AI 芯片市場的主要力量,包括英偉達(dá)、英特爾、AMD、高通、三星、恩智浦、博通、華為海思、聯(lián)發(fā)科、Marvell(美滿)、賽靈思等,另外,還包括不直接參與
51、芯片設(shè)計,只做芯片 IP 授權(quán)的 ARM 公司。其中,英偉達(dá)、英特爾競爭力最為強(qiáng)勁。英偉達(dá):AI 芯片市場的領(lǐng)導(dǎo)者,計算加速平臺廣泛用于數(shù)據(jù)中心、自動駕駛等場景英偉達(dá)創(chuàng)立于 1993 年,最初的主業(yè)為顯卡和主板芯片組。其主板芯片組主要客戶以前是 AMD,但是在 AMD 收購 ATI 推出自研芯片組之后,英偉達(dá)在該領(lǐng)域的優(yōu)勢就蕩然無存。于是,公司全面轉(zhuǎn)向到 GPU 技術(shù)研發(fā),同時進(jìn)入人工智能領(lǐng)域。2012 年,公司神經(jīng)網(wǎng)絡(luò)技術(shù)在其 GPU 產(chǎn)品的支持下取得重大進(jìn)展,并在計算機(jī)視覺、語音識別、自然語言處理等方面得到廣泛應(yīng)用。2016 年,全球人工智能發(fā)展加速,英偉達(dá)迅速推出了第一個專為深度學(xué)習(xí)優(yōu)化
52、的 Pascal GPU。2017年,英偉達(dá)又推出了性能相比 Pascal 提升 5 倍的新 GPU 架構(gòu) Volta,同時推出神經(jīng)網(wǎng)絡(luò)推理加速器TensorRT 3。至此,英偉達(dá)完成了算力、AI 構(gòu)建平臺的部署,也理所當(dāng)然成為這一波人工智能熱潮的最大受益者和領(lǐng)導(dǎo)者。公司的戰(zhàn)略方向包括人工智能和自動駕駛。人工智能方面,英偉達(dá)面向人工智能的產(chǎn)品有兩類,Tesla 系列 GPU 芯片以及 DGX 訓(xùn)練服務(wù)器。Tesla 系列是專門針對 AI 深度學(xué)習(xí)算法加速設(shè)計 GPU 芯片,DGX 則主要是面向 AI 研究開發(fā)人員設(shè)計的工作站或者超算系統(tǒng)。2018 年,公司包含這兩款產(chǎn)品的數(shù)據(jù)中心業(yè)務(wù)收入大幅增
53、長 52%,其中Tesla V100 的強(qiáng)勁銷售是其收入的主要來源。自動駕駛方面。英偉達(dá)針對自動駕駛等場景,推出了 Tegra 處理器,并提供了自動駕駛相關(guān)的工具包。2018 年,基于 Tegra 處理器,英偉達(dá)推出了 NVIDIA DRIVE AutoPilot Level 2+,并贏得了豐田、戴姆勒等車企的自動駕駛訂單。同時,2018 年,公司也正在積極推動 Xavier 自動駕駛芯片的量產(chǎn)。值得關(guān)注的是,英偉達(dá)還正在通過投資和并購方式繼續(xù)加強(qiáng)在超算或者數(shù)據(jù)中心方面的業(yè)務(wù)能力。2019 年 3 月,英偉達(dá)宣稱將斥資 69 億美元收購 Mellanox。Mellanox 是超算互聯(lián)技術(shù)的早期
54、研發(fā)和參與者。通過與 Mellanox 的結(jié)合,英偉達(dá)將具備優(yōu)化數(shù)據(jù)中心網(wǎng)絡(luò)負(fù)載能力的能力,其 GPU 加速解決方案在超算或者數(shù)據(jù)中心領(lǐng)域的競爭力也將得到顯著提升。英特爾加速向數(shù)字公司轉(zhuǎn)型,通過并購+生態(tài)優(yōu)勢發(fā)力人工智能英特爾作為傳統(tǒng)的 CPU 設(shè)計制造企業(yè),在傳統(tǒng) PC、服務(wù)器市場有著絕對的統(tǒng)治力。隨著互聯(lián)網(wǎng)時代的到來以及個人電腦市場的飽和,公司也在開始加快向數(shù)字公司轉(zhuǎn)型。尤其在人工智能興起之后,英特爾憑借著技術(shù)和生態(tài)優(yōu)勢,打造算力平臺,形成全棧式解決方案。英特爾主要產(chǎn)品為 CPU、FPGA 以及相關(guān)的芯片模組。雖然 CPU 產(chǎn)品在訓(xùn)練端的應(yīng)用效率不及英偉達(dá),但推理端優(yōu)勢較為明顯。英特爾認(rèn)為
55、,未來 AI 工作周期中,推理的時長將是訓(xùn)練時長的 5 倍甚至 10 倍,推理端的芯片需求也會放量。同時,即使是云端訓(xùn)練,GPU 也需要同 CPU 進(jìn)行異構(gòu)。目前,英特爾在人工智能芯片領(lǐng)域主要通過三條路徑:1)通過并購快速積累人工智能芯片相關(guān)的技術(shù)和人才,并迅速完成整合。英特爾在收購了 Altera 后,還先后收購了 Nervana、Movidius 與 Mobileye等初創(chuàng)企業(yè)。在完成上述一系列并購之后,英特爾設(shè)立了 AI 事業(yè)群,整合了 Xeon、Xeon Phi、Nervana、Altera、Movidius 等業(yè)務(wù)和產(chǎn)品,同時將原有的自動駕駛業(yè)務(wù)板塊并入 Mobileye。2)建立多
56、元的產(chǎn)品線。目前,英特爾正建構(gòu)滿足高性能、低功耗、低延遲等差異化芯片解決方案,除了 Xeon 外,包括可支持云端服務(wù) Azure 的 Movidius VPU 與 FPGA。3)通過計算平臺等產(chǎn)品,提供強(qiáng)大的整合能力,優(yōu)化 AI 計算系統(tǒng)的負(fù)載,提供整體解決方案。在英特爾收購的這些企業(yè)中,除了前面已經(jīng)提到的 Altera、Mobileye 之外,Nervana 也非常值得關(guān)注。2016 年 8 月,英特爾斥資超過 3.5 億美元收購這家員工人數(shù)不超過 50 人的創(chuàng)業(yè)公司,但是經(jīng)過不到三年的成長,這家公司已經(jīng)成為英特爾 AI 事業(yè)部的主體。依托 Nervana,英特爾成功在 2017年 10 月
57、推出了專門針對機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)系列芯片,目前該芯片已經(jīng)升級至第二代,預(yù)計 下半年將正式量產(chǎn)上市,該芯片在云端上預(yù)計能和英偉達(dá)的 GPU 產(chǎn)品一較高下。3、IT 及互聯(lián)網(wǎng)企業(yè)AI 興起之后,互聯(lián)網(wǎng)及 IT 企業(yè)憑借著在各大應(yīng)用場景上技術(shù)和生態(tài)積累,也在積極拓展 AI 相關(guān)市場,其中 AI 芯片是部署重點(diǎn)之一。相較而言,互聯(lián)網(wǎng)企業(yè)憑借著數(shù)據(jù)和場景先天優(yōu)勢,在 AI 算法和芯片領(lǐng)域優(yōu)勢更為明顯,如美國谷歌、國內(nèi)的 BAT。IT 企業(yè)如 IBM,在人工智能領(lǐng)域較早開始研究,2018 年年中曾經(jīng)推出專門針對深度學(xué)習(xí)算法的原型芯片。谷歌:TPU 芯片已經(jīng)實現(xiàn)從云到端,物聯(lián)網(wǎng) TPU Edge 是當(dāng)前布局
58、重點(diǎn)谷歌可謂是 AI 芯片行業(yè)的一匹黑馬,但是競爭力強(qiáng)勁。谷歌擁有大規(guī)模的數(shù)據(jù)中心,起初同其他廠商的數(shù)據(jù)中心一樣,都采用 CPU+GPU 等異構(gòu)架構(gòu)進(jìn)行計算加速,用來完成圖像識別、語音搜索等計算服務(wù)。但是,隨著業(yè)務(wù)量的快速增長,傳統(tǒng)的異構(gòu)模式也很難支撐龐大的算力需求,需要探索新的高效計算架構(gòu)。同時,谷歌也需要通過研發(fā)芯片來拓展 AI 平臺 TensorFlow 的生態(tài)。因此,2016年,Google 正式發(fā)布了 TPU 芯片。從谷歌 TPU 的本質(zhì)來看,它是一款 ASIC(定制芯片),針對 TensorFlow 進(jìn)行了特殊優(yōu)化,因此該產(chǎn)品在其他平臺上無法使用。第一代 Cloud TPU 僅用于
59、自家云端機(jī)房,且已對多種 Google 官方云端服務(wù)帶來加速效果,例如 Google 街景圖服務(wù)的文字處理、Google 相簿的照片分析、甚至 Google搜尋引擎服務(wù)等。Cloud TPU 也在快速改版,2017 年推出第二代,2018 年推出第三代芯片 TPU 3.0。同時,谷歌對 TPU 的態(tài)度也更為開放,之前主要是自用,目前也在對用戶開放租賃業(yè)務(wù),但沒有提供給系統(tǒng)商。除了云端,谷歌針對邊緣端推理需求快速增長的趨勢,也在開發(fā)邊緣 TPU 芯片。2017 年 11 月,Google 推出輕量版的 TensorFlow Lite(某種程度取代此前的 TensorFlow Mobile),使得
60、能耗有限的移動設(shè)備也能支持TensorFlow,推出的Edge TPU芯片即是以執(zhí)行TensorFlow Lite為主,而非 TensorFlow。Edge TPU 性能雖然遠(yuǎn)不如 TPU,但功耗及體積大幅縮小,適合物聯(lián)網(wǎng)設(shè)備采用。Edge TPU 可以自己運(yùn)行計算,不需要與多臺強(qiáng)大計算機(jī)相連,可在傳感器或網(wǎng)關(guān)設(shè)備中與標(biāo)準(zhǔn)芯片或微控制器共同處理 AI 工作。按照谷歌的規(guī)劃,Edge TPU 將提供給系統(tǒng)商,開放程度將進(jìn)一步提升。如果 Edge TPU 推廣順利,支持的系統(tǒng)伙伴將進(jìn)一步增多,谷歌將盡快推出下一代 Edge TPU 產(chǎn)品。即使推廣不順利,Google也可能自行推出 Edge 網(wǎng)關(guān)、
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京2024年12月國家藥品監(jiān)督管理局高級研修學(xué)院招考1名編制外人員筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- 4.1中國的機(jī)遇與挑戰(zhàn)課件- -2024-2025學(xué)年統(tǒng)編版道德與法治九年級下冊
- 中國海油2025屆校園招聘統(tǒng)一考試筆試參考題庫附帶答案詳解
- 3.1《中國擔(dān)當(dāng)》教學(xué)設(shè)計- 2024-2025學(xué)年統(tǒng)編版道德與法治九年級下冊
- 安徽省淮南市潘集區(qū)屆2025屆數(shù)學(xué)三下期末調(diào)研模擬試題含解析
- 合肥科技職業(yè)學(xué)院《生物化學(xué)1》2023-2024學(xué)年第二學(xué)期期末試卷
- 江蘇省揚(yáng)州市2025屆三下數(shù)學(xué)期末經(jīng)典模擬試題含解析
- 山東理工職業(yè)學(xué)院《技術(shù)軟件應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣西科技大學(xué)《無形資產(chǎn)評估》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西省呂梁地區(qū)方山縣2024-2025學(xué)年小升初數(shù)學(xué)綜合練習(xí)卷含解析
- 小兒白血病飲食
- 2024年杭州科技職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫及答案解析
- JGJ79-2012 建筑地基處理技術(shù)規(guī)范
- LIMS實驗室信息管理系統(tǒng)
- 柱塞泵工作原理動畫演示
- 數(shù)字法學(xué)原理
- 玉米收購可行性分析報告
- 最全醫(yī)院應(yīng)急預(yù)案匯編目錄
- 駕駛員心理健康教育培訓(xùn)課件
- 別墅的價格評估報告
- 滬科版七年級數(shù)學(xué)下冊 第六章 實數(shù) 單元測試卷
評論
0/150
提交評論