好用的車載AI芯片該如何設(shè)計與定義

上傳人：1*** IP屬地：湖南上傳時間：2024-09-19 格式：DOCX 頁數(shù)：24 大小：578.89KB 積分：16 舉報 版權(quán)申訴

已閱讀5頁，還剩19頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

當(dāng)前，在域控制器集中式架構(gòu)階段，智能駕駛和智能座艙是車載AI芯片的兩個重要應(yīng)用領(lǐng)域。充分挖掘在這兩個場景下的應(yīng)用需求是車載AI芯片廠商的核心驅(qū)動力。新算法模型的引入，以及整車EE架構(gòu)的發(fā)展，都會對車載AI芯片的迭代產(chǎn)生較大的影響。不管是智能座艙，還是智能駕駛，所應(yīng)用的算法模型都在不斷地變化和演進，尤其是在智能駕駛領(lǐng)域，更為明顯，從先前的CNN網(wǎng)絡(luò)演進到現(xiàn)在的BEV+Transformer+OCC網(wǎng)絡(luò)，促使車載AI芯片向適應(yīng)更新的算法模型的架構(gòu)方向進化。

車載AI芯片的迭代與整車EE架構(gòu)的演進相互協(xié)同發(fā)展。在域控制器集中式架構(gòu)階段，車載AI芯片基本都是針對特定功能域下的應(yīng)用場景去設(shè)計和開發(fā)，比如，智能座艙或智能駕駛。隨著整車EE架構(gòu)進入跨域融合階段，“艙駕融合”成為重點的關(guān)注方向，芯片廠商需要兼顧智能座艙和智能駕駛的應(yīng)用需求，設(shè)計出一款高度適配“艙駕一體”的車載AI芯片。一、新的算法模型對車載AI芯片的影響當(dāng)前，在智能駕駛領(lǐng)域，頭部車企在城區(qū)NOA方面開始“攻城略地”，“BEV+Transformer”已成為實現(xiàn)這一戰(zhàn)略目標(biāo)的主要技術(shù)手段；在智能座艙領(lǐng)域，生成式AI大模型被逐漸引入，用來強化艙內(nèi)的AI視覺和語音等人機交互體驗。因此，在車載AI芯片上所運行算法的復(fù)雜度、模型參數(shù)以及數(shù)據(jù)規(guī)模均會大幅上升，倒逼車載AI芯片向新架構(gòu)、大算力等方向演進。但是，新的算法模型與傳統(tǒng)的芯片架構(gòu)之間存在著一定的“隔閡”，比如，不少業(yè)內(nèi)人士反映，Transformer網(wǎng)絡(luò)在一些車載AI芯片上很難部署，主要原因在于過去傳統(tǒng)端側(cè)的AI芯片主要是針對CNN網(wǎng)絡(luò)去設(shè)計開發(fā)，通用性比較差，對于Transformer等較新的算法模型適應(yīng)性較弱。

針對這一問題，奕行智能創(chuàng)始人兼CEO劉琿回答說：“首先，Transformer和CNN兩者計算類型完全不同。CNN屬于計算密集型網(wǎng)絡(luò)，整個網(wǎng)絡(luò)是非常規(guī)整的、一層層的卷積操作，每層里若干通道的卷積核作為權(quán)重是可以被輸入特征共享的存儲數(shù)據(jù)。

“Transformer屬于訪存密集型網(wǎng)絡(luò)，特點是算法模型里不規(guī)則形狀的張量多，需要大量矩陣操作的Transpose/Permute/Reshape等算子，體現(xiàn)在硬件上就是對片上內(nèi)存的容量和訪存帶寬的要求會比以CNN為目標(biāo)的加速芯片高很多。映射在計算里面的表現(xiàn)便是對訪存的來回操作，在內(nèi)存中搬運的次數(shù)會比較多。所以，是否能夠適應(yīng)Transformer模型，不僅要看AI芯片是否具備足夠的訪存容量，而且還要有足夠的訪存帶寬。訪存帶寬有多個層級，從計算內(nèi)核到L1，再到L2，以及把這些東西連接起來的總線，都是決定因素?！捌浯?，Transformer對于浮點算力的要求非常高，因為Transformer的Attention模塊是矩陣乘+Softmax，它其實是一個指數(shù)運算，對精度的要求非常高。傳統(tǒng)的AI芯片主要針對CNN網(wǎng)絡(luò)設(shè)計，可以通過Int8來完成，基本上沒有預(yù)留浮點算力。沒有浮點算力，對計算精度會造成很大的影響，所以浮點計算資源不足是過去很多AI芯片存在的問題之一。“最后，向量計算資源對于完成Transformer運算也非常重要。上面已經(jīng)提到Attention是一個矩陣乘+Softmax來回重復(fù)操作的過程。矩陣乘是比較規(guī)則的矩陣運算，Softmax屬于指數(shù)運算。而指數(shù)運算本質(zhì)上是向量運算，向量運算就需要用向量引擎去做，如果用矩陣運算單元去做向量運算，效率會很低，因此，需要有足夠的向量計算資源去支撐。”那么，Transformer算法模型容易在什么樣的芯片架構(gòu)上部署，或者說如何才能提高芯片對新的算法模型的適配度呢？1）專門增加相關(guān)的算法模型引擎?zhèn)鹘y(tǒng)AI推理專用芯片大多針對CNN/RNN網(wǎng)絡(luò)設(shè)計，普遍針對INT8精度，幾乎不考慮浮點運算，并行計算效果不佳。如果將Transformer網(wǎng)絡(luò)簡單量化為INT8精度后，整體的性能會顯著下降，主要是由于普通的激活函數(shù)量化策略無法覆蓋全部的取值區(qū)間。英偉達在設(shè)計GPU新架構(gòu)Hopper時，專門增加了Transformer引擎，即專門為Transformer算法做了硬件優(yōu)化，它集合了新的TensorCore、FP8和FP16精度計算，以及Transformer神經(jīng)網(wǎng)絡(luò)動態(tài)處理能力，旨在加速AI計算的效率。Transformer引擎能夠在訓(xùn)練神經(jīng)網(wǎng)絡(luò)的每個步驟中動態(tài)選擇神經(jīng)網(wǎng)絡(luò)中每一層所需的精度，可以協(xié)調(diào)動態(tài)范圍和準(zhǔn)確度，比如，可以根據(jù)工作負(fù)載在FP8和FP16格式之間進行自動切換，期望跑的每一步都只用最低精度需求，同時又不損失精度的情況下來訓(xùn)練模型，以期達到最高的效率。下一代車載AI芯片Thor便是采用這樣的GPU架構(gòu)。英偉達Transformer引擎工作原理示意圖（圖片來源：英偉達官網(wǎng)）2）針對特定算子進行優(yōu)化設(shè)計一款什么算法模型都支持的芯片也不太現(xiàn)實，如果這樣，成本一定高，研發(fā)周期一定長。那么，怎樣才能讓芯片盡可能多地去支持不同類型的網(wǎng)絡(luò)呢？安霸半導(dǎo)體研發(fā)副總裁孫魯毅談到：“Transformer模型的核心算子是Self-Attention和Cross-Attention，中間包含了一些計算類型，比如矩陣乘法、Softmax等。首先，要從原理上支持他們中間的各種計算；其次，芯片以及工具鏈要具備足夠的靈活性，后期便可以通過修改調(diào)整工具鏈，使得芯片在計算效率不下降的情況下去支持新的算法?！熬W(wǎng)絡(luò)模型的核心計算的地方集中在一些反反復(fù)復(fù)進行特定計算的操作上。正因為如此，才可以通過設(shè)計專門的芯片去提高效率。如果整個網(wǎng)絡(luò)都是亂序的，那么，專用處理器就沒法設(shè)計，只能做通用處理器了。因此，我們專門優(yōu)化了一些很重要的算子，比如，針對Transformer里面的矩陣計算以及一些非線性計算的算子進行優(yōu)化，來提高芯片對于一些特定網(wǎng)絡(luò)的計算效率?！?）適當(dāng)增大內(nèi)存帶寬，避免其成為計算的“瓶頸”在內(nèi)存帶寬的需求上，相比CNN，Transformer不僅模型更寬、更深、參數(shù)更多，其算子復(fù)雜度也更高，計算單元需要頻繁地從存儲單元中存取數(shù)據(jù)與指令，因此，Transformer網(wǎng)絡(luò)對于SRAM的利用率，對于內(nèi)部總線突發(fā)大帶寬訪問等方面提出了更高的要求。那么，到底需要多大的帶寬？某芯片公司研發(fā)工程師回答說：“這不能一概而論，算力、SRAM大小、算法模型類型都會導(dǎo)致對存儲帶寬產(chǎn)生不同的需求。因此，芯片設(shè)計也不可能按照最大帶寬來設(shè)計，否則芯片成本無法接受，需要依據(jù)具體的應(yīng)用需求做出合理規(guī)劃”4）因地制宜，不同的應(yīng)用場景適合不同的設(shè)計方式后摩智能聯(lián)合創(chuàng)始人&產(chǎn)品副總裁信曉旭說“Transformer在性能上雖然比CNN有了很大的提升，但我覺得它并不是整個自動駕駛算法的終局，將來一定還會出現(xiàn)新的算法模型，能夠更好地解決目前尚未解決的問題。在此情況下，如果把芯片做得過于專用化，可能在這一代芯片上，BEV/Transformer可以跑得很好，但當(dāng)新的網(wǎng)絡(luò)模型出來的時候，可能應(yīng)對起來就比較吃力?！艾F(xiàn)在，對于計算類芯片，大家的核心追求是計算效率。專用的芯片是基于算法定義芯片的方式，是其中一種提高計算效率的方式和手段。然而，自動駕駛是一個復(fù)雜的系統(tǒng)，在最開始做芯片設(shè)計時候，我們就需要能夠真正的理解自動駕駛的業(yè)務(wù)流，并能夠以此為導(dǎo)向來設(shè)計NPU：一定要從系統(tǒng)的維度去看，去設(shè)計，而不是簡單的拼積木的形式。更多的時候，從傳感器數(shù)據(jù)流進入系統(tǒng)開始，就要想著怎么設(shè)計才能讓系統(tǒng)更高效的運行?！耙虼耍谥邱{領(lǐng)域，不同的細(xì)分市場可能需要用不同的方式去定義和設(shè)計芯片。前視一體機方案適合采用‘算法定義芯片’的方式，因為前視一體機不需要實現(xiàn)太復(fù)雜的功能，通常也不會涉及到更先進的算法，這樣的方式能夠在最大程度上提高計算效率。對于高階智能駕場景，還有很多Cornercase尚未完全解決，大家在做芯片的時候就要考慮通用性，以及未來對新算法的適配性。芯片的底層設(shè)計要充分考慮上層應(yīng)用算法的發(fā)展，在提供足夠通用性的前提下，還要兼顧計算效率，這也是后摩智能當(dāng)時選擇做存算一體架構(gòu)的原因之一?！?）把NPU當(dāng)成AI處理器來設(shè)計，而不是簡單的AI加速器針對當(dāng)前最新流行的算法模型，愛芯元智聯(lián)合創(chuàng)始人&研發(fā)副總裁劉建偉認(rèn)為：“談到處理器，一般都會有指令集的概念，我們是把算子作為這些處理器的指令集，即所謂的算子集就是處理器的指令集。以前的NPU主要是針對CNN網(wǎng)絡(luò)去開發(fā)，如果是從設(shè)計加速器的角度去考慮，當(dāng)時會很容易陷入到只考慮CNN網(wǎng)絡(luò)模型的慣性思維中去。而我們是把‘到底需要什么樣算子’的需求分解到底層，相當(dāng)于直接去考慮處理器的指令集應(yīng)該如何設(shè)計。在這種情況下，當(dāng)BEV和Transformer出來之后，只需要增加一些BEV和Transformer相關(guān)的算子就可以。以這樣的思路去設(shè)計AI芯片，才能更好地兼顧通用性和靈活性。“首先，把NPU當(dāng)成一個AI處理器來設(shè)計，關(guān)注的是處理器的指令集。雖然網(wǎng)絡(luò)結(jié)構(gòu)變了，只是網(wǎng)絡(luò)里面的算子的組合方式不一樣，但是算子本身的變化沒有那么大?！捌浯?，新的算法模型出來，到底需要什么樣的算子？我們要做的事情是把這些算子實現(xiàn)好，讓算子在硬件上跑得足夠快。對算法工程師來講，只需要考慮這個硬件能支持哪些算子，怎樣才能讓這些算子在硬件上跑得快。隨著時間的推移，硬件和對應(yīng)算子的適配度會越來越高?！?）基于“軟件定義芯片”的理念去設(shè)計AI芯片要想設(shè)計好一款芯片，首先一定要深刻理解算法和軟件。一位業(yè)內(nèi)專業(yè)人士曾直言不諱的提到，為什么當(dāng)前一些AI芯片不能很好地適配最新的算法，最大的原因可能在于他們前期的市場調(diào)查做得不充分，前瞻算法的發(fā)展趨勢研究不透徹，導(dǎo)致設(shè)計出來的產(chǎn)品不具備有前瞻性，雖然能夠解決以前客戶提出的問題，但卻不一定能夠解決現(xiàn)在以及未來可能出現(xiàn)的問題。”在筆者看來，地平線就是一家奉行“軟件定義芯片”類似設(shè)計理念的公司。地平線智能駕駛產(chǎn)品規(guī)劃與市場總經(jīng)理呂鵬談到：“我們一直都是強調(diào)要‘從軟件中來，到軟件中去’的理念去設(shè)計芯片，以軟件驅(qū)動芯片的設(shè)計和創(chuàng)新的架構(gòu)設(shè)計去支撐整個軟件算法的開發(fā)。舉個例子，如果一家芯片公司沒有軟件的Know-How，設(shè)計芯片時沒有考慮清楚將來量產(chǎn)的時候最主流的算法會是什么，那么，一旦芯片量產(chǎn)后，運行當(dāng)時最先進、主流的算法的效率可能會非常低，因此，芯片便很難支撐先進的算法落地。從本質(zhì)上來說，征程6對Transformer高效的支持性能也是基于地平線對于算法的深刻理解而推演出來的結(jié)果。”征程6采用地平線新一代納什架構(gòu)BPU，原生支持Transformer網(wǎng)絡(luò)。針對Transformer網(wǎng)絡(luò)模型，地平線在J6上有幾個獨特的設(shè)計：a.強大的并行浮點算力：支持多線程并發(fā)的SIMTVectorProcessingUnit（VPU）；支持BF16/FP16/FP32多種浮點數(shù)據(jù)類型，在性能和精度之間取得更好的平衡。b.特別優(yōu)化的超越函數(shù)：支持Layer-norm&Softmax算子的硬件加速；支持Transpose&Reshape算子的硬件加速。Transformer模型中有一些非常關(guān)鍵的算子，雖然計算量不大，但復(fù)雜度很大。也就是說，計算量可能只占3%的算子，運行時間可能要占到10%~30%。因此，通過設(shè)計超越函數(shù)的算子，使得原本非常長的計算時間得到快速的縮減。c.采用全新的存儲系統(tǒng)設(shè)計，片上包括L0M、L1M、L2M，共三級存儲系統(tǒng)，用于數(shù)據(jù)緩沖和交換。同時，先進的總線架構(gòu)配合高帶寬的DDR，有效緩解內(nèi)存墻的問題。二、艙駕一體對車載AI芯片的影響1）為什么要做“艙駕一體”？當(dāng)前，主機廠大多處于域控制器集中式架構(gòu)階段。在以功能劃分的域控制器基礎(chǔ)上，為進一步降低成本和增強不同域之間的協(xié)同，出現(xiàn)了跨域融合，即將多個域融合到一起，比如，將動力域、底盤域以及車身域三者合并為整車控制域；將更高算力需求的座艙域和智駕域整合為“艙駕一體”計算域。黑芝麻智能高級市場產(chǎn)品總監(jiān)徐曉煜認(rèn)為：“隨著自動駕駛的部分功能成熟應(yīng)用并且相應(yīng)體驗得到市場和用戶的接受，智能化配置的裝配率會快速提高并快速趨同，隨之而來的行業(yè)挑戰(zhàn)就是如何在保證功能、性能等產(chǎn)品指標(biāo)的前提下優(yōu)化成本并讓不同定位的車型都可以標(biāo)配。

“行業(yè)共識的有效路徑就是對不同的系統(tǒng)作進一步的整合和集成，原本多個供應(yīng)商的多個硬件需要融合為一個系統(tǒng)、一套硬件，從而在域控制器本身、硬件材料、連接線材、軟件費用等多方面降低成本。

“現(xiàn)階段是一個恰逢其時的時間窗口，新型的電子電氣架構(gòu)為艙駕融合在整車層面提供了底座基礎(chǔ)，智駕和座艙的標(biāo)準(zhǔn)智能化也已逐漸趨向于成熟，同時，更重要的是芯片方面，新一代的高性能處理器已經(jīng)問世，新的架構(gòu)和技術(shù)可以更好地支持多功能的集成，從而可以更進一步將多芯片艙駕一體系統(tǒng)推向單芯片艙駕一體系統(tǒng)?！?）實現(xiàn)“艙駕一體”面臨的挑戰(zhàn)是什么？據(jù)相關(guān)業(yè)內(nèi)人士透露，在2025年左右，會有輕量級的單SoC芯片艙駕一體方案量產(chǎn)落地。但也有部分業(yè)內(nèi)人士沒有那么樂觀，他們認(rèn)為單SoC芯片艙駕一體方案量產(chǎn)落地可能不會那么快，還存在一些問題待解決。整體來講，艙駕一體肯定是大勢所趨，大家普遍對在這方面的布局也比較認(rèn)可?！芭擇{一體”面臨的挑戰(zhàn)，從技術(shù)角度，可以從硬件和軟件兩個維度來看：硬件層面對于芯片廠商而言，開發(fā)一款合適的艙駕一體SoC芯片本身就存在很大的挑戰(zhàn)。因為它需要將多個系統(tǒng)和功能融合在一起，并且還要能兼顧不同應(yīng)用場景的需求——有的重視響應(yīng)，需要及時反饋；有的側(cè)重安全，需要高穩(wěn)定可靠性；有的既要性能強，還要兼容軟件豐富，通用性好。

安霸半導(dǎo)體孫魯毅談到：“理想型的艙駕一體SoC需要在支持智能駕駛?cè)δ芨哓?fù)荷運行的時候，還要支持座艙內(nèi)的用戶交互和娛樂系統(tǒng)，這非常有挑戰(zhàn)性?！耙ＷC用戶交互和娛樂系統(tǒng)非常好的響應(yīng)速度和較強的3D圖像渲染能力，艙駕一體SoC不僅需要充足的內(nèi)存帶寬，而且對GPU和CPU的性能要求也比較高。除非艙駕一體SoC單芯片的總性能大于等于單獨的座艙SoC和智駕SoC這兩顆芯片性能之和，否則很難保證兩邊同時工作的效果。而且，兩邊的DRAM系統(tǒng)最好是分開的，互相不影響內(nèi)存帶寬和訪問延遲；另外，在GPU資源的使用上，座艙的娛樂系統(tǒng)和智駕系統(tǒng)最好也完全分開使用；如果AI計算使用專門的NPU，也要考慮是否被兩套系統(tǒng)共享?！薄暗@樣的芯片，成本和功耗自然都不會低，而且復(fù)雜度很高，出問題的概率也會增加。而且，座艙和智駕的功能安全需求等級不一致，如果兩邊都做成滿足智駕水平的功能安全等級，必然會抬高成本。如果兩邊按座艙的標(biāo)準(zhǔn)去做功能安全，智駕系統(tǒng)則存在安全性風(fēng)險。總之，單Soc芯片艙駕一體方案目前仍是一個值得探索但尚未被成功驗證的道路。”軟件層面座艙和智駕如何進行安全有效的隔離？智駕域的特點是高可靠性和低時延性；而座艙域更注重娛樂和用戶體驗，需要更豐富的功能和較高的OTA頻率。如何把兩個系統(tǒng)能進行很好的整合，保證不同任務(wù)的優(yōu)先級情況和不同功能安全等級的實現(xiàn)，這都存在很大的挑戰(zhàn)。目前座艙和智駕中相關(guān)模塊對功能安全的要求：智能座艙中控娛樂模塊需要達到ASILA等級，儀表模塊需要達到ASILB等級；智能駕駛泊車模塊至少需要達到ASILB等級，行車模塊需要達到ASILD等級。那么芯片底層的加速器資源針對這些不同功能安全等級的應(yīng)用如何進行有效隔離是很棘手的問題。對于單SoC艙駕一體方案，某Tier1智駕域控專家曾這樣說到：“座艙和智駕這兩種安全級別不一樣的軟件放在一起該如何共存？可以采用虛擬機的方式，也可以采用Container的方式。通過這些方式都可以在軟件層面上把不同的應(yīng)用隔離出來，但更大的問題在于隔離完以后該怎么辦？通訊怎么解決、調(diào)度怎么解決、資源怎么保證，把這些問題都解決好才是更具挑戰(zhàn)性的難題?！睆姆羌夹g(shù)層面來看，就是老生常談的一些問題了，比如缺乏行業(yè)技術(shù)標(biāo)準(zhǔn)，以及組織架構(gòu)不匹配等，但這些非技術(shù)問題解決起來的難度可能比技術(shù)問題更大。行業(yè)技術(shù)標(biāo)準(zhǔn)的問題對于自動駕駛系統(tǒng)來講，L0~L2有相應(yīng)的標(biāo)準(zhǔn)。但是高階自動駕駛尚處于演進過程中，業(yè)界沒有統(tǒng)一的標(biāo)準(zhǔn)：傳感器方案沒有統(tǒng)一，感知的數(shù)據(jù)格式不一致，那么，它對芯片處理架構(gòu)的需求不一樣?？上攵?，把高階自動駕駛和豐富的座艙功能進行跨域融合和打通，形成所謂的“艙駕一體”，在業(yè)內(nèi)更是沒有統(tǒng)一的技術(shù)和產(chǎn)品標(biāo)準(zhǔn)去約束?！芭擇{一體落地需要行業(yè)標(biāo)準(zhǔn)的推動，甚至需要強迫一些廠商逐漸把他們的軟件架構(gòu)打開。制定行業(yè)標(biāo)準(zhǔn)的目的就是把大家的利益統(tǒng)一起來，誰不跟著行業(yè)標(biāo)準(zhǔn)走，誰就會吃虧、掉隊，甚至面臨淘汰，這樣才能逐漸推動整個行業(yè)的發(fā)展和進步?！蹦砊ier1智駕域控專家介紹說。組織架構(gòu)方面的問題

針對艙泊行一體方案，研發(fā)部門的分工問題目前雖然已經(jīng)被大家普遍意識到了，解決問題需要芯片廠家、主機廠以及一級供應(yīng)商的通力協(xié)作。目前，在實施層面，主機廠的座艙和智駕項目大部分還依然是由兩個獨立的部門去完成，怎么能夠跨部門把這個項目去落地，需要有更符合方案需求、更具競爭力的產(chǎn)品以及全方位的技術(shù)支持來一起推動方案落地量產(chǎn)。

另外，目前大部分座艙和智駕系統(tǒng)分別還需要選擇多個不同的供應(yīng)商來完成，如何提供有競爭力的產(chǎn)品，在單一芯片上實現(xiàn)座艙、泊車以及行車輔助駕駛功能，幫助整車廠優(yōu)化成本，降低研發(fā)投入，提升盈利；給終端消費者帶來更優(yōu)的用戶體驗，是芯片廠家和整車廠商所共同面對的機遇與挑戰(zhàn)。

芯擎科技戰(zhàn)略業(yè)務(wù)發(fā)展副總裁孫東認(rèn)為：“做艙駕一體需要芯片廠家、主機廠或者Tier1在座艙開發(fā)、泊車開發(fā)和行車開發(fā)方面有一定的積累。因此，艙駕一體落地更大的挑戰(zhàn)是要提供實際需求的產(chǎn)品，相比現(xiàn)有方案，要能夠給整車廠降本增效，能夠讓參與者受益和提升競爭力。新生事物肯定要打破以前的慣性，以前任何的一個組織架構(gòu)都受到當(dāng)時的技術(shù)條件和產(chǎn)品形態(tài)影響。隨著市場的發(fā)展和技術(shù)的進步，艙泊行一體方案的發(fā)展，也會隨之有新的東西誕生。對于芯片廠、軟件公司、Tier1以及主機廠，都是很大的挑戰(zhàn)，從產(chǎn)品技術(shù)規(guī)劃、供應(yīng)商的選擇、合作方式以及團隊組織架構(gòu)方面，都需要有做出相應(yīng)的調(diào)整來加速這個趨勢的發(fā)展，使自身更好的在技術(shù)方案演進的過程中受益，并成為行業(yè)發(fā)展的引領(lǐng)者?！?/p>

3）“艙駕一體”的演進路徑艙駕融合是未來的發(fā)展趨勢，已經(jīng)成為行業(yè)內(nèi)的共識。雖然現(xiàn)在還存在一些問題和挑戰(zhàn)，但是只要我們發(fā)現(xiàn)了問題，問題終究會被逐個解決。但是，大家依然會關(guān)心：單SoC芯片的艙駕一體方案什么時候可以落地？艙駕一體的發(fā)展路線又將會是怎樣的呢？后摩智能信曉旭認(rèn)為：“艙駕一體的發(fā)展路徑應(yīng)該是從OneBox到OneBoard，再到OneChip，循序漸進式的發(fā)展，不太可能一下子就跨越到單SoC芯片艙駕一體的‘完美’解決方案。比如，先通過OneBox或OneBoard的方案，先試著去解決組織上的問題，把開發(fā)過程中碰到的問題以及各方的職責(zé)先梳理清楚，把該踩的坑先踩一遍?！倍鄶?shù)人基本贊同艙駕一體會走漸進式的發(fā)展路線，在硬件層面，會從OneBox，OneBoard，再到OneChip。同樣，在功能層面，也是會先集成已經(jīng)成熟穩(wěn)定的功能，慢慢再集成更高階、更復(fù)雜的功能。談到艙駕一體發(fā)展路線時，芯馳科技CTO孫鳴樂認(rèn)為：“座艙整合智駕相關(guān)功能，一個可能的路線是：座艙首先集成360環(huán)視、APA等泊車功能，再進一步集成ADAS行車功能，然后再集成更高階的自動駕駛功能。L2.x的ADAS和座艙的集成，是相對比較有可行性的。而對于L3級別自動駕駛的集成，其難題在于，自動駕駛的邊界到現(xiàn)在為止還沒有完全清晰。比如最近“有圖”和“無圖”的方案討論得很激烈，激光雷達是否會成為標(biāo)配大家也有不同的意見，這些都是高階智能駕駛面臨的方向性問題，在這些技術(shù)路線問題尚未統(tǒng)一的情況下，高階智駕功能就不太容易和座艙系統(tǒng)做集成。”“從長期來看，終極方案——單SoC芯片艙駕一體方案的發(fā)展是大方向。但現(xiàn)階段，由于高階智駕的功能需求尚未完全穩(wěn)定，目前市場也沒有性能和成本都比較理想的單SoC芯片能夠很好地支持座艙和高階自動駕駛的所有功能。因此，在市場需求的驅(qū)動下，當(dāng)前艙駕一體會停留在L2.x的ADAS和座艙功能集成，高階自動駕駛和座艙功能還會采用多SoC芯片方案來實現(xiàn)。芯擎科技孫東也基本認(rèn)同這樣的演進路線：“目前，L2及以下的輔助駕駛功能，傾向于直接集成到座艙的SoC芯片去完成，芯擎科技現(xiàn)有產(chǎn)品的算力能夠完全滿足需求，并且具有極佳的性價比。L3以上的高階智能駕駛方案，傾向于用更大算力的智駕SoC芯片去實現(xiàn)。

“目前，輔助駕駛在市場的滲透率也才30%左右，NOA功能的滲透率更低。如果有企業(yè)率先在市場上把艙駕一體方案推出來，并且切實降低了成本或在不增加用戶成本的基礎(chǔ)上，將原本中高端車型的智駕功能擴大到中低端車型，輔助駕駛的滲透率將會更快的提升，整個行業(yè)都會受益。新的事物進入到市場上，肯定要有一定的導(dǎo)入期。只要方案有價值，并且是可靠的，方案的全行業(yè)落地實現(xiàn)無非就是時間上的問題?！?/p>

關(guān)于艙駕一體方案的量產(chǎn)落地時間問題，徐曉煜認(rèn)為：“討論艙駕一體需要相對準(zhǔn)確地定義不同的市場階段所需要融合的東西。當(dāng)前已進入成熟期的L2+級別自動駕駛與已大規(guī)模普及的座艙功能的融合，2025年起會進入量產(chǎn)和快速發(fā)展期?！案咚懔σ约案唠A智駕的融合尚需時間，隨著下一階段未來5年高階智駕的突破，面向2028年后的融合功能邊界會逐漸清晰。同時，下一代工藝所支撐的新一代融合SoC芯片也會面世，進而可以支撐更高算力性能，更多算力類型的需求?！翱梢钥吹?，一些主機廠和Tier1已經(jīng)開始籌備艙駕一體的平臺項目，可以預(yù)見2024年將是艙駕一體突破期的起點，目前企業(yè)在協(xié)調(diào)不同部門開發(fā)模式上的挑戰(zhàn)，軟件上集成管理更多大型軟件模塊的挑戰(zhàn)，新型芯片的軟硬件完善和成熟方面挑戰(zhàn)等，都會隨著領(lǐng)先的OEM/Tier1的實際項目展開而得到快速解決。”4）“艙駕一體”需要一款什么樣的車載AI芯片？對于單芯片艙駕一體方案，按實現(xiàn)的難易程度可以劃分為：輕量級單SoC艙駕一體和高階單SoC艙駕一體。輕量級單SoC艙駕一體方案，會集成成熟的L2級的駕駛輔助功能+基本的座艙功能。面向的細(xì)分市場主要是針對20~25萬左右的車型。徐曉煜認(rèn)為：“對于這類的芯片，性價比是第一要素，通過單芯片最大程度減少系統(tǒng)元器件數(shù)量。除了可以將座艙和智駕各自需要的算力類型安全可靠地集成在一個芯片架構(gòu)之上，還需要考慮將獨立MCU、獨立的外圍接口芯片等都盡可能地做集成。挑戰(zhàn)在于對芯片的架構(gòu)、綜合性能、面積、功耗等都帶來了新的問題需要攻克?！备唠A單SoC艙駕一體方案，將會集成L2+甚至L3以上的高階智能駕駛功能+豐富的座艙功能。未來，這樣的方案必然是用于搭載于高端車型上。但是，由于高階智能駕駛和高階智能座艙的功能迭代和技術(shù)發(fā)展路線尚未完全收斂，同時，目前也尚未有一款合適的SoC芯片推出，所以，短期內(nèi)很難量產(chǎn)落地。那么，那這樣一款芯片應(yīng)該具備什么樣的特質(zhì)呢？高通SnapdragonFlexSoC參考方案示意圖（圖片來源-高通）創(chuàng)新的硬件架構(gòu)：滿足跨域多場景需求，能夠基于虛擬化技術(shù)將異構(gòu)資源進行合理和安全地隔離分配——把不同類型的算力，根據(jù)不同場景，以不同規(guī)格和安全要求進行靈活的搭配和組合。高算力需求：實現(xiàn)城區(qū)NOA等高階智能駕駛功能，對于芯片的AI算力需求也在逐漸增加，有效AI算力可能至少需要在200TOPS，同時還需要滿足座艙內(nèi)影音娛樂所需要的強大的渲染能力和通用算力需求，因此對于GPU和CPU的算力資源也必然會有較大的需求。具備較為豐富的外設(shè)接口：之前座艙和智駕SoC芯片分別對應(yīng)有各自獨立的外設(shè)接口，現(xiàn)在兩者進行整合后，相當(dāng)于要在這一顆芯片上預(yù)留好之前所有的接口。比如，CES2024上，暢行智駕正式推出了面向中央計算的單SOC艙駕融合域控制解決方案“RazorDCXTarkine”。面向自動駕駛，其支持11V5R12USS接入，預(yù)留12路CAN/CANFD接口，并提供8路車規(guī)級以太網(wǎng)接口；面向座艙，支持多屏互動、音頻放大器、車載音頻總線（A2B）以及面向媒體的系統(tǒng)傳輸總線（MOST）接口與連接?？傊瑢崿F(xiàn)高階的單SoC艙駕一體方案，對SoC芯片的要求會更高：需要在設(shè)計芯片時，就能規(guī)劃好座艙和智駕對CPU、GPU及NPU等各種算力的類型的需求，并在可行的工藝制程下，全面靈活地實現(xiàn)性能、功耗和成本之間的最佳平衡。三、如何才算一款“好用”的車載AI芯片？如何去判斷一款車載AI芯片是否好用呢？可以從以下幾個維度去觀察：芯片的軟件生態(tài)如何，它決定了客戶在上面所要耗費的時間成本和開發(fā)成本；芯片的適配性如何，俗話說“好馬配好鞍，好船配好帆”。雙方只有相互適配才能發(fā)揮最大“價值”；AI芯片的平臺化設(shè)計如何，AI芯片發(fā)展成熟到一定階段，平臺化設(shè)計是企業(yè)降本增效最有效的“武器”。1）車載AI芯片的軟件生態(tài)“軟件生態(tài)決定芯片價值”，已經(jīng)成為了芯片行業(yè)的共識。因為構(gòu)建在芯片之上的軟件生態(tài)對芯片的“可用性”具有較大的影響。如果一家AI芯片企業(yè)具備軟件生態(tài)優(yōu)勢，意味著客戶在其芯片上面做開發(fā)，開發(fā)周期更短，開發(fā)成本更低。AI開發(fā)套件是軟件生態(tài)里比較重要的一部分，通常包括算子庫、AI工具鏈等。什么樣的芯片才算是“好用”的芯片？一般來講，首先，算子庫豐富；其次，工具鏈好用。奕行智能劉琿認(rèn)為：“工具鏈好用表現(xiàn)在兩個方面：第一，編譯部署的時候，要能夠把客戶需要的算子都能署下去，不但能支持，并且性能還要好。第二，不但基礎(chǔ)設(shè)施要好，而且在基礎(chǔ)設(shè)施之上的那些管理調(diào)度系統(tǒng)也需要做好，這是軟硬結(jié)合的過程?！傲硗?，奕行智能自主研發(fā)的AI計算架構(gòu)把RISC-V和DSA結(jié)合起來，解決了在傳統(tǒng)AI加速器上所面臨的通用性和專用性的矛盾問題?；谲浻步Y(jié)合的前瞻理念，我們看到AI編譯技術(shù)對大模型在端側(cè)落地這件事上的重要性。奕行智能采用了多層次AI編譯器，我們通過一個著名模型——屋頂線模型（Rooflinemodel），利用硬件微架構(gòu)與軟件編譯器協(xié)同設(shè)計，把應(yīng)用程序從MemoryBound轉(zhuǎn)變成ComputerBound，以此來提高計算效率。”那么，一個良好的車載智能計算芯片軟件生態(tài)應(yīng)具有哪些特點呢？徐曉煜總結(jié)為以下兩點：易用性——軟件生態(tài)要能支撐好合作伙伴和客戶的開發(fā)所需，應(yīng)用文檔要充分完善，參考設(shè)計和代碼豐富準(zhǔn)確，有相應(yīng)的社區(qū)或者足夠詳細(xì)的指導(dǎo)文檔能幫助用戶自行快速上手。最大限度的降低用戶的學(xué)習(xí)成本和業(yè)務(wù)的遷徙代價。兼容性——需要一個長期穩(wěn)定的軟件框架和接口，能夠盡可能的做到向下兼容，幫助用戶的存量代碼的價值在后續(xù)芯片的升級時也能得到繼承。2）車載AI芯片的適配性主機廠或域控制器Tier1在選擇一款主控SoC芯片時，通常會參考的指標(biāo)包括：能效比、AI算力和效率、車規(guī)級安全認(rèn)證、解決方案的靈活性和全面性、芯片適配性等多方面指標(biāo)。其中，AI芯片的適配性是關(guān)系到芯片是否“好用”的一項關(guān)鍵指標(biāo)。整體來講，車載AI芯片的適配性可以從硬件、軟件以及通訊三個層面去考察。在硬件層面，芯片的適配性包括傳感器的適配，配套外圍電路的適配，例如存儲芯片（如LPDDR、NORFlash）、通信芯片（如以太網(wǎng)交換芯片）、音視頻數(shù)據(jù)接口以及相關(guān)處理芯片（如解串行芯片）等等；軟件層面，芯片的適配性包括與底軟、中間件以及上層算法層面的適配；通訊層面，主要是芯片與總線的適配，涉及到CAN、以太網(wǎng)等總線，即芯片和其它組件的之間的通信和數(shù)據(jù)交換是否適配。安霸半導(dǎo)體孫魯毅認(rèn)為，芯片的適配性要看客戶的定義，而不是芯片廠商自己來定義。泛泛來講，芯片的適配性好不僅意味著整個系統(tǒng)方案的性能達標(biāo)，而且硬件的支持、兼容性以及軟件的成熟度等各方面也要高度適配。比如軟件驅(qū)動如果存在bug或者對某特定硬件不適配，可能導(dǎo)致相應(yīng)硬件的功能或者性能發(fā)揮不出來，或者有偶發(fā)的故障，這些都是“不適配”的表現(xiàn)?？傊酒倪m配性好可以理解為它可以使得產(chǎn)品

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

好用的車載AI芯片該如何設(shè)計與定義

文檔簡介

溫馨提示

最新文檔

評論

好用的車載AI芯片該如何設(shè)計與定義

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔