




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
員會(huì)版權(quán)聲明本報(bào)告版權(quán)屬于中國信息通信研究院、開放數(shù)據(jù)中心委員會(huì),并受法律保護(hù)。轉(zhuǎn)載、摘編或利用其它方式使用本報(bào)者,編者將追究其相關(guān)法律責(zé)任。前言計(jì)算”是推動(dòng)數(shù)據(jù)中心規(guī)模建設(shè)和應(yīng)用賦能的引擎。DPU(DataProcessingUnit,數(shù)據(jù)處理單元)作為應(yīng)對(duì)數(shù)據(jù)流量指數(shù)級(jí)增長而帶來性能問題的關(guān)鍵技術(shù),將部分計(jì)算任務(wù)從CPU轉(zhuǎn)移至DPU,進(jìn)而釋放CPU的資源,以進(jìn)一步提升整體計(jì)算效率。在政策方面,全國一體化大數(shù)據(jù)中心、新型數(shù)據(jù)中心等政策文件的出臺(tái)及“東數(shù)西算”工程的實(shí)施,指引DPU產(chǎn)業(yè)高質(zhì)發(fā)展。技術(shù)方面,DPU架構(gòu)不斷演進(jìn),成為邁向“聯(lián)接+計(jì)算”的關(guān)鍵技術(shù),且軟、硬件技術(shù)協(xié)同發(fā)展,全方位生態(tài)能力不斷實(shí)現(xiàn)。產(chǎn)業(yè)方面,網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)、安全等多樣化的場景需求快速涌現(xiàn),為DPU產(chǎn)業(yè)發(fā)展提供了有效的市場牽引,推動(dòng)我國DPU產(chǎn)業(yè)高質(zhì)發(fā)展。未來DPU技術(shù)將不斷迭代創(chuàng)新、應(yīng)用場景趨于多元,以更好滿足行業(yè)客戶的需求。本報(bào)告從產(chǎn)業(yè)政策、產(chǎn)業(yè)規(guī)模、賦能經(jīng)濟(jì)三方面,對(duì)算力進(jìn)行詳細(xì)闡述,分析了數(shù)字基礎(chǔ)設(shè)施發(fā)展需求。同時(shí),綜合考慮DPU技術(shù)及產(chǎn)業(yè)等發(fā)展要素,重點(diǎn)對(duì)DPU技術(shù)熱點(diǎn)及核心價(jià)值進(jìn)行了梳理,從RDMA高速網(wǎng)絡(luò)、數(shù)據(jù)面轉(zhuǎn)發(fā)、網(wǎng)絡(luò)可編程、開放網(wǎng)絡(luò)及DPU軟件生態(tài)等方面分析了DPU發(fā)展的關(guān)鍵技術(shù),并從政策驅(qū)動(dòng)、技術(shù)創(chuàng)新、應(yīng)用場景等方面對(duì)DPU未來發(fā)展進(jìn)行了展望。報(bào)告仍有諸多不足,懇請(qǐng)各界批評(píng)指正。意見建議請(qǐng)聯(lián)系dceco@ (一)政策密集出臺(tái),芯片關(guān)注度高 1 圖目錄 C DPU2年)1(一)政策密集出臺(tái),芯片關(guān)注度高的載體,是衡量國家信息化發(fā)展程度的重要標(biāo)志。美國、歐洲及日本等世界主要國家和地區(qū)強(qiáng)化政策引領(lǐng),推動(dòng)算力基礎(chǔ)設(shè)施建設(shè)。美國于2015年啟動(dòng)了“國家戰(zhàn)略計(jì)算計(jì)劃”,該計(jì)劃的主要目標(biāo)是在2025年以前,建造世界上速度最快的高性能計(jì)算機(jī)。2019年11月,美國白宮科學(xué)技術(shù)政策辦公室對(duì)這一計(jì)劃進(jìn)行了更新,發(fā)布了《國家戰(zhàn)略性計(jì)算計(jì)劃(更新版):引領(lǐng)未來計(jì)算》,與2016年版本相比,新版計(jì)劃不僅關(guān)注技術(shù)突破,同時(shí)更加側(cè)重于算力生態(tài)的構(gòu)建,包括開拓?cái)?shù)字世界與非數(shù)字世界間的新領(lǐng)域、推進(jìn)計(jì)算基礎(chǔ)設(shè)施和生態(tài)系統(tǒng)的發(fā)展以及建立并擴(kuò)大合作伙伴關(guān)系等。英國政府借鑒美國的經(jīng)驗(yàn)和做法,積極鼓勵(lì)發(fā)展數(shù)據(jù)中心業(yè)務(wù),多家大型互聯(lián)網(wǎng)企業(yè)紛紛在英國建設(shè)數(shù)據(jù)中心。2020年歐盟對(duì)“歐洲高性能計(jì)算共同計(jì)劃”進(jìn)行了升半導(dǎo)體產(chǎn)業(yè)基礎(chǔ),但國內(nèi)能源、資源匱乏,亟需強(qiáng)化數(shù)字技術(shù)應(yīng)用,提升生產(chǎn)力,2022年日本發(fā)布《2022年先進(jìn)數(shù)字技術(shù)制度政策動(dòng)向調(diào)查報(bào)告》,該報(bào)告對(duì)日本、歐美及中國政府?dāng)?shù)字技術(shù)制度和政策動(dòng)鏈及量子計(jì)算機(jī)的發(fā)展。我國政府高度重視算力基礎(chǔ)設(shè)施發(fā)展,將大數(shù)據(jù)中心列入新基建DPU2年)2在中高端消費(fèi)、創(chuàng)新引領(lǐng)、綠色低碳、共享經(jīng)濟(jì)、現(xiàn)代供應(yīng)鏈、人力資本服務(wù)等領(lǐng)域培育新增長點(diǎn)、形成新動(dòng)能”。2020年4月20日,國家發(fā)改委對(duì)“新基建”概念作出正式解釋,細(xì)化新一代信息技術(shù)引領(lǐng)的新型基礎(chǔ)設(shè)施建設(shè)的具體內(nèi)容。在新基建的重點(diǎn)方向中,信息領(lǐng)域基礎(chǔ)設(shè)施建設(shè)是基礎(chǔ),將為各行業(yè)數(shù)字化轉(zhuǎn)型和智能升級(jí)提供重要 (2021-2023年)》,提出引導(dǎo)新型數(shù)據(jù)中心集約化、高密化、智能化建設(shè),推動(dòng)CPU、GPU等異構(gòu)算力提升,逐步提高自主研發(fā)算力。DPU作為一類新興計(jì)算芯片,能夠?qū)⒋鎯?chǔ)、安全、虛擬化等工作負(fù)載從CPU上卸載到自身,進(jìn)而提升數(shù)據(jù)中心等算力基全球算力產(chǎn)業(yè)競爭的焦點(diǎn)。(二)規(guī)模持續(xù)增長,DPU快速發(fā)展力產(chǎn)業(yè)規(guī)模仍將持續(xù)擴(kuò)大。算力產(chǎn)業(yè)成為國家數(shù)字化競爭領(lǐng)域中的關(guān)DPU2年)3鍵領(lǐng)域,算力產(chǎn)業(yè)的發(fā)展不僅能夠帶動(dòng)信息通信相關(guān)技術(shù)創(chuàng)新,提升智能算力方面,隨著“東數(shù)西算”工程的實(shí)施,八大算力樞紐節(jié)點(diǎn)均在強(qiáng)化數(shù)據(jù)中心算力基礎(chǔ)設(shè)施和網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)。作為繼數(shù)據(jù)中心CPU、GPU之后的“第三顆主力芯片”,DPU芯片主要以CPU和GPU為主,分別提供通用和智算算力。此外,GPU,還是其它專用芯片,在計(jì)算過程中均將不可避免的被存儲(chǔ)、通信等進(jìn)程打斷。DPU具有網(wǎng)絡(luò)數(shù)據(jù)傳輸和計(jì)算等功能,可使CPU、求和持續(xù)擴(kuò)大的算力規(guī)模,其重要性不言而喻。當(dāng)前,DPU技術(shù)與產(chǎn)業(yè)快速發(fā)展,DPU企業(yè)、通信設(shè)備廠商、互聯(lián)網(wǎng)公司等都加入到DPU的研發(fā)和應(yīng)用。(三)賦能實(shí)體經(jīng)濟(jì),DPU作用凸顯算力是激活數(shù)據(jù)要素潛能、驅(qū)動(dòng)經(jīng)濟(jì)社會(huì)數(shù)字化轉(zhuǎn)型、推動(dòng)數(shù)字據(jù)要素價(jià)值的發(fā)揮依賴于算力,在缺乏算力支撐的情況下,數(shù)據(jù)將成為無源之水,無法得到有效使用,各類數(shù)字化應(yīng)用場景也無法構(gòu)建。算力對(duì)數(shù)據(jù)處理、存儲(chǔ)及傳輸能力的實(shí)現(xiàn)主要依賴于各類信息通信技DPU2年)4隨著新一代信息技術(shù)快速發(fā)展,用戶對(duì)數(shù)字化應(yīng)用場景需求愈發(fā)強(qiáng)烈,企業(yè)也在積極利用上述信息技術(shù)優(yōu)化業(yè)務(wù)過程、開展數(shù)據(jù)處理,數(shù)據(jù)中心等形式承載各類互聯(lián)網(wǎng)應(yīng)用,滿足用戶需求;金融企業(yè)中,漲、用戶需求升級(jí)等因素影響,能源、工業(yè)、農(nóng)業(yè)等傳統(tǒng)行業(yè)企業(yè),如國家電網(wǎng)、中國電投、中國石油、中國石化等也在積極開展算力基礎(chǔ)設(shè)施建設(shè),不斷深入推動(dòng)數(shù)字化轉(zhuǎn)型。于數(shù)字化轉(zhuǎn)型的各個(gè)方面。當(dāng)前,摩爾定律已接近極限,但是5G、智能駕駛、AR/VR、元宇宙等算力應(yīng)用場景仍在高速發(fā)展,計(jì)算持續(xù)升算力基礎(chǔ)設(shè)施計(jì)算能力,預(yù)期將在自動(dòng)駕駛、人工智能和元宇宙等領(lǐng)域取得廣泛應(yīng)用。DPU2年)5(一)DPn助力進(jìn)入以算力為中心的時(shí)代與用戶算力需求升級(jí)相適應(yīng)的,數(shù)字基礎(chǔ)設(shè)施形態(tài)和服務(wù)能力也經(jīng)歷了不同的發(fā)展階段,形態(tài)更加豐富多樣,服務(wù)能力不斷優(yōu)化升級(jí)。早期用戶需求主要以web瀏覽、語音等應(yīng)用為主,對(duì)算力資源需求較少,在IT機(jī)房中部署少量服務(wù)器即可滿足需求,這一時(shí)期算力基礎(chǔ)更加靈活。與此同時(shí),軟件開發(fā)能力創(chuàng)新迭代,通信帶寬不斷提升,進(jìn)而需要更多服務(wù)器提供支持。在上述情況下,機(jī)房內(nèi)服務(wù)器規(guī)模進(jìn)一步擴(kuò)大,形成了初具規(guī)模的數(shù)據(jù)中心。數(shù)據(jù)中心內(nèi)服務(wù)器數(shù)量增加,一些服務(wù)器堆積密度更大的數(shù)據(jù)中心對(duì)電能持續(xù)供應(yīng)能力要求提升。同時(shí),熱量的增加也對(duì)制冷提出了更高要求。因而,數(shù)據(jù)中心制冷、供配電設(shè)施建設(shè)也得到了同步發(fā)展。隨著多樣化算力需求的不斷演進(jìn),以及信息通信技術(shù)的持續(xù)迭代,數(shù)據(jù)中心形態(tài)變得更加豐富,逐步演變出云計(jì)算中心、智算中心和超算中心等不同的形態(tài)。云計(jì)算中心通過虛擬化提升資源利用率,為互聯(lián)網(wǎng)場景提供通用網(wǎng)絡(luò)資源松耦合,完全虛擬化各種IT設(shè)備、模塊化程度較高、自動(dòng)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源池化能力要求較高,需要通過OpenStack或自主研發(fā)的云資源管理平臺(tái)對(duì)數(shù)據(jù)中心資源進(jìn)行精細(xì)化管理,為用戶提DPU2年)6供更加彈性可靠、敏捷高效的云計(jì)算服務(wù)。計(jì)算數(shù)據(jù)中心可承載電子商務(wù)、在線辦公、視頻、企業(yè)管理平臺(tái)、在線交易、即時(shí)通訊等常規(guī)高適配、強(qiáng)算力的人工智能計(jì)算中心是保障人工智能產(chǎn)業(yè)發(fā)展的刷臉支付等人工智能產(chǎn)品和應(yīng)用加速落地,人工智能正從極具想象力的商業(yè)概念成為具有超強(qiáng)發(fā)展前景的商業(yè)賽道。傳統(tǒng)人工智能技術(shù)無法滿足大模型、多模態(tài)等技術(shù)發(fā)展,因此強(qiáng)大算力集群的智能計(jì)算中心成為突破人工智能發(fā)展瓶頸的重要基礎(chǔ)保障。當(dāng)前,上海、南京、武漢、杭州、廣州等多個(gè)地方正在加速布局人工智能計(jì)算中心。2021年武漢正式投運(yùn)人工智能計(jì)算中心,該人工智能計(jì)算中心具備百P級(jí)算力規(guī)模,支持人工智能重大應(yīng)用的模型訓(xùn)練及推理,其圍繞數(shù)字設(shè)DPU2年)7駕駛、智慧城市、智慧醫(yī)療、智能交通等多個(gè)領(lǐng)域。受國內(nèi)外競爭場景的加速驅(qū)動(dòng),高性能計(jì)算領(lǐng)域取得長足發(fā)展。力地推動(dòng)了高性能計(jì)算的發(fā)展。美國提出NSCI計(jì)劃,促進(jìn)多個(gè)政府部門協(xié)同發(fā)展高性能計(jì)算產(chǎn)業(yè)。歐盟也計(jì)劃2030年在PRACE的基礎(chǔ)上,建立多臺(tái)高性能計(jì)算設(shè)備。在歐盟的主支持下,依托巴塞羅那超算,建立歐洲開放計(jì)算機(jī)系統(tǒng)體系實(shí)驗(yàn)室,為高性能計(jì)算的研發(fā)提數(shù)據(jù)中心集群,建設(shè)E級(jí)和10E級(jí)超級(jí)計(jì)算中心”。算力基礎(chǔ)設(shè)施融合計(jì)算、存儲(chǔ)和網(wǎng)絡(luò),未來將進(jìn)入以計(jì)算為中心的時(shí)代。從整體上來看,算力服務(wù)由計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)共同決定,任何一項(xiàng)能力的不足都可能會(huì)造成“木桶效應(yīng)”,制約算力服務(wù)能力提域,全閃存陣列以及各類存儲(chǔ)網(wǎng)絡(luò)設(shè)備的推廣應(yīng)用,極大地提升了存儲(chǔ)能力;網(wǎng)絡(luò)領(lǐng)域,5G、無損網(wǎng)絡(luò)等技術(shù)促進(jìn)數(shù)據(jù)通信性能提升。相比之下,數(shù)據(jù)中心計(jì)算瓶頸正在逐步顯現(xiàn)。在外部算力服務(wù)需求持續(xù)升級(jí)的情況下,需要避免計(jì)算芯片過多參與到存儲(chǔ)和傳輸環(huán)節(jié),全面提升計(jì)算能力,進(jìn)而帶動(dòng)數(shù)據(jù)中心綜合算力服務(wù)性能升級(jí)。以DPU為代表的數(shù)據(jù)處理芯片可卸載CPU等計(jì)算芯片的存儲(chǔ)、傳輸、安全中心的發(fā)展目標(biāo)。DPU2年)8(二)DPU促進(jìn)從云網(wǎng)協(xié)同走向算網(wǎng)一體數(shù)據(jù)中心建設(shè)是“東數(shù)西算”工程實(shí)施最為重要的組成之一,計(jì)施需依托于八大樞紐節(jié)點(diǎn),同時(shí)還需結(jié)合算力網(wǎng)絡(luò)相關(guān)技術(shù)。以算網(wǎng)算力資源優(yōu)化配置的關(guān)鍵。以算網(wǎng)融合目標(biāo)為驅(qū)動(dòng)、構(gòu)建彈性開放、高效協(xié)同的計(jì)算基礎(chǔ)設(shè)施成為產(chǎn)業(yè)融合發(fā)展的重要共識(shí)。當(dāng)前,我國算網(wǎng)融合發(fā)展尚處于起步階段,算網(wǎng)融合技術(shù)、運(yùn)營機(jī)制及監(jiān)管體制仍不完善。對(duì)于以運(yùn)營商為核心的通信行業(yè),網(wǎng)絡(luò)云化不斷深入,正在從“云網(wǎng)融合”走向“算網(wǎng)融合”,并以5G和算力網(wǎng)絡(luò)為抓手,面向算力和連接進(jìn)行優(yōu)化,積極布局提供算力服務(wù)的新一代網(wǎng)絡(luò)基礎(chǔ)設(shè)施。在以云服務(wù)商、云數(shù)據(jù)中心和超算為代表的算力行業(yè),網(wǎng)絡(luò)長久以來被視為全局化算力調(diào)度的發(fā)展盲區(qū),網(wǎng)絡(luò)資源與計(jì)算資源的隔離阻撓了全局化算力調(diào)度,形成了碎片化的“算力孤島”。因此,面向智能化場景的算力需施發(fā)展的重要方向之一。算網(wǎng)一體趨勢(shì)逐步強(qiáng)化,網(wǎng)絡(luò)設(shè)施可通過在網(wǎng)計(jì)算等方式實(shí)現(xiàn)計(jì)是相互割裂的兩類設(shè)備和功能模塊,沿著各自的技術(shù)發(fā)展方向演進(jìn)。算網(wǎng)融合極大地提升了算力基礎(chǔ)設(shè)施綜合服務(wù)能力,是計(jì)算和網(wǎng)絡(luò)融DPU2年)9據(jù)處理能力,可促進(jìn)實(shí)現(xiàn)在網(wǎng)計(jì)算,進(jìn)而釋放CPU算力,推動(dòng)計(jì)算和網(wǎng)絡(luò)的融合,是支撐算力基礎(chǔ)設(shè)施向算網(wǎng)一體發(fā)展演進(jìn)的重要基礎(chǔ)。(三)DPU是下一代新型算力的重要基礎(chǔ)在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)中心作為數(shù)字化發(fā)展的關(guān)鍵基礎(chǔ)設(shè)施處于高速發(fā)展階段,“網(wǎng)絡(luò)+計(jì)算”已成為推動(dòng)數(shù)據(jù)中心規(guī)模擴(kuò)張的雙引擎。為適應(yīng)當(dāng)前數(shù)據(jù)中心的加速變革,包括交換芯片在內(nèi)的網(wǎng)絡(luò)能力不斷提升。數(shù)據(jù)中心業(yè)務(wù)多樣導(dǎo)致內(nèi)部流量爆發(fā)性增長,造成網(wǎng)絡(luò)擁之間的瓶頸已經(jīng)從原來端云之間逐漸轉(zhuǎn)移到云內(nèi),內(nèi)部大量的流量負(fù)載很難控制得當(dāng),當(dāng)越來越多的流量混跑在一起的時(shí)候,傳統(tǒng)的以CPU為中心的計(jì)算機(jī)體系結(jié)構(gòu),已經(jīng)無法支撐要求。而由于流量沖突和擁塞導(dǎo)致的CPU等待時(shí)間較長的問題,已經(jīng)成為制約整個(gè)數(shù)據(jù)中心算力釋放的巨大瓶頸。以“聯(lián)接+計(jì)算”為中心的架構(gòu)能夠通過提升網(wǎng)絡(luò)能力,對(duì)數(shù)據(jù)做轉(zhuǎn)換傳輸、延伸和分發(fā),在端到端的網(wǎng)絡(luò)上控制延遲,降低大規(guī)模流量的延遲,滿足業(yè)務(wù)的QoS(QualityofService,服務(wù)質(zhì)量),使得CPU、GPU、存儲(chǔ)和加速器等可以在不同的位置或物理機(jī)上,通過數(shù)(一)DPU的技術(shù)發(fā)展綜述DPU2年)傳統(tǒng)的標(biāo)準(zhǔn)網(wǎng)卡(NetworkInterfaceCard,簡稱NIC)是將電腦接入局域網(wǎng)的設(shè)備,網(wǎng)卡插在計(jì)算機(jī)主板的總線插槽中,負(fù)責(zé)將用戶要傳遞的數(shù)據(jù)轉(zhuǎn)換為網(wǎng)絡(luò)設(shè)備能夠識(shí)別的格式,通過網(wǎng)絡(luò)介質(zhì)傳輸。簡而言之,標(biāo)準(zhǔn)網(wǎng)卡沒有任何面向應(yīng)用的加速功能,只是承擔(dān)了將主機(jī)接入網(wǎng)絡(luò)的工作,操作系統(tǒng)收到數(shù)據(jù)包后由主機(jī)CPU承擔(dān)所設(shè)施數(shù)據(jù)處理功能越發(fā)復(fù)雜的情況下,消耗的主機(jī)CPU資源和性能也越來越多。計(jì)算、數(shù)據(jù)中心、智算中心等基礎(chǔ)設(shè)施快速擴(kuò)容的背景下,計(jì)算需求DPU2年)增加,大數(shù)據(jù)和人工智能計(jì)算量的迅速增長,推動(dòng)數(shù)據(jù)中心在數(shù)量和網(wǎng)和邊緣計(jì)算的新需求,計(jì)算被推向了邊緣位置。相對(duì)標(biāo)準(zhǔn)網(wǎng)卡,最初具備加速和卸載功能的網(wǎng)卡被稱為智能網(wǎng)卡,當(dāng)DPU的概念出現(xiàn)后,智能網(wǎng)卡和DPU的概念則缺乏一個(gè)清晰的定義。在從智能網(wǎng)卡到DPU的發(fā)展過程中,NVIDIA在收購Mellanox之后將BlueField系列網(wǎng)卡升級(jí)為DPU,而把主要針對(duì)數(shù)據(jù)平面實(shí)現(xiàn)加速和卸載功能的CX系列稱為智能網(wǎng)卡。目前市場主流的智能網(wǎng)卡和DPU的定義也沿用了這一提法。在硬件架構(gòu)層面,BlueField系列網(wǎng)卡相比CX系列網(wǎng)卡,主要的區(qū)別是增加了多核的ARM通用CPU處理單元,用于滿足控制平面的卸載,以此實(shí)現(xiàn)DPU的基礎(chǔ)設(shè)施服務(wù)的全卸載和宿主機(jī)業(yè)務(wù)物理上的安全隔離。而無論是智能網(wǎng)卡還oCEDPU2年)深度報(bào)文檢測(DPI)、OVS(OpenVirtualSwitch)、存儲(chǔ)網(wǎng)絡(luò)IO虛擬化等,都是落在數(shù)據(jù)平面的加速和卸載單元的實(shí)現(xiàn)上。因此,我們將智能網(wǎng)卡和DPU都稱為廣義上的DPU,以異構(gòu)高能效方式實(shí)現(xiàn)的數(shù)據(jù)平面加速和卸載單元是DPU區(qū)別于CPU通用遠(yuǎn)高于通用CPU技術(shù)的數(shù)據(jù)處理單元,才能擔(dān)負(fù)起將以“計(jì)算為中架構(gòu)實(shí)現(xiàn)數(shù)據(jù)平面加速的DPU,是向DPU最終形態(tài)演進(jìn)的過渡形態(tài)。因此,廣義上的DPU是基于異構(gòu)DSA(DomainSpecificArchitecture,領(lǐng)域?qū)S眉軜?gòu))架構(gòu),采用軟件定義技術(shù)路線,支撐基礎(chǔ)成本(TCO)能力,為高帶寬、低延遲、數(shù)據(jù)密集的計(jì)算場景提供計(jì)算引擎的專用處理器。DPU2年)(二)DPU的核心技術(shù)價(jià)值后摩爾時(shí)代,算力的持續(xù)提升成為數(shù)據(jù)中心高質(zhì)量發(fā)展的重要保數(shù)據(jù)經(jīng)濟(jì)發(fā)展的重要引擎。據(jù)IDC數(shù)據(jù)顯示,全球數(shù)據(jù)量在過去10年的年復(fù)合增長率接近50%,每四個(gè)月對(duì)于算力的需求就會(huì)翻一倍。與此同時(shí),隨著數(shù)據(jù)中心規(guī)模加速擴(kuò)張,數(shù)據(jù)中心網(wǎng)絡(luò)的帶寬不斷提升,交換芯片單芯片的吞吐容量極速提升,數(shù)據(jù)處理需求不斷增長,導(dǎo)致CPU收發(fā)數(shù)據(jù)調(diào)度負(fù)擔(dān)加大,運(yùn)行高負(fù)載持續(xù)。隨著摩爾定律放緩,CPU算力的提升節(jié)奏已無法應(yīng)對(duì)計(jì)算的爆炸式需求引發(fā)的海量數(shù)據(jù)存儲(chǔ)難、數(shù)據(jù)驗(yàn)證效率低、網(wǎng)絡(luò)安全無保障等系列問題。因此,DPU作為繼CPU、GPU之后的又一類芯片,核心的價(jià)值需算力卸載、算力釋放、算力擴(kuò)展等方面實(shí)現(xiàn)。算力卸載即以更高的能效比卸載CPU的部分算力。DPU作為數(shù)字基礎(chǔ)設(shè)施的重要組成部分,其基本功能包括網(wǎng)絡(luò)、存儲(chǔ)、安全和管也可以有效降低能耗,并減少“數(shù)據(jù)中心稅”。尤其在100G或更高帶寬的網(wǎng)絡(luò)中,采用主機(jī)CPU來支持通信處理已經(jīng)越來越困難,通過DPU實(shí)現(xiàn)基礎(chǔ)設(shè)施能力勢(shì)在必行。DPU2年)從性能的角度講,DPU除了以更高的能效比卸載CPU的算力,根據(jù)業(yè)界實(shí)際的部署經(jīng)驗(yàn),在某些場景下,DPU可以帶來10倍以上的應(yīng)用性能提升。重點(diǎn)關(guān)注的問題。在網(wǎng)絡(luò)環(huán)境下,數(shù)據(jù)加密是保障數(shù)據(jù)安全的必要途徑,加密、解密算法將會(huì)消耗大量CPU算力,無法滿足海量數(shù)據(jù)的傳輸,而DPU可以作為新的數(shù)據(jù)網(wǎng)關(guān),將加密、解密算法固化在D業(yè)務(wù)租戶之間提供額外的安全層,滿足用戶數(shù)據(jù)安全和物理隔離需求。DPU2年)算力釋放即無需CPU介入多次訪問內(nèi)存和外設(shè),避免不必要的數(shù)據(jù)搬運(yùn)、拷貝和上下文的切換,直接在網(wǎng)卡硬件上對(duì)數(shù)據(jù)完成處理并交付給最終消費(fèi)數(shù)據(jù)的應(yīng)用。傳統(tǒng)以CPU為中心的計(jì)算機(jī)體系結(jié)構(gòu)在處理數(shù)據(jù)的過程中需要多次在內(nèi)核和應(yīng)用之間拷貝和訪問數(shù)據(jù),并伴隨對(duì)性能影響很大的上下文切換,帶來的是極大的性能損耗,甚至引發(fā)IOHung等異常故障。以數(shù)據(jù)為中心的DPU架構(gòu)則可以有效改善CPU過度參與數(shù)據(jù)處理的問題,在數(shù)據(jù)處理的過程中不需要CPU參與,直接將數(shù)據(jù)送達(dá)應(yīng)用、相關(guān)的GPU或者存儲(chǔ)設(shè)備,能夠有效避免性能瓶頸和由于CPU負(fù)載過大而引發(fā)的異常。以RDMA技術(shù)為例,RDMA允許用戶態(tài)的應(yīng)用程序直接讀取和寫入遠(yuǎn)程內(nèi)存,無需CPU介入多次拷貝內(nèi)存,并可繞過內(nèi)核直接向網(wǎng)卡寫數(shù)據(jù),實(shí)現(xiàn)了高吞吐量、超低時(shí)延和低CPU開銷的效果。在存儲(chǔ)領(lǐng)域,存儲(chǔ)網(wǎng)絡(luò)一直在追求大帶寬高吞吐以充分發(fā)揮存儲(chǔ)速低時(shí)延的NVMe技術(shù)的出現(xiàn),存儲(chǔ)需要更高速、更高效的網(wǎng)絡(luò)。RDMA技術(shù)因其更低時(shí)延更高吞吐、Ethernet技術(shù)因其遠(yuǎn)超F(xiàn)C的更高帶寬更低成本,這兩個(gè)因素使得RDMA和Ethernet技術(shù)的結(jié)合即RoCE成為存儲(chǔ)網(wǎng)絡(luò)技術(shù)的新趨勢(shì)。DPU架構(gòu)和技術(shù),使服務(wù)器上運(yùn)行的業(yè)務(wù)應(yīng)用和操作系統(tǒng)內(nèi)核,用簡單的本地存儲(chǔ)訪問API,就能實(shí)現(xiàn)對(duì)分布式、超融合或軟件定義存儲(chǔ)系統(tǒng)的高效透明訪問。存儲(chǔ)廠商可以把為各行業(yè)應(yīng)用開發(fā)的直連DPU2年)式存儲(chǔ)(DAS)、縱向擴(kuò)展(Scale-up)、橫向擴(kuò)展(Scale-out)、超融合架構(gòu)(Hyperconverged)等存儲(chǔ)解決方案,零開銷地推廣到各個(gè)應(yīng)用領(lǐng)域的現(xiàn)有業(yè)務(wù)處理平臺(tái)和數(shù)據(jù)中心基礎(chǔ)架構(gòu)中,而所有的安全加密、數(shù)據(jù)壓縮、負(fù)載均衡等復(fù)雜又必須的功能則完全由DPU透明地卸載。存儲(chǔ)行業(yè)的革新算法和實(shí)現(xiàn),可以在DPU架構(gòu)中,獨(dú)立于服務(wù)器操署。DPU技術(shù)幫助存儲(chǔ)廠商實(shí)現(xiàn)真正的“算存分離”,完全發(fā)揮自家產(chǎn)品的技術(shù)優(yōu)勢(shì),打通最高效服務(wù)應(yīng)用需求的通路。算力擴(kuò)展即通過有效避免擁塞消除跨節(jié)點(diǎn)的網(wǎng)絡(luò)通信瓶頸,顯著降低分布式應(yīng)用任務(wù)周期中的通信耗時(shí)占比,在大規(guī)模的集群維度提升計(jì)算集群的整體算力。為了提升算力,業(yè)界在多條路徑上持續(xù)演進(jìn)。隨著摩爾定律的放緩,通用CPU已很難繼續(xù)通過提升單核單線程的性能和擴(kuò)展片內(nèi)多核的方式來大幅提升算力。單核芯片的工藝提升至3nm后,發(fā)展放緩;通過疊加多核提升算力,隨著核數(shù)的增加,單位算力功耗也會(huì)顯著增長,當(dāng)128核增至256核時(shí),總算力水平無法線性提升。在計(jì)算單元的工藝演進(jìn)已經(jīng)逼近基線,每18個(gè)月翻一番的摩爾定律即將失效的情況下,為了滿足大算力的需求,通過分布式系統(tǒng),擴(kuò)大計(jì)算集群規(guī)模,提升網(wǎng)絡(luò)帶寬,降低網(wǎng)絡(luò)延遲成為提升數(shù)據(jù)中心集群算力的主要手段。隨著計(jì)算機(jī)視覺、自然語言處理、自動(dòng)駕駛等場景人工智能應(yīng)用DPU2年)為HPC(HighPerformanceComputing高性能計(jì)算)等高性能業(yè)務(wù),用InfiniBand專網(wǎng)。但隨著RoCE技術(shù)的深入發(fā)展,Ethernet在計(jì)算網(wǎng)絡(luò)中的應(yīng)用也逐漸普遍。RDMA技術(shù)通過消除多GPU跨節(jié)點(diǎn)通信的網(wǎng)絡(luò)瓶頸,顯著降低了訓(xùn)練任務(wù)整個(gè)周期中的通信耗時(shí)占比,提高了GPU集群計(jì)算資源利用率和訓(xùn)練效率,也為集群橫向擴(kuò)展到更大規(guī)模時(shí)的線性加速比提供了保證。異構(gòu)算力互聯(lián)即為GPU、FPGA、ASIC或其它加速卡與CPU之間的數(shù)據(jù)連接。在CPU與加速卡之間,以及加速卡之間形成的芯片,雖然PCIe有著非常通用的標(biāo)準(zhǔn)化設(shè)計(jì),但帶寬有限將會(huì)產(chǎn)生瓶頸。以CXL和Gen-Z為代表的等下一代互聯(lián)技DPU作為各種高速互聯(lián)協(xié)議融合的沙盒,最適合成為靈活的高速互聯(lián)載體,通過采用和擴(kuò)展“以內(nèi)存為中心”的互聯(lián)協(xié)議,將帶來在單個(gè)機(jī)箱外部擴(kuò)展亞微秒級(jí)延遲技術(shù)的機(jī)會(huì),為下一代計(jì)算架構(gòu)創(chuàng)新創(chuàng)造可能性。(三)DPU發(fā)展的黃金時(shí)代來臨時(shí)代”和“智能時(shí)代”。當(dāng)前,正處于數(shù)字技術(shù)引領(lǐng)創(chuàng)新與革命的歷網(wǎng)為代表的新一代數(shù)字技術(shù)加速迭代,“數(shù)字化、網(wǎng)絡(luò)化、智能化”的第四次工業(yè)革命正在逐步變革。DPU憑借高技術(shù)、高智能、高性能的優(yōu)勢(shì)在第四次革命中的占據(jù)重要地位。DPU2年)DPU將成為下一代芯片技術(shù)競爭的高地。作為數(shù)據(jù)中心繼CPU和GPU之后的“第三顆主力芯片”,DPU的演進(jìn)也經(jīng)歷了從眾核CPU/NP、FPGA+CPU到ASIC+CPU的多個(gè)發(fā)展階段或者技術(shù)演進(jìn)?;贑PU/NP、FPGA+CPU的硬件架構(gòu)分別具備軟件可編程和硬件可編程的靈活優(yōu)勢(shì),在DPU發(fā)展的初期尤其受到互聯(lián)網(wǎng)云廠商大廠自研方案的青睞,在快速迭代和靈活定制方面有比較明顯的收益。進(jìn)到了100G、200G之后,基于CPU/NP和FPGA+CPU這類硬件架構(gòu)的DPU除了在性能上難以為繼以外,在成本和功耗上則有更大的挑戰(zhàn)?;贏SIC+CPU的硬件架構(gòu)則是結(jié)合了ASIC和CPU二者的優(yōu)勢(shì),即將通用處理器的可編程靈活性與專用的加速引擎相結(jié)合,正在成為最新的產(chǎn)品趨勢(shì)。業(yè)界的頭部廠商N(yùn)VIDIA、Intel和AMD(收購Pensando)的DPU架構(gòu)都采用了這種架構(gòu)路線。為了使基于ASIC硬件架構(gòu)的專用加速引擎具備一定的靈活性,支持基于P4的可編程能力也成為了一個(gè)新的技術(shù)方向。從DPU芯片的實(shí)現(xiàn)角度看,以ASIC+CPU的硬件架構(gòu)為例,CPU的研發(fā)更多的是以系統(tǒng)級(jí)芯片的方式集成第三方成熟的CPU多核IP,不同DPU廠商的核心競爭壁壘在于專用加速引擎的硬件實(shí)現(xiàn)DPU以處理報(bào)文的方式處理數(shù)據(jù),在網(wǎng)絡(luò)芯片領(lǐng)域積累更多的廠商將更有優(yōu)勢(shì)。DPU將成為下一個(gè)市場產(chǎn)業(yè)的代表。隨著新興領(lǐng)域的逐步滲透,DPU憑借“垂直深耕、水平擴(kuò)展”的技術(shù)優(yōu)勢(shì),已擴(kuò)延到數(shù)據(jù)中心、DPU2年)云計(jì)算、高性能計(jì)算、高性能存儲(chǔ)、人工智能等多個(gè)應(yīng)用領(lǐng)域,DPU市場規(guī)模加速提升。如數(shù)據(jù)中心領(lǐng)域的云廠商、電信運(yùn)營商以及人工智能領(lǐng)域的醫(yī)療健康、工業(yè)互聯(lián)網(wǎng)等多家單位已逐步使用DPU智能網(wǎng)卡設(shè)備。未來DPU將持續(xù)延伸至其他應(yīng)用領(lǐng)域,擴(kuò)張市場規(guī)模,保持高速增長態(tài)勢(shì)。DPU以數(shù)據(jù)為中心作為計(jì)算架構(gòu)的核心承載,其產(chǎn)業(yè)賦能價(jià)值逐步凸顯。國際方面,世界主要國家均在積極引導(dǎo)DPU產(chǎn)業(yè)發(fā)展,DPU場規(guī)模日益擴(kuò)展,投資并購活躍,競爭日益激烈。國內(nèi)方發(fā)展提供了重要指導(dǎo),我國DPU產(chǎn)業(yè)發(fā)展步入新階段,市場規(guī)模穩(wěn)步提升,低碳高質(zhì)、協(xié)同發(fā)展的格局正在逐步形成。伴隨信息化建設(shè)與應(yīng)用的深入,市場持續(xù)高漲,DPU產(chǎn)業(yè)在電信、互聯(lián)網(wǎng)、智能駕駛、AI服務(wù)器及其他行業(yè)應(yīng)用需求不斷增長。在電信領(lǐng)域,三大運(yùn)營商均積極布局,推動(dòng)產(chǎn)品驗(yàn)證,并提出與產(chǎn)業(yè)鏈上的廠商推動(dòng)DPU產(chǎn)業(yè)發(fā)展的合作意愿。在互聯(lián)網(wǎng)領(lǐng)域,隨著云計(jì)受到各大云廠商的廣泛關(guān)注。頭部廠商紛紛投入資源嘗試自研,降本布局智能駕駛,不斷提升研發(fā)效率,為DPU的市場發(fā)展奠定基礎(chǔ)。AI和“東數(shù)西算”等政策DPU2年)對(duì)算力的需求不斷增加,傳統(tǒng)的技術(shù)已無法滿足當(dāng)前業(yè)務(wù)的發(fā)展需求,DPU能夠提供成熟的硬件加速方案,提升整個(gè)系統(tǒng)的效率,為AI服務(wù)器、金融及其他領(lǐng)域的發(fā)展提供技術(shù)支撐,全面推進(jìn)DPU產(chǎn)業(yè)未來(一)RDMA高速網(wǎng)絡(luò)技術(shù)傳統(tǒng)TCP/IP協(xié)議棧在處理報(bào)文轉(zhuǎn)發(fā)的過程當(dāng)中,從用戶態(tài)到內(nèi)核協(xié)議棧再經(jīng)過網(wǎng)卡轉(zhuǎn)發(fā)出去這個(gè)過程中,要觸發(fā)多次CPU的上下文切換,發(fā)生多次的內(nèi)存拷貝,由于多次數(shù)據(jù)拷貝,轉(zhuǎn)發(fā)延時(shí)一直較高帶寬,更低延時(shí)的業(yè)務(wù)需求。RDMA是一種遠(yuǎn)程直接內(nèi)存訪問技術(shù),它將數(shù)據(jù)直接從一臺(tái)計(jì)算機(jī)的內(nèi)存?zhèn)鬏數(shù)搅硪慌_(tái)計(jì)算機(jī)的內(nèi)存,數(shù)據(jù)從一端主機(jī)的內(nèi)存通過DMA方式從網(wǎng)卡轉(zhuǎn)發(fā)出去,到另一端通過網(wǎng)卡DMA直接寫入另一DPU2年)端主機(jī)的內(nèi)存,整個(gè)數(shù)據(jù)傳輸過程無須操作系統(tǒng)以及CPU參與,這種CPU\內(nèi)核協(xié)議棧的bypass技術(shù)通過硬件網(wǎng)卡實(shí)現(xiàn),可以滿足未來網(wǎng)絡(luò)對(duì)高帶寬、低延時(shí)的需求,并進(jìn)一步釋放CPU的計(jì)算資源。RDMA技術(shù)具有以下特點(diǎn):CPU卸載:用戶態(tài)應(yīng)用程序通過調(diào)用IBverbs接口直接訪問遠(yuǎn)程主機(jī)的內(nèi)存,可以對(duì)遠(yuǎn)程內(nèi)存執(zhí)行讀取、寫入、原子操作等多種操作,而且無須兩端主機(jī)CPU參與。內(nèi)核旁路:RDMA采用基于verbs的編程方式,不同于socket編程方式,需要用戶態(tài)與內(nèi)核態(tài)的切換,應(yīng)用程序可以直接在用戶態(tài)調(diào)額內(nèi)核系統(tǒng)旁路。零拷貝:本端應(yīng)用程序內(nèi)存數(shù)據(jù)通過網(wǎng)卡DMA直接發(fā)送到遠(yuǎn)端網(wǎng)卡,遠(yuǎn)端網(wǎng)卡通過DMA方式直接寫入對(duì)端內(nèi)存,整個(gè)過程中消除了傳統(tǒng)TCP/IP傳輸方式的多次內(nèi)存拷貝的過程,實(shí)現(xiàn)內(nèi)存零拷貝,進(jìn)一步降低整個(gè)網(wǎng)絡(luò)延時(shí)。為了達(dá)到RDMA在高性能和低延時(shí)上的技術(shù)優(yōu)勢(shì),RDMA有較DPU2年)高的技術(shù)門檻,需要端到端的擁塞控制來避免擁塞和降低網(wǎng)絡(luò)延時(shí)。實(shí)現(xiàn)端到端的高性能RDMA網(wǎng)絡(luò)需要考慮:交換機(jī)的收斂比簡單說就是總的輸入帶寬除以總的輸出帶寬;2)ECMP等價(jià)哈希均衡。當(dāng)前數(shù)據(jù)中心網(wǎng)絡(luò)多采用Fabric架構(gòu),并采用ECMP來構(gòu)建多條等價(jià)負(fù)載均衡的鏈路,通過設(shè)置擾動(dòng)因子,采用HASH選擇一條鏈路來轉(zhuǎn)發(fā)是簡單的,但這個(gè)過程中卻沒有考慮到所選鏈路本身是否有擁塞。ECMP并沒有擁塞感知的機(jī)制,只是將流分散到不同的鏈路上轉(zhuǎn)發(fā),對(duì)于已經(jīng)產(chǎn)生擁塞的鏈路來說,很可;3)Incast流量模型,Incast是多打一的通信模式,在數(shù)據(jù)中心云化的大趨勢(shì)下這種通信模式常常發(fā)生,尤其是那些以Scale-Out方式數(shù)據(jù)庫、Hadoop、MapReduce、HDFS等;4)無損網(wǎng)絡(luò)交換機(jī)的流量控制、QoS和擁塞控制機(jī)制以及相應(yīng)的水線設(shè)置,能夠讓RDMA得到規(guī)模部署且廣泛應(yīng)用的就需要RDMA的擁塞控制算法支撐。在Fabric網(wǎng)絡(luò)復(fù)雜、多路徑的場景下,伴隨著多打一、突發(fā)等情況的出現(xiàn),是擁塞控制算法讓RDMA的高性能得以充分展現(xiàn),為RDMA的高性能保駕護(hù)航。端到端擁塞控制算法的基本原理是依托擁塞節(jié)點(diǎn)交換機(jī)對(duì)出向ECN標(biāo)記,目的端通過ECN標(biāo)記處理反饋CNP使得源端進(jìn)DPU2年)行速率調(diào)節(jié),從而達(dá)到解決擁塞的目的。隨著RDMA技術(shù)的普及,不同的云廠商用戶結(jié)合不同的業(yè)務(wù)場景和網(wǎng)絡(luò)環(huán)境提出了多種擁塞控制算法,比較有代表的算法有被業(yè)界大規(guī)模驗(yàn)證過的DCQCN算法,阿里提出的HPCC算法,以及谷歌提出的TIMELY和Swift算法等。不同的用戶或者業(yè)務(wù)場景有不同擁塞控制算法的需求。因此,DPU芯片需要支持多種擁塞控制算法,或者能夠一步到位支持擁塞控制算法的可編程能力。最后,除了滿足網(wǎng)卡和交換機(jī)緊密配合的要求,解決轉(zhuǎn)發(fā)面無損網(wǎng)絡(luò)的需求外,還要端到端提供精細(xì)化運(yùn)維的能力,才能幫助用戶實(shí)現(xiàn)大規(guī)模部署高性能RDMA網(wǎng)絡(luò)的目標(biāo)。2.RDMA的應(yīng)用價(jià)值RDMA對(duì)比傳統(tǒng)TCP傳輸方式在提升吞吐,降低CPU占用、降低延時(shí)方面均有明顯的優(yōu)勢(shì)。后摩爾時(shí)期尤其是在網(wǎng)絡(luò)進(jìn)入100G甚至200G以上的帶寬情況下,傳統(tǒng)TCP協(xié)議棧內(nèi)核轉(zhuǎn)發(fā)完全無法滿足性能要求,隨著網(wǎng)絡(luò)技術(shù)的演進(jìn),高吞吐、低延時(shí)的RDMA技術(shù)將承擔(dān)基礎(chǔ)的網(wǎng)絡(luò)傳輸功能,進(jìn)一步提升數(shù)據(jù)中心整體算力。DPU2年)隨著大數(shù)據(jù)計(jì)算、AI、機(jī)器學(xué)習(xí)等數(shù)據(jù)模型不斷擴(kuò)大,以CPU+GPU的異構(gòu)計(jì)算模型已經(jīng)成為高性能計(jì)算領(lǐng)域中的主流計(jì)算架DirectRDMA是RDMA在異構(gòu)計(jì)算場景中的應(yīng)用延伸,使得GPU之間的通信不在依賴CPU轉(zhuǎn)發(fā),從而進(jìn)一步提升高性能計(jì)算場景中整CongestionControlforLargeScaleRDMADeploymentsZhuet.al.,SIGCOMM2015DRDPU2年)驅(qū)動(dòng)適應(yīng)性廣等特點(diǎn)在存儲(chǔ)領(lǐng)域得到了廣泛應(yīng)用,而在NVMe協(xié)議RDMA現(xiàn)遠(yuǎn)程存儲(chǔ)。兩者都有著高吞吐、低從而滿足多種對(duì)不同的應(yīng)用需求。圖11NVMe-OFRDMAvskernel性能測試對(duì)比3RDMA憑借其高吞吐、低延時(shí)、CPU旁路、適應(yīng)性廣、技術(shù)成技術(shù)以及應(yīng)用的發(fā)展,RDMA的應(yīng)用將進(jìn)一步擴(kuò)大。3SPDKNVMe-oFRDMAPerformanceReportRelease19.10DPU2年)(二)數(shù)據(jù)面轉(zhuǎn)發(fā)技術(shù)隨著網(wǎng)絡(luò)流量的指數(shù)增長,基于硬件數(shù)據(jù)面轉(zhuǎn)發(fā)技術(shù)越來越受到關(guān)注,在傳統(tǒng)交換機(jī)和路由器上已經(jīng)成熟應(yīng)用的數(shù)據(jù)面轉(zhuǎn)發(fā)技術(shù)也被應(yīng)用到了DPU領(lǐng)域。在數(shù)據(jù)面硬件轉(zhuǎn)發(fā)技術(shù)中,基本的硬件處理架eline通用RTC(Real-TimeClock)處理器轉(zhuǎn)發(fā)模型,報(bào)文進(jìn)入后,經(jīng)過調(diào)度分發(fā)器后,被分配到一個(gè)報(bào)文處理引擎上處理。RTC是一種非搶占機(jī)制,當(dāng)報(bào)文進(jìn)入該處理引擎后,根據(jù)轉(zhuǎn)發(fā)需求進(jìn)行處理,直到處理結(jié)束退出。程序計(jì)數(shù)器(PC)、指令存儲(chǔ)器、譯碼器、寄存器堆、邏輯運(yùn)算單元(ALU),其中指令存儲(chǔ)器多個(gè)核之間共享。通常報(bào)文處理流程通過C語言或微碼編程后,會(huì)被編譯成一系列的指令執(zhí)行。由于轉(zhuǎn)發(fā)需求和報(bào)文長度不同,每個(gè)報(bào)文在處理器內(nèi)部的處理時(shí)間差異很大。在RTC架構(gòu)中,指令處理過程中,通過采用多線程來提高報(bào)文取址方式:報(bào)文根據(jù)起始PC讀取指令,在指令執(zhí)行結(jié)果中獲取下一條需要執(zhí)行指令的PC信息。當(dāng)遇到上下文切換指令,由于帶寬限制,當(dāng)多線程中的報(bào)文同時(shí)訪問指令存儲(chǔ)器時(shí)產(chǎn)生讀寫沖突,從memory中讀取指令到指令信息返回時(shí)延受到影響。查表內(nèi)存訪問沖突:對(duì)于RTC架構(gòu),在轉(zhuǎn)發(fā)流程中,多核處理DPU2年)器之間共享memory資源動(dòng)態(tài)共享,通過crossbar訪問表項(xiàng)memoryPipeline轉(zhuǎn)發(fā)架構(gòu)Pipeline架構(gòu)中,整個(gè)處理流程被拆分成多個(gè)不同的處理階段,對(duì)應(yīng)到不同的步驟,每一級(jí)轉(zhuǎn)發(fā)處理可以做成專用的硬件處理單元。當(dāng)?shù)谝粋€(gè)報(bào)文執(zhí)行完第一個(gè)步驟,進(jìn)入第二個(gè)步驟時(shí),第二個(gè)報(bào)文可以進(jìn)入流水線中的第一個(gè)步驟進(jìn)行處理。根據(jù)業(yè)務(wù)需求,將轉(zhuǎn)發(fā)流程拆分成多個(gè)處理步驟,每個(gè)步驟中只執(zhí)行特定的邏輯處理,主要應(yīng)用在數(shù)據(jù)中心交換機(jī)上,比如:BroadcomTD系列。DPU2年)Match-ActionPipeline架構(gòu)也是一種業(yè)界常用的pipeline架構(gòu)為,與固化Pipeline架構(gòu)相比,每個(gè)步驟中可根據(jù)業(yè)務(wù)生成靈活的查表信示。e在性能上,固化Pipeline架構(gòu)近乎定制化ASIC,相比于可編程Pipeline架構(gòu),吞吐更高,時(shí)延更低,邏輯處理單元復(fù)雜度更低與可編程Pipeline相比,固化Pipeline,不支持可編程和新的業(yè)許的情況下,支持新業(yè)務(wù)拓展。sRTCPipeline和RTC作為兩個(gè)主流轉(zhuǎn)發(fā)架構(gòu),RTC架構(gòu)在轉(zhuǎn)發(fā)業(yè)務(wù)中表項(xiàng)出豐富的靈活性,但隨著網(wǎng)絡(luò)流量的不斷增加,Pipeline架構(gòu)表現(xiàn)出相對(duì)優(yōu)勢(shì):在性能方面,1)在相同處理性能下,RTC架構(gòu)中通常采用多核多線程,來提高轉(zhuǎn)發(fā)性能,由于多線程面積占比較高(每個(gè)線程獨(dú)立維護(hù)相應(yīng)的寄存器信息),報(bào)文進(jìn)入處理器的調(diào)度和多核報(bào)文調(diào)度轉(zhuǎn)發(fā)邏輯資源面積較大,導(dǎo)致芯片面積和功耗通常為Pipeline架構(gòu)的數(shù)DPU2年)倍。2)由于多核處理器訪問內(nèi)存,導(dǎo)致帶寬壓力較大。為提高轉(zhuǎn)發(fā)時(shí)延方面,在Pipeline架構(gòu)下,不同步驟中的memory資源靜態(tài)分配,報(bào)文在轉(zhuǎn)發(fā)過程中執(zhí)行的指令信息提前預(yù)知。和RTC架構(gòu)相比,能夠大大降低由于讀寫/查表沖突帶來的時(shí)延,通常pipeline架構(gòu)對(duì)報(bào)文的處理時(shí)延是RTC架構(gòu)的數(shù)十分之一。從功耗、性能、面積的角度考慮,DPU跟隨網(wǎng)絡(luò)流量需求變化(業(yè)務(wù)需求不斷豐富、網(wǎng)絡(luò)時(shí)延敏感、功耗要求更低),基于可編程Pipeline的硬件架構(gòu)更符合DPU加速硬件報(bào)文轉(zhuǎn)發(fā)的發(fā)展方向。(三)網(wǎng)絡(luò)可編程技術(shù)在以算力為中心的時(shí)代,網(wǎng)絡(luò)邊緣設(shè)備已經(jīng)從柜頂交換機(jī)延展到DPU,DPU已經(jīng)成為數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)連接計(jì)算、存儲(chǔ)的新的接入節(jié)持網(wǎng)絡(luò)可編程技術(shù)成為DPU應(yīng)用于新一代數(shù)字基礎(chǔ)設(shè)施的關(guān)鍵技術(shù)DPU上網(wǎng)絡(luò)可編程技術(shù)主要包括控制平面網(wǎng)絡(luò)可編程技術(shù)和數(shù)據(jù)平面網(wǎng)絡(luò)可編程技術(shù),其中控制平面網(wǎng)絡(luò)可編程技術(shù)主要應(yīng)用于DPU內(nèi)部的通用系統(tǒng)級(jí)芯片上,而數(shù)據(jù)平面網(wǎng)絡(luò)可編程技術(shù)則主要應(yīng)用在硬件加速器部分。DPU2年)DPU的數(shù)據(jù)平面主機(jī)側(cè)連接了多種類型的虛擬化設(shè)備,網(wǎng)絡(luò)側(cè)編程技術(shù)已經(jīng)成為DPU必須要支持的基礎(chǔ)能力。目前DPU數(shù)據(jù)平面網(wǎng)絡(luò)可編程技術(shù)主要包括基于快速流表和基PU控制平面上虛擬交換機(jī)以軟硬協(xié)同工作,軟硬件耦合較緊密,通常是由軟件虛擬交換機(jī)來適配DPU硬件數(shù)據(jù)平面來實(shí)現(xiàn)。上述方式是當(dāng)前市場上DPU的主流數(shù)據(jù)平面網(wǎng)絡(luò)可編程技術(shù),優(yōu)點(diǎn)是可以利用原有軟件虛擬交換機(jī)業(yè)務(wù)處理能力建立DPU硬件數(shù)據(jù)平面的快速流表,對(duì)硬件技術(shù)要求相對(duì)較低;缺點(diǎn)是DPU控制平面軟件參與網(wǎng)絡(luò)首包DPU2年)重,需要軟件適配工作。換機(jī)上網(wǎng)絡(luò)可編程技術(shù)的最佳實(shí)踐和發(fā)展趨勢(shì),以及BarefootTofino系列可編程芯片4和思科SiliconOne可編程芯片5在P4領(lǐng)域的成功經(jīng)驗(yàn),基于P4的協(xié)議無關(guān)的網(wǎng)絡(luò)可編程技術(shù),漸漸成為DPU上網(wǎng)絡(luò)可編程技術(shù)的發(fā)展方向。國內(nèi)外DPU廠商在產(chǎn)品Roadmap里均將P4網(wǎng)絡(luò)可編程能力作為DPU的重點(diǎn)功能來支持,其中以Pensando的DSC加速卡6和Intel的MountEvansIPU7為代表,這兩個(gè)產(chǎn)品在產(chǎn)品化的過程中也推動(dòng)著P4PNA(PortableNICArchitecture)標(biāo)準(zhǔn)8的發(fā)展。DPU硬件數(shù)據(jù)平面支持基于P4流水線的網(wǎng)絡(luò)可編程技術(shù)的優(yōu)點(diǎn)在于通過P4語言可以同時(shí)定義了管理控制消息語義和硬件數(shù)據(jù)平面的業(yè)務(wù)處理流水線,使得DPU控制平面上只需要實(shí)現(xiàn)管理控制消息轉(zhuǎn)換配置下發(fā)給DPU硬件數(shù)據(jù)平面,進(jìn)而降低了對(duì)DPU上系統(tǒng)級(jí)芯片的要求;不足在于當(dāng)前DPU上P4語言標(biāo)準(zhǔn)對(duì)于用戶可編程的支持還有待完善,但在廠商可編程,拓展用戶場景和延長產(chǎn)品生命周期上術(shù)的廠商還比較有限。為了促進(jìn)P4網(wǎng)絡(luò)可編程技術(shù)的發(fā)展,開放數(shù)據(jù)中心委員會(huì)(OpenDataCenterCommittee,ODCC)持續(xù)開展相關(guān)4/content/www/us/en/products/network-io/programmable-ethernet-switch/tofino-series.html5/c/en/us/solutions/silicon-one.html6/en/accelerators/pensando7/content/www/us/en/products/network-io/infrastructure-processing-units/asic/es2000asic.html8/p4-spec/docs/PNA-v0.5.0.html研究,已經(jīng)發(fā)布了《P4敏捷可編程轉(zhuǎn)發(fā)設(shè)計(jì)白皮書》、《P4超融合網(wǎng)關(guān)技術(shù)白皮書》等成果。另外,除了快速流表和P4流水線這兩種主要的數(shù)據(jù)平面網(wǎng)絡(luò)可卸載的應(yīng)用并不廣泛。(四)開放網(wǎng)絡(luò)及DPU軟件生態(tài)由于DPU芯片的發(fā)展還處于早期階段,DPU的軟件生態(tài)也處于萌芽狀態(tài)。目前,市場上主流的開放網(wǎng)絡(luò)及DPU軟件生態(tài)主要有ProgrammableInfrastructure)項(xiàng)目9、由Intel驅(qū)動(dòng)主導(dǎo)的IPDK (InfrastructureProgrammerDevelopmentKit)框架10、NvidiaDPU的Architecture)11、開放數(shù)據(jù)中心委員會(huì)開展的無損網(wǎng)絡(luò)項(xiàng)目等&DPU作為數(shù)據(jù)中心基礎(chǔ)設(shè)施的一顆重要芯片,擁有一個(gè)社區(qū)驅(qū)動(dòng)的、基于標(biāo)準(zhǔn)的開放生態(tài)系統(tǒng),以開放的形式定義DPU標(biāo)準(zhǔn)可編程基礎(chǔ)設(shè)施生態(tài),對(duì)DPU的長期發(fā)展至關(guān)重要。一個(gè)富有生命力的DPU的軟件生態(tài)需要具備條件為提供一個(gè)基于開放社區(qū)的DPU軟件堆棧以及用戶驅(qū)動(dòng),且與供應(yīng)商無關(guān)的軟件架和架構(gòu)。支持既有的DPU開源應(yīng)用程序生態(tài)系統(tǒng),包括DPDK,OVS,SPDK等已經(jīng)在用戶側(cè)有廣泛應(yīng)用的開源應(yīng)用軟件。定義9/10https://ipdk.io/11/networking/docaDPU2年)DPU/IPU(InfrastructureProcessingUnit)開放可編程基礎(chǔ)設(shè)施的接口API,用于DPU/IPU生態(tài)系統(tǒng)相關(guān)組件元素進(jìn)行交互,包括硬件、軟件應(yīng)用程序、主機(jī)節(jié)點(diǎn)以及配置、編排和運(yùn)維等相關(guān)接口,實(shí)現(xiàn)裸金屬、IaaS虛擬機(jī)和容器化平臺(tái)的統(tǒng)一管理調(diào)度功能。定義統(tǒng)一的目標(biāo)做到與底層硬件目標(biāo)解耦。支持?jǐn)?shù)據(jù)平面的P4可編程的編譯環(huán)境和軟件部署模式?;谝陨蠘?biāo)準(zhǔn)我們對(duì)現(xiàn)有的DPU軟件生態(tài)做比較,SONiC是由用戶驅(qū)動(dòng)的開放網(wǎng)絡(luò)平
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年秘書證考試項(xiàng)目管理能力試題及答案
- 2024稅務(wù)師復(fù)習(xí)筆記試題及答案
- 樓宇資產(chǎn)管理培訓(xùn)
- 汽車診斷方案
- 2025冰箱清潔服務(wù)合同范本
- 202520加盟店合同轉(zhuǎn)讓協(xié)議示例
- 針灸模型項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 漯河職業(yè)技術(shù)學(xué)院《數(shù)字影像設(shè)計(jì)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 洛陽職業(yè)技術(shù)學(xué)院《基于工程項(xiàng)目管理應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧夏銀川市寧大附中2024-2025學(xué)年高三畢業(yè)班聯(lián)考(二)數(shù)學(xué)試題含解析
- 國際貿(mào)易理論與實(shí)務(wù)(天津財(cái)經(jīng)大學(xué))知到章節(jié)答案智慧樹2023年
- 教學(xué)防滅火新技術(shù) 公開課比賽一等獎(jiǎng)
- 電磁學(xué)知到章節(jié)答案智慧樹2023年天津大學(xué)
- 四年級(jí)數(shù)學(xué)下冊(cè)教案(先學(xué)后教當(dāng)堂訓(xùn)練)
- 改革開放與新時(shí)代智慧樹知到答案章節(jié)測試2023年同濟(jì)大學(xué)
- 敦煌的藝術(shù)智慧樹知到答案章節(jié)測試2023年
- 淺談心理學(xué)在促進(jìn)社會(huì)工作服務(wù)質(zhì)量中的作用
- JJG 913-2015浮標(biāo)式氧氣吸入器
- GB/Z 20308-2006產(chǎn)品幾何技術(shù)規(guī)范(GPS)總體規(guī)劃
- 2023年沈陽職業(yè)技術(shù)學(xué)院高職單招(數(shù)學(xué))試題庫含答案解析
- GB/T 28731-2012固體生物質(zhì)燃料工業(yè)分析方法
評(píng)論
0/150
提交評(píng)論