基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)_第1頁
基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)_第2頁
基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)_第3頁
基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)_第4頁
基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于分布式解耦的力增強(qiáng)技術(shù)白皮書信股份有限公司研究院12參與單位排序不分先后)主要編寫人員排序不分先后)3大模型的興起引發(fā)了產(chǎn)業(yè)的巨大變革,頭部云商基于AI大模型算網(wǎng)絡(luò)解決方案--基于分布式解耦的網(wǎng)絡(luò)4 3 6 6 6 8 8 8 9 10 12 12 13 17 5 21 21 21 23 24 4.1基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技 25 25 264.4基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技 27 6在數(shù)字化時代,AI大模型以前所未有的速度推動進(jìn)步使AI大模型訓(xùn)練的算力需求爆發(fā)式增長,給AI大模型發(fā)展為電信智算業(yè)務(wù)帶來前景,也對算力和網(wǎng)絡(luò)提出IDC發(fā)布的2024年V1版《全球人工智能AI業(yè)務(wù)快速發(fā)展的訴求,已經(jīng)成為當(dāng)前智算網(wǎng)絡(luò)面臨的7AI大模型訓(xùn)練是一種帶寬敏感的計算業(yè)務(wù)。傳統(tǒng)的中小模型訓(xùn)心網(wǎng)絡(luò)的傳輸帶寬有著更高的要求。以千億參數(shù)在AI大模型的大規(guī)模訓(xùn)練集群中,如何滿足低時延、高吞吐的機(jī)間通信,保障AI大模型訓(xùn)練的高頻計算和數(shù)據(jù)傳輸備轉(zhuǎn)發(fā)時延和光/電傳輸時延。靜態(tài)時延取決于8的丟包率大于10?3時,RDMA有效吞吐將急劇下降;2%的丟包率將使RDMA綜上,AI大模型訓(xùn)練對組網(wǎng)規(guī)模、帶寬這種方式需要端網(wǎng)協(xié)同、參數(shù)指標(biāo)動態(tài)及時調(diào)整,實AI大模型訓(xùn)練和海量數(shù)據(jù)處理需要高帶寬網(wǎng)絡(luò),以減少傳輸時9會給網(wǎng)卡帶來一定的性能壓力。佳流量轉(zhuǎn)發(fā)路徑的方式。但是此方案需要網(wǎng)絡(luò)交換機(jī)、SD到絕對的平均,有效的避免擁塞,并且能夠運(yùn)用E2基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案的物理基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案中的控制單元NCC呈盒式形態(tài),負(fù)責(zé)網(wǎng)絡(luò)的控制工作,創(chuàng)建網(wǎng)絡(luò)云集群,并對基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案中的交換單元NCF呈盒式形態(tài),每臺NCP和每臺NCF之間建議采用全互聯(lián)方式,連接類似Spine-Leaf求為支持IPv6、基本IGP路由與組播的三層交換機(jī),業(yè)界常見的48×10G+6×不做特殊要求,正?;ヂ?lián)即可。本方案網(wǎng)絡(luò)中基本的連接規(guī)則:必須保證每臺效。FTP文件傳輸、GRPC、NetconfAPI接口,以及版本Update議棧,包括以太網(wǎng)二層協(xié)議、三層路由協(xié)議、EVPNVxLAN協(xié)議、基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案的控一次性對整個網(wǎng)絡(luò)進(jìn)行軟件版本升級更新,無需逐臺NCF統(tǒng)一在NCC上登錄,并配置部署命令行置等下發(fā),無需逐個登錄NCF和NCPTelnet/SSH登錄、GRPC、萬+條,人工準(zhǔn)備配置開局、擴(kuò)容易出錯,人工開局需服務(wù)器內(nèi)GPU與網(wǎng)卡間拓?fù)溥B線,實現(xiàn)端網(wǎng)融合可視。支持多維度拓?fù)涔收蠙z決模型訓(xùn)練中的擁塞問題。實時感知網(wǎng)卡經(jīng)過NAK報文等網(wǎng)絡(luò)性能數(shù)據(jù),通過流路徑監(jiān)控網(wǎng)卡間路徑,輔助定位網(wǎng)絡(luò)性能等本方案采用的是信元機(jī)制+授權(quán)Credit擁塞控制的方式,其特點在于具備極佳的負(fù)載均衡、簡潔的轉(zhuǎn)發(fā)面路由部署和擁塞控制部如下圖所示,NCP和NCF之間無需部VLAN和對應(yīng)的網(wǎng)關(guān)IP地址,NCPNCP-NCF鏈路利用率趨近絕對均勻。擁塞控制分為推(Push)和拉(Pull)兩種方在配置部署方面,由于其采用基于信用授權(quán)的擁塞控制機(jī)制置,另一方面避免了PFC死鎖等問題?;诜植际浇怦畹木W(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案具有端過分類和轉(zhuǎn)發(fā)查找后,按目標(biāo)端口排隊到虛擬輸出隊列。入向NC將報文存于VOQ中等待。緩存可設(shè)置流控水線,超水線后入口NCP觸發(fā)反壓載平衡,使其成為承載無損、高利用率RDM分布式系統(tǒng)如盒盒組網(wǎng)、框盒組網(wǎng),需在Spine-Leaf之間規(guī)劃IP地址,部署B(yǎng)GP等路由協(xié)議,配置工作量大且復(fù)雜,均需部署,這一方面易造成PFC死鎖,影而基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案實以及網(wǎng)絡(luò)交換機(jī)逐包Spray噴灑,但依賴而基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案依在基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案中,NC到達(dá)出向NCP設(shè)備時,信元重組為以太網(wǎng)報文發(fā)至目首先,對不同算力規(guī)模下盒盒組網(wǎng)ECMP和基于分布式解耦的網(wǎng)絡(luò)能力增在實驗室中,分別利用盒盒組網(wǎng)ECMP和基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)RDMA網(wǎng)卡和GPU訓(xùn)練卡,使用AllR不均使擁塞概率和性能劣化加劇。通過實驗數(shù)據(jù)可以模擴(kuò)大,基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)增強(qiáng)技術(shù)方案在AI智算訓(xùn)練中的網(wǎng)絡(luò)帶寬利果更優(yōu),較好的適用于商用場景。當(dāng)32QP會話后,QP會話致使兩者帶寬利用率均有所降低。通過上述實驗可以得知:QP會話數(shù)量少時,盒盒組網(wǎng)的ECMP性能與基于分布式解基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案的轉(zhuǎn)發(fā)將基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案與TH系列包交換系統(tǒng)的故障收AI智算項目的建設(shè),除客戶自用外,相當(dāng)部分客戶期望提供對式實現(xiàn)轉(zhuǎn)發(fā)層面隔離,需要為每租戶以Permit/De的NCP業(yè)務(wù)端口上,即可完成租戶隔離網(wǎng)絡(luò)的部署,無其基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案具備較的擁塞控制能力,能夠解決網(wǎng)絡(luò)內(nèi)部擁塞問題,廠商的GPU組合訓(xùn)練,無技術(shù)封閉和解耦損失之憂。其優(yōu)秀的故障倒換性能大大降低了網(wǎng)絡(luò)故障損失,減少了丟包和重傳,有效避免提供機(jī)架級的網(wǎng)絡(luò)吞吐性能,幾乎無擁塞尾時延基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案目前在展生態(tài),芯片廠商除了博通公司的AI芯片,業(yè)界還有其他為代表的交換機(jī)廠商們也一直致力于基于分布式解耦的網(wǎng)絡(luò)能力的開發(fā)研究,已有可商用的交換機(jī)量產(chǎn),上下游生是為應(yīng)對智算業(yè)務(wù)發(fā)展需求所研發(fā)的網(wǎng)絡(luò)技術(shù)方案,旨在提升網(wǎng)絡(luò)服務(wù)的質(zhì)量,主導(dǎo)產(chǎn)業(yè)界進(jìn)行基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技術(shù)方案相關(guān)的技術(shù)標(biāo)準(zhǔn)3、加強(qiáng)基于分布式解耦的網(wǎng)絡(luò)能力增強(qiáng)技需要加強(qiáng)面向AI大模型、HPC、分布式存儲等新附錄A:術(shù)語與縮略語Equal-CostMultipathRExplicitCongestionNotiGenerativePre-trainedIn

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論