AI時(shí)代的下一代數(shù)據(jù)中心網(wǎng)絡(luò)研究報(bào)告_第1頁
AI時(shí)代的下一代數(shù)據(jù)中心網(wǎng)絡(luò)研究報(bào)告_第2頁
AI時(shí)代的下一代數(shù)據(jù)中心網(wǎng)絡(luò)研究報(bào)告_第3頁
AI時(shí)代的下一代數(shù)據(jù)中心網(wǎng)絡(luò)研究報(bào)告_第4頁
AI時(shí)代的下一代數(shù)據(jù)中心網(wǎng)絡(luò)研究報(bào)告_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、AI時(shí)代的下一代數(shù)據(jù)中心網(wǎng)絡(luò)研究報(bào)告 研究報(bào)告為AI時(shí)代打造的下一代數(shù)據(jù)中心網(wǎng)絡(luò)目錄 HYPERLINK l _bookmark0 介 紹 HYPERLINK l _bookmark0 1 HYPERLINK l _bookmark0 應(yīng)用負(fù)載趨勢 HYPERLINK l _bookmark0 1 HYPERLINK l _bookmark0 媒體和流媒體 HYPERLINK l _bookmark0 1 HYPERLINK l _bookmark1 事務(wù)負(fù)載、容器和微服務(wù)架構(gòu) HYPERLINK l _bookmark1 2 HYPERLINK l _bookmark2 數(shù)據(jù)分析(含AI/M

2、L) HYPERLINK l _bookmark2 3 HYPERLINK l _bookmark2 分布式存儲 HYPERLINK l _bookmark2 3 HYPERLINK l _bookmark2 數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)和趨勢 HYPERLINK l _bookmark2 3 HYPERLINK l _bookmark3 更快更新的Fabric HYPERLINK l _bookmark3 4 HYPERLINK l _bookmark3 提升緩存和減少丟包4 HYPERLINK l _bookmark3 虛擬化支持 HYPERLINK l _bookmark4 4 HYPERLINK

3、l _bookmark3 SDN和可編程 HYPERLINK l _bookmark4 4 HYPERLINK l _bookmark3 策略、意圖以及AI/ML賦能的自動化 HYPERLINK l _bookmark4 4 HYPERLINK l _bookmark4 AI/ML優(yōu)化和安全異常檢測5 HYPERLINK l _bookmark4 故障檢測、定位和排除5 HYPERLINK l _bookmark4 結(jié)論5第 ii 頁Next-Gen Data Center Networking - Built for AI, Powered by AITable of ContentsPag

4、e iii為AI時(shí)代打造的下一代數(shù)據(jù)中心網(wǎng)絡(luò)目錄華為Al Fabric解決方案 HYPERLINK l _bookmark5 華為Al Fabric解決方案介紹 HYPERLINK l _bookmark5 6 HYPERLINK l _bookmark5 EANTC認(rèn)證 HYPERLINK l _bookmark5 6 HYPERLINK l _bookmark5 華為Al Fabric方案創(chuàng)新iLossless算法 HYPERLINK l _bookmark5 6 HYPERLINK l _bookmark6 Al Fabric在數(shù)據(jù)中心網(wǎng)絡(luò)的適用場景 HYPERLINK l _bookm

5、ark6 7 HYPERLINK l _bookmark6 以太網(wǎng)為中心的Al負(fù)載解決方案 HYPERLINK l _bookmark6 7 HYPERLINK l _bookmark6 云和容器原生的網(wǎng)絡(luò)和存儲 HYPERLINK l _bookmark6 7 HYPERLINK l _bookmark6 結(jié)論 HYPERLINK l _bookmark6 7研究報(bào)告是由AvidThink有限責(zé)任公司的分析師創(chuàng)建的獨(dú)立內(nèi)容。這些報(bào)告是通過我們商業(yè)支持者的贊助得以實(shí)現(xiàn)的。贊助者對報(bào)告內(nèi)容沒有任何的干涉,這里所呈現(xiàn)的觀點(diǎn),僅代表AvidThink有限責(zé)任公司的觀點(diǎn)。想獲得更多有關(guān)報(bào)告贊組的信息,

6、請通過researchavidthink com聯(lián)系我們。關(guān)于AvidThinkAvidThink是一家研究分析公司,專注于提供對基礎(chǔ)設(shè)施技術(shù)的最前沿的見解。AvidThink的前身是SdxCentral研究小組,在2018年10月作為一家獨(dú)立公司創(chuàng)辦。在過去的五年里,四萬位技術(shù)買家和行業(yè)思想領(lǐng)袖下載了超過11萬份的AvidThink研究報(bào) 告。AvidThink的專業(yè)領(lǐng)域包括邊緣和物聯(lián)網(wǎng)、SD-WAN、云和容器、SDN、NFV、超融合以及AI/ML的基礎(chǔ)設(shè)施應(yīng)用和安全。您可以通過 HYPERLINK / www avidthink com.訪問AvidThink。第 iii 頁第 PAGE

7、1 頁 研究報(bào)告為AI時(shí)代打造的下一代數(shù)據(jù)中心網(wǎng)絡(luò)介紹應(yīng)用發(fā)展推動數(shù)據(jù)中心的變革。視頻和媒體豐富的內(nèi)容構(gòu)成了如今互聯(lián)網(wǎng)的大部分流量,占據(jù)了所有IP流量的近四分之三。流媒體以及嵌入更多互動內(nèi)容的社交和移動應(yīng)用將使數(shù)據(jù)中心南北向流量中的媒體業(yè)務(wù)持續(xù)增長。與此同時(shí),5G、物聯(lián)網(wǎng)和基于 Web的應(yīng)用的興起,將在相同的路徑上驅(qū)動大量的API和事務(wù)性流量。在數(shù)據(jù)中心內(nèi),基于微服務(wù)的軟件架構(gòu)、分布式存儲和人工智能/機(jī)器學(xué)習(xí)(AI/ML)負(fù)載的發(fā)展正將東西向流量推至一個(gè)前所未有的高度。當(dāng)我們研究與負(fù)載有關(guān)的市場時(shí),很顯然每一個(gè)市場都將出現(xiàn)顯著增長的趨勢。針對大數(shù)據(jù)市場,IDC研究公司預(yù)計(jì),2022年全球大數(shù)據(jù)

8、和商業(yè)分析解決方案的收入將達(dá)到2600億美金,年均復(fù)合增長率達(dá)11 .9%,其中增長最快的技術(shù)類別為認(rèn)知/人工智 能軟件平臺(年均復(fù)合增長率達(dá)36 .5%)和非關(guān)系分析數(shù)據(jù)存儲(年均復(fù)合增長率達(dá)30 .3%)1。IDC在存儲市場的研究表明,全球企業(yè)存儲系統(tǒng)的收入在2018年第三季度中同比增長了19 .4%,達(dá)到140億美金,服務(wù)器存儲的收入同比增長了10 .1%,達(dá)到38億 美金2。當(dāng)然,AI/ML市場的重大影響,不僅僅體現(xiàn)在IT上,還體現(xiàn)在GDP上。知名咨詢公司普華永道預(yù)計(jì),到2030年,AI將為全球 經(jīng)濟(jì)貢獻(xiàn)157000億美元3。這些驚人的數(shù)據(jù)將推動數(shù)據(jù)中心網(wǎng)絡(luò)在性能、規(guī)模和可見性方面進(jìn)行

9、創(chuàng)新。畢竟,數(shù)據(jù)中心網(wǎng)絡(luò)將承載支撐AI/ML的流量和分 布式存儲?;诖耍髷?shù)據(jù)分析不會真的消失。我們將研究這些新負(fù)載對網(wǎng)絡(luò)上的壓力,以及網(wǎng)絡(luò)如何應(yīng)對這些新的挑戰(zhàn)。應(yīng)用負(fù)載趨勢數(shù)據(jù)中心架構(gòu)設(shè)計(jì)用于支撐在當(dāng)今業(yè)務(wù)和消費(fèi)空間中占據(jù)主導(dǎo)地位的關(guān)鍵應(yīng)用。隨著基于Web的應(yīng)用的普及和公有云的發(fā)展, 數(shù)據(jù)中心需要滿足軟件即服務(wù)(SaaS)、基礎(chǔ)架構(gòu)即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)和容器即服務(wù)(CaaS)平臺的需求,這些平臺構(gòu)成了如今所有主流云提供商(包括谷歌、亞馬遜和微軟)的應(yīng)用主干,并且為FaceBook、Twitter、Uber、Lyft、AirBnB等 互聯(lián)網(wǎng)巨頭的大規(guī)模發(fā)展和滲透提供媒介

10、。其中每個(gè)平臺都是由驅(qū)動數(shù)據(jù)中心架構(gòu)特別是數(shù)據(jù)中心網(wǎng)絡(luò)的首要架構(gòu)組成。每一個(gè)平臺都包含數(shù)據(jù)中心架構(gòu),特別是數(shù)據(jù)中心網(wǎng)絡(luò)(DCN)的總體架構(gòu)。基于微服務(wù)的軟件架構(gòu)、分布式存儲和人工智能/機(jī)器學(xué)習(xí)負(fù)載的發(fā)展正將東西向流量推至一個(gè)前所未有的高度。媒體和流媒體正如介紹中提到的,如今的視頻流量占據(jù)了大量的互聯(lián)網(wǎng)帶寬。雖然并不是所有的數(shù)據(jù)中心都將成為媒體服務(wù)器站,但多媒體將在絕大多數(shù)數(shù)據(jù)中心流量中呈現(xiàn)并發(fā)揮重要作用。除了YouTube、Netflix、HBO等視頻娛樂網(wǎng)站之外,視頻還在類似統(tǒng)一通信等商業(yè)應(yīng)用,以及新聞和信息網(wǎng)站、物聯(lián)視頻監(jiān)控和社交媒體應(yīng)用中有起重要作用。這些數(shù)據(jù)流很可能會穿越南北向路徑,但

11、也會產(chǎn)生東西向流量,因?yàn)樗鼈儠跀?shù)據(jù)中心內(nèi)部進(jìn)行視頻分析或轉(zhuǎn)碼服務(wù)。雖然視頻流對時(shí)延和少量丟包有一定的容忍,但它們總是消耗大量的可用帶寬,并且需要在DCN中轉(zhuǎn)發(fā)。1 IDC全球半年度大數(shù)據(jù)和分析支出指南: HYPERLINK /getdoc.jsp?containerId=prUS44215218 https:/www .idc .com/getdoc .jsp?containerld=prUS442152182 IDC全球季度企業(yè)存儲系統(tǒng)跟蹤: HYPERLINK /getdoc.jsp?containerId=prUS44539118 https:/www .idc .com/getdoc

12、 .jsp?containerld=prUS445391183 普華永道對全球人工智能研究利用AI革命: HYPERLINK /gx/en/issues/data-and-analytics/publications/artificial-intelligence-study.html /gx/en/issues/data-and-analytics/publications/artificial-intelligence-study.html第 PAGE 2 頁為AI時(shí)代打造的下一代數(shù)據(jù)中心網(wǎng)絡(luò)AI/ML 負(fù)載大數(shù)據(jù)分析視頻轉(zhuǎn)碼處理微服務(wù)跨組件流量分布式存儲東西向視頻和音頻網(wǎng)絡(luò)應(yīng)用物聯(lián)網(wǎng)控制

13、和數(shù)據(jù)南北向應(yīng)用負(fù)載驅(qū)動更多東西向流量事務(wù)負(fù)載、容器和微服務(wù)架構(gòu)除了視頻流之外,我們預(yù)計(jì)移動、物聯(lián)網(wǎng)和基于Web的應(yīng)用將繼續(xù)增長。雖然視頻流可能會占用帶寬,但這些API調(diào)用將構(gòu)成 大量的連接和事務(wù)。對于實(shí)時(shí)游戲、物聯(lián)網(wǎng)控制等應(yīng)用,低時(shí)延和高可靠的DCN可以提升用戶體驗(yàn)。此外,為了適應(yīng)高事務(wù)率,應(yīng)用開發(fā)人員開始使用容器和微服務(wù)架構(gòu)來實(shí)現(xiàn)所需的規(guī)模和穩(wěn)健性。甚至像Netflix這樣的流媒體公司都使用這些應(yīng)用來管理所有的事務(wù)和搜索能力以及視頻轉(zhuǎn)碼4。這是通過內(nèi)容分發(fā)網(wǎng)絡(luò)來增強(qiáng)的,用于快速視頻傳輸。保持這些容器和基于微服務(wù)的應(yīng)用平穩(wěn)運(yùn)行的關(guān)鍵在于對數(shù)據(jù)中心東西向連接的高事務(wù)率的支持。很多應(yīng)用都具備社交

14、的衍生功能,這意味著網(wǎng)絡(luò)效應(yīng)和宣傳可能導(dǎo)致某種類型的流量激增,增加了這一挑戰(zhàn)。例如Tweet風(fēng)暴或金融交易中的一輪拋 售。在這類情況下,網(wǎng)絡(luò)層面會產(chǎn)生流量的微突發(fā),如果管理不當(dāng)?shù)脑?,會造成丟包和極端時(shí)延。4 Netflix如何運(yùn)作: HYPERLINK /refraction-tech-everything/how-netflix-works-the-hugely-simplified-complex-stuff-that-happens-every-time-you-hit-play-3a40c9be254b /refraction-tech-everything/ how-netflix-

15、works-the-hugely- HYPERLINK /refraction-tech-everything/how-netflix-works-the-hugely-simplified-complex-stuff-that-happens-every-time-you-hit-play-3a40c9be254b simplified-complex-stuff-that-happens-every-time-you-hit-play-3a40c9be254b第 PAGE 3 頁為AI時(shí)代打造的下一代數(shù)據(jù)中心網(wǎng)絡(luò)數(shù)據(jù)分析(含AI/ML)類似ML流量,這些存儲協(xié)議會受到時(shí)延和丟包的嚴(yán)重影響,

16、需要特殊處理。視頻和應(yīng)用流量會占用數(shù)據(jù)中心的南北向通道,而數(shù)據(jù)分析會產(chǎn)生大量的東西向流量。大數(shù)據(jù)不再像過去那樣盛行。就在幾年前,Hadoop還是所有追求數(shù)據(jù)驅(qū)動的企業(yè)的寵兒。盡管不復(fù)盛況,Hadoop、Apache Spark及其同 行仍在企業(yè)分析方面仍占據(jù)重要地位,我們相信大數(shù)據(jù)分析正在從低谷中崛起,并開始增加真正的價(jià)值。企業(yè)將繼續(xù)建設(shè)數(shù)據(jù)倉庫和數(shù)據(jù)湖,大數(shù)據(jù)分析將成為企業(yè)IT領(lǐng)域的永久組成部分。企業(yè)的數(shù)據(jù)分析也同時(shí)出現(xiàn)了一個(gè)新的趨勢,即人工智能(AI)和機(jī)器學(xué)習(xí)(ML)。與大數(shù)據(jù)處理不同,現(xiàn)在我們需要運(yùn)算數(shù)據(jù)進(jìn)行機(jī)器。我們看到從支 持Hadoop的Map-Reduce混洗/排序方法,轉(zhuǎn)移到

17、支持Tensor Flow、PyTorch和其他機(jī)器學(xué)習(xí)庫這樣一個(gè)趨勢,這些負(fù)載本質(zhì)上與高性能計(jì)算相似,其中協(xié)作算法集群定期來回遷移數(shù)據(jù)。因此機(jī)器學(xué)習(xí)負(fù)載對時(shí)延和丟包極度敏感。分布式存儲除了應(yīng)用程序之外,我們注意到數(shù)據(jù)中心正在采用融合和超融合的基礎(chǔ)設(shè)施。隨著SSD、存儲級存儲(SCM)、分布式集群存儲、云原生和容器原生存儲的興起,我們看到了數(shù)據(jù)中心存儲架構(gòu)的演變。遷移到容器中的軟件應(yīng)用正在推動存儲架構(gòu)的統(tǒng)一。新的軟件架構(gòu)取代傳統(tǒng)的存儲區(qū)域網(wǎng)絡(luò)(SAN)或網(wǎng)絡(luò)附加存儲(NAS),使得每個(gè)計(jì)算節(jié)點(diǎn)都具備SSD和SCM,同時(shí)運(yùn)行云原生分布式存儲(如GlusterFS或Ceph)。因此存儲流量不是通過

18、網(wǎng)絡(luò)中的特定路徑,例如,通過光纖通道到SAN或預(yù)先建立到NAS的鏈路。存儲流量增加了部分運(yùn)行在以太網(wǎng)鏈路上的東西向流量。和ML流量一樣,這些存儲協(xié)議會受到時(shí)延和丟包的嚴(yán)重影響。數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)和趨勢研究了新的應(yīng)用程序和應(yīng)用架構(gòu)帶來的新需求之后,我們將研究DCN需要提供的支持。首先,為了充分支撐這些新負(fù)載的規(guī)模和需求,DCN采用了新技術(shù),包括部署400GbE的高速連接交換機(jī)和HW網(wǎng)卡加速器卸載器。DCN還通過SDN、自動化和基于意圖的管理和編排系統(tǒng)來促進(jìn)規(guī)模和管理性能。同時(shí),我們還看到處于早期,接受度有限的高可編程的商用硅片,可以支持像P4 這樣的編程構(gòu)造。此外,用于故障檢測和故障處理的自動化工

19、具也開始在DCN進(jìn)行創(chuàng)新和成熟應(yīng)用。數(shù)據(jù)中心交換的關(guān)鍵創(chuàng)新點(diǎn)意向,策略,自動化SDN,可編程性和P4.深度緩存,完善的緩存管理,更快的速度400GbE+AI/ML優(yōu)化與安全2/3層 Clos架構(gòu)第 PAGE 4 頁為AI時(shí)代打造的下一代數(shù)據(jù)中心網(wǎng)絡(luò)更快更新的Fabric如今,低時(shí)延、高帶寬的25GbE、40GbE和100GbE交換機(jī)是大多數(shù)數(shù)據(jù)中心的主流設(shè)備,而由主流制造商生產(chǎn)的更高速率的400GbE交換機(jī)正在進(jìn)軍市場。服務(wù)器網(wǎng)卡也正在升級到更高的吞吐量,同時(shí)提供通過商用硅片、網(wǎng)絡(luò)處理器單元(NPU)或現(xiàn)場可編程邏輯門陣列(FGPA)板載輔助芯片加速。再加上像數(shù)據(jù)平面開發(fā)套件(DPDK)這樣的

20、軟件來提高服務(wù)器I/O性能,將會繼續(xù)驅(qū)動數(shù)據(jù)中心的流量。像InfiniBand這樣的非以太網(wǎng)Fabric會繼續(xù)在數(shù)據(jù)中心發(fā)揮作用,因?yàn)樗鼈兲岣吡送ǔEcHPC負(fù)載相結(jié)合的無損fabric的速度。 InfiniBand的HDR模式提供高達(dá)600Gbps的速率并且仍繼續(xù)努力超越。然而,由于單一Fabric使得數(shù)據(jù)中心運(yùn)營商在交換機(jī)、布線、操作和基礎(chǔ)設(shè)施維護(hù)方面實(shí)現(xiàn)標(biāo)準(zhǔn)化,基于RoCE和RoCEv2標(biāo)準(zhǔn)的融合以太網(wǎng)受到許多數(shù)據(jù)中心運(yùn)營商的青睞。NVMe是一種高性能的存儲訪問協(xié)議,是新一代DCN可能具備的的另一項(xiàng)技術(shù)。而NVMe通常用于本地磁盤和緩存。一個(gè)新的NVMeF規(guī)范將NVMe協(xié)議變成了一個(gè)有效的

21、網(wǎng)絡(luò)存儲協(xié)議,它支持塊設(shè)備和多種類型的RDMA,包括InfiniBand和iWARP,以及類似FCoE的FC隧道。提升緩存和減少丟包改進(jìn)交換機(jī)的資源管理是DCN中另一個(gè)有助于支持新一波應(yīng)用的措施。新的交換系統(tǒng)傾向于提供深層緩沖區(qū),以確保在擁塞環(huán)境中進(jìn)行可靠的報(bào)文傳輸。這些緩沖區(qū)是用來承受通往同一個(gè)端口的應(yīng)用流量的微突發(fā),并防止丟包。其他技術(shù)包括虛擬輸出隊(duì)列和智能檢測大小流,以確保重要的應(yīng)用控制消息傳輸,而不以長時(shí)間存活的大流傳輸為代價(jià)。例如,如果一個(gè)大型視頻轉(zhuǎn)碼項(xiàng)目在相同的東西向通道上開展,可以避免應(yīng)用程序中關(guān)鍵API信息的丟失或延遲增加。此外,為了幫助基于RDMA的AI / ML和存儲工作負(fù)

22、載在無損模式下運(yùn)行,除了支持顯式擁塞通知(ECN),現(xiàn)代以太網(wǎng)交換機(jī)還支持基于優(yōu)先級的流量控制(PFC)等以太網(wǎng)數(shù)據(jù)中心橋接(DCB)擴(kuò)展。RoCE在HPC和ML場景中尤其有價(jià)值,支持零丟包消息傳遞,保證存儲網(wǎng)絡(luò)達(dá)到最大每秒進(jìn)行讀寫操作的次數(shù)(IOPS)。RoCE通過反壓和緩存管理,保證了以太網(wǎng)fabric不丟包, 從而提高了存儲吞吐量,減少了ML庫的任務(wù)完成時(shí)間。然而,許多緩沖管理技術(shù)仍然需要操作員輸入并重新設(shè)置最適合于DC中特定負(fù)載的適當(dāng)閾值。隨著自動化和AI/ML的改進(jìn),一 些配置參數(shù)中可能會實(shí)時(shí)控制或根據(jù)大數(shù)據(jù)分析和/或機(jī)器學(xué)習(xí)訓(xùn)練的結(jié)果來設(shè)置。虛擬化支持IBNS有望將工程團(tuán)隊(duì)從容易出

23、錯(cuò)和單調(diào)的網(wǎng)絡(luò)配置中釋放,讓他們專注于業(yè)務(wù)策略、業(yè)務(wù)級監(jiān)控和滿足新應(yīng)用的需求。雖然我們沒有明確說明虛擬化是新的數(shù)據(jù)中心負(fù)載的一部分,但虛擬機(jī)仍然是數(shù)據(jù)中心架構(gòu)的一個(gè)主要組成部分。即使在容器場景下,也存在大量虛擬機(jī),很多私有數(shù)據(jù)中心正在部署并將繼續(xù)在虛擬機(jī)上部署容器。結(jié)合控制和編排軟件,許多現(xiàn)代交換機(jī)為虛擬機(jī)提供了獨(dú)特的能力。確實(shí)存在一些支持虛擬機(jī)的組件,但其中一個(gè)關(guān)鍵的組件是使能負(fù)載的IP地址可移植。這使得虛擬機(jī)可以在范圍內(nèi)移動,并在交換機(jī)上跟蹤它們的位置。SDN和可編程雖然SDN控制器不再像以前那樣流行,但是他們?nèi)岳^續(xù)發(fā)展,并提供關(guān)鍵的配置、發(fā)放和編排功能。數(shù)據(jù)中心內(nèi)幾乎所有的網(wǎng)絡(luò)虛擬化解決

24、方案都有一個(gè)SDN控制器組件,通常與虛擬機(jī)和容器管理系統(tǒng)緊密集成。SDN( 包括Open Flow和更新的P4編程語言)提供了改進(jìn)的DCN內(nèi)部資源的協(xié)調(diào)能力以支持新的負(fù)載,并為DCN的全局優(yōu)化提供了機(jī)會。策略、意圖以及AI/ML賦能的自動化從fabric可編程性來看,現(xiàn)代DCN的某些方面不涉及數(shù)據(jù)平面,甚至不涉及控制平面。網(wǎng)絡(luò)設(shè)備的管理和配置可能是可擴(kuò)展性和無縫操作的限制。通過使用網(wǎng)絡(luò)虛擬化將以前由物理設(shè)備提供的功能轉(zhuǎn)換為更容易被代碼操控的軟件構(gòu)造,促進(jìn)了網(wǎng)絡(luò)自動化。同時(shí),向標(biāo)準(zhǔn)配置AP(I RESTful接口)的轉(zhuǎn)變允許網(wǎng)絡(luò)自動化管理物理交換機(jī)、路由器和其他設(shè)備。第 PAGE 5 頁為AI時(shí)

25、代打造的下一代數(shù)據(jù)中心網(wǎng)絡(luò)同時(shí),向網(wǎng)絡(luò)自動化的轉(zhuǎn)變采用了新的基于意圖的網(wǎng)絡(luò)系統(tǒng)(IBNS)。在IBNS中,網(wǎng)絡(luò)工程師將表達(dá)網(wǎng)絡(luò)的期望狀態(tài),即個(gè)人意圖,并讓自動化系統(tǒng)將需求編譯成網(wǎng)絡(luò)中不同設(shè)備所需的低級格式。IBNS有望將工程師從容易出錯(cuò)和單調(diào)的網(wǎng)絡(luò)配置中釋放,讓他們專注于業(yè)務(wù)策略、業(yè)務(wù)級監(jiān)控和滿足新應(yīng)用的需求。主流制造商已經(jīng)宣布支持IBNS,但每個(gè)制造商的定義和方法略 有不同。無論如何,我們期待新一代基于意圖的網(wǎng)絡(luò)管理解決方案將結(jié)合AI/ML和其他復(fù)雜的分析模型來“學(xué)習(xí)”正常的操作邊 界,并實(shí)施網(wǎng)絡(luò)和安全策略。AI/ML優(yōu)化和安全異常檢測AI/ML可以進(jìn)一步增加價(jià)值的另一個(gè)領(lǐng)域是優(yōu)化DCN以實(shí)

26、現(xiàn)最大吞吐量、最小丟包和時(shí)延?,F(xiàn)代網(wǎng)絡(luò)的其中一個(gè)特點(diǎn)是具備豐 富的遙測技術(shù)。一些交換機(jī)將提供每個(gè)端口的緩沖隊(duì)列長度的詳細(xì)視圖,以及有關(guān)流量和丟包率的其它相關(guān)數(shù)據(jù)。ML庫可以利用這些信息來生成和訓(xùn)練模型,這些模型可能更擅長調(diào)整交換機(jī)配置和設(shè)備參數(shù),以確保leaf-spine fabric計(jì)算集群的端到端的最佳性能。同時(shí),ML庫可以使用相同的信息來檢測數(shù)據(jù)中心內(nèi)潛在的安全漏洞和異常事件。通過從應(yīng)用負(fù)載中獲取信息,ML模型可以查找應(yīng)用事件與網(wǎng)絡(luò)數(shù)據(jù)之間的關(guān)聯(lián),并推斷出特定負(fù)載的正?;€行為。一旦這些模型創(chuàng)建并訓(xùn)練成功,他們可以對數(shù)據(jù)中心中可能存在的漏洞進(jìn)行監(jiān)視和警告。故障檢測、定位和排除使用遙測數(shù)據(jù)

27、除了進(jìn)行調(diào)優(yōu)和保障安全之外還可以用于故障檢測和排除。某些分析系統(tǒng)將鏡像這些數(shù)據(jù)用于檢測安全漏洞, 但是在這種情況下,數(shù)據(jù)需要經(jīng)過訓(xùn)練來識別故障并找出根本原因。這些系統(tǒng)甚至開始預(yù)測事件,例如根據(jù)需要增加容量或在故障停機(jī)之前更換故障設(shè)備。供應(yīng)商也在預(yù)測未來,并討論這些基于ML的解決方案如何通過避免或重新路由流量,甚至自動修復(fù)錯(cuò)誤配置實(shí)現(xiàn)DCN自修復(fù)。其中大部分仍處于原型測試階段,尚未廣泛部署。結(jié)論數(shù)據(jù)中心負(fù)載正在迅速變化,從南北向轉(zhuǎn)變?yōu)樾枰纫酝叩臇|西向流量吞吐量。大量媒體流、高事務(wù)API調(diào)用率、跨集群存儲請求,以及服務(wù)器間大數(shù)據(jù)和ML數(shù)據(jù)集傳輸?shù)慕M合,對數(shù)據(jù)中心網(wǎng)絡(luò)提出了更高的要求,如對高帶

28、寬、低時(shí)延和低丟包的網(wǎng)絡(luò)結(jié)構(gòu)的需求。因此,網(wǎng)絡(luò)社區(qū)和供應(yīng)商已經(jīng)采用了一系列似乎符合需求的新技術(shù),包括從400GbE升級到智能網(wǎng)卡,從SDN 和P4轉(zhuǎn)變?yōu)榛谝鈭D的網(wǎng)絡(luò)和網(wǎng)絡(luò)自動化,以及AI/ML的應(yīng)用。從本質(zhì)上講,我們期望通過AI/ML來幫助優(yōu)化數(shù)據(jù)中心,以便更 好地支撐AI/ML負(fù)載。隨著數(shù)據(jù)中心進(jìn)入云計(jì)算的時(shí)代和無數(shù)新興應(yīng)用的發(fā)展,網(wǎng)絡(luò)生態(tài)系統(tǒng)可能在初期落后于計(jì)算,但隨著網(wǎng)絡(luò)研究人員、供應(yīng)商和網(wǎng)絡(luò)運(yùn)營商的不斷加速創(chuàng)新,我們相信他們已經(jīng)追趕上來并會在未來幾年持續(xù)的創(chuàng)新。第 PAGE 6 頁研究報(bào)告 解決方案評審華為AI Fabric解決方案華為AI Fabric 解決方案介紹華為Al Fab

29、ric智能無損數(shù)據(jù)中心網(wǎng)絡(luò)解決方案旨在為數(shù)據(jù)中心中需要高性能的新負(fù)載提供零丟包,低時(shí)延和高吞吐量的網(wǎng)絡(luò)。華為認(rèn)為RDMA將是提升Al和分布式存儲負(fù)載性能的關(guān)鍵因素,AI Fabric通過支持RoCEv2構(gòu)建高性能的RDMA網(wǎng)絡(luò)。EANTC認(rèn)證由歐洲國際公認(rèn)的測試中心EANTC測試的華為CloudEngine交換機(jī)目前支持25GbE和100GbE標(biāo)準(zhǔn),AvidThink預(yù)計(jì)400GbE交換機(jī)即將入市。在使用了英特爾的消息傳遞接口(MPI)基準(zhǔn)的HPC場景下,EANTC驗(yàn)證了使用RoCEv2交換機(jī)的網(wǎng)絡(luò)性能。MPI是一套用于確定HPC性能的開源基準(zhǔn)集。此外,EANTC實(shí)驗(yàn)室通過開源I/O負(fù)載生成器

30、和I/O測試器FIO測試了分布式文件系統(tǒng)(DFS) 場景。與未開啟AI Fabric的情況相比,在HPC測試場景中,Al Fabric將通信時(shí)延降低了約40%;而在DFS測試中,將整體IOPS提升了25%。在整個(gè)測試的過程中無丟包且保證了高吞吐量。華為AI Fabric創(chuàng)新iLossless算法華為通過使用一系列資源管理算法,統(tǒng)稱為iLossless算法,取得了上述成效。這些創(chuàng)新解決了我們在研究概要中討論的一些挑 戰(zhàn),包括頭端阻塞、大小流檢測和減緩,以及流量微突發(fā)。使用RDMA和RoCE也可以幫助解決在HPC負(fù)載(包括AI/ML)的進(jìn)程間 通信的時(shí)延挑戰(zhàn)。華為的iLossless算法包括多項(xiàng)旨

31、在提高交換機(jī)性能的創(chuàng)新技術(shù)。一些關(guān)鍵改進(jìn)包括虛擬輸入隊(duì)列,它在出端口上為每個(gè)入端口分配獨(dú)立的隊(duì)列。如果存在多個(gè)輸入流,不堪重負(fù)的出端口可以獨(dú)立地對每個(gè)入端口進(jìn)行反壓,避免丟包。另一項(xiàng)創(chuàng)新是動態(tài)擁塞水線設(shè)置,系統(tǒng)可以智能地動態(tài)管理ECN和PFC的緩沖閾值水平。如果ECN閾值設(shè)置得太低,則時(shí)延敏感的控制流會受益,但大流會受影響導(dǎo)致整體吞吐量低。另一方面,如果ECN閾值設(shè)置過高,交換機(jī)可以處理更大的流量突發(fā)并增加大流吞吐量,但這可能會對小流造成危害。Al Fabric解決方案通過考慮系統(tǒng)流量模型的流量特征和并發(fā)性,以及緩存利用率、歷史隊(duì)列深度和發(fā)送速率等因素來設(shè)置這些閾值。另一組技術(shù)涉及快速擁塞反饋

32、,其中Al Fabric可以提前觸發(fā)擁塞通知,無需等待目標(biāo)服務(wù)器發(fā)生擁塞。這也可以防止隊(duì)列緩沖區(qū)過度擁塞并過早觸發(fā)PFC,從而導(dǎo)致級聯(lián)對性能不利。此外,Al Fabric還可以通過在其轉(zhuǎn)發(fā)芯片的表中存儲相關(guān)的流信息來識別大小流。該信息可用于減少通常攜帶控制信息的小流的頭端阻塞,減少HPC、大數(shù)據(jù)分析和AI/ML的任務(wù)完成時(shí)間。華為還利用這一流特征將大流分解為更小的流量,使他們能夠更像小流一樣便于管理。這樣可以提高ECMP場景下的負(fù)載均衡,保證可用帶寬得到充分利用。以上重點(diǎn)介紹了iLossless智能無損系列算法中的一些技術(shù)。華為將在未來的軟件發(fā)布中增加更多的內(nèi)容。對于許多算法來說,設(shè)置正確的閾

33、值對性能至關(guān)重要,并且其本身可以算是一門藝術(shù)。華為基于AI芯片根據(jù)實(shí)時(shí)負(fù)載自動調(diào)整閾值。作為研究概要的一部分,該概要的贊助者華為公司要求AvidThink對其解決方案進(jìn)行獨(dú)立評審,因?yàn)樗c研究概要的 主題相關(guān)。AvidThink利用贊助者提供的信息和AvidThink本身對數(shù)據(jù)中心網(wǎng)絡(luò)趨勢的市場研究進(jìn)行了此次評審。其中 所引用的任何性能測量、數(shù)字和改進(jìn)均基于贊助者提供的結(jié)果以及EANTC于2018年7月進(jìn)行的獨(dú)立測試。AvidThink 尚未認(rèn)證任何性能聲明,對正在評審的解決方案感興趣的讀者應(yīng)確定此類聲明的真實(shí)性。AvidThink對于此處列出的任 何由于意外操作、損壞或錯(cuò)誤操作的不準(zhǔn)確之處,

34、不承擔(dān)任何責(zé)任。第 PAGE 7 頁解決方案評審 | 華為Al Fabric解決方案AI Fabric在數(shù)據(jù)中心網(wǎng)絡(luò)的適用場景正如我們在研究概要中討論的那樣,數(shù)據(jù)中心負(fù)載將包括大數(shù)據(jù)分析和AI/ML深度學(xué)習(xí)負(fù)載。這將驅(qū)動更多的東西向流量,新一 代的微服務(wù)應(yīng)用也將如此。我們也越來越多地將分布式集群存儲視為云原生存儲解決方案的關(guān)鍵驅(qū)動因素。華為的Al Fabric可能會對這些負(fù)載產(chǎn)生積極的影響。以太網(wǎng)為中心的AI負(fù)載解決方案隨著AI/ML和大數(shù)據(jù)分析的增加,需要通過RDMA等機(jī)制降低時(shí)延,提高吞吐量。大多數(shù)AI/ML和大數(shù)據(jù)分析(如Apache),由于 數(shù)據(jù)集較大,都作為集群進(jìn)程運(yùn)行。許多負(fù)載在迭代輪詢中運(yùn)行數(shù)據(jù),在每個(gè)輪詢期的節(jié)點(diǎn)之間進(jìn)行大量數(shù)據(jù)交換。AI/ML研究人員認(rèn)識到這一點(diǎn)并提供了利用RDMA和InfiniBand的庫。主要的Al框架包括Tensor Flow和Microsoft Cognitive Toolkit以及NVIDIA的NCCL等庫,通過InfiniBand的verb API為InfiniBand標(biāo)準(zhǔn)提供了原生支持。因此,一些數(shù)據(jù)中心將選擇InfiniBand進(jìn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論