算力網(wǎng)絡(luò)前沿報(bào)告_第1頁
算力網(wǎng)絡(luò)前沿報(bào)告_第2頁
算力網(wǎng)絡(luò)前沿報(bào)告_第3頁
算力網(wǎng)絡(luò)前沿報(bào)告_第4頁
算力網(wǎng)絡(luò)前沿報(bào)告_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、前言新一代信息網(wǎng)絡(luò)正在從以信息傳遞為核心的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,向融合計(jì)算、存儲、傳送資源的智能化云網(wǎng)基礎(chǔ)設(shè)施發(fā)生轉(zhuǎn)變。算力網(wǎng)絡(luò)正是為應(yīng)對這種轉(zhuǎn)變而提出的新型網(wǎng)絡(luò)架構(gòu)。算力網(wǎng)絡(luò)基于無處不在的網(wǎng)絡(luò)連接,將動(dòng)態(tài)分布的計(jì)算與存儲資源互聯(lián),通過網(wǎng)絡(luò)、存儲、算力等多維度資源的統(tǒng)一協(xié)同調(diào)度,使海量的應(yīng)用能夠按需、實(shí)時(shí)調(diào)用泛在分布的計(jì)算資源,實(shí)現(xiàn)連接和算力在網(wǎng)絡(luò)的全局優(yōu)化,提供一致的用戶體驗(yàn)。支撐算力網(wǎng)絡(luò)實(shí)現(xiàn)的關(guān)鍵技術(shù),可以歸類為云、網(wǎng)、芯三個(gè)方面。從云化技術(shù)來看,需要在目前已實(shí)現(xiàn)對虛擬資源編排的基礎(chǔ)上,向容器編排和算力編排演進(jìn),并針對網(wǎng)絡(luò)中異構(gòu)算力資源并存的情況,探索計(jì)算能力的統(tǒng)一納管與提供服務(wù)的方式。從網(wǎng)絡(luò)技術(shù)

2、來看,需要在目前已實(shí)現(xiàn)云網(wǎng)拉通和統(tǒng)一配置的基礎(chǔ)上,向基于 SRv6 技術(shù)的網(wǎng)絡(luò)切片能力增強(qiáng)演進(jìn),并增強(qiáng)資源感知與應(yīng)用感知能力,提升算力觸達(dá)用戶的廣度和精度。從芯片技術(shù)來看,需要在傳統(tǒng)固定流程 ASIC 芯片架構(gòu)的基礎(chǔ)上,向具備可編程能力的新一代交換芯片架構(gòu)演進(jìn),并增強(qiáng)網(wǎng)絡(luò)轉(zhuǎn)發(fā)面編程能力以便與計(jì)算芯片相配合,賦予設(shè)備更靈活的功能。本報(bào)告主要研究算力網(wǎng)絡(luò)的發(fā)展趨勢、技術(shù)特征、以及所面臨的挑戰(zhàn),希望拋磚引玉,共同推進(jìn)我國計(jì)算產(chǎn)業(yè)和網(wǎng)絡(luò)產(chǎn)業(yè)的協(xié)同發(fā)展與融合創(chuàng)新。本報(bào)告的主要撰寫人為唐雄燕、曹暢、李建飛、張帥、劉瑩、耿慶鵬、何濤、王友祥等 ,在此對這些專家的貢獻(xiàn)表示感謝!中國通信學(xué)會(huì)信息通信網(wǎng)絡(luò)技術(shù)委員

3、會(huì)主任委員:2020 年 12 月目錄 HYPERLINK l _TOC_250017 一、研究概述 1 HYPERLINK l _TOC_250016 二、計(jì)算與網(wǎng)絡(luò)產(chǎn)業(yè)全球發(fā)展態(tài)勢 1 HYPERLINK l _TOC_250015 三、算力網(wǎng)絡(luò)在我國的發(fā)展現(xiàn)狀 2 HYPERLINK l _TOC_250014 四、算力網(wǎng)絡(luò)關(guān)鍵技術(shù) 4 HYPERLINK l _TOC_250013 (一)算力網(wǎng)絡(luò)技術(shù)體系 4 HYPERLINK l _TOC_250012 (二)算力網(wǎng)絡(luò)承載技術(shù) 5 HYPERLINK l _TOC_250011 (三)算力網(wǎng)絡(luò)編排技術(shù) 7 HYPERLINK l _

4、TOC_250010 (四)算力網(wǎng)絡(luò)轉(zhuǎn)發(fā)技術(shù) 9 HYPERLINK l _TOC_250009 五、算力網(wǎng)絡(luò)工程難題 10 HYPERLINK l _TOC_250008 (一)算力資源的感知與度量 10 HYPERLINK l _TOC_250007 (二)集中式控制與分布式控制的協(xié)同 11 HYPERLINK l _TOC_250006 六、政策建議 12 HYPERLINK l _TOC_250005 (一)技術(shù)政策建議 12大力推進(jìn)算力全網(wǎng)感知與端管云協(xié)同 12 HYPERLINK l _TOC_250004 積極推動(dòng)算力網(wǎng)絡(luò)的標(biāo)準(zhǔn)化工作 13 HYPERLINK l _TOC_25

5、0003 (二)產(chǎn)業(yè)政策建議 14 HYPERLINK l _TOC_250002 促進(jìn)計(jì)算產(chǎn)業(yè)和網(wǎng)絡(luò)產(chǎn)業(yè)融合與能力互補(bǔ) 14 HYPERLINK l _TOC_250001 加快推進(jìn)算力向邊緣下沉 14 HYPERLINK l _TOC_250000 注重算力網(wǎng)絡(luò)產(chǎn)業(yè)的自主可控 14一、 研究概述隨著 5G、大數(shù)據(jù)、人工智能、區(qū)塊鏈等信息通信技術(shù)的推廣應(yīng)用,經(jīng)濟(jì)社會(huì)向數(shù)字化轉(zhuǎn)型升級的趨勢愈發(fā)明顯。2020 年以來,國家發(fā)布了以“新基建”為導(dǎo)向的一系列政策,旨在通過加快建設(shè)數(shù)字化基礎(chǔ)設(shè)施,提升各行業(yè)的“聯(lián)接+計(jì)算”能力,引領(lǐng)重大科技創(chuàng)新、重塑產(chǎn)業(yè)升級模式,為社會(huì)發(fā)展注入更強(qiáng)動(dòng)力?!奥?lián)接+計(jì)算”

6、能力的提升,需要計(jì)算和網(wǎng)絡(luò)兩大產(chǎn)業(yè)的有機(jī)協(xié)同,相互配合,在計(jì)算服務(wù)與網(wǎng)絡(luò)服務(wù)均面向泛在化發(fā)展的今天,探索云-邊-端多級計(jì)算資源和服務(wù)能力如何通過網(wǎng)絡(luò)實(shí)現(xiàn)智能調(diào)度和高效分配十分必要,也是必須攻克的技術(shù)難題。二、 計(jì)算與網(wǎng)絡(luò)產(chǎn)業(yè)全球發(fā)展態(tài)勢數(shù)字化、智能化正在加快推動(dòng)計(jì)算產(chǎn)業(yè)的創(chuàng)新。數(shù)字化浪潮正在 改變著世界經(jīng)濟(jì)格局,IDC 預(yù)測,2023 年全球 GDP 的 62%將是數(shù)字 經(jīng)濟(jì)產(chǎn)值。世界各主要經(jīng)濟(jì)體國家紛紛通過國家戰(zhàn)略來搶占數(shù)字經(jīng)濟(jì) 產(chǎn)業(yè)鏈的制高點(diǎn),如美國的美國國家網(wǎng)絡(luò)戰(zhàn)略、德國的高技術(shù)戰(zhàn) 略 2025、日本的日本制造業(yè)白皮書等。此外,當(dāng)前以云計(jì)算、大數(shù)據(jù)、移動(dòng)超寬帶為核心的智能化創(chuàng)新正在變革生

7、產(chǎn)、管理和營銷 模式,升級傳統(tǒng)生產(chǎn)力,加速數(shù)字經(jīng)濟(jì)的發(fā)展。智能化、數(shù)字化催生 了海量的場景和應(yīng)用,促使?jié)M足多樣化計(jì)算需求的融合計(jì)算架構(gòu)出現(xiàn),以及云-邊-端結(jié)合的泛在計(jì)算模式興起。這些變化都將結(jié)合容器、微 服務(wù)、云原生和 DevOps 等開發(fā)模式直接推動(dòng)計(jì)算產(chǎn)業(yè)的快速變革。行業(yè)數(shù)字化轉(zhuǎn)型和產(chǎn)業(yè)智能化升級促使網(wǎng)絡(luò)產(chǎn)業(yè)向著超寬管道、泛在連接、場景化需求的方向發(fā)展。從業(yè)務(wù)看,5G 特性將帶動(dòng) VR、 AR、云游戲等大帶寬、低時(shí)延業(yè)務(wù)走向商業(yè)化,同時(shí)奠定 Cloud+X發(fā)展基礎(chǔ)。從流量看,未來移動(dòng)數(shù)據(jù)流量將會(huì)迎來再次劇增。愛立信預(yù)測,2025 年全球移動(dòng)數(shù)據(jù)流量較 2019 年將增加 5 倍,其中 45

8、%將會(huì)由 5G 網(wǎng)絡(luò)承載。網(wǎng)絡(luò)帶寬的擴(kuò)大與業(yè)務(wù)類型的不斷拓展將增加網(wǎng)絡(luò)中的視頻流量,預(yù)計(jì) 2025 年占比增至 76%,以國內(nèi)電信運(yùn)營商中國聯(lián)通為例,2020 年 5 月視頻流量占比已達(dá) 72%。新應(yīng)用、新技術(shù)、新計(jì)算架構(gòu),百億級聯(lián)接、爆炸式數(shù)據(jù)增長將重塑 ICT 產(chǎn)業(yè)新格局,催生新的生態(tài)體系。一方面要求新計(jì)算架構(gòu)必須具備海量數(shù)據(jù)處理分析能力,各種應(yīng)用場景下人工智能訓(xùn)練和推理能力,另一方面要求網(wǎng)絡(luò)對于大規(guī)模聯(lián)接場景下的安全和實(shí)時(shí)數(shù)據(jù)傳輸處理等能力。預(yù)計(jì) 2021 年,將有超過 500 億的終端設(shè)備,產(chǎn)生 847ZB/年的數(shù)據(jù)量,2023 年 IP 設(shè)備將達(dá) 29.3 億,M2M 的連接數(shù)將超過

9、 14 億。這將產(chǎn)生海量的數(shù)據(jù),帶動(dòng)海量數(shù)據(jù)分析處理,并圍繞數(shù)據(jù)創(chuàng)造價(jià)值,這就同時(shí)需要泛在計(jì)算的支持和優(yōu)質(zhì)的網(wǎng)絡(luò)保障。由此判斷,新的 ICT 格局將向著泛在聯(lián)接與泛在計(jì)算緊密結(jié)合的方向演進(jìn)。三、 算力網(wǎng)絡(luò)在我國的發(fā)展現(xiàn)狀近年來,中國政府相繼出臺國家信息化發(fā)展戰(zhàn)略綱要、“十三五”國家信息化規(guī)劃、中國制造 2025等重大戰(zhàn)略綱領(lǐng),明確 “數(shù)字中國”建設(shè)發(fā)展的路線圖和時(shí)間表,全面推進(jìn)國民經(jīng)濟(jì)各行各業(yè)的數(shù)字化和智能化。IDC 預(yù)測,到 2023 年,數(shù)字經(jīng)濟(jì)產(chǎn)值將占到中國 GDP 的 67%,超過全球平均水平。伴隨著我國數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展,新一代信息技術(shù)間的融合效應(yīng)漸顯,“5G+云+AI”將成為推動(dòng)我

10、國數(shù)字經(jīng)濟(jì)持續(xù)發(fā)展的重要引擎。結(jié)合未來計(jì)算形態(tài)云-邊-端泛在分布的趨勢,計(jì)算與網(wǎng)絡(luò)的融合將會(huì)更加緊密,因此,我國率先提出了“算力網(wǎng)絡(luò)”的概念。算力網(wǎng)絡(luò)需要網(wǎng)絡(luò)和計(jì)算高度協(xié)同,將計(jì)算單元和計(jì)算能力嵌入網(wǎng)絡(luò),實(shí)現(xiàn)云、網(wǎng)、邊、端、業(yè)的高效協(xié)同,提高計(jì)算資源利用率。在算力網(wǎng)絡(luò)中,用戶無需關(guān)心網(wǎng)絡(luò)中的計(jì)算資源的位置和部署狀態(tài),而只需關(guān)注自身獲得的服務(wù)即可,并通過網(wǎng)絡(luò)和計(jì)算協(xié)同調(diào)度保證用戶的一致體驗(yàn)。目前來看,我國信息通信行業(yè)對“5G+云+AI”的探索處于世界領(lǐng)先地位,這些都帶動(dòng)了全網(wǎng)的算力密集分布,快速下沉并且逐步實(shí)現(xiàn)聯(lián)網(wǎng)服務(wù)。至今為止,算力網(wǎng)絡(luò)的愿景已在業(yè)界得到廣泛的認(rèn)可,算力網(wǎng)絡(luò)在標(biāo)準(zhǔn)制定、生態(tài)建設(shè)

11、、試驗(yàn)驗(yàn)證等領(lǐng)域均取得了一定進(jìn)展,并且作為我國的一項(xiàng)原創(chuàng)成果,開始走向國際舞臺。標(biāo)準(zhǔn)制定方面,國內(nèi)三大運(yùn)營商中國移動(dòng)、中國電信與中國聯(lián)通分別在 ITU-T SG11與 13 組立項(xiàng)了 Y.CPN,Y.CAN 和 Q.CPN 等系列標(biāo)準(zhǔn),在 IETF 開展了 Computing First Network Framework 等系列研究,華為聯(lián)合國內(nèi)運(yùn)營商在 ETSI 和寬帶論壇(BBF)也啟動(dòng)了包括 NWI、城域算網(wǎng)在內(nèi)的多個(gè)項(xiàng)目。在國內(nèi)的 CCSA,“算力網(wǎng)絡(luò)需求與架構(gòu)”以及“算力感知網(wǎng)絡(luò)關(guān)鍵技術(shù)研究”兩項(xiàng)研究也在有序開展。面向未來 6G 時(shí)代,算力網(wǎng)絡(luò)已經(jīng)成為國內(nèi) IMT-2030 6G

12、網(wǎng)絡(luò)組的研究課題之一,正在開展算力網(wǎng)絡(luò)與 6G 通信技術(shù)的融合研究。生態(tài)建設(shè)方面,國內(nèi)未來數(shù)據(jù)通信研究的主要組織網(wǎng)絡(luò) 5.0 產(chǎn)業(yè)聯(lián)盟專門成立了“算力網(wǎng)絡(luò)特設(shè)工作組”,MEC 領(lǐng)域的多個(gè)開源組織也發(fā)起了 KubeEdge、Edge- Gallery 等開源項(xiàng)目,2019 年底,在中國聯(lián)通、中國移動(dòng)和邊緣計(jì)算網(wǎng)絡(luò)產(chǎn)業(yè)聯(lián)盟(ECNI)均發(fā)布了算力網(wǎng)絡(luò)領(lǐng)域相關(guān)白皮書,進(jìn)一步闡述了算網(wǎng)融合的重要觀點(diǎn)。試驗(yàn)驗(yàn)證方面,2019 年中國電信與中國移動(dòng)均已完成算力網(wǎng)絡(luò)領(lǐng)域的實(shí)驗(yàn)室原型驗(yàn)證,并在 GSMA 巴塞羅那展、ITU-T 和 GNTC 相關(guān)展會(huì)上發(fā)布成果。中國聯(lián)通也在推進(jìn)算力網(wǎng)絡(luò)平臺的自主研發(fā),并積極策

13、劃現(xiàn)網(wǎng)試點(diǎn)工作。2018 年以來,國家提出一系列加快5G 商用步伐,加強(qiáng)人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新型基礎(chǔ)設(shè)施建設(shè)的政策建議,“新基建”的概念由此產(chǎn)生。2020 年 4 月,國家發(fā)改委首次對新基建的具體含義進(jìn)行了闡述,在信息基礎(chǔ)設(shè)施部分,提出構(gòu)建以數(shù)據(jù)中心、智能計(jì)算中心為代表的算力基礎(chǔ)設(shè)施。從新基建政策的導(dǎo)向來看,給予了算力提供者、網(wǎng)絡(luò)運(yùn)營者、服務(wù)提供者和服務(wù)使用者等不同角色引入多方參與的空間,同時(shí)也給以算力網(wǎng)絡(luò)技術(shù)為基礎(chǔ)的轉(zhuǎn)-算-存主體分離、聯(lián)合服務(wù)的新商業(yè)模式提供了寶貴的嘗試空間。四、 算力網(wǎng)絡(luò)關(guān)鍵技術(shù)(一) 算力網(wǎng)絡(luò)技術(shù)體系從算力網(wǎng)絡(luò)所倡導(dǎo)的技術(shù)理念中可以看出,算網(wǎng)一體是結(jié)合 5G、

14、泛在計(jì)算與 AI 的發(fā)展,在云網(wǎng)拉通和協(xié)同基礎(chǔ)上的下一個(gè)階段,即云網(wǎng)融合 2.0 階段。云網(wǎng)融合 2.0 是在繼承云網(wǎng)融合 1.0 工作的基礎(chǔ)上,強(qiáng)調(diào)結(jié)合未來業(yè)務(wù)形態(tài)的變化,在云、網(wǎng)、芯三個(gè)層面持續(xù)推進(jìn)研發(fā),實(shí)現(xiàn)應(yīng)用部署匹配計(jì)算,網(wǎng)絡(luò)轉(zhuǎn)發(fā)感知計(jì)算,芯片能力增強(qiáng)計(jì)算,服務(wù)算力網(wǎng)絡(luò)時(shí)代云游戲、千人千面直播、自動(dòng)駕駛、智能安防與工業(yè)機(jī)器視覺等新業(yè)態(tài),其技術(shù)內(nèi)涵如圖 1 所示。圖 1 算力網(wǎng)絡(luò)與云網(wǎng)融合 2.0 示意從圖中可以看出,算力網(wǎng)絡(luò)的技術(shù)內(nèi)涵是在現(xiàn)有 SDN/NFV 技術(shù)基礎(chǔ)上的發(fā)展和升華,相關(guān)技術(shù)可概括為承載、編排和轉(zhuǎn)發(fā)三個(gè)方面,分別對應(yīng) SDN2.0,NFV2.0 和 DCN2.0,本章節(jié)

15、的后續(xù)部分將會(huì)逐一進(jìn)行闡述。(二) 算力網(wǎng)絡(luò)承載技術(shù)隨著 5G、云服務(wù)和物聯(lián)網(wǎng)等新興業(yè)務(wù)的發(fā)展,更多網(wǎng)絡(luò)設(shè)備的接入對于地址擴(kuò)展的需求和網(wǎng)絡(luò)可編程的需求都在增加,“IPv6+”是面向 5G 和云時(shí)代的智能 IP 網(wǎng)絡(luò),可以滿足算力網(wǎng)絡(luò)靈活組網(wǎng)、優(yōu)化用戶體驗(yàn)按需服務(wù)等需求。算力承載網(wǎng)以 SRv6 技術(shù)為底座,在網(wǎng)絡(luò)切片能力的基礎(chǔ)上,引入網(wǎng)絡(luò)感知技術(shù),解決當(dāng)前網(wǎng)絡(luò)難以感知業(yè)務(wù)需求,算力和服務(wù)難以良好匹配的問題。在算力網(wǎng)絡(luò)中,業(yè)務(wù)網(wǎng)關(guān)進(jìn)一步下沉,并通過算力網(wǎng)關(guān)將南北向流量提前轉(zhuǎn)化為東西向流量,同時(shí)利用 IPv6 可擴(kuò)展頭豐富的可編程空間,開展 IPv6+網(wǎng)絡(luò)新技術(shù)包括但不限于 VPN+(網(wǎng)絡(luò)切片)、I

16、FIT(隨路網(wǎng)絡(luò)檢測)、SFC 等和新應(yīng)用開發(fā),實(shí)現(xiàn)城域算力基礎(chǔ)設(shè)施互聯(lián),通過業(yè)務(wù)的部署和資源調(diào)整來保證應(yīng)用的 SLA 要求,以此提供業(yè)務(wù)鏈服務(wù),如圖 2 所示。圖 2 算力網(wǎng)絡(luò)資源感知和信息交互示例當(dāng)前,CCSA (中國通信標(biāo)準(zhǔn)化協(xié)會(huì))TC3 正在開展算力網(wǎng)絡(luò)需求與架構(gòu)的研究工作,其思路是通過網(wǎng)絡(luò)、存儲、算力等多維度資源的統(tǒng)一管理和協(xié)同調(diào)度,實(shí)現(xiàn)連接和算力在網(wǎng)絡(luò)的全局優(yōu)化,技術(shù)實(shí)現(xiàn)上可分為集中式方案、分布式方案、及混合式方案等多種技術(shù)路線。除基于數(shù)據(jù)中心 SDN 集中調(diào)度的方案,還可基于電信運(yùn)營商承載網(wǎng)分布式控制能力,結(jié)合承載網(wǎng)網(wǎng)元自身控制協(xié)議擴(kuò)展,復(fù)用現(xiàn)有 IP 網(wǎng)絡(luò)控制平面分布式協(xié)議的方

17、式實(shí)現(xiàn)算力信息的分發(fā)與基于算力尋址的路由,如圖 3 所示,同時(shí)綜合考慮實(shí)時(shí)的網(wǎng)絡(luò)和計(jì)算資源狀況,將不同的應(yīng)用調(diào)度到合適的計(jì)算節(jié)點(diǎn)處理。圖 3 算力網(wǎng)絡(luò)分布式控制方案同時(shí),面向高質(zhì)量算力服務(wù)要求,算力網(wǎng)絡(luò)還需要引入確定性網(wǎng)絡(luò)技術(shù),通過資源預(yù)留和隊(duì)列管理算法來避免高優(yōu)先級報(bào)文之間的沖突,提供顯式路徑,對報(bào)文的路由進(jìn)行約束,最后通過冗余保護(hù)能夠在某一條路徑發(fā)生斷路丟包時(shí)無損切換到另一條路徑,保證業(yè)務(wù)的高可靠傳輸,實(shí)現(xiàn)對特定業(yè)務(wù)端到端時(shí)延的控制,打造確定性且有差異化的算力連接。(三) 算力網(wǎng)絡(luò)編排技術(shù)算力網(wǎng)絡(luò)是融合計(jì)算、存儲、傳送資源的智能化新型網(wǎng)絡(luò),通過全面引入云原生技術(shù),實(shí)現(xiàn)業(yè)務(wù)邏輯和底層資源的完

18、全解耦。需通過打造如 Kubernetes 的面向服務(wù)的容器編排調(diào)度能力,實(shí)現(xiàn)服務(wù)編排面向算網(wǎng)資源的能力開放。同時(shí),可結(jié)合 OpenStack 的底層基礎(chǔ)設(shè)施的資源調(diào)度管理能力,對于數(shù)據(jù)中心內(nèi)的異構(gòu)計(jì)算資源、存儲資源和網(wǎng)絡(luò)資源進(jìn)行有效管理,實(shí)現(xiàn)對泛在計(jì)算能力的統(tǒng)一納管和去中心化的算力交易,構(gòu)建一個(gè)統(tǒng)一的服務(wù)平臺,如圖 4 所示。圖 4:基于云原生的算力建模與服務(wù)編排示例圖 4 中,算力是設(shè)備/平臺處理、運(yùn)行業(yè)務(wù)的關(guān)鍵核心能力。在算力網(wǎng)絡(luò)中,算力的提供方不再是專有的某個(gè)數(shù)據(jù)中心或集群,而是將云邊端這種泛在的算力通過網(wǎng)絡(luò)化的方式連接在一起,實(shí)現(xiàn)算力的高效共享。因此,算力網(wǎng)絡(luò)中的算力資源將是泛在化的

19、、異構(gòu)化的。算力網(wǎng)絡(luò)中的算力資源包括傳統(tǒng)的 X86 通用服務(wù)器架構(gòu)下的 CPU 計(jì)算單元,專門適用處理類似圖形圖像等數(shù)據(jù)類型統(tǒng)一的 GPU并行計(jì)算芯片,專業(yè)加速處理神經(jīng)網(wǎng)絡(luò)的 NPU 或 TPU,廣泛應(yīng)用于邊緣側(cè)嵌入式設(shè)備的 ARM,半定制化處理器 FPGA 等等。由于所運(yùn)行算法的不同,所涉及的數(shù)據(jù)計(jì)算類型不同,從業(yè)務(wù)的角度出發(fā),將算力分為可提供邏輯運(yùn)算的算力、可提供并行計(jì)算的算力和可提供神經(jīng)網(wǎng)絡(luò)加速計(jì)算的算力。對于異構(gòu)算力資源,算力網(wǎng)絡(luò)架構(gòu)采用基于“K8S+輕量化 K8S”的兩級聯(lián)動(dòng)的架構(gòu)來實(shí)現(xiàn)統(tǒng)一的算力資源調(diào)度納管。K8S 采用中心的資源調(diào)度統(tǒng)一平臺對于整體的基礎(chǔ)資源進(jìn)行統(tǒng)一管理和集群管理

20、,而輕量化 K8S 集群主要是作為邊緣側(cè)得資源調(diào)度平臺對于邊緣計(jì)算集群進(jìn)行調(diào)度和管理。泛在算力資源的統(tǒng)一建模度量是算力調(diào)度的基礎(chǔ)。針對泛在的算 力資源,通過模型函數(shù)將不同類型的算力資源映射到統(tǒng)一的量綱維度,形成業(yè)務(wù)層可理解、可閱讀的零散算力資源池。為算力網(wǎng)絡(luò)的資源匹 配調(diào)度提供基礎(chǔ)保障。將業(yè)務(wù)運(yùn)行所需的算力需求按照一定分級標(biāo)準(zhǔn) 劃分為多個(gè)等級,這樣可為算力提供者設(shè)計(jì)業(yè)務(wù)套餐時(shí)進(jìn)行參考,也 可作為算力平臺設(shè)計(jì)者在設(shè)計(jì)算力平臺時(shí)根據(jù)所需運(yùn)行的業(yè)務(wù)對平 臺算力的選型設(shè)計(jì)提供依據(jù)。(四) 算力網(wǎng)絡(luò)轉(zhuǎn)發(fā)技術(shù)傳統(tǒng)的網(wǎng)絡(luò)設(shè)備采用轉(zhuǎn)控一體的工作模式,其轉(zhuǎn)發(fā)芯片的功能相對固化,“緊耦合”的網(wǎng)絡(luò)設(shè)備難以支撐算力網(wǎng)

21、絡(luò)對設(shè)備靈活性及可編程性的需求。新一代高性能可編程數(shù)據(jù)包處理芯片加上 P4 等編程語言的出現(xiàn),讓網(wǎng)絡(luò)擁有者、工程師、架構(gòu)師及管理員可以自上而下地定義數(shù)據(jù)包的完整處理流程。除了幫助算力網(wǎng)絡(luò)實(shí)現(xiàn)最適合其自身需求的具體網(wǎng)絡(luò)行為外,可編程芯片還能使芯片供應(yīng)商專注于設(shè)計(jì)并改進(jìn)那些可重用的數(shù)據(jù)包處理架構(gòu)和基本模塊,而不必糾結(jié)于特定協(xié)議里錯(cuò)綜復(fù)雜的細(xì)節(jié)和異常行為。因此,可編程芯片技術(shù)產(chǎn)生,為算力網(wǎng)絡(luò)轉(zhuǎn)發(fā)面提供了相應(yīng)的技術(shù)支撐。目前兩種主流的數(shù)據(jù)平面可編程語言為 P4 和 NPL,其中基于 P4語言描述的處理邏輯如圖 5 所示。該語言主要用于定義新協(xié)議和網(wǎng)絡(luò)相關(guān)功能(例如帶內(nèi)網(wǎng)絡(luò)遙測,VNF 卸載規(guī)則,傳輸層

22、負(fù)載均衡方案等),并以高級編程語言的形式呈現(xiàn)。圖 5 基于 P4 的協(xié)議無關(guān)可編程架構(gòu)在基于 P4 的協(xié)議無關(guān)可編程架構(gòu)下,用戶通過 P4 語言實(shí)現(xiàn)全流水線可編程,當(dāng)算力網(wǎng)絡(luò)需要引入諸如 SRv6 等新協(xié)議時(shí),用戶只需向 P4 程序添加新的邏輯即可,而基于 NPL 語言實(shí)現(xiàn)的編譯器可編程芯片,可支持系統(tǒng)工作時(shí)的各種功能更新。兩種方式都在很大程度上縮短了設(shè)備的開發(fā)周期,同時(shí)也提供了更快的數(shù)據(jù)包處理速度用以支撐算力網(wǎng)絡(luò)的后續(xù)部署。最新一代 P4 可編程芯片的總帶寬已達(dá)到 12.8Tbps,而最新一代 NPL 可編程芯片總帶寬范圍是 2Tbps 到 12.8Tbps。五、 算力網(wǎng)絡(luò)工程難題(一) 算

23、力資源的感知與度量算力網(wǎng)絡(luò)在工程實(shí)際應(yīng)用中首先面臨的是算力的感知與度量,進(jìn)而才能實(shí)現(xiàn)對算力的編排并合理快速匹配業(yè)務(wù)需求。目前,如何感知算力,并通過有效建模形成統(tǒng)一度量的算力資源,并能夠合理編排來滿足業(yè)務(wù)需求,是算力網(wǎng)絡(luò)研究的重點(diǎn)和難點(diǎn)之一。隨著 5G 人工智能等技術(shù)的發(fā)展,算力網(wǎng)絡(luò)中的算力提供方不再是專有的某個(gè)數(shù)據(jù)中心或計(jì)算集群,而是云邊端這種泛在化的算力通過網(wǎng)絡(luò)連接在一起,實(shí)現(xiàn)算力的高效共享。因此,算力網(wǎng)絡(luò)中的算力資源將是泛在化的、異構(gòu)化的。目前市面上不同廠家的計(jì)算芯片類型形式各異,如英偉達(dá) GPU,寒武紀(jì)的 ASIC,以及近年出現(xiàn)的 NPU、 TPU 等,這些芯片功能和適用場景各有側(cè)重,如

24、何準(zhǔn)確感知這些異構(gòu)的泛在芯片的算力大小、不同芯片所適合的業(yè)務(wù)類型以及在網(wǎng)絡(luò)中的位置,并且有效納管、監(jiān)督。針對泛在算力的納管方法也不再適合采用統(tǒng)一的調(diào)度方式,業(yè)界提出的兩級聯(lián)動(dòng)調(diào)度模式正在研究中。再者,所感知的算力需要映射到統(tǒng)一的度量單位,屏蔽不同算力類型的差異性,以形成上層資源調(diào)度器或編排器可理解、可量化的資源層。但是對于業(yè)務(wù)運(yùn)行,不光要有足夠的算力,同時(shí)也需要配套的存儲能力、網(wǎng)絡(luò)能力,甚至還可能需要編解碼能力、吞吐能力等來聯(lián)合保障用戶的業(yè)務(wù)體驗(yàn)。然后基礎(chǔ)算力難以度量,無法直觀合理的給出基礎(chǔ)算力的統(tǒng)一度量方法,建議從微服務(wù)的角度來衡量算力,并建立相應(yīng)的資源調(diào)度分配的標(biāo)準(zhǔn)和機(jī)制,降低算力網(wǎng)絡(luò)中業(yè)

25、務(wù)和應(yīng)用部署復(fù)雜度,簡化業(yè)務(wù)管理流程和機(jī)制。 (二) 集中式控制與分布式控制的協(xié)同算力網(wǎng)絡(luò)控制方案的實(shí)現(xiàn)有集中式和分布式兩種。集中式控制方案是基于數(shù)據(jù)中心 SDN 集中調(diào)度的方案,即在云數(shù)據(jù)中心內(nèi)部,由多個(gè)分布式應(yīng)用服務(wù)器節(jié)點(diǎn)構(gòu)成集群,分擔(dān)業(yè)務(wù)計(jì)算與存儲請求,同時(shí)云數(shù)據(jù)中心向城域網(wǎng)擴(kuò)展,與邊緣云相連接,通過集中式的 SDN控制器和 NFVO MANO 實(shí)現(xiàn)中心云及邊緣云間的算力網(wǎng)絡(luò)的統(tǒng)一管理和協(xié)同調(diào)度。分布式控制方案即基于電信運(yùn)營商承載網(wǎng)分布式控制能力,結(jié)合承載網(wǎng)網(wǎng)元自身控制協(xié)議擴(kuò)展,復(fù)用現(xiàn)有 IP 網(wǎng)絡(luò)控制平面的方式實(shí)現(xiàn)算力信息的分發(fā)與基于算力尋址的路由,同時(shí)綜合考慮實(shí)時(shí)的網(wǎng)絡(luò)和計(jì)算資源狀況

26、,將不同的應(yīng)用調(diào)度到合適的計(jì)算節(jié)點(diǎn)處理,實(shí)現(xiàn)連接和算力在網(wǎng)絡(luò)的全局優(yōu)化。對比集中控制與分布控制兩種方案,前者能夠做到算力節(jié)點(diǎn)的路 由可達(dá),配置通過集中式的 SDN 控制器可快速實(shí)現(xiàn)。但該方案的問 題是計(jì)算節(jié)點(diǎn)無法快速與網(wǎng)絡(luò)屬性聯(lián)動(dòng),也較難與 underlay 網(wǎng)絡(luò)聯(lián)動(dòng),因此建議作為算力網(wǎng)絡(luò)初期的實(shí)現(xiàn)方案。另一種分布控制方案,需要 根據(jù)具體的業(yè)務(wù)需求選擇 BGP 擴(kuò)展的種類和形式,實(shí)現(xiàn)比較復(fù)雜, 也尚未標(biāo)準(zhǔn)化。但是該方案充分調(diào)動(dòng)了承載網(wǎng)中 IP 路由器節(jié)點(diǎn)的控 制能力,應(yīng)用可以感知路徑中沿途的所有節(jié)點(diǎn)的服務(wù)質(zhì)量,是真正意 義上的計(jì)算需求向網(wǎng)絡(luò)開放,建議用于算力網(wǎng)絡(luò)的遠(yuǎn)期實(shí)現(xiàn),同時(shí)分 布式方案也更

27、適合具有基礎(chǔ)網(wǎng)絡(luò)資源的電信運(yùn)營商采用。六、 政策建議(一) 技術(shù)政策建議大力推進(jìn)算力全網(wǎng)感知與端管云協(xié)同 “IPv6+”拉通端管云以實(shí)現(xiàn)統(tǒng)一的網(wǎng)絡(luò)配置,可以滿足云網(wǎng)融合的靈活組網(wǎng)、業(yè)務(wù)快速開通、確定性傳輸、優(yōu)化用戶體驗(yàn)按需服務(wù)等需求。國內(nèi)運(yùn)營商和設(shè)備商為了滿足 IPv6+應(yīng)用場景如 5G 與邊緣計(jì)算等,選擇計(jì)算、存儲等基礎(chǔ) IT 資源離散部署或多級部署的方式,雖然短期看有利于快速滿足應(yīng)用場景需求,但長期看,隨著資源節(jié)點(diǎn)出現(xiàn)泛在化的特點(diǎn),還需解決以下問題,一是如何使得多方、異構(gòu)的資源整合在一起,解決云和網(wǎng)的靈活對接、云網(wǎng)資源的統(tǒng)一管控;二是如何在滿足用戶業(yè)務(wù)需求的情況下,實(shí)現(xiàn)資源利用的整體最優(yōu)化的問題。在國內(nèi)運(yùn)營商和設(shè)備商的積極推動(dòng)下,目前算力網(wǎng)絡(luò)協(xié)同的標(biāo)準(zhǔn)正在制定中,需要研究云服務(wù)應(yīng)用感知、算力資源及時(shí)調(diào)用與網(wǎng)絡(luò)能力開放之間的協(xié)調(diào)機(jī)制,以便更好地推進(jìn)云網(wǎng)融合,促進(jìn)算力的端管云拉通。積極推動(dòng)算力網(wǎng)絡(luò)的標(biāo)準(zhǔn)化工作算力網(wǎng)絡(luò)的標(biāo)準(zhǔn)化工作處于前期開展階段,我國的研究成果目前處于領(lǐng)先狀態(tài)。后續(xù)建議國內(nèi)運(yùn)營商和設(shè)備商結(jié)合自身的標(biāo)準(zhǔn)研究與應(yīng)用實(shí)踐,將標(biāo)準(zhǔn)推向國際化,進(jìn)一步推動(dòng)算力網(wǎng)絡(luò)技術(shù)的標(biāo)準(zhǔn)化程度。以解決對泛在計(jì)算和服務(wù)感知、互聯(lián)和資源控制和調(diào)度的問題及滿足未來新應(yīng)用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論