2024數(shù)字中國(guó)萬里行暨算力經(jīng)濟(jì)中國(guó)行考察報(bào)告_第1頁
2024數(shù)字中國(guó)萬里行暨算力經(jīng)濟(jì)中國(guó)行考察報(bào)告_第2頁
2024數(shù)字中國(guó)萬里行暨算力經(jīng)濟(jì)中國(guó)行考察報(bào)告_第3頁
2024數(shù)字中國(guó)萬里行暨算力經(jīng)濟(jì)中國(guó)行考察報(bào)告_第4頁
2024數(shù)字中國(guó)萬里行暨算力經(jīng)濟(jì)中國(guó)行考察報(bào)告_第5頁
已閱讀5頁,還剩284頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

?確?!皷|數(shù)西算”工程高質(zhì)量發(fā)展P003?高校開啟新一輪技術(shù)創(chuàng)新實(shí)踐P011?自動(dòng)駕駛進(jìn)入數(shù)據(jù)驅(qū)動(dòng)的3.0時(shí)代P027?車能路云網(wǎng)融合發(fā)展加速落地P035?北京理工大學(xué):提升大模型價(jià)值,“墨子”全新升級(jí)P0562綜上所述,在圍繞算力本身產(chǎn)生的算力服務(wù)產(chǎn)業(yè)鎮(zhèn)數(shù)字化這種提供各種基礎(chǔ)設(shè)施,提供各種支撐?資源化:計(jì)算能力被視作一種資源,可以像電?市場(chǎng)化:算力可以在市場(chǎng)上進(jìn)行買賣,形成供?價(jià)值化:算力的使用可以帶來經(jīng)濟(jì)價(jià)值,續(xù)地提供和使用算力,減少能源消耗和環(huán)境影2023年,經(jīng)過一年的考察和調(diào)研,“東數(shù)西算”起步區(qū)位于上海西面,而上海西北部的嘉定、太數(shù)西算”工程國(guó)家樞紐節(jié)點(diǎn)的項(xiàng)目數(shù)量、投資數(shù)4(如起步區(qū)),壯大國(guó)家數(shù)據(jù)中心集群規(guī)模,有序引導(dǎo)數(shù)據(jù)中心和算力中心產(chǎn)業(yè)向規(guī)劃區(qū)域內(nèi)轉(zhuǎn)批準(zhǔn)、授予能評(píng);對(duì)于確實(shí)不適合納入規(guī)劃范圍序推進(jìn)大模型訓(xùn)練和推理服務(wù)產(chǎn)業(yè)的發(fā)展。降低算力成本、提高利用效率,真正促進(jìn)大模型的落建立起“東數(shù)西算”工程的動(dòng)態(tài)調(diào)整機(jī)制,發(fā)揚(yáng)立起完善的準(zhǔn)入和退出機(jī)制,健全問責(zé)和扶持體系,在保持總體穩(wěn)定的基礎(chǔ)上,根據(jù)區(qū)域經(jīng)濟(jì)發(fā)現(xiàn)資源的優(yōu)化配置和高效利用,護(hù)航算力經(jīng)濟(jì)更采購(gòu)35萬片英偉達(dá)GPU發(fā)展自己的大模型;軟OpenAI更是計(jì)劃籌集七萬億美金研制生產(chǎn)新AI型工作組”,英國(guó)希望能擁有自己國(guó)家的“主權(quán)”近日,英偉達(dá)提出“主權(quán)AI”的概念,并將其定一個(gè)國(guó)家AI水平的最高點(diǎn),是基礎(chǔ)大模型的基競(jìng)爭(zhēng)力,涉及軍事、經(jīng)濟(jì)、政治等多方面能力。沒有“主權(quán)級(jí)基礎(chǔ)大模型”,就像是國(guó)家沒有了國(guó)防重器,國(guó)家就會(huì)被打壓,國(guó)家安全也會(huì)受到我建議,利用我國(guó)在超算研發(fā)建設(shè)中的豐富積累,設(shè)立能夠支持“主權(quán)級(jí)”多模態(tài)大模型訓(xùn)練的專用超算攻關(guān)專項(xiàng)。過去的15年,我國(guó)超算的研制已經(jīng)達(dá)到世界領(lǐng)先水平,形成了神威、天河和曙光三大世界級(jí)超算研制團(tuán)隊(duì),奪得了十一通過該專項(xiàng)計(jì)劃的支持,可以充分利用超算領(lǐng)域多年積累的人才和技術(shù)優(yōu)勢(shì),快速形成突破,盡快縮小我國(guó)在“主權(quán)級(jí)基礎(chǔ)大模型”訓(xùn)練領(lǐng)域與美國(guó)的差距,為研制更先進(jìn)適用的大模型專用訓(xùn)目前,國(guó)內(nèi)一些企業(yè)往往傾向于使用國(guó)外的開源模大戰(zhàn)使得算力資源過于分散,延誤了“主權(quán)級(jí)需要國(guó)家出面協(xié)調(diào)資源,以當(dāng)年“兩彈一星”的形式組建隊(duì)伍,以取得快速突破。留給我們的時(shí)項(xiàng)組,通過多輪競(jìng)爭(zhēng),確定最優(yōu)的訓(xùn)練芯片研發(fā)技術(shù)路線和國(guó)家標(biāo)準(zhǔn),擇優(yōu)集中投入資金和優(yōu)秀人才資源,整合芯片產(chǎn)能,盡快研制出能夠滿足國(guó)產(chǎn)“主權(quán)級(jí)基礎(chǔ)大模型”訓(xùn)練的十萬卡、百萬能的快速發(fā)展,預(yù)示著全球新一輪科技革命和產(chǎn)和能夠熟練掌握新質(zhì)生產(chǎn)資料的應(yīng)用型人才。因6四是師資力量不足。人工智能是一個(gè)高度專業(yè)化的領(lǐng)域,需要有專業(yè)知識(shí)和實(shí)踐經(jīng)驗(yàn)的教師。目前,合格的生成式人工智能教師相對(duì)稀缺,影響建議可以在現(xiàn)有教育部政策框架內(nèi)進(jìn)行探索和實(shí)內(nèi)外學(xué)校(或企業(yè))合作創(chuàng)新課程內(nèi)容和教學(xué)方境,學(xué)校和產(chǎn)業(yè)界應(yīng)加強(qiáng)合作,通過實(shí)習(xí)、項(xiàng)目合作等方式幫助學(xué)生了解實(shí)際工作中的需求和挑全棧數(shù)據(jù)中心縱貫IT基等IT設(shè)備傳導(dǎo)到網(wǎng)絡(luò)架82023年是大模型蓬勃發(fā)展的一年,從文字對(duì)話交互開始,“百模大戰(zhàn)”爆發(fā)。2024年Sora的發(fā)布標(biāo)志著人工智能(AI)在視頻技術(shù)多模態(tài)大模型可實(shí)現(xiàn)文本、語音、圖像及音視頻等多模態(tài)數(shù)據(jù)的復(fù)雜處理和交互。超大規(guī)模AI大模型的訓(xùn)練需要相應(yīng)的算力支撐,在生成式AI引燃算力需求,算力技術(shù)架構(gòu)持續(xù)升級(jí)。作為服務(wù)器的關(guān)ann能交通國(guó)家戰(zhàn)略漸趨明確,行業(yè)共識(shí)逐步形成,產(chǎn)業(yè)化工作正在穩(wěn)步中國(guó)高校在數(shù)字化教大學(xué)為代表的高校通過分發(fā)揮了算力資源的價(jià)值,為國(guó)家的“東數(shù)西ann△北大未名二號(hào)算力集群那么上海交通大學(xué)則是南方乃至全國(guó)地區(qū)算力應(yīng)用的先行者。2013“交我算”平臺(tái)服務(wù)了上海交通大學(xué)1200多個(gè)課題組,“交我算”平臺(tái)還開發(fā)了全國(guó)校級(jí)服務(wù)平臺(tái)中可能是唯一的“工單”系統(tǒng)。從最健康”“大海洋”“大信息”的發(fā)展戰(zhàn)略,“交我算”團(tuán)隊(duì)從支持科我算”平臺(tái)支撐了上海交通大學(xué)計(jì)算服務(wù)的不斷革新升級(jí),賦能科研原始創(chuàng)新與前沿突破?!八荚匆惶?hào)”、π2.0集群、Arm超算平臺(tái)等共同構(gòu)成了“交我算”的算力基座,提供了多元化、多維度的算力服務(wù)與應(yīng)用環(huán)境。以AI芯片為主的高效率、大規(guī)模的智能算力基礎(chǔ)設(shè)施將成為訓(xùn)練AI大模型的前提。在應(yīng)用層面,隨著“百模千態(tài)”走向每一個(gè)行業(yè),在加速千行萬業(yè)智能化轉(zhuǎn)型時(shí),承載大模型的新型算力中心也在悄然發(fā)生變化——算力規(guī)模快速增長(zhǎng)、計(jì)算技術(shù)多元?jiǎng)?chuàng)ann案,通過曙光ParaStor分布式液冷存儲(chǔ)系統(tǒng)將可存儲(chǔ)容量擴(kuò)展至近出發(fā),按照基礎(chǔ)建設(shè)、服務(wù)能力和中臺(tái)應(yīng)用能力三個(gè)方面將不同部門的業(yè)務(wù)進(jìn)行劃分,通過“一網(wǎng)通辦”將其串聯(lián)起來,打造統(tǒng)一部多模態(tài)數(shù)據(jù)正成為大模型訓(xùn)練的主要數(shù)據(jù),對(duì)算力來說需求倍增,相同參數(shù)下,更深的模型擁有更好的性能,超千億參數(shù)的大模型研發(fā)就不僅僅是算法問題,而是囊括了底層龐大算力、網(wǎng)絡(luò)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程,需要有超大規(guī)模數(shù)據(jù)中心的AI算力來支撐。以AI芯片為主的高效率、大規(guī)模的智能算力基礎(chǔ)設(shè)施將成為訓(xùn)練在加速千行萬業(yè)智能化轉(zhuǎn)型時(shí),承載大模型的新型算力中心也在悄然發(fā)生變化——算力規(guī)??焖僭鲩L(zhǎng)、計(jì)算技術(shù)多元?jiǎng)?chuàng)新、產(chǎn)業(yè)格局中心的兩倍以上,生成式AI技術(shù)和服務(wù)的影響已成為超大規(guī)模數(shù)據(jù)中心發(fā)展的動(dòng)力。在中國(guó),服務(wù)AI的智算中心是發(fā)展最快的一種算力供給形式,2024年我國(guó)有超過30個(gè)城市正在建設(shè)智算中心,整大裝置的重要載體,是上海新一代AI計(jì)算與賦能平臺(tái),是服務(wù)上海臨港AIDC項(xiàng)目位于臨港新片區(qū),一期投資臺(tái)管理系統(tǒng)與大模型應(yīng)用等多方向研發(fā)。項(xiàng)目占地87畝,建筑面積13萬平方米,一期已建成7萬平方米。目前,臨港AIDCann0000000000未來,隨著算力底座技模型比拼的更多是集群系統(tǒng)能力。從軟件到硬件,隨著智算中心數(shù)量增長(zhǎng),國(guó)產(chǎn)算力產(chǎn)業(yè)需要加快智算中心軟硬件適配生態(tài)建設(shè),需要通過標(biāo)準(zhǔn)等手段適度收斂,建立統(tǒng)一、高效的生態(tài),集中有限的產(chǎn)業(yè)和社會(huì)資源,規(guī)范算力產(chǎn)業(yè)的高質(zhì)量發(fā)展,最總算力規(guī)模高達(dá)12000PFlops,已有超4.5萬塊GPU,其中臨港署。強(qiáng)大算力可支撐超過20個(gè)千億超大模型同時(shí)訓(xùn)練,并支持萬億ann當(dāng)AI的應(yīng)用場(chǎng)景呈現(xiàn)多樣化時(shí),數(shù)據(jù)中心側(cè)單一的計(jì)算架構(gòu)就難以滿足業(yè)務(wù)需求了,多樣性計(jì)算加速了算力格局的變化,多元化的算Arm等架構(gòu)方案。當(dāng)生成式AI應(yīng)用不斷發(fā)展,異構(gòu)計(jì)算Arm提供了豐富的內(nèi)核授權(quán),供不同性能、功耗、成本需求的產(chǎn)品選用。在Cortex-A系列之后,Arm面向云計(jì)算和數(shù)據(jù)中心領(lǐng)域推出了Neoverse平臺(tái)。該平臺(tái)分為三大系列NeoverseV系列、數(shù)字中國(guó)萬里行團(tuán)隊(duì)曾參觀過阿里云、騰訊云、京東云、抖音、UCloud(優(yōu)刻得)等國(guó)內(nèi)多個(gè)超大規(guī)模數(shù)據(jù)中心,它們都上線了包同樣進(jìn)行了異構(gòu)應(yīng)用探索的還有UCloud烏蘭察布數(shù)據(jù)中心。早在云服務(wù)器解決方案;2023年UCloud還與此芯科技達(dá)成彈性擴(kuò)容項(xiàng)ann生成式AI帶來的挑戰(zhàn)不在于增加數(shù)據(jù)中心的數(shù)量,而是大幅增加運(yùn)Q全球范圍內(nèi)共售出約70萬張,這就耗費(fèi)了約22023年,“液冷”已成為熱詞,當(dāng)然這并不代表液冷技術(shù)解決方案早在十幾年前,液冷技術(shù)已是高性能計(jì)算領(lǐng)域的主流解決方案。隨著算力需求的暴增和隨之帶來的功耗指標(biāo)居高不到液冷技術(shù)解決方案的用和綠色低碳的共同推解決方案,通過曙光ParaStor分布式液冷存儲(chǔ)系統(tǒng)將可存儲(chǔ)容量擴(kuò)annAI需要龐大的算力,AI也需要大量的能源。要保證算力能夠高效地個(gè)個(gè)ann2018年,“數(shù)字中國(guó)萬里行”活動(dòng)啟動(dòng)時(shí),“草原云谷”烏蘭察布簽約服務(wù)器規(guī)模447萬臺(tái),阿里巴巴、中心15棟單體建筑全部封頂。和林格爾新區(qū)作為全國(guó)一體化算力網(wǎng)特別是以顛覆性技術(shù)和前沿技術(shù)催生新產(chǎn)業(yè)、新模式、新動(dòng)能,發(fā)展新質(zhì)生產(chǎn)力所發(fā)揮的動(dòng)力支持作用上,更體現(xiàn)在算力本身具有的廣泛應(yīng)用自動(dòng)駕駛是駕駛輔助功能的最終形態(tài),同時(shí)作為AI技術(shù)在汽車行業(yè)來自Canalys的數(shù)據(jù)顯示,中國(guó)市場(chǎng)L2+滲透率連續(xù)三個(gè)季度達(dá)到2020年2月國(guó)家頒布了《智能汽車創(chuàng)新發(fā)展戰(zhàn)略》,希望在2025由硬件與軟件驅(qū)動(dòng)的自近尾聲。由數(shù)據(jù)驅(qū)動(dòng)的過算法模型訓(xùn)練、驗(yàn)證后,將有效數(shù)據(jù)成果部署上車,各環(huán)節(jié)相互連ann模型和少數(shù)據(jù)的模式提供自動(dòng)駕駛方案。挖掘算力潛能,讓AI真正發(fā)揮價(jià)值。在AI算力升級(jí)后,很多自動(dòng)駕駛企業(yè)加大了對(duì)算法模型據(jù)的生成量也呈現(xiàn)指數(shù)級(jí)增長(zhǎng),從GB到TB、PB,傳統(tǒng)數(shù)據(jù)存管模當(dāng)智能駕駛行業(yè)進(jìn)入了下半場(chǎng),就需要更深更廣的挖掘數(shù)據(jù)應(yīng)用場(chǎng)景及價(jià)值,讓數(shù)據(jù)發(fā)揮價(jià)棧全價(jià)值鏈的數(shù)據(jù)閉環(huán)運(yùn)營(yíng)車輛資源,目前吉利一輛車每個(gè)月的合規(guī)數(shù)據(jù)采集量是幾個(gè)GB),大模型的技術(shù)架構(gòu)涵蓋AI技術(shù)群和大模型的融合創(chuàng)新,通過真實(shí)數(shù)據(jù)語義挖掘和合成數(shù)據(jù)仿真能力解決智駕功能開發(fā)所需的大量隨機(jī)/性。以GPT為代表的大模型為智能駕駛帶來了新思路,與早期用于車機(jī)系統(tǒng)和智能座實(shí)現(xiàn)更高智能的人車交互,還可擺脫座艙的同質(zhì)化,因算法不同而具而形成車企自身獨(dú)特的的應(yīng)用通過強(qiáng)大的數(shù)據(jù)強(qiáng)了自動(dòng)駕駛系統(tǒng)的安全性、效率和用戶體ann駕駛、更個(gè)性化的服務(wù)和更高效的運(yùn)營(yíng)。如吉利汽車推出的星睿AI大模型,是吉利全棧自研的全球首個(gè)汽車行業(yè)全場(chǎng)景AI大模型;一在數(shù)字中國(guó)萬里行團(tuán)隊(duì)考察期間,我們看到吉利發(fā)布的星睿AI大模型擁有超千億參數(shù)量,具備海量常識(shí)和情感模塊。星睿AI大模型以?星睿NPDS研發(fā)大模型是吉利星睿語言大模型在研發(fā)端的創(chuàng)新應(yīng)ann3D生成技術(shù)和數(shù)字人AI驅(qū)動(dòng)技術(shù)。它能夠快速生成各種逼真的智能體驗(yàn)是消費(fèi)者評(píng)價(jià)算力資源是直接影響開發(fā)速度的硬性因素,智能駕駛算法的訓(xùn)練需要在有限的時(shí)間內(nèi)完成大量的運(yùn)算,因而對(duì)算力形成極高的要求。隨著智能駕駛車輛滲透率的提升,車端算力、城市NOA(NavigateOn航駕駛或領(lǐng)航輔助駕駛)系統(tǒng)需要的云側(cè)訓(xùn)練大△雨中的吉利星睿智算中心大的自動(dòng)駕駛智算中心“扶搖”,專用于自動(dòng)駕駛模型訓(xùn)練,算60000+ann?長(zhǎng)城汽車旗下毫末智行“雪湖·綠洲”智算中心。其算力達(dá)到6△吉利星睿智算中心機(jī)房△吉利星睿智算中心機(jī)房據(jù)計(jì)算開發(fā)、大數(shù)據(jù)應(yīng)用支持、AI研發(fā)等業(yè)務(wù)領(lǐng)域提供技術(shù)服務(wù)。IaaS層由通用計(jì)算資源、GPU計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源、數(shù)服務(wù)組成,用于調(diào)用IaaS層資源,對(duì)吉利常規(guī)車聯(lián)業(yè)務(wù)提供大數(shù)據(jù)型的技術(shù)架構(gòu)能力,涵蓋AI技術(shù)群和大?邊緣研發(fā)區(qū)則是支撐吉利研究院本地?cái)?shù)據(jù)業(yè)務(wù)、智能化業(yè)務(wù)的研就是一個(gè)基于數(shù)據(jù)驅(qū)動(dòng)天產(chǎn)生、接收、傳遞大量的數(shù)據(jù)。AI大模型技術(shù)的應(yīng)用將為智能網(wǎng)聯(lián)汽車帶來革命性的變革。臺(tái)等多個(gè)領(lǐng)域?qū)崿F(xiàn)深度也為自動(dòng)駕駛技術(shù)的發(fā)ann交通、城市融合發(fā)展的新路徑,進(jìn)一步促進(jìn)智能駕駛的落地。2016年以來,“車路協(xié)同智能交通”的國(guó)家戰(zhàn)略漸趨明確,行業(yè)共識(shí)逐步我國(guó)正在探索車路云一體化,即智能網(wǎng)聯(lián)汽車通和城市的融合發(fā)展。在推動(dòng)車路云一體化生態(tài)的規(guī)?;涞睾统B(tài)化運(yùn)營(yíng)進(jìn)程中,面向車路云一體化的基礎(chǔ)設(shè)施體系提供了堅(jiān)實(shí)的底部?2020年11月,住房和城鄉(xiāng)建設(shè)部、工業(yè)和信作的通知》,進(jìn)一步明確L3級(jí)和L4級(jí)自動(dòng)駕駛準(zhǔn)入規(guī)范,推動(dòng)?2023年12月,交通運(yùn)輸部印發(fā)ann2024年1月,數(shù)字中國(guó)萬里行團(tuán)隊(duì)走進(jìn)了蘇州市智能實(shí)現(xiàn)L4級(jí)別自動(dòng)駕駛所需的單車多維度感知轉(zhuǎn)由路端傳感器分擔(dān),目前,天翼交通在蘇州市打造了相城三期(51公里全息感知道路、111公里智能網(wǎng)聯(lián)道路)、S17高速(6.5公里全息服務(wù)平臺(tái)。在面向交通管理的應(yīng)用實(shí)踐中,利用AI識(shí)別能力,可以對(duì)于自動(dòng)駕駛汽車來說,通過道路感知體系感知的數(shù)據(jù)顯然要比車身上的傳感器所能獲得的數(shù)據(jù)更為全面。但在關(guān)鍵的是道路與車輛之間的通信問題。天翼交通自誕生之日起就兼顧了云網(wǎng)、數(shù)據(jù)安全等技ann3系統(tǒng)分別是激光/毫米波雷達(dá)與攝像頭的場(chǎng)基于5G切片的超穩(wěn)態(tài)智駕專網(wǎng)系統(tǒng)。1平臺(tái)目前車路協(xié)同主要采用路端開展多點(diǎn)位融合感知計(jì)算并把相應(yīng)結(jié)果傳輸?shù)竭吘壴七M(jìn)行融合的方式,開展覆蓋范圍內(nèi)的環(huán)境感知計(jì)算。但由于目前AI算法對(duì)于算力的要求較高,這種方式使得路端算力的投資比較大,隨著算法升級(jí),算力平臺(tái)無法有效擴(kuò)展,同時(shí)接入對(duì)應(yīng)的邊緣云還需要相應(yīng)的光纖部署等一系列工程量大的工作。而天基站、路側(cè)的分級(jí)部署和協(xié)同,能帶來部署便捷、減少投資、統(tǒng)一),ann識(shí)逐步形成,產(chǎn)業(yè)化工作正在穩(wěn)步推進(jìn)。從技術(shù)演進(jìn)來看,AI大模型技術(shù)的應(yīng)用將為智能駕駛帶來革命性的變革,智算集群可以提升數(shù)據(jù)處理與模型訓(xùn)練的效率。因此,承載算力基礎(chǔ)設(shè)施的智算中心成為車企快速占領(lǐng)智能汽車市場(chǎng)的基礎(chǔ)條件。國(guó)內(nèi)車企或自建或聯(lián)合云廠商共建智算中國(guó)高校在數(shù)字化教索與實(shí)踐早已卓有成效。的演進(jìn)進(jìn)程中,多元算解決方案正在高校加速2024年的政府工作報(bào)告明確提出,要“堅(jiān)持教育強(qiáng)國(guó)、科技強(qiáng)國(guó)、地的數(shù)據(jù)中心外,2023年的數(shù)字中國(guó)萬里行暨算力經(jīng)濟(jì)中國(guó)行還先ann提供高性能科學(xué)與工程計(jì)算服務(wù)。目前平臺(tái)資源包括755個(gè)節(jié)點(diǎn)和△△在線shell平臺(tái)極大降低了用戶使用門檻,即使是Linux相對(duì)于目前不少高校使用的外國(guó)平臺(tái),北京大了盈利,也不是為了出臺(tái)讓更多中國(guó)高校用上是證明中國(guó)軟件并不比功能和更全面的系統(tǒng)服ann在單機(jī)上測(cè)試系統(tǒng)的話,可以用Vagrant實(shí)現(xiàn)一鍵部署,也可以用量在不到半年的時(shí)間內(nèi)已經(jīng)超過12000次。正如計(jì)算中心系統(tǒng)管理更多功能和更全面的系統(tǒng)服務(wù)更多的高校?!痹朴?jì)算、AI計(jì)算、高性能計(jì)算、Arm超算、楊元慶科學(xué)計(jì)算中心五△“思源一號(hào)”高性能計(jì)算集群65PB△π2.0集群Arm超算平臺(tái)以及科學(xué)大數(shù)據(jù)平臺(tái)等多個(gè)算力集群,聚合存儲(chǔ)容量達(dá)到65PB,未來將擴(kuò)展到100PB。其中,“思源一號(hào)”高性能計(jì)算集群總算力為6PFlops,暫列國(guó)內(nèi)高校第一;Arm超算平臺(tái)共有100個(gè)計(jì)算節(jié)點(diǎn),是國(guó)內(nèi)高校首個(gè)基于Arm處理器的高性能計(jì)算集ann前沿突破。上述提到的“思源一號(hào)”、π2.0集群、Arm超算平臺(tái)等或許不少老師是某個(gè)領(lǐng)域的教授乃至權(quán)威,比如生物、化學(xué)、物理等等學(xué)科,但是如何將這些學(xué)科的專業(yè)需求轉(zhuǎn)化為計(jì)算機(jī)能“聽懂”的語言,如何實(shí)現(xiàn)有效的代碼編程與調(diào)優(yōu),這就是計(jì)算專員們需要解決的問題。尤其近些年,隨著數(shù)字化、智能化的發(fā)展,幾乎所有的理工學(xué)科實(shí)驗(yàn)都可以通過計(jì)算機(jī)進(jìn)行模擬,而不斷升級(jí)變化、層出不窮的計(jì)算機(jī)軟件工具也必需要專業(yè)的人才來操作,這也是學(xué)科當(dāng)然,這種“翻譯”服務(wù)也不可能是一對(duì)一的,畢竟目前“交我算”平臺(tái)已經(jīng)服務(wù)于上海交通大學(xué)1300多個(gè)課題組,如此龐大的數(shù)量也讓整個(gè)服務(wù)團(tuán)隊(duì)異常忙碌。為了實(shí)現(xiàn)有序管理、避免重復(fù)問題提交,這樣一來,通過對(duì)于不同工單系統(tǒng)需求的分析,服務(wù)團(tuán)隊(duì)就可以為需求一致或者接近的課題組提供標(biāo)準(zhǔn)化的服務(wù),同時(shí)也可以保障不同課題組的作業(yè)能夠有序運(yùn)行,讓算力資源與服務(wù)團(tuán)隊(duì)運(yùn)行實(shí)現(xiàn)效率最大化。這也是“交我算”推出的全新服務(wù)模式。ann決PB量級(jí)(千萬億字節(jié))的健康大數(shù)據(jù)“隨存隨算”和數(shù)據(jù)構(gòu)建過優(yōu)化程序代碼,提升計(jì)算性能,保障科研工作高效推進(jìn)。“交我算”10余門課程,注重各專業(yè)所需的計(jì)算知識(shí)講授和技能培養(yǎng),強(qiáng)化計(jì)區(qū)一流的理工類大學(xué)。目前該校建有29個(gè)國(guó)家級(jí)科研平臺(tái)、231個(gè)該校數(shù)據(jù)中心廣泛承載了科研平臺(tái)和智慧校園等業(yè)務(wù),為在校超10△華南理工機(jī)房華南理工大學(xué)稱得上是曙光存儲(chǔ)在華南地區(qū)的經(jīng)典案例,一方面基于本”之間的“不可能三角”,通過液冷存儲(chǔ)系統(tǒng)與液冷服務(wù)器的技術(shù)液冷方案;另一方面也讓數(shù)據(jù)中心基礎(chǔ)設(shè)施得以統(tǒng)一規(guī)劃、設(shè)計(jì)和通用,在助力數(shù)據(jù)中心提高運(yùn)維效率的同時(shí),率先在行業(yè)內(nèi)補(bǔ)全了全棧ann4.5理工大學(xué)數(shù)據(jù)中心整體能耗降低了30%。按照服務(wù)器、存儲(chǔ)等IT基礎(chǔ)設(shè)施5年的生命周期計(jì)算,整體TCO有所節(jié)省的同時(shí)也為后續(xù)的有著太多的光環(huán),“雙一流”“985”“211”等稱號(hào)都彰顯出這是據(jù)“星球數(shù)據(jù)派”統(tǒng)計(jì),2023到2024思路,即實(shí)現(xiàn)低成本、高價(jià)值的優(yōu)質(zhì)服務(wù)。在有了一定經(jīng)驗(yàn)之后,截至2023年11月,中國(guó)農(nóng)業(yè)大學(xué)校級(jí)算力平臺(tái)總計(jì)具備1178助力在《自然》《細(xì)胞》《科學(xué)》等影響因子大于20的期刊發(fā)表論ann△農(nóng)大校級(jí)網(wǎng)絡(luò)建設(shè)華中農(nóng)業(yè)大學(xué)作為全國(guó)直以來依托傳統(tǒng)優(yōu)勢(shì)農(nóng)科,理農(nóng)結(jié)合培植發(fā)展生命科學(xué),通過交叉培植、整合集成、發(fā)展鞏固、帶動(dòng)提升等幾個(gè)階段,用現(xiàn)代生物科學(xué)技術(shù)提升傳統(tǒng)農(nóng)科,加快推進(jìn)學(xué)科交叉融合,提升農(nóng)科和生命科學(xué)國(guó)際架構(gòu)的NPU加速卡處理特定場(chǎng)景的計(jì)算任務(wù),實(shí)現(xiàn)計(jì)算資源的靈活家治理大數(shù)據(jù)人工智能創(chuàng)新平臺(tái)”就是算力應(yīng)用的很好載體,也能夠?yàn)閷W(xué)校層面提供優(yōu)秀的平臺(tái)支持,推動(dòng)學(xué)科間的交流與合作,進(jìn)一步強(qiáng)化高校科研水平與人為促進(jìn)跨學(xué)科合作,中國(guó)人民大學(xué)還定期組織了名為“數(shù)智工作坊”北京理工大學(xué)的“墨子”大模型已經(jīng)廣泛應(yīng)用于科研與教學(xué)中,并在逐步提升“墨子”大模型的應(yīng)用特性,以應(yīng)對(duì)未來更加高端、多元化和復(fù)雜化的挑戰(zhàn),從而徹底、全方位解決數(shù)據(jù)碎片化、分析力度粗、知卡間互聯(lián)不夠、數(shù)據(jù)清洗難度增加等等,但在應(yīng)用技能上也較為熟練。然而,像中國(guó)人民大學(xué)這樣的文科高校其實(shí)更需要關(guān)注到數(shù)字化創(chuàng)新的應(yīng)用,因?yàn)檫@能補(bǔ)全綜就是算力應(yīng)用的很好載體,也能夠?yàn)閷W(xué)校層面提供優(yōu)秀的平臺(tái)支持,這是由北京理工大學(xué)自主研發(fā)的,專注于科型。該模型旨在通過大規(guī)模語言和證據(jù)檢索模型SciDPR成針對(duì)用戶關(guān)于特定論文的問題,進(jìn)行簡(jiǎn)潔準(zhǔn)確的回答,并為學(xué)術(shù)研識(shí)圖譜、科技論文閱讀器和科技對(duì)話系統(tǒng)等學(xué)術(shù)產(chǎn)品,在科技學(xué)術(shù)領(lǐng)在大模型應(yīng)用如火如荼的今天,“墨子”的迭代非常迅速。為了進(jìn)一步提升在科技論文領(lǐng)域的作用,尤其是針對(duì)多模態(tài)應(yīng)用、科技論文領(lǐng)域推薦應(yīng)用、科技論文續(xù)寫應(yīng)用三方面所發(fā)揮的重要作用,北京理工為此,北京理工大學(xué)評(píng)估了來自行業(yè)內(nèi)第三方ann部具備的8個(gè)昇騰AI處理器,能夠最大限度地提高多線程應(yīng)用的并高校算力需求的快速增長(zhǎng),這種增長(zhǎng)不僅推動(dòng)了算力基礎(chǔ)設(shè)施的建設(shè),也促進(jìn)了高校在科研、教學(xué)、管理等方面的數(shù)字化轉(zhuǎn)型。同時(shí),這也帶來了諸如運(yùn)營(yíng)管理、用戶使用難度、算力融合等一系列挑戰(zhàn),而為了克服這些挑戰(zhàn),各大高校又組織網(wǎng)絡(luò)中心、信息中心等團(tuán)隊(duì)進(jìn)行攻關(guān),從針對(duì)應(yīng)用拓展,北京大學(xué)和上海交通大學(xué)做出了很好的榜樣。這兩所高校都從自身的日常教學(xué)與科研需求出發(fā),通過多年的積累和拓展,形成了符合自身需求、有著明確應(yīng)用場(chǎng)景的平臺(tái)級(jí)解決方案。其中,北京大上海交通大學(xué)的“交我算”平臺(tái)則肩負(fù)起全面支撐學(xué)校教學(xué)、科研和管華南理工大學(xué)等高校都使用了液冷解決方案,事實(shí)證明無論是從效率角度還是從低碳角度,液冷解決方案對(duì)于高校應(yīng)用來說都是未來發(fā)展的必然趨勢(shì)。值得一提的是,這些高校都采用了不止一家的解決方案,甚至在算力層面這些高校也有包括主流x86、Arm在內(nèi),乃至國(guó)產(chǎn)信創(chuàng)平臺(tái)等多維度的需求,這也有助于未來科研應(yīng)用的多元化發(fā)展,甚至有助于為主,這些高校有著相對(duì)更充裕的教學(xué)資金和師資力量,在科研水平上考察團(tuán)隊(duì)計(jì)劃深入更多高校,助力高校的智慧教學(xué)場(chǎng)景,讓更多高校有機(jī)會(huì)接觸并了解最新的數(shù)字化、智能化咨詢與應(yīng)用,推動(dòng)中國(guó)的數(shù)字教簡(jiǎn)稱“2021版報(bào)告”和“2023版報(bào)告”),報(bào)告的中心篇幅都留作為通用算力的代表,CPU分出“大、小”核本身也是一種多元化的體現(xiàn)。大核為了性能,小核不僅為了能效,也為了在同樣的硅片面積上提供更多的CPU核心。隨著小核越做越多,大核又大又多,ann大核即性能核(PerformanceCore強(qiáng)調(diào)單核性能,屬于縱向擴(kuò)展(Scale-up)路線,與之相對(duì)應(yīng)的橫向擴(kuò)展(Scale-out)要在同處理器架構(gòu)精簡(jiǎn)也是能效核的主流操作方式,而減小CPU核心面積annArm的數(shù)據(jù)顯示,經(jīng)過V1到V2的努力,在SQL數(shù)據(jù)庫、企業(yè)級(jí)ann隨著半導(dǎo)體制造工藝的進(jìn)步,相對(duì)邏輯電的SRAM電路的微縮效面積成本愈發(fā)顯得昂貴。緩存的面積接近一半。因此,Zen4c大幅度地縮減緩存容量肯定是但是,即使假設(shè)Zen4的三級(jí)緩存面積占50%,容量減半后只是縮減25%的面積,其余的面積優(yōu)化如何實(shí)現(xiàn)呢?答案是:除了已經(jīng)是的操作會(huì)限制頻率的提升——盡管AMD宣稱經(jīng)過優(yōu)化設(shè)計(jì),與8T準(zhǔn)頻率為2.4GHz,最高加速頻率為3.7GHz。基于Zen4的EPYC),經(jīng)過重新設(shè)計(jì)之后,包含二級(jí)緩存在內(nèi)的單個(gè)Zen4c核心在減少核心面積和三級(jí)緩存容量后,Zen4c單個(gè)CCD內(nèi)包含兩組ann前五代英特爾至強(qiáng)可擴(kuò)展(XeonScalable)處理器都只有性能核,第五代至強(qiáng)6的性能核版本延續(xù)了這一風(fēng)格,代號(hào)為Granite),CPU作為服務(wù)器里的“大管家”,提供算力只是其諸多工作之一,),),核心數(shù)就從64個(gè)升至96個(gè);Zen4c單個(gè)CCD內(nèi)的核ann2023年第四季度,微軟也借力Arm公布了自有品牌的CPU,其隨著矩陣的規(guī)模越來越大,也勢(shì)必要切分成多塊(tile),即不同的ann即對(duì)等拆分。進(jìn)一步降低CPU的開發(fā)周期和成本。以其首款方案A兩顆Die互連后封裝為一顆CPU,也可以用于連接其他高性能加速ann△四等分的第四代英特爾至強(qiáng)可擴(kuò)展處理器(上)和二等分的第五代英特annDDR5內(nèi)存控制器的規(guī)格從4800小幅提升到5600。最顯著的規(guī)格不過,從架構(gòu)層面上,對(duì)等拆分的模塊化程度不如按功能拆分,如PCIe控制器、(SPR開始加入的)DSA/IAA/QAT/DL),ann但是至強(qiáng)6的E核版支持的內(nèi)存規(guī)格最高為DDR5-6400,而P核),官方數(shù)據(jù)顯示,雙路配置下,與64核的第五代英特個(gè)UPI2.0,P核版支持四路和八路配置;6900系列增加到96個(gè)但是某些廠商、ISV客戶或無法對(duì)自身軟件進(jìn)行修改優(yōu)化的然希望能夠用一個(gè)對(duì)軟件透明,在硬件層面上管理CXL和系統(tǒng)原生延遲略有區(qū)別,但整體對(duì)系統(tǒng)的吞吐影響并不大。這種模式僅在單GPU已經(jīng)可以達(dá)到千瓦級(jí),相應(yīng)的散熱要求也更為嚴(yán)苛,英偉達(dá)),封裝面積的增加也得益于中介層面積擴(kuò)大,相應(yīng)的可封裝多達(dá)8顆量作為參考指標(biāo),那就是H100的2倍多一些(4500GFLOPs的連接,相比上一代是256個(gè)。配套的第四代NVSwitch芯片提供),annAmpereBlackwell4.8TB/s------4----),B200并非完全規(guī)格。性能打折扣的情況在H100/200SXM、H100與B200這些產(chǎn)品采用兩顆較大的芯片(Die)組合不同,2023版ann礎(chǔ)層加持”部分。英特爾在BaseTile中提e),80GB、3.3TB/s。英偉達(dá)的H200主要也是提升了HBM,容量達(dá)到),單節(jié)點(diǎn)內(nèi)可安裝4顆MI300A。節(jié)點(diǎn)外部擴(kuò)展可使用4組Infinity務(wù)器不再安裝其他的CPU,也不提供DDR內(nèi)存擴(kuò)展。整個(gè)節(jié)點(diǎn)的ann為450GB/s。即便如此,這樣的帶寬依舊可以超過PCIe6.0x16聯(lián),可以構(gòu)建的“單”GPU的內(nèi)存容量就會(huì)遠(yuǎn)遠(yuǎn)超過上一代產(chǎn)品。CPU的整合思路與英偉完全不同。后者的CPU除了提供一定的通用算力之外,最大的賣點(diǎn)就供更大容量的直接內(nèi)存異構(gòu)整合是Chiplet的價(jià)值點(diǎn)之一。MI300A對(duì)CPU的整合思路與英偉達(dá)的GH200SuperChip完全不同。后者的CPU除了提供一定接入整個(gè)NVLink域,為GPU提供更大容量的直接內(nèi)存訪問。英類似的為CPU提供高帶寬內(nèi)存的思路包括英特爾的XeonMax,以及更早的富士通的A64FX,在科學(xué)計(jì)算方面性能突出。英特爾的Shores已經(jīng)被推遲到2025年上市,并取消了異構(gòu)設(shè)計(jì),改為純annSmartNIC(智能網(wǎng)卡)崛起于云計(jì)算的黃金時(shí)代,用意包括但不限于為CPU減負(fù),或者說從CPU那里搶點(diǎn)兒工作出來。于是,一些有運(yùn)行任何業(yè)務(wù),這個(gè)消耗也是實(shí)際存在的。早期的“數(shù)據(jù)中心稅”考慮到CPU相對(duì)昂貴,且功耗偏高,將這些工作盡可能地卸載到其卸載的任務(wù)是一個(gè)循序漸進(jìn)的過程。早期的產(chǎn)品,被稱為智能網(wǎng)卡如果查找命中,則會(huì)下發(fā)到內(nèi)核態(tài)進(jìn)行緩存,以便后續(xù)在內(nèi)核態(tài)直接智能網(wǎng)卡可以優(yōu)化轉(zhuǎn)發(fā)性能,當(dāng)流緩存到網(wǎng)卡后,后續(xù)的報(bào)文解析、數(shù)據(jù)中心網(wǎng)絡(luò)數(shù)據(jù)傳輸層面的算力消耗,如虛進(jìn)行處理不夠劃算,那就可以交給專用的加速器處理。這種加速器早期均基于FPGA進(jìn)行開ann隨著數(shù)據(jù)流量的增加,安全方面的開銷同樣也急劇增大。IP數(shù)據(jù)包在公用網(wǎng)絡(luò)中傳輸可能會(huì)面臨被偽造、竊取或篡改的風(fēng)險(xiǎn),而IPsec擬路由、IPsec等,使用通用CPU核心進(jìn)行處理不夠劃算,那就可最早將FPGA引入數(shù)據(jù)中心進(jìn)行加速的探索者是微軟,項(xiàng)目代號(hào)業(yè)界所了解,被視為第一個(gè)在大型數(shù)據(jù)中心中應(yīng)用FPGA的實(shí)例。了6顆XilinxVirtex-6做搜索排序,將這類運(yùn)算從CPU卸載下來——這就是妥妥的“異構(gòu)到2016年,微軟發(fā)表了Catapult第三階段的成果,直接將FPGA接口。FPGA加速卡位于服務(wù)器和數(shù)據(jù)中心網(wǎng)絡(luò)之間,一個(gè)網(wǎng)口也可以加速器的形式回到CPU內(nèi)部,譬如英特爾第四代至強(qiáng)可擴(kuò)展基于FPGA的智能網(wǎng)卡存在一些明顯的缺點(diǎn)。通軟件工程師進(jìn)行二次開發(fā)的門檻較高。更主輯資源有限,或者說邏輯資源對(duì)應(yīng)的芯片成本ann普通軟件工程師進(jìn)行二次開發(fā)的門檻較高。更主要的問題是,F(xiàn)PGA的邏輯資源有限,或者說邏輯資源對(duì)應(yīng)的芯片成本較高,主流的FPGA無法容納復(fù)雜的邏輯,因此,通中,限制了智能網(wǎng)卡的功能進(jìn)一步發(fā)展?;贏SIC的智能網(wǎng)卡也存量都極其有限。相應(yīng)的,控制面的功能還保留在CPU上處理,如虛(彈性塊存儲(chǔ))卡、安全芯片等。虛擬機(jī)的業(yè)務(wù)管理安排在“額外”署神龍架構(gòu),2017年天貓雙十一大促部署了1000臺(tái)服務(wù)器進(jìn)行驗(yàn)這種組合可以是分立的,典型的如英特爾2021年推出的代號(hào)Oakann英偉達(dá)的BlueField-3DPU是AI時(shí)代的明星產(chǎn)品。除了支持PCIe接口。CPU核的增加在芯片面積上也產(chǎn)生了明顯差異,已經(jīng)占據(jù)了annMarvell將其DPU家族的歷史上溯到2005年,當(dāng)時(shí)主要用于防大語言模型的成功讓數(shù)據(jù)中心的算力和網(wǎng)絡(luò)帶寬都進(jìn)入的高速發(fā)展的階段,如果要更好地適應(yīng)這種形勢(shì),DPU的迭并且集成了機(jī)器學(xué)習(xí)引擎。OCTEON10的2OCTEON10除了固化密碼處理、虛擬化等功能外,還有向量數(shù)Processor)。向量數(shù)據(jù)包處理引擎與前一代的標(biāo)量處理引擎相比,F(xiàn)P16數(shù)據(jù),主要用于推理應(yīng)用,如威脅檢測(cè)、波束成形優(yōu)化、情境點(diǎn)都是整合了不同程度的AI算力。支撐這種算力需求的現(xiàn)實(shí)應(yīng)用是大語言模型的成功讓數(shù)據(jù)中心的算力和網(wǎng)絡(luò)帶寬都進(jìn)入到高速發(fā)展的階段,如果要更好地適應(yīng)這種形勢(shì),DPU的迭代速度必須相應(yīng)加典型的就是在GTC2024上,英偉達(dá)發(fā)布了面向高性能AI基礎(chǔ)設(shè)施高性能、高靈活性的需總線協(xié)議也需要為此做好相應(yīng)的準(zhǔn)備。以ArmArm推出的高級(jí)微控制的歷程中不斷演進(jìn),并ann不同規(guī)模的嵌入式CPU可以定義不同卸載能力,如BlueField-3高性能、高靈活性的需求一定會(huì)促使DPU也開始考慮Chiplet的思CPU與各種加速器通過高級(jí)封裝組合起來。這些加速器可能用于AI),到了下半年,英偉達(dá)引入了BlueField-3SuperNIC,并將其定義為一種新型網(wǎng)絡(luò)加速器,旨在為基于以太網(wǎng)的AI云上運(yùn)行的超大規(guī)模ann以上屬性強(qiáng)化了高性能網(wǎng)絡(luò)的數(shù)據(jù)處理能力,而不再像DPU那樣強(qiáng)點(diǎn)可以參見下表。簡(jiǎn)單說,BlueField-3SuperNIC主要是圍繞提升先是Arm核心數(shù)量,從16個(gè)減半為8個(gè),DDR5內(nèi)存容量也從SuperNIC取消了該輔助供電。BlueField-3全部是全高卡設(shè)計(jì),均ann以自由采購(gòu),進(jìn)入門檻較低??紤]到DPU是與具體的應(yīng)用Arm提供了豐富的IP授權(quán),供不同性能、功耗、成本需求的產(chǎn)品選而Cortex-A72屬于v8.0A體系。Neoverseann8也有不小的提升,譬如前者每個(gè)核心的私有L2緩架構(gòu)多處理器(4個(gè)核心為一簇),也可以選擇直接互聯(lián),以構(gòu)成目前服務(wù)器多CPU中比較主流的網(wǎng)格(Mesh)架構(gòu)。換句話說,升。N2是Neoverse家族首個(gè)支持Armv9指令集架構(gòu)的核心,支持SVE2(可伸縮矢量擴(kuò)展,ScalableVectorExtension)、增強(qiáng)有了40%的提升。譬如前端方面,分支預(yù)測(cè)寬度翻倍,分支目標(biāo)緩相對(duì)核心數(shù)以百計(jì)的服務(wù)器系統(tǒng),擁有36個(gè)N2核心的Marvell適合DPU使用,更小的核心規(guī)模可用于網(wǎng)關(guān)等。符合UCIe規(guī)范的),家DPU的介紹也一直猶抱琵琶半遮面。為了應(yīng)對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)的高早期數(shù)據(jù)中心的算力來AI對(duì)大規(guī)模并行算力的發(fā)展為異構(gòu)算力的第三極。DPU內(nèi)部的算力來自于異構(gòu),除了嵌入式CPU,還有日趨多樣的加速器資源。這些加速ann),或者是存儲(chǔ)子系統(tǒng)的虛擬化,高性能存儲(chǔ)節(jié)點(diǎn)也需要配置DPU降本并行算力的需求讓GPU崛起為兩強(qiáng)并立,而DPU正逐步發(fā)展為異英偉達(dá)在2016年推出的DGX-1系統(tǒng),不僅首個(gè)實(shí)體(服務(wù)器)捐△△);ann),在集群層面,基于8個(gè)Gaudi3加速器的服務(wù)器通過3個(gè)800GbEann置,從帶寬的角度,與DGXH100似無不同,主要變化是對(duì)接南北向網(wǎng)絡(luò)的兩塊ConnectX-7雙端口網(wǎng)卡被兩塊功能更豐富強(qiáng)大的但限制了英偉達(dá)新一代網(wǎng)卡的性能,其實(shí)也會(huì)限制第四代NV芯片的性能。目前的DGXB200并非“完全體”,隨著英特爾或 服務(wù)器OEM基于HGX模組提供的GPU服務(wù)器在內(nèi)部拓?fù)渖蠒?huì)有英特爾和AMD的x86CPU只能通過相對(duì)低速的PCIe總線與英偉達(dá)GPU通信,這限制了GPU訪問CPU內(nèi)存的速度。英偉達(dá)基于Chip與其GPU之間建立900GB/s的高速通道,顯著提升訪問2個(gè)GH200超級(jí)芯片組成ann?9臺(tái)NVLink交換機(jī)通過銅纜形成機(jī)柜級(jí)的“背板”,將32個(gè)GH200NVL32是一種機(jī)柜級(jí)方案,使用帶冷板式液冷的集中供電機(jī)柜,設(shè)備空間為31U。每臺(tái)NVLink交換機(jī)(NVSwitchTray)端口50Gbps。NVLink交換節(jié)點(diǎn),機(jī)柜上下再各3U空間安排電源。每顆GPU外聯(lián)900GB/sann互聯(lián)方案也與半年前的發(fā)布不同,GH200NVL32不打算通過NVLinkSwitch級(jí)聯(lián)擴(kuò)展更多GPU,所有NVLink集中在一個(gè)機(jī)柜口,每個(gè)100GB/s。從英偉達(dá)發(fā)布的信息來看,DGXGH200發(fā)布還可以釋放更多的供電能力給計(jì)算節(jié)點(diǎn)。英偉達(dá)CEO黃仁勛表示,相應(yīng)的,網(wǎng)絡(luò)配置也來到了72個(gè)單口400Gb在數(shù)據(jù)采集、數(shù)據(jù)準(zhǔn)備、訓(xùn)練和推理等AI工作流的各個(gè)環(huán)節(jié),對(duì)存(Restore)數(shù)據(jù)的操作,大量數(shù)據(jù)的持續(xù)寫入和讀取,需要網(wǎng)絡(luò)和ann),許多甚至大多數(shù)數(shù)據(jù)集都可以放在數(shù)據(jù)集太大,無法放入緩存,大量不論如何評(píng)論“摩爾定律”,芯片算力提升的不論如何評(píng)論“摩爾定律”,芯片算力提升的貢獻(xiàn)越來越來自于先進(jìn)封裝而非制造工藝的改進(jìn)。于是,在算力密度提升的同時(shí),芯片功耗的上漲也引人關(guān)注——置已嫌不足,整機(jī)柜級(jí)別的“超級(jí)節(jié)點(diǎn)”正在涌現(xiàn)。集群內(nèi)的跨節(jié)點(diǎn)通信要求,不斷攀升,帶動(dòng)網(wǎng)絡(luò)端口總量及帶寬需求劇增,網(wǎng)絡(luò)基礎(chǔ)設(shè)施投資變得前所未有對(duì)算力密度的追求,促使單芯片功耗和單位空間內(nèi)的芯片數(shù)量同時(shí)增長(zhǎng),這種疊加效應(yīng)對(duì)服務(wù)器的散熱能力提出巨大挑戰(zhàn),成為液冷技術(shù)應(yīng)用邁上新臺(tái)階的主要ann無論從政策角度、市場(chǎng)需求,還是技術(shù)的成熟度來講,我們都可以認(rèn)為數(shù)據(jù)中心已經(jīng)來到了“液冷時(shí)代”。液冷正成為未來AI服務(wù)器散熱的主流解決方案,其強(qiáng)大的散熱能力和經(jīng)濟(jì)效率將推動(dòng)數(shù)據(jù)中心的持不僅是國(guó)產(chǎn)算力加速發(fā)展的黃金期,也是液冷是主流解決方案了。我國(guó)最早登上TOP500冠軍寶座的“天河二號(hào)”用戶是抱著試水的心態(tài)在“體驗(yàn)”。直到AI的爆發(fā)式增長(zhǎng)、算力需求的指數(shù)級(jí)提升,再加上迅猛發(fā)展的生成式AI不再單純?cè)黾訑?shù)據(jù)中為數(shù)據(jù)中心已經(jīng)來到了“液冷時(shí)代”。液冷正成為未來AI服務(wù)器散持續(xù)發(fā)展和創(chuàng)新。2024年不僅是國(guó)產(chǎn)算力加速發(fā)展的黃金期,也是據(jù)國(guó)際能源署(IEA)估算,由于需要靠大量計(jì)算才能運(yùn)行的生成式斯坦福大學(xué)AI研究所發(fā)布的《2023年人工智能指數(shù)報(bào)告》顯示,GPU的表現(xiàn)更加“恐怖”。英偉達(dá)最新一代的H100GPU峰值功耗高達(dá)700瓦,按照61%的年利用率,每張H100每年將消耗約目標(biāo)。為實(shí)現(xiàn)“雙碳”目標(biāo),也為解決數(shù)據(jù)中心的能源利用率低、技術(shù)水平不足等問題,各級(jí)政府先后出臺(tái)了相關(guān)圳等七省市在內(nèi)啟動(dòng)了地方碳排放權(quán)交易市場(chǎng)試點(diǎn)工作并陸續(xù)開始上ann的政策與措施。比如,北京市地方標(biāo)準(zhǔn)《數(shù)據(jù)中心能源效率限額》以及國(guó)家對(duì)數(shù)據(jù)中心從包含PUE、WUE、CUE的更多維度、更嚴(yán)苛寧暢的解決方案最大亮點(diǎn)在于PCIe區(qū)域的首創(chuàng)解耦設(shè)計(jì),以及ann刀片服務(wù)器的代表產(chǎn)品就是聯(lián)想海神Neptune溫水水冷服務(wù)器。作代,已升級(jí)到第6代。相比過往,新技術(shù)增加了對(duì)服務(wù)器電源部件水冷散熱的支持。新一代聯(lián)想溫水水冷系統(tǒng)已經(jīng)完全實(shí)現(xiàn)對(duì)CPU、溫度在58攝氏度左右,有效提升了整個(gè)系統(tǒng)的性能。即使在海南等超聚變的FusionPoD系列商用數(shù)據(jù)中心整機(jī)柜液冷服務(wù)器,具有高ann曙光數(shù)創(chuàng)的C8000是針對(duì)超高密度刀片服務(wù)器散熱問題推出的浸沒傳統(tǒng)風(fēng)冷數(shù)據(jù)中心節(jié)能超過30%。服務(wù)器采用DC400V直流供電,ann更符合互聯(lián)網(wǎng)快速迭代的實(shí)際業(yè)務(wù)情況。得益于模塊化設(shè)計(jì),J360發(fā)成本同時(shí)降低60%。DC48V供ann存儲(chǔ)在數(shù)據(jù)中心系統(tǒng)35%,比例僅次于計(jì)算能耗。也就是說,如果低,那整個(gè)數(shù)據(jù)中心的PUE值都會(huì)明顯降低。在這種情況下,存算一體化已經(jīng)不可避免,而使用液冷解決方案的存儲(chǔ)系統(tǒng)也將成為行業(yè)的保存時(shí)間自患者最后一次就診之日起不少于15年;住院電子病歷保存時(shí)間自患者最后一次出院之日起不少于30年。換句話說,醫(yī)院對(duì)市南山區(qū)人民醫(yī)院,簡(jiǎn)稱“南山醫(yī)院”)年總診療量高達(dá)227萬人次,這對(duì)后端數(shù)據(jù)中心的算力與存力都提出了嚴(yán)苛的挑戰(zhàn)。為響應(yīng)正如報(bào)告前面所提,生成式AI應(yīng)用的崛起造成了數(shù)據(jù)中心性能與散同,因此類似手機(jī)這樣的產(chǎn)品線也需要強(qiáng)大后端數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論