數(shù)據(jù)中心算力白皮書(shū)

上傳人：媚*** IP屬地：境外上傳時(shí)間：2024-04-17 格式：DOCX 頁(yè)數(shù)：115 大?。?.43MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩110頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

[編號(hào)ODCC-2020- 1Ope Dat Cente Committe1 研究背研究現(xiàn) TOP Green SPEC SPEC 小存儲(chǔ)能網(wǎng)絡(luò)能方模 I CPU服務(wù) GPU服務(wù) 算力分算效分發(fā)展趨總 202034確指出“加快5G網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度，將數(shù)據(jù)中心納入“新基建”范疇。420日，國(guó)家發(fā)改委明確新型I 1 數(shù)據(jù)中心算力白皮2020年3月4日，中共中央政治局常務(wù)委員會(huì)召開(kāi)會(huì)議，明確指出“加快5G網(wǎng)絡(luò)、數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度”，將數(shù)據(jù)中心納入“新基建”范疇。4月20日，國(guó)家發(fā)改委明確新型基礎(chǔ)設(shè)施的范展新一代信息網(wǎng)絡(luò)，拓展5G應(yīng)用，建設(shè)數(shù)據(jù)中心”。1海外巨頭在算力方面動(dòng)作不斷：Intel167FPGA生Altera。Intel2020年，30%CPU芯片將配AMD1 商轉(zhuǎn)型為Fabless設(shè)計(jì)商，目前已經(jīng)在Rome系列使用7nm工藝；20204月，NVIDIA69Mellanox（邁絡(luò)思推出網(wǎng)卡新品NVIDIAMellanox。SA2，該云服務(wù)器實(shí)例已經(jīng)被應(yīng)用于騰訊內(nèi)部包括騰訊會(huì)議、騰訊教育、春節(jié)QQ紅包、微信、視頻轉(zhuǎn)碼、廣告檢索等產(chǎn)品和業(yè)務(wù)中，表現(xiàn)出亮眼的性能和可靠的穩(wěn)定性2。阿里巴巴在ODCC牽頭發(fā)起的方升服務(wù)器開(kāi)源項(xiàng)目,旨在打造云基礎(chǔ)設(shè)施行業(yè)的COCI(ChinaOpenCloudInfrastructure)技術(shù)標(biāo)準(zhǔn),引領(lǐng)行業(yè)發(fā)展,共建中國(guó)云數(shù)據(jù)中心硬件生態(tài)，目前已經(jīng)部署超過(guò)10萬(wàn)節(jié)點(diǎn)。百度推出的FPGA版本百度大腦，運(yùn)用到于包括語(yǔ)音識(shí)別、廣告點(diǎn)擊率預(yù)估模型、DNA序列檢測(cè)以及無(wú)人車等業(yè)務(wù)中，性能提升3倍以上。22 TOP500根據(jù)超算執(zhí)行Linpack程是針對(duì)單機(jī)或芯片開(kāi)展的，SPECCPU套件能夠?qū)PU整點(diǎn)運(yùn)算及3 個(gè)國(guó)家先進(jìn)計(jì)算水平的代表性設(shè)施。人們普遍用浮點(diǎn)運(yùn)算速度LINAC（基準(zhǔn)測(cè)試所能達(dá)到的最高性能Rmax（單位：TFLOPS）500個(gè)超算TOP5006111202011TOP500排行表1202011月TOP500排行榜超算系統(tǒng)前十排名12橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室（美國(guó)3勞倫斯利弗莫爾國(guó)家4（中國(guó)Sunway5英偉達(dá)公司（美國(guó)6廣州國(guó)家超算中心（中國(guó)34數(shù)值為雙精度浮點(diǎn)運(yùn)算次數(shù)4 選取的測(cè)試標(biāo)準(zhǔn)產(chǎn)生質(zhì)疑，TOP500并沒(méi)有對(duì)超算通信子系統(tǒng)運(yùn)算性TOP500測(cè)評(píng)如Graph500。Graph500對(duì)超算每秒遍歷邊緣的數(shù)量進(jìn)行了評(píng)估，其單位為Gteps（每秒10億遍歷邊緣數(shù)Graph500榜單的發(fā)布表明了Green到了廣泛的關(guān)注。2007年，Green500（GFLOPS/W）5002202011月發(fā)布的排行榜超算系統(tǒng)前十榜單，從該Green500和TOP500在超算系統(tǒng)排名上存在很大的TOP500Green500榜單上排名NVIDIADGXSuperPODMN-3TOP500170330Green500上排名靠TOP500上排名靠前的超算并沒(méi)有出現(xiàn)在Green5005從TOP500到Green500，超算算力評(píng)價(jià)指標(biāo)逐漸從以運(yùn)算速度為Green500提出的浮點(diǎn)運(yùn)算能力及浮點(diǎn)運(yùn)算用電效率指標(biāo)為其他行業(yè)表 2020年11月Green500排行榜超算系統(tǒng)前十）1（美國(guó)D237 (FZJ)（德國(guó)455Corporation（美6 Plant（日本7 56數(shù)值為雙精度浮點(diǎn)運(yùn)算次數(shù)7數(shù)值為雙精度浮點(diǎn)運(yùn)算次數(shù)688Eni（意大利9Holyoke,（美國(guó)1 SPECSPECCPU是由全球權(quán)威性能評(píng)估機(jī)構(gòu)SPEC（StandardPerformanceEvaluationCorporation）推出的一款行業(yè)標(biāo)準(zhǔn)的CPU測(cè)SPECCPU2017SPECspeed2017Integer、SPECspeed2017FloatingPoint、SPECrate2017Integer、SPECrate2017FloatingPoint這四個(gè)套件的43個(gè)測(cè)試項(xiàng)目，對(duì)CPU試。SPECCPU套件將會(huì)根據(jù)測(cè)試結(jié)果為CPU整數(shù)運(yùn)算及浮點(diǎn)運(yùn)算能力進(jìn)行打分，用戶能夠通過(guò)打分結(jié)果直觀地看出不同CPU的性能差異，并且根據(jù)業(yè)務(wù)需要選擇合適的CPU。SPECSPEC2006SPECpower72007power委員會(huì)推出了一款里程碑式的能效基準(zhǔn)測(cè)試套件——評(píng)級(jí)工具worklet分別對(duì)服務(wù)器的CPU、內(nèi)存、存儲(chǔ)組件進(jìn)行測(cè)試。SERT對(duì)SPECpower_ssj2008中的SPECPTDaemon進(jìn)行了復(fù)用。MLPerf2018（raining（Inference20204月，MLPerf已經(jīng)發(fā)布了兩8 MLPerf圖1MLPerfTrainingv0.7ODCC（開(kāi)放數(shù)據(jù)中心委員會(huì)）于2019年發(fā)布了《服務(wù)器能效評(píng)試規(guī)范將服務(wù)器性能測(cè)試劃分為CPU、內(nèi)存及存儲(chǔ)三個(gè)部分，利用BenchmarkEffserver=exp[????????×ln(????????????)+??????????????ln(??????????????????)+????????????????×ln(????????????????????)] 9 PUE（PowerUsageEffectiveness，電能利用效率）是TGG（TheGreenGrid，綠色網(wǎng)格）發(fā)布的一項(xiàng)用于評(píng)價(jià)數(shù)據(jù)中心能效的指標(biāo)，PUEIT數(shù)據(jù)中心中，IT設(shè)備是對(duì)外提供服務(wù)的主體設(shè)備，是產(chǎn)生算力的源泉。PUEIT設(shè)備能耗占比越大，有更多電能算力能效除了與電能供給有關(guān)，還與IT設(shè)備的硬件性能、虛擬化技術(shù)的應(yīng)用等因素有關(guān)，例如，對(duì)于不同性能的CPU芯片，消耗相同足要求而引發(fā)的“木桶效應(yīng)”可能會(huì)拉低整個(gè)數(shù)據(jù)中心的實(shí)際算力水在數(shù)據(jù)中心算力水平測(cè)試方面，對(duì)于正在運(yùn)行的數(shù)據(jù)中心，讓其單獨(dú)運(yùn)行某一測(cè)試程序從而判斷其算力水平不僅會(huì)帶來(lái)大量的測(cè)試 P00和ren50運(yùn)算速度和浮點(diǎn)運(yùn)算用電效率兩個(gè)角度為超算算力評(píng)價(jià)提供了統(tǒng)一CCP對(duì)UCoer算力測(cè)試及評(píng)估指標(biāo)為超算及常規(guī)服務(wù)器算力性能評(píng)價(jià)提供了一套質(zhì)上說(shuō)，數(shù)據(jù)中心為應(yīng)對(duì)5G、人工智能、工業(yè)互聯(lián)網(wǎng)的大數(shù)據(jù)需求圖2 數(shù)據(jù)中心算力是數(shù)據(jù)中心的服務(wù)器通過(guò)對(duì)數(shù)據(jù)進(jìn)行處理后實(shí)現(xiàn)、代表的新一代數(shù)字化技術(shù)產(chǎn)業(yè)趨勢(shì)過(guò)程中，又可以區(qū)分為以CPU為代表的通用計(jì)算能力，和以GPU為代表的加速計(jì)算能力。前者主要4CPU（CentralProcessingUnit，中央處理器）作為通用處理器，更偏重支持控制流數(shù)據(jù)。CPU每個(gè)物理核中大部分的硬件資源被做（ALU8JohnNickollsandWilliamJDally.Thegpucomputingera.IEEEmicro,30(2):56–69, CPUx86ARMx86Intel和AMDx86CPUIntelx86指令A(yù)I技術(shù)的發(fā)展，往往通過(guò)深度學(xué)習(xí)作為切入點(diǎn)來(lái)分析各個(gè)芯片的性能。例如Intel的向AI應(yīng)用提供了更為全面的硬件加速能力。X86架構(gòu)CPU芯片計(jì)算能力與對(duì)應(yīng)的核數(shù)、主頻和對(duì)應(yīng)的微架構(gòu)計(jì)算能力息息相關(guān)，作為當(dāng)今世界生產(chǎn)CPU的最大廠商Intel和系列芯片，AMD主要是霄龍系列芯片。IntelAMD的服務(wù)器所用的部分芯片的參數(shù)詳見(jiàn)表3。表 X86架構(gòu)典型芯片處理器參數(shù)122.0032.3045AMDEPYC?2.206AMDEPYC?3.20x86架構(gòu)CPU計(jì)算能力與對(duì)應(yīng)的微架構(gòu)和指令集息息相關(guān)，以Intel的Haswell微架構(gòu)為例進(jìn)行分析，Haswell架構(gòu)上計(jì)算單元有2個(gè)FMA，每個(gè)FMA可以對(duì)256bit數(shù)據(jù)在一個(gè)時(shí)鐘周期中做一次乘SPECCPU2017SPECspeed2017Integer、SPECspeed2017FloatingPoint以及測(cè)試整型并發(fā)速率和浮點(diǎn)并發(fā)速率SPECrate2017Integer和SPECrate2017FloatingPointSPECspeedCPU完成單個(gè)任務(wù)SPECrateCPUSPECCPU20174CPU測(cè)試結(jié)果，詳見(jiàn)表4。9數(shù)據(jù)來(lái)源：intel、AMD 表4SPEC測(cè)試結(jié)果峰1288H(IntelXeonGold2.10SPECspeed211288H(IntelXeonGold2.20212288H(IntelSPECrate22—2488H(IntelGold421288H(IntelXeonGold2.10SPECspeed211288H(IntelGold2.20212488H(IntelGoldSPECrate2017Integer4210 ARMCPU穿戴設(shè)備、IoT等領(lǐng)域。隨著ARM技術(shù)不斷進(jìn)步，多核性能大幅提高，尤其是開(kāi)放的生態(tài)，ARM也從端和邊緣計(jì)算走向服務(wù)器和數(shù)據(jù)中心。當(dāng)下，ARM架構(gòu)發(fā)揮在多核、低功耗等方面的優(yōu)勢(shì)，在面向大數(shù)據(jù)、分布式存儲(chǔ)和ARM原生應(yīng)用等場(chǎng)景，為企業(yè)構(gòu)建高性能、由于ARM架構(gòu)CPU采用RISC精簡(jiǎn)指令集，內(nèi)核結(jié)構(gòu)簡(jiǎn)單小1632位、64位多種指令集，能很好的兼容從IOT、終端到云端的各類應(yīng)用場(chǎng)ARMCPUARM的Cortex-A57微架構(gòu)為例進(jìn)行分析，Cortex-A57架構(gòu)上計(jì)算單元有1個(gè)FMA，每個(gè)FMA可以對(duì)128bit數(shù)據(jù)在一個(gè)時(shí)鐘周期中做一次乘運(yùn)算和一次加運(yùn)算，所以對(duì)應(yīng)32bit單精度浮點(diǎn)計(jì)算能力為8 ARM架構(gòu)CPU構(gòu)計(jì)算能力息息相關(guān)。因?yàn)锳RMCPU，開(kāi)始于低功耗、計(jì)算量小的場(chǎng)景，如智能手機(jī)、穿戴設(shè)備、IoTARM架隨著服務(wù)器的發(fā)展，華為公司聚焦于發(fā)展基于ARM架構(gòu)的鯤鵬處理ARM架構(gòu)的CPU芯片情況詳見(jiàn)表5。表5ARM架構(gòu)典型芯片（高通、華為、飛騰1驍龍8243鯤鵬4411數(shù)據(jù)來(lái)源：https:/// AI等復(fù)雜應(yīng)用的必然選GPU（GraphicsProcessingUnit，圖形處理器）具有強(qiáng)大而高效的并行計(jì)算能力，對(duì)于海量訓(xùn)練數(shù)據(jù)，用GPU來(lái)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)，中心基礎(chǔ)設(shè)施也更少。此外GPU還被廣泛用于云端進(jìn)行分類、預(yù)測(cè)CPU的做法相比，GPU具有數(shù)以千計(jì)的計(jì)算核心，可實(shí)現(xiàn)10-100倍應(yīng)用吞吐量。GPUCPUGPU每個(gè)運(yùn)算核心的工作頻率不及CPU，但GPU計(jì)算單元的算力要遠(yuǎn)遠(yuǎn)強(qiáng)于CPU，且GPU的GPU線程之間的切換相對(duì)廉價(jià)，能夠通過(guò)大量并行線程之間的交織 NVIDIA是最早將GPU用于人工智能領(lǐng)域的公司，創(chuàng)造性的推出了CUDA通用并行計(jì)算架構(gòu)。作為一項(xiàng)同時(shí)支持硬件和軟件的技CUDA計(jì)算性能可獲得顯著提升。從軟件生態(tài)上，CUDA不僅支持自身的API，也支持其他通用計(jì)算API比如OpenCL/DXCompute等。為適應(yīng)近些年來(lái)AI的發(fā)展，CUDA也增加了一系列的標(biāo)準(zhǔn)庫(kù)函數(shù)來(lái)支持CUDA架構(gòu)及生態(tài)只支持NVIDIA公司的GPU產(chǎn)品，不開(kāi)源，所以在有國(guó)產(chǎn)化要求的AI應(yīng)用中有一定的安全隱患。AMDAMDAMDCDNAGPU架構(gòu)，專為數(shù)MatrixCore技術(shù)、搭載百億億級(jí)計(jì)算核心，可提供卓越的性能和能HPCAIMatrixCore技術(shù)，為單精度和混合精度矩陣運(yùn)算(FP32、FP16、bFloat15、Int8Int4）提供超強(qiáng)性能，促進(jìn)HPC和AI的融合。CDNA架構(gòu)還包含AMDInfinity架構(gòu)，為緊密連接的GPU系統(tǒng)提供了一個(gè)先進(jìn)的運(yùn)行平臺(tái)，讓工作負(fù)載可以AMD也正式發(fā)布了首款基于全新CDNA架構(gòu)的InstinctMI100加速顯卡，率先超越10TFFP64大關(guān)的數(shù)據(jù)中心GPU，為行業(yè)提供的算法設(shè)計(jì)。FPGA不采用指令和軟件，是軟硬件合一的器件。對(duì)FPGACPUGPUASIC之ASICASICFPGA的CPU、GPU等處理器，F(xiàn)PGA高度可定制。開(kāi)發(fā)者可以使用Verilog或VHDL硬件描述語(yǔ)FPGA前FPGA常被用作ASIC芯片流片前的硬件驗(yàn)證方法。FPGAFPGA計(jì)算的絕對(duì)性能并不如GPU，但是企業(yè)級(jí)GPU的功率通常高FPGA20瓦以下。低功耗帶來(lái)的直接 FPGAFPGAASIC芯片與FPGA相比較，單純的ASIC芯片無(wú)法完全替代FPGAAI領(lǐng)域，F(xiàn)PGA與ASIC會(huì)分而治之。而在智慧工業(yè)機(jī)器人、智慧通信、智慧醫(yī)療、智慧裝備等領(lǐng)域，除FPGA以外其他AI全球最大的FPGA芯片生產(chǎn)廠商賽靈思和Intel，都確立了相似元件集成在芯片上，滿足AI等應(yīng)用對(duì)強(qiáng)大計(jì)算能力的需求。掘FPGA使用范圍，充分發(fā)揮FPGA的優(yōu)勢(shì)。微軟將FPGA作為核AIFPGA的專用服務(wù)器集群，到用專用網(wǎng)絡(luò)連接的FPGA加速卡集群，再到將共享數(shù)據(jù)中心網(wǎng)絡(luò)的大規(guī)模 FPGAFPGAIntel針對(duì)FPGA開(kāi)發(fā)了一種經(jīng)濟(jì)高效的可重復(fù)編程平臺(tái)，具有ASIC（ApplicationSpecificIntegratedCircuit，特殊應(yīng)用專用集成電路）是為了某種特定的需求而專門(mén)定制的芯片。ASIC芯片的計(jì)算片可分為全定制ASIC芯片、半定制ASIC芯片及可編程ASIC芯片特別是在AI芯片布局方面，已經(jīng)成為了眾多行業(yè)巨頭的重心，因?yàn)锳I應(yīng)用如雨后春筍般出現(xiàn)，而針對(duì)不同應(yīng)用打造的特殊應(yīng)用芯片ASIC的 TPU（TensorProcessingUnit，張量處理器）是Google為機(jī)器學(xué)（ASIC而設(shè)計(jì)。TPU在算法架構(gòu)上介于CPU和全定制化ASIC之間，兼具TPUCPUTPU算法架構(gòu)的ASIC芯片可完成更高運(yùn)算量。相對(duì)同級(jí)別CPU、GPU，該類ASIC芯片可提高運(yùn)算性能15倍至30倍，并提高能耗效率30倍至80倍。Google針對(duì)AI很早就設(shè)計(jì)了自己的TPU芯片，之前的AlphaGo就有采用。此外，Google自己的手機(jī)Pixel2也首次采用了自研芯片PixelVisualCore以提升拍照性能。eASICASICASICFPGA靜態(tài)泄漏和高功NPU等（AI芯片AI應(yīng) 的類腦芯片。當(dāng)前技術(shù)條件下的AI芯片主要是針對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練各國(guó)都在積極摸索研究AI芯片的發(fā)展方向，在我國(guó)也涌現(xiàn)出了一批AI芯片企業(yè)。AINPU。20161A處理器具有完全自主知識(shí)產(chǎn)權(quán)，可用于計(jì)算機(jī)視AI芯片的研發(fā)。2018年華為正式910310AI910是目前單芯AIAI310是目前面向SoCAI芯片，非常適合邊緣計(jì)算的低功耗要求場(chǎng)燧原科技在2019年發(fā)布了首款面向云端數(shù)據(jù)中心的AI訓(xùn)練芯 2019AICSK400XAI算法，可以有效通過(guò)深度神經(jīng)網(wǎng)絡(luò)對(duì)于ICP和吞吐率是IDC數(shù)據(jù)中心存儲(chǔ)系統(tǒng)應(yīng)該密切關(guān)注的問(wèn)題。從歷史上看,計(jì)算機(jī)速度的瓶頸已逐漸從20世紀(jì)80年代的CPU和90年代的網(wǎng)絡(luò)帶寬轉(zhuǎn)移到IOIDC數(shù)據(jù)中心存儲(chǔ)系統(tǒng)的保證應(yīng)用系統(tǒng)永不停機(jī)（7×24小時(shí)不間斷工作AI時(shí)代模型訓(xùn)練的算力需求，AIGPU的算力AIAI集群系統(tǒng)成為了滿足AI應(yīng)用算力需求的首選。IsNetworktheBotleneckofDistributedTraining,JohnsHopkinsUniversity& InfiniBand（IB）RoCEAI領(lǐng)域網(wǎng)絡(luò)技術(shù)的重要網(wǎng)IBLawrenceLivermore國(guó)家實(shí)驗(yàn)室和IBM公司公布的均通信效率只有50%到60%，利用動(dòng)態(tài)路由，他們達(dá)到了平均96%MPIGraph14All2All500nsIB從靜態(tài)時(shí)延角度看，以太相比IB存在劣勢(shì)，這種劣勢(shì)通過(guò)網(wǎng)絡(luò)與計(jì)《TheDesign，Deployment，andEvaluationoftheCORALPre-ExascaleSystemsSudharshanS.Vazhkudai?BronisR.deSupinski?ArthurS.BlandAlGeist?JamesSextonJimKahleChristopherJ.Zimmer?ScottAtchleySarpOral?DonE.MaxwellVeronicaGVergaraLarreaAdamBertschRobinGoldstone?,WayneJoubert?,ChrisChambreau?,DavidAppelhans,RobertBlackmoretc.SC18,November11-16,2018,Dallas,Texas,USAMPIGraphAll2AllMPI《CharacterizationofMPIUsageonaProductionSupercomputer ODCC8TAISHAN（920芯片NVIDIA100GE網(wǎng)OSU傳統(tǒng)RoCE網(wǎng)絡(luò)，網(wǎng)算一體技術(shù)大幅度降低了HPC計(jì)算的任務(wù)完成時(shí)間，平均降幅超20%。圖3768核allreduce通信ODCC 目前數(shù)據(jù)中心內(nèi)部的服務(wù)器芯片類型以CPU和GPU這兩個(gè)類 pointoperationspersecond）為每秒執(zhí)行的浮點(diǎn)運(yùn)算次數(shù)，是對(duì)計(jì)算機(jī)FLOPS的概念最早由FrankH.McMahon17在其YifanSun18等使用FLOPS作為度量標(biāo)準(zhǔn)，以評(píng)估CPU和GPU的單精度和雙精度計(jì)算能力。（FP64（FP32半精度浮點(diǎn)數(shù)（FP16：采用16位二進(jìn)制來(lái)表達(dá)一個(gè)數(shù)字，NVIDIA2002CUDA7.516位浮點(diǎn)數(shù)的存儲(chǔ)16JohnNickollsandWilliamJDally.Thegpucomputingera.IEEEmicro,30(2):56–69,17McMahon,FH.TheLivermoreFortranKernels:Acomputertestofthenumericalperformancerange.UnitedStates:N.p.,1986.Web.18YifanSunet，al.SummarizingCPUandGPUDesignTrendswithProduct 與Linpack僅關(guān)心雙精度的浮點(diǎn)計(jì)算（FP64）能力不同，我們將給出（FP32除了FP64和FP32之外，其他的計(jì)算精度也越來(lái)越廣泛被用于計(jì)算領(lǐng)域。對(duì)于人工智能來(lái)說(shuō)，F(xiàn)P16大有后來(lái)居上的趨勢(shì)。主流的AI芯片和AI軟件都已經(jīng)支持FP16精度用于深度學(xué)習(xí)訓(xùn)練。同時(shí)INT8也越來(lái)越多用于深度學(xué)習(xí)推理領(lǐng)域。在本白皮書(shū)中，我們目前僅采用FP64和FP32兩種精度衡量數(shù)據(jù)中心算力和算效，未來(lái)考慮數(shù)據(jù)中心算力（CP，ComputationalPower）????=f(通用算力，高性能算力，存儲(chǔ)能力，網(wǎng)絡(luò)能力) 通用算力=∑(CPU服務(wù)器存數(shù)×CPU算力 CPU6表主流CPU服務(wù)器算力1Intel?Xeon?ProcessorE7921.62Intel?Xeon?ProcessorE5774.43Intel?Xeon?Scalable1.64AMDEPYC?7002Series2.6 高性能算力=∑(某型號(hào)GPU服務(wù)器存數(shù)×該型號(hào)服務(wù)器GPU算力以NVIDIA主流GPU7表7NVIDIAGPU型號(hào)算力1526.839.3415.7514619.5SSD硬盤(pán)由于使用了高速的閃存顆粒做為物理存儲(chǔ)資源，并且使用PCIe等高速傳輸協(xié)議/接口做為主流數(shù)據(jù)交換的物理通道，其在IOPS和帶寬方面遠(yuǎn)優(yōu)于傳統(tǒng)的HDD硬盤(pán)。1920數(shù)據(jù)來(lái)源：NVIDIA PCIeSSDSASHDD硬盤(pán)來(lái)比較，PCIeSSD卡的4KIOPS1M以上，而SASHDDIOPS為PCIeSSD的測(cè)試結(jié)果均為SASHDD的1000倍以上。圖4HDD&SSDODCCAIAI AI集群節(jié)點(diǎn)之間的通信代價(jià)的增加，當(dāng)前存儲(chǔ)介質(zhì)SSD的訪問(wèn)性能相比傳統(tǒng)分布式存儲(chǔ)HDD已提升了100倍，對(duì)于采用NVMe接口協(xié)議的SSD（簡(jiǎn)稱NVM介質(zhì)）時(shí)，訪問(wèn)性能相比HDD甚至可以提升10000倍。在存儲(chǔ)介質(zhì)的時(shí)延5%65%中心的耗電規(guī)模為205TWh，占全世界耗電規(guī)模的1% IT設(shè)備功耗的比值，即“IT設(shè)備每瓦功耗單位：FLOPS/W

???? ∑????設(shè)備

數(shù)據(jù)中心算力能效測(cè)算方面，數(shù)據(jù)中心IT設(shè)備能耗之和可以用機(jī)架功耗之和近似替代，在得到IT圖5近五年我國(guó)數(shù)據(jù)中心機(jī)架規(guī)模及預(yù)測(cè)圖530%圖62016-2018年各省份機(jī)架規(guī)模詳情（單位，萬(wàn)架620162018年我國(guó)各省份數(shù)據(jù)中心機(jī)架PUE我國(guó)數(shù)據(jù)中心機(jī)架規(guī)模區(qū)域分布不均衡的根本原因在于我國(guó)不同數(shù)據(jù)在遠(yuǎn)距離傳輸過(guò)程中的網(wǎng)絡(luò)延時(shí)可能會(huì)對(duì)服務(wù)質(zhì)量產(chǎn)生一定的 2018年年底，國(guó)內(nèi)數(shù)據(jù)中心總體平均上架率為47.9%23。部69.9%72.3%53.6%、52.4%28.2%，大型54.3%59.8%?？侰PU根據(jù)Gartner的數(shù)據(jù)來(lái)看，中國(guó)（不包括港澳臺(tái)地區(qū)）CPU架2015-2019年基本呈現(xiàn)上升趨勢(shì)，5年復(fù)合增長(zhǎng)率近8%，2019年的出貨量為340萬(wàn)臺(tái)左右，其中x86架構(gòu)在CPU99%圖72015-2019CPU架構(gòu)服務(wù)器出貨量在廠商市場(chǎng)份額方面，IntelCPU市場(chǎng)市占率95%2019Q4IDC數(shù)據(jù)顯示，IntelCPU93.6%，其次為AMD為4.9%。24圖82019Q4CPU微處理器市場(chǎng)份額GPU根據(jù)IDC的數(shù)據(jù)顯示，全球GPU2019840萬(wàn)Unit圖92016-2019年全球GPU出貨量（25數(shù)據(jù)來(lái)源：IDC《DatacenterProcessing4Q19ServerCPUGPUFPGAAIASICs,andASSPs26數(shù)據(jù)來(lái)源：IDC《DatacenterProcessing4Q19ServerCPUGPUFPGAAIASICs,andASSPs市場(chǎng)份額方面，NVIDIA2019Q4為例，根據(jù)IDC數(shù)據(jù)顯示，NVIDIA在全球數(shù)據(jù)中心GPU服務(wù)器市場(chǎng)份額的占比為94.4%，其余為AMD，占比5.6%。圖102019Q4GPU服務(wù)器市場(chǎng)份額2127數(shù)據(jù)來(lái)源：IDC《DatacenterProcessing4Q19ServerCPUGPUFPGAAIASICs,andASSPs2014年全球數(shù)據(jù)中心能耗達(dá)到世界能源使用總量的1.62%左右28。IT測(cè)算是基礎(chǔ)。數(shù)據(jù)中心總功耗主要由供配電系統(tǒng)、制冷系統(tǒng)及IT設(shè)數(shù)據(jù)中心能效水平的提升，數(shù)據(jù)中心PUE居高不下，近年來(lái)，隨著數(shù)據(jù)中心整體能效水平有所提升。截至2018年年底，全國(guó)超大型數(shù)據(jù)中心平均PUE為1.40，大型數(shù)據(jù)中心平均PUE為1.54，與前兩年比有所提升。全國(guó)規(guī)劃在建數(shù)據(jù)中心平均設(shè)計(jì)PUE為1.35左右，超大型、大型數(shù)據(jù)中心平均設(shè)計(jì)PUE分別為1.32、1

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)中心算力白皮書(shū)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)據(jù)中心算力白皮書(shū)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔