




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、華為高性能計(jì)算集群軟件方案1目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點(diǎn)4.華為HPC軟件應(yīng)用案例2高性能計(jì)算系統(tǒng)概述(source:)200020131990-20001980-19901970-1980MPP向量機(jī)DSMCluster01002003004005002009.62009.112010.62010.112011.62011.112012.62012.112013.62009-2013 TOP500 HPC系統(tǒng)架構(gòu)ClusterMPPSMP高性能計(jì)算系統(tǒng)的架構(gòu)演變?nèi)騂PC系統(tǒng)主流架構(gòu)(cluster和MPP)以計(jì)算為目的,
2、使用了很多處理器的單個(gè)計(jì)算機(jī)系統(tǒng)或者使用了多臺(tái)計(jì)算機(jī)集群的計(jì)算系統(tǒng)和環(huán)境什么是高性能計(jì)算3高性能計(jì)算系統(tǒng)的應(yīng)用領(lǐng)域4高性能計(jì)算系統(tǒng)組成Application : 計(jì)算應(yīng)用Scalable File System: 集群存儲(chǔ)Middleware: 計(jì)算通信中間件Development Tools: 開(kāi)發(fā)工具Operating System: 集群操作系統(tǒng)Interconnect: 高速計(jì)算互聯(lián)設(shè)備Server: 節(jié)點(diǎn)服務(wù)器Storage: 硬件存儲(chǔ)設(shè)備Cluster Management: 集群和資源管理Deployment Toolkit: 部署工具Change Management: 配置變
3、更管理Health Monitoring: 狀態(tài)監(jiān)控Job Scheduling: 作業(yè)調(diào)度5X86,Linux,刀片系統(tǒng)占據(jù)主流,IB和GE平分秋色高性能計(jì)算系統(tǒng)的發(fā)展趨勢(shì)100%75%50%25%全球TOP 500 高性能計(jì)算機(jī)的使用情況81%10%95%66%41%處理器操作系統(tǒng)構(gòu)建方式互聯(lián)網(wǎng)絡(luò)Intel X869%AMDX869OthersLinuxBlade16%43%34%IBGEOthersOthersOthers5%6華為高性能計(jì)算解決方案硬件資源硬件資源計(jì)算環(huán)境計(jì)算環(huán)境并行文件系統(tǒng) (Lustre, NAS)管理服務(wù)管理服務(wù) 操作系統(tǒng)操作系統(tǒng) (RHEL 5.x/6.x, C
4、entOS 5.x/6.x, SLES11.x)記帳統(tǒng)計(jì)并行環(huán)境 (MPI/MPICH, PVM等)開(kāi)發(fā)接口應(yīng)用服務(wù)應(yīng)用服務(wù)系統(tǒng)系統(tǒng)部署部署程序程序部署部署備份備份還原還原Intel HPC 編譯及開(kāi)發(fā)環(huán)境C/C+/Fortran Intel MKL, Intel Vtune監(jiān)控告警流程管理資源管理作業(yè)調(diào)度系統(tǒng)服務(wù)應(yīng)用集成華華 為為 高高 性性 能能 計(jì)計(jì) 算算 服服 務(wù)務(wù) 平平 臺(tái)臺(tái)7目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點(diǎn)4.華為HPC軟件應(yīng)用案例8Huawei HPC軟件解決方案包HPC集群常用組件華為WisdomC+ 高性能計(jì)算軟件包1操作系統(tǒng)RedHat
5、 Linux 5.x, 6.x,CentOS 5.x, 6.x2集群管理工具WisdomC+ 集群管理工具,3資源管理和作業(yè)調(diào)度管理器WisdomC+ 作業(yè)調(diào)度和資源管理4并行計(jì)算消息通訊庫(kù)、測(cè)試工具WisdomC+ 并行計(jì)算組件包5文件系統(tǒng)NFS,Lustre6集群部署工具WisdomC+ 集群部署工具7工作流組件WisdomC+ 工作流工具8節(jié)能管理組件WisdomC+ 節(jié)能管理工具9許可證管理組件WisdomC+ 許可證管理工具10統(tǒng)計(jì)分析組件WisdomC+ 統(tǒng)計(jì)分析工具11帳戶及計(jì)費(fèi)管理組件WisdomC+ 帳戶及計(jì)費(fèi)管理工具9支持的典型行業(yè)應(yīng)用行業(yè)主要的計(jì)算任務(wù)支持的行業(yè)應(yīng)用軟件產(chǎn)
6、品CAE幾何建模電磁仿真計(jì)算流體力學(xué)有限元分析HFSS、COMSOL、Feko* (EMSS)、CST Microwave Studio、Zelan Fidelity、ABAQUS、ANSYS、LS-DYNA、FLUENT、STAR-CD 、Hspice、Maxwell、PoweSI、OptimizePI基礎(chǔ)科學(xué)物理科學(xué)計(jì)算化學(xué)分析計(jì)算材料科學(xué)計(jì)算VASP、Gaussian、Materials Studio石油勘探能藏模擬分析地震油層分析油層數(shù)據(jù)可視化VIIP、Eclipse、RMS生命科學(xué)基因測(cè)序蛋白質(zhì)分析醫(yī)藥研究BLAST/MPIBLAST、AMBER、Gromacs、NAMD氣象海洋氣候
7、模擬氣候預(yù)測(cè)MM5、WRF、ARPS、GRAPES、CMAQ、CCSM10l功能完備的集群管理和部署工具l可視化工作流工具,支持自定義流程l智能的能耗管理和靈活的調(diào)度策略高效易用l友好的圖形化統(tǒng)一管理界面l完善的作業(yè)管理和調(diào)度功能l支持多種類(lèi)型的并行計(jì)算任務(wù)可靠l支持1000節(jié)點(diǎn)以上中大規(guī)模運(yùn)算l管理節(jié)點(diǎn)互備,快速故障恢復(fù)l運(yùn)算過(guò)程checkpoint,單點(diǎn)故障后續(xù)算專(zhuān)業(yè)l7*24小時(shí)專(zhuān)業(yè)支持服務(wù)l遍布全球的售后支持網(wǎng)絡(luò)l定制化服務(wù)華為HPC軟件特點(diǎn)11模塊化,可擴(kuò)展,易升級(jí)Web Service InterfaceWeb Portal / CLIHTTP/SSHHTTP作業(yè)調(diào)度集群管理集群監(jiān)
8、控告警管理能耗管理用戶管理記賬統(tǒng)計(jì)安裝部署并行庫(kù)數(shù)學(xué)庫(kù)編譯器調(diào)測(cè)器RHEL 5.x/6.xSLES 11.xCentOS 5.x/6.x 生物制藥CAS仿真動(dòng)漫渲染石油勘探軟件架構(gòu):組件化、Web化、開(kāi)放預(yù)集成行業(yè)應(yīng)用軟件,集中調(diào)度管理維護(hù)簡(jiǎn)單定制開(kāi)發(fā)12與普通集成方案的區(qū)別功能華為HPC方案普通集成方案普通集成方案的補(bǔ)救措施便捷的集群安裝和部署YesNo自行下載相關(guān)軟件,手工進(jìn)行安裝部署統(tǒng)一的圖形化集群管理YesNo自行集成第三方集群管理軟件直觀的集群和節(jié)點(diǎn)監(jiān)控YesNo自行集成和配置第三方集群監(jiān)控軟件豐富的告警管理YesNo應(yīng)用程序統(tǒng)一訪問(wèn)門(mén)戶YesNoHPC必備組件(函數(shù)數(shù)學(xué)計(jì)算庫(kù),開(kāi)發(fā)
9、工具)YesNo自行查找、下載、編譯和安裝數(shù)學(xué)庫(kù)等組件,自行軟件包間依賴(lài)性問(wèn)題高效的作業(yè)調(diào)度器YesNo自行下載、編譯、安裝和配置作業(yè)調(diào)度器完備的統(tǒng)計(jì)記賬YesNo智能的能耗管理YesNo網(wǎng)絡(luò)并行文件系統(tǒng)YesNo自行集成和配置第三方網(wǎng)絡(luò)并行文件系統(tǒng)靈活的工作流管理YesNoNO表示尚未具備商用軟件能力,YES表示已具備商用軟件能力13和普通集成方案對(duì)比組件華為HPC方案普通集成方案集群安裝部署工具 一鍵式批量部署,快速完成集群搭建 便捷的部署界面,靈活安裝部署新增節(jié)點(diǎn) 節(jié)點(diǎn)鏡像安裝和恢復(fù),提供完備的鏡像管理手工安裝操作系統(tǒng)手工編寫(xiě)安裝腳本,軟件安裝困難無(wú)節(jié)點(diǎn)備份恢復(fù)功能圖形化集群管理工具統(tǒng)一
10、的圖形化集群管理工具集群節(jié)點(diǎn)管理功能、多節(jié)點(diǎn)并發(fā)命令工具、文件系統(tǒng)管理功能自行集成各種集群管理軟件包沒(méi)有統(tǒng)一的集群管理界面集群和節(jié)點(diǎn)監(jiān)控工具統(tǒng)一的集群和節(jié)點(diǎn)監(jiān)控工具豐富的報(bào)表和圖形展現(xiàn)自行查找和集成相關(guān)監(jiān)控用以動(dòng)態(tài)監(jiān)控集群沒(méi)有統(tǒng)一的集群監(jiān)控界面告警管理工具豐富的告警管理,系統(tǒng)支持郵件發(fā)送通知無(wú)告警管理工具應(yīng)用程序統(tǒng)一訪問(wèn)門(mén)戶統(tǒng)一的系統(tǒng)門(mén)戶,支持定制各種應(yīng)用的作業(yè)提交界面,預(yù)集成典型應(yīng)用的作業(yè)提供界面無(wú)應(yīng)用程序統(tǒng)一訪問(wèn)界面HPC必備組件(函數(shù)數(shù)學(xué)計(jì)算庫(kù),開(kāi)發(fā)工具)包含MPICH1/2、MVAPICH、OpenMPI并行通信庫(kù),包含MKL、ATLAS等主流數(shù)學(xué)計(jì)算庫(kù)自行查找、下載、編譯和安裝數(shù)學(xué)庫(kù)
11、等組件,自行軟件包間依賴(lài)性問(wèn)題作業(yè)調(diào)度器提供高效的作業(yè)調(diào)度器,支持豐富的任務(wù)調(diào)度策略、資源分配策略和資源限制策略自行下載、編譯、安裝和配置作業(yè)調(diào)度器統(tǒng)計(jì)記賬工具完備的統(tǒng)計(jì)記帳工具,按需產(chǎn)生計(jì)費(fèi)報(bào)表無(wú)統(tǒng)計(jì)記帳工具能耗管理工具智能的能耗管理工具,靈活的綠色節(jié)能算法無(wú)能耗管理工具網(wǎng)絡(luò)并行文件系統(tǒng)提供功能強(qiáng)大的Lustre并行文件系統(tǒng)自行集成和配置第三方網(wǎng)絡(luò)并行文件系統(tǒng)工作流管理工具圖形化的流程設(shè)計(jì)工具直觀的流程管理界面無(wú)工作流管理工具14目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點(diǎn)4.華為HPC軟件應(yīng)用案例15靈活的作業(yè)提交方式模板提交方式預(yù)集成典型應(yīng)用通用任務(wù)提交方式命令
12、行提交方式16完備的作業(yè)管理 。 郵件通知 數(shù)據(jù)轉(zhuǎn)移 后處理 調(diào)度執(zhí)行 預(yù)處理作業(yè)提交工作流引擎以工作流引擎為基礎(chǔ)的作業(yè)生命周期管理17高效的作業(yè)調(diào)度豐富的策略管理功能先來(lái)先服務(wù)MINRESOURCEMAXBALANCE任務(wù)調(diào)度策略資源分配策略資源限制策略搶占策略回填策略預(yù)留策略基于優(yōu)先級(jí)策略限制活動(dòng)作業(yè)限制系統(tǒng)作業(yè)限制空閑作業(yè)ReQueueSuspendFirstFitBestFitGreedy資源預(yù)留18用戶目錄1用戶目錄2用戶目錄3用戶目錄4外部存儲(chǔ)運(yùn)算結(jié)果自動(dòng)傳輸完整的業(yè)務(wù)數(shù)據(jù)管理功能強(qiáng)大的web數(shù)據(jù)管理功能安全隔離的用戶數(shù)據(jù)19集群節(jié)點(diǎn)管理:注重整個(gè)集群中節(jié)點(diǎn)操作,如上下電;調(diào)度系統(tǒng)
13、節(jié)點(diǎn)管理:關(guān)注調(diào)度信息,如是否接收作業(yè)操作。分角色的集群節(jié)點(diǎn)管理調(diào)度相關(guān)計(jì)算節(jié)點(diǎn)管理帶外節(jié)點(diǎn)管理帶內(nèi)節(jié)點(diǎn)管理 通過(guò)并行命令可以同時(shí)對(duì)多個(gè)節(jié)點(diǎn)下發(fā)命令統(tǒng)一的集群管理多維度的集群節(jié)點(diǎn)管理多節(jié)點(diǎn)并發(fā)管理20直觀的集群監(jiān)控集群整體性能狀態(tài)監(jiān)控單個(gè)節(jié)點(diǎn)性能狀態(tài)所見(jiàn)即所得的設(shè)備管理21豐富的告警管理豐富的告警類(lèi)型靈活的告警查詢可配置的告警閾值l提供CPU負(fù)載、CPU溫度、磁盤(pán)容量、內(nèi)存容量、主機(jī)連接狀態(tài)、系統(tǒng)服務(wù)狀態(tài)、自定義服務(wù)等多種告警l可按主機(jī),類(lèi)型,級(jí)別及時(shí)間查詢歷史告警信息l可配置不同告警閾值,以靈活應(yīng)對(duì)變化l郵件發(fā)送通知,以便及時(shí)處理方便的告警通知22智能的能耗管理聚合監(jiān)控系統(tǒng)的資源狀態(tài)和資源需
14、求,為能耗分析提供統(tǒng)一數(shù)據(jù)l計(jì)算集群信息l調(diào)度系統(tǒng)作業(yè)信息根據(jù)能效監(jiān)視數(shù)據(jù)及能耗配置信息,提供節(jié)能建議l豐富的節(jié)能算法l支持自定義算法l可動(dòng)態(tài)配置QoS信息能效監(jiān)視分析診斷自動(dòng)處理根據(jù)分析診斷建議,自動(dòng)或人工確認(rèn)完成系統(tǒng)的處理l節(jié)點(diǎn)下電/降頻l節(jié)點(diǎn)上電23完善的帳號(hào)管理統(tǒng)一的用戶管理功能基于用戶的計(jì)費(fèi)管理功能支持與操作系統(tǒng)統(tǒng)一的用戶以及群組管理,批量導(dǎo)入用戶功能與調(diào)度算法結(jié)合指定優(yōu)先級(jí)及資源限制??蓪?dǎo)出指定時(shí)間段內(nèi),用戶作業(yè)產(chǎn)生的費(fèi)用報(bào)表24部署節(jié)點(diǎn)便捷的集群部署、靈活的規(guī)模伸縮管理節(jié)點(diǎn)業(yè)務(wù)量上升界面添加節(jié)點(diǎn)計(jì)算節(jié)點(diǎn)界面操作,方便快捷的擴(kuò)減容業(yè)務(wù)量增加時(shí)擴(kuò)充集群規(guī)模,應(yīng)對(duì)大量任務(wù);業(yè)務(wù)量減少時(shí)
15、縮小集群規(guī)模,實(shí)行資源共享,提高資源利用率。配置簡(jiǎn)單,一鍵執(zhí)行批量安裝,省時(shí)省力動(dòng)態(tài)伸縮,界面操作批量安裝(OS、軟件等)25實(shí)時(shí)的流程運(yùn)行監(jiān)視圖友好的流程設(shè)計(jì)與直觀的流程管理并行分支條件分支圖形化的元素便捷的設(shè)置拖拽式的流程設(shè)計(jì)完備的流程實(shí)例管理圖形化的設(shè)計(jì)工具,支持多種流程完備的流程實(shí)例管理功能26鏡像備份通過(guò)鏡像批量部署管理節(jié)點(diǎn)熱備,主節(jié)點(diǎn)故障時(shí)快速接管。整個(gè)集群備份,在整個(gè)集群出現(xiàn)故障時(shí),快速恢復(fù)方便的備份與恢復(fù),高可靠系統(tǒng)安裝好的初始節(jié)點(diǎn)支持系統(tǒng)鏡像管理:創(chuàng)建、刪除、瀏覽節(jié)點(diǎn)快照,快速恢復(fù)27目錄1.HPC概述2.華為HPC軟件方案概述3.華為HPC軟件方案特點(diǎn)4.華為HPC軟件應(yīng)用
16、案例28生物超算云服務(wù)平臺(tái) 提供專(zhuān)業(yè)的HPC業(yè)務(wù)流程管理軟件,包括流程設(shè)計(jì)工具、流程執(zhí)行引擎、流程監(jiān)控等組件。 依托云平臺(tái)的海量計(jì)算資源和存儲(chǔ)資源,充分結(jié)合華為云平臺(tái)和HPC的特點(diǎn),提供完善的超算云解決方案。解決方案 基因測(cè)序軟件:BLAST、BOWTIE2、SAMTOOLS 業(yè)務(wù)處理的步驟多,流程復(fù)雜,需要定義流程??蛻粜枨?提供專(zhuān)業(yè)的計(jì)算業(yè)務(wù)流程管理服務(wù),有效支撐基因測(cè)序等行業(yè)應(yīng)用,極大提高客戶業(yè)務(wù)效率。 充分利用華為云平臺(tái)的資源,提供按需使用、資源彈性伸縮、智能管理等特性的HPC服務(wù),滿足了客戶的計(jì)算和存儲(chǔ)需求。 完善的資源管理、作業(yè)調(diào)度、用戶管理,為客戶提供行業(yè)整體解決方案。客戶價(jià)值計(jì)
17、算節(jié)點(diǎn): 采用50臺(tái)高內(nèi)存C型管理節(jié)點(diǎn): 采用2臺(tái)標(biāo)準(zhǔn)均衡C型內(nèi)部存儲(chǔ)節(jié)點(diǎn): 采用4臺(tái)標(biāo)準(zhǔn)均衡E型,采用云存儲(chǔ),提供無(wú)限的對(duì)象存儲(chǔ)能力的服務(wù)軟件系統(tǒng): SUSE 、華為集群管理軟件(包含工作流組件)29華為中央硬件仿真平臺(tái) 提供專(zhuān)業(yè)的HPC集群管理軟件,包含安裝部署、調(diào)度、集群配置、監(jiān)控告警等 提供web界面,方便進(jìn)行作業(yè)操作以及集群管理維護(hù)解決方案 仿真業(yè)務(wù)需要用到HFSS、Hspice、Maxwell和PoweSI應(yīng)用軟件。 自動(dòng)化的安裝部署工具,操作簡(jiǎn)單,維護(hù)管理便利??蛻粜枨?計(jì)算能力由原先200萬(wàn)網(wǎng)格提升到超千萬(wàn),計(jì)算效率提升5倍,長(zhǎng)期綜合成本可節(jié)約XXX萬(wàn)。 用戶通過(guò)web界面進(jìn)行
18、作業(yè)操作,使得用戶不必理解底層調(diào)度系統(tǒng)命令,更加聚焦本職工作,提高工作效率。 完善的資源管理、作業(yè)調(diào)度、賬戶管理等功能,為客戶提供行業(yè)整體解決方案。客戶價(jià)值當(dāng)前解決方案:計(jì)算節(jié)點(diǎn):共60個(gè)節(jié)點(diǎn)(30臺(tái)RH2485 + 30臺(tái)RH2285)管理節(jié)點(diǎn):采用1臺(tái)RH2285刀片服務(wù)器內(nèi)部存儲(chǔ)節(jié)點(diǎn):NFS+華為D5100高速存儲(chǔ)軟件系統(tǒng):RHEL5.8 、華為集群管理軟件Copyright2012 Huawei Technologies Co., Ltd. All Rights Reserved.The information in this document may contain predictive statements including, without limitation, statements regarding the future financial and operating results, future product portfolio, new technology, etc. There are a number of factors that could cause actual results and developments to differ m
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 文化創(chuàng)意產(chǎn)業(yè)服務(wù)補(bǔ)充協(xié)議
- 商超秋冬季新冠疫情防控常態(tài)化措施
- 網(wǎng)紅炸雞品牌品牌授權(quán)期限延長(zhǎng)合同
- IT項(xiàng)目開(kāi)發(fā)進(jìn)度協(xié)調(diào)保證措施
- 2024-2025學(xué)年度小學(xué)三年級(jí)音樂(lè)教學(xué)計(jì)劃
- 2025年石英或云母填充塑料項(xiàng)目申請(qǐng)報(bào)告
- 2025年抗倍特板項(xiàng)目規(guī)劃申請(qǐng)報(bào)告模板
- 2025年電線線纜項(xiàng)目提案報(bào)告
- 專(zhuān)升本語(yǔ)文作文記敘文范文解析
- 電商平臺(tái)客服團(tuán)隊(duì)的關(guān)鍵職責(zé)
- 《高效面試技巧課件版》教案
- 實(shí)驗(yàn)室精密儀器全面維護(hù)保養(yǎng)服務(wù)協(xié)議
- (三模)2025年沈陽(yáng)市高中三年級(jí)教學(xué)質(zhì)量監(jiān)測(cè) (三)生物試卷(含答案)
- 拓?fù)鋬?yōu)化與異形結(jié)構(gòu)打印-洞察闡釋
- 【綏化】2025年黑龍江綏化市“市委書(shū)記進(jìn)校園”事業(yè)單位引進(jìn)人才287人筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 粉筆協(xié)議班電子合同
- 2025+CSCO非小細(xì)胞肺癌診療指南解讀課件
- -小學(xué)英語(yǔ)人稱(chēng)代詞與物主代詞講解課件(共58張課件).課件
- 超市經(jīng)營(yíng)服務(wù)方案投標(biāo)方案(技術(shù)標(biāo))
- 2024年天津高考英語(yǔ)第二次高考真題(原卷版)
- 七年級(jí)英語(yǔ)下冊(cè)閱讀理解專(zhuān)項(xiàng)練習(xí)題100篇含答案
評(píng)論
0/150
提交評(píng)論