高性能計算系統(tǒng)方案建議書_第1頁
高性能計算系統(tǒng)方案建議書_第2頁
高性能計算系統(tǒng)方案建議書_第3頁
高性能計算系統(tǒng)方案建議書_第4頁
高性能計算系統(tǒng)方案建議書_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

./WORD格式整理版高性能計算系統(tǒng)技術(shù)方案建議書目錄第一章概述 31.1高性能計算環(huán)境發(fā)展的趨勢 31.1.1更高、更全面的性能要求 31.1.2向通用化方向發(fā)展 41.1.3更加嚴格的預(yù)算約束 41.1.4使用商品化部件 51.2高性能計算應(yīng)用的特點 51.3高性能計算主機性能評價體系 6第二章設(shè)計方案 92.1系統(tǒng)設(shè)計原則 92.2總體方案結(jié)構(gòu) 102.3SMP計算服務(wù)器方案 122.3.1CPU內(nèi)存配置數(shù)量計算 122.3.2SMP計算服務(wù)器型號及配置 132.3.3基于EPIC的安騰芯片技術(shù) 152.3.4高性能計算環(huán)境HP-UX11iTCOE 182.3.5計算任務(wù)提交及管理 192.3.6HPrx8620計算服務(wù)器的特點和優(yōu)勢 202.4Cluster計算集群方案 212.4.1HPCluster計算集群結(jié)構(gòu) 212.4.2Cluster節(jié)點系統(tǒng)配置 242.4.3節(jié)點互連、管理和用戶網(wǎng)絡(luò) 262.4.4Cluster計算集群節(jié)點管理 272.4.5Cluster計算集群作業(yè)管理 282.4.6HPCluster計算集群的特點和優(yōu)勢 292.5高性能計算外接存儲需求分析 302.6HP方案的優(yōu)勢 31附件HP的HPC應(yīng)用及成功案例 331HP的基礎(chǔ)研究和國防研究HPC解決方案 352HP面向計算機輔助工程<CAE>的HPC解決方案 382.1HP基于網(wǎng)絡(luò)的一體化和虛擬化CAE解決方案 382.2HP全面和豐富的CAE應(yīng)用軟件 402.3HP面向CAE的HPC解決方案在中國國內(nèi)的應(yīng)用 422.4HP面向CAE的HPC解決方案的成功應(yīng)用實例 43第一章概述HP公司非常榮幸能為×××高性能計算中心系統(tǒng)建設(shè)提出建議。作為全球最大的計算機廠商之一,HP公司具有一流的產(chǎn)品、技術(shù)和服務(wù)。在本方案建議書中,HP公司推薦了先進的系統(tǒng)建設(shè)方案,考慮了系統(tǒng)的實用性、高可用性、安全性、可管理性以及靈活擴展能力。HP公司憑借先進的技術(shù)和出色的支持服務(wù),相信通過雙方的合作,可使×××高性能計算中心系統(tǒng)項目順利實施,從而為用戶提供一個健壯、安全、高可用的運行環(huán)境,并進一步建立長期的友好合作關(guān)系。高性能計算系統(tǒng)是提高一個科研機構(gòu)研究水平的重要基礎(chǔ)設(shè)施,也是一個國家科技與經(jīng)濟實力的標(biāo)志。它不僅是一個高速處理的計算機系統(tǒng)、更重要的是在其之上運行的各種應(yīng)用對科學(xué)領(lǐng)域產(chǎn)生非常深遠的影響。20世紀90年代中后期以來,許多高性能計算應(yīng)用領(lǐng)域越來越多地希望利用半導(dǎo)體和計算機技術(shù)發(fā)展的新成果通過更大規(guī)模、更精確的數(shù)值模擬和數(shù)字計算來進行新產(chǎn)品設(shè)計和科學(xué)研究,提高科學(xué)研究水平、廠商市場競爭力以至國家的綜合國力。另一方面,人們也要求利用工業(yè)標(biāo)準芯片等開放性的技術(shù)降低投資、加速開發(fā),在規(guī)定經(jīng)費預(yù)算和時間框架內(nèi)完成規(guī)模越來越大的計算任務(wù)。高性能和高經(jīng)濟效益相結(jié)合已經(jīng)成為高性能計算領(lǐng)域最引人注目的發(fā)展趨勢。1.1高性能計算環(huán)境發(fā)展的趨勢1.1.1更高、更全面的性能要求高性能技術(shù)計算是利用數(shù)值模擬和數(shù)字技術(shù)方法探索和預(yù)測未知世界的技術(shù)。這一技術(shù)廣泛應(yīng)用于核武器研究和核材料儲存仿真、生物信息技術(shù)、醫(yī)療和新藥研究、計算化學(xué)、GIS、CAE、全球性長期氣象、天氣和災(zāi)害預(yù)報、工藝過程改進和環(huán)境保護等許多領(lǐng)域。近年來,隨著研究的深入和競爭的加劇,各個領(lǐng)域越來越多地使用模擬的方法來解決科研和生產(chǎn)中的實際問題。模擬的模型越來越大、計算的精度越來越高、對超級計算機性能要求也越來越高。例如,在一個3維模型中,如果把從每個方向取100個分點增加取到1000個分點,對計算機資源的需求將增加1000倍以上。高性能計算應(yīng)用不僅規(guī)模越來越大,而且往往必須在規(guī)定的時間內(nèi)完成任務(wù)否則就失去了計算的價值〔如天氣預(yù)報、傳染病防治。這就對計算機系統(tǒng)的計算能力、系統(tǒng)帶寬、內(nèi)存容量、存儲設(shè)備和I/O吞吐能力以及應(yīng)用軟件的開發(fā)技術(shù)都提出了更高、更全面的要求。1.1.2向通用化方向發(fā)展過去人們一般把計算機應(yīng)用分為科學(xué)計算、信息處理和自動控制等類型。其中,以信息處理為主的應(yīng)用統(tǒng)稱企業(yè)應(yīng)用,是市場容量最大的應(yīng)用領(lǐng)域。早期的企業(yè)應(yīng)用與高性能計算應(yīng)用有很大的差別,涉及的計算比較簡單、使用的數(shù)據(jù)量也不大,對計算機系統(tǒng)的主要要求是能夠支持大量用戶〔包括網(wǎng)上用戶進行事務(wù)處理如信息輸入、查詢和統(tǒng)計等,而對于計算能力、存儲容量要求也不高。因此,高性能計算應(yīng)用往往使用與企業(yè)應(yīng)用不同的系統(tǒng),影響了產(chǎn)品批量的擴大。當(dāng)前,人類正在從工業(yè)化社會進入信息社會,技術(shù)的持續(xù)創(chuàng)新、市場需求的瞬息萬變、競爭空間的迅速擴大,要求企業(yè)采用Internet、電子商務(wù)、電子商務(wù)企業(yè)等現(xiàn)代化手段,來適應(yīng)時代的發(fā)展。許多新型的企業(yè)應(yīng)用對計算能力、存儲容量和系統(tǒng)帶寬的要求都越來越高、越來越迫切,高性能計算應(yīng)用和其他類型應(yīng)用的界限也日益淡化。當(dāng)前,幾乎所有應(yīng)用領(lǐng)域都需要使用能夠提供高計算能力、系統(tǒng)帶寬和存儲容量的計算機系統(tǒng),促使用戶選擇相同的系統(tǒng)滿足各種類型的需求,為利用大批量、低成本的通用產(chǎn)品滿足高性能計算應(yīng)用需求創(chuàng)造了有利的條件。1.1.3更加嚴格的預(yù)算約束隨著競爭的加劇和應(yīng)用的普及,高性能計算不再是一個不惜工本的應(yīng)用領(lǐng)域,許多項目的預(yù)算約束越來越嚴格。這就要求廠商生產(chǎn)全系列的產(chǎn)品滿足不同規(guī)模應(yīng)用的需求、更加可靠地保護用戶原有投資、加速IT投資回報,而且也要求實現(xiàn)資源按需供應(yīng)和更大范圍的資源共享,推動了網(wǎng)格和公用服務(wù)等新的計算模式的發(fā)展。1.1.4使用商品化部件為了促進高性能計算廣泛應(yīng)用必須降低成本,否則很難為更多的用戶所接受。由于高端的高性能計算系統(tǒng)〔特別是超級計算機需要使用許多計算節(jié)點和互聯(lián)設(shè)備等部件,因此必須保持每個部件的低成本。早期的超級計算機系統(tǒng)使用專門定制的處理器和互聯(lián)設(shè)備等部件價格非常昂貴。以后,CrayResearch公司的T3D和CRAYT3E開始使用商品化的Alpha處理器。當(dāng)前商品化處理器和服務(wù)器性能日益提高、價格也日趨下降,為利用它們建立高端和超級計算機系統(tǒng)提供了良好的基礎(chǔ)。為此,美國政府還推出了ASCI計劃,力圖降低超級計算機系統(tǒng)的成本,其主要途徑是盡可能采用商品化市售<COTS>硬件和軟件部件,把力量集中在發(fā)展主流計算機工業(yè)不能有效地提供的專門技術(shù)。目前已經(jīng)很少再有廠商使用專門的部件如向量處理器來建立超級計算機系統(tǒng)。今后的發(fā)展趨勢是在高端和超級計算機系統(tǒng)中盡可能普遍地采用商品化和大批量的工業(yè)標(biāo)準部件,包括處理器、互聯(lián)設(shè)備、I/O、存儲、操作系統(tǒng)、語言、編譯程序、編程工具和應(yīng)用軟件。人們注意到,基于開放性IA-32體系結(jié)構(gòu)的Xeon和Pentium4處理器的超級計算機已經(jīng)在TOP500占有重要地位。新興的Itanium處理器系列〔IPF必將以其開放性、大批量和64位尋址和處理能力,對超級計算機水平的提高產(chǎn)生劃時代的影響,以遠比32位體系結(jié)構(gòu)時代高的性能和性價比來滿足日益增長的需求。我們深信,通過采用HP的高性能計算系統(tǒng),必將加速×××在高性能計算領(lǐng)域取得更加豐碩的科研成果。1.2高性能計算應(yīng)用的特點在傳統(tǒng)意義上高性能計算應(yīng)用是屬于CPU和內(nèi)存密集型的應(yīng)用,它對所運行的計算機體系結(jié)構(gòu)<超級計算機體系結(jié)構(gòu)>提出了幾個主要的要求:浮點計算能力<尤其是64位雙精度浮點運算>,內(nèi)存帶寬和內(nèi)存容量及體系框架。所有這些因素都是相互關(guān)聯(lián)的。高性能計算通常利用各種數(shù)學(xué)方程式來建立模型和模擬物理現(xiàn)象。隨著各種模型越來越大,越來越復(fù)雜,數(shù)據(jù)集的規(guī)模也急劇增長。例如,一個100*100*100的柵格包含100萬個元素,該模型僅占用32MB內(nèi)存,如果此柵格的分辨率提高10倍,這一模型就變?yōu)?000*1000*1000,包含10億個元素,此模型的原始數(shù)據(jù)將占用32GB的內(nèi)存!因此不論是分布式內(nèi)存還是共享式內(nèi)存,要將此數(shù)據(jù)傳輸至內(nèi)存中,由CPU處理,就需要高帶寬,高容量,低延遲的體系結(jié)構(gòu),當(dāng)然還需要強大的CPU進行計算。而超級計算機主要用來處理這樣龐大的工作負載。這樣的負載所要求的超級計算機一定是采用快速的CPU,高性能的內(nèi)存和I/O子系統(tǒng),旨在實現(xiàn)最高的運算速度。同樣這樣的負載所要求的超級計算機還必須采用多級別并行處理技術(shù),能夠利用幾十個甚至幾千個處理器來處理一項任務(wù);這樣的并行處理技術(shù)也需要超級計算機要采用高性能的互連設(shè)備和系統(tǒng)設(shè)計,以較高的成本去換取最高的性能。1.3高性能計算主機性能評價體系衡量主機系統(tǒng)或處理器計算處理能力的測試體系<BenchMark>也有多種,如SPEC、Linpack等,尤其是通過Linpack值更可以衡量一個主機系統(tǒng)或一個處理器芯片的實際運算能力,而不僅僅是虛的理論峰值能力。過去,人們使用系統(tǒng)能夠達到的執(zhí)行指令最大速率如每秒執(zhí)行百萬指令數(shù)/浮點操作數(shù)<MIPS/MFLOPS>來量度計算機硬件性能。但是,這些量度指標(biāo)的實用價值十分有限,它們只能給出理論上最大的性能,并沒有全面反映計算機系統(tǒng)的實際性能如內(nèi)存帶寬、內(nèi)存延遲和I/O性能等。此外,硬件性能量度和系統(tǒng)體系結(jié)構(gòu)都是非標(biāo)準的,使得人們很難使用它們作為服務(wù)器選型的性能指標(biāo)。因此,出現(xiàn)了計算機系統(tǒng)性能基準測試的概念,即由某些中立的非盈利機構(gòu)開發(fā)出一組經(jīng)過精心統(tǒng)籌設(shè)計和組合的程序,來量度計算機系統(tǒng)運行這組程序的性能指標(biāo)。此類程序一般稱為基準測試程序。不同的計算機系統(tǒng)都運行同一組基準測試程序,就可以相對客觀地比較計算機系統(tǒng)的性能。目前有許多專門設(shè)計基準測試程序和管理各種計算機系統(tǒng)基準測試指標(biāo)的機構(gòu),其中最著名的是SPEC和TPC?;鶞蕼y試可以分為三類:系統(tǒng)基準測試指標(biāo):用于測試計算機各子系統(tǒng)的性能,其中主要有:SPECCPU2000用于處理器子系統(tǒng)的指標(biāo);McCaplinStream用于測試內(nèi)存帶寬指標(biāo);TPC-C用于測試在線事務(wù)處理指標(biāo)性能指標(biāo);標(biāo)準應(yīng)用基準測試指標(biāo):用于測試計算機系統(tǒng)執(zhí)行某種標(biāo)準的應(yīng)用的性能指標(biāo),其中主要有:SPECWEB99用于測量計算機執(zhí)行Web應(yīng)用的性能指標(biāo);SPECMAIL2000用于測量計算機執(zhí)行電子郵件應(yīng)用的性能指標(biāo);SPECJBB2000,SPECJVM98用于測量計算機執(zhí)行JAVA應(yīng)用性能指標(biāo);Linpack用于測量計算機進行線性代數(shù)計算的性能指標(biāo)〔也常作為測量計算機浮點計算速度的基準測試指標(biāo);SPECHPC96用于測量計算機執(zhí)行高性能計算應(yīng)用的性能指標(biāo);SPECSFS97用于測量計算機執(zhí)行網(wǎng)絡(luò)文件系統(tǒng)應(yīng)用的性能指標(biāo);TPC-D專門用于測量計算機執(zhí)行數(shù)據(jù)倉庫應(yīng)用的性能指標(biāo);SPECglperf和SPECviewperf專門用于測量計算機執(zhí)行圖形和圖象顯示方面應(yīng)用的性能指標(biāo);實際應(yīng)用基準測試指標(biāo):許多重要的獨立軟件開發(fā)商<ISV>都制訂了計算機系統(tǒng)運行本公司開發(fā)的軟件產(chǎn)品的基準測試指標(biāo)。例如,在數(shù)據(jù)庫應(yīng)用方面Oracle、Informix、Sybase公司的基準測試指標(biāo);在企業(yè)應(yīng)用方面SAP、SAS、PeopleSoft、Baan等公司的基準測試指標(biāo);在高性能計算方面運行Amber、CHARMm、Fluent、LS-DYNA、MARC、ANSYS等著名應(yīng)用軟件的指標(biāo)等;一般地說,系統(tǒng)基準測試指標(biāo)測試的計算機子系統(tǒng)的性能,而其他兩類基準測試指標(biāo)則主要測試計算機執(zhí)行某種或某個特殊應(yīng)用的性能。基準測試指標(biāo)在用戶服務(wù)器選型工作中具有重要的作用,許多用戶都根據(jù)它們來決定設(shè)備選型。但是"全信書不如無書"。對基準測試必須持一分為二的觀點。一方面,雖然基準測試的環(huán)境和用戶的實際應(yīng)用環(huán)境不完全相同,但是它們畢竟比較客觀地反映了計算機系統(tǒng)某一方面的性能,對性能評估和搞好服務(wù)器選型工作都有相當(dāng)大的參考價值;另一方面,任何基準測試指標(biāo)都是在人為設(shè)定的特殊條件下得到的。雖然,設(shè)計基準測試的機構(gòu)盡了很大的努力使得基準測試條件盡可能符合實際、具有代表性,但真實的應(yīng)用環(huán)境規(guī)模大、軟件類型多其組合更是千變?nèi)f化?;鶞蕼y試的條件不可能完全反映實際應(yīng)用的復(fù)雜性,基準測試指標(biāo)不可避免地具有某種片面性。因此,在進行設(shè)備選型時必須盡可能了解所使用的各項基準測試指標(biāo)的實際含義,包含產(chǎn)生它們的環(huán)境和測試方法等。為了避免片面性,對服務(wù)器系統(tǒng)的性能指標(biāo)、特性和廠商進行全面考察,將是搞好服務(wù)器選型工作比較科學(xué)和可靠的方法。第二章設(shè)計方案2.1系統(tǒng)設(shè)計原則幫助用戶建立一套既能最大限度地滿足用戶實際需要且技術(shù)又處于領(lǐng)先地位的高性能計算環(huán)境是HP公司為高性能計算用戶設(shè)計方案的基本出發(fā)點。HP認為,×××高性能計算系統(tǒng)應(yīng)具有處理大規(guī)模的復(fù)雜運算,尤其是浮點運算的能力。它將為×××提供優(yōu)化工程設(shè)計、分析、驗證的手段,最終實現(xiàn)提高設(shè)計質(zhì)量、縮短開發(fā)周期、降低開發(fā)成本。方案設(shè)計以用戶現(xiàn)場測試結(jié)果為基礎(chǔ),根據(jù)用戶對未來應(yīng)用模式及業(yè)務(wù)量需求預(yù)測為前提,強調(diào)高性能以及可行、合理和低風(fēng)險。架構(gòu)設(shè)計和系統(tǒng)選型遵循以下原則:1.先進性本系統(tǒng)方案所采用的技術(shù)既要符合業(yè)界的發(fā)展方向,又要在未來幾年內(nèi)仍具有很高的技術(shù)先進性,保持在同類系統(tǒng)中的領(lǐng)先地位。這樣有利于提高整個系統(tǒng)的計算與處理能力。2.有限投資獲取最大計算性能在有限的投資前提下,高性能計算系統(tǒng)應(yīng)具有優(yōu)秀的處理能力,它不僅具有符合要求的峰值性能<PeakPerformance>,更重要的是應(yīng)具有穩(wěn)定的應(yīng)用性能〔sustainedperformance。各種復(fù)雜的研究課題在本系統(tǒng)中能夠得到準確,快速的計算結(jié)果。3.可擴展性系統(tǒng)應(yīng)具有很強的擴展能力。隨著對計算機系統(tǒng)性能的要求不斷提高,該計算機系統(tǒng)應(yīng)具有擴展能力,并且容易實現(xiàn)。4.開放性和兼容性本計算機系統(tǒng)應(yīng)符合公認的工業(yè)標(biāo)準,包括體系結(jié)構(gòu),硬件,I/O,網(wǎng)絡(luò),操作系統(tǒng),開發(fā)環(huán)境和開發(fā)工具等。這樣,便于和其他平臺上的系統(tǒng)互操作。5.應(yīng)用軟件豐富本系統(tǒng)的平臺上應(yīng)具有豐富的軟件資源,能夠提供研究課題的解決方案和相應(yīng)的軟件系統(tǒng)。HP公司與高性能計算方面的獨立軟件開發(fā)商緊密合作,例如:Fluent,ANSYS等專業(yè)工程軟件商,RedHat,Etnus,Pallas,Platform等專業(yè)平臺軟件商,不僅提供處理節(jié)點間的協(xié)調(diào)和通信的中間件,使整個系統(tǒng)節(jié)點能夠真正實現(xiàn)合作,負載均衡,還能針對不同應(yīng)用需求,提供一系列并行計算應(yīng)用。6.良好的技術(shù)支持由于本系統(tǒng)是比較復(fù)雜的計算機環(huán)境,在使用過程中不可避免的會遇到一些技術(shù)問題。當(dāng)遇到這些問題時能夠得到有效的支持,使問題得以圓滿的解決。7.性能價格比優(yōu)越由于本系統(tǒng)比較龐大,價格因素也比較重要。本系統(tǒng)在性能價格比方面在同類系統(tǒng)中應(yīng)具有明顯的優(yōu)勢,對于三院三部來說在采購大型系統(tǒng)中應(yīng)該考慮的重要因素。8.管理簡單盡量減少數(shù)據(jù)中心的設(shè)備管理難度。2.2總體方案結(jié)構(gòu)針對×××系統(tǒng)高性能計算應(yīng)用的特點,結(jié)合與相關(guān)業(yè)務(wù)處室的溝通。從滿足應(yīng)用需求的角度出發(fā),我們建議建立一個高可擴展、易管理的混合SMP與Cluster結(jié)構(gòu)的高性能計算環(huán)境,整體方案架構(gòu)如下:我們推薦采用1臺HP高檔UNIX服務(wù)器HPIntegrityrx8620作為SMP計算服務(wù)器,主要運行Ansys、Nastran、Marc計算應(yīng)用。SMP計算服務(wù)器采用高性能HP-UX11iTCOE高性能計算操作系統(tǒng)環(huán)境,并運行HPWorkLoadManager<WLM>動態(tài)資源管理工具對任務(wù)的資源分配進行管理和調(diào)度。另外,采用64節(jié)點、通過Infiniband高速互連的Linux高性能計算集群〔128顆CPU,512G內(nèi)存,主要運行Fluent、Fastran或LS-Dyna計算應(yīng)用。高性能計算集群配置1個管理節(jié)點及2個I/O節(jié)點,并通過用戶網(wǎng)絡(luò)和管理網(wǎng)絡(luò)進行互聯(lián)。Cluster管理節(jié)點運行ClusterManagementUtility<CMU>管理軟件實現(xiàn)Cluster中所有節(jié)點的集中管理、配置、激活/關(guān)閉等,并通過OpenPBS軟件對用戶提交的任務(wù)進行作業(yè)管理。SMP計算服務(wù)器和Cluster管理節(jié)點通過1000Base-T千兆以太網(wǎng)連接到三部的骨干網(wǎng)中,各室工作組通過該網(wǎng)絡(luò)申請計算資源和提交任務(wù)。待三院三部存儲區(qū)域網(wǎng)絡(luò)〔SAN建成后,SMP計算服務(wù)器和ClusterI/O節(jié)點可通過擴展的光纖通道卡連接到SAN中,滿足高性能計算環(huán)境對存儲性能和空間的巨大需求。2.3SMP計算服務(wù)器方案2.3.1CPU內(nèi)存配置數(shù)量計算根據(jù)以上分析,SMP計算服務(wù)器主要用于結(jié)構(gòu)類計算任務(wù),包括結(jié)構(gòu)的設(shè)計、分析和仿真等。SMP服務(wù)器的選型應(yīng)與用戶現(xiàn)場測試服務(wù)器具有相同的結(jié)構(gòu)和相同的產(chǎn)品系列機型,即采用基于Itanium2芯片的HPIntegrity〔安騰服務(wù)器系列產(chǎn)品,并根據(jù)未來幾年內(nèi)三院三部的計算需求配置適當(dāng)?shù)男吞柡虲PU內(nèi)存數(shù)量。從測試結(jié)果上看,ANSYS類應(yīng)用對系統(tǒng)資源和開銷是最大的,而用戶使用ANSYS來進行部件和系統(tǒng)設(shè)計也是最多的,因此按此類應(yīng)用的峰值性能需求來計算出系統(tǒng)的配置,當(dāng)然還應(yīng)根據(jù)任務(wù)的并發(fā)情況來適當(dāng)調(diào)整。根據(jù)用戶計算需求的預(yù)測,該SMP計算服務(wù)器應(yīng)至少達到以下性能:同時運行5-6個ANSYS系統(tǒng)級任務(wù)〔每個600萬單元,計算時間不超過12小時〔夜間運行;部件級ANSYS任務(wù)〔每個200萬單元的計算時間在1-2小時內(nèi)〔白天運行;用戶目前此類應(yīng)用用戶有5人,按未來10人來規(guī)劃。白天考慮4-5個部件級的并發(fā)。計算依據(jù)上述要求和實測數(shù)據(jù):ANSYS實際測試結(jié)果:1個7萬單元任務(wù),4個1.3GHzCPU,8GBRAM,運行時間:2分15秒;本次選擇1.5GHz的芯片,性能比測試機配置芯片性能高;ANSYS提供標(biāo)準題的計算要求:600萬單元的任務(wù),要求20GB內(nèi)存;系統(tǒng)級并發(fā)任務(wù)對CPU數(shù)目要求如下:6任務(wù)*<600萬/7萬>*<1.3GHz/1.5GHz>*<2分鐘/720分鐘>*4CPU=4.95CPU結(jié)論:對于在12小時內(nèi)完成6個系統(tǒng)級任務(wù),按每個任務(wù)分配1個CPU,共需6個1.5GHzCPU即可實現(xiàn)。如果每個系統(tǒng)級任務(wù)分配2個CPU,共占用12顆CPU,只需不到6個小時即可完成計算。部件級并發(fā)任務(wù)對CPU數(shù)目要求如下:5任務(wù)*<200萬/7萬>*<1.3GHz/1.5GHz>*<2分鐘/90分鐘>*4CPU=11CPU按每個任務(wù)分配2-3個CPU,共需11個1.5GHzCPU。結(jié)論:對于在1.5小時內(nèi)完成5個系統(tǒng)級任務(wù),共需11個1.5GHzCPU即可實現(xiàn)。整個系統(tǒng)配置CPU數(shù)目如下:按照白天在1.5個小時內(nèi)完成5個并發(fā)部件級任務(wù)和晚上并發(fā)6個系統(tǒng)級人物的最大要求,考慮其他應(yīng)用如Nastran、Marc、LS-Dyna任務(wù)的并發(fā)計算要求,建議本次SMP系統(tǒng)的CPU配置總數(shù)為12個。系統(tǒng)對內(nèi)存的要求如下:我們以ANSYS應(yīng)用對內(nèi)存的要求作為估算標(biāo)準。1700萬單元ANSYS標(biāo)準題的內(nèi)存要求約為60GB。對于本系統(tǒng)來說,系統(tǒng)最大負荷時的并發(fā)任務(wù)量總計最大為6x600萬單元,因此,我們建議本次SMP系統(tǒng)內(nèi)存配置為128GB。2.3.2SMP計算服務(wù)器型號及配置根據(jù)以上分析,我們配置16CPU和128GB內(nèi)存的HPIntegrityrx8620安騰服務(wù)器作為SMP計算服務(wù)器,并安裝在2米高機柜內(nèi)。HPIntegrityrx8620具有51.2GB/s系統(tǒng)帶寬、64GB/s內(nèi)存帶寬和8.5GB/s的I/O總線帶寬,非常適合做高性能計算服務(wù)器,并最多可支持32個CPU及擴展至256GB內(nèi)存。HPIntegrityrx8620如下圖所示:除了滿足上述用戶的計算要求外,配置16CPU和128GB內(nèi)存的rx8620計算服務(wù)器還可勝任超過單任務(wù)3000萬以上單元的系統(tǒng)部件的計算,并在4-12小時內(nèi)得到計算結(jié)果。HPIntegrityrx8620計算服務(wù)器的配置如下:服務(wù)器型號HPIntegrityrx8620-32處理器12*Itanium21.5GHz/4MB內(nèi)存128GBHDSyncDRAM內(nèi)存硬盤4*146GB硬盤網(wǎng)絡(luò)接口〔內(nèi)置1*10/100/1000Base-T,接用戶網(wǎng)絡(luò)1*10/100/1000Base-T,接管理網(wǎng)絡(luò)擴展網(wǎng)卡1*10/100/1000Base-T,接所骨干網(wǎng)DVD-ROM1*DVD+RW機柜1*RackSystem/E41U,PDU電源風(fēng)扇N+1熱拔插電源風(fēng)扇軟件配置-HP-UX11iv2TCOE操作系統(tǒng)〔無限用戶許可-HPWorkLoadManager<WLM>動態(tài)資源管理器-HPMirrorDisk/UX磁盤鏡像軟件-C/C++/Fortran編譯器配置的HPIntegrityrx8620還有13個可擴展的PCI-X插槽,未來可配置2塊FiberChannel2Gb適配器分別連接至SAN<存儲區(qū)域網(wǎng)絡(luò)>上,以獲得高性能的數(shù)據(jù)訪問及所需的及可擴展的存儲空間。HPIntegrityrx8620最多可擴展32個PCI-X插槽,滿足I/O擴展的需要。2.3.3基于EPIC的安騰芯片技術(shù)針對高性能計算應(yīng)用對高性能的需求,HP在系統(tǒng)設(shè)計上允許通過使用不斷更新的IPF系列產(chǎn)品、采用先進的芯片組、使用更高性能的基礎(chǔ)節(jié)點、支持更多的節(jié)點和提供更高的帶寬等多種途徑擴展系統(tǒng)的規(guī)模,提供高性能和最大的性能擴展空間,滿足當(dāng)前和為適應(yīng)當(dāng)前飛速發(fā)展的計算需要,一個高性能計算的全新時代應(yīng)運而生,而HP正是以其基于第二代Itanium2處理器的安騰服務(wù)器執(zhí)業(yè)界之牛耳。未來各種高端應(yīng)用的需要。具有革命意義的安騰處理器家族架構(gòu)由HP與Intel共同研制開發(fā),它基于全新的EPIC體系結(jié)構(gòu),降低了平臺的成本,提高了其性能和可擴展性.基于Itanium2的HP系統(tǒng)的速度比上一代產(chǎn)品快兩倍,輕松超越IA-32和基于標(biāo)準RSIC的系統(tǒng)的性能.基于Itanium2的惠普服務(wù)器能夠提供更強大的功能,更多的應(yīng)用,附加的特性,以及更廣泛的解決方案。IA-64體系結(jié)構(gòu)在吸收RISC體系結(jié)構(gòu)經(jīng)驗教訓(xùn)基礎(chǔ)上另辟蹊徑,一開始就走開放性的道路,充分利用現(xiàn)代芯片制造工藝發(fā)展成果、提供足夠的資源;同時,通過力爭成為新的高端工業(yè)標(biāo)準、擴大批量來降低成本。它的基本設(shè)計思想是:提供一種新的機制、充分利用硬軟件協(xié)同能力來提高指令并行度:一方面大力開發(fā)先進的編譯程序,消除程序中的條件轉(zhuǎn)移指令、并基于猜測機制越過轉(zhuǎn)移和存儲指令界限調(diào)度指令的執(zhí)行次序,把程序員利用串行語義編寫的源程序轉(zhuǎn)換成由可并行執(zhí)行指令段序列組成的目標(biāo)程序;另一方面使得處理器具有足夠資源和智能,來紀錄編譯程序所發(fā)現(xiàn)的程序中可并行執(zhí)行指令段之間的劃分信息,并保證在程序運行過程中發(fā)現(xiàn)猜測和調(diào)度有錯時仍然給出正確結(jié)果。對IA-64體系結(jié)構(gòu)處理器來說,所執(zhí)行的目標(biāo)程序中可并行執(zhí)行的指令段已經(jīng)由編譯程序顯性地標(biāo)識出來了、指令間的數(shù)據(jù)相關(guān)性和過程相關(guān)性也已經(jīng)由編譯程序消除了,使得處理器只需使用相對簡單的邏輯來實現(xiàn)很高的指令級并行度〔ILP。相反,傳統(tǒng)的RISC處理器沒有足夠的資源來紀錄編譯程序所產(chǎn)生許多有用的信息,也沒有充分利用現(xiàn)代編譯程序強大的對程序執(zhí)行過程的調(diào)度能力。雖然在RISC體系結(jié)構(gòu)下,設(shè)計師們也使用編譯程序來優(yōu)化目標(biāo)程序、為處理器提高ILP創(chuàng)造條件。但是,處理器所執(zhí)行的基本上是隱性并行和包含大量相關(guān)性的目標(biāo)程序,發(fā)現(xiàn)并行、線路預(yù)測、動態(tài)調(diào)度等提高ILP的無序執(zhí)行技術(shù)、完全是由處理器硬件利用復(fù)雜的芯片邏輯來實現(xiàn)的。盡管兩種體系結(jié)構(gòu)之間存在著許多差別,但是執(zhí)行顯性并行或者隱性并行目標(biāo)程序是其中最主要的本質(zhì)差別。所以最初發(fā)明這種新體系結(jié)構(gòu)的惠普公司把它稱為顯性并行指令計算〔EPIC體系結(jié)構(gòu)。除了強有力的編譯程序外,IA-64體系結(jié)構(gòu)微處理器必須提供足夠的資源來實現(xiàn)EPIC設(shè)計思想、提高并行度和實現(xiàn)高性能,包括:新穎的指令集:允許編譯程序產(chǎn)生由并行指令段組成的目標(biāo)程序,并紀錄指令段間的劃分;大寄存器空間:為編譯程序通過寄存器換名等技術(shù)消除相關(guān)性、產(chǎn)生盡可能在寄存器中進行運算的優(yōu)質(zhì)目標(biāo)程序提供充分的余地;具有足夠長度的指令:便于在指令中訪問大寄存器空間中多個寄存器和消除程序中轉(zhuǎn)移指令;足夠的指令發(fā)送端口和派送網(wǎng)絡(luò):用于提高每個時鐘周期發(fā)送到指令數(shù)和提高發(fā)送到速度和效率;多種類型的新型寄存器:允許編譯程序越過條件轉(zhuǎn)移和存儲指令的界限調(diào)度目標(biāo)程序中訪問內(nèi)存指令的位置、消除相關(guān)性,并彌補調(diào)整位置所產(chǎn)生的錯誤;更多的浮點執(zhí)行部件:有利于處理器實現(xiàn)高并行度的浮點計算;更多的整數(shù)和多媒體運算執(zhí)行部件:有利于處理器實現(xiàn)高并行度的整數(shù)和多媒體信息處理;更多的芯片上高速緩存:有利于提高緩存命中率、降低內(nèi)存延遲;EPIC體系結(jié)構(gòu)處理器提供的寄存器資源IA-64的EPIC體系結(jié)構(gòu)是對傳統(tǒng)RISC體系結(jié)構(gòu)的重大革新,許多方面突破了RISC體系結(jié)構(gòu)的局限、發(fā)展了RISC體系結(jié)構(gòu),為利用新制造工藝和技術(shù)、按照摩爾定律預(yù)示的速度提高處理器性能提供了可靠的保證。2.3.4高性能計算環(huán)境HP-UX11iTCOEHPIntegrityrx8620采用HP_UX11iV2<現(xiàn)在成為唯一可支持安騰芯片的64位UNIX操作系統(tǒng)>操作系統(tǒng)<TCOE>提供高性能計算環(huán)境的基礎(chǔ),并配合相應(yīng)的系統(tǒng)管理軟件、語言編譯器、并行模式、相關(guān)數(shù)學(xué)庫,還可支持目前流行的各種第三方高性能計算商業(yè)軟件包和應(yīng)用軟件包,例如Platform的LSF<負載平衡軟件>和checkpoint,Etnus的TotalView,Pallas的Vampir及Gaussian等等,這些可根據(jù)實際要求靈活配置,以運行高性能計算應(yīng)用程序和商業(yè)軟件<含數(shù)據(jù)庫軟件>。HP_UX11i系統(tǒng)下的C,C++和Fortran編譯器展示出卓越的實際應(yīng)用性能,操作系統(tǒng)庫充分利用了Itanium2架構(gòu)的先進技術(shù),其中包括:MLIB。一系列子程序,為科學(xué)和技術(shù)計算提供了常用數(shù)學(xué)軟件,并針對Itanium2架構(gòu)進行了優(yōu)化;HPMPI。實現(xiàn)對Itanium2架構(gòu)信息傳遞接口的高性能,為開發(fā)人員提供了API和軟件庫來支持下有效,可移植的并行信息傳遞的應(yīng)用,是分布式計算的理想選擇。2.3.5計算任務(wù)提交及管理所有向HPIntegrityrx8620計算服務(wù)器提交的任務(wù)其所需的CPU內(nèi)存等系統(tǒng)資源是通過HPWorkloadManager<WLM>動態(tài)資源管理工具來進行管理的。HPWorkloadManager<WLM>是一個非常簡單、高效、易用的資源分區(qū)和管理工具,通過它,系統(tǒng)管理員可根據(jù)計算服務(wù)器的資源情況及提交任務(wù)的優(yōu)先級給使用用戶靈活分配和調(diào)度CPU、內(nèi)存及I/O等系統(tǒng)資源,當(dāng)更高優(yōu)先級的任務(wù)提交后,HPWLM可動態(tài)調(diào)整系統(tǒng)資源的分配,保證高優(yōu)先級的任務(wù)獲得所需的資源。HPWLM動態(tài)資源管理可通過本地或遠程終端進行管理,其界面如下圖所示。2.3.6HPrx8620計算服務(wù)器的特點和優(yōu)勢HPIntegrityrx8620是具有非常高性能價格比的SMP計算服務(wù)器,非常適合三院三部的結(jié)構(gòu)類計算任務(wù)的運算。其特點和優(yōu)勢如下:業(yè)已經(jīng)測試證明的結(jié)構(gòu)類高性能計算架構(gòu)用戶現(xiàn)場測試結(jié)果表明,HPIntegrity安騰服務(wù)器的架構(gòu)最適合作為Ansys、Nastran、Marc等應(yīng)用的計算平臺。優(yōu)越的系統(tǒng)架構(gòu)和CPU芯片技術(shù)優(yōu)勢與用戶現(xiàn)場測試服務(wù)器的架構(gòu)相同的HPIntegrityrx8620高端SMP服務(wù)器,提供更高的系統(tǒng)帶寬、內(nèi)存總線帶寬和I/O總線帶寬。基于這樣的架構(gòu),HPIntegrityrx8620可為計算應(yīng)用帶來更高的性能和更好的加速比。另外,HPIntegrityrx8620采用基于EPIC〔顯式并行指令計算技術(shù)的Itanium2MP芯片〔注:非Itanium2DP芯片,擁有更大的內(nèi)存帶寬和系統(tǒng)帶寬。與RISC和超標(biāo)量技術(shù)不同,EPIC技術(shù)是在程序編譯階段即實現(xiàn)指令的并行,這為強調(diào)并行的高性能任務(wù)實現(xiàn)更高的計算性能提供了基礎(chǔ)。多操作系統(tǒng)支持以及硬件分區(qū)技術(shù)給用戶更多的靈活性HPIntegrityrx8620可支持HP-UX、Linux和Windows等操作系統(tǒng),并支持在同一機箱內(nèi)劃分成1至4個完全電隔離的硬件分區(qū)〔nPars。這樣,在需要的情況下,用戶可靈活配置不同大小的硬分區(qū)及分別運行相同或不同的操作系統(tǒng),從而給與用戶最大的系統(tǒng)使用靈活性。易管理的高性能計算環(huán)境HP-UX11iTCOEHP-UX11iTCOE提供高性能、高可靠及安全的UNIX操作系統(tǒng)基礎(chǔ)環(huán)境,并提供HP高性能C/C++和Fortran編譯器、數(shù)學(xué)庫MLIB和MPI工具。通過HPWorkloadManager<WLM>動態(tài)資源管理工具,管理員可根據(jù)SMP計算服務(wù)器的資源情況及任務(wù)的優(yōu)先級給不同使用用戶靈活分配和調(diào)度CPU、內(nèi)存及I/O等系統(tǒng)資源,HPWLM動態(tài)資源管理工具簡單、高效、易用。投資保護優(yōu)勢HPIntegrityrx8620基于工業(yè)標(biāo)準架構(gòu),擁有良好的可擴展能力〔其中內(nèi)存可最大擴展到256GB,并支持在機箱內(nèi)升級到下一代Itanium2芯片,最大可容納32顆CPU,可實現(xiàn)最大程度的投資保護。2.4Cluster計算集群方案2.4.1HPCluster計算集群結(jié)構(gòu)HP公司作為高性能科學(xué)計算集群技術(shù)的領(lǐng)導(dǎo)者,可提供最強大的、易于管理的一系列現(xiàn)有的Linux集群解決方案?;萜战Y(jié)合了Linux的優(yōu)勢、最好的軟件、內(nèi)部互連、工業(yè)標(biāo)準的計算機平臺、惠普集群技術(shù)專家、支持和服務(wù)向用戶提供具有增加容量和能力的Linux集群系統(tǒng)。Linux集群系統(tǒng)也叫做BeowulfCluster集群系統(tǒng)。HPBeowulf集群的邏輯架構(gòu)如下:硬件部分應(yīng)包括:計算節(jié)點管理節(jié)點I/O節(jié)點互連系統(tǒng)軟件部分應(yīng)包括:操作系統(tǒng)集群管理軟件開發(fā)環(huán)境數(shù)學(xué)庫、并行庫作業(yè)管理系統(tǒng)文件系統(tǒng)和客戶應(yīng)用軟件標(biāo)準應(yīng)用軟件根據(jù)用戶的需求分析,按HPBeowulf集群的邏輯架構(gòu),我們?yōu)楸卷椖吭O(shè)計的Cluster計算集群方案如下:上述Cluster高性能集群主要為Fluent、Fastran等流體類應(yīng)用提供計算環(huán)境,另外,根據(jù)用戶現(xiàn)場測試的結(jié)果,LS-Dyna應(yīng)用在此SMP和Cluster架構(gòu)上均有非常出色的表現(xiàn),用戶也可選擇在此Cluster計算集群中來運行此類應(yīng)用。2.4.2Cluster節(jié)點系統(tǒng)配置根據(jù)用戶需求,配置高性能計算節(jié)點配置配置64臺計算節(jié)點。每臺配置如下:計算結(jié)點處理器2*Opteron2.6GHz內(nèi)存4GB內(nèi)存硬盤1*60GBSATA硬盤網(wǎng)絡(luò)接口〔內(nèi)置1*10/100/1000Base-T,接用戶網(wǎng)絡(luò)1*10/100/1000Base-T,接管理網(wǎng)絡(luò)網(wǎng)絡(luò)互連接口1*InfinibandAdapter遠程管理Integratedlightsout<iLO>軟件配置RedHatEL3U2X86-64WSI/O節(jié)點配置配置2臺I/O節(jié)點,每臺配置如下:I/O節(jié)點處理器2*Opteron2.6GHz內(nèi)存4GB內(nèi)存硬盤2*146GBSCSIUltra320硬盤網(wǎng)絡(luò)接口〔內(nèi)置1*10/100/1000Base-T,接用戶網(wǎng)絡(luò)1*10/100/1000Base-T,接管理網(wǎng)絡(luò)擴展網(wǎng)卡1*10/100/1000Base-T,接所骨干網(wǎng)遠程管理Integratedlightsout<iLO>軟件配置RedHatEL3U2X86-64ES用戶數(shù)據(jù)中心建立以前,用戶數(shù)據(jù)及應(yīng)用程序臨時存放在4個146GB硬盤中。用戶數(shù)據(jù)中心建立后,可擴展配置2個2GB光纖通道卡接到SAN存儲網(wǎng)絡(luò)中,屆時,所有Cluster計算集群的用戶數(shù)據(jù)、應(yīng)用等均放到SAN里。管理節(jié)點配置采用1臺管理節(jié)點,配置如下:管理節(jié)點處理器2*Opteron2.6GHz內(nèi)存8GB內(nèi)存硬盤2*146GBSCSIUltra320硬盤網(wǎng)絡(luò)接口〔內(nèi)置1*10/100/1000Base-T,接用戶網(wǎng)絡(luò)1*10/100/1000Base-T,接管理網(wǎng)絡(luò)擴展網(wǎng)卡1*10/100/1000Base-T,接所骨干網(wǎng)高速通訊網(wǎng)絡(luò)Infiniband遠程管理Integratedlightsout<iLO>軟件配置-ClusterManagementUtility<CMU>-OpenPBS-MPI,PVM-C/C++/FortranCompilersandMlibforAMD-RedHatEL3U2X86-64ES管理節(jié)點通過CMU管理計算節(jié)點,并通過OpenPBS進行作業(yè)的調(diào)度管理。2.4.3節(jié)點互連、管理和用戶網(wǎng)絡(luò)HPCluster高性能集群系統(tǒng)的計算節(jié)點通過高速的Infiniband互連技術(shù)實現(xiàn)互聯(lián),高速的Infiniband互連網(wǎng)絡(luò)主要用于計算節(jié)點之間進行MPI通訊,交換節(jié)點應(yīng)用進程信息和計算數(shù)據(jù)。Infiniband互連采用64端口的Infiniband交換機。整個高性能集群的每個節(jié)點連接分別連接到兩個網(wǎng)絡(luò),管理網(wǎng)絡(luò)和用戶網(wǎng)絡(luò)。管理網(wǎng)絡(luò)主要用于節(jié)點管理信息的傳輸,用戶網(wǎng)絡(luò)又稱存儲網(wǎng)絡(luò),主要用于各節(jié)點與I/O節(jié)點之間的數(shù)據(jù)傳輸,包括應(yīng)用程序和數(shù)據(jù)的裝載、計算結(jié)果的保存等等。管理網(wǎng)絡(luò)和用戶網(wǎng)絡(luò)均采用HPProCurve以太網(wǎng)絡(luò)產(chǎn)品搭建。管理網(wǎng)絡(luò)采用2臺10/100Mb/sHPProCurve2650以太網(wǎng)交換機,用戶網(wǎng)絡(luò)〔存儲網(wǎng)絡(luò)采用2臺1Gb/sHPProCurve2800系列以太網(wǎng)交換機。網(wǎng)絡(luò)交換機配置如下:互連交換機〔Infiniband64端口Infiniband交換機,以太網(wǎng)交換機〔用戶網(wǎng)絡(luò)1*HPProCurveSwitch2824-20*10/100/1000Base-T-4*10/100/1000Base-T或mini-GBIC〔雙功能定制端口1*HPProCurveSwitch2848-44*10/100/1000Base-T-4*10/100/1000Base-T或mini-GBIC〔雙功能定制端口以太網(wǎng)交換機〔管理網(wǎng)絡(luò)2*HPProCurveSwitch2650-48*10/100Base-T-2*10/100/1000Base-T所有Cluster集群計算節(jié)點、I/O節(jié)點和管理節(jié)點及上述互連交換機和以太網(wǎng)交換機均被分別安裝在3個2米高E42的機柜中〔含PDU,安裝位置進行適當(dāng)調(diào)整,以優(yōu)化機柜配線。2.4.4Cluster計算集群節(jié)點管理為了有效的管理HPCluster計算集群系統(tǒng),管理節(jié)點配置了管理能力很強的管理軟件CMU<ClusterManagementUtility>。CMU是一個非常出色的Beowulf集群系統(tǒng)環(huán)境下的管理軟件,它負責(zé)系統(tǒng)的診斷、軟件安裝、性能監(jiān)控、系統(tǒng)的克隆<Cloning>和事件的分析與管理。通過使用CMU友好的用戶界面,集群管理將變得更加高效。CMU也將通過減少相關(guān)的管理任務(wù),使HPCluster計算集群成為一個經(jīng)濟高效的解決方案。CMU使用了RILOE板或集成iLO的特性,使得所有計算節(jié)點的遠程文本控制臺在服務(wù)器的所有狀態(tài)下〔設(shè)置、啟動、OS或暫停均可使用。并借助獨立于CMU的WEB瀏覽器,遠程訪問任何活動節(jié)點的圖形控制臺。通過CMU管理程序,Cluster集群系統(tǒng)管理員可以遠程控制服務(wù)器電源,而無論服務(wù)器處于何種狀態(tài)〔即使服務(wù)器關(guān)機。另外,通過CMU還可進行遠程BIOS設(shè)置。CMU還具有將一個系統(tǒng)配置向集群中的所有計算節(jié)點傳播的功能。CMU可以通過網(wǎng)絡(luò)將一個映像服務(wù)器的磁盤分區(qū)內(nèi)容克隆到計算節(jié)點本地磁盤中。這可用于計算節(jié)點的首次安裝,以及向核心或當(dāng)前系統(tǒng)配置傳播更新內(nèi)容等。在目標(biāo)分區(qū)與初始映像不同的情況下,CMU則會重點考慮目標(biāo)磁盤分區(qū)。CMU在克隆階段對目標(biāo)磁盤進行分區(qū),避免了在初次安裝期間對各個計算節(jié)點進行分區(qū)。集群管理實用程序<CMU>可以有效地管理大量計算節(jié)點。CMU帶有圖形用戶界面〔GUI,可以根據(jù)需要和集群中任意數(shù)量的節(jié)點進行定制。借助CMU,只需在單一顯示屏上單擊鼠標(biāo)即可訪問所有的計算節(jié)點控制臺。CMU主窗口可通過訪問配置顯示界面來設(shè)置控制臺服務(wù)器硬件。通過CMU,可以監(jiān)控、暫停、啟動、重啟或關(guān)閉選定的任何節(jié)點。還可以連接到集群中的多個節(jié)點,并通過一次鍵盤輸入以廣播的方式向其發(fā)出命令。CMU也可以管理來自集群的事件,如節(jié)點的增加或減少等。2.4.5Cluster計算集群作業(yè)管理高性能計算用戶通過登錄管理節(jié)點進行作業(yè)的提交,作業(yè)提交后,由管理節(jié)點上的OpenPBS作業(yè)管理軟件進行管理和分發(fā)。OpenPBS為生產(chǎn)環(huán)境設(shè)計的,它可提供了圖形和命令行兩種用戶界面來提交批處理、交互式作業(yè),并提供查詢作業(yè)、隊列、系統(tǒng)的狀態(tài)和跟蹤作業(yè)的處理。在作業(yè)運行之前,用戶可將需要的文件拷貝到執(zhí)行節(jié)點上,和將這些指定的文件在作業(yè)執(zhí)行完之后,拷貝出來。只有在所有的文件成功傳輸之后,作業(yè)將會被列入調(diào)度表。提交任務(wù)的用戶可以指定作業(yè)的優(yōu)先級,可以向隊列和系統(tǒng)層提供默認值。OpenPBS支持單隊列或多隊列方式。并選擇標(biāo)準的first-in,firstout調(diào)度,或者改進的調(diào)度算法。OpenPBS可以使用戶定義廣泛的批處理作業(yè)的內(nèi)部相關(guān)性。這些相關(guān)性包括:執(zhí)行順序、同步執(zhí)行和根據(jù)指定作業(yè)的成功或失敗結(jié)果條件執(zhí)行。2.4.6HPCluster計算集群的特點和優(yōu)勢HPCluster計算集群具有以下特點和優(yōu)勢:具有很高的性能價格比。采用先進的Beowulf架構(gòu),擴展性好即可擴充到幾百上千個節(jié)點,從而獲得很高的性能和比較低的總體成本。方案采用惠普公司的高性能、高可靠性的產(chǎn)品。高節(jié)點內(nèi)存帶寬,高性能的HPProCurve網(wǎng)絡(luò)交換產(chǎn)品,HPCMU集群管理軟件。方案采用工業(yè)標(biāo)準設(shè)備和順應(yīng)高新技術(shù)發(fā)展的趨勢。如AMDCPU,Linux技術(shù),集群并行計算技術(shù),開放代碼程序。由HP亞太地區(qū)高性能計算顧問提供技術(shù)支持,由HP集群技術(shù)部門進行配置清單設(shè)計和由HP亞太地區(qū)工廠進行集成和測試,并提供并行測試報告。由惠普公司提供專業(yè)服務(wù)支持。2.5高性能計算外接存儲需求分析本次方案沒有涉及存儲區(qū)域網(wǎng)絡(luò)的設(shè)計,本方案中給SMP計算服務(wù)器和ClusterI/O節(jié)點配置的多個146GB硬盤僅考慮臨時的應(yīng)用需要,但高性能計算對存儲空間的巨大需求是顯而易見的。在這里,我們根據(jù)現(xiàn)場測試的結(jié)果,簡單分析存儲的容量要求,供三院三部在規(guī)劃存儲區(qū)域網(wǎng)〔SAN設(shè)計時參考。經(jīng)多對實際測試情況的分析及與三部實際用戶的交流發(fā)現(xiàn),ANSYS結(jié)構(gòu)類應(yīng)用每20萬單元大約需要差不多2GB存儲空間,即每10萬單元需1GB。假設(shè)以三個月作為用戶的活躍生產(chǎn)數(shù)據(jù)遷移到近線存儲空間〔作為非頻繁訪問數(shù)據(jù)的周期,以一年作為非頻繁訪問數(shù)據(jù)遷移到離線備份設(shè)備〔作為離線備份數(shù)據(jù)的周期,因此用戶的SAN總存儲空間需求為高性能磁盤空間加上近線磁盤空間:高性能磁盤空間=生產(chǎn)數(shù)據(jù)空間+20%冗余+預(yù)留30%近線存儲磁盤空間=4x生產(chǎn)數(shù)據(jù)空間+20%冗余+預(yù)留15%而生產(chǎn)數(shù)據(jù)空間與計算任務(wù)量相關(guān)。以ANSYS為例,按SMP計算服務(wù)器配置中分析,用戶有10人,假設(shè)每月每人要計算2個600萬單元的系統(tǒng)級任務(wù),5個200萬單元的部件級任務(wù)。每個系統(tǒng)級任務(wù)和部件級任務(wù)均產(chǎn)生3份計算結(jié)果〔不同的參數(shù)和條件,但不包含中間結(jié)果數(shù)據(jù)。因此,所需空間的計算如下:生產(chǎn)數(shù)據(jù)空間=10人x<1x600萬單元+5x200萬單元>/10萬單元x1GBx3 =4.8TB考慮預(yù)留空間30%和20%的RAID冗余,可計算出所需的高性能磁盤空間約為7.2TB。近線存儲磁盤空間約為25.9TB。即總的存儲磁盤裸容量應(yīng)為33TB。上述計算只針對ANSYS應(yīng)用,對于Marc、Nastran、Fastran、Fluent、LS-Dyna等其他應(yīng)用,也應(yīng)一一分析其對存儲資源的需求情況,并根據(jù)預(yù)測的用戶數(shù)、任務(wù)量以及數(shù)據(jù)管理遷移策略等具體情況分別進行計算。另外,進行實際的估算時應(yīng)根據(jù)用戶實際的工作模式、任務(wù)量預(yù)測、考慮的數(shù)據(jù)遷移策略等作相應(yīng)調(diào)整和計算。2.6HP方案的優(yōu)勢HP所提供的上述方案是經(jīng)過深思熟慮的,從架構(gòu)設(shè)計、選型配置等方面均經(jīng)過專業(yè)的分析并以用戶現(xiàn)場測試結(jié)果為基礎(chǔ),可行、適當(dāng)、低風(fēng)險和高性價比,是三院三部最好的選擇。在以下方面,HP具有明顯的優(yōu)勢:1HP提供的方案是真正可行、低風(fēng)險的HP方案提供的計算環(huán)境系統(tǒng)架構(gòu)與已被證明架構(gòu)可行、對各種應(yīng)用具有良好的適用性、高性能、易管理的現(xiàn)場測試系統(tǒng)方案相一致,不但可以保證用戶可獲得所期望的性能,還避免了由于采用未經(jīng)測試系統(tǒng)架構(gòu)所帶來的風(fēng)險。HP方案采用多種標(biāo)準的工業(yè)架構(gòu)〔Intel安騰2MP芯片、RedHat標(biāo)準版Linux及多種高性能計算應(yīng)用軟件〔ANSYS、Nastran等。在用戶現(xiàn)場測試中,分別在該架構(gòu)上測試了用戶樣題和標(biāo)準題,不但證明了結(jié)果準確無誤,計算性能也非常理想,而且測試過程中從未發(fā)生操作系統(tǒng)與應(yīng)用不能匹配而臨時對操作系統(tǒng)打補丁的問題,或測試題目的運算異常的現(xiàn)象。證明了HP方案的架構(gòu)是穩(wěn)定的、對應(yīng)用的支持可靠的。2HP提供的方案具有非常高的性能價格比本次方案中,整個計算環(huán)境配置的計算CPU數(shù)共達144個〔SMP計算服務(wù)器共16個CPU,Cluster計算節(jié)點共128個CPU,內(nèi)存總數(shù)共達640GB??芍С殖^3000萬單元的任務(wù)運算,計算性能非凡。能夠同時滿足十一五期間流體和結(jié)構(gòu)計算的最大要求。由于采用了SMP和Cluster混合的高性能計算體系架構(gòu),能充分利用高價格高性能SMP和高性能低成本Cluster的優(yōu)勢,使得整體構(gòu)建成本仍較低,而使用戶獲得了非常高性能價格比的高性能計算環(huán)境。3HP提供的方案所采用的架構(gòu)是合理、高性能和高可擴展的HP方案中采用與用戶現(xiàn)場測試時一致的SMP+Cluster架構(gòu),針對了不同類型應(yīng)用對不同架構(gòu)計算平臺具有不同的適應(yīng)性的特點,為各類應(yīng)用任務(wù)的計算都提供了最優(yōu)的支持和性能表現(xiàn),同時也給用戶提供更加靈活的選擇。測試結(jié)果已經(jīng)驗證了該架構(gòu)是合理的、高性能的。4HP方案給用戶提供了低成本、易管理的高性能計算環(huán)境SMP單機運行結(jié)構(gòu)題目,Cluster運行流體題目,是系統(tǒng)管理簡單而且性能高。另外,用戶可以通過HPWLM和CMU、OpenPBS等管理工具和簡易管理界面即可進行計算節(jié)點的管理及計算任務(wù)的更為精細的調(diào)度和資源分配,大大簡化了任務(wù)管理的復(fù)雜性及降低了管理成本。附件HP的HPC應(yīng)用及成功案例并行計算是提高高性能計算機計算速度、從而利用它們來解決各行各業(yè)實際問題的關(guān)鍵技術(shù)。無數(shù)實踐經(jīng)驗表明,開發(fā)優(yōu)質(zhì)的并行計算軟件難度很大、必須解決許多與實際應(yīng)用相關(guān)的復(fù)雜問題。因此,發(fā)展并行計算技術(shù)不能光靠抽象研究算法、模型,必須結(jié)合實際應(yīng)用的特點和需求以及所使用的計算機平臺的特點、對應(yīng)用軟件有針對性地進行優(yōu)化、提高并行度和計算速度。許多HPC應(yīng)用領(lǐng)域的優(yōu)質(zhì)應(yīng)用軟件都是經(jīng)過廠商、ISV和用戶長期合作的結(jié)晶,經(jīng)過反復(fù)的考驗,才能在此基礎(chǔ)上形成可重復(fù)使用的整套解決方案。因此,HPC解決方案具有很高的含金量,受到用戶普遍重視。進入21世紀后,并行計算這一新興學(xué)科有了飛速發(fā)展,顯現(xiàn)出強大的生命力。最重要的標(biāo)志就是,并行計算技術(shù)在生命科學(xué)和材料科學(xué)、計算化學(xué)、數(shù)值天氣預(yù)報、石油勘探開發(fā)、航空航天、核能利用等近代科技領(lǐng)域得到了廣泛的應(yīng)用,能夠較好地發(fā)揮高性能計算機并行計算能力的HPC應(yīng)用軟件數(shù)量越來越多,在此基礎(chǔ)上形成了覆蓋HPC所有重要應(yīng)用領(lǐng)域的解決方案。HP與HPC領(lǐng)域中許多領(lǐng)先的ISV合作,在許多個能夠最佳地發(fā)揮HP基于工業(yè)標(biāo)準平臺性能優(yōu)勢和技術(shù)特長、具有最佳用戶基礎(chǔ)和市場優(yōu)勢的關(guān)鍵領(lǐng)域,推出一系列HPC應(yīng)用解決方案,包括:基礎(chǔ)研究和國防研究解決方案計算機輔助工程<CAE>解決方案生命科學(xué)和材料科學(xué)解決方案GIS解決方案數(shù)字特技和內(nèi)容創(chuàng)作等可視化計算解決方案電子設(shè)計自動化〔EDA解決方案產(chǎn)品全過程<PLM>管理解決方案天氣和氣象模型解決方案HPC主要應(yīng)用領(lǐng)域規(guī)模和增長率HPC應(yīng)用領(lǐng)域2004年市場規(guī)模年增長率基礎(chǔ)研究10億美元5.2%國防研究5億美元6%生命科學(xué)10億美元22%CAE6億美元7.3%EDA3億美元4,5%地球物理3億美元5.5%PLM2億美元5%GIS2億美元5.7%HPC應(yīng)用軟件和解決方案是長期積累的成果,也是大量投資的產(chǎn)物。為了加速應(yīng)用開發(fā)和保護原有投資,應(yīng)用軟件和解決方案移植和認證對促進HPC應(yīng)用具有重要意義。為此,HP與Intel合作、共同投入巨資,在全球建立了三個解決方案中心:Cupertino解決方案中心、Grenoble解決方案中心和上海解決方案中心,幫助廣大ISV、SI和用戶進一步了解基于IPF硬軟件系統(tǒng)和現(xiàn)有的解決方案以及開發(fā)工具,支持他們把現(xiàn)有的解決方案移植到IPF平臺上、或者在這一平臺上開發(fā)新的解決方案和應(yīng)用軟件。此外,HP還在北京、上海和XX等地設(shè)立了多個解決方案和體驗中心,承擔(dān)類似的任務(wù)。其中HPIntel上海解決方案中心位于上海外灘中心,擁有強大的基礎(chǔ)設(shè)施、齊全和先進的硬軟件設(shè)備和前沿的技術(shù),提供進行各種模式應(yīng)用開發(fā)的完美環(huán)境;擁有多名技術(shù)專家,具備應(yīng)用開發(fā)、解決方案設(shè)計、性能優(yōu)化等技術(shù)能力,以及豐富的行業(yè)和跨行業(yè)解決方案經(jīng)驗;擁有專用的寬帶Internet接入線路,合作伙伴和客戶可以與中心建立VPN聯(lián)接,在中心技術(shù)專家配合下,進行遠程開發(fā)和測試。這一中心是全球性的解決方案中心,中心專家將以HP和Intel總部和世界各地極其雄厚的資源和豐富經(jīng)驗為后盾、幫助合作伙伴和用戶解決所遇到的問題。在網(wǎng)絡(luò)化的世界中,許多難題往往很快就能得到回答。HP的解決方案中心以及與Intel等廠商共建的解決方案中心已經(jīng)在工業(yè)標(biāo)準平臺上開發(fā)HPC應(yīng)用軟件和解決方案作出了重要貢獻,今后這一作用必將越來越大。下面主要列舉與本項目應(yīng)用領(lǐng)域相類似的部分內(nèi)容。1HP的基礎(chǔ)研究和國防研究HPC解決方案政府資助項目、學(xué)院基礎(chǔ)科學(xué)研究和國防應(yīng)用是HPC傳統(tǒng)的主要領(lǐng)域之一,也是HPC〔過去稱為HPTC的發(fā)源地。今天廠商與高等學(xué)院和研究機構(gòu)開展HPC領(lǐng)域尖端和基礎(chǔ)研究仍然是發(fā)展HPC技術(shù)、推動HPC廣泛和成功應(yīng)用最重要力量,具有不可取代作用:發(fā)展尖端技術(shù):當(dāng)今世界上最尖端和最大規(guī)模的超級計算機項目往往都是為國防服務(wù)、是國家綜合實力的象征。此類項目一般都由國家出資組織廠商、大型國立實驗室和著名高等院校合作承擔(dān)。從當(dāng)前TOP500排行榜和演變歷史就可以清楚地看到最大的超級計算機和最尖端的技術(shù)都應(yīng)用于航天和核技術(shù)的發(fā)展。HP在發(fā)展HPC尖端技術(shù)方面過去、現(xiàn)在和將來都發(fā)揮重要作用,美國所有從事核技術(shù)實驗室〔如LLNL,LBNL,PNNL,Sendia,PNNL等和航天機構(gòu)〔如NASA都是HP的重要用戶和合作伙伴;探索自然奧秘:許多涉及到探索自然奧秘的HPC尖端應(yīng)用,規(guī)模大、周期長、風(fēng)險也非常大,又往往很難直接轉(zhuǎn)為商品,此類研究往往只能放在高校和院所進行。例如,高能物理是HPC領(lǐng)域最高端的科研應(yīng)用代表性領(lǐng)域。HP提供豐富的工具支持科研人員在HP工業(yè)標(biāo)準和開放性平臺上進行應(yīng)用開發(fā),包括CERNlib〔高能物理代碼庫、Geant〔事件模擬代碼、MBONE〔協(xié)作軟件、PAW〔物理分析工作站、PIAF〔并行交互分析工具等;開展基礎(chǔ)研究:HPC基礎(chǔ)研究是推動HPC技術(shù)發(fā)展和應(yīng)用推廣的基礎(chǔ),但是基礎(chǔ)研究難度大、需要許多綜合人才、直接創(chuàng)利能力又差,只有高等院校才是開展并行計算算法、軟件和開發(fā)運行環(huán)境的最理想場所。HP一方面與國內(nèi)外許多院校合作、建立了一系列聯(lián)合開發(fā)實驗室〔詳見第四章,另一方面提供高性能超級計算機、豐富和優(yōu)質(zhì)的軟件開發(fā)工具、數(shù)據(jù)分析和可視化工具作為面向基礎(chǔ)研究解決方案,支持許多院校進行并行計算、數(shù)值模擬、軟件優(yōu)化和移植等方面基礎(chǔ)研究,為HPC技術(shù)發(fā)展奠定堅實的基礎(chǔ);開發(fā)新技術(shù):一方面,基礎(chǔ)研究的創(chuàng)新性和劇烈競爭要求所使用的HPC系統(tǒng)具有先進性、高性能、可伸縮性、可用性、可維護性以及豐富的應(yīng)用軟件和解決方案;另一方面,從事基礎(chǔ)研究的學(xué)院和機構(gòu)有創(chuàng)新的傳統(tǒng)、經(jīng)費一般都比較緊張。這一領(lǐng)域比較喜歡別出心裁,蘊育了許多新技術(shù)如Internet、UNIX、Linux和集群等;培育高級人才:人才是HPC技術(shù)發(fā)展和成功應(yīng)用的關(guān)鍵,高等院校和國立實驗室之所以能夠取得許多項目和投資關(guān)鍵也在于人才。例如,LosAlamos國家實驗室今后三年內(nèi)將獲得國防部420萬美元的資助,以便實驗室的計算機和計算科學(xué)部門進行分析、模擬、創(chuàng)建軟件工具和評估網(wǎng)絡(luò)。該實驗室之所以被選中進行該計劃是因為該實驗室擁有高級超級計算機結(jié)構(gòu)、性能模擬等方面的人才。我國目前正在建設(shè)的兩大網(wǎng)格中國國家網(wǎng)格和中國教育網(wǎng)格其主要節(jié)點全部在科教單位〔詳見第一章,其原因與高校擁有大量人才顯然有關(guān);HP許多國內(nèi)外許多著名的科教機構(gòu)合作提供支持它們進行HPC應(yīng)用開發(fā)和人才培育的完整解決方案,包括工業(yè)標(biāo)準平臺、軟件開發(fā)和移植工具、數(shù)據(jù)分析和可視化工具以及通過解決方案中心等機構(gòu)提供技術(shù)服務(wù)和支持,為HPC領(lǐng)域前沿項目研究、尖端技術(shù)開發(fā)、并行算法和理論基礎(chǔ)研究發(fā)展作出了重要的貢獻,創(chuàng)造了一系列成功的應(yīng)用實例。HP集群架構(gòu)超級計算機在基礎(chǔ)研究領(lǐng)域中部分用戶用戶名稱用戶簡介系統(tǒng)配置主要應(yīng)用復(fù)旦大學(xué)著名高校128臺HPProLiantDL360生命科學(xué)、網(wǎng)格西北工業(yè)大學(xué)著名理工大學(xué)42臺rx2600組成集群航天、航空CAE研究清華大學(xué)清華大學(xué)高性能計算中心,國內(nèi)最著名綜合性大學(xué)120臺rx2600集群系統(tǒng)網(wǎng)格高性能計算研究華中理工大學(xué)國內(nèi)著名理工類學(xué)院57臺rx2600服務(wù)器集群生命科學(xué)等領(lǐng)先中國科技大學(xué)中國國家重點建設(shè)的高水平大學(xué)之一2臺IntegritySuperdome,32臺rx2600集群系統(tǒng)生命科學(xué)、工程、化學(xué)和材料等領(lǐng)域應(yīng)用中科院物理研究所國內(nèi)著名研究所AlphaServerSC45超級計算機凝聚態(tài)物理研究CaliforniaInstituteofTechnology加州技術(shù)學(xué)院的高級計算研究中心,支持學(xué)院和設(shè)在該院的噴氣發(fā)動機實驗室的科研6套4處理器的rx4610服務(wù)器與HPSuperDome和V2500等大型服務(wù)器聯(lián)網(wǎng)科學(xué)和工程計算機模型研究OhioSupercomputerCenter美國Ohio州的一個為大學(xué)和私人公司提供計算服務(wù)的計算中心150個zx6000工作站、通過Myrinet聯(lián)接組成的Linux集群系統(tǒng)計算化學(xué)、物理和機械工程、全球天氣預(yù)報等方面計算Queen‘sUniversityBelfast英國北愛爾蘭一家大學(xué)23個節(jié)點〔50個Itanium2CPUHP-UX集群系統(tǒng)〔以后使用Linux操作系統(tǒng)高性能技術(shù)計算RiceUniversityTexas州一所大學(xué),是美國最好的技術(shù)和研究大學(xué)之一;建立該州大學(xué)中第一個速度高達1TFLOPS的超級計算機-RTC〔RiceTelescaleCluster由132臺zx6000工作站和4臺rx5670服務(wù)器,通過Myrinet聯(lián)接,組成基于Linux的集群系統(tǒng)高性能技術(shù)計算和高端的可視化應(yīng)用UniversityofOslo挪威的一所大學(xué),與Trosmo大學(xué)等四個單位聯(lián)合組成一個支持高性能技術(shù)計算的網(wǎng)格利用基于Itanium工作站的Linux集群系統(tǒng)與兩臺HPSuperDome服務(wù)器聯(lián)接,組成網(wǎng)格系統(tǒng)生物信息學(xué)、天體物理、地球物理、化學(xué)和金融模擬等領(lǐng)域的計算UniversityofTennessee美國田納西州的一所大學(xué),大量從事網(wǎng)格計算研究使用由大量基于Itanium2的集群系統(tǒng)組成網(wǎng)絡(luò),支持網(wǎng)格計算支持該校的開放性校園間網(wǎng)格工程〔SinRGUniversityofTromso挪威的一所大學(xué),與Oslo大學(xué)等四個單位聯(lián)合組成一個支持高性能技術(shù)計算的網(wǎng)格利用基于Itanium工作站的Linux集群系統(tǒng)與兩臺HPSuperDome服務(wù)器聯(lián)接,組成網(wǎng)格系統(tǒng)生物信息學(xué)、天體物理、地球物理、化學(xué)和金融模擬等領(lǐng)域的計算KTH<RoyalInstituteofTechnology>瑞典最大的工程學(xué)院180個Itanium2處理器集群系統(tǒng),包括74個HPrx2600服務(wù)器和16個HPzx6000工作站〔2CPU支持瑞典科學(xué)院研究和國家合作,包括生命科學(xué)、生物信息學(xué)、計算化學(xué)、材料科學(xué)、天體物理、基礎(chǔ)物理和計算工程2HP面向計算機輔助工程<CAE>的HPC解決方案當(dāng)前,計算機輔助工程〔CAE已經(jīng)發(fā)展成為制造業(yè)不可缺少的工具:工程師使用CAE系統(tǒng)開發(fā)和觀察物理世界高度復(fù)雜和精確的模型,設(shè)計各種事物如交通工具<汽車、飛機、輪船和火車>、醫(yī)療設(shè)備、運動設(shè)備、民用建筑等。CAE技術(shù)的應(yīng)用需要完成計算量大和復(fù)雜的計算任務(wù),需要性能越來越高的計算機系統(tǒng)和復(fù)雜的應(yīng)用軟件,形成了規(guī)模巨大的基于64位系統(tǒng)的CAE市場。根據(jù)IDC的統(tǒng)計,CAE在HPC各分支中市場份額僅次于生命科學(xué)位居第二,達到6億美元以上,年增長率達到7.3%。隨著基于超級計算機的并行處理計算、網(wǎng)絡(luò)和網(wǎng)格技術(shù)的發(fā)展,CAE技術(shù)逐步于傳統(tǒng)的CAD技術(shù)融合在一起,向一體化、虛擬化和協(xié)作化的方向發(fā)展,成為HPC發(fā)展最快的分支之一。HP在CAE市場中居領(lǐng)先地位。自從2002年第一代Itanium2上市以來,所有一流的開發(fā)CAE軟件的ISV廠商都已經(jīng)全部采用基于Itanium2系統(tǒng)。HP與它們合作,推出了豐富和優(yōu)化的Itanium2平臺上計算機輔助工程HPC解決方案,許多著名的Linux廠商也與HP合作,例如CAE領(lǐng)域著名的Linux軟件廠商MSC.Linux,也與HP合作在HP工業(yè)標(biāo)準平臺上推出Linux下的CAE應(yīng)用軟件。目前,HP能夠全面提供結(jié)構(gòu)分析、影響分析和流體動力學(xué)等三個主要分支許多著名的CAE應(yīng)用軟件,所有這些軟件在HP工業(yè)標(biāo)準平臺上都表現(xiàn)出領(lǐng)先的性能,滿足用戶建立各類CAE系統(tǒng)的需要。HP提供全面的CAE關(guān)鍵技術(shù)解決方案和針對工業(yè)標(biāo)準平臺和集群架構(gòu)優(yōu)化的CAE應(yīng)用軟件,受到國內(nèi)CAE用戶的廣泛歡迎,創(chuàng)造了一系列成功應(yīng)用實例,充分顯示了現(xiàn)代并行計算機在國民經(jīng)濟中應(yīng)用價值和HP在CAE領(lǐng)域的領(lǐng)先地位。2.1HP基于網(wǎng)絡(luò)的一體化和虛擬化CAE解決方案當(dāng)前計算機技術(shù)在機械工程的應(yīng)用已經(jīng)由傳統(tǒng)的計算機輔助設(shè)計<CAD>發(fā)展到計算機輔助工程<CAE>。傳統(tǒng)的CAE又發(fā)展成為基于網(wǎng)絡(luò)的新一代CAE:把模擬和分析技術(shù)與CAD技術(shù)融為一體、把CAE前處理和后處理結(jié)合在一起,創(chuàng)造一個虛擬和智能的產(chǎn)品開發(fā)過程。例如:基于模擬的設(shè)計:使設(shè)計人員在產(chǎn)品實際投產(chǎn)前就能夠觀察和分析產(chǎn)品,從而加速和優(yōu)化設(shè)計過程;虛擬樣機:使用模擬技術(shù)對虛擬而不是實際樣機進行工程測試;虛擬制造:使用模擬技術(shù)來模擬制造過程,從而優(yōu)化制造過程;HP在多年CAE應(yīng)用豐富經(jīng)驗的基礎(chǔ)上推出了基于網(wǎng)絡(luò)的CAE解決方案參考架構(gòu),利用網(wǎng)絡(luò)幫助用戶把HP領(lǐng)先的集群、服務(wù)器、客戶機、應(yīng)用軟件結(jié)合在一起,為用戶建立CAD和CAE一體化、能夠?qū)崿F(xiàn)虛擬化設(shè)計和制造的提供強大、可靠和可伸縮平臺。HP的CAE網(wǎng)絡(luò)能夠把與設(shè)計、制造有關(guān)的各種工程技術(shù)人員組成一個虛擬的協(xié)作網(wǎng)絡(luò),圍繞設(shè)計項目分工協(xié)作。這一協(xié)作網(wǎng)絡(luò)還具有交互功能:設(shè)計者可以通過網(wǎng)絡(luò)觀察根據(jù)原設(shè)計"生產(chǎn)"出來的虛擬樣機,并進行修改。這一過程周而復(fù)始,直至獲得滿足的結(jié)果,再投入正式生產(chǎn)。這樣可以大大提高設(shè)計效率、加速新產(chǎn)品上市,產(chǎn)生巨大的經(jīng)濟效益。HP領(lǐng)先的CAE參考架構(gòu)和豐富的系統(tǒng)平臺和應(yīng)用軟件相結(jié)合,使得HP能夠為CAE用戶提供具有網(wǎng)絡(luò)時代風(fēng)格新一代的一體化CAE解決方案,大大提高設(shè)計水平,全面滿足CAE各個應(yīng)用領(lǐng)域的需要。2.2HP全面和豐富的CAE應(yīng)用軟件當(dāng)前CAE應(yīng)用軟件主要分為:結(jié)構(gòu)分析〔大多使用有限元分析、影響分析〔如汽車沖擊影響分析等和計算流動動力學(xué)〔如飛機和水流的流體動力學(xué)等。在現(xiàn)代的CAE應(yīng)用軟件中,這三方面的軟件也可以結(jié)合在一起構(gòu)成高效的設(shè)計鏈。下表說明這三類應(yīng)用的特點。三類主要的CAE應(yīng)用CAE領(lǐng)域結(jié)構(gòu)分析影響分析計算流體動力學(xué)并行方式SMPSMP<MPI>MPI可伸縮性1-8CPU2-16CPU4-128CPU最適用的硬件平臺運行HP-UX或Linux的Integrity服務(wù)器服務(wù)器或集群系統(tǒng)集群系統(tǒng)通用解決方案SMP架構(gòu)的基于IPF的Integrity服務(wù)器HP與領(lǐng)先廠商合作,全面提供各個CAE領(lǐng)域的應(yīng)用軟件。其中,有許多軟件雙方共同合作進行了針對HP工業(yè)標(biāo)準平臺特點的優(yōu)化,提供領(lǐng)先的性能。HP也支持把三者結(jié)合在一起的解決方案,如MSC.Linux的設(shè)計鏈加速器和Ansys的組合解決方案等。HP平臺上的有限元分析<FEA>解決方案HP提供基于這一領(lǐng)域中著名的Ansys、MSC.Linux等廠商軟件的有限元分析解決方案,把FEA技術(shù)與HP工業(yè)標(biāo)準平臺的高性能和性價比結(jié)合在一起、應(yīng)用于解決結(jié)構(gòu)和固體對負載、接觸、沖擊、溫度、電磁和其它環(huán)境條件的物理響應(yīng)的問題,滿足飛機和汽車設(shè)計、國防和民用工程設(shè)計、芯片制造等行業(yè)以及國家和大學(xué)實驗室的需要。HP平臺上的計算流體力學(xué)<CFD>解決方案HP提供基于這一領(lǐng)域中著名的Fluent、EXA、LTSC、MetacompTech等廠商軟件的計算流體力學(xué)解決方案,把CFD技術(shù)與HP工業(yè)標(biāo)準平臺的高性能和性價比結(jié)合在一起、應(yīng)用于模擬和仿真流體、熱流或材料流,滿足航空、航天、汽車制造等行業(yè)設(shè)計飛機和汽車引擎和外形設(shè)計的需要。HP平臺上的沖擊分析和碰撞模擬解決方案HP提供基于這一領(lǐng)域中著名的ESI、PTC等廠商軟件的沖擊分析和碰撞模擬解決方案,使用FEA和CFD技術(shù)以多種尺寸模擬設(shè)計中動態(tài)沖擊的結(jié)果,滿足汽車、貨車、火車制造行業(yè)的需要。這些行業(yè)利用車輛和乘客模型進行碰撞模擬,優(yōu)化車輛的安全性能。許多用戶如美國全國汽車碰撞分析中心利用運行Linux的HP系統(tǒng)研究車輛碰撞對車輛影響的復(fù)雜計算機模擬問題、取得了滿意的結(jié)果。HP平臺上的生產(chǎn)過程模擬解決方案HP提供基于這一領(lǐng)域中CEI、CDAdapcoGroup等廠商的生產(chǎn)過程模擬解決方案。把模擬技術(shù)應(yīng)用于制造過程和材料分析,例如金屬印制、焊接、融合和壓制等過程,使設(shè)計者能夠優(yōu)化生產(chǎn)能力和生產(chǎn)過程參數(shù)提高產(chǎn)品質(zhì)量、適用程度和降低成本。HP平臺上設(shè)計鏈加速器解決方案HP與MSC.Linux合作推出設(shè)計鏈加速器<DCA>解決方案通過為制造廠〔如汽車和飛機工業(yè)制造廠提供超級的高性能產(chǎn)品開發(fā)解決方案改進產(chǎn)品開發(fā)。DCA以更高精度和可靠性幫助公司開發(fā)基于先進的設(shè)計標(biāo)準銷售的產(chǎn)品。它通過從產(chǎn)品設(shè)計到正式投產(chǎn)前、進行復(fù)雜的模擬,包括計算流體力學(xué)〔CFD、碰撞和結(jié)構(gòu)模擬,大大減少代價極大的設(shè)計錯誤。DCA解決方案的組成部件包括:HP工作站、服務(wù)器、互聯(lián)設(shè)備、SAN、Linux操作系統(tǒng)、MSC.Linux集群發(fā)行版本。組合技術(shù)解決方案Itanium2平臺上基于Ansys公司著名的MultiPhysics軟件的組合技術(shù)解決方案,把FEA和CFD技術(shù)組合在一起分析更加復(fù)雜的物理系統(tǒng)。例如,對行駛中汽車周圍氣流產(chǎn)生的噪聲作空氣聲學(xué)分析,對飛機機翼周圍氣流產(chǎn)生的力對機翼結(jié)構(gòu)影響的分析等。許多著名的FEA和CFD軟件廠商如MSC.Software、Fluent、ESI等能夠在Itanium2平臺上提供把兩種技術(shù)結(jié)合在一起的組合技術(shù)解決方案。2.3HP面向CAE的HPC解決方案在中國國內(nèi)的應(yīng)用當(dāng)前,中國工業(yè)化發(fā)展非常迅速,已經(jīng)成為了"世界制造中心",大部分全球知名的制造企業(yè)已在中國開辦了工廠,而且中國國內(nèi)制造業(yè)企業(yè)發(fā)展也非常迅猛,CAE應(yīng)用市場潛力很大;另一方面,隨著制造企業(yè)的增多,國內(nèi)制造業(yè)競爭激烈度不斷加劇。任何制造企業(yè)都面臨著提高產(chǎn)品設(shè)計質(zhì)量和縮短產(chǎn)品的生產(chǎn)周期的問題,CAE以其應(yīng)用數(shù)學(xué)模型確保產(chǎn)品設(shè)計的合理性、與優(yōu)化技術(shù)組合產(chǎn)生最佳產(chǎn)品設(shè)計方案等眾多優(yōu)點,成為現(xiàn)代設(shè)計流程的核心和現(xiàn)代設(shè)計的聚焦點。在這些因素的綜合作用下,中國CAE應(yīng)用市場發(fā)展非常迅速,平均年市場增長率超過10%。HPCAE應(yīng)用解決方案廣泛的可用性,使它們得到中國國內(nèi)汽車、輪船、飛機、橋梁、化工、醫(yī)療設(shè)備等領(lǐng)域的青睞,目前在中國也有一大批企業(yè)、研究院所和學(xué)院運用HPCAE解決方案進行現(xiàn)代工藝設(shè)計。例如,軍隊某研究所選擇8CPU的HPIntegrity服務(wù)器作為飛機設(shè)計CAE應(yīng)用軟件的硬件平臺,運行GridGen,NSAERO和Tecplot等三個模塊,進行飛機設(shè)計。其中,GridGen是前處理模塊,主要用于高超音速飛行器氣動仿真建模;NSAERO是專業(yè)的高超音速氣動仿真解算器,用于求解復(fù)雜邊界微分方程;Tecplot是后處理模塊,主要用于三維流場顯示以及結(jié)果分析;在包括中國在內(nèi)Linux市場取得巨大成功的MSC.Software公司目前成為HP在工業(yè)制造商高性能計算〔HighPerformanceComputing/linux市場的全球性伙伴。雙方合作在中國汽車、飛機、橋梁等領(lǐng)域把MSC.Software優(yōu)質(zhì)的Linux軟件和HP價廉物美的平臺結(jié)合在一起取得可觀的成果;西北工業(yè)大學(xué)使用42臺Integrityrx2600組成的集群系統(tǒng)和計算網(wǎng)格,進行航天和航空有關(guān)的相關(guān)的流體計算、材料相關(guān)的結(jié)構(gòu)分析與優(yōu)化設(shè)計、并行算法研究等CAE計算取得了非常好的結(jié)果;中國科學(xué)院過程工程研究所基于ProLiant集群為了解決各項模擬工作對大規(guī)模并行計算的需求,20XX初與HP合作建立了集群并行系統(tǒng)。該系統(tǒng)在最大配置方式下?lián)碛?2個計算節(jié)點和8個服務(wù)和管理節(jié)點。計算節(jié)點采用HPProLiantDL360服務(wù)器,每個節(jié)點配置兩個P3/1.13GHzCPU和512MB內(nèi)存,并以兩個百兆以太網(wǎng)卡相連,峰值計算速度達到110GFLOPS。該系統(tǒng)已成功安裝了通用離散模擬平臺,并在寶鋼和中石油項目中得到應(yīng)用。2.4HP面向CAE的HPC解決方案的成功應(yīng)用實例HP在CAE領(lǐng)域具有非常明顯的硬軟件優(yōu)勢、標(biāo)簽?zāi)軌驗橛脩籼峁┴S富的解決方案,被世界各國用戶廣泛采用,創(chuàng)造了許多引人注目的成功實例。例如:HP和AVAKI合作為一家大型跨國公司建立了基于計算網(wǎng)格和數(shù)據(jù)網(wǎng)格的CAE系統(tǒng)。該公司的總部在美國、設(shè)計中心在意大利和新加坡、生產(chǎn)工廠在印度。最初該公司分別在這些地方建立了基于集群系統(tǒng)的CAE和管理系統(tǒng)。這些系統(tǒng)雖然發(fā)揮了較好的作用,但由于都是孤立的系統(tǒng),資源和數(shù)據(jù)共享能力較差。HP與AVAKI合作使用網(wǎng)格技術(shù)統(tǒng)一該公司的管理、設(shè)計和生產(chǎn)系統(tǒng),大大提高了CAE系統(tǒng)的資源和數(shù)據(jù)共享能力以及設(shè)計效率和水平,產(chǎn)生了非常好的效益。德國DaimlerChrysler公司以生產(chǎn)奔馳車而

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論