第1講-高性能計算與高性能計算機_第1頁
第1講-高性能計算與高性能計算機_第2頁
第1講-高性能計算與高性能計算機_第3頁
第1講-高性能計算與高性能計算機_第4頁
第1講-高性能計算與高性能計算機_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第1講-高性能計算與高性能計算機2023/5/182為什么要開設(shè)這門課程本課程主要涉及高性能計算和并行程序設(shè)計,其核心是并行技術(shù)并行技術(shù)與當(dāng)今計算機研究和應(yīng)用的熱點緊密相連:1、多核技術(shù)(INTEL、AMD、IBM、SONY、SUN、NVIDIA)。當(dāng)你有了16個核的處理器怎么有效利用?2、集群技術(shù)。集群系統(tǒng)如今隨處可見,如何有效使用它?并行是唯一途徑。3、超級計算機。超級計算機用于求解富有挑戰(zhàn)性的計算問題.有效的大規(guī)模并行軟件是發(fā)揮其性能的關(guān)鍵4、云計算、網(wǎng)格計算、服務(wù)計算、高性能計算、物聯(lián)網(wǎng)技術(shù)5、大數(shù)據(jù)6、……2023/5/183為什么要并行計算?有限時間內(nèi)解決復(fù)雜計算問題汽車碰撞實驗:32CPU4小時(一個工況)藥物篩選:64CPU,500萬化合物,一年蛋白質(zhì)折疊,256CPU、2個月只能算一個納秒過程宇宙大尺度結(jié)構(gòu)模擬:256CPU,6個月過去:大量應(yīng)用需求的驅(qū)動需求驅(qū)動和技術(shù)推動2023/5/184為什么要并行計算?

今天:計算機技術(shù)發(fā)展的推動芯片上晶體管數(shù)目每18個月增長一倍?工藝:90nm65nm32nm,逼近極限主頻:從到,步履艱難功耗:單芯片百瓦功耗,mini型“核反應(yīng)堆”2023/5/185并行計算平民化的到來!

每個程序員面臨的多核并行計算時代在單個芯片上內(nèi)置多個處理單元-“核”每個處理器視為小型的并行計算機雙核四核多核

并行計算已經(jīng)成為必然!2023/5/186如何進行并行(多核)計算?思路最關(guān)鍵,并行思想,并行算法新的工具和實現(xiàn)方法MPI/OpenMP,GoggleHadoop,IntelC++,WindowsHPC等好的編程方法針對硬件結(jié)構(gòu),重視程序性能2023/5/187現(xiàn)實的情況●1、需要通過顯式并行的硬件系統(tǒng)走向普及:集群計算機、多核處理器●2、然而大家對于并行計算方法和工具了解和認識不足。為此,開設(shè)這門課程希望把并行計算作為一種通用計算技術(shù)介紹給大家2023/5/188課程目的澄清對并行計算的認識:

●不是少數(shù)人的專利●高性能計算隨著機群系統(tǒng)、多核處理器的出現(xiàn)將逐漸普及到桌面系統(tǒng)了解高性能計算的前沿技術(shù)發(fā)展情況鍛煉基本的資料檢索、文獻閱讀、歸納整理和口頭報告的能力實實在在體驗并行軟件開發(fā)

●并行編程語言-實現(xiàn)●并行程序性能與優(yōu)化-分析●并行算法設(shè)計-設(shè)計●并行程序開發(fā)流程-獨立開展2023/5/189教材和主要參考書教材:暫無(提供電子教案)參考書:[1]并行計算導(dǎo)論,張林波等

,北京:清華大學(xué)出版社,2006[2]并行計算:結(jié)構(gòu)、算法、編程(修訂版),陳國良等,北京:高教出版社,2003[3]并行程序設(shè)計(第二版),BarryWilkinson等,陸鑫達等譯,北京:機械工業(yè)出版社,2005[4]MPI并行程序設(shè)計實例教程,張武生等

,北京:清華大學(xué)出版社,2009[5]多核程序設(shè)計,陳天洲等,北京:清華大學(xué)出版社,2007[6]并行計算應(yīng)用與實戰(zhàn),王鵬等,北京:機械工業(yè)出版社,20092023/5/1810課程安排理論并行計算機系統(tǒng)及其結(jié)構(gòu)模型(當(dāng)代對稱多處理機、大規(guī)模并行處理機、機群系統(tǒng))并行計算機系統(tǒng)的性能評測以及并行算法的設(shè)計基礎(chǔ)、一般設(shè)計策略和一般設(shè)計過程介紹幾種常見的分布式并行算法

實踐典型并行計算機系統(tǒng)—PC機群的搭建消息傳遞(MessagePassingInterface,MPI)并行程序設(shè)計具體內(nèi)容安排第一講高性能計算與高性能計算機第二講并行計算機系統(tǒng)及其結(jié)構(gòu)模型第三講PC機群的搭建(自學(xué))第四講并行算法設(shè)計的關(guān)鍵技術(shù)第五講MPI并行程序設(shè)計語言第六講并行算法設(shè)計實例2023/5/1811第一講高性能計算與高性能計算機1.高性能計算的意義2.高性能計算的發(fā)展與現(xiàn)狀3.高性能計算的典型應(yīng)用4.高性能計算的挑戰(zhàn)與機遇2023/5/18121.高性能計算的意義(1)1.1高性能計算的內(nèi)在含義1.2高性能計算的應(yīng)用需求1.3高性能計算的戰(zhàn)略地位2023/5/18131.高性能計算的意義(2)1.1高性能計算的內(nèi)在含義計算和計算科學(xué)所有的學(xué)科都轉(zhuǎn)向定量化和精確化三大科學(xué):理論科學(xué)、實驗科學(xué)和計算科學(xué)計算科學(xué)是一個交叉學(xué)科,用計算的方法來解決應(yīng)用問題。適用于理論模型復(fù)雜或尚未建立、實驗費用昂貴或無法進行。計算物理、計算化學(xué)、計算生物學(xué)、計算地質(zhì)學(xué)、計算氣象學(xué)。并行計算是跟上摩爾定律的重要手段。2023/5/18141.高性能計算的意義(3)高性能計算的含義高性能計算簡稱HPC(HighPerformanceComputing),泛指量大、快速、高效的運算。高性能計算主要包括:向量計算并行計算分布式計算網(wǎng)格計算………..2023/5/18151.高性能計算的意義(4)高性能計算的量綱前綴縮寫基冪含意數(shù)值KiloK103Thousand千MegaM106Million兆,百萬GigaG109Billion千兆,10億TeraT1012Trillion垓,萬億PetaP1015Quadrillion千萬億ExaE1018Quitillion百億億Flops:每秒所執(zhí)行的浮點運算次數(shù)(floating-pointoperationspersecond)目前的PC機運算速度通常在GFlops量級,高性能計算機運算速度則在TFlops至PFlops量級。2023/5/18161.高性能計算的意義(5)1.2高性能計算的應(yīng)用需求應(yīng)用需求計算密集型應(yīng)用(Computing-intensive):大型科學(xué)工程計算,數(shù)值模擬等。應(yīng)用領(lǐng)域:石油、氣象、CAD、核能、制藥、環(huán)境監(jiān)測分析、系統(tǒng)仿真等。數(shù)據(jù)密集型應(yīng)用(Data-intensive):數(shù)字圖書館,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘,計算可視化等。應(yīng)用領(lǐng)域:圖書館、銀行、證券、稅務(wù)、決策支持系統(tǒng)等。通信密集型應(yīng)用(Network-intensive):協(xié)同工作,網(wǎng)格計算,遙控和遠程診斷等。應(yīng)用領(lǐng)域:網(wǎng)站、信息中心、搜索引擎、電信、流媒體等。2023/5/18171.高性能計算的意義(6)千萬億次超級計算機的應(yīng)用需求應(yīng)用領(lǐng)域應(yīng)用需求計算能力需求存儲容量需求生物醫(yī)學(xué)蛋白質(zhì)電子態(tài)的計算藥物發(fā)明中的篩選過程蛋白質(zhì)折疊100Tflops800Tflops1Pflops30TB200TB1PB航空航天制造發(fā)動機燃燒模擬和機翼設(shè)計模擬500Tflops100TB氣候環(huán)境短期天氣預(yù)報長期天氣預(yù)報局部突發(fā)性災(zāi)難預(yù)報(如洪水、海嘯)20Tflops200Tflops1Pflops10TB100TB500TB核能領(lǐng)域完全等離子分析(包括電子結(jié)構(gòu)分析)核武器數(shù)值模擬天然氣燃燒500Tflops1Pflops1Pflops1PB1PB1PB納米技術(shù)復(fù)合材料的結(jié)構(gòu)分析和功能預(yù)測新材料發(fā)明200Tflops1Pflops400TB2PB天體物理學(xué)超新星三維模擬1Pflops1PB國防和國家安全密碼破譯先進武器模擬1Pflops1Pflops1PB1PB2023/5/18181.高性能計算的意義(7)1.3高性能計算的戰(zhàn)略地位從戰(zhàn)略高度上講高性能計算技術(shù)是一個國家綜合國力的體現(xiàn)。高性能高計算是支撐國家實力持續(xù)發(fā)展的關(guān)鍵技術(shù)之一。高性能計算國防安全、高科技發(fā)展和國民經(jīng)濟建設(shè)中占有重要的戰(zhàn)略地位。

重大挑戰(zhàn)問題:飛機設(shè)計、藥物設(shè)計、全球氣候預(yù)測、人類基因、海洋環(huán)流新材料、生物分子結(jié)構(gòu)、半導(dǎo)體建模、超導(dǎo)建模等。2023/5/18191.高性能計算的意義(8)高性能計算在發(fā)達國家的戰(zhàn)略地位(1)美國有關(guān)發(fā)展高性能計算的建議報告從1982年到2005年,美國國防部、能源部、國家科學(xué)院、國家科學(xué)基金委以及美國總統(tǒng)信息技術(shù)顧問委員會、美國信息技術(shù)咨詢委員會、美國國家競爭力委員會等提出的有關(guān)信息技術(shù)和計算機的建議報告中,大都涉及到了高性能超級計算機的內(nèi)容。2023/5/18201.高性能計算的意義(9)高性能計算在發(fā)達國家的戰(zhàn)略地位(2)清單(按年代排序)1982年,美國國家科學(xué)院:《關(guān)于科學(xué)研究及工程中的大規(guī)模計算》1993年,美國國家科學(xué)院:《從臺式計算機到萬億次計算機:充分發(fā)揮美國在高性能計算領(lǐng)域領(lǐng)導(dǎo)權(quán)》1995年,美國國家科學(xué)院:《特別工作組關(guān)于未來國家科學(xué)基金委超級計算中心計劃報告》1996年,美國總統(tǒng)信息技術(shù)顧問委員會:《信息技術(shù)研究:為了未來》2000年,美國國家科學(xué)院:《促使信息技術(shù)更好》2001年,美國國家科學(xué)院:《無處不在》2002年,美國國防部:《適用于國家安全部門的高性能計算》2003年,美國能源部:《基于科學(xué)的大規(guī)模模擬》

2003年,美國國家科學(xué)基金委:《通過計算機基礎(chǔ)結(jié)構(gòu)變革科學(xué)與工程》

2003年,美國國家科學(xué)基金委:《信息時代的知識丟失》2004年,美國國家競爭力委員會:《促使美國變革并提高競爭力》

2004年,美國跨機構(gòu):《聯(lián)邦高端計算計劃-高端計算復(fù)興特別工作組》2005年,美國國家科學(xué)院:《超級計算機未來》

2005年,美國總統(tǒng)信息技術(shù)顧問委員會:《計算科學(xué):確保美國競爭力》2023/5/18211.高性能計算的意義(10)高性能計算在發(fā)達國家的戰(zhàn)略地位(3)美國發(fā)展有關(guān)高性能計算的行動計劃1993年,美國科學(xué)工程技術(shù)聯(lián)邦協(xié)調(diào)理事會:《HPCC(HighperformanceComputing&Communication)GrandChallenge》計劃,提出發(fā)展萬億次(Tera=1012)計算機計劃。1996年,美國能源部和LawrenceLivermore、LosAlamos、Sandia三大核武器國家實驗室:《ASIC(AcceleratedStrategicComputingInitiative)》計劃,提出發(fā)展千萬億次(Pera=1015)計算機的目標(biāo)。1997年,HPCC包括了HECC(HighEndComputing&Communication),被擴展為CIC(Computing,Information,Communication)計劃。1998年度的CIC藍皮書,將千萬億次計算機硬件和軟件研制列入了計劃中。2002年啟動HPCS計劃,希望確定未來10到20年超級計算機的體系結(jié)構(gòu)。2023/5/18221.高性能計算的意義(11)高性能計算在發(fā)達國家的戰(zhàn)略地位(4)美國1996年提出的ASCI(AcceleratedStrategicComputingInitiative)計劃。通過數(shù)值模擬,評估核武器的性能、安全性、可靠性等。高分辨率、高逼真度、三維、全物理、全系統(tǒng)的規(guī)模和能力。計劃研制5代計算平臺,目前,前四代已完成,第五代平臺正在研制。隨著第一個十年研究結(jié)束,已經(jīng)開始為下一個十年發(fā)展制訂規(guī)劃。2023/5/18231.高性能計算的意義(12)高性能計算在發(fā)達國家的戰(zhàn)略地位(5)—ASCI高性能計算機BlueMountainOptionRed2023/5/18241.高性能計算的意義(13)高性能計算在發(fā)達國家的戰(zhàn)略地位(6)美國2002年啟動的千萬億次超級計算機研究HPCS計劃從2002年起的兩年多時間里,ES占據(jù)TOP1位置Cluster并不是HPC的最終體系結(jié)構(gòu)美國DARPA于2002年啟動高生產(chǎn)率計算系統(tǒng)(HighProductivityComputingSystems)HPCS計劃希望確定未來10年甚至20年的高性能計算機體系結(jié)構(gòu)高生產(chǎn)率而非峰值計算能力作為評價指標(biāo)高性能計算的一個新的創(chuàng)新時代的開始2023/5/18251.高性能計算的意義(14)高性能計算在我國的戰(zhàn)略地位(1)2006年2月,國務(wù)院發(fā)布《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006~2020年)》指出加速發(fā)展高性能計算對提高我國國防建設(shè)與國家安全、國家經(jīng)濟建設(shè)、國家重大工程和基礎(chǔ)科學(xué)研究等尖端科技領(lǐng)域的核心支撐能力,具有十分重要的戰(zhàn)略意義。提出要全面提升我國的自主創(chuàng)新能力,以期將我國在2020年前建設(shè)成為一個創(chuàng)新型國家。2023/5/18261.高性能計算的意義(15)高性能計算在我國的戰(zhàn)略地位(2)中國高性能計算發(fā)展大事記1983年,由國防科技大學(xué)研制的銀河I型億次巨型機系統(tǒng)的成功問世,標(biāo)志著我國具備了研制高端計算機系統(tǒng)的能力。1992年,曙光投入200萬元研制曙光一號。隨后,曙光一號、曙光1000、曙光2000、曙光3000、曙光4000相繼問世。1994年,銀河I的換代產(chǎn)品銀河II在國家氣象局正式投入運行,其系統(tǒng)性能達每秒10億次,大大縮短了我國與先進國家的差距。1997年,銀河III并行巨型計算機在北京通過國家鑒定,峰值性能為每秒130億浮點運算。1999年,首臺“神威I”計算機通過了國家級驗收,并在國家氣象中心投入運行。2000年,由1024個CPU組成的銀河Ⅳ超級計算機系統(tǒng)問世,峰值性能達到每秒萬億次浮點運算。2002年,世界上第一個萬億次機群系統(tǒng)聯(lián)想深騰1800出世,獲得2004年國家科技進步二等獎。2003年,聯(lián)想深騰6800問世把世界機群計算推向新的高峰。2004年,曙光4000A成功研制,使中國成為繼美國、日本之后第三個能研制10萬億次商品化高性能計算機的國家(進入TOP500前10位)。2005年,中國高性能計算機性能TOP100排行榜揭曉,曙光位居第一。天梭榮獲國家科學(xué)技術(shù)進步二等獎。2006年,曙光高性能計算機被胡錦濤總書記點評為“中國七大標(biāo)志性自主創(chuàng)新成果之一”,曙光4000系列高性能計算機榮獲國家科學(xué)技術(shù)進步二等獎。2007年12月,中國首臺采用國產(chǎn)高性能通用處理器芯片“龍芯2F”的萬億次高性能計算機“KD-50-I”研制成功。2008年6月24日,中國科學(xué)院計算技術(shù)研究所、曙光公司和上海超級計算中心在中科院計算所聯(lián)合舉行了曙光5000落戶上海超級計算中心的簽約儀式。2023/5/18271.高性能計算的意義(16)高性能計算在我國的戰(zhàn)略地位(3)—國產(chǎn)高性能計算平臺神威-I銀河-II曙光-5000聯(lián)想-68002023/5/18282.高性能計算的發(fā)展與現(xiàn)狀(1)2.1高性能計算機的發(fā)展2.2高性能計算機的現(xiàn)狀2.3高性能計算面臨的主要問題2023/5/18292.高性能計算的發(fā)展與現(xiàn)狀(2)2.1高性能計算機的發(fā)展歷史回顧2023/5/18302.高性能計算的發(fā)展與現(xiàn)狀(3)發(fā)展過程中的主流技術(shù)607080900010巨型機萌芽CDC6600向量機鼎盛CRAY-1,SX-3MPP發(fā)展CrayT3E,OptionRed機群發(fā)展NOW,IBMSP2,ASCIQ定制機器ESBlueGene2023/5/18312.高性能計算的發(fā)展與現(xiàn)狀(4)兩類構(gòu)造高性能計算機的方式采用定制部件價格較高(小于1B$市場)對大規(guī)?;蛲ㄐ琶芗娜蝿?wù)進行了優(yōu)化設(shè)計并行向量機采用商用部件利用每年80B$的市場優(yōu)勢對一些計算密集任務(wù)有很好的性能MPP/機群2023/5/18322.高性能計算的發(fā)展與現(xiàn)狀(5)并行向量機構(gòu)造方式PVP采用全定制部件定制的高性能向量處理器(Gflops)節(jié)點內(nèi)多體交叉共享存儲(GB)定制的高帶寬低延遲互連(交叉開關(guān))2023/5/18332.高性能計算的發(fā)展與現(xiàn)狀(6)機群構(gòu)造方式機群是一組獨立的計算機(節(jié)點)的集合體:機群的各節(jié)點都是一個完整的系統(tǒng):工作站,PC機或SMP互連通常使用高速互連網(wǎng)絡(luò),如Myrinet、Infiniband等各節(jié)點可以協(xié)同工作并表現(xiàn)為一個單一的、集中的計算資源CPUMemoryI/OChannel...CPUMemoryI/OChannelCPUMemoryI/OChannelCPUMemoryI/OChannelCPUMemoryI/OChannelSystemAreaNetwork&StorageAreaNetwork2023/5/18342.高性能計算的發(fā)展與現(xiàn)狀(7)2006年TOP500預(yù)測:達到Petascale2023/5/18352.高性能計算的發(fā)展與現(xiàn)狀(8)2.2高性能計算機的現(xiàn)狀從Top500看高性能計算機現(xiàn)狀(2009年)最快的高性能計算機:最普遍的高性能計算機:機群(410臺)安裝高性能計算機最多的國家:美國(291臺),亞洲(49臺,日本15臺,中國21臺,印度6臺),歐洲(145臺)生產(chǎn)高性能計算機的企業(yè):HP(212臺),IBM(188臺)高性能計算機中使用最多的微處理器:Intel系列(399臺),IBM(55臺),AMD(43臺)高性能計算機使用最廣泛的領(lǐng)域:企業(yè)與研究結(jié)構(gòu)進入500強的最低性能:,半年前為500強的總性能為:,半年前為2023/5/18362.高性能計算的發(fā)展與現(xiàn)狀(9)2.2高性能計算機的現(xiàn)狀從Top500看高性能計算機現(xiàn)狀(2013年)最快的高性能計算機:,前十名中:美國5臺,中國2臺,德國2臺,日本1臺;已經(jīng)有26套系統(tǒng)的最大性能邁入了PFlops(每秒千萬億次)級別;中國上榜超算66套,之前兩次分別為72套、68套,基本保持穩(wěn)定,而且始終僅次于美國位列世界第二(日本30套/-2)。有了天河2,中國不但在數(shù)量上,性能上也超越日本,成為世界第二。Intel處理器還是絕對主流,份額高達%。88%的系統(tǒng)所用處理器擁有六個或更多核心,67%的不少于八核心。500套系統(tǒng)總性能223PFlops,比半年前的162PFlops增長了%,比一年前的123PFlops則增長了%。天河2一套就占了總性能的%,幾乎五分之一!美國252套占了一半還多,比上次有多了2套。歐洲112套,比上次增加7套,還是不如亞洲119套(少了4套)。英國、法國、德國分別有29、23、19套。2023/5/18372.高性能計算的發(fā)展與現(xiàn)狀(10)近幾年來Top1機器2001年,為IBMASCIWHITE,LINPACK峰值為12TFLOPS,處理器數(shù)目為8192。2002年—2004年上半年,為NECEarth-Simulator,LINPACK峰值為40TFLOPS,處理器數(shù)目為5120。2004年下半年—2007年11月,為IBMBlueGene,LINPACK峰值為478TFLOPS,處理器數(shù)目為212992。2008年6月,Top1為IBMRoadrunner(走鵑),LINPACK峰值為,處理器核數(shù)目為122400。2009年6月,Top1為IBMRoadrunner(走鵑),LINPACK峰值為,處理器核數(shù)目為129600。2023/5/18382023/5/18392.高性能計算的發(fā)展與現(xiàn)狀(New)天河2號2023/5/18402.高性能計算的發(fā)展與現(xiàn)狀(New)天河2號2023/5/18412.高性能計算的發(fā)展與現(xiàn)狀(New)天河2號2023/5/18422.高性能計算的發(fā)展與現(xiàn)狀(11)IBMRoadrunner走鵑(1)2023/5/18432.高性能計算的發(fā)展與現(xiàn)狀(12)IBMRoadrunner(2)基本參數(shù)(2008年6月)6,480AMDOpteron處理器,51.8TB內(nèi)存(in3,240LS21刀片)12,960IBMCell處理器,51.8TB內(nèi)存(in6,480QS22刀片)216Systemx3755I/O節(jié)點

26288-portISR2012Infiniband4xDDRswitches296機架

2.35MWpower2023/5/18442.高性能計算的發(fā)展與現(xiàn)狀(13)IBMRoadrunner(3)混合(Hybrid)設(shè)計(2008年6月)通用處理器+專用處理器采用兩種不同架構(gòu)的處理器:1.8GAMDOpteron雙核處理器(X86架構(gòu))6912個處理器(6480個用于計算節(jié)點,432個用于系統(tǒng)操作和通信節(jié)點)共13824個cores(12960+864)3.2GIBMPowerXCell8i異構(gòu)多核處理器數(shù)學(xué)運算比Opteron快30倍1個通用核(PowerProcessingElement

:PPE),8個專用核(SynergisticProcessingElement:SPE)(共有9個處理器核)12960個PPEcores和103680個SPEcores共116640個cores(12960+103680)系統(tǒng)共有130464個cores(13824+116640)2023/5/18452.高性能計算的發(fā)展與現(xiàn)狀(14)IBMRoadrunner(4)刀片式機群架構(gòu)(2008年6月)每個Triblade包含4個刀片,一個LS21Opteron刀片,一個擴展連接刀片,兩個QS22Cell刀片。LS21包含2個1.8GHz雙核Opterons,16GB內(nèi)存。QS22包含2個3.2GHz

PowerXCell8i處理器,8GB內(nèi)存。2023/5/18462.高性能計算的發(fā)展與現(xiàn)狀(15)IBMRoadrunner(5)一個Triblade包含4個刀片一個BladeCenterH框包含3個Triblade一個機架(rack)包含4個BladeCenterH一個連接單元CU(ConnectedUnit)包含15個機架Roadbunner包含18個CU,通過兩級Infiniband互連2023/5/18472.高性能計算的發(fā)展與現(xiàn)狀(16)ASCIBlueGene/L設(shè)計特點采用專門的System-on-a-chip技術(shù)減少功耗、體積、復(fù)雜度和設(shè)計難度實現(xiàn)低延遲、高帶寬存儲系統(tǒng)MPP結(jié)構(gòu)可擴展到

~100k處理器采用三種互連網(wǎng)絡(luò):Gbit以太網(wǎng)用于節(jié)點內(nèi)部3DTorus用于節(jié)點間樹用于多播通信2023/5/18482.高性能計算的發(fā)展與現(xiàn)狀(17)ASCIBlueGene/L構(gòu)造圖BlueGene/LComputeASIC

2023/5/18492.高性能計算的發(fā)展與現(xiàn)狀(18)最快的并行向量計算機—ES體系結(jié)構(gòu):并行向量機峰值速度/存儲器:40Tflops/10TB節(jié)點數(shù)/處理器數(shù)/處理器峰值:640/5120/8Gflops占地:六個籃球場大3層建筑安裝時間:2002年2月主要用途:全球氣候變化預(yù)測、地震預(yù)報、原子能等2023/5/18502.高性能計算的發(fā)展與現(xiàn)狀(19)TOP500中的機群機群系統(tǒng)在高性能計算機中所占比例迅速增加TOP500中目前有400個機群系統(tǒng)TOP500中最普通的并行機體系結(jié)構(gòu)導(dǎo)致了高性能計算機的“平民化”2023/5/18512.高性能計算的發(fā)展與現(xiàn)狀(20)中國的高端高性能機群2008年11月,第32屆HPCTop500榜曙光5000A排名第10,LINPACK峰值TFLOPS聯(lián)想DeepComp7000排名第19,LINPACK峰值2009年06月,第33屆HPCTop500榜曙光5000A排名第15,LINPACK峰值聯(lián)想DeepComp7000排名第31,LINPACK峰值2023/5/18522.高性能計算的發(fā)展與現(xiàn)狀(21)中國的高端高性能機群—曙光5000機群特點(三高一低)高性能—超高運算速度,230Tflops高效能—超高系統(tǒng)效率,大于70%高密度—單節(jié)點4路16核刀片低功耗—230萬億次峰值功率700KW2023/5/18532.高性能計算的發(fā)展與現(xiàn)狀(22)中國的個人高性能計算機—基于龍芯2號國產(chǎn)萬億次高性能計算機KD-50-I基本參數(shù)計算單元:336個主頻750MHz的龍芯2F,總的峰值計算速度1.008TFlops服務(wù)節(jié)點:2個Opteron雙核處理器,主頻2.2GHz內(nèi)存容量:每計算單元內(nèi)存1GB,服務(wù)節(jié)點內(nèi)存8GB,共344GB磁盤容量:876GB系統(tǒng)互聯(lián)網(wǎng)絡(luò):千兆以太網(wǎng)特點(三低一高)低功耗—

整機功耗小于6KW低占地面積—

占地平方米,高度米低成本—

整機成本不超過80萬高計算性能—

峰值性能達1TFlops以上2023/5/18542.高性能計算的發(fā)展與現(xiàn)狀(23)從Top500看高性能計算機的趨勢(1)關(guān)于計算機結(jié)構(gòu):機群系統(tǒng)仍將是高性能計算機最常用的結(jié)構(gòu)MPP仍然是一個重要結(jié)構(gòu),尤其是作為PFlops超級計算機的主要結(jié)構(gòu)PVP是另一種獲得超高性能的重要結(jié)構(gòu),但不是主流2023/5/18552.高性能計算的發(fā)展與現(xiàn)狀(24)從Top500看高性能計算的趨勢(2)關(guān)于微處理器:主要是采用CMOS工藝的商用微處理器多核處理器占統(tǒng)治地位Intel處理器家族仍將是高性能計算機中占統(tǒng)治地位的處理器基于RISC的IBMPower體系也會有一席之地AMD有一定地位(HyperTransport加快了處理器間的通信速度,簡化了一致性協(xié)議的實現(xiàn))專用的處理器仍然存在,但逐漸減少適用于最高端系統(tǒng)(Roadrunner)向量處理器片上系統(tǒng)2023/5/18562.高性能計算的發(fā)展與現(xiàn)狀(25)2.3高性能計算面臨的主要問題Memorywall:存儲器訪問能力與處理部件計算能力的不平衡處理器速度每年提高59%,高性能計算速度提高更快。存儲器速度每年提高7%。處理器性能與數(shù)據(jù)訪問帶寬和延遲之間的差距越來越大。必須從系統(tǒng)存儲體系結(jié)構(gòu)上創(chuàng)新,改進時延機制,以提供更高的帶寬和更低的延遲。目前對三類超級計算機(定制、混合與商業(yè))的主要區(qū)別在于針對不同的存儲訪問模式所能提供的有效本地和全局存儲訪問帶寬。2023/5/18572.高性能計算的發(fā)展與現(xiàn)狀(26)Programmingwall:系統(tǒng)規(guī)模增大到10萬個以上處理器,系統(tǒng)結(jié)構(gòu)復(fù)雜(數(shù)據(jù)共享與消息通信模式交織),為超級計算機編寫高效健壯程序越來越復(fù)雜,越來越困難。高性能機器上的程序設(shè)計語言、庫和應(yīng)用開發(fā)環(huán)境的進展比廣泛應(yīng)用的工業(yè)軟件差很多沒有廣泛應(yīng)用的并行程序設(shè)計模型軟件的研制周期大于硬件的研制周期高端計算的真正危機在于軟件2023/5/18582.高性能計算的發(fā)展與現(xiàn)狀(27)Powerwall:單個芯片的功耗急劇升高,導(dǎo)致整個系統(tǒng)的總功耗越來越高占地均在數(shù)百~數(shù)千平方米,功耗在數(shù)兆瓦綜合成本急劇增加,高達數(shù)億美元如ASCI系統(tǒng)和ES系統(tǒng)峰值(Tflops)占地(m2)功耗(KW)Glops/m2Glops/KW時間BlueGene/L36723015001595652452005ASCI.Purple77.826247800124.729.972005RedStorm43.52791700155.9125.592005Earth-Simulator403060800013.0752002ASCI.Q301858710016.144.2320042023/5/18592.高性能計算的發(fā)展與現(xiàn)狀(28)功耗-工業(yè)界普遍關(guān)注的問題“HidinginPlainSight,GoogleSeeksMorePower”,byJohnMarkoff,June14,2006NewGooglePlantinTheDulles,Oregon,fromNYT,June14,2006Google策略在靠近河邊的平原上建立機房水力發(fā)電全世界共有>500,000臺服務(wù)器2023/5/18603.高性能計算的典型應(yīng)用(1)3.1高性能計算的應(yīng)用領(lǐng)域3.2高性能計算的代表應(yīng)用實例3.2.1國產(chǎn)并行計算機在淮河流域防洪防污中的應(yīng)用

3.2.2高性能計算在石油與天然氣中的應(yīng)用

3.2.3高性能計算在數(shù)字化大橋中的應(yīng)用

2023/5/18613.高性能計算的典型應(yīng)用(2)3.1高性能計算的應(yīng)用領(lǐng)域氣候能量的燃燒、熔化和裂變技術(shù)(軍事國防)生物社會經(jīng)濟發(fā)展天體物理學(xué)數(shù)學(xué)能源及材料……“E3”報告62(WeatherModelingandForecasting)

考慮3000*3000平方公里的范圍,垂直方向的考慮高度為11公里。將3000*3000*11立方公里的區(qū)域分成立方公里的小區(qū)域,則將近有1011個不同的小區(qū)域。另外還需考慮時間因素,將時間參數(shù)量化。假定考慮48小時天氣預(yù)報。

天氣預(yù)報63每一小區(qū)域的計算包括參數(shù)的初始化及與其它區(qū)域的數(shù)據(jù)交換。若每一小區(qū)域計算的操作指令為100條,則整個范圍一次計算的指令為1011*100=1013,兩天的計算次數(shù)將近100次,因此,指令總數(shù)為1015條。用一臺10億次/秒(PIII500)計算,將大約需要280小時。若我們用100個10億次/秒的處理器構(gòu)成一臺并行處理機,每個處理器計算的區(qū)域為109個,不同的處理器通過通信來傳輸參數(shù),若個處理器的計算能力得到充分利用,則整個問題的計算時間不超過3小時。說明兩點(1)并行計算機可以解決原先不能解決的問題;(2)可進行更準(zhǔn)確的天氣預(yù)報。64要開采石油,必須鉆井。據(jù)說打這樣一口井,花費是非常高的,差不多要幾百萬甚至上千萬,如果選擇的鉆井地點有偏差,那么投入的人力、財力、物力就會全部浪費,損失巨大。因此提前的精確測算就顯得格外重要。石油勘探靠什么呢?現(xiàn)在據(jù)我門所知還在依靠人工地震,就是在認為可能的地方進行人工爆破,然后搜集爆破后的反應(yīng),記錄它的反射弧,再把這些數(shù)據(jù)送到計算機上進行處理,地質(zhì)專家再根據(jù)得出的結(jié)論分析石油的分布,爭取打下去就有石油開采出來。石油部門是我國最早應(yīng)用計算機的部門。石油勘探2023/5/18653.高性能計算的典型應(yīng)用(3)高性能計算的應(yīng)用領(lǐng)域(1)從傳統(tǒng)應(yīng)用到新興應(yīng)用歷史上,物理和工程科學(xué)是計算和計算機科學(xué)應(yīng)用驅(qū)動者?,F(xiàn)今,像生物科學(xué)(從基于實驗發(fā)展為基于計算、從個體研究發(fā)展為跨學(xué)科研究、從注意數(shù)值技術(shù)發(fā)展為生物醫(yī)學(xué)計算方法等)等是計算和計算機科學(xué)的受益者。將來,社會科學(xué)和人文科學(xué)則是計算和計算機科學(xué)的主要消費者。2023/5/18663.高性能計算的典型應(yīng)用(4)高性能計算的應(yīng)用領(lǐng)域(2)傳統(tǒng)的科學(xué)與工程計算科學(xué)工程計算的共性:在過去20年,計算物理是應(yīng)用的主要驅(qū)動力,這類應(yīng)用具有如下共同特點:應(yīng)用程序常常由定義在R3×t子空間的一組PDE所描述。多物理模擬的不同物理區(qū)域的計算方法各不相同。很多應(yīng)用均主要集中在大學(xué)和研究所。研究側(cè)重點離散化PDE及其相應(yīng)的線性/非線性方程的求解。強調(diào)并行機的速度和問題求解精度。很少關(guān)心相關(guān)的I/O操作。并行化方法與編程模型并行化方法:最常使用區(qū)域分解法。編程模型:最常使用數(shù)據(jù)并行。2023/5/18673.高性能計算的典型應(yīng)用(5)高性能計算的應(yīng)用領(lǐng)域(3)與社會相關(guān)的新興應(yīng)用新應(yīng)用的共性:最近幾年,與社會相關(guān)的應(yīng)用急劇增加與傳統(tǒng)的計算應(yīng)用分享市場空間,其共性是:應(yīng)用問題常常由圖來定義,而不是離散的R3空間。計算過程中的交互常是全局性的,而不是通過邊界來交換信息的。新出現(xiàn)的應(yīng)用,無相應(yīng)的使用經(jīng)驗和成熟的軟件。很多應(yīng)用常集中在與社會相關(guān)的國計民生方面。研究側(cè)重點建立誠信機制:包括硬件、軟件、人機界面、安全協(xié)議的使用等。巨量的數(shù)據(jù),而不是科學(xué)計算,將是此類應(yīng)用的主要處理對象,I/O是最為關(guān)心的。數(shù)據(jù)的安全、屬主、管理等帶來一系列技術(shù)、法律和人道等問題。2023/5/18683.高性能計算的典型應(yīng)用(6)高性能計算的應(yīng)用領(lǐng)域(4)應(yīng)用實例社會科學(xué)社會經(jīng)濟學(xué):利用宏觀經(jīng)濟理論和計算經(jīng)濟學(xué)(行為方程)來模擬經(jīng)濟活動,施行動態(tài)調(diào)整平衡,預(yù)測貨幣政策變化所帶來的經(jīng)濟含義,修正改變金融政策來防止經(jīng)濟動蕩。社會行為科學(xué):當(dāng)社會和行為科學(xué)家面臨巨大的數(shù)據(jù)需要理解和保護這些數(shù)據(jù)時,社會科學(xué)家和計算科學(xué)家加強合作是最有利的;社會科學(xué)家可幫助計算科學(xué)家理解在社會生態(tài)系統(tǒng)中怎樣運用計算機科學(xué);行為科學(xué)家也能幫助計算機科學(xué)家開發(fā)良好的人機交互模型;心理學(xué)家和語言學(xué)家同計算機科學(xué)家合作,能聯(lián)合開發(fā)易于理解、使用和語言翻譯的計算機程序,等等。主體經(jīng)濟學(xué):通過相互作用主體(包括個體、社會群體、機構(gòu)、生物實體、物質(zhì)實體等)動態(tài)系統(tǒng)建模來研究經(jīng)濟現(xiàn)象和規(guī)律,以達到理解以往的經(jīng)驗和規(guī)范作用,定量分析和發(fā)展理論以及改進方法等之目的。2023/5/18693.高性能計算的典型應(yīng)用(7)高性能計算的應(yīng)用領(lǐng)域(5)應(yīng)用實例物理科學(xué)挖掘資料發(fā)現(xiàn)新星球(褐矮星):美國國家虛擬觀測站的計算機科學(xué)家用計算機搜索(約2分鐘)兩個天文數(shù)據(jù)庫中數(shù)百萬天體的資料時發(fā)現(xiàn)了它,它是研究人員在演示軟件的可行性時無意發(fā)現(xiàn)的,是天文界驚人的精確發(fā)現(xiàn)。超新星建模:伽利略觀察巨大星球爆炸500年后,人們對超新星(比太陽至少大10倍)中心坍塌的爆炸機制仍不清楚。最近許多物理學(xué)家和計算科學(xué)家用一維、二維、三維程序來模擬此現(xiàn)象,有可能提高對此現(xiàn)象的認識和增加對宇宙特性的理解。暗物質(zhì)與暗能量:最近宇宙科學(xué)家發(fā)現(xiàn)宇宙在加速膨脹,這與愛因斯坦廣義相對論理論物質(zhì)行為相反,宇宙科學(xué)家猜想,除暗物質(zhì)外,宇宙也可能包含暗能量,此能量將引力作為排斥力,從而導(dǎo)致加速膨脹,美國芝加哥大學(xué)天文學(xué)家用擴展版FLASH程序模擬了宇宙的能力。2023/5/18703.高性能計算的典型應(yīng)用(8)高性能計算的應(yīng)用領(lǐng)域(6)應(yīng)用實例工程與制造微氣泡和船舶降阻:很久以來,研究人員已經(jīng)知道其體積約在50~500微米之間的微氣泡,在一些情形下可減少船舶80%的阻力、減少燃料消耗、增加航程。但是人們還不能確定最佳微氣泡系統(tǒng)的特性,該在哪里加入、加入多少和加入多大的氣泡。美國布朗大學(xué)通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論