高性能計算機技術(shù)展望-中國力學(xué)學(xué)會_第1頁
高性能計算機技術(shù)展望-中國力學(xué)學(xué)會_第2頁
高性能計算機技術(shù)展望-中國力學(xué)學(xué)會_第3頁
高性能計算機技術(shù)展望-中國力學(xué)學(xué)會_第4頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、高效能計算機技術(shù)展望桂亞東上海超級計算中心上海201203ydgui摘要本文是有關(guān)高效能計算機技術(shù)和發(fā)展趨勢的綜述性文章。通過分析科學(xué)和工程領(lǐng)域越來越旺盛的需求,介紹國內(nèi)外高效能計算機研制的狀況;通過剖析多核處理器產(chǎn)生的背景和性能提升的原因,分析多核處理器對高效能計算機的影響;通過解讀高效能計算機的四個要素,指出高效能計算機面臨的多種挑戰(zhàn),歸納了部分解決的思路。關(guān)鍵詞: 高效能計算機多核處理器高性能可編程性可移植性魯棒性幾十年來,我們一直用高性能計算機這個詞來概括運算速度高的一類計算機,用Linpack 來評價機器的效率。這只是考慮了運算性能一個方面。這幾年出現(xiàn)的一個新詞高效能計算機(High

2、 Productivity Computing System)則概括了高性能、可編程性、程序可移植性與魯棒性 4 個基本要素,即在追求高的運算速度的前提下,強調(diào)系統(tǒng)的程序開發(fā)、部署和移植的方便性,強調(diào)系統(tǒng)的健壯程度和容錯能力,強調(diào)用戶能感受到的系統(tǒng)運行的整體效率。本文使用高效能計算機一詞,以與國家863 十一五重大項目“高效能計算機及網(wǎng)格服務(wù)環(huán)境”相呼應(yīng)。一、對高效能計算機的需求越來越旺盛科學(xué)和工程領(lǐng)域?qū)Ω咝苡嬎阌罒o休止的需求是驅(qū)動高效能計算機發(fā)展的動力。從能源方面看,如何解決能源問題是全球各國非常關(guān)注的問題,尤其是高效能計算機有可能幫助社會解決一些問題。比如等離子物理學(xué)里面的核聚變研究,高

3、效能計算機的作用是在電站的發(fā)電設(shè)備建造之前對反應(yīng)過程進行大規(guī)模的模擬,是未來利用核聚變能量的關(guān)鍵,綜合計算機能力將增長100010000倍,既需要1100Pflops的計算機。在生存環(huán)境方面,跟大眾日常生活相關(guān)的有氣候模擬。高效能計算機可以模擬整個地球生存環(huán)境,來預(yù)測未來人類生存的環(huán)境。有的科學(xué)家對地球環(huán)境比較悲觀,因為人類的發(fā)展使得我們的生存環(huán)境越來越惡劣。一百年或者更長的時間地球的環(huán)境會怎樣,能不能對它進行模擬,這是千萬億次計算機發(fā)揮作用的地方。未來510 年,有效的模擬計算能力需要增長1001000倍;對計算能力增長的最終需求至少為當前的10 億倍。在交通運輸方面,高效能計算解決的主要問

4、題包括安全性、噪音、振動、粗糙度、耐久性、氣流和熱傳輸。這些問題需要幾小時到幾周的時間解決,至少需要在今天的計算能力的基礎(chǔ)上提高7 個數(shù)量級,也就是1000Exaflops。對地震的計算模擬結(jié)果表明,人類有望預(yù)測地震的發(fā)生,從而減輕地震帶來的危險,未來處理地震數(shù)據(jù)所需的計算資源大約為1000Pflops 。在人類認知方面,比如天體物理學(xué),利用高效能計算機進行模擬是研究天體物理的基本手段。傳統(tǒng)上,該領(lǐng)域中的受控實驗非常少,甚至不太可能有受控實驗,但計算機模擬可以使受控實驗成為可能。幾百年、幾千年或者更長時間的天體演變可以通過計算機來對進行模擬,這樣就節(jié)省了大量的時間。未來這一領(lǐng)域需要110Pfl

5、ops的計算能力。目前,1這樣的能力可以應(yīng)用于銀河系形成的模擬、行星形成的模擬等。更為重要的應(yīng)用領(lǐng)域是國家安全。國家安全是各國政府密切關(guān)注的,首先是核模擬和核武庫管理,核模擬過程已經(jīng)從二維模型和解決方案向三維模型和解決方案演變,需要計算資源增長1000 倍以上。信號情報方面計算機主要有兩個用途,情報處理和情報分析,該領(lǐng)域?qū)τ嬎隳芰Φ男枨笫菬o止境的,計算機速度越快越好。計算模擬在工業(yè)中的應(yīng)用隨處可見, 它在材料設(shè)計、 制造和生產(chǎn)過程中起到一個實質(zhì)性作用, 為了確保產(chǎn)品的可靠性、質(zhì)量和節(jié)約成本,計算模擬被越來越多地用來取代實物試驗。隨著各種計算方法的成熟,例如多尺度方法的應(yīng)用,工業(yè)界在提高產(chǎn)品性能

6、方面更多地依賴于計算模擬技術(shù)的應(yīng)用。工業(yè)領(lǐng)域?qū)τ嬎銠C速度的需求是永無止境。二、高效能計算機的發(fā)展狀況表 1列出了 2006 年 11 月世界上最快的 5 臺高效能計算機。(8 月開會時將替換為新的)表 12006 年 11 月 TOP5 超級計算機排名安裝地點 / 時間系統(tǒng)名稱 / 處理器數(shù)量 / 制造商實測性能( GF)峰值性能( GF)勞倫斯利弗莫爾國家實驗室藍色基因 /L2806001eServer Blue Gene Solution/131072美國 /2005 年367000IBM 公司紅色風(fēng)暴(新)2圣地亞國家實驗室Sandia/ Cray Red Storm, Opteron2

7、.4101400美國 /2006 年GHz dual core/26544127411Cray 公司IBM 華生研究中心BGW912903eServer Blue Gene Solution/40960美國 /2006 年114688IBM 公司勞倫斯利弗莫爾國家實驗室ASC紫色757604美國 /2006 年eServer pSeries p5 575 1.9 GHz/12208IBM 公司92781MareNostrum5巴塞羅那超級計算中心BladeCenter JS21 Cluster, PPC 970,62630西班牙 /20062.3 GHz, Myrinet/1024094208

8、IBM 公司高效能計算機發(fā)展的速度可以這樣來描述,每半年發(fā)布的TOP500 有 40 左右(有時50 )在半年后會被淘汰出局。當前美日等發(fā)達國家爭相研制千萬億次高效能計算機。世界上第一臺專用千萬億次計算機已經(jīng)于2006 年 6 月出現(xiàn),由日本理化所、日本SGI 、美國 Intel 公司共同研發(fā),這臺MDGRAPE-3系統(tǒng)主要為天文模擬以及分子動力學(xué)模擬提供高精度N-體計算。它是基于通用服務(wù)器的機群結(jié)構(gòu),201 個運算結(jié)點, 每個結(jié)點帶有24 個為分子動力學(xué)開發(fā)的專用芯片。由于其專用機身份,無法運行Linpack 基準測試程序,因而無法進入TOP500 行列。IBM 公司從1999 年開始實施藍

9、色基因(BlueGene )計劃,旨在研發(fā)千萬億次計算機2解決生命科學(xué)中的分子模擬問題。藍色基因 /L 系統(tǒng)自 2004 年 11 月開始已經(jīng)在TOP500 中連續(xù) 3 年占據(jù)榜首位置,目前峰值性能367 萬億次,持續(xù)性能280 萬億次。根據(jù)該計劃,藍色基因 /P 系統(tǒng)的峰值 /持續(xù)性能為1Pflops/0.3Pflops, 2007 年推出。藍色基因/Q 系統(tǒng)峰值/ 持續(xù)性能為 3Pflops/1Pflops , 2008 年推出。美國國防部的HPCS 計劃從 2003 年開始資助 IBM 、Cray 、 SUN 公司進行千萬億次計算機的研制,投資7.25 億美元。該項目經(jīng)歷了關(guān)鍵技術(shù)和原型

10、系統(tǒng)兩個階段后,已經(jīng)進入最后階段 2010 年前完成兩臺千萬億次高生產(chǎn)率計算機系統(tǒng)的研發(fā)。IBMPERCS 系統(tǒng)和 Cray 的 Cascade 系統(tǒng)分別獲得2.5億美元和2.44 億美元資助,用以研制可擴展至Pflops 的超級計算機,并形成產(chǎn)品。IBM PERCS系統(tǒng)基于 Power7微處理器、 AIX 操作系統(tǒng)、通用并行文件系統(tǒng)(GPFS) 、IBM 并行計算環(huán)境及互聯(lián)和存儲子系統(tǒng)進行開發(fā)。在該系統(tǒng)中IBM 同時計劃開發(fā)高效用軟件和開發(fā)工具,以提高開發(fā)人員的生產(chǎn)率。Cray Cascade 系統(tǒng)本質(zhì)上是一個能在單系統(tǒng)中提供包括標量、FPGA和混合矢量 /超級多線程 (MMT) 處理器板卡

11、的機箱內(nèi)集群(cluster-in-a-box)。在該系統(tǒng)中, Cray將設(shè)計一款基于其 XD1 系統(tǒng)的 FPGA 加速板卡。Cascade 系統(tǒng)將開發(fā)編譯器軟件以處理多種涉及標量、矢量或 MMT 應(yīng)用的混合任務(wù)。在未來四年中,Cray 將基于 Cascade 系統(tǒng)研發(fā)商品化的千萬億次超級計算機, 如為美國國家橡樹嶺實驗室( )開發(fā)代號為“ Baker ”的超級計算機系統(tǒng)?!?Baker ”超級計算機預(yù)計采用四路雙核AMDOpteron處理器( 24000 個處理器),基于 Cray專用 SeaStar 3D互連網(wǎng)絡(luò)實現(xiàn)和AMD HyperTransport總線互聯(lián)。美國能源部已經(jīng)選定 IBM

12、公司設(shè)計并建造基于Cell 處理器的超級計算機。該系統(tǒng)將采用新的、高度復(fù)雜的軟件, 來管理超過 16000個 AMD Opteron處理器和超過16000 個 CellBE 處理器,從而能夠有效地解決當今計算領(lǐng)域最具挑戰(zhàn)性的問題。該機將擁有1.6Pflops的峰值性能,持續(xù)速度能夠達到1Pflops以上。占地面積僅為12000 平方英尺(約三個籃球場大?。?,預(yù)計2008 年完成。目前,日本已有五個千萬億次超級計算機研發(fā)計劃:除了已經(jīng)完成的MDGRAPE-3計劃外,另有 GRAPE-DR 計劃, 2008年完成。文部省的MEXT 計劃以 1000億日元支持NEC 、日立、東京大學(xué)等研發(fā)10 Pf

13、lops的系統(tǒng), 2011 年完成。富士通公司投入500 億日元研發(fā)一臺 3 Pflops 的系統(tǒng), 該系統(tǒng)以更少更強的處理器來構(gòu)建,2010年完成。 每塊處理芯片上具有個處理器, 達到 100Gflops的性能。升級后的地球模擬器將達到16 Pflops 的指標。該系統(tǒng)將采用兩種計算模式,粗略計算和精確計算,以實現(xiàn)更高的并行計算效率。法國 Bull 公司也計劃在 2013 年開發(fā)出千萬億次超級計算機系統(tǒng),用于一項法國軍事項目。我國在這方面的投入和產(chǎn)生的效果也非常明顯。從五年前我國在這個領(lǐng)域默默無聞,到現(xiàn)在已經(jīng)排名到世界前五名。863 計劃信息技術(shù)領(lǐng)域圍繞國家重大工程、重大行業(yè)應(yīng)用和經(jīng)濟發(fā)展迫

14、切需求,設(shè)立了 “高效能計算機及網(wǎng)絡(luò)服務(wù)環(huán)境”重大項目,這也就使我國進入千萬億次機研究行列。 擬在 2008年 6 月完成兩臺用于科學(xué)工程計算、網(wǎng)絡(luò)信息服務(wù)和數(shù)據(jù)庫應(yīng)用的 100 Tflops高效能計算機系統(tǒng), 并在 2010年最終實現(xiàn)中國的1Pflops高效能計算機系統(tǒng)。三、多核 CPU 對高效能計算機產(chǎn)生重大影響1. CPU 進入多核時代CPU 一直以摩爾定律的速度在發(fā)展,正是CPU 速度的不斷提高帶來計算機性能的持續(xù)飛躍。在集成電路工藝進步的前提下, CPU 性能提高的途徑主要是依靠頻率的提高和系統(tǒng)結(jié)構(gòu)的創(chuàng)新。31971 年第一款 CPU Intel 4004 問世時,晶體管數(shù)只有 23

15、00 個,頻率 108KHz 。今天,一款 4 核處理器 Intel Core 2 達到 8.2 億晶體管,頻率最高的 CPU 達到 4GHz 。但是頻率的繼續(xù)提高遇到了難以克服的功耗問題,于是轉(zhuǎn)向多核處理器的開發(fā)。多核處理器將成為今后CPU 的主流。從目前所能看到的,摩爾定律直到2020 年仍將是有效的。為什么多核處理器在降低頻率、不增加功耗的前提下還能提升性能呢?由于頻率降低能明顯的降低功耗,而對性能的影響有限,從表2 可以看出,當頻率降低20 并采用雙核時,功耗基本不變,性能卻能提升73 。表 2CPU 頻率、性能、功耗三者的關(guān)系頻率功耗性能以單核 CPU 為基準111頻率提升20 1.

16、21.731.13頻率降低20 0.80.510.87頻率降低20 雙核0.81.021.73當前多核處理器分為兩種,一種是同構(gòu)多核處理器,在一個芯片中集成了多個相同的處理器核,面向通用應(yīng)用。這類多核處理器繼2006 年雙核之后, 2007 年以 4 核處理器為主流。另一種是異構(gòu)多核處理器,一個通用主核和若干異構(gòu)從核集成起來,面向一定的應(yīng)用領(lǐng)域,較之專用處理器有寬泛的應(yīng)用范圍。例如,Cell 處理器是由IBM 、東芝、索尼三家共同開發(fā)的新一代處理器產(chǎn)品,結(jié)合1 個 IBM 64 位 PowerPC微處理器核心與8 個協(xié)同運算處理器( SPE )所構(gòu)成,具備強大的浮點數(shù)運算性能,應(yīng)用于PS3 游

17、戲機、醫(yī)學(xué)影像處理、 3D 電腦圖形、影音多媒體與科學(xué)運算等領(lǐng)域。目前,IBM 正在建造基于Cell 處理器和 AMDOpteron處理器的千萬億次計算機。按照其產(chǎn)品規(guī)劃,2007 年達到 16 核, 2009年 32 核, 2011 年 64 核, 2013 年 128 核。多核的最新成果是 06 年 9 月 Intel 公司發(fā)布的 80 核處理器,耗電僅 62 瓦。這款處理器不僅運算速度達到 1Tflops ,而且訪存帶寬達到 1TB/s ,加上 1Tb/s 的光互連帶寬,真正的桌面式萬億次機將成為幾年后垂手可得的產(chǎn)品。與此同時,06 年底專用多核處理器達到512 核,這是 Alchip

18、技術(shù)公司為日本正在研制中的2Pflops GRAPE-DR專用機研制的芯片。2. 多核 CPU 對高效能計算機的影響多核 CPU 對高效能計算機總體的影響應(yīng)該是積極的,有助于以較低的功耗和較少的芯片構(gòu)建更高效能的系統(tǒng)。但是在系統(tǒng)結(jié)構(gòu)和系統(tǒng)軟件方面,目前還有許多事情沒有跟上多核的出現(xiàn)。多核對系統(tǒng)結(jié)構(gòu)的影響多核增加了系統(tǒng)結(jié)構(gòu)的層次。 過去的層次是 CPU 芯片運算結(jié)點系統(tǒng), 現(xiàn)在是 CPU 核 CPU 芯片運算結(jié)點系統(tǒng),造成核間通信在芯片內(nèi)與芯片間是不相等的。其次由于多核芯片目前有真多核和假多核之說,主要是指除了運算核以外的其他資源(如二級Cache )是否真正共享。 這些結(jié)構(gòu)上的不同雖然應(yīng)用層都

19、看不見,但直接和間接的影響著性能。多核的出現(xiàn)鼓勵高效能計算機研發(fā)人員要在系統(tǒng)結(jié)構(gòu)方面大膽創(chuàng)新。多核帶動多線程開發(fā)2007 年是多核普及的年代。多核對應(yīng)用的影響成為最為關(guān)注的一個焦點。多核普及時代的影響主要體現(xiàn)在兩個方面:一方面,多核處理器對多線程軟件開發(fā)帶來一個大的機遇與挑戰(zhàn),只有多線程的軟件與多核處理器硬件配合,才能為用戶提供更好的應(yīng)用環(huán)境。另一方面,多核普及將使用戶使用電腦的方式發(fā)生改變,同時運行多種應(yīng)用將成為現(xiàn)實。4四、高效能計算機面臨的挑戰(zhàn)構(gòu)建千萬億次高效能計算機,要把現(xiàn)在 PC 的運算速度提高 100 萬倍。首先是功耗、研制和運行成本能否承擔得起。 其次是用 100 萬顆 CPU 放

20、在一起實現(xiàn)這樣的速度, 其可靠性如何。第三, 100 萬個單元之間進行數(shù)據(jù)傳遞和同步,實際能達到的效果怎樣。最后,像千萬億次計算機這樣大的設(shè)備,投入大,消耗大,用戶最終能否得到相應(yīng)的收益。面臨的挑戰(zhàn)眾多,我們挑選關(guān)鍵的幾個問題來加以闡述。1. 功耗、體積和低成本問題功耗、體積和成本是千萬億次機系統(tǒng)設(shè)計碰到的最大問題,也是投入運行后最棘手的問題。在芯片級,除了 Intel 80 核芯片外, Clearspeed 芯片是另一個好的例子。芯片中集成了 96 個 PE ,完成 64 位浮點操作的持續(xù)性能達到 25Gflops ,用 250MHz 的較低頻率使功耗控制在 10W 。從系統(tǒng)級來看,盡管多核

21、的出現(xiàn)有助于減少功耗和提高效能,但千萬億次系統(tǒng)決不是簡單的堆砌。系統(tǒng)設(shè)計上,性能價格比的設(shè)計觀念要轉(zhuǎn)變?yōu)樾阅苣芎谋鹊挠^念,即投入的單位能耗所能換取來的性能, Gflops/W 。按照目前的技術(shù)手段,千萬億次系統(tǒng)的功耗會達到數(shù)兆瓦甚至十幾兆瓦,這對系統(tǒng)的供電、冷卻、環(huán)境空調(diào)提出了巨大的挑戰(zhàn)。不僅要重視計算機的額定功耗,而且更要重視運行應(yīng)用時的功耗?,F(xiàn)在,多核處理器在內(nèi)部增加了節(jié)電功能,在部件和系統(tǒng)層次也要深入尋求降低功耗的技術(shù),使得系統(tǒng)的運行成本控制在用戶可以接受的范圍之內(nèi)。2. 系統(tǒng)結(jié)構(gòu)研發(fā)千萬億次高效能計算機,必須在計算機系統(tǒng)結(jié)構(gòu)上有所突破。首先,對通用和專用的問題要有清醒的認識。應(yīng)用本身的

22、特征要求有相應(yīng)的系統(tǒng)結(jié)構(gòu)與之配合才能得到高的運行效率。計算機規(guī)模越大,運行應(yīng)用時的效率就越低??紤]性能成本等諸因素,我們不可能造出一臺包打天下的千萬億次機。因此,考慮適當?shù)膽?yīng)用面向性是系統(tǒng)結(jié)構(gòu)設(shè)計的前提。藍色基因系統(tǒng)、地球模擬器、蛋白質(zhì)探索者都不是通用計算機,它們只是在一類或幾類應(yīng)用領(lǐng)域里才表現(xiàn)出卓越的性能。其次,同構(gòu)和異構(gòu)的問題是另一個關(guān)鍵問題。綜合考慮功耗性能成本以及應(yīng)用需求等因素,異構(gòu)結(jié)構(gòu)應(yīng)該引起我們足夠的重視,很可能成為高效能計算機系統(tǒng)結(jié)構(gòu)的新趨勢。異構(gòu)可以在芯片級、結(jié)點級和系統(tǒng)級上實現(xiàn)。芯片級的例子有Cell 、 CSX600等。結(jié)點級可以采用主從結(jié)構(gòu),用FPGA 或?qū)S眉铀俨考閼?yīng)

23、用中的計算密集部分提供加速。系統(tǒng)級將多種不同系統(tǒng)結(jié)構(gòu)的大系統(tǒng)通過高速互連網(wǎng)絡(luò)連接起來,以通用處理器適應(yīng)不同領(lǐng)域的各種應(yīng)用需求,以異構(gòu)多核處理器面向特定應(yīng)用領(lǐng)域的計算需求,通用與專用的結(jié)合構(gòu)成新的多態(tài)復(fù)合系統(tǒng)結(jié)構(gòu),是構(gòu)建千萬億次機的一種新方式。平衡性設(shè)計是另一個不容忽視的問題。例如存儲墻問題一直是困擾系統(tǒng)設(shè)計者的大問題。在多核時代,存儲墻問題更加突出。存儲器性能與處理器性能差距越來越大,以及本地延遲和遠程延遲不一致性,導(dǎo)致存儲器供數(shù)能力與處理器計算能力嚴重不協(xié)調(diào)。需要對應(yīng)用的時間局部性和空間局部性進行認真分析,獲得折中的選擇。 我們也高興的注意到, IBM和 Intel 公司都在從工藝角度為某些

24、系統(tǒng)結(jié)構(gòu)問題提供解決方案。IBM 公司 07 年 4 月宣布了一項突破性的芯片堆垛 ( chip-stacking )制造技術(shù), 使芯片布局從平面二維形式轉(zhuǎn)變?yōu)槿S立體形式。也就是說, CPU 芯片和存儲芯片由傳統(tǒng)在硅晶片上的并列擺放轉(zhuǎn)變?yōu)閷盈B式擺放。芯片層疊起來的結(jié)果就是封裝的體積大大縮小,從而極大地加快了數(shù)據(jù)在芯片功能部件間的傳輸速度。53. 編譯技術(shù)和并行編程模型基于多核處理器的千萬億次機對編譯技術(shù)提出了嚴峻的挑戰(zhàn)。并行編譯器的研究與系統(tǒng)結(jié)構(gòu)的設(shè)計是相輔相成的。當多核結(jié)構(gòu)不太明朗時,編譯器研究不是等待,而是必須設(shè)計多種假定方案,通過與模擬試驗相結(jié)合為多核設(shè)計提供方向性指導(dǎo)。編譯器針對同構(gòu)

25、多核和異構(gòu)多核處理器,要研究的問題側(cè)重點也是不相同的。由于同構(gòu)多核都是運行在較低的頻率下,程序的串行部分更容易成為瓶頸。我們更希望串行部分運行在高頻率的主核上,異構(gòu)多核提供了較好的選擇。對于異構(gòu)多核處理器,編譯器面臨的主要優(yōu)化問題是決定主核上執(zhí)行哪些運算,多個輔核上執(zhí)行哪些運算。異構(gòu)多核也使并行處理的運行模式復(fù)雜化。以 IBM Cell 處理器為例, 面對一主八從結(jié)構(gòu), 采用主 / 從式協(xié)同處理是一種自然的處理模式。而從核之間既可以選擇 SIMD 方式運行,也可以選擇 MIMD 方式運行。如果程序員難以確定并行運行模式,就需要編譯器進行分析和評估,作出指導(dǎo)性建議。并行編程模型在多核時代同樣遇到

26、了艱難的挑戰(zhàn)。由于單純靠編譯器把串行程序自動轉(zhuǎn)成并行程序是不太現(xiàn)實的事情。十多年來,OpenMP和 MPI 逐步發(fā)展成分別針對共享內(nèi)存和分布內(nèi)存的并行編程模型。對于OpenMP來說,由于多核結(jié)構(gòu)并不是SMP 結(jié)構(gòu)在片上的簡單重復(fù),OpenMP面臨著多種挑戰(zhàn)。首先,OpenMP需要發(fā)掘更廣泛的并行性,除支持整數(shù)循環(huán)外要考慮對C迭代器的支持,尋求支持不規(guī)則程序的擴展,針對推測執(zhí)行提供必要的語言擴展支持等。其次,多核處理器可以同時具有多線程和NUMA 特性,加上 SMP 的并行層次,具有不可忽視的層次并行的特征,這對于OpenMP扁平的執(zhí)行模型提出了很大的挑戰(zhàn)。OpenMP 中一直薄弱的局部性描述也

27、需要加強。4. 魯棒性問題魯棒性來源于一個英文單詞 Robust ,也就是健壯和強壯的意思。控制專家用這個名字來表示當一個控制系統(tǒng)中的參數(shù)發(fā)生攝動時系統(tǒng)能否保持正常工作的一種特性或?qū)傩?。就像人在受到外界病菌的感染后,是否能夠通過自身的免疫系統(tǒng)恢復(fù)健康一樣?,F(xiàn)在,魯棒性已成為控制理論中的一個重要的研究課題,也是一切類型的控制系統(tǒng)的設(shè)計中所必須考慮的一個基本問題。對魯棒性的研究主要限于線性定??刂葡到y(tǒng),所涉及的領(lǐng)域包括穩(wěn)定性、無靜差性、適應(yīng)控制等。魯棒性問題與控制系統(tǒng)的相對穩(wěn)定性和不變性原理有著密切的聯(lián)系,內(nèi)模原理的建立則對魯棒性問題的研究起了重要的推動作用。研究千萬億次機的魯棒性必須從系統(tǒng)結(jié)構(gòu)、

28、軟硬件設(shè)計、并行支持環(huán)境、用戶界面以及診斷容錯系統(tǒng)等多方面共同努力才有可能得到解決。系統(tǒng)結(jié)構(gòu)必須從片內(nèi)到系統(tǒng),從結(jié)點到網(wǎng)絡(luò)都采取冗余設(shè)計,在軟件的支持下具備故障檢測、任務(wù)遷移、隔離的功能,以及有修復(fù)再加入的功能。軟件魯棒性首先是操作系統(tǒng)本身的魯棒性,對于這樣大的系統(tǒng),當各種不同類型的故障發(fā)生時不能輕易的重啟操作系統(tǒng)。對于跟用戶相關(guān)的并行支持環(huán)境和用戶界面有更多的細節(jié)需要考慮魯棒性??傊瑢τ谇f億次機這樣的大系統(tǒng),平均無故障間隔時間很可能下降到幾十小時甚至幾小時,不出故障是不可能的,關(guān)鍵是各部分各層次的魯棒性措施是否能協(xié)同工作,一套完善的免疫修復(fù)機制是否有效,從而保證大系統(tǒng)的正常工作。五、 結(jié)束語科學(xué)和工程計算的計算需求仍然

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論