第20講 并行計算_第1頁
第20講 并行計算_第2頁
第20講 并行計算_第3頁
第20講 并行計算_第4頁
第20講 并行計算_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

并行計算1并行計算介紹

什么是并行計算基本概念并行計算機的發(fā)展我國并行計算機的發(fā)展情況當(dāng)前最快的超級計算機并行計算機體系結(jié)構(gòu)并行算法2并行計算傳統(tǒng)的軟件是為串行計算機而編寫的:在只有一個處理器的單臺計算機上運行

把一個問題分解成離散的指令序列

指令被一條條的順序執(zhí)行任何時候只有一條指令在執(zhí)行3并行計算的應(yīng)用需求

數(shù)值天氣預(yù)報全球氣象中期天氣預(yù)報要求在24

小時內(nèi)完成48

小時天氣預(yù)測數(shù)值模擬,至少需635

萬個網(wǎng)格點,內(nèi)存需求大于1T,計算性能高達25

萬億次/秒.

核武器數(shù)值模擬美國1996年實施的ASCI計劃,分四個階段實現(xiàn)萬億次、十萬億次、30萬億次和100萬億次大規(guī)模并行數(shù)值模擬,實現(xiàn)全三維、全物理過程、高分辨率的核武器數(shù)值模擬.并行計算能力已成為衡量一個國家綜合實力的重要標志之一!4并行計算機系統(tǒng)的應(yīng)用領(lǐng)域數(shù)學(xué)基因信息氣象預(yù)報生物物理石油勘探信息服務(wù)汽車制造船舶制造5并行計算并行計算(高性能計算、超級計算)大任務(wù)分解多個子任務(wù)不同處理單元分

給快速求解協(xié)同合作基本條件:

硬件(并行機)、并行算法設(shè)計、并行編程環(huán)境主要目標:提高求解速度,擴大問題規(guī)模6串行計算與并行計算78組成并行計算機的各個部分:節(jié)點(node)互聯(lián)網(wǎng)絡(luò)(interconnectnetwork)內(nèi)存(memory)內(nèi)存模塊與節(jié)點分離內(nèi)存模塊位于節(jié)點內(nèi)部并行計算8并行計算介紹什么是并行計算基本概念并行計算機的發(fā)展我國并行計算機的發(fā)展情況當(dāng)前最快的超級計算機弗林經(jīng)典分類并行計算機體系結(jié)構(gòu)并行算法9弗林根據(jù)指令和數(shù)據(jù)這兩個獨立維度的情況,對多處理器計算機結(jié)構(gòu)進行了如下分類SISD單指令流單數(shù)據(jù)流SIMD單指令流多數(shù)據(jù)流MISD多指令流單數(shù)據(jù)流MIMD多指令流多數(shù)據(jù)流基本概念10單指令流單數(shù)據(jù)流(SISD)一個串行(非并行)計算機

單指令流:在任何一個時鐘周期,CPU中只有一個指令流在活動。單數(shù)據(jù)流:在任何一個時鐘周期,只有一個數(shù)據(jù)流作為輸入在被使用。執(zhí)行結(jié)果是確定的。從很早一直到現(xiàn)在,這都是計算機的最主要的形式?;靖拍?1單指令流多數(shù)據(jù)流(SIMD)并行計算機的一種

。單指令流:在任何一個時鐘周期,CPU中只有一個指令流在活動。多數(shù)據(jù)流:每個處理單元能在不同的數(shù)據(jù)元素上進行操作。最適合具有高度規(guī)律性的特殊的問題,比如圖像處理。同步(步調(diào)一致)和確定的執(zhí)行兩種類型:處理器陣列和向量流水線基本概念12多指令流單數(shù)據(jù)流(MISD)單一的數(shù)據(jù)流流入多個處理器單元去處理每個處理器單元通過獨立的指令流對數(shù)據(jù)進行處理這種類型的并行計算機很少有存在的例子,有一個實驗室的產(chǎn)品是卡內(nèi)基梅隴大學(xué)的C.mmp計算機(1971)。

一些想象中的可能應(yīng)用:

多種頻率的濾波器處理同一個信號流用多個密碼算法嘗試解開一個編碼信息?;靖拍?3多指令流多數(shù)據(jù)流(MIMD)目前最常用的并行計算機。大多數(shù)現(xiàn)代計算機屬于這一類多指令流:每個處理器可以執(zhí)行不同的指令流多數(shù)據(jù)流:每個處理器可以工作在不同的數(shù)據(jù)流上執(zhí)行可以是同步的或者異步的,確定的或者不確定的舉例:很多目前的巨型計算機、網(wǎng)絡(luò)并行計算機“網(wǎng)格”、多處理器SMP計算機以及多核處理器?;靖拍?4基本概念15并行計算機存儲結(jié)構(gòu)多級存儲體系結(jié)構(gòu)為了解決存儲墻(memorywall)性能瓶頸問題。在節(jié)點內(nèi)部的cache稱為二級cache(L2cache)。在處理器內(nèi)部更小的cache成為一級cache(L1cache)L1cache連接CPU寄存器和L2cache,負責(zé)緩存L2cache中的數(shù)據(jù)到寄存器中。1616微處理器的多級存儲結(jié)構(gòu)

微機機群的一次消息傳遞延遲相當(dāng)于

50000次峰值浮點運算17微處理器的多級存儲結(jié)構(gòu)

微處理器主頻越來越高,內(nèi)存容量越來越大,

但內(nèi)存訪問速度的增長較慢

緩解內(nèi)存墻性能瓶頸:Cache高速緩存18并行計算機體系結(jié)構(gòu)并行計算機體系

結(jié)構(gòu)示意圖

內(nèi)存模塊與結(jié)點分離并行計算機體系

結(jié)構(gòu)示意圖

內(nèi)存模塊位于

結(jié)點內(nèi)部19并行計算機存儲結(jié)構(gòu)多級存儲體系結(jié)構(gòu)Cache的映射策略指的是內(nèi)存塊和cache行之間如何建立相互映射關(guān)系。直接映射策略(directmappingstrategy)每個內(nèi)存塊只能被唯一的映射到一條cache行中K-路組相聯(lián)映射策略(K-waysetassociationmappingstrategy)Cache被分解為V個組,每個組由K個cache行組成,內(nèi)存塊按直接映射策略映射到某個組,但在該組中,內(nèi)存塊可以被映射到任意一個cache行。全相聯(lián)映射策略(fullassociationmappingstrategy)內(nèi)存塊可以被映射到cache中的任意一個cache行。20并行計算機存儲結(jié)構(gòu)分布式存儲MEMORYNODEMEMORYNODEMEMORYNODEMEMORYNODEnetworkNODE(節(jié)點)=單處理器或多處理器21并行計算機存儲結(jié)構(gòu)分布式存儲-NORMA(No-RemoteMemoryAccess)節(jié)點有它們自己的局部存儲器。一個節(jié)點內(nèi)的存儲器地址不會映射到其他節(jié)點上,所以在全部節(jié)點中沒有全局地址空間的概念。因為每一個節(jié)點有它自己局部存儲器它們獨立地操作。因此Cache一致性的概念不存在。當(dāng)一個節(jié)點需要存取另一個節(jié)點的數(shù)據(jù)(很少見),通常要程序員明確提供如何以及何時數(shù)據(jù)被傳送的信息。22并行計算機存儲結(jié)構(gòu)分布式存儲優(yōu)點增加節(jié)點數(shù),就自然成比例地增加了存儲容量.每個節(jié)點能快速地存取它自己的存儲器而無需干涉也沒有試圖保持Cache一致性的開銷。成本效率:可以用商業(yè)化的,現(xiàn)成的處理器和網(wǎng)絡(luò)。缺點

如果數(shù)據(jù)在兩個節(jié)點間傳送,就要求程序員提供很多有關(guān)數(shù)據(jù)傳送的細節(jié)。很難將現(xiàn)在基于全局存儲的已有數(shù)據(jù)結(jié)構(gòu)映射到這種存儲組織中。非均勻內(nèi)存訪問(NUMA)時間

23并行計算機存儲結(jié)構(gòu)共享存儲NODEMEMORYNODE(節(jié)點)=單處理器或多處理器NODENODENODE24并行計算機存儲結(jié)構(gòu)共享存儲共享存儲的并行計算機千差萬別,但都能夠使所有的節(jié)點以全局地址空間的形式訪問全部的存儲器空間。多個節(jié)點可以獨立操作但又可共享相同的存儲資源。在一個節(jié)點上改變一個存儲位置的值對其他節(jié)點來說也是可見和可用的。25并行計算機存儲結(jié)構(gòu)共享存儲均勻存儲訪問(UMA):存儲器和節(jié)點分離物理存儲器能夠通過互聯(lián)網(wǎng)絡(luò)被所有節(jié)點共享。發(fā)生訪存競爭時,仲裁策略平等對待每個節(jié)點,即每個節(jié)點機會均等;外圍I/O設(shè)備也可以共享,且每個節(jié)點有平等的訪問權(quán)利。最常見的代表是當(dāng)前的對稱多處理器機器(SMP)26并行計算機存儲結(jié)構(gòu)共享存儲均勻存儲訪問(UMA):所有節(jié)點訪問任意存儲單元的時間相同;各節(jié)點的CPU可帶有局部私有高速緩存;互聯(lián)網(wǎng)絡(luò)可以是單總線、多總線或者交叉開關(guān)。

有時候稱為CC-UMA–Cache一致性UMA.Cache一致性意味著如果一個處理器修改了共享存儲器中的某個位置的數(shù),其他的所有處理器都知道這個改變。Cache的一致性在硬件一級完成。27network并行計算機存儲結(jié)構(gòu)分布式共享存儲器(DSM)NODENODEMEMORYNODENODENODENODEMEMORYNODENODENODENODEMEMORYNODENODENODENODEMEMORYNODENODENODE(節(jié)點)=單處理器或多處理器28并行計算機存儲結(jié)構(gòu)分布式共享存儲器(DSM)共享存儲器部分通常是一個Cache一致性的SMP機器。在給定的SMP中的處理器,能夠以全局方式尋址這個機器的存儲器。分布式存儲部分是多個SMP聯(lián)網(wǎng)。SMP只知道它們自己的存儲器-不是在其他SMP上的存儲器。因此,需要網(wǎng)絡(luò)通信來將數(shù)據(jù)從一個SMP移動到另一個。目前的趨勢似乎表明這種類型的存儲結(jié)構(gòu)將繼續(xù)盛行,并將在高端計算機上得到增強。29并行計算機存儲結(jié)構(gòu)分布式共享存儲器(DSM)非均勻存儲訪問(NUMA)每個節(jié)點都有共享存儲的一部分(局部存儲器)存儲器只有一個地址空間任何節(jié)點都可以實際地址直接訪問任何存儲器每個節(jié)點都可以有局部Cache不是所有的節(jié)點能夠以相同的時間訪問所有的存儲器,訪問時間與該存儲器到該節(jié)點的距離有關(guān)。跨鏈接的存儲訪問比較慢如果保持Cache一致性,它也可以稱為CC-NUMA–Cache一致性NUMA3031并行計算機存儲結(jié)構(gòu)分布式共享存儲器全高速緩存存儲訪問(COMA):每個節(jié)點擁有共享存儲的一部分。然而,這次共享存儲器是由Cache組成的。沒有層次性存儲,地址空間是針對Cache的。有一個Cache目錄來幫助遠程Cache訪問。需要將數(shù)據(jù)轉(zhuǎn)移到需要它的節(jié)點上。3132并行計算機存儲結(jié)構(gòu)分布式共享存儲器優(yōu)點全局地址空間提供一個用戶友好的訪存編程方式。由于節(jié)點與內(nèi)存接近,任務(wù)間的數(shù)據(jù)共享快速統(tǒng)一缺點

增加一些節(jié)點會使得存儲器到節(jié)點的路徑的擁擠程度成幾何增大。對于cache一致性系統(tǒng),增加更多的節(jié)點會使得與cache/存儲器管理相關(guān)聯(lián)的沖突成幾何增長。程序員的責(zé)任就是能確保全局存儲的正確訪問的同步結(jié)構(gòu)。32并行計算機系統(tǒng)架構(gòu)33以動物的食物鏈為例并行計算機系統(tǒng)架構(gòu)34并行計算機系統(tǒng)架構(gòu)35對稱多處理機系統(tǒng)(SMP)SMP對稱式共享存儲:任意處理器可直接訪問任意內(nèi)存地址,且訪問延遲、帶寬、機率都是等價的;系統(tǒng)是對稱的;微處理器:一般少于64個;處理器不能太多,總線和交叉開關(guān)的一旦作成難于擴展;例子:IBMR50,SGIPowerChallenge,SUNEnterprise,36分布式共享存儲系統(tǒng)(DSM)DSM分布共享存儲:內(nèi)存模塊物理上局部于各個處理器內(nèi)部,但邏輯上(用戶)是共享存儲的;這種結(jié)構(gòu)也稱為基于Cache目錄的非一致內(nèi)存訪問(CC-NUMA)結(jié)構(gòu);局部與遠程內(nèi)存訪問的延遲和帶寬不一致;與SMP的主要區(qū)別:DSM在物理上有分布在各個節(jié)點的局部內(nèi)存從而形成一個共享的存儲器;微處理器:16-128個;代表:SGIOrigin2000,CrayT3D;37大規(guī)模并行計算機系統(tǒng)(MPP)MPP物理和邏輯上均是分布內(nèi)存能擴展至成百上千個處理器(微處理器或向量處理器)采用高通信帶寬和低延遲的互聯(lián)網(wǎng)絡(luò)(專門設(shè)計和定制的)一種異步的MIMD機器;程序系由多個進程組成,每個都有其私有地址空間,進程間采用傳遞消息相互作用;代表:CRAYT3E(2048),ASCIRed(3072),IBMSP238機群系統(tǒng)(Cluster)Cluster每個節(jié)點都是一個完整的計算機各個節(jié)點通過高性能網(wǎng)絡(luò)相互連接網(wǎng)絡(luò)接口和I/O總線松耦合連接每個節(jié)點有完整的操作系統(tǒng)曙光2000、3000、4000,ASCIBlueMountain39并行計算機的發(fā)展始于70年代

1946年第一臺計算機ENIAC

(ElectronicNumericalIntegratorAndComputer)占地170平方重約30噸

5000次加法/秒

或500次乘法/秒

15分鐘換一個零件主要用于彈道計算

和氫彈研制40并行計算機的發(fā)展始于70年代

1972年第一臺并行計算機ILLIACIV(伊利諾依大學(xué))60年代末開始建造

72年建成,74年運行

第一個完整程序,

76年

運行第一個應(yīng)用程序

64個處理器,是當(dāng)時

性能最高的CDC7600

機器的2-6倍公認的1981年前最快1982年退役可擴展性好,

但可編程性差41并行計算機的發(fā)展始于70年代向量機Cray-1

一般將Cray-1投入

運行的1976年稱為

“超級計算元年”編程方便,

但可擴展性差以Cray為代表的

向量機稱雄超級

計算機界十幾載收藏于DeutschesMuseum德意志

博物館的Cray-1原型42并行計算機的發(fā)展

80年代百家爭鳴早期:以MIMD并行計算機的研制為主

DenelcorHEP

(1982年)第一臺商用MIMD并行計算機

CrayX-MP

Cray研究公司第一臺MIMD并行計算機

IBM309080

年代普遍為銀行所采用西摩?克雷SeymourCray(1925-1996),

電子工程學(xué)學(xué)士,應(yīng)用數(shù)學(xué)碩士,

超級計算機之父,Cray研究公司的創(chuàng)始人,

親手設(shè)計了Cray機型的全部硬件與操作系統(tǒng),

作業(yè)系統(tǒng)由他用機器碼編寫完成。1984年時,

公司占據(jù)了超級計算機市場70%的份額。

1996年Cray研究公司被SGI收購,2000年被

出售給Tera計算機公司,成立Cray公司。43并行計算機的發(fā)展

80年代百家爭鳴中期:共享存儲多處理機Shared-MemoryMultiProcessor

SMP

(SymmetricalMulti-Processing):在一個計算機上匯集一組處理器,各處理器對稱共享內(nèi)存及計算機的其他資源,由單一操作系統(tǒng)管理,極大提高整個系統(tǒng)的數(shù)據(jù)處理能力。

擴展性較差可靠性較差內(nèi)存訪問瓶頸44并行計算機的發(fā)展

80年代百家爭鳴后期:具有強大計算能力的并行機

通過二維Mesh連接的Meiko(Sun)系統(tǒng)

超立方體連接的MIMD并行機:nCUBE-2、iPSC/80共享存儲向量多處理機CrayY-MP

······45并行計算機的發(fā)展

90年代:體系結(jié)構(gòu)框架趨于統(tǒng)一(DSM、MPP、NOW)

DSM(DistributedSharedMemory)分布式共享存儲以結(jié)點為單位,每個結(jié)點有一個或多個CPU專用的高性能互聯(lián)網(wǎng)絡(luò)連接(Myrinet,Infiniband,…)分布式存儲:內(nèi)存模塊局部在每個結(jié)點中單一的操作系統(tǒng)單一的內(nèi)存地址空間:所有內(nèi)存模塊都由硬件進行了統(tǒng)一的編址,各個結(jié)點既可以直接訪問局部內(nèi)存單元,又可以直接訪問其他結(jié)點的局部內(nèi)存單元可擴展到上百個結(jié)點支持消息傳遞、共享存儲并行程序設(shè)計46并行計算機的發(fā)展

90年代:體系結(jié)構(gòu)框架趨于統(tǒng)一

DSM(DistributedSharedMemory)分布式共享存儲47并行計算機的發(fā)展

90年代:體系結(jié)構(gòu)框架趨于統(tǒng)一

MPP(MassivelyParallelProcessing)大規(guī)模并行處理結(jié)構(gòu)

每個結(jié)點相對獨立,有一個或多個微處理器每個結(jié)點均有自己的操作系統(tǒng)各個結(jié)點自己獨立的內(nèi)存,避免內(nèi)存訪問瓶頸各個結(jié)點只能訪問自己的內(nèi)存模塊擴展性較好

DM-MPP分布式存儲MPP:每個結(jié)點僅包含一個微處理器

SMP-MPP:每個結(jié)點是一臺SMP并行機

DSM-MPP:每個結(jié)點是一臺DSM并行機48并行計算機的發(fā)展

MPP體系結(jié)構(gòu)示意圖

90年代:體系結(jié)構(gòu)框架趨于統(tǒng)一49并行計算機的發(fā)展

90年代:體系結(jié)構(gòu)框架趨于統(tǒng)一

NOW(NetworkofWorkstations)工作站機群投資風(fēng)險小、結(jié)構(gòu)靈活、可擴展性強、通用性好、異構(gòu)能力強,被大量中小型計算用戶和科研院校所采用每個結(jié)點安裝消息傳遞并行程序設(shè)計軟件,實現(xiàn)通信、負載平衡等每個結(jié)點都是一個完整的工作站,有獨立的硬盤與UNIX系統(tǒng)結(jié)點間通過低成本的網(wǎng)絡(luò)(如千兆以太網(wǎng))連接也稱為COW(ClusterofWorkstations)

NOW(COW)與MPP之間的界線越來越模糊50并行計算機的發(fā)展

NOW的典型代表:Beowulfcluster微機機群性能價格比極高

90年代:體系結(jié)構(gòu)框架趨于統(tǒng)一51并行計算機的發(fā)展第一臺Beowulf機群52并行計算機的發(fā)展

2000年至今:前所未有大踏步發(fā)展

Cluster機群

Constellation星群每個結(jié)點含多個商用處理器,結(jié)點內(nèi)部共享存儲

采用商用機群交換機通過前端總線連接結(jié)點,結(jié)點分布存儲各個結(jié)點采用Linux操作系統(tǒng)、GNU編譯系統(tǒng)和作業(yè)管理系統(tǒng)每個結(jié)點是一臺子并行機采用商用機群交換機通過前端總線連接結(jié)點,結(jié)點分布存儲各個結(jié)點運行專用的結(jié)點操作系統(tǒng)、編譯系統(tǒng)和作業(yè)管理系統(tǒng)

MPP專用高性能網(wǎng)絡(luò),大多為政府直接支持53并行計算機的發(fā)展并行計算機發(fā)展趨勢由于向量機和MPP

受研制費用高、售價高等因素的影響,其市場受到一定的限制

SMP

由于共享結(jié)構(gòu)的限制,系統(tǒng)的規(guī)模不可能很大由于機群系統(tǒng)具有投資風(fēng)險小、可擴展性好、可繼承現(xiàn)有軟硬件資源和開發(fā)周期短、可編程性好等特點,目前已成為并行處理的熱點和主流54并行計算介紹什么是并行計算并行計算機的發(fā)展我國并行計算機的發(fā)展情況當(dāng)前最快的超級計算機并行計算機體系結(jié)構(gòu)操作系統(tǒng)與并行計算編程環(huán)境并行算法55我國高性能計算機的發(fā)展

1958年第一臺國產(chǎn)計算機

--103型計算機運行速度每秒1500次第一臺計算機56我國高性能計算機的發(fā)展

1983年12月,我國第一臺每秒鐘運算達1億次以上的計算機“銀河I”問世

1992年“銀河-II”問世,每秒運算達10億次

1997年成功研制百億次并行機“銀河-III”,由130多個處理結(jié)點組成超級計算機曙光(曙光信息產(chǎn)業(yè)有限公司

)深騰(聯(lián)想集團)銀河神威軍事部門57我國高性能計算機的發(fā)展

1999年9月,由國家并行計算機工程技術(shù)研究中心牽頭研制成功的“神威”計算機系統(tǒng)投入運行。2000年,“神威I”面向社會開放使用?!吧裢蘒”的峰值速度為每秒3840億次浮點運算神威

I58我國高性能計算機的發(fā)展

1993年10月研制成功“曙光一號”SMP多處理機

2000年推出每秒3000億次的曙光3000超級服務(wù)器

2004年6月,推出11萬億次的曙光4000A超級計算機,落戶上海超算中心,進入全球前十名,從而使中國成為繼美國和日本之后,第三個能研制10萬億次高性能計算機的國家

2008年6月,曙光5000A發(fā)布,實際運算速度超過每秒160萬億次,排名世界第十曙光5000A59我國高性能計算機的發(fā)展

2002年,聯(lián)想發(fā)布深騰1800計算機,排名全球第43位,成為首家正式進入排行榜前100的中國企業(yè)

2003年,深騰6800計算機發(fā)布,列全世界TOP500第14位,其78.5%的整機效率列世界通用高端計算機第一名

2008年12月,聯(lián)想發(fā)布百萬億次超級計算機深騰7000深騰700060并行計算介紹什么是并行計算并行計算機的發(fā)展我國并行計算機的發(fā)展情況當(dāng)前最快的超級計算機并行計算機體系結(jié)構(gòu)操作系統(tǒng)與并行計算編程環(huán)境并行算法61當(dāng)前高性能計算機

Top500:2007年11月排名第一的

IBMBlueGene/L由212992

個處理器構(gòu)成,內(nèi)存為73728G

理論峰值為596378

GFlops測試峰值478200

GFlops

2008年06月排名第二62當(dāng)前高性能計算機63當(dāng)前高性能計算機64當(dāng)前高性能計算機

并行機類型Architecturesharefor06/200965當(dāng)前高性能計算機

并行機采用的操作系統(tǒng)OperatingsystemFamilysharefor06/200966當(dāng)前高性能計算機

并行機采用的網(wǎng)絡(luò)鏈接67

并行計算機發(fā)展趨勢68國內(nèi)高性能計算機

Top100inChina:http:///曙光公司中國科學(xué)院計算技術(shù)研究所國家智能計算機研究開發(fā)中心國家高性能計算中心

合作伙伴:AMD、上海超級計算中心最新產(chǎn)品:曙光5000A(百萬億次)聯(lián)想公司合作伙伴:Intel、中科院計算機網(wǎng)絡(luò)中心(超級計算中心)最新產(chǎn)品:深騰7000(百萬億次)69國內(nèi)超級計算中心國家高性能計算中心

國家高性能計算中心(北京)

1995年5月成立,第一個高性能計算中心

國家高性能計算中心(合肥):1995年9月,中科大

國家高性能計算中心(成都):1997年11月,西南交大

國家高性能計算中心(武漢):1997年12月,華中科技

國家高性能計算中心(上海):1998年4月,復(fù)旦大學(xué)

國家高性能計算中心(杭州):2001年4月,浙江大學(xué)

國家高性能計算中心(西安):2002年4月,西安交大70并行計算介紹什么是并行計算并行計算機的發(fā)展我國并行計算機的發(fā)展情況當(dāng)前的超級計算機并行計算機體系結(jié)構(gòu)操作系統(tǒng)與并行計算編程環(huán)境并行算法71操作系統(tǒng)與編程語言并行計算機主流操作系統(tǒng):UNIX/Linux

AIX(IBM)

HPUX(HP)

Solaris(SUN)

IRIX(SGI)

Linux編程語言

Fortran77/90/95

C/C++72進程與線程進程(process)運行中的程序各個進程擁有獨立的執(zhí)行環(huán)境進程間通信同一臺處理機或不同處理機的多個進程之間交流信息通信(消息傳遞)、同步、聚集線程(threads)降低系統(tǒng)管理開銷一個進程可以含一個或多個線程73并行編程環(huán)境常見的并行編程環(huán)境消息傳遞、共享存儲、數(shù)據(jù)并行特征消息傳遞共享數(shù)據(jù)數(shù)據(jù)并行典型代表

可移植性

存儲方式

學(xué)習(xí)難度

可擴展性MPI,PVM

所有流行并行機

分布式存儲

較難

好OpenMP

SMP,DSM

共享存儲

容易

較差HPF

SMP,DSM,MPP

共享存儲

偏易

一般三種并行編程環(huán)境主要特征一覽74并行計算介紹什么是并行計算并行計算機的發(fā)展我國并行計算機的發(fā)展情況當(dāng)前的超級計算機并行計算機體系結(jié)構(gòu)操作系統(tǒng)與并行計算編程環(huán)境并行算法75并行算法適合在并行機上實現(xiàn)的算法

好的并行算法應(yīng)充分發(fā)揮并行機計算機的潛在性能并行算法并行算法分類按運算對象:數(shù)值并行算法、非數(shù)值并行算法

按并行進程執(zhí)行順序:

同步并行算法、異步并行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論