計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法

上傳人：y*** IP屬地：山東上傳時(shí)間：2024-05-20 格式：PPTX 頁數(shù)：89 大?。?.78MB 積分：20 舉報(bào) 版權(quán)申訴

計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法_第2頁

計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法_第3頁

計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法_第4頁

計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法_第5頁

已閱讀5頁，還剩84頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多處理機(jī)系統(tǒng)計(jì)算機(jī)組成與體系結(jié)構(gòu)進(jìn)程并行減少進(jìn)程間的資源共享可不共享的資源CPU存儲器I/O必須共享的資源（進(jìn)程間通信）互連結(jié)構(gòu)多處理機(jī)系統(tǒng)(multiprocessorsystem)，多處理器系統(tǒng)、多處理機(jī)多處理機(jī)系統(tǒng)分類多處理機(jī)系統(tǒng)SIMD單指令多數(shù)據(jù)流機(jī)SIMD(SingleInstructionMultipleData)MIMD并行向量處理機(jī)PVP(ParallelVectorProcessor)對稱多處理機(jī)SMP(SymmetricMultiprocessor)大規(guī)模并行處理機(jī)MPP(MassivelyParallelProcessor)工作站集群COW(ClusterofWorkstation)分布式共享存儲DSM(DistributedSharedMemory)多處理機(jī)SIMD體系結(jié)構(gòu)控制器指令流運(yùn)算器存儲運(yùn)算器存儲…………數(shù)據(jù)流數(shù)據(jù)流從前端機(jī)裝入的數(shù)據(jù)從前端機(jī)裝入的程序MIMD的優(yōu)勢MIMD靈活性強(qiáng)。在必要的軟件和硬件支持下，MIMD既能作為單用戶多處理器為單一應(yīng)用程序提供高性能（向量處理器除外，且目前使用向量處理器的MIMD很少），又可作為同時(shí)運(yùn)行多個(gè)任務(wù)的多道程序多處理器系統(tǒng)使用，甚至可以提供這兩種任務(wù)相結(jié)合的應(yīng)用MIMD能夠充分利用現(xiàn)有微處理器的性價(jià)比優(yōu)勢。實(shí)際上，當(dāng)今幾乎所有的商用多處理器系統(tǒng)所使用的微處理器與工作站及單處理器服務(wù)器所使用的微處理器都是相同的。此外，多核芯片通過復(fù)制方式可以有效降低單處理器內(nèi)核的設(shè)計(jì)成本并行向量處理機(jī)PVP對于處理特定的向量計(jì)算有很高的速度，但其通用性較差Cray系列、NECSX4、銀河-I型（峰值速度1億次/秒）銀河-II型（峰值速度10億次/秒）對稱多處理機(jī)SMPIBMR50、SGIPowerChallenge、DECAlpha服務(wù)器8400、曙光1號大規(guī)模并行處理機(jī)MPPIntelParagon、IBMSP2、IntelTFLOPS、曙光-1000主要應(yīng)用是科學(xué)計(jì)算、工程模擬和信號處理等以計(jì)算為主的領(lǐng)域分布式共享存儲多處理機(jī)DSMStanfordDASH、CrayT3D和SGI/GrayOrigin2000等工作站集群COWBerkeleyNOW、AlphaFarm、DigitalTruCluster等公用結(jié)構(gòu)五種結(jié)構(gòu)特性一覽表屬性PVPSMPMPPDSMCOW結(jié)構(gòu)類型MIMDMIMDMIMDMIMDMIMD處理器類型專用定制商用商用商用商用互連網(wǎng)絡(luò)定制交叉開關(guān)總線、交叉開關(guān)定制網(wǎng)絡(luò)定制網(wǎng)絡(luò)商用網(wǎng)絡(luò)（以太ATM）通信機(jī)制共享變量共享變量消息傳遞共享變量消息傳遞地址空間單地址空間單地址空間多地址空間單地址空間多地址空間系統(tǒng)存儲器集中共享集中共享分布非共享分布共享分布非共享訪存模型UMAUMANORMANUMANORMA代表機(jī)器CrayC-90，CrayT-90，銀河1號IBMR50，SGIPowerChallenge，曙光1號IntelParagon，

IBMSP2，曙光1000/2000StanfordDASH，CrayT3DBerkeleyNOW，AlphaFarm并行計(jì)算機(jī)訪存模型UMA(UniformMemoryAccess)

NUMA(NonuniformMemoryAccess)COMA(Cache-OnlyMemoryAccess)CC-NUMA(Coherent-CacheNonuniformMemoryAccess)

NORMA(No-RemoteMemoryAccess)

UMA均勻存儲訪問模型物理存儲器被所有處理器均勻共享；所有處理器訪問任何存儲字取相同的時(shí)間；每臺處理器可帶私有高速緩存；外圍設(shè)備也可以一定形式共享。UMA多處理機(jī)模型NUMA非均勻存儲訪問模型被共享的存儲器在物理上是分布在所有的處理器中的，其所有本地存儲器的集合就組成了全局地址空間；處理器訪問存儲器的時(shí)間是不一樣的；訪問本地存儲器LM或群內(nèi)共享存儲器CSM較快，而訪問外地的存儲器或全局共享存儲器GSM較慢（此即非均勻存儲訪問名稱的由來）；每臺處理器照例可帶私有高速緩存，外設(shè)也可以某種形式共享。NUMA多處理機(jī)模型LM1P1LM2P2LMnPn互連網(wǎng)絡(luò)(a)共享本地存儲模型全局互連網(wǎng)絡(luò)(b)層次式集群模型GSMGSMGSM…………PCINCSMPPCSMCSM群1……PCINCSM群NPPCSMCSM……COMA全高速緩存存儲訪問各處理器節(jié)點(diǎn)中沒有存儲層次結(jié)構(gòu)，全部高速緩存組成了全局地址空間；利用分布的高速緩存目錄D進(jìn)行遠(yuǎn)程高速緩存的訪問;COMA中的高速緩存容量一般都大于2級高速緩存容量；使用COMA時(shí)，數(shù)據(jù)開始時(shí)可任意分配，因?yàn)樵谶\(yùn)行時(shí)它最終會被遷移到要用到它們的地方。COMA多處理機(jī)模型CC-NUMA高速緩存一致性非均勻存儲訪問大多數(shù)使用基于目錄的高速緩存一致性協(xié)議保留SMP結(jié)構(gòu)易于編程的優(yōu)點(diǎn)，也改善常規(guī)SMP的可擴(kuò)展性CC-NUMA實(shí)際上是一個(gè)分布共享存儲的DSM多處理機(jī)系統(tǒng)它最顯著的優(yōu)點(diǎn)是程序員無需明確地在節(jié)點(diǎn)上分配數(shù)據(jù)，系統(tǒng)的硬件和軟件開始時(shí)自動(dòng)在各節(jié)點(diǎn)分配數(shù)據(jù)，在運(yùn)行期間，高速緩存一致性硬件會自動(dòng)地將數(shù)據(jù)遷移至要用到它的地方CC-NUMA多處理機(jī)模型NORMA非遠(yuǎn)程存儲訪問所有存儲器是私有的；絕大數(shù)NORMA都不支持遠(yuǎn)程存儲器的訪問；在DSM中，NORMA就消失了。消息傳遞多處理機(jī)一般模型并行機(jī)訪存模型總結(jié)物理上分布的存儲器從編程的觀點(diǎn)看可以是共享的或非共享的共享結(jié)構(gòu)（多處理器）可以同時(shí)支持共享存儲和消息傳遞編程模型共享存儲的編程模型可同時(shí)執(zhí)行于共享存儲結(jié)構(gòu)和分布式存儲結(jié)構(gòu)（多計(jì)算機(jī)）上并行機(jī)系統(tǒng)的不同存儲結(jié)構(gòu)主流并行計(jì)算機(jī)系統(tǒng)SMPMPPClusterSMP特性(1)SMP：通常采用商用微處理器，通常有片上和片外Cache，基于總線連接，集中式共享存儲，UMA結(jié)構(gòu)。SMP特性(2)優(yōu)點(diǎn)對稱性單地址空間，易編程性，動(dòng)態(tài)負(fù)載平衡，無需顯示數(shù)據(jù)分配高速緩存及其一致性，數(shù)據(jù)局部性，硬件維持一致性低通信延遲，Load/Store完成問題欠可靠，易產(chǎn)生單點(diǎn)失效，如BUS、OS、SM通信延遲，單次通信延遲要低，但總線競爭加劇慢速增加的帶寬（MBdouble/3年，IOB則更慢）不可擴(kuò)展性，限制了SMP最大的處理器數(shù)。為了增大系統(tǒng)的規(guī)模，可改用交叉開關(guān)連接，或改用CC-NUMA或集群結(jié)構(gòu)典型SMP系統(tǒng)系統(tǒng)特性DECAlphaserver84005/440HP9000/T600IBMRS600/R40SunUltraEnterprise6000SGIPowerChallengeXL處理器數(shù)目121283036處理器類型437MHzAlpha21164180MHzPA8000112MHzPowerPC604167MHzUltraSPARCI195MHzMIPSR10000處理器片外Cache容量4MB8MB1MB512MB4MB最大主存容量28GB16GB2GB30GB16GB互連網(wǎng)絡(luò)及帶寬BUS2.1GB/sBUS960MB/sBUS+Crossbar1.8GB/sBUS+Crossbar2.6GB/sBUS1.2GB/s外存容量192GB168GB38GB63GB144GBI/O通道12PCI，每個(gè)133MB/sN/A2MCA，每個(gè)160MB/s30Sbus，每個(gè)200MB/s6PowerChannel-2HIO，每個(gè)320MB/sI/O槽144PCI槽112HP-PB槽15MCA45Sbus槽12HIO槽I/O帶寬1.2GB/s1GB/s320MB/s2.6GB/s每個(gè)HIO槽320MB/sMPP系統(tǒng)MPP并沒有一個(gè)明確的定義，典型的MPP系統(tǒng)中包含成百上千乃至上萬個(gè)處理器，并用專用的高速互聯(lián)網(wǎng)絡(luò)把大量的計(jì)算結(jié)點(diǎn)連接在一起，組成的大型計(jì)算機(jī)系統(tǒng)，進(jìn)行并行處理“計(jì)算結(jié)點(diǎn)”并不只是處理器，計(jì)算結(jié)點(diǎn)內(nèi)包含除了CPU外的其他私有的資源，如總線，內(nèi)存等MPP系統(tǒng)包含的計(jì)算結(jié)點(diǎn)數(shù)很多，故其可以達(dá)到很高的峰值速度典型的MPP體系結(jié)構(gòu)P/CP/CMEM局部總線或互聯(lián)網(wǎng)絡(luò)NICI/OP/CP/CMEM局部總線或互聯(lián)網(wǎng)絡(luò)NICI/O高性能互聯(lián)網(wǎng)絡(luò)I/OMPP的特征由數(shù)百個(gè)乃至數(shù)千個(gè)計(jì)算結(jié)點(diǎn)和I/O結(jié)點(diǎn)組成，這些結(jié)點(diǎn)由局部網(wǎng)卡（NIC）通過高性能互聯(lián)網(wǎng)絡(luò)相互聯(lián)接每個(gè)結(jié)點(diǎn)相對獨(dú)立，并擁有一個(gè)或多個(gè)微處理器（P/C）MPP的各個(gè)結(jié)點(diǎn)均擁有不同的操作系統(tǒng)映像各個(gè)結(jié)點(diǎn)間的內(nèi)存模塊相互獨(dú)立，且不存在全局內(nèi)存單元的統(tǒng)一硬件編址MPP分類DM-MPP。每個(gè)結(jié)點(diǎn)僅包含一個(gè)微處理器，早期的MPP均屬于這一類。例如CRAYT3D、CRAYT3E、IntelParagon、IBMSP-2、YH-3等。SMP-MPP。每個(gè)結(jié)點(diǎn)是一臺SMP并行機(jī)，例如當(dāng)前位于Top500排名前列的多臺MPP并行機(jī)均屬于這一類，其中包括IBMASCIWhite、IntelASCIRed、IBMBluePacific等；DSM-MPP。每個(gè)結(jié)點(diǎn)是一臺DSM并行機(jī)，其典型代表為包含6144臺處理器的ASCIBlueMountainMPP并行機(jī)，它由48臺Origin2000構(gòu)成，其中每臺含128個(gè)微處理器。MPP的固有問題通信效率問題。在處理器數(shù)目很多的情況下，通信開銷是影響系統(tǒng)加速比的重要因素可靠性問題。MPP包含有大量的處理器等硬件，這使得系統(tǒng)發(fā)生故障的概率大大提高成本問題。大量的計(jì)算結(jié)點(diǎn)，專用的高帶寬、低延遲互連網(wǎng)絡(luò)，使得MPP的成本很容易就達(dá)到幾千萬美元。MPP項(xiàng)目的研發(fā)往往耗資巨大，主要由各國政府資助，很少有商業(yè)公司涉足，MPP系統(tǒng)也主要用于專業(yè)領(lǐng)域，也很少有商用MPP系統(tǒng)出現(xiàn)。典型MPP系統(tǒng)MPP模型Intel/SandiaASCIOptionRedIBMSP2SGI/CrayOrigin2000一個(gè)大型樣機(jī)的配置9072個(gè)處理器，1.8Tflop/s(NSL)400個(gè)處理器，100Gflop/s(MHPCC)128個(gè)處理器，51Gflop/s(NCSA)問世日期1996年12月1994年9月1996年10月處理器類型200MHz,200Mflop/sPentiumPro67MHz，267Mflop/sPOWER2200MHz，400Mflop/sMIPSR10000節(jié)點(diǎn)體系結(jié)構(gòu)和數(shù)據(jù)存儲器2個(gè)處理器，32到256MB主存，共享磁盤1個(gè)處理器，64MB到2GB本地主存，1GB到14.5GB本地磁盤2個(gè)處理器，64MB到256MB分布共享主存和共享磁盤互連網(wǎng)絡(luò)和主存模型分離兩維網(wǎng)孔，NORMA多級網(wǎng)絡(luò)，NORMA胖超立方體網(wǎng)絡(luò)，CC-NUMA節(jié)點(diǎn)操作系統(tǒng)輕量級內(nèi)核（LWK）完全AIX（IBMUNIX）微內(nèi)核CellularIRIX自然編程機(jī)制基于PUMAPortals的MPIMPI和PVMPowerC，PowerFortran其他編程模型Nx，PVM，HPFHPF，LindaMPI，PVMCluster(1)分類：大規(guī)模并行處理系統(tǒng)MPP集群工作站集群COW（ClusterofWorkstations）MPP集群設(shè)計(jì)策略：集群體系結(jié)構(gòu)標(biāo)準(zhǔn)環(huán)境標(biāo)準(zhǔn)編程模型系統(tǒng)可用性精選的單一系統(tǒng)映像Cluster(2)COW特征：分布式存儲，MIMD，工作站+商用互連網(wǎng)絡(luò)，每個(gè)節(jié)點(diǎn)是一個(gè)完整的計(jì)算機(jī)，有自己的磁盤和操作系統(tǒng)，使用SPMD（SingleProgramMultipleData）編程方式。COW優(yōu)點(diǎn)：投資風(fēng)險(xiǎn)小編程方便系統(tǒng)結(jié)構(gòu)靈活性能/價(jià)格比高能充分利用分散的計(jì)算資源可擴(kuò)展性好COW需解決的問題通信性能。盡管使用商品網(wǎng)絡(luò)可以降低集群系統(tǒng)的造價(jià)，使其獲得很高的性能/價(jià)格比，但商品網(wǎng)絡(luò)的通信性能有限，往往滿足不了一些對通信性能要求高的領(lǐng)域。并行應(yīng)用性能的提升。集群系統(tǒng)可以通過增加結(jié)點(diǎn)來達(dá)到更高的峰值運(yùn)算速度，但運(yùn)行在其上的并行應(yīng)用并不能不加修改的獲得更佳的性能。造成這種現(xiàn)象的主要原因是，用于集群的并行編程環(huán)境還不能實(shí)現(xiàn)自動(dòng)的數(shù)據(jù)分配和負(fù)載均衡。典型的集群系統(tǒng)典型的集群系統(tǒng)特點(diǎn)一覽表名稱系統(tǒng)特點(diǎn)Princeton:SHRIMPPC商用組件，通過專用網(wǎng)絡(luò)接口達(dá)到共享虛擬存儲，支持有效通信Karsruhe:Parastation用于分布并行處理的有效通信網(wǎng)絡(luò)和軟件開發(fā)Rice:TreadMarks軟件實(shí)現(xiàn)分布共享存儲的工作站集群Wisconsin:WindTunnel在經(jīng)由商用網(wǎng)絡(luò)互連的工作站集群上實(shí)現(xiàn)分布共享存儲Chica、Maryl、Penns:NSCP國家可擴(kuò)放集群計(jì)劃：在通過因特網(wǎng)互連的3個(gè)本地集群系統(tǒng)上進(jìn)行元計(jì)算Argonne:Globus在由ATM連接的北美17個(gè)站點(diǎn)的WAN上開發(fā)元計(jì)算平臺和軟件Syracuse:WWVM使用因特網(wǎng)和HPCC技術(shù)，在世界范圍的虛擬機(jī)上進(jìn)行高性能計(jì)算HKU:PearlCluster研究集群在分布式多媒體和金融數(shù)字庫方面的應(yīng)用Virgina:Legion在國家虛擬計(jì)算機(jī)設(shè)施上開發(fā)元計(jì)算軟件SMP/MPP/集群比較系統(tǒng)特征SMPMPP集群節(jié)點(diǎn)數(shù)量(N)

O(10)O(100)-O(1000)

O(100)節(jié)點(diǎn)復(fù)雜度中粒度或細(xì)粒度細(xì)粒度或中粒度中粒度或粗粒度節(jié)點(diǎn)間通信

共享存儲器消息傳遞或共享變量（有DSM時(shí)）消息傳遞節(jié)點(diǎn)操作系統(tǒng)1N(微內(nèi)核)和1個(gè)主機(jī)OS(單一)N(希望為同構(gòu))支持單一系統(tǒng)映像永遠(yuǎn)部分希望地址空間單一多或單一（有DSM時(shí)）多個(gè)作業(yè)調(diào)度單一運(yùn)行隊(duì)列主機(jī)上單一運(yùn)行隊(duì)列協(xié)作多隊(duì)列網(wǎng)絡(luò)協(xié)議非標(biāo)準(zhǔn)非標(biāo)準(zhǔn)標(biāo)準(zhǔn)或非標(biāo)準(zhǔn)可用性通常較低低到中高可用或容錯(cuò)性能/價(jià)格比一般一般高互連網(wǎng)絡(luò)總線/交叉開關(guān)定制商用計(jì)算機(jī)性能量化評價(jià)方法計(jì)算機(jī)組成與體系結(jié)構(gòu)性能指標(biāo)、模型及定律如何評價(jià)計(jì)算機(jī)的性能？計(jì)算機(jī)用戶程序運(yùn)行時(shí)間響應(yīng)時(shí)間管理員吞吐量（throughput）單位時(shí)間內(nèi)所能完成的工作量宏觀評價(jià)指標(biāo)響應(yīng)時(shí)間服務(wù)時(shí)間等待時(shí)間傳輸時(shí)間吞吐量：單位時(shí)間內(nèi)完成事務(wù)/任務(wù)的數(shù)量功耗動(dòng)態(tài)功耗Consumedbyactivityinacircuit靜態(tài)功耗ConsumedwhenpoweredonbutidleActivePower

Capacitance~chipareaVoltagefrequencyActivityfactorStaticPowerVoltageLeakage基本性能指標(biāo)機(jī)器字長存儲容量內(nèi)存外存處理器評價(jià)指標(biāo)MIPS(MillionInstructionPerSecond)FLOPS(FloatingPointOperationPerSecond)CPI(CyclePerInstruction)TOPS(TeraOperationsperSecond)MIPS程序的執(zhí)行時(shí)間為：MIPS的缺陷MIPS依賴于指令集，所以用MIPS來比較指令集不同的機(jī)器的性能的好壞是很不準(zhǔn)確的在同一臺機(jī)器上，MIPS因程序而異，有時(shí)變化是很大的MIPS可能與性能相反MFLOPSMillionFloatingPointOperationsPerSecond基于操作而不是基于指令的，所以它可以用來比較兩種不同的機(jī)器MFLOPS的局限性MFLOPS取決于機(jī)器和程序兩個(gè)方面只能用來衡量機(jī)器浮點(diǎn)運(yùn)算操作的性能，而不能體現(xiàn)機(jī)器的整體性能不同機(jī)器上浮點(diǎn)運(yùn)算集不同，另外MFLOPS還依賴于操作類型CPI和CPU執(zhí)行時(shí)間每條計(jì)算機(jī)指令執(zhí)行所需的時(shí)鐘周期，有時(shí)簡稱為指令的平均周期數(shù)。主頻，即CPU內(nèi)核工作的時(shí)鐘頻率（CPUClockSpeed）CPU執(zhí)行時(shí)間：表示CPU執(zhí)行一段程序所占用的CPU時(shí)間

加速比&效率加速比S(n)：由單處理器求解一個(gè)給定任務(wù)實(shí)例所需時(shí)間與由n個(gè)處理器組成的并行系統(tǒng)求解同一實(shí)例所需時(shí)間的比值。效率E(n)

：加速比與處理器數(shù)n的比值，即E(n)=S(n)/n。效率是對每個(gè)處理器可獲得加速的度量，可用來衡量多個(gè)處理器的利用率。E(n)的取值在0與1之間。理想性能模型E(n)=1不考慮通信開銷，全部程序都可通過并行執(zhí)行加速考慮通信開銷的模型若tc

<<ts，則加速比近似等于n；若tc

>>ts，則加速比近似等于ts/tc<<1；若tc

=ts，則加速比為

，當(dāng)n>>1時(shí)，近似為1。具有串行部分的模型-無通信開銷具有串行部分的模型-有通信開銷Amdahl定律突破Amdahl定律GrowthinprocessorperformanceGrowthinclockrateRulesofThumbAmdahl/CaseRule:Abalancedcomputersystemneedsabout1MBofmainmemorycapacityand1megabitpersecondofI/ObandwidthperMIPSofCPUperformance.90/10LocalityRule:Aprogramexecutesabout90%ofitsinstructionsin10%ofitscode.BandwidthRule:Bandwidthgrowsbyatleastthesquareoftheimprovementinlatency.2:1CacheRule:Themissrateofadirect-mappedcacheofsizeNisaboutthesameasatwo-waysetassociativecacheofsizeN/2.DependabilityRule:Designwithnosinglepointoffailure.Watt-YearRule:ThefullyburdenedcostofaWattperyearinaWarehouseScaleComputerinNorthAmericain2011,includingthecostofamortizingthepowerandcoolinginfrastructure,isabout$2.ComputerArchitectureFormulasComputerArchitectureFormulas基準(zhǔn)性能測試基準(zhǔn)測試程序基準(zhǔn)測試程序（benchmark）集是指使用一組專門設(shè)計(jì)的整數(shù)或浮點(diǎn)數(shù)程序，去測試待測計(jì)算機(jī)系統(tǒng)性能的不同方面四種來源實(shí)際的應(yīng)用程序核心程序：實(shí)際程序中抽取少量關(guān)鍵循環(huán)程序段玩具基準(zhǔn)測試程序：通常只有10-100行而且運(yùn)行結(jié)果是可以預(yù)知的綜合基準(zhǔn)測試程序：它類似于核心程序，但它考慮了各種操作和各種程序的比例常用的基準(zhǔn)測試程序Linpack(Linearsystempackage)：用IEEE754雙精度64位字長的子程序求解100階線性方程組的速度，測試結(jié)果以Mflops或Gflops為單位給出LAPACK(LinearAlgebraPACKage)ScaLAPACK(ScalableLAPACK)Linpack(1)Linpack是線性系統(tǒng)軟件包（Linearsystempackage）的縮寫20世紀(jì)70年代中期開始，國際上曾開發(fā)過一批基于FORTRAN語言的求解線性代數(shù)方程組的子程序，并于1979年正式發(fā)布了Linpack包Linpack測試的基準(zhǔn)是用IEEE754雙精度64位字長的子程序求解100階線性方程組的速度，測試結(jié)果以Mflops或Gflops為單位給出Linpack也被廣泛的應(yīng)用于實(shí)際計(jì)算中，用來分析和求解線性方程組和線性最小二乘法問題Linpack測試包括三類，Linpack100、Linpack1000和HPL(HighPerformanceLinpack)Linpack(2)目前，TOP500仍以執(zhí)行Linpack測試的峰值運(yùn)算速度作為排名依據(jù)使用Linpack基準(zhǔn)測試一般需要和收集的信息包括：Rpeak：它是系統(tǒng)的最大理論峰值性能，按Gflops表示；Nmax：給出有最高Gflops值的矩陣規(guī)?；騿栴}規(guī)模；Rmax：在Nmax規(guī)定的問題規(guī)模下，達(dá)到的最大Gflops。綜合基準(zhǔn)測試集——SPECStandardPerformanceEvaluationCorporation是一個(gè)非營利性組織，于1988年成立SPEC的基準(zhǔn)測試程序全部選自實(shí)際的應(yīng)用程序，提供標(biāo)準(zhǔn)、公正并可在各種硬件結(jié)構(gòu)間進(jìn)行高強(qiáng)度計(jì)算性能比較的方法它所發(fā)布的測試結(jié)果已經(jīng)成為世界公認(rèn)的計(jì)算機(jī)性能評價(jià)標(biāo)準(zhǔn)之一與Linpack有所不同，SPEC是一個(gè)合成（綜合）的基準(zhǔn)測試程序集，既包括浮點(diǎn)數(shù)運(yùn)算測試，也包括整數(shù)運(yùn)算測試/SPEC92SPEC92由兩套測試程序組成：CINT92和CFP92CINT92由6個(gè)測試整數(shù)性能的C程序組成，而CFP92則由14個(gè)測試浮點(diǎn)性能的C和FORTRAN程序組成在SPEC92中，SPECratio代表實(shí)際執(zhí)行指定程序時(shí)間和預(yù)先確定的參照時(shí)間（通常取VAX11/780的執(zhí)行時(shí)間）兩者的比值SPEC92整數(shù)程序(CINT92)程序描述compress壓縮/解壓縮工具espresso化簡布爾函數(shù)的程序gccGNU編譯器eqntott邏輯設(shè)計(jì)程序sc電子表格程序liLisp解釋器SPEC92浮點(diǎn)程序(CFP92)程序描述/領(lǐng)域alvinn神經(jīng)網(wǎng)絡(luò)/機(jī)器人doduce核反應(yīng)堆模擬/物理學(xué)ear耳朵模擬/醫(yī)學(xué)fpppp電子積分/化學(xué)hydro2d噴氣計(jì)算/天體物理mdljdp2運(yùn)動(dòng)方程/化學(xué)（雙精度）mdljsp2運(yùn)動(dòng)方程/化學(xué)（單精度）nasa7浮點(diǎn)內(nèi)核ora光線跟蹤/光學(xué)spice電路模擬器/電路設(shè)計(jì)su2cor粒子質(zhì)量/量子物理學(xué)swm256水方程求解器/模擬tomcatv網(wǎng)格生成程序wave5麥克斯韋方程式求解器SPECbenchmarks高性能計(jì)算術(shù)語高性能計(jì)算（HPC/HEC）：沒有一個(gè)嚴(yán)格的定義HPC：HighPerformanceComputing，高性能計(jì)算HEC：HighEndComputing，高端計(jì)算并行計(jì)算：ParallelComputing彼此關(guān)系高性能計(jì)算=并行計(jì)算高性能計(jì)算機(jī)=并行計(jì)算機(jī)不很嚴(yán)格，但得到了廣泛的認(rèn)可需要高性能計(jì)算技術(shù)？時(shí)間復(fù)雜度n=10n=30n=60n0.01毫秒0.03毫秒0.06毫秒n20.1毫秒0.9毫秒3.6毫秒n50.1秒24.3秒13.0分鐘2n1.0毫秒17.9分鐘366.0世紀(jì)3n0.06毫秒6.5年1.3×1013世紀(jì)人類對計(jì)算能力的需求永無止境時(shí)間代價(jià)表（每秒處理1,000,000次基本操作的PC機(jī)）高性能計(jì)算的三類需求計(jì)算密集(computeintensive)如大型科學(xué)工程計(jì)算、數(shù)值模擬等數(shù)據(jù)密集(dataintensive)數(shù)字圖書館、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘等網(wǎng)絡(luò)密集(networkintensive)協(xié)同工作、遙控、遠(yuǎn)程醫(yī)療等高性能計(jì)算技術(shù)的重要性許多高精尖應(yīng)用領(lǐng)域?qū)τ?jì)算能力的極大需求，使高性能計(jì)算技術(shù)成為了決定軍事、經(jīng)濟(jì)和科技領(lǐng)先地位的關(guān)鍵因素構(gòu)造高性能計(jì)算機(jī)就成為該技術(shù)的核心內(nèi)容高性能計(jì)算機(jī)更是國家綜合國力的象征各國政府都不惜投入巨資開發(fā)自己的高性能計(jì)算機(jī)研究背景高性能計(jì)算機(jī)的開發(fā)具有極為濃厚的政治軍事背景美國政府擔(dān)心其它核武器擁有國對美國國防形成核威脅，試圖全面限制核試驗(yàn)，但禁止核試驗(yàn)和限制核武器的發(fā)展，使美國把核技術(shù)作為決定性武器來發(fā)展的傳統(tǒng)戰(zhàn)略陷入困境美國能源部推出了ASCI計(jì)劃，以擺脫核武器發(fā)展面臨的困境ASCI計(jì)劃的目的，是利用高技術(shù)創(chuàng)造核武器試驗(yàn)的虛擬空間，并在這個(gè)空間中開展虛擬試驗(yàn)（VirtualTesting），高性能計(jì)算機(jī)的研制是ASCI計(jì)劃的重要組成部分美國ASCI計(jì)劃(1)全稱為AcceleratedStrategicComputingInitiative，加速戰(zhàn)略計(jì)算創(chuàng)新1996年6月由美國能源部聯(lián)合三大核武器實(shí)驗(yàn)室（圣地亞哥、洛斯·阿拉莫斯、勞倫斯·利弗莫爾國家實(shí)驗(yàn)室）共同提出ASCI計(jì)劃的目的在2010年之前開發(fā)出高性能、全系統(tǒng)、全物理現(xiàn)象的預(yù)測程序以支持核武器的性能評定、更新過程分析、偶發(fā)事件的分析及確認(rèn)刺激美國計(jì)算機(jī)工業(yè)的發(fā)展。

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法

文檔簡介

溫馨提示

最新文檔

評論

計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

計(jì)算機(jī)組成與體系結(jié)構(gòu) 課件 13多處理機(jī)系統(tǒng)、14計(jì)算機(jī)性能量化評價(jià)方法