高級計(jì)算機(jī)體系結(jié)構(gòu)第4章1_第1頁
高級計(jì)算機(jī)體系結(jié)構(gòu)第4章1_第2頁
高級計(jì)算機(jī)體系結(jié)構(gòu)第4章1_第3頁
高級計(jì)算機(jī)體系結(jié)構(gòu)第4章1_第4頁
高級計(jì)算機(jī)體系結(jié)構(gòu)第4章1_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1第四章性能評測2第一節(jié)性能評測概述一、并行計(jì)算機(jī)性能指標(biāo)1、硬件性能參數(shù)--反映硬件系統(tǒng)基本性能名稱符號含義量綱機(jī)器規(guī)模n處理器P的數(shù)量個時鐘頻率f時鐘周期長度的倒數(shù)MHz峰值速度

Rpeak=nR’peak并行機(jī)峰值速度Mflop/s通信延遲t0傳送0/1字節(jié)的時間us漸進(jìn)帶寬R∞長消息的通信速率MB/s

*硬件性能的輔助參數(shù):

存儲系統(tǒng)—主存/Cache容量、頁/塊大小、關(guān)聯(lián)度等;通信系統(tǒng)—通信服務(wù)、IN及NIC性能參數(shù)3名稱符號含義量綱工作負(fù)載W計(jì)算操作的數(shù)目MFlop順序執(zhí)行時間T1程序在單處理機(jī)上運(yùn)行時間s并行執(zhí)行時間Tn程序在并行機(jī)上運(yùn)行時間s速度Rn=W/Tn程序在并行機(jī)上運(yùn)行速度Mflop/s加速比Sn=T1/Tn并行機(jī)比單處理機(jī)速度的倍數(shù)無量綱效率En=Sn/n并行機(jī)硬件部件的利用率無量綱利用率U=Rn/Rpeak并行機(jī)峰值速度的利用率無量綱吞吐率TP=m/Tn(m)并行機(jī)單位時間內(nèi)處理任務(wù)數(shù)個/s2、系統(tǒng)性能指標(biāo)--反映軟硬件系統(tǒng)性能和可擴(kuò)放性

*程序參數(shù):問題規(guī)模、工作負(fù)載、負(fù)載不平衡開銷、工作集尺寸、通信-計(jì)算比、通信與同步開銷、并行性開銷等

*影響系統(tǒng)性能因素:硬件參數(shù)(結(jié)構(gòu)與速度)、程序參數(shù)(應(yīng)用與算法),及兩者的相互作用回7頁回13頁回23頁回24頁回27頁4二、為何要進(jìn)行性能評測1、購買者進(jìn)行性能評測的目的

主要是降低投資風(fēng)險(xiǎn),提高投資效益

·有利于選擇并行機(jī)型號(性/價(jià)、RARS、可擴(kuò)展性)

·有利于配置系統(tǒng)相關(guān)參數(shù)(需求、性能、性/價(jià))2、設(shè)計(jì)者進(jìn)行性能評測的目的

主要是為優(yōu)化設(shè)計(jì)提供量化依據(jù)

·有利于發(fā)現(xiàn)系統(tǒng)設(shè)計(jì)中存在的問題

·有利于合理地進(jìn)行軟/硬件功能分配,提高系統(tǒng)性/價(jià)

·有利于優(yōu)化結(jié)構(gòu)-算法-應(yīng)用的組合,設(shè)計(jì)高效算法5三、如何進(jìn)行性能評測

*系統(tǒng)性能指標(biāo):不同測試者所關(guān)心的性能指標(biāo)種類不同

*性能評測層次:機(jī)器級、算法級、程序級1、機(jī)器級性能評測

*評測內(nèi)容:

CPU及存儲器基本性能(Tn、Rn等);

并行與通信開銷(Tpar、t0、R∞等);

可用性、好用性(運(yùn)行正常百分比、環(huán)境及界面);

性能與成本

*評測方法:通過基準(zhǔn)測試程序,

不斷改變硬件參數(shù)進(jìn)行測試回7頁62、算法級性能評測

*評測內(nèi)容:應(yīng)用-算法-結(jié)構(gòu)組合的可擴(kuò)放性;

即給定應(yīng)用背景,系統(tǒng)擴(kuò)放時的性能

*評測方法:通過基準(zhǔn)測試程序,

不斷改變問題規(guī)模及機(jī)器規(guī)模進(jìn)行測試3、程序級性能評測

*評測內(nèi)容:各種系統(tǒng)性能(如Tn、Rn、U、TP等)

*評測方法:通過基準(zhǔn)測試程序進(jìn)行測試

*基準(zhǔn)測試程序種類:

按生成方式—真實(shí)、核心、小、綜合程序;

按應(yīng)用類型—科學(xué)計(jì)算、商業(yè)應(yīng)用、信息處理等;按程序功能—宏觀測試程序、微觀測試程序回15頁7第二節(jié)機(jī)器級性能評測一、CPU及存儲器的基本性能指標(biāo)轉(zhuǎn)5頁轉(zhuǎn)3頁

*基本性能指標(biāo):

并行執(zhí)行時間—

Tn=Tcomput+Tcomm+Tsync+Tpara

速度--

Rn=W

/Tn,為系統(tǒng)實(shí)際速度(非峰值)1n并行度時間1、CPU性能指標(biāo)

*基本參數(shù):工作負(fù)載(W

)、順序執(zhí)行時間(T1)

工作負(fù)載—計(jì)算量,常用指令或浮點(diǎn)運(yùn)算表示;(算法相關(guān))順序執(zhí)行時間—工作負(fù)載在單處理器上的執(zhí)行時間82、存儲器性能指標(biāo)

*存儲器層次結(jié)構(gòu):

各層性能指標(biāo)—容量C、延遲L、帶寬B;

相關(guān)參數(shù)—交換粒度、一致性粒度、層間管理方案等

*影響容量C設(shè)計(jì)的因素:

與應(yīng)用的進(jìn)程數(shù)及各進(jìn)程工作集尺寸等有關(guān)

*影響延遲L設(shè)計(jì)的因素:

與CPU主頻f、指令系統(tǒng)CPI及帶寬B等有關(guān)

*影響帶寬B設(shè)計(jì)的因素:

與應(yīng)用的數(shù)據(jù)通信量、通信頻率和通信延遲等有關(guān)REG一級Cache主存二級Cache磁盤遠(yuǎn)程存儲器9二、并行及通信開銷2、開銷量化方法

*測量準(zhǔn)備:選擇測量所用的參數(shù),它們會影響測量結(jié)果(數(shù)據(jù)結(jié)構(gòu)、語言及編譯器、通信硬件及協(xié)議、計(jì)時方法等)

*測量方法:

點(diǎn)點(diǎn)通信—乒-乓法、熱土豆(又稱救火隊(duì))法等

集合通信—較復(fù)雜,原則是盡量避免/減少額外干擾

*測量結(jié)果表示:

表格法、曲線法、表達(dá)式法等1、開銷來源

*并行開銷:包括進(jìn)程/進(jìn)程組管理、數(shù)據(jù)分配等時間

*通信開銷:包括通信及同步操作時間(軟硬件)103、開銷量化

*并行性開銷:

特性--生命周期中分期償還(總開銷/計(jì)算量);

量化—測量并行性開銷對應(yīng)的計(jì)算量;

如:POWER2處理器的T進(jìn)程創(chuàng)建=372,000T浮點(diǎn)運(yùn)算

結(jié)果—計(jì)算粒度較大時,才需要創(chuàng)建進(jìn)程

*點(diǎn)點(diǎn)通信(通信、互斥/事件等)開銷:

量化--測量t(m)=t0+m/R∞的各項(xiàng)參數(shù);

結(jié)果--根據(jù)t0與R∞關(guān)系確定最佳m(平衡設(shè)計(jì)原理)

*集合通信(廣播、集合、柵障等)開銷:

量化--測量t(m,n)=t0(n)+m/R∞(n)的各項(xiàng)參數(shù);

結(jié)果--根據(jù)測量確定軟/硬件功能分配(高性/價(jià))11三、可用性與好用性

*可用性的提高:

方法--增加MTTF,或減少M(fèi)TTR;

技術(shù)—分隔的冗余設(shè)備(雙管理機(jī)),

故障診斷、通知與接管(如系統(tǒng)監(jiān)控),

故障恢復(fù)(如檢查點(diǎn))等1、可用性

指系統(tǒng)正常運(yùn)行時間占總時間的百分比

*量化方法:根據(jù)實(shí)際使用情況進(jìn)行測量與統(tǒng)計(jì)

注意—排除環(huán)境、人為等因素的干擾122、好用性指用戶環(huán)境的好用性,包括環(huán)境系統(tǒng)及界面2方面

*并行機(jī)用戶環(huán)境:命令行+遠(yuǎn)程登錄、GUI+X協(xié)議、客戶GUI+服務(wù)器、瀏覽器+WEB服務(wù)器

*用戶環(huán)境系統(tǒng)的好用性:

·靈活、易擴(kuò)充和易集成;

·使應(yīng)用軟件開發(fā)與平臺無關(guān);

·用戶可不了解低層系統(tǒng)的實(shí)現(xiàn)細(xì)節(jié);

·提供單一系統(tǒng)映像

*用戶界面的好用性:

實(shí)用性(提供服務(wù))、高效性(提供幫助)、易學(xué)習(xí)性(簡單/易理解/風(fēng)格統(tǒng)一)、交互性(交互手段多)、美觀性(感覺好)13四、性能與成本2、性能/價(jià)格

指性能/買價(jià),性能常用速度(Rn)表示

※高性能/價(jià)格—性能或性能/成本不一定好3、成本有效性

指性能/成本,性能通常用利用率(U

)表示

※高性能/成本—體系結(jié)構(gòu)較為合理1、成本與價(jià)格

常見關(guān)系為:轉(zhuǎn)3頁原料成本直接成本毛利潤平均折扣原料成本直接成本原料成本毛利潤直接成本原料成本100%75%25%37.5%12.5%50%25.1%8.3%33.3%33.3%成本價(jià)格14第三節(jié)算法級性能評測一、并行計(jì)算性能參數(shù)

*研究加速比的目的:

+對并行算法,研究順序/并行部分對性能的影響;

+對算法-結(jié)構(gòu),研究基于結(jié)構(gòu)的并行性開發(fā)方法

※性能提高方法—有并行化和容量增加2方面1、加速比

指對給定應(yīng)用,并行相對于串行的性能提高程度

即Sn=T1/Tn=Rn

/R1,通常1≤Sn≤n

※給定應(yīng)用--指工作負(fù)載W

、處理器數(shù)n為給定值

*影響Sn的因素:算法并行性、并行機(jī)體系結(jié)構(gòu)152、可擴(kuò)放性

指對給定應(yīng)用背景,性能隨P增加(n)的按比例提高能力

即Ψ(n,n’)=[Sn(W)/n]/[Sn’(W’)/n’],Ψ(n,n’)∈(0,1)

※應(yīng)用背景—擴(kuò)放時對W

及Tn的要求或限制;

Ψ(n,n’)—為曲線,希望很快接近常數(shù)

*影響Ψ(n,n’)的因素:

算法并行性、并行體系結(jié)構(gòu)、應(yīng)用背景等

*研究可擴(kuò)放性的目的:

+對給定問題,選擇算法及結(jié)構(gòu),以充分利用可擴(kuò)充資源

+對給定應(yīng)用及算法,評測體系結(jié)構(gòu)的擴(kuò)放性能

+對給定結(jié)構(gòu),評測并行算法的擴(kuò)放性能+對給定可擴(kuò)充資源,指導(dǎo)改進(jìn)體系結(jié)構(gòu)和并行算法轉(zhuǎn)6頁回下頁回23頁*特征:反映應(yīng)用-算法-結(jié)構(gòu)組合的有效性(有效利用n)16二、擴(kuò)放模型及性能分析1、應(yīng)用背景與擴(kuò)放模型

*應(yīng)用背景種類:

①實(shí)時性要求較高—關(guān)注Tn,W可不變,如Web服務(wù)

②結(jié)果精度要求較高—關(guān)注Δ,Tn可不變,如天氣預(yù)報(bào)

③充分利用硬件資源—關(guān)注Un,Tn及W均可變,如計(jì)算中心

└→充分利用CPU和MEM等

*擴(kuò)放模型種類:

①固定負(fù)載擴(kuò)放模型—增加n(W固定),以減小Tn

②固定時間擴(kuò)放模型—增加n及W,以提高精度(保持Tn)

③存儲器受限擴(kuò)放模型—增加n及W,以提高Un

*擴(kuò)放模型性能分析:可用3個加速比性能定律進(jìn)行性能分析轉(zhuǎn)上頁回下頁回19頁回21頁172、Amdahl定律--適用于固定負(fù)載擴(kuò)放模型

*基本思想:W不變,增加n,以提高處理速度(減小Tn)

*定律公式:設(shè)W=fW+(1-f

)W,f為順序部分比例,則

*定律幾何意義:工作負(fù)載(a)固定負(fù)載T1n執(zhí)行時間(b)減少執(zhí)行時間

123

4f加速比Sn10240%1%2%3%4%(c)固定負(fù)載的加速比TpTpTpTpT1T1T1n

123

4WpW1WpW1WpW1WpW1××91×48×31×24轉(zhuǎn)上頁回下頁回19頁18

*引入開銷的加速比:設(shè)額外開銷為T0(含通信/同步/并行化)

*定律含義:

--性能分析

①對給定工作負(fù)載,Sn≤1/f;

②僅增加n,順序部分依然是瓶頸轉(zhuǎn)上頁193、Gustafson定律--適用于固定時間擴(kuò)放模型

*基本思想:保持Tn不變,增加n及W,以增加計(jì)算量(精度)

*定律公式:設(shè)W’=fW+(1-f

)nW,f

為順序部分比例,則

*定律幾何意義:工作負(fù)載執(zhí)行時間n

123

4TpT1TpT1TpT1TpT1W1n

123

4WpWpWpWpW1W1W1f加速比Sn10240%1%2%3%4%(c)固定時間的加速比××1014×××(a)規(guī)模擴(kuò)展的負(fù)載(b)固定執(zhí)行時間1004993983S1024=1024-1023f轉(zhuǎn)16頁轉(zhuǎn)17頁回下頁回21頁20

*定律含義:--性能分析

①當(dāng)W可擴(kuò)展以保持Tn不變時,Sn是n的線性函數(shù)

②當(dāng)n充分大、W’成比例增加時,順序部分不再是瓶頸

└→關(guān)鍵:順序部分fW基本不變轉(zhuǎn)上頁

*引入開銷的加速比:設(shè)額外開銷為T0(含通信/同步/并行化)214、Sun和Ni定律--適用于存儲器受限擴(kuò)放模型

*基本思想:增加n及W,以提高Un(充分利用CPU和MEM資源)

*定律公式:設(shè)W’=fW+(1-f

)G(n)W,f為順序部分比例,則

*定律幾何意義:工作負(fù)載執(zhí)行時間n

123

4TpT1TpT1TpT1TpT1W1n

123

4WpWpWpWpW1W1W1f加速比Sn10240%1%2%3%4%(c)存儲器受限的加速比××1016×××(a)規(guī)模擴(kuò)展的負(fù)載(b)執(zhí)行時間稍增1007999991G(n)=1.25n轉(zhuǎn)16頁轉(zhuǎn)19頁回下頁22

*定律含義:--性能分析

①若G(n)=1,Sn性能與Amdahl定律等效;

②若G(n)=n,Sn性能與Gustafson定律等效;

③若G(n)>n,Sn性能比固定負(fù)載、固定時間擴(kuò)放模型都高

└→即W增加速度>MEM增長速度

(n增長速度)Snn存儲器受限擴(kuò)放模型固定時間擴(kuò)放模型固定負(fù)載擴(kuò)放模型工作負(fù)載W(問題規(guī)模)機(jī)器規(guī)模n固定負(fù)載擴(kuò)放模型通信界限存儲器界限αδ固定時間擴(kuò)放模型γ存儲器受限擴(kuò)放模型轉(zhuǎn)上頁回下頁

*引入開銷的加速比:設(shè)額外開銷為T0(含通信/同步/并行化)23三、可擴(kuò)放性評測標(biāo)準(zhǔn)

*可擴(kuò)放性的特征:可用效率、速度、利用率等反映1、可擴(kuò)放性評測標(biāo)準(zhǔn)回下頁轉(zhuǎn)3頁轉(zhuǎn)上頁轉(zhuǎn)15頁度量方法—解析法、測量法

*可擴(kuò)放性的度量:

存在問題—W較大時T1(W)無法測量→Sn等無法測量解決方法—同時增加n及W,以保持性能不變,用所增加的W來衡量可擴(kuò)放性

*可擴(kuò)放性評測標(biāo)準(zhǔn):

現(xiàn)狀—無公認(rèn)的、定義嚴(yán)格的評測標(biāo)準(zhǔn)

標(biāo)準(zhǔn)--等效率標(biāo)準(zhǔn)、等速度標(biāo)準(zhǔn)、等延遲標(biāo)準(zhǔn)(解析法)(測量法)(測量法)回28頁242、等效率標(biāo)準(zhǔn)

用維持效率不變時,所需增加的W來度量可擴(kuò)放性*等效率需求:增大n時,需增大s,E才可能保持不變(1)等效率函數(shù)

設(shè)問題規(guī)模為s,工作負(fù)載W(s)為s的函數(shù),

并行開銷為T0(s,n)為s及n的函數(shù)

*等效率函數(shù):為保持效率E不變,增大n時增加W(s),此時W(s)與n的函數(shù)關(guān)系即為等效率函數(shù)

因E為常數(shù),則對上式求解方程,可得s

=y(tǒng)(n)

由效率公式得,W(s)=E/(1-E)×nT0(s,n)回下頁回26頁轉(zhuǎn)3頁

等效率函數(shù)為fE(n)=W(s)=W(

y(n))解析法25(2)可擴(kuò)放性評測*度量:對給定的等效率值,可獲得具體的等效率函數(shù)系統(tǒng)1效率EnE系統(tǒng)1=E系統(tǒng)2=E系統(tǒng)3等效率函數(shù)fE(n)n系統(tǒng)2系統(tǒng)31可擴(kuò)放性排序(好→差)結(jié)果:系統(tǒng)1→系統(tǒng)2→系統(tǒng)3

*等效率值的特性:等效率值E越小,可擴(kuò)放性越好效率EnE系統(tǒng)1=E系統(tǒng)2等效率函數(shù)fE(n)n系統(tǒng)1系統(tǒng)210.50.3轉(zhuǎn)上頁*評價(jià):等效率函數(shù)fE(n)越小,可擴(kuò)放性越好26

例—兩個N×N

矩陣相乘,W(s)=cN

3,A、B兩系統(tǒng)運(yùn)行時間分別為

、

,評價(jià)等效率值Ec分別保持1/3和1/4時,哪個系統(tǒng)具有更好的可擴(kuò)放性。

即當(dāng)Ec=1/3時,可擴(kuò)放性A、B系統(tǒng)相同

即當(dāng)Ec=1/4時,可擴(kuò)放性B系統(tǒng)比A系統(tǒng)好

(1)當(dāng)Ec=1/3時,1/3=cN

3/(cN

3+T0)

對A系統(tǒng)有,即

,等效率函數(shù)

對B系統(tǒng),等效率函數(shù)(2)當(dāng)Ec=1/4時,1/4=cN

3/(cN

3+h)

對A系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論