計(jì)算機(jī)系統(tǒng)的軟硬取舍、性能評(píng)測(cè)及定量設(shè)計(jì)原理.ppt_第1頁(yè)
計(jì)算機(jī)系統(tǒng)的軟硬取舍、性能評(píng)測(cè)及定量設(shè)計(jì)原理.ppt_第2頁(yè)
計(jì)算機(jī)系統(tǒng)的軟硬取舍、性能評(píng)測(cè)及定量設(shè)計(jì)原理.ppt_第3頁(yè)
計(jì)算機(jī)系統(tǒng)的軟硬取舍、性能評(píng)測(cè)及定量設(shè)計(jì)原理.ppt_第4頁(yè)
計(jì)算機(jī)系統(tǒng)的軟硬取舍、性能評(píng)測(cè)及定量設(shè)計(jì)原理.ppt_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1-3 計(jì)算機(jī)系統(tǒng)的軟硬取舍、性能評(píng)測(cè)及定量設(shè)計(jì)原理,基本內(nèi)容: 軟、硬取舍的基本原則 計(jì)算機(jī)系統(tǒng)的性能評(píng)測(cè) 計(jì)算機(jī)系統(tǒng)的定量設(shè)計(jì)原理 計(jì)算機(jī)系統(tǒng)設(shè)計(jì)者的主要任務(wù) 計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)思路 計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)步驟,計(jì)算機(jī)系統(tǒng)的軟、硬件功能分配,發(fā)展,不可編程,目前計(jì)算機(jī),最少硬件,軟件,硬件,軟 硬 件 比 例,控制流程的三種實(shí)現(xiàn)方法,全硬件、軟硬件結(jié)合、全軟件 邏輯上等價(jià) 硬件實(shí)現(xiàn):速度快、成本高;靈活性差、占用內(nèi)存少 軟件實(shí)現(xiàn):速度慢、復(fù)制費(fèi)用低;靈活性好、占用內(nèi)存多、易設(shè)計(jì)、可改性強(qiáng)、適應(yīng)性強(qiáng)、設(shè)計(jì)周期短; 發(fā)展趨勢(shì) 硬件實(shí)現(xiàn)的比例越來(lái)越高 硬件所占的成本越來(lái)越低,軟硬件實(shí)現(xiàn)的優(yōu)缺點(diǎn),計(jì)算機(jī)系統(tǒng)的軟、硬件成本變化,七十年代,硬件,軟件,成本,年代,軟硬取舍的基本原則,很高的性能價(jià)格比 設(shè):D為研制設(shè)計(jì)費(fèi)用,M為重復(fù)生產(chǎn)費(fèi)用 h為硬件,s為軟件。 則: 設(shè)C為該功能在軟件實(shí)現(xiàn)時(shí)需重新設(shè)計(jì)的次數(shù); R:存儲(chǔ)介質(zhì)上出現(xiàn)的次數(shù); V:生產(chǎn)的臺(tái)數(shù); 則硬件的費(fèi)用: 軟件的費(fèi)用:,軟硬取舍的基本原則(續(xù)),則只有: 用硬件實(shí)現(xiàn)才是適宜的。 將上述帶入 : 可見(jiàn):只有在C和R的值較大時(shí),才成立。 由于: 則: 因?yàn)椋篊100 所以V值越大,上式成立。即產(chǎn)量大。,軟硬取舍的基本原則(續(xù)),考慮到準(zhǔn)備采用和可能采用的組成技術(shù),使它盡可能不要過(guò)多或不合理地限制各種組成、實(shí)現(xiàn)技術(shù)的采用; 不能僅從“硬”的角度去考慮如何便于應(yīng)用組成技術(shù)的成果和發(fā)揮器件技術(shù)的進(jìn)展,還應(yīng)從“軟”的角度把為編譯和操作系統(tǒng)的實(shí)現(xiàn),以至高級(jí)語(yǔ)言程序的設(shè)計(jì)提供更多更好的硬件支持放在首位;,軟硬取舍的基本原則(續(xù)),考慮用戶(hù)的應(yīng)用領(lǐng)域:專(zhuān)用硬件 設(shè)計(jì)周期長(zhǎng)的硬件不宜采用 常用的功能盡量采用硬件實(shí)現(xiàn) 實(shí)現(xiàn)功能的價(jià)格性能比要低 盡量采用新技術(shù)實(shí)現(xiàn)超前設(shè)計(jì),舉例1-3-1:,某一計(jì)算機(jī)用于商業(yè)外貿(mào)的事務(wù)處理,有大量的字符串操作。由于這種事務(wù)處理很普遍,有較大的市場(chǎng),故而設(shè)計(jì)人員決定在下一代此類(lèi)計(jì)算機(jī)的CPU中加入字符串操作的功能。經(jīng)測(cè)試應(yīng)用軟件調(diào)查發(fā)現(xiàn),字符串操作的使用占整個(gè)程序運(yùn)行時(shí)間的50%,而增加此功能如用軟件(如微程序)實(shí)現(xiàn),則快5倍,增加CPU成本1/5倍;如果用硬件實(shí)現(xiàn),則快100倍,CPU成本增加到5倍。問(wèn)設(shè)計(jì)人員提出增加此功能是否恰當(dāng)?是否用軟件還是硬件? 設(shè)CPU成本占整機(jī)成本的1/3。,硬件實(shí)現(xiàn),軟件實(shí)現(xiàn),舉例1-3-2:,如果上例中,字符串操作功能的使用時(shí)間占整個(gè)程序運(yùn)行時(shí)間的90%,則情況如何?,硬件實(shí)現(xiàn),軟件實(shí)現(xiàn),計(jì)算機(jī)系統(tǒng)的評(píng)測(cè),性能指標(biāo)體現(xiàn)在時(shí)間和空間 峰值性能:在理想情況下計(jì)算機(jī)系統(tǒng)可獲得的最高理論性能值,它不能反映出系統(tǒng)的實(shí)際性能 實(shí)際性能(持續(xù)性能):只是峰值性能的5%-30%,持續(xù)性能的表示,算術(shù)性能平均值: 調(diào)和性能平均值: 幾何性能平均值:,加權(quán)算術(shù)平均值: 加權(quán)調(diào)和平均值: 加權(quán)幾何平均值:,CPU性能公式,CPU的性能取決于三個(gè)要素: 時(shí)鐘頻率fc (或時(shí)鐘周期t); 每條指令所花的時(shí)鐘周期數(shù)CPI; 指令條數(shù)IC 一個(gè)程序所花的CPU時(shí)間(T)可以用兩種方式來(lái)表示: CPU時(shí)間(T)=CPU時(shí)鐘周期數(shù)(CPIIC)*時(shí)鐘周期長(zhǎng)(t),每條指令的平均時(shí)鐘周期數(shù):,計(jì)算CPU的程序時(shí)間: IC (Instruction Counter):程序執(zhí)行的總指令條數(shù) CPI (Cycles Per Instruction):平均每條指令的時(shí)鐘周期 fc:主時(shí)鐘頻率,假設(shè)系統(tǒng)共有n種指令,第i種指令在程序中出現(xiàn)的次數(shù)為Ii, 這樣:,MIPS(Million Instruction Per Second),MFLOPS(Million Floating Point Per Second),評(píng)測(cè)方法,采用實(shí)際的應(yīng)用程序測(cè)試 如:C語(yǔ)言的編譯程序,CAD應(yīng)用:Spice 采用核心程序測(cè)試 從實(shí)際程序中抽出關(guān)鍵部分組合而成 合成測(cè)試程序 人為寫(xiě)的核心程序,規(guī)模小,結(jié)果預(yù)知 綜合基準(zhǔn)測(cè)試程序 人為平衡編制基準(zhǔn)測(cè)試程序,與實(shí)際應(yīng)用差別較大,所測(cè)得的性能往往不真實(shí),計(jì)算機(jī)系統(tǒng)的定量設(shè)計(jì)原理,哈夫曼壓縮原理 Amdahl定律 程序訪(fǎng)問(wèn)的局部性規(guī)律,哈夫曼壓縮原理,盡可能加速高概率事件遠(yuǎn)比加速處理概率很低的事件對(duì)性能提高要顯著。,Amdahl 定律,Make the common case fast 例如:CPU中的加法,溢出情況。 這是計(jì)算機(jī)設(shè)計(jì)中最重要也最廣泛采用的設(shè)計(jì)準(zhǔn)則。使經(jīng)常性事件的處理速度加快能明顯提高整個(gè)系統(tǒng)的性能。,Amdahl定律(續(xù)),系統(tǒng)對(duì)某一部件采用某種更快執(zhí)行方式所能獲得的系統(tǒng)性能改進(jìn),取決于這種執(zhí)行方式被使用的頻率,或所占總執(zhí)行時(shí)間的比例。,Amdahl定律(續(xù)),定義了加速比的大小,Amdahl加速比(續(xù)),例1-3-3,假設(shè)將某系統(tǒng)的某一部件的處理速度加快到10倍,但該部件的原處理時(shí)間僅為整個(gè)運(yùn)行時(shí)間的40%,則采用加快措施后能使整個(gè)系統(tǒng)的性能提高多少? 解:由題意可知:fe=0.4, re=10,根據(jù)Amdahl定律,例1-3-4,采用哪種實(shí)現(xiàn)技術(shù)來(lái)求浮點(diǎn)數(shù)平方根FPSQR的操作對(duì)系統(tǒng)的性能影響較大。假設(shè)FPSQR操作占整個(gè)測(cè)試程序執(zhí)行時(shí)間的20%。 一種實(shí)現(xiàn)方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。 另一種實(shí)現(xiàn)方法是使所有浮點(diǎn)數(shù)據(jù)指令的速度加快,使FP指令的速度加快到2倍,還假設(shè)FP指令占整個(gè)執(zhí)行時(shí)間的50%。請(qǐng)比較這兩種設(shè)計(jì)方案。,解:分別計(jì)算出這兩種設(shè)計(jì)方案所能得到的加速比:,性能遞減規(guī)則 如果僅僅對(duì)計(jì)算機(jī)中的一部分做性能改進(jìn),則改進(jìn)越多,系統(tǒng)獲得的效果越小。 推論:如果只針對(duì)整個(gè)任務(wù)的一部分進(jìn)行優(yōu)化,那么所獲得的加速比不大于1/(1-fe)。 一個(gè)“好”的計(jì)算機(jī)系統(tǒng):具有高性?xún)r(jià)比的計(jì)算機(jī)系統(tǒng)是一個(gè)帶寬平衡的系統(tǒng),而不是看它的某些部件的性能 。,Amdahl定律(續(xù)),CPU性能公式,CPU的性能取決于三個(gè)要素: 時(shí)鐘頻率f(或時(shí)鐘周期t); 每條指令所花的時(shí)鐘周期數(shù)CPI; 指令條數(shù)IC 一個(gè)程序所花的CPU時(shí)間(T)可以用兩種方式來(lái)表示: CPU時(shí)間(T)=CPU時(shí)鐘周期數(shù)(CPIIC)*時(shí)鐘周期長(zhǎng)(t),每條指令的平均時(shí)鐘周期數(shù):,例1-3-5,如果FP操作的比例為25%,F(xiàn)P操作的平均CPI=4.0,其它指令的平均CPI為1.33,F(xiàn)PSQR操作的比例為2%, FPSQR的CPI為20。假設(shè)有兩種設(shè)計(jì)方案,分別把FPSQR操作的CPI和所有FP操作的CPI減為2。試?yán)肅PU性能公式比較這兩種設(shè)計(jì)方案哪一個(gè)更好(只改變CPI而時(shí)鐘頻率和指令條數(shù)保持不變)。,解:原系統(tǒng)的CPI=25%4+75%1.33=2 方案1(使FPSQR操作的CPI為2)系統(tǒng) CPI=CPI原-2%(20-2)=2-2%18=1.64 方案2(提高所有FP指令的處理速度)系統(tǒng) CPI=CPI原-25%(4-2)=2-25%2=1.5 我們也可以根據(jù)以下公式計(jì)算出方案2系統(tǒng)的CPI CPI= 75%1.33+25%2=1.5 顯然,提高所有FP指令處理速度的方案要比提高FPSQR處理速度的方案要好。方案2的加速比=2/1.5= 1.33,假設(shè)我們考慮條件分支指令的兩種不同設(shè)計(jì)方法如下: (1) CPU1:通過(guò)比較指令設(shè)置條件碼,然后測(cè)試條件碼進(jìn)行分支。 (2) CPU2:在分支指令中包括比較過(guò)程 在兩種CPU中,條件分支指令都占用2個(gè)時(shí)鐘周期而所有其它指令占用1個(gè)時(shí)鐘周期,對(duì)于CPU1,執(zhí)行的指令中分支指令占20%;由于每個(gè)分支指令之前都需要有比較指令,因此比較指令也占20%。,例1-3-6,由于CPU1在分支時(shí)不需要比較,因此假設(shè)它的時(shí)鐘周期時(shí)間比CPU2快1.25倍。哪一個(gè)CPU更快? 如果CPU1的時(shí)鐘周期時(shí)間僅僅比CPU2快1.1倍,哪一個(gè)CPU更快呢? 解:我們不考慮所有系統(tǒng)問(wèn)題,所以可用CPU性能公式。占用2個(gè)時(shí)鐘周期的分支指令占總指令的20%,剩下的指令占用1個(gè)時(shí)鐘周期。所以 CPI1 = 0.2 2 + 0.80 1 = 1.2 則CPU性能為: 總CPU時(shí)間1 = IC 1.2 時(shí)鐘周期1,根據(jù)假設(shè),有: 時(shí)鐘周期2 = 1.25 時(shí)鐘周期1 在CPU2中沒(méi)有獨(dú)立的比較指令,所以CPU2的程序量為CPU1的80%,分支指令的比例為: 20%/80% = 25% 這些分支指令占用2個(gè)時(shí)鐘周期,而剩下的75%的指令占用1個(gè)時(shí)鐘周期,因此: CPI2= 0.25 2 + 0.75 1 = 1.25 因?yàn)镃PU2不執(zhí)行比較,故: IC2= 0.8 IC1,因此CPU2性能為: 總CPU時(shí)間2 = IC2 CPI2 時(shí)鐘周期2 = 0.8 IC1 1.25 (1.25 時(shí)鐘周期1) = 1.25 IC1 時(shí)鐘周期1 在這些假設(shè)之下,盡管CPU2執(zhí)行指令條數(shù)較少,CPU1因?yàn)橛兄痰臅r(shí)鐘周期,所以比CPU2快。,如果CPU1的時(shí)鐘周期時(shí)間僅僅比CPU2快1.1倍,則 時(shí)鐘周期2= 1.10 時(shí)鐘周期1 CPU2的性能為: 總CPU時(shí)間2 = IC2 CPI2 時(shí)鐘周期2 = 0.8 IC1 1.25 (1.10 時(shí)鐘周期1) = 1.10 IC1 時(shí)鐘周期1 因此CPU2由于執(zhí)行更少指令條數(shù),比CPU1運(yùn)行更快。,程序訪(fǎng)問(wèn)的局部性規(guī)律,局部性分時(shí)間上的局部性和空間上的局部性 時(shí)間局部性:程序中近期被訪(fǎng)問(wèn)的信息項(xiàng)很可能馬上將被再次訪(fǎng)問(wèn)。 空間局部性:指那些在訪(fǎng)問(wèn)地址上相鄰近的信息項(xiàng)很可能會(huì)被一起訪(fǎng)問(wèn)。 存儲(chǔ)器體系的構(gòu)成就是以訪(fǎng)問(wèn)的局部性原理為基礎(chǔ)的。,計(jì)算機(jī)系統(tǒng)設(shè)計(jì)者的主要任務(wù),滿(mǎn)足用戶(hù)對(duì)功能上的要求以及相應(yīng)的價(jià)格性能要求 滿(mǎn)足功能要求的基礎(chǔ)上,進(jìn)行優(yōu)化設(shè)計(jì) 設(shè)計(jì)應(yīng)能適應(yīng)日后的發(fā)展趨勢(shì),硬件與軟件的發(fā)展,硬件: 晶體管數(shù): 增加25%/年, 三年一倍 DRAM的密度: 增加60%/年, 二年三倍 訪(fǎng)存周期: 減少33%/十年 硬盤(pán)密度: 增加25%/年 訪(fǎng)問(wèn)時(shí)間: 減少33%/十年 軟件: 程序空間: 增加1.52位/年 地址: 增加0.51位/年,計(jì)算機(jī)系統(tǒng)設(shè)計(jì)思路,由上往下(Top-down) 由下往上(Bottom-up) 由中間開(kāi)始(Middle-out),由上往下(Top-down),設(shè)計(jì)過(guò)程:由上向下 面向應(yīng)用的數(shù)學(xué)模型 面向應(yīng)用的高級(jí)語(yǔ)言 面向這種應(yīng)用的操作系統(tǒng) 面向操作系統(tǒng)和高級(jí)語(yǔ)言的機(jī)器語(yǔ)言 面向機(jī)器語(yǔ)言的微指令系統(tǒng)和硬件實(shí)現(xiàn) 應(yīng)用場(chǎng)合:專(zhuān)用計(jì)算機(jī)的設(shè)計(jì)(早期計(jì)算機(jī)的設(shè)計(jì)) 特點(diǎn):對(duì)于所面向的應(yīng)用領(lǐng)域,性能和性能價(jià)格比很高,應(yīng)用對(duì)象變了,難以適應(yīng)。 隨著通用計(jì)算機(jī)價(jià)格降低,目前已經(jīng)很少采用,由下往上(Bottom-up),設(shè)計(jì)過(guò)程: 根據(jù)當(dāng)時(shí)的器件水平,設(shè)計(jì)微程序機(jī)器級(jí)和傳統(tǒng)機(jī)器級(jí)。 根據(jù)不同的應(yīng)用領(lǐng)域設(shè)計(jì)多種操作系統(tǒng)、匯編語(yǔ)言、高級(jí)語(yǔ)言編譯器等。 最后設(shè)計(jì)面向應(yīng)用的虛擬機(jī)器級(jí)。 應(yīng)用場(chǎng)合: 在計(jì)算機(jī)早期設(shè)計(jì)中(6070年代)廣為采用 特點(diǎn): 容易使軟件和硬件脫節(jié) 軟件被動(dòng),某些性能指標(biāo)不確切 整個(gè)計(jì)算機(jī)系統(tǒng)的效率降低。,由 下 往 上 設(shè) 計(jì),由中間開(kāi)始(Middle-out),設(shè)計(jì)過(guò)程: 首先定義軟硬件的分界面,包括:指令系統(tǒng)、存儲(chǔ)系統(tǒng)、輸入輸出系統(tǒng)、中斷系統(tǒng)、硬件對(duì)操作系統(tǒng)和編譯系統(tǒng)的支持等 然后各個(gè)層次分別進(jìn)行設(shè)計(jì): 軟件設(shè)計(jì)人員設(shè)計(jì)操作系統(tǒng)、高級(jí)語(yǔ)言、匯編語(yǔ)言、應(yīng)用出現(xiàn)等; 硬件設(shè)計(jì)人員設(shè)計(jì)傳統(tǒng)機(jī)器、微程序、硬聯(lián)邏輯等 應(yīng)用場(chǎng)合:用于系列機(jī)的設(shè)計(jì) 特點(diǎn): 軟硬件的分界面在上升; 硬件價(jià)格下降,軟件價(jià)格上升; 軟

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論