計算機基礎(chǔ)學(xué)習(xí)指導(dǎo)_第1頁
計算機基礎(chǔ)學(xué)習(xí)指導(dǎo)_第2頁
計算機基礎(chǔ)學(xué)習(xí)指導(dǎo)_第3頁
計算機基礎(chǔ)學(xué)習(xí)指導(dǎo)_第4頁
計算機基礎(chǔ)學(xué)習(xí)指導(dǎo)_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、計算機系統(tǒng)結(jié)構(gòu)網(wǎng)絡(luò)學(xué)習(xí)資料編者 文軍電子科技大學(xué)第 1 章 計算機系統(tǒng)結(jié)構(gòu)的基本概念授課內(nèi)容:本章主要論述計算機系統(tǒng)結(jié)構(gòu)的概念以及系統(tǒng)結(jié)構(gòu)和并行性的發(fā)展, 將引導(dǎo)讀者進入計 算機系統(tǒng)結(jié)構(gòu)這么一個新的領(lǐng)域。 首先, 在計算機系統(tǒng)層次結(jié)構(gòu)概念的基礎(chǔ)上, 講述了經(jīng)典 計算機體系結(jié)構(gòu)概念, 并進一步討論了計算機組成和計算機實現(xiàn)技術(shù), 在此基礎(chǔ)上, 我們可 以更好地理解現(xiàn)代計算機體系結(jié)構(gòu)所研究的范圍和內(nèi)容。1.1 引言計算機系統(tǒng)結(jié)構(gòu)作為一門學(xué)科, 主要是研究軟件、 硬件功能分配和對軟件、 硬件界面的 確定,即哪些功能由軟件完成,哪些功能由硬件完成。1.2 計算機系統(tǒng)結(jié)構(gòu)的概念 計算機系統(tǒng)由硬件器件和軟件

2、組成,按功能劃分成多級層次結(jié)構(gòu)。計算機系統(tǒng)結(jié)構(gòu), 計算機組成和計算機實現(xiàn)是三個不同的概念。 計算機系統(tǒng)結(jié)構(gòu)是計算機系統(tǒng)的軟硬件的界面; 計算機組成是計算機系統(tǒng)結(jié)構(gòu)的邏輯實現(xiàn); 計算機實現(xiàn)是計算機組成的物理實現(xiàn)。 依據(jù)不同 的標(biāo)準(zhǔn),計算機系統(tǒng)結(jié)構(gòu)分類的分類有多種,例如 Flynn 分類法,它是按照指令流和數(shù)據(jù)流 的不同組織方式,將計算機系統(tǒng)結(jié)構(gòu)分為以下四類:SISD、 SIMD 、MISD 、MIMD 。1.3 定量分析技術(shù) 計算機系統(tǒng)設(shè)計常用的三個定量原理:加快經(jīng)常性事件的執(zhí)行速度 (Make the commoncase fast), Amdahl 定律,訪問的局部性原理。計算機系統(tǒng)的性能評

3、測有不同的方式。1.4 計算機系統(tǒng)結(jié)構(gòu)的發(fā)展馮. 諾依曼結(jié)構(gòu)的特征有五點,其中結(jié)構(gòu)的核心是運算器。軟件發(fā)展、器件發(fā)展、應(yīng)用 對系統(tǒng)結(jié)構(gòu)的影響,系統(tǒng)結(jié)構(gòu)的生命周期。1.5 計算機系統(tǒng)結(jié)構(gòu)中并行性的發(fā)展 并行性是指在同一時刻或是同一時間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不相同的工作。 從執(zhí)行程度的角度和處理數(shù)據(jù)的角度, 并行性的等級劃分是不同的。 提高并行性的技 術(shù)途徑有時間重疊、資源重復(fù)、資源共享三種。單機、多機系統(tǒng)中并行性的發(fā)展。目的要求:1. 掌握計算機系統(tǒng)的多級層次結(jié)構(gòu)。2. 掌握計算機系統(tǒng)結(jié)構(gòu)、計算機組成與計算機實現(xiàn)的定義及三者之間的關(guān)系。3. 理解透明性、虛擬機的概念。4. 理解系列機

4、和軟件兼容的基本思想。5. 了解對于通用寄存器型機器來說, 機器語言程序員所看到的傳統(tǒng)機器級所具有的主 要屬性。6. 掌握計算機體系結(jié)構(gòu)設(shè)計的三個基本原則。7. 熟練應(yīng)用 Amdahl 定律和 CPU 性能公式求解問題。8. 知道估評計算機性能的測試程序。9. 了解計算機性能的若干定義。10. 掌握存儲程序計算機體系結(jié)構(gòu)的主要特征,了解從五個方面對其所作的改進。11. 掌握并行性的概念。12. 了解從執(zhí)行程序的角度和處理數(shù)據(jù)的角度來看,并行性等級的劃分。13. 掌握計算機系統(tǒng)中提高并行性的三種技術(shù)途徑(時間重疊、資源重復(fù)、資源共享)14. 了解單機系統(tǒng)和多機系統(tǒng)中并行性的發(fā)展。重點:1. 計算

5、機系統(tǒng)的多級層次結(jié)構(gòu);2. 系列機和虛擬機的概念;3. 計算機體系結(jié)構(gòu)設(shè)計的三個基本原則。4. 系統(tǒng)設(shè)計的定量原理的應(yīng)用。5. 計算機系統(tǒng)中提高并行性的三種技術(shù)途徑(時間重疊、資源重復(fù)、資源共享)難點:1. 計算機系統(tǒng)設(shè)計定量原理的應(yīng)用;2. 計算機系統(tǒng)性能進行評測。3. 計算機系統(tǒng)中提高并行性的三種技術(shù)途徑(時間重疊、資源重復(fù)、資源共享)學(xué)習(xí)方法指導(dǎo):學(xué)習(xí)時,一定要從宏觀上把握計算機系統(tǒng)結(jié)構(gòu)所涉及的領(lǐng)域。通過本章學(xué)習(xí),要弄清計算機系統(tǒng)結(jié)構(gòu)的基本概念, 掌握計算機系統(tǒng)結(jié)構(gòu)的基本分析方法的基本設(shè)計方法,建立計算機系統(tǒng)的完整概念,為后續(xù)的學(xué)習(xí)打下良好的基礎(chǔ)。作業(yè):1. 解釋下列術(shù)語:CPI翻譯解釋

6、體系結(jié)構(gòu)透明性系列機軟件兼容兼容機計算機組成計算機實現(xiàn)并行性時間重迭資源重復(fù)資源共享同構(gòu)型多處理機異構(gòu)型多處理機緊密耦合響應(yīng)時間測試程序r大概率事件優(yōu)先系統(tǒng)加速比Amdahl 定律程序的局部性原理答案:1. CPI指令時鐘數(shù)(Cycles per In structi on)。2. 翻譯一一(基于層次結(jié)構(gòu))先把N+1級程序全部變換成 N級程序之后,再去執(zhí)行N級程 序,在執(zhí)行過程中,N+1級程序不再被訪問。3. 解釋一一每當(dāng)一條 N+1級指令被譯碼后,就直接去執(zhí)行一串等效的N級指令,然后再去取下一條N+1級指令,依此重復(fù)執(zhí)行。4. 體系結(jié)構(gòu)一一程序員所看到的計算機的屬性,即概念性結(jié)構(gòu)與功能特性。

7、5. 透明性在計算機技術(shù)中,對本來存在的事物或?qū)傩?,從某一角度來看又好像不存?的概念稱為透明性。6. 系列機一一在一個廠家生產(chǎn)的具有相同的體系結(jié)構(gòu),但具有不同的組成和實現(xiàn)的一系列 不同型號的機器。7. 軟件兼容一一同一個軟件可以不加修改地運行于體系結(jié)構(gòu)相同的各檔機器上,而且它們所獲得的結(jié)果一樣,差別只在于運行的時間不同。8. 兼容機不同廠家生產(chǎn)的、具有相同體系結(jié)構(gòu)的計算機。9. 計算機組成一一計算機體系結(jié)構(gòu)的邏輯實現(xiàn)。10. 計算機實現(xiàn)一一計算機組成的物理實現(xiàn)。11. 存儲程序計算機(馮諾依曼結(jié)構(gòu))一一采用存儲程序原理,將程序和數(shù)據(jù)存放在同一存儲器中。指令在存儲器中按其執(zhí)行順序存儲,由指令計

8、數(shù)器指明每條指令所在的單元地址。12. 并行性在同一時刻或同一時間間隔內(nèi)完成兩種或兩種以上性質(zhì)相同或不同的工作。13. 時間重疊在并行性中引入時間因素,即多個處理過程在時間上相互錯開,輪流重疊 地使用同一套硬件設(shè)備的各個部分,以加快硬件周轉(zhuǎn)而贏得速度。14. 資源重復(fù)在并行性中引入時間因素, 是根據(jù)“以數(shù)量取勝” 的原則,通過重復(fù)設(shè) 資源,尤其是硬件資源,大幅度提高計算機系統(tǒng)的性能。15. 資源共享是一種軟件方法,它使多個任務(wù)按一定的時間順序輪流使用同一套硬件設(shè)備.16. 同構(gòu)型多處理機由多個同種類型、至少同等功能的處理機組成、同時處理同一作業(yè) 中能并行執(zhí)行的多個任務(wù)的機器。17. 異構(gòu)型多處

9、理機由多個不同類型、功能不同的處理機組成、串行完成同一作業(yè)中不 同任務(wù)的機器。18. 最低耦合是耦合度最低的系統(tǒng),除通過某種中間存儲介質(zhì)之外,各計算機之間沒有 物理連接、也無共享的聯(lián)機硬件資源。19. 松散耦合一般是通過通道或通信線路實現(xiàn)計算機之間連接、共享某些外圍設(shè)備(例 如磁盤、磁帶),機器間的相互作用是在文件或數(shù)據(jù)集一級進行。20. 緊密耦合一般是指機間物理連接的頻帶較高,它們往往通過總線或高速開關(guān)實現(xiàn)互 連,可以共享主存。21. 響應(yīng)時間從事件開始到結(jié)束之間的時間,也稱執(zhí)行時間。22. 測試程序用于測試計算機性能的程序,可分為四類:真實程序、核心程序、小測試 程序、合成測試程序。23.

10、 測試程序組件選擇一個各個方面有代表性的測試程序,組成一個通用的測試程序集 合。這個通用的測試程序集合稱為測試程序組件。24. 大概率事件優(yōu)先此原則是計算機體系結(jié)構(gòu)中最重要和最常用的原則。對于大概率事 件(最常見的事件),賦予它優(yōu)先的處理權(quán)和資源使用權(quán),以獲得全局的最優(yōu)結(jié)果。25. 系統(tǒng)加速比系統(tǒng)改進前與改進后總執(zhí)行時間之比。26. Amdahl 定律加快某部件執(zhí)行速度所獲得的系統(tǒng)性能加速比, 受限于該部件在系統(tǒng)中 的所占的重要性。27. 程序的局部性原理程序在執(zhí)行時所訪問的地址不是隨機的,而是相對簇聚;這種簇 聚包括指令和數(shù)據(jù)兩部分。2. 傳統(tǒng)的存儲程序計算機的主要特征是什么?存在的主要問題

11、是什么?我們目前的計 算機系統(tǒng)是如何改進的?存儲程序計算機在體系結(jié)構(gòu)上的主要特點 :(1) 機器以運算器為中心。(2) 采用存儲程序原理。程序 (指令 ) 和數(shù)據(jù)放在同一存儲器中,并且沒有對兩者加以區(qū)分。 指令和數(shù)據(jù)一樣可以送到運算器進行運算,即由指令組成的程序自身是可以修改的。(3) 存儲器是按地址訪問的、線性編址的空間。(4) 控制流由指令流產(chǎn)生。(5) 指令由操作碼和地址碼組成。 操作碼指明本指令的操作類型, 地址碼指明操作數(shù)和操作 結(jié)果的地址。(6) 數(shù)據(jù)以二進制編碼表示,采用二進制運算。 傳統(tǒng)存儲程序計算機體系結(jié)構(gòu)存在的主要問題及其改進 :(1)分布的 I/O 處理能力存儲程序計算機

12、以運算器為中心、所有部件的操作都由控制器集中控制,這一特點帶來了慢速輸入輸出操作占用快速運算器的矛盾。為了克服這一缺點,人們先后提出各種輸入/輸出方式。(2)保護的存儲器空間把指令和數(shù)據(jù)放在同一存儲器中有優(yōu)缺點?,F(xiàn)在絕大多數(shù)計算機都規(guī)定:在執(zhí)行過程中不準(zhǔn)修改程序。(3 )存儲器組織結(jié)構(gòu)的發(fā)展按地址訪問的存儲器具有結(jié)構(gòu)簡單、價格便宜、存取速度快等優(yōu)點。但是在數(shù)據(jù)處理時,往往要求查找具有某種內(nèi)容特點的信息。但由于訪問存儲器的次數(shù)較多而影響計算機系統(tǒng)的性 能。采用了通用寄存器的概念、設(shè)置高速緩沖存儲器Cache、構(gòu)成了以相聯(lián)存儲器為核心的相聯(lián)處理機。(4)并行處理技術(shù)傳統(tǒng)的存儲程序計算機解題算法是順

13、序型的,即使問題本身可以并行處理,由于程序的執(zhí)行受程序計數(shù)器控制,故只能是串行、順序地執(zhí)行。如何挖掘傳統(tǒng)機器中的并行性?改進CPU的組成;在體系結(jié)構(gòu)上使本來可以并行計算的題目能并行計算;多機并行處理系 統(tǒng)。(5)指令集的發(fā)展計算機系統(tǒng)指令的種類愈來愈多,這種計算機稱為復(fù)雜指令集計算機CISC。日趨龐雜的指令集不但不容易實現(xiàn),而且還可能降低計算機系統(tǒng)的性能。把指令集設(shè)計成只包含那些使用頻率高的少量指令,并提供一些必要的指令以支持操作系統(tǒng)和高級語言。按照這個原則而構(gòu)成的計算機稱為精簡指令集計算機RISCo3. 按照Amdahl定律,假設(shè)將某系統(tǒng)的某一部件的處理速度加快到原來的5倍,但該部件的原處理

14、時間僅為整個運行時間的20%則采用加快措施后能使整個系統(tǒng)的性能提高到原來的()倍。A 1/0.36B 1/0.24C 1/0.45D 1/0.84答案:D4. 如果某一個計算任務(wù)用向量方式求解比用標(biāo)量方式求解要快10倍,稱可用向量方式求解部分所花費時間占總時間的百分比為可向量化百分比。請畫出加速比與可向量化比例兩者關(guān)系的曲線,并回答加速比為2和5時,可向量化百分比分別為多少。答案:設(shè)可向量化百分比為x,加速比為y,根據(jù)Amdahl定律,有y 1則:xy=2 時,1 19y=5 時,x=-88.9%9參考書目:1 計算機系統(tǒng)結(jié)構(gòu)張晨曦主編,高等教育出版社;2008年6月;2. 計算機系統(tǒng)結(jié)構(gòu)鄭緯

15、民主編,清華大學(xué)出版社;本章典型例題分析:【例1-1】用一臺433MHz的處理器執(zhí)行標(biāo)準(zhǔn)測試程序,它包含的各類指令和相應(yīng)的時鐘周期數(shù) 如下表,求有效CPI、MIPS速率和程序的執(zhí)行時間。指令類型指令數(shù)時鐘周期數(shù)整數(shù)運算50 0001數(shù)據(jù)傳送35 0002浮點運算12 0002控制傳送7 0002分析如下:n解:CPI (CPIi * 丄)i 1IC=(50000*1+35000*2+12000*2+7000*2)/(50000+35000+12000+7000)=1.52周期/指令MIPS f /(CPI *106) = 433* 106 /(1.52* 106) 285MIPS執(zhí)行時間 t=

16、(50000*1+35000*2+12000*2+7000*2)/(433*1°° )=3.649* 1° S【例1-2】假定要將某一執(zhí)行部件改進后速度提高 行時間的50%。問改進后,獲得的加速比 分析如下:假設(shè)系統(tǒng)在改進前后的執(zhí)行時間分別為10倍,改進后被改進部件執(zhí)行時間占系統(tǒng)總運Sp是多少?T1和T2 ,則SpTl1T2(1 Fe) Fe/Se(1 )40由( 1)式,得 T2 (1 Fe) Fe/Se*T1 ( 2)由題意50%T2Fe*T110(3)(2)-(3),得50%T2(1 Fe) * T1(4)10*T2Fe(5)2*T1T1Sp5.5由(4)(

17、5)可得T2【例1-3】計算機系統(tǒng)有三個部件可以改進,這三個部件的加速比如下:部件1加速比S仁30;部件2加速比S2=20;部件3加速比S3=10;(1) 如果部件1和部件2的可改進比例為30%,那么當(dāng)部件3的可改進比例為多少時,系統(tǒng)的加速比才可以達到10 ?(2) 如果三個部件的可改進比例為30%、30%和20%,三個部件同時改進,那么系統(tǒng)中不可加速部分的執(zhí)行時間在總執(zhí)行時間中占的比例是多少?分析如下:(1) 多個部件可改進情況下 Amdahl定理的擴展(1 Fi)iFii Si其中,F(xiàn)i為可加速部件I在未優(yōu)化系統(tǒng)中所占的比例,Si是部件I的加速比。S 1(F1 F2 F3)F1 £

18、;2 F3 1S1 S2 S310 1(0.3 0.3 F3)0.3300.320 F3=0.36=36%1(0.30.30.2)T1212 0.82 82%p0.30.30.214.7TTT 0.2T302010(2)【例1-4】假定我們有一臺計算機,如果所有的cache訪問都命中的話,它的CPI是2.0。唯一的數(shù)據(jù)訪問指令是 store和load,它們占指令總數(shù)的40 %,不命中損失是 25個時鐘周期,不命中率是2 %。如果所有的指令訪問cache都命中的話,那么機器的速度是存在cache不命中時的多少倍? 分析如下:首先計算所有cache訪問都命中時計算機的性能:CPU執(zhí)行時間=(CPU

19、時鐘周期+內(nèi)存停機周期)x時鐘周期時長=(IC x CPI + 0)x時鐘周期時長=IC x 2.0 x時鐘周期時長現(xiàn)在計算考慮cache不命中在內(nèi)的真實計算機性能,我們先計算內(nèi)存停機周期: 內(nèi)存停機周期=IC x每條指令訪問內(nèi)存的次數(shù)x不命中率x不命中損失=IC x( 1 + 0.4)x 0.02 x 25=IC x 0.7其中(1 + 0.4)代表每條指令訪問一次內(nèi)存,而占指令總數(shù)40%的store和load訪問兩次內(nèi)存,所以平均每條指令訪問訪問(1+0.4)次內(nèi)存。這樣總的性能是:CPU執(zhí)行時間 =(IC x 2.0+ IC x 0.7)x時鐘周期時長=IC x 2.7 x時鐘周期時長性

20、能提高的比是執(zhí)行時間之比的倒數(shù):cache不命中考慮在內(nèi)的 CPU執(zhí)行時間/cache訪問全部命中的 CPU執(zhí)行時間=2.7 x IC x時鐘周期時長/2.0x IC x時鐘周期時長=1.35cache訪問全部命中時的速度是有cache不命中時機器速度的 1.35倍。例 1-5】假設(shè)在一臺40MHZ處理機上運行200,000條指令的目標(biāo)代碼,程序主要由四種指令組 成。根據(jù)程序跟蹤實驗結(jié)果,已知指令混合比和每種指令所需的指令數(shù)如下:指令類型CPI指令混合比算術(shù)和邏輯160%高速緩存命中的加載/存儲218%轉(zhuǎn)移412%冋速存儲缺失的存儲器訪冋810%計算在單處理機上用上述跟蹤數(shù)據(jù)運行程序的平均CP

21、I。根據(jù)所得的CPI,計算相應(yīng)的MIPS速率。分析如下:平均 CPI 1* 60%2*18%4*12% 8*10% =2.24MIPS CPI*10640MHZ2.24* 10617.86第2章計算機指令集結(jié)構(gòu)授課內(nèi)容:本章論述計算機指令集結(jié)構(gòu)設(shè)計中的一些問題,比如指令集結(jié)構(gòu)的分類、 尋址方式、指令集結(jié)構(gòu)的功能設(shè)計、操作數(shù)的相關(guān)設(shè)計、指令集格式的設(shè)計等,并以MIPS為例,簡述了計算機指令集結(jié)構(gòu)是如何設(shè)計的。2.1 指令集結(jié)構(gòu)的分類根據(jù)CPI內(nèi)部存儲單元類型對指令集結(jié)構(gòu)分為三類:堆棧型指令集結(jié)構(gòu)、累加器型指令集結(jié)、通用寄存器型指令集結(jié)構(gòu),而他們各有優(yōu)缺點。2.2 尋址方式當(dāng)前指令集結(jié)構(gòu)中所使用的

22、一些操作數(shù)尋址方式。2.3 指令集結(jié)構(gòu)的功能設(shè)計CISC、RISC旨令集結(jié)構(gòu)的功能設(shè)計的目標(biāo)與原則不同、各有優(yōu)缺點,以及控制指令的概念。2.4 操作數(shù)的類型、表示和大小操作數(shù)的類型主要有:整數(shù)(定點) 、浮點、十進制、字符、字符串、向量、堆棧等。 操作數(shù)的表示是指硬件結(jié)構(gòu)能夠識別、 指令系統(tǒng)可以直接調(diào)用的那些結(jié)構(gòu)。 而大小則是從字 節(jié)、半字( 16位)、單字( 32位)到雙字( 64位)。2.5 指令集格式的設(shè)計指令中有兩種表示尋址方式的方法, 分別是將尋址方式編碼于操作碼中, 由操作碼描述 指令操作的同時, 也描述了相應(yīng)操作的尋址方式; 為每個操作數(shù)設(shè)置一個地址描述符, 由地 址描述符表示相

23、應(yīng)操作數(shù)的尋址方式。 且有三種指令集編碼格式: 變長編碼格式、 固定長度 編碼格式、混合型編碼格式。2.6 MIPS 指令集本節(jié)不做過多要求,了解就好。目的要求:1. 掌握指令集結(jié)構(gòu)的各種分類方法。2. 了解堆棧型指令集結(jié)構(gòu)、 累加器型指令集結(jié)構(gòu)和通用寄存器型指令集結(jié)構(gòu)的優(yōu)缺點。3. 了解三種通用寄存器型指令集結(jié)構(gòu)的優(yōu)缺點。4. 了解當(dāng)前指令集結(jié)構(gòu)中所使用的一些操作數(shù)尋址方式。5. 通過對基準(zhǔn)程序進行測試統(tǒng)計,了解各種尋址方式的使用情況。6. 掌握指令集結(jié)構(gòu)功能設(shè)計上的兩種不同方向。7. 掌握CISC計算機指令集結(jié)構(gòu)的功能設(shè)計的目標(biāo)、CISC結(jié)構(gòu)存在的缺點。8. 掌握RISC計算機指令集結(jié)構(gòu)的

24、功能設(shè)計的目標(biāo)、原則。9. 了解各種控制指令的定義、四種改變控制流程的操作及三種表示分支條件的技術(shù)。10. 掌握操作數(shù)類型與操作數(shù)表示的定義及表示方法。11. 了解各種操作數(shù)類型、操作數(shù)類型大小。12. 掌握指令中兩種表示尋址方式的方法。13. 掌握三種指令集編碼格式及其適用范圍。重點:1.2.3.面向主存儲器的尋址方式。RISC的關(guān)鍵技術(shù)。三種指令集編碼格式及其適用范圍。難點:1.2.面向主存儲器的尋址方式。 三種指令集編碼格式及其適用范圍。學(xué)習(xí)方法指導(dǎo):弄清他們之間的相同在學(xué)習(xí)浮點數(shù)表示方法時, 要把浮點數(shù)與數(shù)學(xué)中的實數(shù)進行比較,與不同,這樣,就能夠比較容易學(xué)會浮點數(shù)與實數(shù)之間的轉(zhuǎn)換方法,

25、學(xué)會浮點數(shù)能夠表示的實數(shù)的范圍、精度及效率。指令系統(tǒng)和尋址方式是計算機系統(tǒng)的主要組成部分。凡是能夠在計算機系統(tǒng)上直接運行的目標(biāo)程序都是由指令組成的。 指令系統(tǒng)是計算機系統(tǒng)中軟件與硬件之間的一個主要分界面, 也是他們之間互相溝通的橋梁。對于計算機硬件和軟件方面的分析設(shè)計人員,學(xué)習(xí)通用計算機系統(tǒng)的指令系統(tǒng)、尋址方式及數(shù)據(jù)表示是非常重要的。只有對指令系統(tǒng)、尋址方式和數(shù)據(jù)表示有比較系統(tǒng)和深入的了 解,才能設(shè)計出高水平的程序。本章主要講述指令系統(tǒng)、尋址方式和數(shù)據(jù)表示方面的一般概念,這與匯編語言程序設(shè)計課中只介紹一種具體處理機的指令系統(tǒng)不同。因此,在學(xué)習(xí)本章時,可利用在匯編語 言程序設(shè)計課中已經(jīng)基本學(xué)會了

26、某一種處理機的指令系統(tǒng)和尋址方式的基礎(chǔ)上,通過本章的學(xué)習(xí),掌握指令系統(tǒng)和尋址方式的一般原理和分析設(shè)計方法。作業(yè):1. 解釋下列術(shù)語堆棧型機器累加器型機器通用寄存器型機器有效地址CISCRISC:指令集結(jié)構(gòu)的正交特性答案:1. 堆棧型機器一一CPU中存儲操作數(shù)的單元是堆棧的機器。2. 累加型機器一一CPU中存儲操作數(shù)的單元是累加器的機器。3. 通用寄存器型機器一一CPU中存儲操作數(shù)的單元是通用寄存器的機器。4. CISC 復(fù)雜指令集計算機。5. RISC 精簡指令集計算機。2. 堆棧型機器、累加器型機器和通用寄存器型機器各自有什么優(yōu)缺點?答案:指令集結(jié)構(gòu)類型優(yōu)點缺點堆棧型是一種表示計算的簡單模

27、型;指令短小不能隨機訪問堆棧,從而很難生成有效代碼。同時,由于 堆棧是瓶頸,所以很難被高效地實現(xiàn)累加器型減少了機器的內(nèi)部狀態(tài);指 令短小由于累加器是唯一的暫存器,這種機器的存儲器通信開銷 最大寄存器型易于生成高效的目標(biāo)代碼所有操作數(shù)均需命名,且要顯式表示,因而指令比較長3.三種通用寄存器型指令集結(jié)構(gòu)分別有什么優(yōu)缺點? 答案:指令集結(jié)構(gòu)類型優(yōu)點缺點寄存器-寄存器型(0,3)簡單,指令字長固定,是一種 簡單的代碼生成模型,各種指 令的執(zhí)行時鐘周期數(shù)相近和ALU指令中含存儲器操作數(shù)的指令集結(jié)構(gòu)相 比,指令條數(shù)多,因而其目標(biāo)代碼量較大寄存器-存儲器(1,2)可以直接對存儲器操作數(shù)進行 訪問,容易對指令

28、進行編碼, 且其目標(biāo)代碼量較小指令中的操作數(shù)類型不同。 在一條指令中同時對 一個寄存器操作數(shù)和存儲器操作數(shù)進行編碼,將限制指令所能夠表示的寄存器個數(shù)。由于指令的 操作數(shù)可以存儲在不同類型的存儲器單元,所以每條指令的執(zhí)行時鐘周期數(shù)也不盡相同存儲器-存儲器型(3,3)是一種最緊密的編碼方式,無 需浪費”寄存器保存變量指令字長多種多樣。每條指令的執(zhí)行時鐘周期數(shù) 也大不一樣,對存儲器的頻繁訪問將導(dǎo)致存儲器 訪問瓶頸問題4. 計算機指令集結(jié)構(gòu)設(shè)計所涉及的內(nèi)容有哪些? 答案:(1)指令集功能設(shè)計:主要有 RISC和CISC兩種技術(shù)發(fā)展方向。(2)尋址方式的設(shè)計。(3)操作數(shù)表示和操作數(shù)類型。(4)尋址方式

29、的表示:可以將尋址方式編碼于操作碼中,也可以將尋址方式作為一個單獨的域來表示。(5)指令集格式的設(shè)計:有變長編碼格式、固定長度編碼格式和混合型編碼格式三種。5. 從當(dāng)前的計算機技術(shù)觀點來看,CISC指令集結(jié)構(gòu)的計算機有什么缺點?答案:(1)CISC結(jié)構(gòu)的指令系統(tǒng)中,各種指令的使用頻率相差懸殊。(2)CISC結(jié)構(gòu)指令系統(tǒng)的復(fù)雜性帶來了計算機系統(tǒng)結(jié)構(gòu)的復(fù)雜性,這不僅增加了研制 時間和成本,而且還容易造成設(shè)計錯誤。(3) CISC結(jié)構(gòu)指令系統(tǒng)的復(fù)雜性給VLSI設(shè)計增加了很大負擔(dān),不利于單片集成。(4)CISC結(jié)構(gòu)的指令系統(tǒng)中,許多復(fù)雜指令需要很復(fù)雜的操作,因而運行速度慢。(5) 在CISC結(jié)構(gòu)的指令

30、系統(tǒng)中,由于各條指令的功能不均衡性,不利于采用先進的計 算機系統(tǒng)結(jié)構(gòu)技術(shù)來提高系統(tǒng)的性能。6. 簡述RISC指令集結(jié)構(gòu)設(shè)計的原則。答案:(1)選取使用頻率最高的指令,并補充一些最有用的指令。(2)每條指令的功能應(yīng)盡可能簡單,并在一個機器周期內(nèi)完成。(3)所有指令長度均相同。(4)只有l(wèi)oad和store操作指令才訪問存儲器,其它指令操作均在寄存器之間進行。(5)以簡單、有效的方式支持高級語言。7. 某工作站采用時鐘頻率f為15MHZ處理速率為10MIPS的處理機來執(zhí)行一個已知混合程序。假定每次存儲器存取為1周期延遲。如果假定將處理機的時鐘頻率f提高到30MHZ但存儲器子系統(tǒng)速率不變。這樣,每次

31、存儲器存取需要兩個時鐘周期,如果30%旨令每條只需要一次存儲存取,而另外5%每條需要兩次存儲存取,還假定已知混合程序的指令數(shù)不變,并與原工作站兼容,試求改進后的處理機性能。答案:如題所述,30 %的指令需要一次存儲存取,則這些指令在處理器提高時鐘頻率之后需要增加一個時鐘周期;同樣,另外5%的指令需要增加兩個時鐘周期。CPInew=(改進前執(zhí)行混合程序的所需時鐘周期數(shù)+ 30%< 1 X指令數(shù)+ 5%x 2X指令數(shù))/指令數(shù)=改進前有效 CPI + 30% X 1 + 5% X 2= 1.5 + 0.3 + 0.1= 1.9處理速率 MIPS= f new / (CPI newX 106)

32、 = 30 X 106/(1.9 X 106) = 15.79 MIPS假設(shè)混合程序的指令數(shù)為IC,則有CPI old * IC * foldCPI new * IC *1.58new可見,改進后工作站性能提高了。參考書目:1. 計算機系統(tǒng)結(jié)構(gòu)張晨曦主編,高等教育出版社;2008年6月;2. 計算機系統(tǒng)結(jié)構(gòu)鄭緯民主編,清華大學(xué)出版社;本章典型例題分析:【例2-1】用一臺40MHZ處理機執(zhí)行標(biāo)準(zhǔn)測試程序,它含的混合指令數(shù)和相應(yīng)所需的時鐘周期數(shù)如下:指令類型指令數(shù)時鐘周期數(shù)-整數(shù)運算450001數(shù)據(jù)傳送320002浮點150002控制傳送80002求有效CPI、MIPS速率和程序的執(zhí)行時間。分析如

33、下:n I.CPI= (CPI . * 忌)=(45000*1 + 32000*2+15000*2+8000*2)/(45000+32000+15000+8000)i 1=1.55速率 MIPS f /(CPI * 106)40*106 /(1.55* 106)25.81 MIPS程序執(zhí)行時間1t (45000 * 132000 * 215000* 28000* 2)* (6)40*103.875* 10 3秒【例2-2】試解釋指令系統(tǒng)的、編譯器技術(shù)、CPU實現(xiàn)和控制、高速緩存和存儲器層次結(jié)構(gòu)如何影響CPU性能,并根據(jù)程序長度、時鐘速率和有效CPI來說明其影響。分析如下:CPU的性能取決于三個

34、方面:時鐘頻率、每條指令所化花的時鐘周期數(shù)和指令的條數(shù)。CPU時間=(IC*CPI)/時鐘頻率指令系統(tǒng)越豐富則經(jīng)過對相同的程序,產(chǎn)生的指令數(shù)就越少,即減少IC的總數(shù),從而減少CPU時間,提高CPU的性能。同樣編譯技術(shù)越先進,可減少產(chǎn)生多余的指令,減少指令的條數(shù),從而提高CPU的性能。時鐘速度高即時鐘的頻率高,由上式顯然提高CPU的性能。CPU 實現(xiàn)和控制,高速緩存和存儲器的層次結(jié)構(gòu)都能影響 CPI 的值。從而影響 CPU 的 性能?!纠?2-3】 分別用變址尋址方式和間接尋址方式編寫一個程序,求 C=A+B ,其中, A 與 B 都是由 n 個元素組成的一維數(shù)組。比較兩個程序,并回答下列問題:

35、(1) 從程序的復(fù)雜程度看,哪一種尋址方式更好?(2) 從硬件實現(xiàn)的代價看,哪一種尋址方式比較容易實現(xiàn)?(3) 從對向量運算的支持看,哪一種尋址方式更好?分析如下:( 1)變址尋址方式( 2)間接尋址方式(3) 變址尋址方式【例 2-4】 某臺計算機只有 Load/Store 指令能對存儲器進行讀 / 寫操作,其它指令只對寄存器進行操作。根據(jù)程序跟蹤實驗結(jié)果,已知每種指令所占的比例及CPI 數(shù)如下:指令類型指令所占比例CPI算邏指令431Load指令212Store指令122轉(zhuǎn)移指令242(1) 求上述情況下的平均 CPI。(2)假設(shè)程序由M條指令組成。算邏運算中25%的指令的兩個操作數(shù)中的一

36、個已在寄存器中,另一個必須在算邏指令執(zhí)行前用Load 指令從存儲器取到寄存器。因此有人建議增加另一種算邏指令, 其特點是一個操作數(shù)取自寄存器, 另一個操作數(shù)取自存儲器, 即寄存器 存儲器 類型,假設(shè)這種指令的 CPI 等于 2。同時,轉(zhuǎn)移指令的 CPI 變?yōu)?3。求新指令系統(tǒng)的平均 CPI。 分析如下:CPI 舊=(0.43 X 1+ 0.21 X 2+ 0.12 X 2+0.24 X 2)=1.57原算邏指令中的 25變成了寄存器存儲器型指令, 所以算邏指令 (寄存器 寄存器型 )少了 (0.25 X 0.43)M 條,Load 指令少了 (0.25 X 0.43)M 條,而(0.25 X

37、0.43)M 條的新指令為寄 存器 存儲器型指令。 指令總數(shù)少了 (0.25X 43%)M 條。設(shè)執(zhí)行算邏指令 (寄存器 寄存器型 ) 、 Load 指令、算邏指令 (寄存器 存儲器型 ) 、 Store 指令和轉(zhuǎn)移指令的周期總數(shù)分別為 C1, C2, C3, C4, C5,所以:C1=(0.43-(0.25X0.43)MX1=0.3225MC2=(0.21- (0.25X 0.43)M X2=0.205MC3=(0.25X 0.43)M X2=0.215MC4=0.12M X 2=0.24MC5=0.24X 3M=0.72M新指令總數(shù) N=(1-(0.25X 0.43)M=0.8925MCP

38、I 新=(C1+C2+C3+C4+C5 ) / N=1.7025M/0.8925M=1.908【例 2-5】 假定我們正在考慮兩種條件轉(zhuǎn)移指令的設(shè)計方法,這兩種方法如下:CPU A :先通過一條比較指令設(shè)置條件碼 A,再用一條分支指令檢測條件碼。CPU B :比較操作包含在分支指令中。 在兩種 CPU 中,條件轉(zhuǎn)移指令都需要兩個時鐘周期, 所有的其它指令都需要一個時鐘周期。在 CPU A 中,全部指令的 20是條件轉(zhuǎn)移指令,因 為每次條件轉(zhuǎn)移都需要一次比較,所以比較指令約占所有指令的20。因為 CPU A 不需要在轉(zhuǎn)移中包含分支, 所以它的時鐘頻率是 CPU B 的 1.25倍。哪一種 CPU

39、 更快?如果 CPU A 的時鐘頻率只是 CPU B 的 1.1 倍,結(jié)果又如何?分析如下:CP時間A= IC 1.2 時鐘周期A注: 20的分支指令需要兩個時鐘周期,其它指令需要一個時鐘周期。因為 A 的時鐘頻率是 B 的 1.25 倍,所以 B 的時鐘周期是 A 的 1.25倍。因為在 B 中不需要 進行比較操作,所以分支指令占 B指令總數(shù)的20%/80%= 25%, B中除分支指令需兩個時 鐘周期外,所有其它指令都需要一個時鐘周期。所有 B 的 CPI 為:CPIb=0.2520.7511.25因為 B 不 執(zhí)行比較操作,所以B 的指令數(shù)是 A 的 80%,這樣 CPU B 的性能為:C

40、P時間B= ICb CPIb時鐘周期B=0.8ICa 1.25 (1.25時鐘周期人)=1.25 ICA 時鐘周期A在上述假定下,時鐘周期較短的 CPU A 指令總數(shù)較少的 CPU B 快。如果 CPU A 的時鐘頻率只是 CPU B 的 1.10 倍,那么 B 的時鐘周期是 A 的 1.10 倍,那么 CPU B 的性能為:CP!時間8= ICb CPIb 時鐘周期b=0.8ICA 1.25 (1.10時鐘周期 A)=1.10 IC A 時鐘周期 A經(jīng)過這一改進,指令總數(shù)較少的 CPU B 比 CPU A 快了。第 3 章 流水線技術(shù)授課內(nèi)容:本章論述流水線技術(shù)的基本概念、 分類以及性能計算

41、方法, 并對流水線中的相關(guān)問題以 及向量計算機進行討論。3.1 重疊執(zhí)行和先行控制 一條指令分為三個階段,取指令、指令分析、指令執(zhí)行。共有三種執(zhí)行方式,分別是順序執(zhí)行方式,一次重疊執(zhí)行方式。而先行控制則是緩沖技術(shù)和預(yù)處理技術(shù)的結(jié)合。 二次重疊執(zhí)行方式3.2 流水線的基本概念通過工業(yè)生產(chǎn)流水線而對流水線先有抽象意義上的了解,并根據(jù)不同的角度和觀點, 將 流水線進行分類。3.3 流水線性能指標(biāo)本小節(jié)將從吞吐率, 加速比, 效率三個流水線性能指標(biāo)對其進行性能分析, 并引出流水 線設(shè)計存在的若干問題。3.4 流水線中的相關(guān)及沖突 本小節(jié)將學(xué)習(xí)到經(jīng)典的五段流水線,三種相關(guān)(數(shù)據(jù)相關(guān)、名相關(guān)、控制相關(guān))

42、;以及 三種流水線沖突(結(jié)構(gòu)沖突、數(shù)據(jù)沖突,數(shù)據(jù)沖突控制沖突) 。3.5 基本MIPS實現(xiàn)流水線此小節(jié)只作簡單了解。3.6 向量處理機簡單了解向量的三種處理方式及其特點。目的要求:1. 掌握流水線的分類及相關(guān)概念;2. 掌握流水技術(shù)的特點及基本思想;3. 掌握吞吐率(最大吞吐率、實際吞吐率) 、加速比、效率的定義和計算方法;4. 掌握流水線時空圖的概念和畫法;5. 理解流水線中相關(guān)的分類及定義;6. 掌握結(jié)構(gòu)相關(guān)的解決方法;7. 掌握數(shù)據(jù)相關(guān)的三種類型;掌握定向技術(shù)的主要思想及應(yīng)用;8. 掌握靜態(tài)流水線和動態(tài)流水線的區(qū)別;9. 掌握向量的三種處理方式及其特點;重點:1. 流水技術(shù)的特點;2.

43、靜態(tài)流水線和動態(tài)流水線的區(qū)別。3. 流水線的分類及相關(guān)概念;4. 流水線中相關(guān)的分類及定義;5. 結(jié)構(gòu)相關(guān)的解決方法;6. 數(shù)據(jù)相關(guān)的三種類型;7. 向量的三種處理方式及其特點;難點:1. 流水技術(shù)的特點;2. 流水線的分類及相關(guān)概念;3. 流水線中相關(guān)的分類及定義;4. 結(jié)構(gòu)相關(guān)的解決方法;5. 數(shù)據(jù)相關(guān)的三種類型;學(xué)習(xí)方法指導(dǎo):流水線技術(shù)是提高系統(tǒng)吞吐率的一項強大的實現(xiàn)技術(shù),并且不需要大量重復(fù)設(shè)置硬件。而流水線性能的主要障礙是指令相關(guān)引起的流水線停頓。 其中, 控制相關(guān)引起的分支開銷是 最主要的部分。 隨著流水線深度的增加, 分支開銷也會增大并成為主要的挑戰(zhàn)。另外,流水線處理器設(shè)計將傳統(tǒng)

44、CPU設(shè)計中的數(shù)據(jù)通路設(shè)計和控制通路設(shè)計放到了一起進行處理,它們可以被合并到一條流水線來實現(xiàn)。 流水線性能的主要障礙是指令相關(guān)引起的流水線停頓。其中,控制相關(guān)引起的分支開銷是最主要的部分。 隨著流水線深度的增加, 分支開銷也會增大并成為主要的挑戰(zhàn)。但真正掌握流水線技術(shù)的設(shè)計與實現(xiàn),需要課后再花時間研究學(xué)習(xí)。作業(yè):1根據(jù)指令對寄存器的讀寫順序,可將數(shù)據(jù)沖突分為哪三種類型?答案:(1) 寫后讀沖突(2) 寫后寫沖突(3) 讀后寫沖突2 解決流水線數(shù)據(jù)沖突的方法有哪些?答案:(1) 定向技術(shù):在某條指令產(chǎn)生一個結(jié)果之前,其他指令并不真正需要該計算結(jié)果, 如果將該計結(jié)果從其產(chǎn)生的地方直接送到其他指令需

45、要它的地方,就可以避免暫停。(2) 暫停技術(shù):設(shè)置一個“流水線互鎖”的功能部件,一旦流水線互鎖檢測到數(shù)據(jù)相 關(guān),流水線暫停執(zhí)行發(fā)生數(shù)據(jù)相關(guān)指令后續(xù)的所有指令,直到該數(shù)據(jù)相關(guān)解決為止。(3) 采用編譯器調(diào)度。(4) 重新組織代碼順序。3. 定向技術(shù)的主要思想是什么?答案:在發(fā)生數(shù)據(jù)沖突時,后面的指令并不是立即就要用到前一條指令的計算結(jié)果。如果能夠?qū)⒂嬎憬Y(jié)果從其產(chǎn)生的地方直接送到需要它的地方,就可以避免暫停。當(dāng)定向硬件檢測到前面某條指令的結(jié)果寄存器就是當(dāng)前指令的源寄存器時,控制邏輯會將前面那條指令的結(jié)果直接從其產(chǎn)生的地方定向到當(dāng)前指令所需的位置。4. 按照流水線所完成的功能來分,流水線可分為哪兩類

46、?答案:(1 )單功能流水線:只能完成一種固定功能的流水線。(2) 多功能流水線:流水線的各段可以進行不同的連接,從而使流水線在不同的時間,或者在同一時間完成不同的功能。5. 按照同一時間內(nèi)各段之間的連接方式來分,流水線可分為哪兩類?答案:(1) 靜態(tài)流水線:在同一時間內(nèi),流水線的各段只能按同一種功能的連接方式工作。(2) 動態(tài)流水線:在同一時間內(nèi),當(dāng)某些段正在實現(xiàn)某種運算時,另一些段卻在實現(xiàn) 另一種運算。6條流水線的可分為 k段,各段的執(zhí)行時間都是t,共向該流水線輸入 n個任務(wù),求該流水線實際吞吐率的為:nA. TPB. TP n k n 1 tk tC. TPt答案:DD. TP(k n

47、1) t7假設(shè)一條指令的執(zhí)行過程可以分為“取指令”、“分析”和“執(zhí)行”三段,每一段分別只有一個部件可供使用并且執(zhí)行時間分別為、和,連續(xù)執(zhí)行n條指令所需要花費的最短時間約為(假設(shè)“取指令”、“分析”和“執(zhí)行”可重疊并假設(shè)n足夠大):A. 6n t B. 2n t C. 3n t D. nt答案:C參考書目:1 計算機系統(tǒng)結(jié)構(gòu)張晨曦主編,高等教育出版社;2008年6月;2. 計算機系統(tǒng)結(jié)構(gòu)鄭緯民主編,清華大學(xué)出版社;本章典型例題分析:【例3-1】定向技術(shù)的主要思想是什么?分析如下:在發(fā)生數(shù)據(jù)沖突時,后面的指令并不是立即就要用到前一條指令的計算結(jié)果。如果能夠 將計算結(jié)果從其產(chǎn)生的地方直接送到需要它的

48、地方,就可以避免暫停。當(dāng)定向硬件檢測到前面某條指令的結(jié)果寄存器就是當(dāng)前指令的源寄存器時,控制邏輯會將前面那條指令的結(jié)果直接從其產(chǎn)生的地方定向到當(dāng)前指令所需的位置。【例3-2】流水技術(shù)有哪些特點? 分析如下:(1 )流水過程由多個相聯(lián)系的子過程組成,每個過程稱為流水線的“級”或“段”。(2) 每個子過程由專用的功能段實現(xiàn)。(3) 各個功能段所需時間應(yīng)盡量相等。(4) 流水線需要有“通過時間”,在此之后流水過程才進入穩(wěn)定工作狀態(tài),每一個時鐘 周期(拍)流出一個結(jié)果。(5 )流水技術(shù)適合于大量重復(fù)的時序過程,只有在輸入端能連續(xù)地提供任務(wù),流水線 的效率才能充分發(fā)揮?!纠?-3】設(shè)在下圖所示的靜態(tài)流水

49、線上計算:4(A B)i 1流水線的輸出可以直接返回輸入端或暫存于相應(yīng)的流水寄存器中,試計算其吞吐率、加速比和效率。分析如下:(1)(2)TP加減法乘法(每段的時間都t)選擇適合流水線工作的算法:1)2) 再計算(A+B1) X (A+E2)和(Ab+Bb) x (A+B)。3) 然后求總的乘積結(jié)果 畫出時空圖:先計算 A1+B1、A+B2、A+B 和 A4+B4。0Ai1 23A2 A3 A4時間CX DBD9A10 11C12 1314 15 16 17 18A X BBiB2 B3 B436 tT8746348 180. 25(3)計算性能在18個厶t時間中,給出了7個結(jié)果。吞吐率為:T

50、P18 t不用流水線,由于一次求和需 則產(chǎn)生上述7個結(jié)果共需(6A t,一次求積需4X 6+3 X 4) t = 36 t加速比為S36 t18 t流水線的效率 E46348 180. 25可以看出,在求解此問題時,該流水線的效率不高。第4章指令集并行授課內(nèi)容:幾乎所有的處理機都利用流水線來使指令重疊并行執(zhí)行, 以達到提高性能的目的。 這種 指令之間存在的潛在并行性稱為指令級并行。 本章研究: 如何通過各種可能的技術(shù), 獲得更 多的指令級并行性。4.1 :指令級并行的概念 最基本的開發(fā)循環(huán)級并行的技術(shù)有兩種:循環(huán)展開( loop unrolling )技術(shù)和采用向量 指令和向量數(shù)據(jù)表示。而流水

51、線相關(guān)有三種:數(shù)據(jù)相關(guān)、名相關(guān)、控制相關(guān)。因而流水線沖 突也有三種類型:結(jié)構(gòu)沖突、數(shù)據(jù)沖突、控制沖突。4.2 :指令的動態(tài)調(diào)度 理解指令的動態(tài)調(diào)度和靜態(tài)調(diào)度概念的不同, 而指令的動態(tài)調(diào)度是指在程序的執(zhí)行過程 中,依靠專門硬件對代碼進行調(diào)度,減少數(shù)據(jù)相關(guān)導(dǎo)致的停頓。 Tomasulo 算法的思想是: 記錄和檢測指令相關(guān),操作數(shù)一旦就緒就立即執(zhí)行,把發(fā)生RAW中突的可能性減少到最小;通過寄存器換名來消除 WAR中突和WAW中突。4.3 :動態(tài)分支預(yù)測技術(shù)本節(jié)中介紹的方法對于每個時鐘周期流出多條指令(若為n條,就稱為n流出)的處理機來說非常重要,包括分支歷史表,分支目標(biāo)緩中器,基于硬件的前瞻執(zhí)行三個

52、方面。4.4 :多指令流出技術(shù)因一個時鐘周期內(nèi)流出多條指令,CPI v 1,所以多流出比但流出處理機更為比靜態(tài)調(diào)度高效。而該技術(shù)將從動態(tài)調(diào)度,超長指令字,多流出處理器受到的限制,超流水線處理機進行介紹。4.5 :循環(huán)展開和指令調(diào)度為充分開發(fā)指令之間存在的并行性, 找出不相關(guān)的指令序列, 讓它們在流水線上重疊并 行執(zhí)行,于是提出了循環(huán)展開和指令調(diào)度。目的要求:1. 了解指令動態(tài)調(diào)度技術(shù);2. 了解控制相關(guān)動態(tài)解決技術(shù)的基本思想和可解決的問題;3. 了解多指令流出技術(shù)思想;4. 掌握 Tomasulo 算法的思想;5. 掌握指令級并行的概念;6. 應(yīng)用循環(huán)展開、重命名等提高指令級并行的基本技術(shù);重

53、點:1. 控制相關(guān)動態(tài)解決技術(shù)的基本思想和可解決的問題;2. 指令級并行的概念;3. Tomasulo 算法的思想;4. 應(yīng)用循環(huán)展開、重命名等提高指令級并行的基本技術(shù);難點:1. 控制相關(guān)動態(tài)解決技術(shù)的基本思想和可解決的問題;2. Tomasulo 算法的思想;學(xué)習(xí)方法指導(dǎo):指令級并行, 一種平行計算形式, 在一個程式運行中, 許多指令操作, 能在同時間進行。 它也是一個測量值, 用來計算在一個程式運算中, 它有多少個指令能夠在同時間運算, 稱為 指令層級平行度。實現(xiàn)指令層級,可以用硬件或軟件方式來實作。硬件方式有,指令管線化、 超標(biāo)量等。但真正掌握指令集并行設(shè)計與實現(xiàn),需要課后再花時間研究學(xué)習(xí)。作業(yè):1. 解釋下列術(shù)語:指令級并行循環(huán)展開技術(shù)超標(biāo)量處理機分支歷史表BHTBTBCDB動態(tài)分支預(yù)測技術(shù)P動態(tài)調(diào)度方法答案:1. 指令級并行-當(dāng)指令之間不存在相關(guān)時,它們可以在流水線中重疊起來并行執(zhí)行。這種指令序列中存在的潛在并行性稱為指令級并行。2. 循環(huán)展開技術(shù)-開發(fā)循環(huán)級并行的一種基本技術(shù)。它將循環(huán)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論