




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、系統(tǒng)結構ch計算機系統(tǒng)結構第一章第一章 基本概念基本概念第二章第二章 指令系統(tǒng)指令系統(tǒng)第三章第三章 存儲系統(tǒng)存儲系統(tǒng)第四章第四章 輸入輸出系統(tǒng)輸入輸出系統(tǒng)第五章第五章 標量處理機標量處理機第六章第六章 向量處理機向量處理機第七章第七章 互連網(wǎng)絡互連網(wǎng)絡第八章第八章 并行處理機并行處理機第九章第九章 多處理機多處理機系統(tǒng)結構ch第五章標量處理機5.1 指令的重疊執(zhí)行方式指令的重疊執(zhí)行方式5.2 流水線技術流水線技術5.3 超標量處理機超標量處理機5.4 超流水線處理機超流水線處理機5.5 超標量超流水線處理機超標量超流水線處理機系統(tǒng)結構ch 只有標量數(shù)據(jù)表示和標量指令系統(tǒng)的處理機稱為標量處理機提
2、高指令執(zhí)行速度的主要途徑:(1) 提高處理機的工作主頻(2) 采用更好的算法和設計更好的功能部件(3) 采用指令級并行技術三種指令級并行處理機:(1) 流水線處理機和超流水線(Super-pipelining)處理機(2) 超標量(Superscalar)處理機(3) 超長指令字(VLIW: Very Long Instruction Word)處理機系統(tǒng)結構chniiiitttT1()執(zhí)行分析取指令取指令k 分析k 執(zhí)行k 取指令k+1 分析k+1執(zhí)行k+15.1 指令的重疊執(zhí)行方式1、順序執(zhí)行方式執(zhí)行n條指令所用的時間為:如果每段時間都為t,則執(zhí)行n條指令所用的時間為: T=3nt系統(tǒng)結構
3、ch主要優(yōu)點:控制簡單,節(jié)省設備。主要缺點:執(zhí)行指令的速度慢,功能部件的利用率很低。2、一次重疊執(zhí)行方式一種最簡單的流水線方式如果兩個過程的時間相等,則執(zhí)行n條指令的時間為:T=(1+2n)t系統(tǒng)結構ch取指 分析 執(zhí)行取指 分析 執(zhí)行取指 分析 執(zhí)行主要優(yōu)點:指令的執(zhí)行時間縮短功能部件的利用率明顯提高主要缺點:需要增加一些硬件控制過程稍復雜系統(tǒng)結構ch如果三過程的時間相等,執(zhí)行n條指令的時間為:T=(2+n)t理想情況下同時有三條指令在執(zhí)行處理機的結構要作比較大的改變,必須采用先行控制方式取指k+2 分析k+2 執(zhí)行k+2取指k+1 分析k+1 執(zhí)行k+1取指k分析k執(zhí)行k3、二次重疊執(zhí)行方
4、式系統(tǒng)結構ch先行控制方式的原理先行控制方式的原理 1.采用二次重疊執(zhí)行方式必須解決兩個問題:采用二次重疊執(zhí)行方式必須解決兩個問題: (1)有獨立的取指令部件、指令分析部件和指令執(zhí)有獨立的取指令部件、指令分析部件和指令執(zhí)行部件行部件 把一個集中的指令控制器,分解成三個獨立的控制器: 存儲控制器、指令控制器、運算控制器存儲控制器、指令控制器、運算控制器 (2)要解決訪問主存儲器的沖突問題要解決訪問主存儲器的沖突問題 取指令、分析指令、執(zhí)行指令都可能要訪問存儲器系統(tǒng)結構ch 2.解決訪存沖突的方法:解決訪存沖突的方法: (1)采用低位交叉存取方式采用低位交叉存取方式: 這種方法不能根本解決沖突問題
5、。指令、讀操作數(shù)、寫結果。 (2)兩個獨立的存儲器兩個獨立的存儲器:獨立的指令存儲器和數(shù)據(jù)獨立的指令存儲器和數(shù)據(jù)存儲器。存儲器。 如果再規(guī)定,執(zhí)行指令所需要的操作數(shù)和執(zhí)行結果只寫到通用寄存器,則取指令、分析指令和執(zhí)行指令就可以同時進行。 在許多高性能處理機中,有獨立的指令Cache和數(shù)據(jù)Cache。這種結構被稱為哈佛結構。系統(tǒng)結構ch (3)采用先行控制技術采用先行控制技術 采用先行控制技術的關鍵是緩沖技術和預采用先行控制技術的關鍵是緩沖技術和預處理技術。處理技術。 緩沖技術通常用在工作速度不固定的兩個功能部件之間。設置緩沖棧的目的是用來以平滑功能部件之間的工作速度。 在采用了緩沖技術和預處理
6、技術之后,運算器能夠?qū)P挠跀?shù)據(jù)的運算,從而大幅度提高程序的執(zhí)行速度。系統(tǒng)結構ch第五章標量處理機5.1 先行控制技術5.2 流水線技術5.3 超標量處理機5.4 超流水線處理機5.5 超標量超流水線處理機系統(tǒng)結構ch 空間并行性:設置多個獨立的操作部件多操作部件處理機超標量處理機 時間并行性:采用流水線技術。不增加或只增加少量硬件就能使運算速度提高幾倍流水線處理機超流水線處理機5.2 流水線技術系統(tǒng)結構ch5.2.1 流水線工作原理5.2.2 流水線的分類5.2.3 線性流水線的性能分析5.2.4 非線性流水線的調(diào)度技術5.2 流水線技術系統(tǒng)結構ch5.2.1 流水線工作原理流水線工作原理1、
7、簡單流水線、簡單流水線流水線的每一個階段稱為流水步、流水步驟、流水段、流水線階段、流水功能段、功能段、流水級、流水節(jié)拍等。在每一個流水段的末尾或開頭必須設置一個寄存器,稱為流水寄存器、流水鎖存器、流水閘門寄存器等。會增加指令的執(zhí)行時間。分析器分析k+1流水鎖存器執(zhí)行部件執(zhí)行k流水鎖存器輸入輸出t1t2為了簡化,在一般流水線中不畫出流水鎖存器。系統(tǒng)結構ch取指形成操作數(shù)地址譯碼取操作數(shù)執(zhí)行保存結果2、一種指令流水線、一種指令流水線一般4至12個流水段,等于及大于8個流水段的稱為超流水線處理機系統(tǒng)結構ch分析k 分析k+1分析k+2分析k+3執(zhí)行k 執(zhí)行k+1執(zhí)行k+2執(zhí)行k+3時間空間0t1t2
8、t3t4t53、流水線的時空圖、流水線的時空圖一條簡單流水線的時空圖:系統(tǒng)結構chED1時間空間0t1t2t3t4t5ED2 ED3 ED4 ED5EA1 EA2 EA3 EA4 EA5MA1MA2MA3MA4MA5NL1 NL2 NL3 NL4 NL5t6t7t8NL:規(guī)格化MA:尾數(shù)加EA:對階ED:求階差一個浮點加法器流水線的時空圖(由求階差、對階、尾數(shù)加和規(guī)格化4個流水段組成):系統(tǒng)結構ch4、流水線的主要特點只有連續(xù)提供同類任務才能充分發(fā)揮流水線的效率:對于指令流水線:要盡量減少因條件分支造成的“斷流”對于操作部件:主要通過編譯技術,盡量提供連續(xù)的同類操作在流水線的每一個流水線段中都
9、要設置一個流水鎖存器時間開銷:流水線的執(zhí)行時間加長是流水線中需要增加的主要硬件之一系統(tǒng)結構ch各流水段的時間應盡量相等流水線處理機的基本時鐘周期等于時間最長的流水段的時間長度流水線需要有“裝入時間”和“排空時間”系統(tǒng)結構ch1、線性流水線與非線性流水線 流水線的各個流水段之間是否有反饋信號 線性流水線(Linear Pipelining)每個流水段都流過一次,且僅流過一次 非線性流水線(Nonlinear Pipelining)在流水線的某些流水段之間有反饋回路或前饋回路 線性流水線能夠用流水線連接圖唯一表示非線性流水線必須用流水線連接圖流水線預約表等共同表示5.2.2 流水線的分類流水線的分
10、類系統(tǒng)結構chS1輸入S2S3輸出前饋回路反饋回路一種簡單的非線性流水線系統(tǒng)結構ch2、按照流水線的級別來分處理機級流水線, 又稱為指令流水線 (Instruction Pipelining)例如:在采用先行控制器的處理機中,各功能部件之間的流水線先行指令緩沖棧輸入先行控制方式中的指令流水線先行指令分析器先行讀數(shù)棧先行操作棧取指譯碼取操作數(shù)指令執(zhí)行部件后行寫數(shù)棧輸出執(zhí)行寫結果系統(tǒng)結構ch求階差輸入輸出t1對階尾數(shù)加規(guī)格化t2t3t4P1輸入任務1MMP2任務2MP3任務3輸出部件級流水線(操作流水線),如浮點加法器流水線處理機之間的流水線稱為宏流水線 (Macro Pipelining)每個處
11、理機對同一個數(shù)據(jù)流的不同部分分別進行處理系統(tǒng)結構ch3、單功能流水線與多功能流水線、單功能流水線與多功能流水線單功能流水線:單功能流水線:只能完成一種固定功能的流水線Cray-1計算機中有12條;YH-1計算機有18條;Pentium有一條5段的定點和一條8段的浮點流水線;Pentium有三條指令流水線,其中兩條定點指令流水線,一條浮點指令流水線多功能流水線:多功能流水線:流水線的各段通過不同連接實現(xiàn)不同功能Texas公司的ASC計算機中的8段流水線,能夠?qū)崿F(xiàn):定點加減法、定點乘法、浮點加法、浮點乘法、邏輯運算、移位操作、數(shù)據(jù)轉(zhuǎn)換、向量運算等。系統(tǒng)結構ch系統(tǒng)結構ch4、靜態(tài)流水線與動態(tài)流水線
12、、靜態(tài)流水線與動態(tài)流水線靜態(tài)流水線:靜態(tài)流水線:同一段時間內(nèi),多功能流水線中的各個功能段只能按照一種固定的方式連接,實現(xiàn)一種固定的功能。只有連續(xù)出現(xiàn)同一種運算時,流水線的效率才能得到充分的發(fā)揮。動態(tài)流水線:動態(tài)流水線:在同一段時間內(nèi),多功能流水線中的各段可以按照不同的方式連接,同時執(zhí)行多種功能。系統(tǒng)結構ch1時間空間02 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 4 1 2 3 1 2 1輸入求階差對階尾數(shù)加規(guī)格化尾數(shù)乘累加輸出靜態(tài)流水線時空圖浮點加法定點乘法系統(tǒng)結構ch1時間空間02 3 n1 2 3 n1 2 3 n1 2 3 n1 2 3 n
13、1 2 3 n輸入求階差對階尾數(shù)加規(guī)格化尾數(shù)乘累加輸出動態(tài)流水線時空圖1 2 35461 2 3541 2 3 41 2 3浮點加法定點乘法系統(tǒng)結構chS1就緒回答S2就緒回答S3就緒回答輸出就緒回答輸入5、流水線的其他分類方法、流水線的其他分類方法按照數(shù)據(jù)表示方式:按照數(shù)據(jù)表示方式:標量流水線和向量流水線標量流水線和向量流水線按照控制方式:按照控制方式:同步流水線和異步流水線同步流水線和異步流水線順序流水線與亂序流水線:順序流水線與亂序流水線:亂序流水線又稱為無序流亂序流水線又稱為無序流水線、錯序流水線或異步流水線等水線、錯序流水線或異步流水線等系統(tǒng)結構ch5.2.3 線性流水線的性能分析線
14、性流水線的性能分析衡量流水線性能的主要指標有:吞吐率、加速比和效率。1、吞吐率(、吞吐率(Though Put)求流水線吞吐率的最基本公式:TP = n / Tkn為任務數(shù), Tk為完成n個任務所用時間各段執(zhí)行時間相等,輸入連續(xù)任務情況下完成n個連續(xù)任務需要的總時間為:Tk= (k+n-1) tk為流水線的段數(shù), t為時鐘周期系統(tǒng)結構ch1時間空間S123 n-1 nS2S3S4123 n-1 n123 n-1 n123 n-1 nkt(n-1) tnt(k-1)tT系統(tǒng)結構chtnknTP) 1(nTPLimnknttmax() 11),max() 1(211kkiitttntnTP ),m
15、ax(121ktttTP 吞吐率:吞吐率:最大吞吐率為:最大吞吐率為:各段執(zhí)行時間不相等、輸入連續(xù)任務情況下:各段執(zhí)行時間不相等、輸入連續(xù)任務情況下:吞吐率為:吞吐率為:最大吞吐率為:最大吞吐率為:系統(tǒng)結構ch流水線各段執(zhí)行時間不相等的解決辦法S1輸入t1=tS2t2=3tS3t3=tS4t4=t輸出1時間空間S1S2S3S4ti(n-1)t2Tk23 n123n123 n123 n系統(tǒng)結構chS1輸入輸出tS2-1tS2-2tS2-3tS3tS4tS2(3t)S1輸入輸出t1=tS2-1S2-1S2-1S3S4t3=tt4=tt2=3t二是將二是將 “瓶頸瓶頸”流水段重復設置:流水段重復設置
16、:一是將一是將“瓶頸瓶頸”流水段細分流水段細分(如果可分的話如果可分的話):系統(tǒng)結構ch1時間空間2 3nS1流水段重復設置的流水線S2-14 5 614-2 -1n-225n-136n1 2 3n4 5 6 -2 -11 2 3n4 5 6 -2 -1S2-2S2-3S3S4系統(tǒng)結構ch1) 1(nknktnktnkSSLimk nknknmax12、加速比(、加速比(Speedup)計算流水線加速比的基本公式:計算流水線加速比的基本公式:S = 順序執(zhí)行時間順序執(zhí)行時間T0 / 流水線執(zhí)行時間流水線執(zhí)行時間Tk各段執(zhí)行時間相等,輸入連續(xù)任務情況下各段執(zhí)行時間相等,輸入連續(xù)任務情況下加速比為
17、:加速比為:最大加速比為:最大加速比為:各段執(zhí)行時間不等,輸入連續(xù)任務情況下各段執(zhí)行時間不等,輸入連續(xù)任務情況下實際加速比實際加速比為:為:Snttntttiikiikk 11121() m ax(,)系統(tǒng)結構ch任務個數(shù)加速比10246811 2 4 8 16 32 64128系統(tǒng)結構chkTkTknE0個流水段的總的時空區(qū)個任務占用的時空區(qū)1) 1(nkntnkktnkE11maxnknLimEn3、效率(、效率(Efficiency)計算流水線效率的一般公式:計算流水線效率的一般公式:各流水段執(zhí)行時間相等,輸入各流水段執(zhí)行時間相等,輸入n個連續(xù)任務個連續(xù)任務流水線的效率為:流水線的效率為
18、:流水線的最高效率為流水線的最高效率為系統(tǒng)結構ch各流水段執(zhí)行時間不等,輸入各流水段執(zhí)行時間不等,輸入n個連續(xù)任務個連續(xù)任務流水線的效率為:流水線的效率為:),max() 12111kkiikiitttntktnE (系統(tǒng)結構ch), ,max() 121111nkiiikiIikiiitttntaatanE(kakii1流水線各段的設備量或各段的價格不相等時:流水線各段的設備量或各段的價格不相等時:流水線的效率為:流水線的效率為:空區(qū)個流水段的總的加權時區(qū)個任務占用的加權時空knE 即:即:其中其中,ai k,且且系統(tǒng)結構chtnknTP) 1(1nknkS1nknE流水線的吞吐率、加速比與
19、效率的關系:流水線的吞吐率、加速比與效率的關系:因為因為因此:因此:E=TPDt,S=kE系統(tǒng)結構ch5、流水線性能分析舉例、流水線性能分析舉例 對于單功能線性流水線,輸入連續(xù)任務的情況,通過上面給出的公式很容易計算出流水線的吞吐率、加速比和效率。用一條4段浮點加法器流水線求8個浮點數(shù)的和ZABCDEFGH系統(tǒng)結構ch1時間空間2 3求階差45671 2 3 45671 2 3 45671 2 3 4567對階尾數(shù)加規(guī)格化加數(shù)A C E GA+BE+FB D F HC+DG+HA+B+C+DE+F+G+H結果A+BC+DE+FG+HA+B+C+DE+F+G+HZ = (A+B) + (C+D)
20、 + (E+F) + (G+H)系統(tǒng)結構chttTnTPk147015787115740ttTTSk470154740ttTkTEk7個浮點加法共用了個浮點加法共用了15個時鐘周期。個時鐘周期。流水線的吞吐率為:流水線的吞吐率為:流水線的加速比為:流水線的加速比為:流水線的效率為:流水線的效率為:系統(tǒng)結構ch第五章標量處理機5.1 先行控制技術5.2 流水線技術5.3 超標量處理機5.4 超流水線處理機5.5 超標量超流水線處理機系統(tǒng)結構ch 5.3 超標量處理機5.3.1 基本結構5.3.2 單發(fā)射與多發(fā)射系統(tǒng)結構ch超標量處理機:Intel公司的i860, i960, Pentium處理機
21、Motolora公司的MC88110IBM公司的Power 6000SUN公司的SuperSPARC等。超流水線處理機:SGI公司的MIPS R4000, R5000, R10000等。超標量超流水線處理機:DEC公司的Alpha等。系統(tǒng)結構chk段流水線基準標量處理機m度超標量n度超流水線(m,n)度超標量超流水機器類型機器流水線周期同時發(fā)射指令條數(shù)指令發(fā)射等待時間指令級并行度ILP1個時鐘周期1條1個時鐘周期11m1m1/n11/nn1/nm1/nmn超標量、超流水、超標量超流水處理機的主要性能系統(tǒng)結構ch5.3.1 基本結構一般流水線處理機:一條指令流水線,一個多功能操作部件,每個時鐘周
22、期平均執(zhí)行指令的條數(shù)小于1。多操作部件處理機:一條指令流水線,多個獨立的操作部件,操作部件可以采用流水線,也可以不流水。多操作部件處理機的指令級并行度小于1。系統(tǒng)結構ch超標量處理機典型結構:多條指令流水線先進的超標量處理機有:定點處理部件CPU,浮點處理部件FPU,圖形加速部件GPU大量的通用寄存器,兩個一級高速Cache超標量處理機的指令級并行度大于1系統(tǒng)結構chMotorola公司的MC88110:10個操作部件兩個寄存器堆:整數(shù)部件通用寄存器堆,32個32位寄存器;浮點部件擴展寄存器堆,32個80位寄存器。每個寄存器堆有8個端口,分別與8條內(nèi)部總線相連接,有一個緩沖深度為4的先行讀數(shù)棧
23、和一個緩沖深度為3的后行寫數(shù)棧。兩個獨立的高速Cache中,各為8KB,采用兩路組相聯(lián)方式,轉(zhuǎn)移目標指令Cache,在有兩路分支時,存放其中一路分支上的指令系統(tǒng)結構ch整數(shù)部件整數(shù)部件位操作浮點加乘法部件除法部件圖形部件圖形部件內(nèi)部總線讀數(shù)存數(shù)部件通用寄存器堆擴展寄存器堆目標指令指令分配轉(zhuǎn)移部件數(shù)據(jù)Cache (8KB)指令Cache (8KB)系統(tǒng)總線32位地址總線32位數(shù)據(jù)總線超標量處理機MC88110的結構系統(tǒng)結構ch5.3.2 單發(fā)射與多發(fā)射單發(fā)射處理機:每個周期只取一條指令、只譯碼一條指令,只執(zhí)行一條指令,只寫回一個運算結果取指部件和譯碼部件各設置一套可以只設置一個多功能操作部件,也
24、可以設置多個獨立的操作部件操作部件中可以采用流水線結構,也可以不采用流水線結構設計目標是每個時鐘周期平均執(zhí)行一條指令,ILP的期望值1系統(tǒng)結構chIF時鐘周期指令I1I2I3IDEXWRIFIDEXWRIFIDEXWR123456單發(fā)射處理機的指令流水線時空圖系統(tǒng)結構chIFIDFA1 FA2 FA3MD1MD2MD3ALLS浮點加法部件乘除法部件定點ALU部件取數(shù)存數(shù)部件WR來自指令Cache通用寄存器后行寫數(shù)棧系統(tǒng)結構ch多發(fā)射處理機:每個周期同時取多條指令、同時譯碼多條指令,同時執(zhí)行多條指令,同時寫回多個運算結果需要多個取指令部件,多個指令譯碼部件和多個寫結果部件設置多個指令執(zhí)行部件,復
25、雜的指令執(zhí)行部件一般采用流水線結構設計目標是每個時鐘周期平均執(zhí)行多條指令,ILP的期望值大于1系統(tǒng)結構chIF時鐘周期指令I1I2I3IDEXWR123456多發(fā)射處理機的指令流水線時空圖I4I5I6IFIDEXWRI7I8I9IFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWR系統(tǒng)結構chIFIDFA1 FA2 FA3MD1MD2MD3ALLS浮點加法部件乘除法部件定點ALU部件取數(shù)存數(shù)部件WRIFIDWR系統(tǒng)結構ch超標量處理機:一個時鐘周期內(nèi)能夠同時發(fā)射多條指令的處理機稱為超標量處理機必須有兩條或兩條以上能夠同時工作的指令流水線
26、先行指令窗口:能夠從指令Cache中預取多條指令能夠?qū)Υ翱趦?nèi)的指令進行數(shù)據(jù)相關性分析和功能部件沖突的檢測窗口的大?。阂话銥?至8條指令采用目前的指令調(diào)度技術,每個周期發(fā)射2至4條指令比較合理系統(tǒng)結構ch例如:Intel公司的i860、i960、Pentium處理機,Motolora公司的MC88110處理機,IBM公司的Power 6000處理機等每個周期都發(fā)射兩條指令TI公司生產(chǎn)的SuperSPARC處理機以及Intel的Pentium III處理機等每個周期發(fā)射三條指令操作部件的個數(shù)多于每個周期發(fā)射的指令條數(shù)。4個至16個操作部件超標量處理機的指令級并行度:1ILPm;m為每個周期發(fā)射的指
27、令條數(shù)。系統(tǒng)結構chIFIDFA1 FA2 FA3MD1MD2MD3ALLS浮點加法部件乘除法部件定點ALU部件取數(shù)存數(shù)部件WRIFIDWRIFID先行指令窗口系統(tǒng)結構ch超標量處理機的性能超標量處理機的性能在理想情況下,在理想情況下,N條沒有資源沖突、沒有數(shù)據(jù)相關和控制相條沒有資源沖突、沒有數(shù)據(jù)相關和控制相關的指令在單流水線普通標量處理機中執(zhí)行的時間是:關的指令在單流水線普通標量處理機中執(zhí)行的時間是:tNkT) 1() 1 , 1 (在超標量處理機中執(zhí)行的時間是:在超標量處理機中執(zhí)行的時間是:tmmNkmT)() 1 ,(超標量處理機相對于普通處理機的加速比是:超標量處理機相對于普通處理機的
28、加速比是:) 1() 1() 1 ,() 1 , 1 () 1 ,(kmNNkmmTTmS系統(tǒng)結構ch第五章標量處理機5.1 先行控制技術5.2 流水線技術5.3 超標量處理機5.4 超流水線處理機5.5 超標量超流水線處理機系統(tǒng)結構ch 5.4 超流水線處理機兩種定義:一個周期內(nèi)能夠分時發(fā)射多條指令的處理機稱為超流水線處理機指令流水線有8個或更多功能段的流水線處理機稱為超流水線處理機提高處理機性能的不同方法:超標量處理機是通過增加硬件資源為代價來換取處理機性能的超流水線處理機則通過各硬件部件充分重疊工作來提高處理機性能系統(tǒng)結構ch兩種不同并行性:超標量處理機采用的是空間并行性超流水線處理機采
29、用的是時間并行性系統(tǒng)結構ch5.4.1 指令執(zhí)行時序每隔1/n個時鐘周期發(fā)射一條指令,流水線周期為1/n個時鐘周期在超標量處理機中,流水線的有些功能段還可以進一步細分例如:ID功能段可以再細分為譯碼、讀第一操作數(shù)和讀第二操作數(shù)三個流水段。也有些功能段不能再細分,如WR功能段一般不再細分。因此有超流水線的另外一種定義:有8個或8個以上流水段的處理機稱為超流水線處理機系統(tǒng)結構chIF時鐘周期指令I1I2I3IDEXWR123456每個時鐘周期分時發(fā)送3條指令的超流水線I4I5I6IFIDEXWRI7I8I9IFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEX
30、WRIFIDEXWR系統(tǒng)結構ch5.4.2 典型處理機結構MIPS R4000處理機每個時鐘周期包含兩個流水段,是一種很標準的超流水線處理機結構。指令流水線有8個流水段有兩個Cache,指令Cache和數(shù)據(jù)Cache的容量各8KB,每個時鐘周期可以訪問Cache兩次,因此在一個時鐘周期內(nèi)可以從指令Cache中讀出兩條指令,從數(shù)據(jù)Cache中讀出或?qū)懭雰蓚€數(shù)據(jù)。主要運算部件有整數(shù)部件和浮點部件系統(tǒng)結構ch譯譯 碼碼數(shù)數(shù) 據(jù)據(jù)C C a a c c h h e e標標 志志標標 志志指指 令令C C a a c c h h e e譯譯 碼碼存存 入入緩緩 沖沖 對對 準準 器器IB U S寫寫 入
31、入 緩緩 沖沖 器器數(shù)數(shù) 據(jù)據(jù)標標 志志地地 址址D B U S 系系 統(tǒng)統(tǒng) 控控 制制浮浮 點點存存 儲儲 管管 理理 部部 件件寄寄 存存 器器 堆堆指指 令令 快快 表表浮浮 點點 流流 水水 線線 專專 用用 通通 路路指指 令令 C ach e控控 制制快快 表表 TL B浮浮 點點 控控 制制 寄寄 存存 器器 D V A浮浮 點點 乘乘 法法 部部 件件地地 址址 部部 件件浮浮 點點 除除 法法 部部 件件數(shù)數(shù) 據(jù)據(jù) C ach e控控 制制程程 序序 計計 數(shù)數(shù) 器器浮浮 點點 加加 法法 部部 件件流流 水水 線線通通 用用 寄寄 存存 器器 堆堆轉(zhuǎn)轉(zhuǎn) 換換 部部 件件控控
32、 制制算算 術術 邏邏 輯輯 部部 件件 A L U求求 平平 方方 根根 部部 件件裝裝 入入 對對 準準 器器 / / 存存 入入 驅(qū)驅(qū) 動動 器器整整 數(shù)數(shù) 乘乘 法法 除除 法法 部部 件件M M I I P P S S R R 4 4 0 0 0 0 0 0 超超 流流 水水 線線 處處 理理 機機 結結 構構系統(tǒng)結構ch指令CacheMIPS R4000處理機的流水線操作IF:取第一條指令IS:取第二條指令RF:讀寄存器堆,指令譯碼EX:執(zhí)行指令DF:取第一個數(shù)據(jù)DS:取第二個數(shù)據(jù)TC:數(shù)據(jù)標志校驗;WB:寫回結果指令譯碼讀寄存器堆ALU數(shù)據(jù)Cache標志檢驗寄存器堆IFISRFE
33、XDF DSWBTC系統(tǒng)結構chIF流水線周期當前CPU周期IS RF EX DF DS TC WBIFIS RF EX DF DS TC WBIFIS RF EX DF DS TC WBIFIS RF EX DF DS TC WBIFIS RF EX DF DS TC WBIFIS RF EX DF DS TC WBIFIS RF EX DF DS TC WBIFIS RF EX DF DS TC WB主時鐘周期MIPS R4000正常指令流水線工作時序系統(tǒng)結構ch如果在LOAD指令之后的兩條指令中,任何一條指令要在它的EX流水級使用這個數(shù)據(jù),則指令流水線要暫停一個時鐘周期采用順序發(fā)射方式系
34、統(tǒng)結構ch暫停IFIS RF EX DF DS TC WBMIPS R4000正常指令流水線工作時序IS RF EX DF DS TC WBRF EX DF DS TC WBEX DF DS TC WBEX DF DS TC WBDF DS TC WBIFISRFI1I2I3I4I5I6運行運行Load指令使用Load數(shù)據(jù)系統(tǒng)結構chtnknTN)(),(11tnNktNknTTnS)1() 1(), 1 () 1 , 1 (),(15.4.3 超流水線處理機性能超流水線處理機性能指令級并行度為(1,n)的超流水線處理機,執(zhí)行N條指令所的時間為超流水線處理機相對于單流水線普通標量處理機的加速比
35、為系統(tǒng)結構ch1) 1(), 1 (NnkNknnS即:超流水線處理機的加速比的最大值為:S(1,n)MAX = n系統(tǒng)結構ch第五章標量處理機5.1 先行控制技術5.2 流水線技術5.3 超標量處理機5.4 超流水線處理機5.5 超標量超流水線處理機系統(tǒng)結構ch 5.5 超標量超流水線處理機把超標量與超流水線技術結合在一起,就成為超標量超流水線處理機5.5.1 指令執(zhí)行時序5.5.2 典型處理機結構5.5.3 超標量超流水線處理機性能5.5.4 三種指令級并行性處理機性能比較系統(tǒng)結構ch5.5.1 指令執(zhí)行時序超標量超流水線處理機在一個時鐘周期內(nèi)分時發(fā)射指令n次,每次同時發(fā)射指令m條,每個時
36、鐘周期總共發(fā)射指令m n條。系統(tǒng)結構chIF時鐘周期指令I1I2I3IDEXWR12345I4I5I6I7I8I9IFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRI10I11I12每時鐘周期發(fā)射3次,每次3條指令系統(tǒng)結構ch5.5.2 典型處理機結構DEC公司的Alpha處理機采用超標量超流水線結構。主要由四個功能部件和兩個Cache組成:整數(shù)部件EBOX、浮點部件FBOX、地址部件ABOX和中央控制部件IBOX。中央控制部件IBOX可以同時從指令Cache中讀入兩條
37、指令,同時對讀入的兩條指令進行譯碼,并且對這兩條指令作資源沖突檢測,進行數(shù)據(jù)相關性和控制相關性分析。如果資源和相系統(tǒng)結構ch關性允許,IBOX就把兩條指令同時發(fā)射給EBOX、ABOX和FBOX三個指令執(zhí)行部件中的兩個。指令流水線采用順序發(fā)射亂序完成的控制方式。在指令Cache中有一個轉(zhuǎn)移歷史表,實現(xiàn)條件轉(zhuǎn)移的動態(tài)預測。在EBOX內(nèi)還有多條專用數(shù)據(jù)通路,可以把運算結果直接送到執(zhí)行部件。Alpha 21064處理機共有三條指令流水線整數(shù)操作流水線和訪問存儲器流水線分為7個流水段,其中,取指令和分系統(tǒng)結構ch析指令為4個流水段,運算2個流水段,寫結果1個流水段。浮點操作流水線分為10個流水段,其中,
38、浮點執(zhí)行部件FBOX的延遲時間為6個流水段。所有指令執(zhí)行部件EBOX、IBOX、ABOX和FBOX中都設置由專用數(shù)據(jù)通路。系統(tǒng)結構ch系統(tǒng)結構ch析指令為4個流水段,運算2個流水段,寫結果1個流水段。浮點操作流水線分為10個流水段,其中,浮點執(zhí)行部件FBOX的延遲時間為6個流水段。所有指令執(zhí)行部件EBOX、IBOX、ABOX和FBOX中都設置由專用數(shù)據(jù)通路。Alpha 21064處理機的三條指令流水線的平均段數(shù)為8段,每個時鐘周期發(fā)射兩條指令。因此,Alpha 21064處理機是超標量超流水線處理機。系統(tǒng)結構chSWAPIF取值SWAP 交換雙發(fā)射指令、轉(zhuǎn)移預測I0指令譯碼I1訪問通用寄存器堆,發(fā)射校驗A1計算周期1,IBOX計算新的PC值A2計算周期2,查指令快表WR寫整數(shù)寄存器堆,指令Cache命中檢測17個流水段的整數(shù)操作流水線IFI0I1A0A1WR234560系統(tǒng)結構chSWAPIF取值SWAP 交換雙發(fā)射指令、轉(zhuǎn)移預測I0指令譯碼I1訪問通用寄存器堆,發(fā)射校驗ACABOX計算有效數(shù)據(jù)地址TB查數(shù)據(jù)快表HM寫讀數(shù)緩沖棧,數(shù)據(jù)Cache命中/不命中檢測17個流水段的訪問存儲器流水線IF
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級上冊數(shù)學教案-7.4分數(shù)的初步認識(一)練習十一 |蘇教版
- 六年級上冊數(shù)學教案-6.1 比的認識(一)|北師大版
- 加法運算律教案2024-2025學年數(shù)學四年級上冊 西師大版
- 2025年轉(zhuǎn)讓有限公司股權合同
- 一致行動人協(xié)議(2025年版)-@-1
- 一年級上冊數(shù)學教案-總復習第1課時數(shù)與代數(shù)(1)∣北師大版
- 河南省三門峽市陜州區(qū)三年級英語下學期期中試題(人教PEP版-含答案)
- 《秋詞》歷年中考古詩欣賞試題匯編(截至2022年)
- 2025年河南省信陽市單招職業(yè)適應性測試題庫及答案1套
- 2025年湖南鐵路科技職業(yè)技術學院單招職業(yè)技能測試題庫參考答案
- 【道法】開學第一課 課件-2024-2025學年統(tǒng)編版道德與法治七年級下冊
- 中華民族共同體概論專家講座第一講中華民族共同體基礎理論
- 2023年浙江省統(tǒng)招專升本考試英語真題及答案解析
- GB 9706.202-2021醫(yī)用電氣設備第2-2部分:高頻手術設備及高頻附件的基本安全和基本性能專用要求
- A320主起落架收放原理分析及運動仿真
- 植筋施工方案(二標)
- 神經(jīng)外科疾病健康宣教
- 2. SHT 3543-2017施工過程文件表格
- 分部分項工程項目清單
- 電纜防火分析及措施
- 幼兒園小足球活動游戲化教學的研究
評論
0/150
提交評論