計(jì)算機(jī)體系結(jié)構(gòu)第三章答案_第1頁
計(jì)算機(jī)體系結(jié)構(gòu)第三章答案_第2頁
計(jì)算機(jī)體系結(jié)構(gòu)第三章答案_第3頁
計(jì)算機(jī)體系結(jié)構(gòu)第三章答案_第4頁
計(jì)算機(jī)體系結(jié)構(gòu)第三章答案_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章答案三、流水線技術(shù)(80空)1、對(duì)階尾數(shù)相加2、求階差規(guī)格化3、時(shí)間流水線的各段4、 盡量相等流水線的瓶頸5、 通過時(shí)間大量重復(fù)的時(shí)序輸入端能連續(xù)地提供任務(wù)6、靜態(tài)動(dòng)態(tài)7、部件級(jí)處理機(jī)級(jí)8、 標(biāo)量流水處理機(jī)向量流水處理機(jī)9、 線性流水線非線性流水線10、 執(zhí)行/有效地址計(jì)算周期存儲(chǔ)器訪問/分支完成周期11、譯碼讀寄存器12、ALUoutput J A op B ALUoutput J NPC + Imm13、分支STORE指令14、ALU指令LOAD指令15、單周期多周期16、重復(fù)設(shè)置指令執(zhí)行功能部件 流水17、吞吐率等功能非流水線18、通過時(shí)間排空時(shí)間19、 流水線寄存器的延遲時(shí)鐘扭曲

2、20、數(shù)據(jù)相關(guān)控制相關(guān)21、結(jié)構(gòu)相關(guān)數(shù)據(jù)相關(guān)22、結(jié)構(gòu)數(shù)據(jù)23、硬件開銷 功能單元的延遲24、寫后讀 讀后寫 寫后讀25、寫后讀讀后寫26、PC值改變?yōu)榉种мD(zhuǎn)移的目標(biāo)地址PC值保持正常(等于當(dāng)前值加4)27、目標(biāo)地址分支轉(zhuǎn)移條件不成立28、8存儲(chǔ)器29、多功能線性 830、 水平處理方式垂直處理方式31、縱向處理方式縱橫處理方式32、存儲(chǔ)器 向量寄存器33、訪問存儲(chǔ)器的次數(shù) 對(duì)存儲(chǔ)器帶寬的要求34、 每秒執(zhí)行多少指令(MIPS)每秒取得多少個(gè)浮點(diǎn)運(yùn)算結(jié)果( MFLOPS)35、512 836、鏈接技術(shù)向量循環(huán)或分段開采技術(shù)37、源向量結(jié)果向量38、 向量功能部件標(biāo)量寄存器向量寄存器塊39、 向

3、量寄存器 向量功能部件3.1流水線的基本概念1、流水線:將一個(gè)重復(fù)的時(shí)序過程,分解為若干個(gè)子過程,而每一個(gè)子過程都可有效地在其專用功能段上與其他子過程同時(shí)執(zhí)行。2、單功能流水線:只能完成一種固定功能的流水線。3、多功能流水線:流水線的各段可以進(jìn)行不同的連接,從而使流水線在不同的時(shí)間,或者在同一時(shí)間 完成不同的功能。4、靜態(tài)流水線:同一時(shí)間內(nèi),流水線的各段只能按同一種功能的連接方式工作。5、動(dòng)態(tài)流水線:同一時(shí)間內(nèi),當(dāng)某些段正在實(shí)現(xiàn)某種運(yùn)算時(shí),另一些段卻在實(shí)現(xiàn)另一種運(yùn)算。6、 部件級(jí)流水線:(運(yùn)算操作流水線)把處理機(jī)的算術(shù)邏輯部件分段,以便為各種數(shù)據(jù)類型 進(jìn)行流水操作。7、處理機(jī)級(jí)流水線:(指令流

4、水線)把解釋指令的過程按照流水方式處理。8、線性流水線:指流水線的各段串行連接,沒有反饋回路。9、非線性流水線:指流水線中除有串行連接的通路外,還有反饋回路。10、標(biāo)量流水處理機(jī):處理機(jī)不具有向量數(shù)據(jù)表示,僅對(duì)標(biāo)量數(shù)據(jù)進(jìn)行流水處理。11、向量流水處理機(jī):處理機(jī)具有向量數(shù)據(jù)表示,并通過向量指令對(duì)向量的各元素進(jìn)行處理。3.2 DLX的基本流水線12、固定字段譯碼:在DLX指令多周期實(shí)現(xiàn)中,由于DLX指令格式中操作碼在固定位置,且都是6 位編碼,在指令執(zhí)行的第二個(gè)時(shí)鐘周期,指令譯碼和讀寄存器并行進(jìn)行,這種技術(shù)稱為固定字段譯 碼。13、吞吐率:吞吐率是指單位時(shí)間內(nèi)流水線所完成的任務(wù)數(shù)或輸出結(jié)果的數(shù)量。

5、14、最大吞吐率:最大吞吐率是指流水線在連續(xù)流動(dòng)達(dá)到穩(wěn)定狀態(tài)后所得到的吞吐率。15、流水線效率:由于流水線有通過時(shí)間和排空時(shí)間,所以流水線的各段并不是一直滿負(fù)荷地工 作。效率是指流水線的設(shè)備利用率。3.3流水線中的相關(guān)16、 結(jié)構(gòu)相關(guān):某些指令組合在流水線中重疊執(zhí)行時(shí),發(fā)生資源沖突,則稱該流水線有結(jié)構(gòu) 相關(guān)。17、 數(shù)據(jù)相關(guān):當(dāng)指令在流水線中重疊執(zhí)行時(shí),流水線有可能改變指令讀使得/寫操作的順序, 讀/寫操作順序不同于它們非流水實(shí)現(xiàn)時(shí)的順序,將導(dǎo)致數(shù)據(jù)相關(guān)。18、定向:將計(jì)算結(jié)果從其產(chǎn)生的地方直接送到其他指令需要它的地方,能單 或所有需要它的功 元,避免暫停。19、Load互鎖:由Load指令引

6、起的RAW相關(guān),當(dāng)檢測(cè)到相關(guān)后,控制部件必須在流水線 中插入暫 停周期,并使IF和ID段中的指令停止前進(jìn)。20、 寫后讀相關(guān):兩條指令i,j,i在j前進(jìn)入流水線,j執(zhí)行要用到i的結(jié)果,但當(dāng)其在流水線中 重疊執(zhí)行時(shí),j可能在i寫入其結(jié)果之前就先行對(duì)保存該結(jié)果的寄存器進(jìn)行讀操作,得到錯(cuò)誤值。21、 讀后寫相關(guān):兩條指令i, j,i在j前進(jìn)入流水線,j可能在i讀某個(gè)寄存器之前對(duì)該寄存器進(jìn)行寫 操作,導(dǎo)致i讀出數(shù)據(jù)錯(cuò)誤。22、 寫后寫相關(guān):兩條指令i, j, i在j前進(jìn)入流水線,j、i的操作數(shù)一樣,在流水線中重疊執(zhí)行時(shí), j可能在i寫入其結(jié)果之前就先行對(duì)保存該結(jié)果的寄存器進(jìn)行寫操作,導(dǎo)致寫錯(cuò)誤。MIP

7、S R4000流水線計(jì)算機(jī) 向量處理機(jī) 23、水平(橫向)處理方式:在向量處理機(jī)中,向量指令對(duì)數(shù)據(jù)分量的處理 方式是按行的方式從左至右橫向地進(jìn)行。24、垂直(縱向)處理方式:在向量處理機(jī)中,向量指令對(duì)數(shù)據(jù)分量的處理方式是按列的方式全上而 下縱向地進(jìn)行。25、分組(縱橫)處理方式:在向量處理機(jī)中,向量指令對(duì)數(shù)據(jù)分量的處理方式是把向量分成長度為 某個(gè)固定值的若干組,組內(nèi)按縱向方式處理,依次處理各組。3.1流水線的基本概念1、流水技術(shù)的特點(diǎn)有哪些?答:(1)流水過程由多個(gè)相聯(lián)系的子過程組成,每個(gè)過程稱為流水 線的“級(jí)”或“段”每個(gè)子過程由專用的功能段實(shí)現(xiàn);2分(2)各個(gè)功能段所需時(shí)間應(yīng)盡量相等,否則

8、,時(shí)間長的功能段將成為流水線的瓶頸,會(huì)造成流水 線的“堵塞”和“斷流” ;2分(3) 流水線需要有“通過時(shí)間”(第一個(gè)任務(wù)流出結(jié)果所需的時(shí)間),在此之后流水過程才 進(jìn)入穩(wěn)定工作狀態(tài),每一個(gè)時(shí)鐘周期(拍)流出一個(gè)結(jié)果;1分(4)流水技術(shù)適合于大量重復(fù)的時(shí)序過程,只有在輸入端能連續(xù)地提供任務(wù),流水線的效率才能 充分發(fā)揮。1分3.2 DLX的基本流水線1在DLX指令的多周期實(shí)現(xiàn)中,一條DLX指令需4或5個(gè)時(shí)鐘周期。請(qǐng)寫出各時(shí)鐘周期中文名稱以及R-R類型ALU指令在每個(gè)時(shí)鐘周期中所做的操作。答:(1)取指令周期(IF)IR - MemPCNPC - PC + 41 分(2)指令譯碼 /讀寄存器周期(I

9、D) A - RegsIR6 10 B - RegsIRii .15 Imm -(IR16) 16 # IR16.31 1 分(3) 執(zhí)行/有效地址計(jì)算周期(EX) ALUOutput - A op B 1分(4) 存儲(chǔ)器訪問/分支完成周期(MEM) LMD - MemALUOutput 1分(5)寫回周期(WB) RegsIR 16 .20 - ALUOutput 2分2、從CPI和CC的角度考慮,指令的實(shí)現(xiàn)有哪兩種方案,各有何優(yōu)缺點(diǎn)?答:實(shí)現(xiàn)方案 一:一條指令用多個(gè)時(shí)鐘周期CPI1優(yōu)點(diǎn):有利于流水線實(shí)現(xiàn)指令的執(zhí)行。缺點(diǎn):硬件冗余大實(shí)現(xiàn)方案二:一條指令用一個(gè)長時(shí)鐘周期CPI =1但CC2遠(yuǎn)大

10、于多周期實(shí)現(xiàn)的CC1優(yōu)點(diǎn):臨時(shí)寄存器可省去缺點(diǎn):1、低效率指令要執(zhí)行的操作總量變化較大,不同指令實(shí)現(xiàn)所需要的時(shí)鐘周期時(shí)間大不一 樣。2、基于單周期實(shí)現(xiàn)提高程序執(zhí)行速度需要重復(fù)設(shè)置指令執(zhí)行功能部件,而基于多周期實(shí)現(xiàn)提高速度可 采用流水技術(shù)。3、DLX流水線中的多路選擇器MUX有幾個(gè),分別在哪一流水段,如何選擇輸入(即多 路器如何控制)?答:(1)IF段MUX由Cond判斷控制:下一條指令地址為增長后的PC (當(dāng)前PC加4) 或向前數(shù)第三條指令的ALUOutput的值,前提是那條指令為分支指令并且條件成立;(2)EX段有兩個(gè)MUX:由指令類型控制如果是分支指令,則NPC ALU否則A ALU如果是

11、ALU指令,則B、ALU否則:立 即數(shù)/位移量ALU(3)WB段MUX:由指令類型控制(Load/ALU)寫回Reg的值來自于LMD (Load指令)或ALUOutput (ALU指令)3.3流水線中的相關(guān)1、試簡要說明流水線中幾種相關(guān)類型。答:流水線中的相關(guān)是指相鄰或相近的兩條指令因存在某種關(guān)聯(lián),后一條指令不能在原指定的時(shí)鐘周期開始執(zhí)行。(1)結(jié)構(gòu)相關(guān):當(dāng)硬件資源滿足不了同時(shí)重疊執(zhí)行的指令的要求,而發(fā)生資源沖突 時(shí),就發(fā)生了結(jié)構(gòu)相關(guān)。(2)數(shù)據(jù)相關(guān):當(dāng)一條指令需要用到前面某條指令的結(jié)果,從而不能重疊執(zhí)行時(shí),就 發(fā)生了數(shù)據(jù)相關(guān)。(3) 控制相關(guān):當(dāng)流水線遇到分支指令和其他能夠改變PC值的指令時(shí)

12、,就會(huì)發(fā) 生控制相關(guān)。2、常見的導(dǎo)致結(jié)構(gòu)相關(guān)的原因有哪些?為什么流水線設(shè)計(jì)者有時(shí)允許結(jié)構(gòu)相關(guān)存在? 答:常見的導(dǎo)致結(jié)構(gòu)相關(guān)的原因有以下兩種:(1)功能部件不是全流水;(2)重復(fù)設(shè)置的資源的份數(shù)不夠。流水線設(shè)計(jì)者有時(shí)允許結(jié)構(gòu)相關(guān)存在的原因:(1)有的結(jié)構(gòu)并不經(jīng)常發(fā)生,而為了避免結(jié)構(gòu)相關(guān)需要增加大量的硬件開銷;結(jié)構(gòu)相 關(guān)存在可降低硬件成本;(2)可以減少部件的延遲??稍O(shè)計(jì)出比完全流水化功能單元具有更短延遲時(shí)間的非流 水化和不完全流水化的功能單元。3、請(qǐng)分析下列指令序列的數(shù)據(jù)相關(guān)情況,可采取哪些技術(shù)來保證指令正確執(zhí)行,或減 小流水線性能損失?ADD R1,R2,R3SUB R4,R1,R5AND R

13、6,R1,R7OR R8,R1,R9XOR R10,R1,R11答:第一條指令和緊鄰的三條指令產(chǎn)生數(shù)據(jù)相關(guān),最后一條指令和前面的指令不產(chǎn)生數(shù)據(jù)相關(guān)。第條和第條產(chǎn)生寫后讀的數(shù)據(jù)相關(guān),可使用定向技術(shù)消除數(shù)據(jù)相關(guān),第條和第 條產(chǎn)生寫后讀的數(shù)據(jù)相關(guān),可使用寄存器技術(shù)消除數(shù)據(jù)相關(guān)。4、DLX流水線中,定向技術(shù)的主要思想是什么?如何實(shí)現(xiàn)?答:定向技術(shù)的實(shí)現(xiàn):在某一個(gè)功能單元的輸入端和與某一個(gè)功能單元輸出端具有數(shù)據(jù)通 路的流水寄存器之間通過多路器建立通路。當(dāng)定向硬件檢測(cè)到前面某條指令的結(jié)果寄存器就是當(dāng)前指令的源寄存器時(shí),控制邏 輯會(huì)開通前面那條指令的結(jié)果目前所在的位置(某個(gè)流水寄存器)到當(dāng)前指令所需的位置

14、(某個(gè)功能單元的輸入端)的通路。5、有的數(shù)據(jù)相關(guān)可通過編譯器調(diào)度方法來消除暫停。請(qǐng)為下列表達(dá)式生成沒有暫停的DLX代碼序列。假設(shè)載入延遲為1個(gè)時(shí)鐘周期。a=b-c;d=e-f答:調(diào)度前后的代碼序列如下:調(diào)度前代碼調(diào)度后代碼LW Rb, bLW Rb,bLW Rc,cLW Rc,cADD Ra,Rb,RcLW Re,eSW a,RaADD Ra,Rb,RcLW Re,eSW a,RaLw Rf,fSUB Rd,Re,RfLw Rf,fSW d,RdSUB Rd,Re,RfSW d,Rd6減少流水線處理分支指令時(shí)的暫停時(shí)鐘周期數(shù)的技術(shù)途徑是什么?其流水線數(shù)據(jù)通路應(yīng) 如何改進(jìn)?答:在流水線中盡早判斷

15、分支轉(zhuǎn)移是否成功;轉(zhuǎn)移成功時(shí),盡早計(jì)算出轉(zhuǎn)移目標(biāo)地址。兩者應(yīng)同時(shí)采用,缺一不可。(1)(1)把“二0?”測(cè)試移至ID段;(2)在ID段增設(shè)一個(gè)加法器,這樣可以把分支開 銷減少一拍。7、為了在延遲槽中填入有效指令,一般可采用哪三種方法?比較它們的優(yōu)缺點(diǎn)。答:為 了在延遲槽中填入有效指令,一般可采用以下三種方法:1)將轉(zhuǎn)移指令前的那條指令調(diào)度到延遲槽中。2)將轉(zhuǎn)移目標(biāo)處的那條指令調(diào)度到延遲槽中。3)將轉(zhuǎn)移不發(fā)生時(shí)該執(zhí)行的那條指令調(diào)度到延遲槽中。相比之下:這三種方法中,第一種方法的效果最好,總能使性能獲得改善。但當(dāng)轉(zhuǎn)移指令中所 用到的條件判別與轉(zhuǎn)移指令前的那條指令相關(guān)時(shí),就只能使用方法二或方法三。方

16、法二僅當(dāng)轉(zhuǎn)移發(fā)生時(shí)才會(huì)改進(jìn)性能, 且由于要將該指令復(fù)制,造成存儲(chǔ)空間占用的增加,此方法適于轉(zhuǎn)移發(fā)生概率較高的場合,如循環(huán)程序段。使用方法三僅當(dāng)轉(zhuǎn)移不發(fā)生時(shí)才會(huì)改進(jìn)性 能。此外,方法二各方法三都要求:當(dāng)轉(zhuǎn)移按另一方向前進(jìn)時(shí),執(zhí)行調(diào)入延遲槽中指令不會(huì)破壞程序的正確執(zhí)行。8、降低流水線分支損失的方法有哪些?答:(1)在流水線中盡早判斷出分支轉(zhuǎn)移是否成功; TOC o 1-5 h z 盡早計(jì)算出分支轉(zhuǎn)移成功時(shí)的PC值(即分支的目標(biāo)地址)2分(2)“凍結(jié)”或“排空”流水線的方法1分(3)預(yù)測(cè)分支失敗1分(4) 預(yù)測(cè)分支成功1分(5) 延遲分支1分3.4 MIPS R4000流水線計(jì)算機(jī)1、MIPS R4

17、000整型流水線結(jié)構(gòu)是怎樣的?3.5向量處理機(jī)1、三種向量處理方式,對(duì)向量處理機(jī)的結(jié)構(gòu)要求有何不同?答:1水平處理方式:若向量長度為N,則水平處理方式相當(dāng)于執(zhí)行N次循環(huán)。若使用流水線,在每次循環(huán)中可能出現(xiàn)數(shù)據(jù)相關(guān)和功能轉(zhuǎn)換,不適合對(duì)向量進(jìn)行流水處理。2垂直處理方式:將整個(gè)向量按相同的運(yùn)算處理完畢之后,再去執(zhí)行其他運(yùn)算。適合 對(duì)向量進(jìn) 行流水處理,向量運(yùn)算指令的源/目向量都放在存儲(chǔ)器內(nèi),使得流水線運(yùn)算部件的輸入、輸出端直接與存儲(chǔ)器相聯(lián),構(gòu)成M-M型的運(yùn)算流水線。3分組處理方式:把長度為 N的向量分為若干組,每組長度為n,組內(nèi)按縱向方式處理,依次處理各組,組數(shù)為N 適合流水處理??稍O(shè)長度為n的向量

18、寄存器,使每組向量n I運(yùn)算的源/目向量都在向量寄存器中,流水線的運(yùn)算部件輸入、輸出端與向量寄存器相聯(lián),構(gòu)成R-R型 運(yùn)算流水線。2、什么是向量處理鏈接技術(shù)?答:向量處理鏈接技術(shù)是從流水線的“定向”概念發(fā)展而來的。當(dāng)兩條指令出現(xiàn)寫后讀” 相關(guān)時(shí),若它們不存在功能部件沖突和向量寄存器(源或目的)沖突,就有可能把它們所用的功能部件頭尾相接,形成一個(gè)鏈接流水線,進(jìn)行流水處理。為了在向 量處理機(jī)中實(shí)現(xiàn)向量鏈接機(jī)制必須恰當(dāng)?shù)卦O(shè)定所需要的向理功能部件和操作數(shù)寄存器;否 則,鏈接操作就不得不掛起直到所需要的資源變?yōu)榭捎脼橹埂?、向量處理鏈接技術(shù)有哪些技術(shù)要求?答:除了要保證無向量寄存器使用沖突和無向量功能部

19、件使用沖突的條件之外,還有諸如 鏈接時(shí)機(jī)等其他一些要求,主要有:在進(jìn)行鏈接的時(shí)候,只有在前一條向量指令的第一個(gè)結(jié)果元素送入結(jié)果向量寄存器 的那一個(gè)時(shí)鐘周期才可以進(jìn)行鏈接,若錯(cuò)過該時(shí)刻就不能進(jìn)行鏈接。只有當(dāng)前一條向量指令全部執(zhí)行完畢,釋放相應(yīng)的向量寄存器資源后才能執(zhí)行后面 的向量指令。當(dāng)一條向量指令的兩個(gè)源操作數(shù)分別是兩條先行向量指令的結(jié)果寄存器時(shí),要求先行的兩條向量指令產(chǎn)生運(yùn)算結(jié)果的時(shí)間必須相等,即要求有關(guān)向量功能部件的延遲 時(shí)間相等。只有所有可以鏈接執(zhí)行的向量指令的向量長度相等時(shí),它們之間才能鏈接執(zhí)行,否則它們之間也不能鏈接執(zhí)行。4、什么是分段向量處理技術(shù)?答:當(dāng)向量的長度大于向量寄存器的長

20、度時(shí),把長向量分成固定長度的段,然后循環(huán)分段 處理,一次循環(huán)只處理一個(gè)向量段。這種長向量循環(huán)分段處理的程序結(jié)構(gòu)稱為向量循環(huán), 這種分段向量處理技術(shù)也稱為分段開米。將長向量循環(huán)分段處理是由系統(tǒng)硬件和軟件控制 完成的,對(duì)程序員透明。1假設(shè)一條指令的解釋分為取指、分析與執(zhí)行三個(gè)階段,每個(gè)階段所需時(shí)間為t取指、t分析、t執(zhí)行。(1)寫出用下列幾種方式執(zhí)行100條指令所需的時(shí)間的通式:1)順序方式;2)僅”執(zhí)行k、與”取指k+1重疊;3)僅執(zhí)行K、”分析k+1和取指k+2重疊。(2)當(dāng)t取指=t分析=2,t執(zhí)行=3以及t取指=t分析=4,t執(zhí)行=2時(shí),用上述通式計(jì)算所需時(shí)間。解:(1)以下是各方式執(zhí)行1

21、00條指令所需時(shí)間的通式:1)順序方式:100七=刀仕取指i+t分析i+t執(zhí)行i1=100t取指i+t分析i+t執(zhí)行i“執(zhí)行i”與“取指k”重疊:100t=t+刀 t取指1分析1i=1100+e maxt,t 執(zhí)行i-i取指ii=2+t執(zhí)行1003)僅“執(zhí)行k”、“分析K+1”與“取指K+2重疊:t=t取指1+maxt分析1, t取指2100-_+e maxt執(zhí)行i -2=3r.+maxt分析100分析i 1t 執(zhí)行99取指i執(zhí)行100當(dāng)T取指=T分析=2, T執(zhí)行=3時(shí),用上述通式計(jì)算所需時(shí)間T=100( 2+2+3)=700T=2+2X100+3X 99+3=502T=2+2+3X 97+

22、3+3=301當(dāng)T取指=T執(zhí)行=4, T分析=2時(shí),用上述通式計(jì)算所需時(shí)間為:T=100 ( 4+2+4) =1000T=4+2X100+4X 99+4=604T=4+4+4X 97+4+4=4042、一個(gè)流水線由四段組成,其中每當(dāng)流經(jīng)第三段時(shí),總要在該段循環(huán)一次才能流到第四段。如果 每段經(jīng)過一次的時(shí)間都是么t,問:當(dāng)在流水線的輸入端每么t時(shí)間輸入任務(wù)時(shí),該流水 線會(huì)發(fā)生什么情況?此流水線的實(shí)際吞吐率為多少?如果每2At輸入個(gè)任務(wù),連續(xù)處理10個(gè)任務(wù)的實(shí)際吞吐率和效率是多少?當(dāng)每段時(shí)間不變時(shí),如何提高該流水線的吞吐率?仍連續(xù)處理10個(gè)任務(wù) 時(shí),其吞吐 率提高多少?解:(1)會(huì)發(fā)生流水線阻塞情況

23、。(2)In str.1stage1stage2stage3stage3stage4in str.2stage1stage23tallstage3stage3stage4in str.3stage1stallstage2 stallstage3stage3stage4in str.4stallstage1stallstage2stallstage3stage3stage40t 1t 2t 3t 4t 5t 6t 7t 8tIn str.1 stagel stage2 stage3 stage3stage4instr.2stagel stage2stage3stage3stage4instr.3

24、stagel stage2stage3 stage3 stage4231TPmax12Dt-23DtT pipeli ne=1023DtDE 二 5Dt4 %TP:54.35%重復(fù)設(shè)置部件t3_1tttTPpipeli neTime10Dt = 57 Dt/145吞吐率提高倍數(shù)二竺=1.6410/23Dt3、有一條流水線如下所示_ 323|*450ns50ns100ns200ns求連續(xù)輸入10條指令,該流水線的實(shí)際吞吐率和效率;該流水線的瓶頸在哪一段?請(qǐng)采取三種不同的措施消除此“瓶頸”出的新流水線,計(jì)對(duì)于你所給算連續(xù)輸入10條指令時(shí),其實(shí)際吞吐率和效率解:(1)mT pipeli ne 二Dt

25、i(n - 1)Dtmaxi d-(5050 100 200) 9 200 -2200( ns)TPpipeli nemDt400 5E 二 TP 一二TP45.45%(2)瓶頸在3、4段。變成八級(jí)流水線(細(xì) 分)Tgi ne八但D。七懺4 =50 89 50二 850(ns)、DtiE=TP=TP40010一 58.82%m17200ns200nsT pipeline = DI=2002(n - 1) Dtm ax i 總9200二 2200(ns)TP%20(ns )pipeli ne400二 TP1090.91%重復(fù)設(shè)置部件2 11變成兩級(jí) 流水線(合并)E=410850 81782%4

26、、如果流水線有m段,各段的處理時(shí)間分別是ti (i=1, 2,,m),現(xiàn)在有n個(gè)任務(wù)需要 完成,且每個(gè)任務(wù)均需流水線各段實(shí)現(xiàn),請(qǐng)計(jì)算: 流水線完成這n個(gè)任務(wù)所需要的時(shí)間;和非流水線實(shí)現(xiàn)相比,這n個(gè)任務(wù)流水實(shí)現(xiàn)的加速比是多少?加速比的峰值是多少?解:(1)(n - 1) tmaxmpipeline = ii -1nopipelinen、i -: 1=to)t.iSpeedupA =m nm n 1 (ti (n 八 m,Speedupm)5、一臺(tái)非流水處理器A的工作時(shí)鐘頻率為25MHz它的平均CPI為4,處理器B是A的改 進(jìn)型,它有一條5段的線性指令流水線。由于鎖定電路延遲及時(shí)鐘扭斜效應(yīng),它的工

27、作時(shí) 鐘頻率僅為20MHz問:若在A和B兩個(gè)處理器上執(zhí)行含有100條指令的程序,則處理器B對(duì)A的加速 比為多少?在執(zhí)行上述程序時(shí),計(jì)算A、B處理器各自的MIPS速率為多少?解:(1)Ta=100*4/2.5E7=1.6E-5 秒Tb=(5+100- 1) X 4/5)/2E7=4.16E -6 秒二 Sp=Ta/tb=3.85 MIPSa=100/1.6E-5=6.25MIPS MIPSb=100/4.16E-6=24.04MIPS& 一個(gè)由4段構(gòu)成的雙輸入端的流水浮點(diǎn)加法器,每一段的延遲為可直接10ns,輸出 返回到輸入端或把結(jié)果暫存到相應(yīng)緩沖寄存器中?,F(xiàn)若要將相加,問最少10個(gè)浮點(diǎn)數(shù) 需用

28、多少時(shí)間,要求畫出相應(yīng)的流水線工作的時(shí)空?qǐng)D。解:根據(jù)題意,畫出相應(yīng)流水線時(shí)空?qǐng)D:12 *3+144:所需最少時(shí)間:Tmi n=17*10 ns=170 ns7、若有一靜態(tài)多功能流水線分為6段,如圖所示,其中乘法流水線由1、2、3、6段組成,加法流水線由1、4、5、6段組成,通過每段所需時(shí)間如圖所示。使用流水線時(shí),要等某種功能(如 加法)操作都處理完畢后才能轉(zhuǎn)換成另種功能(如乘法)。若要計(jì)算:AXB=(a1+b1)危 2+b2)危 3+b3),問:(1)在上述流水方式下,完成 AXB需要多少時(shí)間?畫出時(shí)空?qǐng)D并計(jì)算此流水線的使用效率和 吞吐率。(2)與順序運(yùn)算方式相比,加速比為多少?解:根據(jù)題意,

29、畫出的時(shí)空?qǐng)D為:(捋+珀】T=26T吞吐率:Tp=5/26 T效率:E= (2*17) / (26*6) =21.79%(2)加速比:Sp=Tl/Tk= (6T *3+8 T *2) /26 T =1.3148、在如下圖所示的靜態(tài)流水線上計(jì)算a A Bj,流水線的輸出可以直接返回輸入 端或暫存于相應(yīng)于的流水線寄存器中,試計(jì)算其吞吐率,加速比,效率。解:該題解題步驟為:確定適合于流水處理的計(jì)算過程。畫時(shí)空?qǐng)D計(jì)算性能(1)確定適合于流水處理的計(jì)算過程為:士程SAiB i AiBi 4- A2B2 + A3B3 4-軻創(chuàng) i=lAiBi A2B2 MBs A4Bd根據(jù)所確定的計(jì)算過程,畫出時(shí)空?qǐng)D根據(jù)

30、時(shí)空?qǐng)D和流水線性能公式,計(jì)算性能故:吞吐率TP= 7/(20 t)加速比 S= (34 t) /(20 t) =1.7效率 E= (4 X 4+ 3X 6) /(8 X 20) = 0.219、假設(shè)各種分支所占指令數(shù)地百分比如下表所示:條件分支20%(其中60%是成功的)跳轉(zhuǎn)和調(diào)用5%現(xiàn)有一深度為4地流水線(流水線有4段),無條件分支在第二個(gè)時(shí)鐘周期結(jié)束時(shí)就被解 析出來,而條件分支要到第三個(gè)時(shí)鐘周期結(jié)束時(shí)才能被解析出來。第-個(gè)流水段是完全獨(dú) 立于指令類型的,即所有的指令都必須經(jīng)過第一個(gè)流水段的處理。請(qǐng)問在沒有任何結(jié)構(gòu) 相關(guān)地情況下,該流水線相對(duì)于存在上述結(jié)構(gòu)相關(guān)情況下地加速比是多少?P無條件分支=1stal1P攵世八古二2stall條件分支加速比-1 C =1 f P分支解:在不存在結(jié)構(gòu)相關(guān)時(shí),每條指令的平均執(zhí)行時(shí)間是1個(gè)時(shí)鐘周期,而存在上述條件相關(guān) 的情況下,并假設(shè)條件分支預(yù)測(cè)成功,那么無條件分支和成功的條件分支的等待時(shí)間都是1,而不成 功地條件分支等待時(shí)間是2個(gè)周期;所以加速比就等于存在相關(guān)的每條指令的平均執(zhí)行時(shí)間和不存 在相關(guān)的每條指令的執(zhí)行時(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論