計算機(jī)體系結(jié)構(gòu)第三章答案.doc_第1頁
計算機(jī)體系結(jié)構(gòu)第三章答案.doc_第2頁
計算機(jī)體系結(jié)構(gòu)第三章答案.doc_第3頁
計算機(jī)體系結(jié)構(gòu)第三章答案.doc_第4頁
計算機(jī)體系結(jié)構(gòu)第三章答案.doc_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章答案三、流水線技術(shù)(80空)1、對階 尾數(shù)相加2、求階差 規(guī)格化3、時間 流水線的各段4、盡量相等 流水線的瓶頸5、通過時間 大量重復(fù)的時序 輸入端能連續(xù)地提供任務(wù)6、靜態(tài) 動態(tài)7、部件級 處理機(jī)級8、標(biāo)量流水處理機(jī) 向量流水處理機(jī)9、線性流水線 非線性流水線10、執(zhí)行/有效地址計算周期 存儲器訪問/分支完成周期11、譯碼 讀寄存器12、ALUoutputA op B ALUoutputNPC + Imm13、分支 STORE指令14、ALU指令 LOAD指令15、單周期 多周期16、重復(fù)設(shè)置指令執(zhí)行功能部件 流水17、吞吐率 等功能非流水線18、通過時間 排空時間19、流水線寄存器的延遲 時鐘扭曲20、數(shù)據(jù)相關(guān) 控制相關(guān)21、結(jié)構(gòu)相關(guān) 數(shù)據(jù)相關(guān)22、結(jié)構(gòu) 數(shù)據(jù)23、硬件開銷 功能單元的延遲24、寫后讀 讀后寫 寫后讀25、寫后讀 讀后寫26、PC值改變?yōu)榉种мD(zhuǎn)移的目標(biāo)地址 PC值保持正常(等于當(dāng)前值加4)27、目標(biāo)地址 分支轉(zhuǎn)移條件不成立28、8 存儲器29、多功能線性 830、水平處理方式 垂直處理方式31、縱向處理方式 縱橫處理方式32、存儲器 向量寄存器33、訪問存儲器的次數(shù) 對存儲器帶寬的要求34、每秒執(zhí)行多少指令(MIPS) 每秒取得多少個浮點運算結(jié)果(MFLOPS)35、512 8 36、鏈接技術(shù) 向量循環(huán)或分段開采技術(shù)37、源向量 結(jié)果向量38、向量功能部件 標(biāo)量寄存器 向量寄存器塊39、向量寄存器 向量功能部件3.1流水線的基本概念1、流水線:將一個重復(fù)的時序過程,分解為若干個子過程,而每一個子過程都可有效地在其專用功能段上與其他子過程同時執(zhí)行。2、單功能流水線:只能完成一種固定功能的流水線。3、多功能流水線:流水線的各段可以進(jìn)行不同的連接,從而使流水線在不同的時間,或者在同一時間完成不同的功能。4、靜態(tài)流水線:同一時間內(nèi),流水線的各段只能按同一種功能的連接方式工作。5、動態(tài)流水線:同一時間內(nèi),當(dāng)某些段正在實現(xiàn)某種運算時,另一些段卻在實現(xiàn)另一種運算。6、部件級流水線:(運算操作流水線)把處理機(jī)的算術(shù)邏輯部件分段,以便為各種數(shù)據(jù)類型進(jìn)行流水操作。7、處理機(jī)級流水線:(指令流水線)把解釋指令的過程按照流水方式處理。8、線性流水線:指流水線的各段串行連接,沒有反饋回路。9、非線性流水線:指流水線中除有串行連接的通路外,還有反饋回路。10、標(biāo)量流水處理機(jī):處理機(jī)不具有向量數(shù)據(jù)表示,僅對標(biāo)量數(shù)據(jù)進(jìn)行流水處理。11、向量流水處理機(jī):處理機(jī)具有向量數(shù)據(jù)表示,并通過向量指令對向量的各元素進(jìn)行處理。3.2 DLX 的基本流水線12、固定字段譯碼:在DLX指令多周期實現(xiàn)中,由于DLX指令格式中操作碼在固定位置,且都是6位編碼,在指令執(zhí)行的第二個時鐘周期,指令譯碼和讀寄存器并行進(jìn)行,這種技術(shù)稱為固定字段譯碼。13、吞吐率:吞吐率是指單位時間內(nèi)流水線所完成的任務(wù)數(shù)或輸出結(jié)果的數(shù)量。14、最大吞吐率:最大吞吐率是指流水線在連續(xù)流動達(dá)到穩(wěn)定狀態(tài)后所得到的吞吐率。15、流水線效率:由于流水線有通過時間和排空時間,所以流水線的各段并不是一直滿負(fù)荷地工作。效率是指流水線的設(shè)備利用率。3.3流水線中的相關(guān)16、結(jié)構(gòu)相關(guān):某些指令組合在流水線中重疊執(zhí)行時,發(fā)生資源沖突,則稱該流水線有結(jié)構(gòu)相關(guān)。17、數(shù)據(jù)相關(guān):當(dāng)指令在流水線中重疊執(zhí)行時,流水線有可能改變指令讀/寫操作的順序,使得讀/寫操作順序不同于它們非流水實現(xiàn)時的順序,將導(dǎo)致數(shù)據(jù)相關(guān)。18、定向:將計算結(jié)果從其產(chǎn)生的地方直接送到其他指令需要它的地方,或所有需要它的功能單元,避免暫停。19、Load互鎖:由Load指令引起的RAW相關(guān),當(dāng)檢測到相關(guān)后,控制部件必須在流水線中插入暫停周期,并使IF和ID段中的指令停止前進(jìn)。20、寫后讀相關(guān):兩條指令i,j,i在j前進(jìn)入流水線,j執(zhí)行要用到i的結(jié)果,但當(dāng)其在流水線中重疊執(zhí)行時,j可能在i寫入其結(jié)果之前就先行對保存該結(jié)果的寄存器進(jìn)行讀操作,得到錯誤值。21、讀后寫相關(guān):兩條指令i,j,i在j前進(jìn)入流水線,j可能在i讀某個寄存器之前對該寄存器進(jìn)行寫操作,導(dǎo)致i讀出數(shù)據(jù)錯誤。22、寫后寫相關(guān):兩條指令i,j,i在j前進(jìn)入流水線,j、i的操作數(shù)一樣,在流水線中重疊執(zhí)行時,j可能在i寫入其結(jié)果之前就先行對保存該結(jié)果的寄存器進(jìn)行寫操作,導(dǎo)致寫錯誤。3.4MIPS R4000 流水線計算機(jī)3.5向量處理機(jī)23、水平(橫向)處理方式:在向量處理機(jī)中,向量指令對數(shù)據(jù)分量的處理方式是按行的方式從左至右橫向地進(jìn)行。24、垂直(縱向)處理方式:在向量處理機(jī)中,向量指令對數(shù)據(jù)分量的處理方式是按列的方式至上而下縱向地進(jìn)行。25、分組(縱橫)處理方式:在向量處理機(jī)中,向量指令對數(shù)據(jù)分量的處理方式是把向量分成長度為某個固定值的若干組,組內(nèi)按縱向方式處理,依次處理各組。3.1 流水線的基本概念1、流水技術(shù)的特點有哪些?答:(1)流水過程由多個相聯(lián)系的子過程組成,每個過程稱為流水線的“級”或“段” ;每個子過程由專用的功能段實現(xiàn);2分(2)各個功能段所需時間應(yīng)盡量相等,否則,時間長的功能段將成為流水線的瓶頸,會造成流水線的“堵塞”和“斷流”;2分(3)流水線需要有“通過時間”(第一個任務(wù)流出結(jié)果所需的時間),在此之后流水過程才進(jìn)入穩(wěn)定工作狀態(tài),每一個時鐘周期(拍)流出一個結(jié)果;1分(4)流水技術(shù)適合于大量重復(fù)的時序過程,只有在輸入端能連續(xù)地提供任務(wù),流水線的效率才能充分發(fā)揮。1分3.2 DLX 的基本流水線1、在DLX指令的多周期實現(xiàn)中,一條DLX指令需4或5個時鐘周期。請寫出各時鐘周期中文名稱以及R-R類型ALU指令在每個時鐘周期中所做的操作。 答:(1)取指令周期(IF)IR MemPC NPC PC4 1分(2)指令譯碼/讀寄存器周期(ID)A RegsIR6 .10B RegsIR11 .15 Imm (IR16)16 # IR16 .311分(3)執(zhí)行/有效地址計算周期(EX) ALUOutput A op B 1分(4)存儲器訪問/分支完成周期(MEM)LMD MemALUOutput 1分(5)寫回周期(WB) RegsIR16 .20 ALUOutput 2分2、從CPI和CC的角度考慮,指令的實現(xiàn)有哪兩種方案,各有何優(yōu)缺點?答:實現(xiàn)方案一:一條指令用多個時鐘周期CPI1 優(yōu)點:有利于流水線實現(xiàn)指令的執(zhí)行。缺點:硬件冗余大實現(xiàn)方案二:一條指令用一個長時鐘周期CPI =1 但CC2遠(yuǎn)大于多周期實現(xiàn)的CC1 優(yōu)點:臨時寄存器可省去缺點:1、低效率 指令要執(zhí)行的操作總量變化較大,不同指令實現(xiàn)所需要的時鐘周期時間大不一樣。2、基于單周期實現(xiàn)提高程序執(zhí)行速度需要重復(fù)設(shè)置指令執(zhí)行功能部件,而基于多周期實現(xiàn)提高速度可采用流水技術(shù)。3、DLX流水線中的多路選擇器MUX有幾個,分別在哪一流水段,如何選擇輸入(即多路器如何控制)? 答:(1)IF段MUX 由Cond判斷控制:下一條指令地址為增長后的PC(當(dāng)前PC加4)或向前數(shù)第三條指令的ALUOutput的值,前提是那條指令為分支指令并且條件成立;(2)EX段有兩個MUX:由指令類型控制如果是分支指令,則NPC ALU 否則A ALU如果是ALU指令,則B ALU 否則:立即數(shù)/位移量 ALU (3)WB段MUX:由指令類型控制( Load/ALU)寫回Reg的值來自于LMD(Load指令)或ALUOutput(ALU指令)3.3流水線中的相關(guān)1、試簡要說明流水線中幾種相關(guān)類型。答:流水線中的相關(guān)是指相鄰或相近的兩條指令因存在某種關(guān)聯(lián),后一條指令不能在原指定的時鐘周期開始執(zhí)行。(1)結(jié)構(gòu)相關(guān):當(dāng)硬件資源滿足不了同時重疊執(zhí)行的指令的要求,而發(fā)生資源沖突時,就發(fā)生了結(jié)構(gòu)相關(guān)。(2)數(shù)據(jù)相關(guān):當(dāng)一條指令需要用到前面某條指令的結(jié)果,從而不能重疊執(zhí)行時,就發(fā)生了數(shù)據(jù)相關(guān)。(3)控制相關(guān):當(dāng)流水線遇到分支指令和其他能夠改變PC值的指令時,就會發(fā)生控制相關(guān)。2、常見的導(dǎo)致結(jié)構(gòu)相關(guān)的原因有哪些?為什么流水線設(shè)計者有時允許結(jié)構(gòu)相關(guān)存在?答:常見的導(dǎo)致結(jié)構(gòu)相關(guān)的原因有以下兩種:(1)功能部件不是全流水;(2)重復(fù)設(shè)置的資源的份數(shù)不夠。流水線設(shè)計者有時允許結(jié)構(gòu)相關(guān)存在的原因:(1)有的結(jié)構(gòu)并不經(jīng)常發(fā)生,而為了避免結(jié)構(gòu)相關(guān)需要增加大量的硬件開銷;結(jié)構(gòu)相關(guān)存在可降低硬件成本;(2)可以減少部件的延遲??稍O(shè)計出比完全流水化功能單元具有更短延遲時間的非流水化和不完全流水化的功能單元。3、請分析下列指令序列的數(shù)據(jù)相關(guān)情況,可采取哪些技術(shù)來保證指令正確執(zhí)行,或減小流水線性能損失? ADD R1,R2,R3 SUB R4,R1,R5 AND R6,R1,R7 OR R8,R1,R9 XOR R10,R1,R11答:第一條指令和緊鄰的三條指令產(chǎn)生數(shù)據(jù)相關(guān),最后一條指令和前面的指令不產(chǎn)生數(shù)據(jù)相關(guān)。第條和第條產(chǎn)生寫后讀的數(shù)據(jù)相關(guān),可使用定向技術(shù)消除數(shù)據(jù)相關(guān),第條和第條產(chǎn)生寫后讀的數(shù)據(jù)相關(guān),可使用寄存器技術(shù)消除數(shù)據(jù)相關(guān)。4、DLX流水線中,定向技術(shù)的主要思想是什么?如何實現(xiàn)?答:定向技術(shù)的實現(xiàn):在某一個功能單元的輸入端和與某一個功能單元輸出端具有數(shù)據(jù)通路的流水寄存器之間通過多路器建立通路。 當(dāng)定向硬件檢測到前面某條指令的結(jié)果寄存器就是當(dāng)前指令的源寄存器時,控制邏輯會開通前面那條指令的結(jié)果目前所在的位置(某個流水寄存器)到當(dāng)前指令所需的位置(某個功能單元的輸入端)的通路。5、有的數(shù)據(jù)相關(guān)可通過編譯器調(diào)度方法來消除暫停。請為下列表達(dá)式生成沒有暫停的DLX代碼序列。假設(shè)載入延遲為1個時鐘周期。a=b-c;d=e-f答:調(diào)度前后的代碼序列如下:調(diào)度前代碼調(diào)度后代碼LW Rb,bLW Rc,cADD Ra,Rb,RcSW a,RaLW Re,eLw Rf,fSUB Rd,Re,RfSW d,RdLW Rb,bLW Rc,c LW Re,e ADD Ra,Rb,RcSW a,RaLw Rf,fSUB Rd,Re,RfSW d,Rd6、減少流水線處理分支指令時的暫停時鐘周期數(shù)的技術(shù)途徑是什么?其流水線數(shù)據(jù)通路應(yīng)如何改進(jìn)?答:在流水線中盡早判斷分支轉(zhuǎn)移是否成功; 轉(zhuǎn)移成功時,盡早計算出轉(zhuǎn)移目標(biāo)地址。兩者應(yīng)同時采用,缺一不可。(1) (1)把“0?”測試移至ID段; (2) 在ID段增設(shè)一個加法器,這樣可以把分支開銷減少一拍。7、為了在延遲槽中填入有效指令,一般可采用哪三種方法? 比較它們的優(yōu)缺點。答:為了在延遲槽中填入有效指令,一般可采用以下三種方法:1)將轉(zhuǎn)移指令前的那條指令調(diào)度到延遲槽中。2)將轉(zhuǎn)移目標(biāo)處的那條指令調(diào)度到延遲槽中。3)將轉(zhuǎn)移不發(fā)生時該執(zhí)行的那條指令調(diào)度到延遲槽中。相比之下:這三種方法中,第一種方法的效果最好,總能使性能獲得改善。但當(dāng)轉(zhuǎn)移指令中所用到的條件判別與轉(zhuǎn)移指令前的那條指令相關(guān)時,就只能使用方法二或方法三。方法二僅當(dāng)轉(zhuǎn)移發(fā)生時才會改進(jìn)性能,且由于要將該指令復(fù)制,造成存儲空間占用的增加,此方法適于轉(zhuǎn)移發(fā)生概率較高的場合,如循環(huán)程序段。使用方法三僅當(dāng)轉(zhuǎn)移不發(fā)生時才會改進(jìn)性能。此外,方法二各方法三都要求:當(dāng)轉(zhuǎn)移按另一方向前進(jìn)時,執(zhí)行調(diào)入延遲槽中指令不會破壞程序的正確執(zhí)行。8、降低流水線分支損失的方法有哪些?答:(1)在流水線中盡早判斷出分支轉(zhuǎn)移是否成功;盡早計算出分支轉(zhuǎn)移成功時的PC值(即分支的目標(biāo)地址) 2分(2)“凍結(jié)”或“排空”流水線的方法 1分(3)預(yù)測分支失敗 1分(4)預(yù)測分支成功 1分(5)延遲分支 1分3.4MIPS R4000 流水線計算機(jī)1、MIPS R4000整型流水線結(jié)構(gòu)是怎樣的?3.5向量處理機(jī)1、三種向量處理方式,對向量處理機(jī)的結(jié)構(gòu)要求有何不同?答:1水平處理方式:若向量長度為N,則水平處理方式相當(dāng)于執(zhí)行N次循環(huán)。若使用流水線,在每次循環(huán)中可能出現(xiàn)數(shù)據(jù)相關(guān)和功能轉(zhuǎn)換,不適合對向量進(jìn)行流水處理。2垂直處理方式:將整個向量按相同的運算處理完畢之后,再去執(zhí)行其他運算。適合對向量進(jìn)行流水處理,向量運算指令的源/目向量都放在存儲器內(nèi),使得流水線運算部件的輸入、輸出端直接與存儲器相聯(lián),構(gòu)成M-M型的運算流水線。3分組處理方式:把長度為N的向量分為若干組,每組長度為n,組內(nèi)按縱向方式處理,依次處理各組,組數(shù)為,適合流水處理??稍O(shè)長度為n的向量寄存器,使每組向量運算的源/目向量都在向量寄存器中,流水線的運算部件輸入、輸出端與向量寄存器相聯(lián),構(gòu)成R-R型運算流水線。2、什么是向量處理鏈接技術(shù)?答:向量處理鏈接技術(shù)是從流水線的“定向”概念發(fā)展而來的。當(dāng)兩條指令出現(xiàn)“寫后讀”相關(guān)時,若它們不存在功能部件沖突和向量寄存器(源或目的)沖突,就有可能把它們所用的功能部件頭尾相接,形成一個鏈接流水線,進(jìn)行流水處理。為了在向量處理機(jī)中實現(xiàn)向量鏈接機(jī)制必須恰當(dāng)?shù)卦O(shè)定所需要的向理功能部件和操作數(shù)寄存器;否則,鏈接操作就不得不掛起直到所需要的資源變?yōu)榭捎脼橹埂?、向量處理鏈接技術(shù)有哪些技術(shù)要求?答:除了要保證無向量寄存器使用沖突和無向量功能部件使用沖突的條件之外,還有諸如鏈接時機(jī)等其他一些要求,主要有:(1)在進(jìn)行鏈接的時候,只有在前一條向量指令的第一個結(jié)果元素送入結(jié)果向量寄存器的那一個時鐘周期才可以進(jìn)行鏈接,若錯過該時刻就不能進(jìn)行鏈接。(2)只有當(dāng)前一條向量指令全部執(zhí)行完畢,釋放相應(yīng)的向量寄存器資源后才能執(zhí)行后面的向量指令。 (3)當(dāng)一條向量指令的兩個源操作數(shù)分別是兩條先行向量指令的結(jié)果寄存器時,要求先行的兩條向量指令產(chǎn)生運算結(jié)果的時間必須相等,即要求有關(guān)向量功能部件的延遲時間相等。(4)只有所有可以鏈接執(zhí)行的向量指令的向量長度相等時,它們之間才能鏈接執(zhí)行,否則它們之間也不能鏈接執(zhí)行。4、什么是分段向量處理技術(shù)?答:當(dāng)向量的長度大于向量寄存器的長度時,把長向量分成固定長度的段,然后循環(huán)分段處理,一次循環(huán)只處理一個向量段。這種長向量循環(huán)分段處理的程序結(jié)構(gòu)稱為向量循環(huán),這種分段向量處理技術(shù)也稱為分段開采。將長向量循環(huán)分段處理是由系統(tǒng)硬件和軟件控制完成的,對程序員透明。1、假設(shè)一條指令的解釋分為取指、分析與執(zhí)行三個階段,每個階段所需時間為t取指、t分析、t執(zhí)行。(1)寫出用下列幾種方式執(zhí)行100條指令所需的時間的通式:1)順序方式;2)僅執(zhí)行k、與取指k+1重疊;3)僅執(zhí)行K、分析k+1和取指k+2重疊。(2)當(dāng)t取指=t分析=2,t執(zhí)行=3以及t取指=t分析=4,t執(zhí)行=2時,用上述通式計算所需時間。解:(1)以下是各方式執(zhí)行100條指令所需時間的通式:1)順序方式:100t=t取指i+t分析i+t執(zhí)行i i=1 =100t取指i+t分析i+t執(zhí)行i2)“執(zhí)行i”與“取指k”重疊:100t=t取指1+ t分析i=1 100+maxt執(zhí)行i,t取指ii=2+t執(zhí)行1003)僅“執(zhí)行k”、“分析K+1”與“取指K+2”重疊:t=t取指1+maxt分析1,t取指2100+maxt執(zhí)行i2,t分析i1,t取指ii=3+maxt分析100,t執(zhí)行99+t執(zhí)行100(2)當(dāng)T取指=T分析=2,T執(zhí)行=3時,用上述通式計算所需時間1)T=100(2+2+3)=7002)T=2+2100+399+3=5023)T=2+2+397+3+3=301當(dāng)T取指=T執(zhí)行=4,T分析=2時,用上述通式計算所需時間為:1)T=100(4+2+4)=10002)T=4+2100+499+4=6043)T=4+4+497+4+4=4042、一個流水線由四段組成,其中每當(dāng)流經(jīng)第三段時,總要在該段循環(huán)一次才能流到第四段。如果每段經(jīng)過一次的時間都是t,問:當(dāng)在流水線的輸入端每t時間輸入任務(wù)時,該流水線會發(fā)生什么情況?此流水線的實際吞吐率為多少?如果每2t輸入一個任務(wù),連續(xù)處理10個任務(wù)的實際吞吐率和效率是多少?當(dāng)每段時間不變時,如何提高該流水線的吞吐率?仍連續(xù)處理10個任務(wù) 時,其吞吐率提高多少?解:(1)會發(fā)生流水線阻塞情況。(2)(3)重復(fù)設(shè)置部件吞吐率提高倍數(shù)1.643、有一條流水線如下所示。求連續(xù)輸入10條指令,該流水線的實際吞吐率和效率;該流水線的瓶頸在哪一段?請采取三種不同的措施消除此“瓶頸”。對于你所給出的新流水線,計算連續(xù)輸入10條指令時,其實際吞吐率和效率。解:(1)(2)瓶頸在3、4段。l 變成八級流水線(細(xì)分)l 變成兩級流水線(合并)l 重復(fù)設(shè)置部件123-13-24-14-24-34-44、如果流水線有m段,各段的處理時間分別是ti(i=1,2,m),現(xiàn)在有n個任務(wù)需要完成,且每個任務(wù)均需流水線各段實現(xiàn),請計算:流水線完成這n個任務(wù)所需要的時間;和非流水線實現(xiàn)相比,這n個任務(wù)流水實現(xiàn)的加速比是多少?加速比的峰值是多少?解:(1)(2)5、一臺非流水處理器A的工作時鐘頻率為25MHz,它的平均CPI為4,處理器B是A的改進(jìn)型,它有一條5段的線性指令流水線。由于鎖定電路延遲及時鐘扭斜效應(yīng),它的工作時鐘頻率僅為20MHz。問:(1)若在A和B兩個處理器上執(zhí)行含有100條指令的程序,則處理器B對A的加速比為多少?(2)在執(zhí)行上述程序時,計算A、B處理器各自的MIPS速率為多少?解:(1)Ta=100*4/2.5E7=1.6E-5 秒 Tb=(5+100-1)4/5)/2E7=4.16E-6 秒 Sp=Ta/tb=3.85(2)MIPSa=100/1.6E-5=6.25MIPSMIPSb=100/4.16E-6=24.04MIPS6、一個由4段構(gòu)成的雙輸入端的流水浮點加法器,每一段的延遲為10ns,輸出可直接返回到輸入端或把結(jié)果暫存到相應(yīng)緩沖寄存器中?,F(xiàn)若要將10個浮點數(shù)相加,問最少需用多少時間,要求畫出相應(yīng)的流水線工作的時空圖。解:根據(jù)題意,畫出相應(yīng)流水線時空圖:所需最少時間:Tmin=17*10ns=170ns7、若有一靜態(tài)多功能流水線分為6段,如圖所示,其中乘法流水線由1、2、3、6段組成,加法流水線由1、4、5、6段組成,通過每段所需時間如圖所示。使用流水線時,要等某種功能(如加法)操作都處理完畢后才能轉(zhuǎn)換成另種功能(如乘法)。若要計算:AB=(a1+b1)(a2+b2)(a3+b3),問:(1)在上述流水方式下,完成AB需要多少時間?畫出時空圖并計算此流水線的使用效率和吞吐率。(2)與順序運算方式相比,加速比為多少?解:根據(jù)題意,畫出的時空圖為:(1)T=26吞吐率:Tp=5/26效率:E=(2*17)/(26*6)=21.79%(2)加速比:Sp=Tl/Tk=(6*3+8*2)/26=1.318、在如下圖所示的靜態(tài)流水線上計算,流水線的輸出可以直接返回輸入端或暫存于相應(yīng)于的流水線寄存器中,試計算其吞吐率,加速比,效率。解:該題解題步驟為:(1) 確定適合于流水處理的計算過程。(2) 畫時空圖(3) 計算性能 (1) 確定適合于流水處理的計算過程為:(2)根據(jù)所確定的計算過程,畫出時空圖(3) 根據(jù)時空圖和流水線性能公式,計算性能故:吞吐率 TP7(20t) 加速比 S(34t)(20t)1.7效率 E(4436)(820)0.219、假設(shè)各種分支所占指令數(shù)地百分比如下表所示:條件分支20(其中60是成功的)跳轉(zhuǎn)和調(diào)用5現(xiàn)有一深度為4地流水線(流水線有4段),無條件分支在第二個時鐘周期結(jié)束時就被解析出來,而條件分支要到第三個時鐘周期結(jié)束時才能被解析出來。第一個流水段是完全獨立于指令類型的,即所有的指令都必須經(jīng)過第一個流水段的處理。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論