高級系統(tǒng)結(jié)構(gòu)課程試卷及試卷分析-大題詳細(xì)版_第1頁
高級系統(tǒng)結(jié)構(gòu)課程試卷及試卷分析-大題詳細(xì)版_第2頁
高級系統(tǒng)結(jié)構(gòu)課程試卷及試卷分析-大題詳細(xì)版_第3頁
高級系統(tǒng)結(jié)構(gòu)課程試卷及試卷分析-大題詳細(xì)版_第4頁
高級系統(tǒng)結(jié)構(gòu)課程試卷及試卷分析-大題詳細(xì)版_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

高級計(jì)算機(jī)體系結(jié)構(gòu)試卷作業(yè)授課教師陳文智作者姓名21321240陳英芝 21321191楊誼 21321284柴一平 21321189張翔提交日期2014年01月06日2013-2014學(xué)年秋冬學(xué)期高級計(jì)算機(jī)體系結(jié)構(gòu)試卷學(xué)號____________姓名____________分?jǐn)?shù)____________一、選擇題(共10題,每題2分,共20分)1、根據(jù)指令流和數(shù)據(jù)流的多倍性可以將計(jì)算機(jī)體系結(jié)構(gòu)分為四大類。其中以陣列處理機(jī)和向量處理機(jī)為代表的是(),以多機(jī)計(jì)算機(jī)系統(tǒng)為代表的是()。SISD,SIMDB.SIMD,MIMDC.MISD,MIMDD.MIMD,SIMD2、在流水線中,利用簡單硬件技術(shù)“轉(zhuǎn)發(fā)(Forwarding)”可以解決一些數(shù)據(jù)冒險(xiǎn)問題,從而減少流水線停頓,但是并非所有數(shù)據(jù)冒險(xiǎn)都可以通過轉(zhuǎn)發(fā)方式處理。下列指令序列中,不能利用轉(zhuǎn)發(fā)技術(shù)完全消除停頓的是()。A.DADDR1,R2,R3 B.LDR1,0(R2)DSUBR4,R1,R5 DSUBR4,R1,R5C.DADDR1,R2,R3 D.LDR4,0(R1)LDR4,0(R1) DADDR1,R2,R33、下列語句間存在的指令間相關(guān)性有_______、_______,在基本流水線(MIPS)中會(huì)產(chǎn)生競爭的有_______、_______。DADDIU R1,R3,#-8BNE R1,R2,LOOPSUB R4,R4,#8A、RAW,WAR;RAW,WAR B、真相關(guān),反相關(guān);RAW,轉(zhuǎn)移C、真相關(guān),控制相關(guān);RAW,轉(zhuǎn)移 D、RAW,WAW;RAW,WAW4、下列哪個(gè)選項(xiàng)正確包含了記分牌全部限制因素:①指令間可用并行數(shù)少②積分卡的項(xiàng)數(shù)有限③功能單元數(shù)目和類型④存在反相關(guān)和輸出相關(guān)⑤未能利用轉(zhuǎn)發(fā)⑥無法解決RAWA.①②③④⑥ B.②③⑤⑥ C.①②③④⑤ D.①③④⑤⑥5、Tomasulo's硬件調(diào)度算法有兩個(gè)主要優(yōu)點(diǎn),一是_______競爭檢測邏輯,二是消除了_______競爭的阻塞。A、集中,WAW和WAR B、分散,WAW和WARC、集中,WAW和RAW D、分散,WAW和RAR

6、通過硬件動(dòng)態(tài)預(yù)測轉(zhuǎn)移指令的行為可以減少轉(zhuǎn)移代價(jià),2位轉(zhuǎn)移預(yù)測緩沖器是硬件動(dòng)態(tài)預(yù)測技術(shù)之一。假設(shè)2位轉(zhuǎn)移預(yù)測緩沖器的初始值為0,某循環(huán)體共循環(huán)10次,若該循環(huán)體只在前9次循環(huán)實(shí)際轉(zhuǎn)移,最后1次實(shí)際不轉(zhuǎn)移,則2位預(yù)測緩沖器的命中率為()。若該循環(huán)體在第一次循環(huán)實(shí)際轉(zhuǎn)移,且實(shí)際轉(zhuǎn)移行為間隔變換一次,則2位預(yù)測緩沖器的命中率為()。A.90%,50% B.70%,20%C.70%,50% D.90%,20%7、多發(fā)射處理器的目標(biāo)是允許在一個(gè)時(shí)鐘周期內(nèi)發(fā)射多條指令。兩種基本的多發(fā)射技術(shù)有(),()。其中()每時(shí)鐘周期發(fā)射固定數(shù)目的指令,()主要采用硬件檢測競爭。A、多處理器,超標(biāo)量;超標(biāo)量,多處理器

B、VLIW,超標(biāo)量;VLIW,超標(biāo)量C、超標(biāo)量,VLIW;超標(biāo)量,VLIW

D、超標(biāo)量,VLIW;VLIW,超標(biāo)量8、以下說法正確的是:=1\*GB3①集中式共享存儲(chǔ)器系統(tǒng)結(jié)構(gòu)所有的處理器訪問存儲(chǔ)器的時(shí)間不一致=2\*GB3②在分布式共享存儲(chǔ)(DSM)系統(tǒng)中,任何一個(gè)處理器都能夠通過引用地址的方式訪問任意節(jié)點(diǎn)上的存儲(chǔ)器=3\*GB3③在消息傳遞多處理器系統(tǒng)中,不同處理器中相同的物理地址分別指向兩個(gè)不同存儲(chǔ)器中的不同位置=4\*GB3④NUMA(非均勻存儲(chǔ)器訪問)的訪問時(shí)間取決于數(shù)據(jù)字在存儲(chǔ)器中的位置A.=1\*GB3①=2\*GB3② B.=1\*GB3①=2\*GB3②=3\*GB3③=4\*GB3④ C.=2\*GB3②=3\*GB3③=4\*GB3④ D.=1\*GB3①=3\*GB3③=4\*GB3④9、出現(xiàn)多處理機(jī)cache不一致的原因有:共享可寫的數(shù)據(jù)、進(jìn)程遷移和I/O傳輸。有以下兩個(gè)不同處理器的程序T1和T2共享同一個(gè)可寫的數(shù)據(jù),T1與T2分別使用緩存cache-1和cache-2,且采用寫回式寫回緩存。內(nèi)存與緩存的初始值如下表所示。這兩個(gè)進(jìn)程按下表順序執(zhí)行之后,內(nèi)存中保存的數(shù)據(jù)為()。ProgramT1ProgramT2Cache-1Cache-2內(nèi)存初始值程序執(zhí)行順序STX,1STY,10LDY,R1STY’,R1LDX,R2STX’,R2X=Y=X=X’=Y=Y’=X=0Y=5X’=Y’=T1完成程序執(zhí)行Cache-1寫回XT2執(zhí)行結(jié)束Cache-2寫回X’與Y’Cache-1寫回YA. X=1,Y=10,X’=1,Y’=5 B.X=0,Y=10,X’=1,Y’=5C.X=1,Y=5,X’=1,Y’=10 D.X=0,Y=5,X’=1,Y’=510、在基于目錄的cache一致性協(xié)議中,已知數(shù)據(jù)塊可能處于以下3種狀態(tài):共享(shared)、未緩存(uncached)、獨(dú)占(exclusive)。則在數(shù)據(jù)塊處于共享狀態(tài)時(shí)可能的目錄請求有:=1\*GB3①讀缺失=2\*GB3②寫缺失=3\*GB3③數(shù)據(jù)寫回A.=1\*GB3①=2\*GB3②=3\*GB3③ B.=1\*GB3①=2\*GB3② C.=2\*GB3②=3\*GB3③ D.=1\*GB3①=3\*GB3③二、簡答題(共5題,每題4分,共20分)1、簡述流水線的三類冒險(xiǎn),并指出數(shù)據(jù)冒險(xiǎn)有哪幾類,以及解決數(shù)據(jù)冒險(xiǎn)的方法。2、簡述分支延時(shí)槽的原理,并根據(jù)分支延時(shí)槽的原理優(yōu)化下述代碼。ADDR1,R2,R3DelayslotIfR2=0thenDelayslot3、簡述硬件投機(jī)機(jī)制的原理和ROB的作用,并指出ROB與普通的tomasulo算法中的保留站(reservationstations)的功能區(qū)別。4、簡述tomosulo算法和記分牌算法的異同。5、試解釋并行性的含義。三、計(jì)算題(共2題,每題10分,共20分)(1)概述Amadahl定律(2)假定指令中的FP(浮點(diǎn))運(yùn)算頻率=25%,F(xiàn)P平均CPI=5.0,平均非FP的CPI=2.33,F(xiàn)PSQR(浮點(diǎn)開方)運(yùn)算頻率5%,F(xiàn)PSQR的平均CPI=20,假定有兩種方法提高性能,分別是: a.將FP中FPSQR的CPI減少到2 b.將FP的CPI減少到2.5,試計(jì)算這兩種方案的CPI,并計(jì)算出較好的方法的加速比,結(jié)果保留兩位有效數(shù)字。(3)現(xiàn)有100個(gè)處理器,為了達(dá)到50倍的加速比,試計(jì)算所需要的并行度,結(jié)果保留四位有效數(shù)字。2、設(shè)指令間的相關(guān)性參數(shù)如下表,假定采用一個(gè)標(biāo)準(zhǔn)5級整數(shù)流水線,這些功能單元被完全流水化或復(fù)制。試分析計(jì)算下列問題:(1)

計(jì)算該循環(huán)在未進(jìn)行任何調(diào)度時(shí)迭代一次需多少時(shí)鐘。(2)

采用軟件流水方式編譯優(yōu)化下列循環(huán),使其循環(huán)內(nèi)的競爭最少。(3)

計(jì)算優(yōu)化后該循環(huán)迭代一次需多少時(shí)鐘。前操作指令后繼相關(guān)指令延遲時(shí)鐘FPALU

操作FPALU

操作3FPALU

操作Store(雙字)2Load(雙字)FPALU

操作1Load(雙字)Store(雙字)0LOOP:

L.D

F0,0(R1)ADD.D

F4,F(xiàn)0,F(xiàn)2S.D

0(R1),F(xiàn)4DADDUI

R1,R1,#-8BNEZ

R1,LOOP四、分析題(共3題,共40分。第1題15分,第2題10分,第3題15分)1、(m,n)相關(guān)分支預(yù)測器利用最近執(zhí)行的m個(gè)分支的行為從2m個(gè)預(yù)測器中作出選擇,這些預(yù)測器都是n位預(yù)測器?,F(xiàn)有一個(gè)(2,2)相關(guān)分支預(yù)測器共8K位。(1)在該相關(guān)分支預(yù)測器中有多少項(xiàng)?(2)畫出這個(gè)相關(guān)預(yù)測器的硬件框圖。(3)假設(shè)全局轉(zhuǎn)移緩存和每個(gè)轉(zhuǎn)移預(yù)測器的初始值都為0,a初始值為1,利用上述(2,2)相關(guān)分支預(yù)測器,下列程序連續(xù)執(zhí)行5次時(shí)命中率是多少?Reg[R1]=a;Reg[R1]=a;BNEZ R1,L1;DADD R1,R0,#1;L1: DADDR3,R1,#-1; BNEZ R3,L2; DADDR1,R0,#2L2:…if(a==0) a=1;if(a==1) a=2;2、假設(shè)浮點(diǎn)功能單元的延遲為:加法為2個(gè)時(shí)鐘周期、乘法為6個(gè)時(shí)鐘周期、除法為12個(gè)時(shí)鐘周期。通過基于Tomasulo動(dòng)態(tài)調(diào)度的硬件投機(jī)技術(shù),使用下面代碼段,寫出當(dāng)DIV.D指令做好提交準(zhǔn)備時(shí)的狀態(tài)表。L.DL.D F6,32(R2)L.D F2,44(R3)MUL.D F0,F2,F4SUB.D F8,F2,F6DIV.D F10,F0,F6ADD.D F6,F8,F2重排序緩沖器項(xiàng)目繁忙指令狀態(tài)目的地值123456FP寄存器狀態(tài)字段F0F1F2F3F4F5F6F7F8F10ROB#繁忙3、根據(jù)下表指令序列,結(jié)合snooping協(xié)議cache塊的狀態(tài)轉(zhuǎn)移圖,假設(shè)緩存寫回方式采用寫回式。請正確填寫下面流程表,若內(nèi)存有多個(gè)數(shù)據(jù),例如內(nèi)存中A1=10,A2=15則表格填寫方式為Addr:A1、A2,Value:10、15。snooping協(xié)議cache塊狀態(tài)轉(zhuǎn)移圖注意:假設(shè)初始Cache的狀態(tài)為Invalid,且A1與A2映射到同一Cache塊,A1!=A2P1P2BUSMEMstepStatAddrValueStatAddrValueStatProcAddrValueAddrvalueP2:Write20toA1P1:Write40toA2P2:ReadA2P1:Write30toA2P1:Write50toA12013-2014學(xué)年秋冬學(xué)期高級計(jì)算機(jī)體系結(jié)構(gòu)試卷分析選擇題1、B。SIMD計(jì)算機(jī)屬于并行結(jié)構(gòu)計(jì)算機(jī),一條指令可以同時(shí)對多個(gè)數(shù)據(jù)進(jìn)行運(yùn)算。SIMD計(jì)算機(jī)由單一的指令部件控制,按照同一指令流的要求,為多個(gè)處理單元分配各不相同的數(shù)據(jù)并進(jìn)行處理。SIMD計(jì)算機(jī)以陣列處理機(jī)和向量處理機(jī)為代表。MIMD計(jì)算機(jī)屬于并行結(jié)構(gòu)計(jì)算機(jī),多個(gè)處理單元根據(jù)不同的控制流程執(zhí)行不同的操作,處理不同的數(shù)據(jù)。MIMD計(jì)算機(jī)是能夠?qū)崿F(xiàn)指令、數(shù)據(jù)作業(yè)、任務(wù)等各級全面并行計(jì)算的多機(jī)處理系統(tǒng)。2、B。本題考查對forwarding技術(shù)的理解。Forwarding技術(shù)是解決流水線中的部分?jǐn)?shù)據(jù)冒險(xiǎn)問題的重要硬件技術(shù),但由于load指令只有在MEM周期結(jié)束之后才能得到數(shù)據(jù),所以即使利用轉(zhuǎn)發(fā)也需要一個(gè)停頓之后才能得到數(shù)據(jù)。本題中B選項(xiàng)中LD與DSUB存在數(shù)據(jù)相關(guān),且不能利用轉(zhuǎn)發(fā)技術(shù)完全消除停頓。A,C選項(xiàng)都能利用轉(zhuǎn)發(fā)技術(shù)消除停頓,而D選項(xiàng)不存在數(shù)據(jù)相關(guān)。答案選B。3、C。DADDIU R1,R3,#-8①BNE R1,R2,LOOP②SUB R4,R4,#8③①②之間存在真相關(guān),產(chǎn)生RAW競爭。②存在控制相關(guān),產(chǎn)生轉(zhuǎn)移競爭。4、C。5、B。相較簡單的方案而言,Tomasulo方案有兩個(gè)優(yōu)勢:1)冒險(xiǎn)檢測邏輯的分散;2)消除可能產(chǎn)生的WAW和WAR冒險(xiǎn)的停頓。第一個(gè)優(yōu)勢源于分布式保留站和CDB的使用,第二個(gè)優(yōu)勢(消除WAR和WAW)是利用保留站來重命名寄存器,并在操作數(shù)可用時(shí),立即將其存儲(chǔ)在保留站中。6、C。本題考查對2位轉(zhuǎn)移預(yù)測緩沖器的理解。2位預(yù)測器只有在連續(xù)預(yù)測錯(cuò)誤兩次之后才會(huì)修改預(yù)測方向。當(dāng)循環(huán)體在前9次實(shí)際轉(zhuǎn)移,最后一次實(shí)際不轉(zhuǎn)移時(shí):預(yù)測器開始預(yù)測不轉(zhuǎn)移,前兩次都預(yù)測失敗,連續(xù)失敗兩次后,2位預(yù)測器預(yù)測轉(zhuǎn)移,所以3~9次預(yù)測成功,第10次實(shí)際不轉(zhuǎn)移,預(yù)測錯(cuò)誤,故命中率為70%。當(dāng)循環(huán)體第一次實(shí)際轉(zhuǎn)移且實(shí)際轉(zhuǎn)移行為間隔變換一次時(shí):預(yù)測器每兩次命中一次,故命中率為50%。答案選C。7、B。多發(fā)射技術(shù)有superscalar超標(biāo)量方法和VLIW超長指令字。超標(biāo)量主要采用硬件檢測競爭,VLIM采用編譯構(gòu)成可并行執(zhí)行的指令包,每個(gè)周期始終發(fā)射固定數(shù)目的指令。8、C?,F(xiàn)有的MIMD機(jī)器根據(jù)存儲(chǔ)器組織方式可以分為兩類:集中式共享存儲(chǔ)器系統(tǒng)結(jié)構(gòu)和分布式存儲(chǔ)器系統(tǒng)結(jié)構(gòu)。集中式共享存儲(chǔ)器結(jié)構(gòu)只有單一存儲(chǔ)器結(jié)構(gòu),對每個(gè)處理器而言都是對等的,每個(gè)處理器訪問的時(shí)間都相同,所以也被稱為對稱(共享存儲(chǔ)器)多處理器系統(tǒng)(SMP)或均勻存儲(chǔ)器訪問(UMA)。分布式存儲(chǔ)器多處理器系統(tǒng)的每個(gè)節(jié)點(diǎn)包含處理器、存儲(chǔ)器、輸入輸出系統(tǒng)和互聯(lián)網(wǎng)絡(luò)的接口。 根據(jù)處理器間傳遞數(shù)據(jù)所用的方法,有兩種不同的系統(tǒng)結(jié)構(gòu)。分布式共享存儲(chǔ)器系統(tǒng)(DSM)和消息傳遞多處理器系統(tǒng)。DSM將物理上分離的存儲(chǔ)器作為邏輯上共享的地址空間進(jìn)行尋址,所以任何一個(gè)處理器都能夠通過引用地址的方式訪問任意節(jié)點(diǎn)上的存儲(chǔ)器,但是其訪問時(shí)間取決于數(shù)據(jù)字在存儲(chǔ)器中的位置,所以也被稱為NUMA(非均勻存儲(chǔ)器訪問)。消息傳遞多處理器系統(tǒng)的地址空間由多個(gè)私有的地址空間組成,這些私有地址空間在邏輯上是分散的,并且不能被遠(yuǎn)程處理器尋址。9、A。本題考察共享可寫數(shù)據(jù)時(shí)引起的cache不一致,寫回式和回寫式兩種緩存寫入方式的理解。采用寫回式緩存時(shí)緩存更新的數(shù)據(jù)不會(huì)立即反應(yīng)到內(nèi)存中。本題中,T1完成程序執(zhí)行時(shí)cache1中的X=1,Y=10。Cache1寫回X后,內(nèi)存中的X=1。T2執(zhí)行結(jié)束時(shí)cache2中的X=1,X’=1,Y=5,Y’=5。Cache2寫回X’與Y’后內(nèi)存中X=1,Y=5,X’=1,Y’=5。Cache1寫回Y后內(nèi)存中X=1,Y=10,X’=1,Y’=5。故答案為A。10、B。簡答題1、流水線的三類冒險(xiǎn)分別是:(1)結(jié)構(gòu)冒險(xiǎn):當(dāng)硬件在指令重疊執(zhí)行中不能支持指令所有可能的組合時(shí)發(fā)生資源冒險(xiǎn)。(2)數(shù)據(jù)冒險(xiǎn):在同時(shí)執(zhí)行的指令中,一條指令依賴于前一條指令的數(shù)據(jù)而得不到時(shí)發(fā)生的冒險(xiǎn)。(3)控制冒險(xiǎn):流水線中的轉(zhuǎn)移指令或其他改寫PC的指令造成的冒險(xiǎn)。其中有3類數(shù)據(jù)冒險(xiǎn):RAW(寫后讀):指令j試圖在指令i寫一個(gè)數(shù)據(jù)之前讀取它,這時(shí)j會(huì)讀到錯(cuò)誤的值,RAW對應(yīng)于數(shù)據(jù)的真相關(guān);WAW(寫后寫):指令j試圖在指令i寫一個(gè)數(shù)據(jù)之前寫該數(shù)據(jù),留下的值將會(huì)是指令i的結(jié)果,WAW對應(yīng)于輸出相關(guān),只在特定類型的流水線中才發(fā)生;WAR(讀后寫):指令j試圖在指令i讀一個(gè)數(shù)據(jù)之前寫該數(shù)據(jù),這時(shí)指令i會(huì)錯(cuò)誤的讀出新值,WAR對應(yīng)于反相關(guān),不會(huì)發(fā)生在靜態(tài)流水線之中。解決數(shù)據(jù)冒險(xiǎn)的方法有:雙跳(doublebump);停頓(stall);轉(zhuǎn)發(fā)(forwarding);指令重排序(instructionreorder)。2、分支延時(shí)槽的原理:引入分支延遲槽的目的主要是為了提高流水線的效率。流水線中,分支指令執(zhí)行時(shí)因?yàn)榇_定下一條指令的目標(biāo)地址一般要到第ID級以后,在目標(biāo)確定前流水線的取指級是不能工作的,即整個(gè)流水線就“浪費(fèi)”(阻塞)了一個(gè)時(shí)間片,為了利用這個(gè)時(shí)間片,在體系結(jié)構(gòu)的層面上規(guī)定跳轉(zhuǎn)指令后面的一個(gè)時(shí)間片為分支延遲槽(branchdelayslot)。位于分支延遲槽中的指令總是被執(zhí)行,與分支發(fā)生與否沒有關(guān)系。這樣就有效利用了一個(gè)時(shí)間片,消除了流水線的一個(gè)“氣泡”。調(diào)整后的代碼:ADDR1,R2,ADDR1,R2,R33、(1)硬件投機(jī)機(jī)制的原理:基于硬件的投機(jī)技術(shù)實(shí)質(zhì)上是綜合了下述三種技術(shù)的一種集成技術(shù):=1\*GB3①應(yīng)用動(dòng)態(tài)轉(zhuǎn)移預(yù)測技術(shù)選擇投機(jī)指令=2\*GB3②應(yīng)用投機(jī)技術(shù)達(dá)到在控制相關(guān)性消除以前就執(zhí)行指令=3\*GB3③應(yīng)用動(dòng)態(tài)調(diào)度技術(shù)來調(diào)度程序基本塊的不同組合。實(shí)際上就是動(dòng)態(tài)投機(jī)與動(dòng)態(tài)調(diào)度相結(jié)合的一種技術(shù)。(2)ROB的作用:重構(gòu)序緩存(ROB)相當(dāng)于一個(gè)額外的虛擬存儲(chǔ)器,相當(dāng)于tomasulo算法中的保留站、loadbuffer和storebuffer等的功能。重構(gòu)序緩存在指令完成操作之后直到交付這段時(shí)間里保存該指令的結(jié)果,作為其他指令操作數(shù)的源。(3)ROB與RS的區(qū)別:在tomasulo算法中,當(dāng)指令完成寫結(jié)果的操作后,所有的后繼指令都將從寄存器文件中讀取結(jié)果。而在推測技術(shù)中,只有在指令提交之后寄存器文件才會(huì)被更新,即在指令執(zhí)行到指令提交這段時(shí)間之內(nèi),由ROB提供操作數(shù)。4、(1)核心思想相同之處:兩者消除RAW競爭的思想相同。Tomasulo方法采用了記分牌方法的動(dòng)態(tài)調(diào)度的核心思想,多條指令處于發(fā)射狀態(tài),等待條件成熟,可以不按順序執(zhí)行。(2)核心思想不同之處:Tomasulo方法通過寄存器換名過程可以消除WAR和WAW競爭。記分牌方法能檢測WAR和WAW競爭,一旦檢測到存在WAR和WAW競爭,通過插入停頓周期來解決這一競爭。所以,記分牌方法不能消除WAR和WAW競爭。(3)檢測競爭和控制指令執(zhí)行方式的不同:Tomasulo方法檢測競爭和控制指令執(zhí)行兩方面功能是通過分布在每一功能單元的保留站來進(jìn)行的,因此Tomasulo方法是一種分布式方法。記分牌方法的上述功能是通過統(tǒng)一的記分牌來實(shí)現(xiàn)的,因此記分牌方法是一種集中式方法。(4)寫結(jié)果的方法不同:Tomasulo方法直接將功能單元輸出的結(jié)果送往需要該結(jié)果的所有保留站,而不必經(jīng)過寄存器這一中間環(huán)節(jié)。記分牌方法是將結(jié)果寫入寄存器,因而可能造成等待這一結(jié)果的指令都出現(xiàn)停頓現(xiàn)象,之后,所有相關(guān)指令的功能單元在讀FP寄存器時(shí)又可能出現(xiàn)競爭現(xiàn)象。5、并行性是指計(jì)算機(jī)系統(tǒng)具有可以同時(shí)進(jìn)行運(yùn)算或操作的特性,在同一時(shí)間完成兩種或兩種以上工作。它包括同時(shí)性與并發(fā)性兩種含義。同時(shí)性指兩個(gè)或兩個(gè)以上事件在同一時(shí)刻發(fā)生。并發(fā)性指兩個(gè)或兩個(gè)以上事件在同一時(shí)間間隔發(fā)生。是通過對有限物理資源強(qiáng)制行駛多用戶共享以提高效率。三、計(jì)算題1、1)Amdahal定律定義了使用某一特定功能所獲得的加速比。加速比取決于下面兩個(gè)因素:原計(jì)算機(jī)計(jì)算時(shí)間中可升級部分所占的比例;通過升級執(zhí)行模式得到的改進(jìn),也就是說在為整個(gè)程序使用這一執(zhí)行模式時(shí),任務(wù)的運(yùn)行速度會(huì)提高多少倍。2)由公式CPIoriginal=i=1=(5x25%)+(2.33x75%)=3CPInewFPSQR=CPIorignal-5%x(CPIoldFPSQR-CPIwithnewFPSQRonly)=3.0-5%x(20-2)=2.1同理,計(jì)算出CPInewFP=(75%x2.33)+(25%x2.5)=2.375通過比較,第一種方案更優(yōu),加速比SpeedupnewFPSQR=CPIoriginal/CPInewFPSQR=3/2.1=1.42863)由加速比的公式得: 50 =1/(Fparallel/100+(1-Fparallel)) Fparallel≈0.98992、1)未調(diào)度時(shí),迭代一次需10個(gè)時(shí)鐘。FDXMWFDSA1A2A3A4WFSDSSXMWFSSDXMWFSDXMWFF10cc2)軟件流水方式編譯優(yōu)化后的循環(huán)代碼如下:#啟動(dòng)代碼:L.DF0,0(R1)DADDUIR1,R1,#-8ADD.DF4,F0,F2L.DF0,0(R1)DADDUIR1,R1,#-8#循環(huán)代碼:loop:S.D F4,16(R1);存到M[i]ADD.D F4,F0,F2;M[i-1]LD F0,0(R1);取M[i-2]BNEZR1,loopDADDUIR1,R1,#-8#結(jié)束代碼:S.DF4,16(R1)ADD.DF4,F0,F2S.DF4,8(R1)3)軟件流水方式編譯優(yōu)化之后,每迭代n次,啟動(dòng)代碼和結(jié)束代碼各執(zhí)行一次,loop代碼執(zhí)行n次。其中:#啟動(dòng)代碼:L.DF0,0(R1)1DADDUIR1,R1,#-82ADD.DF4,F0,F23L.DF0,0(R1)4DADDUIR1,R1,#-85每執(zhí)行一次啟動(dòng)代碼需要5個(gè)時(shí)鐘周期#循環(huán)代碼:loop:S.D 16(R1),F4;存到M[i]1ADD.D F4,F0,F2;M[i-1]2LDF0,0(R1);取M[i-2]3BNEZR1,loop4DADDUIR1,R1,#-85每執(zhí)行一次循環(huán)代碼需要5個(gè)時(shí)鐘周期#結(jié)束代碼:ADD.DF4,F0,F21S.D16(R1),F42Stall3S.D8(R1),F44每執(zhí)行一次結(jié)束代碼需要4個(gè)時(shí)鐘周期所以當(dāng)?shù)鷑次時(shí),總共需要9+5n個(gè)時(shí)鐘周期。所以每迭代一次需要的時(shí)鐘周期數(shù)(9+5n)/n=5+9/n四、分析題1、本題要求對關(guān)聯(lián)預(yù)測器和2位預(yù)測器有較好的理解,能綜合運(yùn)用關(guān)聯(lián)預(yù)測器與2位預(yù)測器的結(jié)合。(1)22*2*由分支選中的預(yù)測項(xiàng)數(shù)=8K,則由分支選中的預(yù)測項(xiàng)數(shù)=1K。(2)這個(gè)相關(guān)預(yù)測器的硬件框圖如下:1010每個(gè)BR指令的低位地址每個(gè)轉(zhuǎn)移預(yù)測器2位2位全局轉(zhuǎn)移歷史記錄:最后兩條指令的轉(zhuǎn)移情況本次BR的預(yù)測位為XX1K項(xiàng)(3)程序執(zhí)行時(shí)的數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論