版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
高級計(jì)算機(jī)體系結(jié)構(gòu)試卷作業(yè)授課教師陳文智作者姓名21321240陳英芝 21321191楊誼 21321284柴一平 21321189張翔提交日期2014年01月06日2013-2014學(xué)年秋冬學(xué)期高級計(jì)算機(jī)體系結(jié)構(gòu)試卷學(xué)號____________姓名____________分?jǐn)?shù)____________一、選擇題(共10題,每題2分,共20分)1、根據(jù)指令流和數(shù)據(jù)流的多倍性可以將計(jì)算機(jī)體系結(jié)構(gòu)分為四大類。其中以陣列處理機(jī)和向量處理機(jī)為代表的是(),以多機(jī)計(jì)算機(jī)系統(tǒng)為代表的是()。SISD,SIMDB.SIMD,MIMDC.MISD,MIMDD.MIMD,SIMD2、在流水線中,利用簡單硬件技術(shù)“轉(zhuǎn)發(fā)(Forwarding)”可以解決一些數(shù)據(jù)冒險(xiǎn)問題,從而減少流水線停頓,但是并非所有數(shù)據(jù)冒險(xiǎn)都可以通過轉(zhuǎn)發(fā)方式處理。下列指令序列中,不能利用轉(zhuǎn)發(fā)技術(shù)完全消除停頓的是()。A.DADDR1,R2,R3 B.LDR1,0(R2)DSUBR4,R1,R5 DSUBR4,R1,R5C.DADDR1,R2,R3 D.LDR4,0(R1)LDR4,0(R1) DADDR1,R2,R33、下列語句間存在的指令間相關(guān)性有_______、_______,在基本流水線(MIPS)中會(huì)產(chǎn)生競爭的有_______、_______。DADDIU R1,R3,#-8BNE R1,R2,LOOPSUB R4,R4,#8A、RAW,WAR;RAW,WAR B、真相關(guān),反相關(guān);RAW,轉(zhuǎn)移C、真相關(guān),控制相關(guān);RAW,轉(zhuǎn)移 D、RAW,WAW;RAW,WAW4、下列哪個(gè)選項(xiàng)正確包含了記分牌全部限制因素:①指令間可用并行數(shù)少②積分卡的項(xiàng)數(shù)有限③功能單元數(shù)目和類型④存在反相關(guān)和輸出相關(guān)⑤未能利用轉(zhuǎn)發(fā)⑥無法解決RAWA.①②③④⑥ B.②③⑤⑥ C.①②③④⑤ D.①③④⑤⑥5、Tomasulo's硬件調(diào)度算法有兩個(gè)主要優(yōu)點(diǎn),一是_______競爭檢測邏輯,二是消除了_______競爭的阻塞。A、集中,WAW和WAR B、分散,WAW和WARC、集中,WAW和RAW D、分散,WAW和RAR
6、通過硬件動(dòng)態(tài)預(yù)測轉(zhuǎn)移指令的行為可以減少轉(zhuǎn)移代價(jià),2位轉(zhuǎn)移預(yù)測緩沖器是硬件動(dòng)態(tài)預(yù)測技術(shù)之一。假設(shè)2位轉(zhuǎn)移預(yù)測緩沖器的初始值為0,某循環(huán)體共循環(huán)10次,若該循環(huán)體只在前9次循環(huán)實(shí)際轉(zhuǎn)移,最后1次實(shí)際不轉(zhuǎn)移,則2位預(yù)測緩沖器的命中率為()。若該循環(huán)體在第一次循環(huán)實(shí)際轉(zhuǎn)移,且實(shí)際轉(zhuǎn)移行為間隔變換一次,則2位預(yù)測緩沖器的命中率為()。A.90%,50% B.70%,20%C.70%,50% D.90%,20%7、多發(fā)射處理器的目標(biāo)是允許在一個(gè)時(shí)鐘周期內(nèi)發(fā)射多條指令。兩種基本的多發(fā)射技術(shù)有(),()。其中()每時(shí)鐘周期發(fā)射固定數(shù)目的指令,()主要采用硬件檢測競爭。A、多處理器,超標(biāo)量;超標(biāo)量,多處理器
B、VLIW,超標(biāo)量;VLIW,超標(biāo)量C、超標(biāo)量,VLIW;超標(biāo)量,VLIW
D、超標(biāo)量,VLIW;VLIW,超標(biāo)量8、以下說法正確的是:=1\*GB3①集中式共享存儲(chǔ)器系統(tǒng)結(jié)構(gòu)所有的處理器訪問存儲(chǔ)器的時(shí)間不一致=2\*GB3②在分布式共享存儲(chǔ)(DSM)系統(tǒng)中,任何一個(gè)處理器都能夠通過引用地址的方式訪問任意節(jié)點(diǎn)上的存儲(chǔ)器=3\*GB3③在消息傳遞多處理器系統(tǒng)中,不同處理器中相同的物理地址分別指向兩個(gè)不同存儲(chǔ)器中的不同位置=4\*GB3④NUMA(非均勻存儲(chǔ)器訪問)的訪問時(shí)間取決于數(shù)據(jù)字在存儲(chǔ)器中的位置A.=1\*GB3①=2\*GB3② B.=1\*GB3①=2\*GB3②=3\*GB3③=4\*GB3④ C.=2\*GB3②=3\*GB3③=4\*GB3④ D.=1\*GB3①=3\*GB3③=4\*GB3④9、出現(xiàn)多處理機(jī)cache不一致的原因有:共享可寫的數(shù)據(jù)、進(jìn)程遷移和I/O傳輸。有以下兩個(gè)不同處理器的程序T1和T2共享同一個(gè)可寫的數(shù)據(jù),T1與T2分別使用緩存cache-1和cache-2,且采用寫回式寫回緩存。內(nèi)存與緩存的初始值如下表所示。這兩個(gè)進(jìn)程按下表順序執(zhí)行之后,內(nèi)存中保存的數(shù)據(jù)為()。ProgramT1ProgramT2Cache-1Cache-2內(nèi)存初始值程序執(zhí)行順序STX,1STY,10LDY,R1STY’,R1LDX,R2STX’,R2X=Y=X=X’=Y=Y’=X=0Y=5X’=Y’=T1完成程序執(zhí)行Cache-1寫回XT2執(zhí)行結(jié)束Cache-2寫回X’與Y’Cache-1寫回YA. X=1,Y=10,X’=1,Y’=5 B.X=0,Y=10,X’=1,Y’=5C.X=1,Y=5,X’=1,Y’=10 D.X=0,Y=5,X’=1,Y’=510、在基于目錄的cache一致性協(xié)議中,已知數(shù)據(jù)塊可能處于以下3種狀態(tài):共享(shared)、未緩存(uncached)、獨(dú)占(exclusive)。則在數(shù)據(jù)塊處于共享狀態(tài)時(shí)可能的目錄請求有:=1\*GB3①讀缺失=2\*GB3②寫缺失=3\*GB3③數(shù)據(jù)寫回A.=1\*GB3①=2\*GB3②=3\*GB3③ B.=1\*GB3①=2\*GB3② C.=2\*GB3②=3\*GB3③ D.=1\*GB3①=3\*GB3③二、簡答題(共5題,每題4分,共20分)1、簡述流水線的三類冒險(xiǎn),并指出數(shù)據(jù)冒險(xiǎn)有哪幾類,以及解決數(shù)據(jù)冒險(xiǎn)的方法。2、簡述分支延時(shí)槽的原理,并根據(jù)分支延時(shí)槽的原理優(yōu)化下述代碼。ADDR1,R2,R3DelayslotIfR2=0thenDelayslot3、簡述硬件投機(jī)機(jī)制的原理和ROB的作用,并指出ROB與普通的tomasulo算法中的保留站(reservationstations)的功能區(qū)別。4、簡述tomosulo算法和記分牌算法的異同。5、試解釋并行性的含義。三、計(jì)算題(共2題,每題10分,共20分)(1)概述Amadahl定律(2)假定指令中的FP(浮點(diǎn))運(yùn)算頻率=25%,F(xiàn)P平均CPI=5.0,平均非FP的CPI=2.33,F(xiàn)PSQR(浮點(diǎn)開方)運(yùn)算頻率5%,F(xiàn)PSQR的平均CPI=20,假定有兩種方法提高性能,分別是: a.將FP中FPSQR的CPI減少到2 b.將FP的CPI減少到2.5,試計(jì)算這兩種方案的CPI,并計(jì)算出較好的方法的加速比,結(jié)果保留兩位有效數(shù)字。(3)現(xiàn)有100個(gè)處理器,為了達(dá)到50倍的加速比,試計(jì)算所需要的并行度,結(jié)果保留四位有效數(shù)字。2、設(shè)指令間的相關(guān)性參數(shù)如下表,假定采用一個(gè)標(biāo)準(zhǔn)5級整數(shù)流水線,這些功能單元被完全流水化或復(fù)制。試分析計(jì)算下列問題:(1)
計(jì)算該循環(huán)在未進(jìn)行任何調(diào)度時(shí)迭代一次需多少時(shí)鐘。(2)
采用軟件流水方式編譯優(yōu)化下列循環(huán),使其循環(huán)內(nèi)的競爭最少。(3)
計(jì)算優(yōu)化后該循環(huán)迭代一次需多少時(shí)鐘。前操作指令后繼相關(guān)指令延遲時(shí)鐘FPALU
操作FPALU
操作3FPALU
操作Store(雙字)2Load(雙字)FPALU
操作1Load(雙字)Store(雙字)0LOOP:
L.D
F0,0(R1)ADD.D
F4,F(xiàn)0,F(xiàn)2S.D
0(R1),F(xiàn)4DADDUI
R1,R1,#-8BNEZ
R1,LOOP四、分析題(共3題,共40分。第1題15分,第2題10分,第3題15分)1、(m,n)相關(guān)分支預(yù)測器利用最近執(zhí)行的m個(gè)分支的行為從2m個(gè)預(yù)測器中作出選擇,這些預(yù)測器都是n位預(yù)測器?,F(xiàn)有一個(gè)(2,2)相關(guān)分支預(yù)測器共8K位。(1)在該相關(guān)分支預(yù)測器中有多少項(xiàng)?(2)畫出這個(gè)相關(guān)預(yù)測器的硬件框圖。(3)假設(shè)全局轉(zhuǎn)移緩存和每個(gè)轉(zhuǎn)移預(yù)測器的初始值都為0,a初始值為1,利用上述(2,2)相關(guān)分支預(yù)測器,下列程序連續(xù)執(zhí)行5次時(shí)命中率是多少?Reg[R1]=a;Reg[R1]=a;BNEZ R1,L1;DADD R1,R0,#1;L1: DADDR3,R1,#-1; BNEZ R3,L2; DADDR1,R0,#2L2:…if(a==0) a=1;if(a==1) a=2;2、假設(shè)浮點(diǎn)功能單元的延遲為:加法為2個(gè)時(shí)鐘周期、乘法為6個(gè)時(shí)鐘周期、除法為12個(gè)時(shí)鐘周期。通過基于Tomasulo動(dòng)態(tài)調(diào)度的硬件投機(jī)技術(shù),使用下面代碼段,寫出當(dāng)DIV.D指令做好提交準(zhǔn)備時(shí)的狀態(tài)表。L.DL.D F6,32(R2)L.D F2,44(R3)MUL.D F0,F2,F4SUB.D F8,F2,F6DIV.D F10,F0,F6ADD.D F6,F8,F2重排序緩沖器項(xiàng)目繁忙指令狀態(tài)目的地值123456FP寄存器狀態(tài)字段F0F1F2F3F4F5F6F7F8F10ROB#繁忙3、根據(jù)下表指令序列,結(jié)合snooping協(xié)議cache塊的狀態(tài)轉(zhuǎn)移圖,假設(shè)緩存寫回方式采用寫回式。請正確填寫下面流程表,若內(nèi)存有多個(gè)數(shù)據(jù),例如內(nèi)存中A1=10,A2=15則表格填寫方式為Addr:A1、A2,Value:10、15。snooping協(xié)議cache塊狀態(tài)轉(zhuǎn)移圖注意:假設(shè)初始Cache的狀態(tài)為Invalid,且A1與A2映射到同一Cache塊,A1!=A2P1P2BUSMEMstepStatAddrValueStatAddrValueStatProcAddrValueAddrvalueP2:Write20toA1P1:Write40toA2P2:ReadA2P1:Write30toA2P1:Write50toA12013-2014學(xué)年秋冬學(xué)期高級計(jì)算機(jī)體系結(jié)構(gòu)試卷分析選擇題1、B。SIMD計(jì)算機(jī)屬于并行結(jié)構(gòu)計(jì)算機(jī),一條指令可以同時(shí)對多個(gè)數(shù)據(jù)進(jìn)行運(yùn)算。SIMD計(jì)算機(jī)由單一的指令部件控制,按照同一指令流的要求,為多個(gè)處理單元分配各不相同的數(shù)據(jù)并進(jìn)行處理。SIMD計(jì)算機(jī)以陣列處理機(jī)和向量處理機(jī)為代表。MIMD計(jì)算機(jī)屬于并行結(jié)構(gòu)計(jì)算機(jī),多個(gè)處理單元根據(jù)不同的控制流程執(zhí)行不同的操作,處理不同的數(shù)據(jù)。MIMD計(jì)算機(jī)是能夠?qū)崿F(xiàn)指令、數(shù)據(jù)作業(yè)、任務(wù)等各級全面并行計(jì)算的多機(jī)處理系統(tǒng)。2、B。本題考查對forwarding技術(shù)的理解。Forwarding技術(shù)是解決流水線中的部分?jǐn)?shù)據(jù)冒險(xiǎn)問題的重要硬件技術(shù),但由于load指令只有在MEM周期結(jié)束之后才能得到數(shù)據(jù),所以即使利用轉(zhuǎn)發(fā)也需要一個(gè)停頓之后才能得到數(shù)據(jù)。本題中B選項(xiàng)中LD與DSUB存在數(shù)據(jù)相關(guān),且不能利用轉(zhuǎn)發(fā)技術(shù)完全消除停頓。A,C選項(xiàng)都能利用轉(zhuǎn)發(fā)技術(shù)消除停頓,而D選項(xiàng)不存在數(shù)據(jù)相關(guān)。答案選B。3、C。DADDIU R1,R3,#-8①BNE R1,R2,LOOP②SUB R4,R4,#8③①②之間存在真相關(guān),產(chǎn)生RAW競爭。②存在控制相關(guān),產(chǎn)生轉(zhuǎn)移競爭。4、C。5、B。相較簡單的方案而言,Tomasulo方案有兩個(gè)優(yōu)勢:1)冒險(xiǎn)檢測邏輯的分散;2)消除可能產(chǎn)生的WAW和WAR冒險(xiǎn)的停頓。第一個(gè)優(yōu)勢源于分布式保留站和CDB的使用,第二個(gè)優(yōu)勢(消除WAR和WAW)是利用保留站來重命名寄存器,并在操作數(shù)可用時(shí),立即將其存儲(chǔ)在保留站中。6、C。本題考查對2位轉(zhuǎn)移預(yù)測緩沖器的理解。2位預(yù)測器只有在連續(xù)預(yù)測錯(cuò)誤兩次之后才會(huì)修改預(yù)測方向。當(dāng)循環(huán)體在前9次實(shí)際轉(zhuǎn)移,最后一次實(shí)際不轉(zhuǎn)移時(shí):預(yù)測器開始預(yù)測不轉(zhuǎn)移,前兩次都預(yù)測失敗,連續(xù)失敗兩次后,2位預(yù)測器預(yù)測轉(zhuǎn)移,所以3~9次預(yù)測成功,第10次實(shí)際不轉(zhuǎn)移,預(yù)測錯(cuò)誤,故命中率為70%。當(dāng)循環(huán)體第一次實(shí)際轉(zhuǎn)移且實(shí)際轉(zhuǎn)移行為間隔變換一次時(shí):預(yù)測器每兩次命中一次,故命中率為50%。答案選C。7、B。多發(fā)射技術(shù)有superscalar超標(biāo)量方法和VLIW超長指令字。超標(biāo)量主要采用硬件檢測競爭,VLIM采用編譯構(gòu)成可并行執(zhí)行的指令包,每個(gè)周期始終發(fā)射固定數(shù)目的指令。8、C?,F(xiàn)有的MIMD機(jī)器根據(jù)存儲(chǔ)器組織方式可以分為兩類:集中式共享存儲(chǔ)器系統(tǒng)結(jié)構(gòu)和分布式存儲(chǔ)器系統(tǒng)結(jié)構(gòu)。集中式共享存儲(chǔ)器結(jié)構(gòu)只有單一存儲(chǔ)器結(jié)構(gòu),對每個(gè)處理器而言都是對等的,每個(gè)處理器訪問的時(shí)間都相同,所以也被稱為對稱(共享存儲(chǔ)器)多處理器系統(tǒng)(SMP)或均勻存儲(chǔ)器訪問(UMA)。分布式存儲(chǔ)器多處理器系統(tǒng)的每個(gè)節(jié)點(diǎn)包含處理器、存儲(chǔ)器、輸入輸出系統(tǒng)和互聯(lián)網(wǎng)絡(luò)的接口。 根據(jù)處理器間傳遞數(shù)據(jù)所用的方法,有兩種不同的系統(tǒng)結(jié)構(gòu)。分布式共享存儲(chǔ)器系統(tǒng)(DSM)和消息傳遞多處理器系統(tǒng)。DSM將物理上分離的存儲(chǔ)器作為邏輯上共享的地址空間進(jìn)行尋址,所以任何一個(gè)處理器都能夠通過引用地址的方式訪問任意節(jié)點(diǎn)上的存儲(chǔ)器,但是其訪問時(shí)間取決于數(shù)據(jù)字在存儲(chǔ)器中的位置,所以也被稱為NUMA(非均勻存儲(chǔ)器訪問)。消息傳遞多處理器系統(tǒng)的地址空間由多個(gè)私有的地址空間組成,這些私有地址空間在邏輯上是分散的,并且不能被遠(yuǎn)程處理器尋址。9、A。本題考察共享可寫數(shù)據(jù)時(shí)引起的cache不一致,寫回式和回寫式兩種緩存寫入方式的理解。采用寫回式緩存時(shí)緩存更新的數(shù)據(jù)不會(huì)立即反應(yīng)到內(nèi)存中。本題中,T1完成程序執(zhí)行時(shí)cache1中的X=1,Y=10。Cache1寫回X后,內(nèi)存中的X=1。T2執(zhí)行結(jié)束時(shí)cache2中的X=1,X’=1,Y=5,Y’=5。Cache2寫回X’與Y’后內(nèi)存中X=1,Y=5,X’=1,Y’=5。Cache1寫回Y后內(nèi)存中X=1,Y=10,X’=1,Y’=5。故答案為A。10、B。簡答題1、流水線的三類冒險(xiǎn)分別是:(1)結(jié)構(gòu)冒險(xiǎn):當(dāng)硬件在指令重疊執(zhí)行中不能支持指令所有可能的組合時(shí)發(fā)生資源冒險(xiǎn)。(2)數(shù)據(jù)冒險(xiǎn):在同時(shí)執(zhí)行的指令中,一條指令依賴于前一條指令的數(shù)據(jù)而得不到時(shí)發(fā)生的冒險(xiǎn)。(3)控制冒險(xiǎn):流水線中的轉(zhuǎn)移指令或其他改寫PC的指令造成的冒險(xiǎn)。其中有3類數(shù)據(jù)冒險(xiǎn):RAW(寫后讀):指令j試圖在指令i寫一個(gè)數(shù)據(jù)之前讀取它,這時(shí)j會(huì)讀到錯(cuò)誤的值,RAW對應(yīng)于數(shù)據(jù)的真相關(guān);WAW(寫后寫):指令j試圖在指令i寫一個(gè)數(shù)據(jù)之前寫該數(shù)據(jù),留下的值將會(huì)是指令i的結(jié)果,WAW對應(yīng)于輸出相關(guān),只在特定類型的流水線中才發(fā)生;WAR(讀后寫):指令j試圖在指令i讀一個(gè)數(shù)據(jù)之前寫該數(shù)據(jù),這時(shí)指令i會(huì)錯(cuò)誤的讀出新值,WAR對應(yīng)于反相關(guān),不會(huì)發(fā)生在靜態(tài)流水線之中。解決數(shù)據(jù)冒險(xiǎn)的方法有:雙跳(doublebump);停頓(stall);轉(zhuǎn)發(fā)(forwarding);指令重排序(instructionreorder)。2、分支延時(shí)槽的原理:引入分支延遲槽的目的主要是為了提高流水線的效率。流水線中,分支指令執(zhí)行時(shí)因?yàn)榇_定下一條指令的目標(biāo)地址一般要到第ID級以后,在目標(biāo)確定前流水線的取指級是不能工作的,即整個(gè)流水線就“浪費(fèi)”(阻塞)了一個(gè)時(shí)間片,為了利用這個(gè)時(shí)間片,在體系結(jié)構(gòu)的層面上規(guī)定跳轉(zhuǎn)指令后面的一個(gè)時(shí)間片為分支延遲槽(branchdelayslot)。位于分支延遲槽中的指令總是被執(zhí)行,與分支發(fā)生與否沒有關(guān)系。這樣就有效利用了一個(gè)時(shí)間片,消除了流水線的一個(gè)“氣泡”。調(diào)整后的代碼:ADDR1,R2,ADDR1,R2,R33、(1)硬件投機(jī)機(jī)制的原理:基于硬件的投機(jī)技術(shù)實(shí)質(zhì)上是綜合了下述三種技術(shù)的一種集成技術(shù):=1\*GB3①應(yīng)用動(dòng)態(tài)轉(zhuǎn)移預(yù)測技術(shù)選擇投機(jī)指令=2\*GB3②應(yīng)用投機(jī)技術(shù)達(dá)到在控制相關(guān)性消除以前就執(zhí)行指令=3\*GB3③應(yīng)用動(dòng)態(tài)調(diào)度技術(shù)來調(diào)度程序基本塊的不同組合。實(shí)際上就是動(dòng)態(tài)投機(jī)與動(dòng)態(tài)調(diào)度相結(jié)合的一種技術(shù)。(2)ROB的作用:重構(gòu)序緩存(ROB)相當(dāng)于一個(gè)額外的虛擬存儲(chǔ)器,相當(dāng)于tomasulo算法中的保留站、loadbuffer和storebuffer等的功能。重構(gòu)序緩存在指令完成操作之后直到交付這段時(shí)間里保存該指令的結(jié)果,作為其他指令操作數(shù)的源。(3)ROB與RS的區(qū)別:在tomasulo算法中,當(dāng)指令完成寫結(jié)果的操作后,所有的后繼指令都將從寄存器文件中讀取結(jié)果。而在推測技術(shù)中,只有在指令提交之后寄存器文件才會(huì)被更新,即在指令執(zhí)行到指令提交這段時(shí)間之內(nèi),由ROB提供操作數(shù)。4、(1)核心思想相同之處:兩者消除RAW競爭的思想相同。Tomasulo方法采用了記分牌方法的動(dòng)態(tài)調(diào)度的核心思想,多條指令處于發(fā)射狀態(tài),等待條件成熟,可以不按順序執(zhí)行。(2)核心思想不同之處:Tomasulo方法通過寄存器換名過程可以消除WAR和WAW競爭。記分牌方法能檢測WAR和WAW競爭,一旦檢測到存在WAR和WAW競爭,通過插入停頓周期來解決這一競爭。所以,記分牌方法不能消除WAR和WAW競爭。(3)檢測競爭和控制指令執(zhí)行方式的不同:Tomasulo方法檢測競爭和控制指令執(zhí)行兩方面功能是通過分布在每一功能單元的保留站來進(jìn)行的,因此Tomasulo方法是一種分布式方法。記分牌方法的上述功能是通過統(tǒng)一的記分牌來實(shí)現(xiàn)的,因此記分牌方法是一種集中式方法。(4)寫結(jié)果的方法不同:Tomasulo方法直接將功能單元輸出的結(jié)果送往需要該結(jié)果的所有保留站,而不必經(jīng)過寄存器這一中間環(huán)節(jié)。記分牌方法是將結(jié)果寫入寄存器,因而可能造成等待這一結(jié)果的指令都出現(xiàn)停頓現(xiàn)象,之后,所有相關(guān)指令的功能單元在讀FP寄存器時(shí)又可能出現(xiàn)競爭現(xiàn)象。5、并行性是指計(jì)算機(jī)系統(tǒng)具有可以同時(shí)進(jìn)行運(yùn)算或操作的特性,在同一時(shí)間完成兩種或兩種以上工作。它包括同時(shí)性與并發(fā)性兩種含義。同時(shí)性指兩個(gè)或兩個(gè)以上事件在同一時(shí)刻發(fā)生。并發(fā)性指兩個(gè)或兩個(gè)以上事件在同一時(shí)間間隔發(fā)生。是通過對有限物理資源強(qiáng)制行駛多用戶共享以提高效率。三、計(jì)算題1、1)Amdahal定律定義了使用某一特定功能所獲得的加速比。加速比取決于下面兩個(gè)因素:原計(jì)算機(jī)計(jì)算時(shí)間中可升級部分所占的比例;通過升級執(zhí)行模式得到的改進(jìn),也就是說在為整個(gè)程序使用這一執(zhí)行模式時(shí),任務(wù)的運(yùn)行速度會(huì)提高多少倍。2)由公式CPIoriginal=i=1=(5x25%)+(2.33x75%)=3CPInewFPSQR=CPIorignal-5%x(CPIoldFPSQR-CPIwithnewFPSQRonly)=3.0-5%x(20-2)=2.1同理,計(jì)算出CPInewFP=(75%x2.33)+(25%x2.5)=2.375通過比較,第一種方案更優(yōu),加速比SpeedupnewFPSQR=CPIoriginal/CPInewFPSQR=3/2.1=1.42863)由加速比的公式得: 50 =1/(Fparallel/100+(1-Fparallel)) Fparallel≈0.98992、1)未調(diào)度時(shí),迭代一次需10個(gè)時(shí)鐘。FDXMWFDSA1A2A3A4WFSDSSXMWFSSDXMWFSDXMWFF10cc2)軟件流水方式編譯優(yōu)化后的循環(huán)代碼如下:#啟動(dòng)代碼:L.DF0,0(R1)DADDUIR1,R1,#-8ADD.DF4,F0,F2L.DF0,0(R1)DADDUIR1,R1,#-8#循環(huán)代碼:loop:S.D F4,16(R1);存到M[i]ADD.D F4,F0,F2;M[i-1]LD F0,0(R1);取M[i-2]BNEZR1,loopDADDUIR1,R1,#-8#結(jié)束代碼:S.DF4,16(R1)ADD.DF4,F0,F2S.DF4,8(R1)3)軟件流水方式編譯優(yōu)化之后,每迭代n次,啟動(dòng)代碼和結(jié)束代碼各執(zhí)行一次,loop代碼執(zhí)行n次。其中:#啟動(dòng)代碼:L.DF0,0(R1)1DADDUIR1,R1,#-82ADD.DF4,F0,F23L.DF0,0(R1)4DADDUIR1,R1,#-85每執(zhí)行一次啟動(dòng)代碼需要5個(gè)時(shí)鐘周期#循環(huán)代碼:loop:S.D 16(R1),F4;存到M[i]1ADD.D F4,F0,F2;M[i-1]2LDF0,0(R1);取M[i-2]3BNEZR1,loop4DADDUIR1,R1,#-85每執(zhí)行一次循環(huán)代碼需要5個(gè)時(shí)鐘周期#結(jié)束代碼:ADD.DF4,F0,F21S.D16(R1),F42Stall3S.D8(R1),F44每執(zhí)行一次結(jié)束代碼需要4個(gè)時(shí)鐘周期所以當(dāng)?shù)鷑次時(shí),總共需要9+5n個(gè)時(shí)鐘周期。所以每迭代一次需要的時(shí)鐘周期數(shù)(9+5n)/n=5+9/n四、分析題1、本題要求對關(guān)聯(lián)預(yù)測器和2位預(yù)測器有較好的理解,能綜合運(yùn)用關(guān)聯(lián)預(yù)測器與2位預(yù)測器的結(jié)合。(1)22*2*由分支選中的預(yù)測項(xiàng)數(shù)=8K,則由分支選中的預(yù)測項(xiàng)數(shù)=1K。(2)這個(gè)相關(guān)預(yù)測器的硬件框圖如下:1010每個(gè)BR指令的低位地址每個(gè)轉(zhuǎn)移預(yù)測器2位2位全局轉(zhuǎn)移歷史記錄:最后兩條指令的轉(zhuǎn)移情況本次BR的預(yù)測位為XX1K項(xiàng)(3)程序執(zhí)行時(shí)的數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東白云學(xué)院《平面廣告》2023-2024學(xué)年第一學(xué)期期末試卷
- 共青科技職業(yè)學(xué)院《智能汽車傳感技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東財(cái)經(jīng)大學(xué)《古代女性文學(xué)研究》2023-2024學(xué)年第一學(xué)期期末試卷
- 貨運(yùn)司機(jī)培訓(xùn)課件
- 贛南衛(wèi)生健康職業(yè)學(xué)院《JavaWeb程序設(shè)計(jì)SIT》2023-2024學(xué)年第一學(xué)期期末試卷
- 2022年上海注冊會(huì)計(jì)師《審計(jì)》考試題庫(含典型題和真題)
- 贛東學(xué)院《小學(xué)跨學(xué)科教育研究》2023-2024學(xué)年第一學(xué)期期末試卷
- 七年級生物上冊第三單元生物圈中的綠色植物第五章綠色植物與生物圈中的碳-氧平衡第一節(jié)光合作用吸收二氧化碳釋放氧氣教案新版新人教版1
- 七年級道德與法治上冊第一單元成長的節(jié)拍第一課中學(xué)時(shí)代第一框中學(xué)序曲教案新人教版
- 《常見案例分析類型》課件
- 80、沈陽桃仙機(jī)場二平滑工程冬期施工方案
- 《STM32Cube嵌入式系統(tǒng)應(yīng)用》HAL庫版本習(xí)題及答案
- 一年級數(shù)學(xué)練習(xí)題-20以內(nèi)加減法口算題(4000道)直接打印版
- 施工作業(yè)安全管理規(guī)定(4篇)
- 浙江省金華市(2024年-2025年小學(xué)五年級語文)人教版質(zhì)量測試((上下)學(xué)期)試卷及答案
- 2024年度無人機(jī)飛行培訓(xùn)合同
- 2025年中國細(xì)胞與基因治療行業(yè)深度分析、投資前景、趨勢預(yù)測報(bào)告(智研咨詢)
- 統(tǒng)編版語文二年級上冊第一單元快樂讀書吧(推進(jìn)課)公開課一等獎(jiǎng)創(chuàng)新教案
- 2024-2030年中國LNG(液化天然氣)行業(yè)發(fā)展分析及投資可行性研究報(bào)告
- 17.2.4 一元二次方程求根公式 同步練習(xí)
- 人教版道德與法治八年級上冊2.1網(wǎng)絡(luò)改變世界課件
評論
0/150
提交評論