中南大學(xué)計(jì)算機(jī)體系結(jié)構(gòu)題庫_第1頁
中南大學(xué)計(jì)算機(jī)體系結(jié)構(gòu)題庫_第2頁
中南大學(xué)計(jì)算機(jī)體系結(jié)構(gòu)題庫_第3頁
中南大學(xué)計(jì)算機(jī)體系結(jié)構(gòu)題庫_第4頁
中南大學(xué)計(jì)算機(jī)體系結(jié)構(gòu)題庫_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、五 計(jì)算題 目 錄一、填空題1二、判斷題56三、名詞解釋74四、簡(jiǎn)答題74五、計(jì)算題74五、計(jì)算題-1、試題序號(hào):5812、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):一、計(jì)算機(jī)體系結(jié)構(gòu)的基本概念5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:解釋執(zhí)行8、試題內(nèi)容:假設(shè)有一個(gè)計(jì)算機(jī)系統(tǒng)分為四級(jí),每一級(jí)指令都比它下一級(jí)指令在功能上強(qiáng)M倍,即一條r+1級(jí)指令能夠完成M條r指令的工作,且一條r+1級(jí)指令需要N條r級(jí)指令解釋。對(duì)于一段在第一級(jí)執(zhí)行時(shí)間為K的程序,在第二、第三、第四級(jí)上的一段等效程序需要執(zhí)行多少時(shí)間?9、答案內(nèi)容:解:假設(shè)在第一級(jí)上用時(shí)間K執(zhí)行了該級(jí)IC條指令。1分對(duì)第二級(jí)而言,為了完成

2、IC條指令的功能,第二級(jí)指令的條數(shù)為:。為了執(zhí)行第二級(jí)條指令,需要執(zhí)行條第一級(jí)的指令對(duì)其進(jìn)行解釋,所以對(duì)于第二級(jí)而言,等效程序的執(zhí)行時(shí)間是: 2分對(duì)于第三級(jí)而言,為了完成IC條指令的功能,第三級(jí)指令的條數(shù)為:。為了執(zhí)行第三級(jí)條指令,需要執(zhí)行條第二級(jí)的指令對(duì)其進(jìn)行解釋。那么對(duì)第二級(jí)而言,總的指令條數(shù)為: 3分而第二級(jí)等效于第一級(jí)條指令,同時(shí)還需要條第一級(jí)指令進(jìn)行解釋,所以第三級(jí)等效程序的執(zhí)行時(shí)間是: 3分按照同樣的逐層遞推關(guān)系,不難求得第四級(jí)等效程序的總的執(zhí)行時(shí)間為: 1分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5822、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):1

3、.5 定量分析技術(shù)基礎(chǔ)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:阿姆達(dá)爾定律8、試題內(nèi)容:已知某商用計(jì)算機(jī)擬增加字符串操作功能。 若用軟件實(shí)現(xiàn),與無字符串操作相比,速度提高4倍, CPU成本提高1/5倍;若用硬件實(shí)現(xiàn),則速度是原來的100倍,,CPU成本是原來的5倍。 由實(shí)驗(yàn)測(cè)得,字符串操作占總運(yùn)行時(shí)間的50%, CPU成本約占整機(jī)成本的1/3。你選用哪種設(shè)計(jì)方案?9、答案內(nèi)容:解:采用軟件方法時(shí)根據(jù)阿姆達(dá)爾定律,性能提高:=1.66 2分硬件成本提高到C=2/3 + 1/3* (1+1/5)=1.07 1分價(jià)格性能比為:C/S = 1.07/1.66 = 0.64 1分采用硬件方法

4、時(shí): S=1/(1-50%)+50%/100=1.98 2分硬件成本提高到C=2/3 + 1/3* 5=2.33 1分價(jià)格性能比為:C/S = 2.33/1.98 = 1.18 1分如果僅考慮性能提高,則可選擇硬件方法,而考慮性能提高和成本因素,則應(yīng)選擇軟件方法。 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5832、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):一、計(jì)算機(jī)體系結(jié)構(gòu)的基本概念5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:CPU性能公式8、試題內(nèi)容:假設(shè)我們考慮條件分支指令的兩種不同設(shè)計(jì)方法如下: (1) CPUA:通過比較指令設(shè)置條件碼,然后測(cè)試

5、條件碼進(jìn)行分支。 (2) CPUB:在分支指令中包括比較過程在兩種CPU中,條件分支指令都占用2個(gè)時(shí)鐘周期而所有其它指令占用1個(gè)時(shí)鐘周期,對(duì)于CPUA,執(zhí)行的指令中分支指令占20%;由于每個(gè)分支指令之前都需要有比較指令,因此比較指令也占20%。由于CPUA在分支時(shí)不需要比較,因此假設(shè)它的時(shí)鐘周期時(shí)間比CPUB快1.25倍。哪一個(gè)CPU更快?如果CPUA的時(shí)鐘周期時(shí)間僅僅比CPUB快1.1倍,哪一個(gè)CPU更快呢?9、答案內(nèi)容:解:我們不考慮所有系統(tǒng)問題,所以可用CPU性能公式。占用2個(gè)時(shí)鐘周期的分支指令占總指令的20%,剩下的指令占用1個(gè)時(shí)鐘周期。所以 CPIA = 0.2 ´ 2 +

6、 0.80 ´ 1 = 1.2 1分則CPU性能為: 總CPU時(shí)間A = IC ´ 1.2 ´ 時(shí)鐘周期A 1分根據(jù)假設(shè),有: 時(shí)鐘周期B = 1.25 ´ 時(shí)鐘周期A 1分在CPUB中沒有獨(dú)立的比較指令,所以CPUB的程序量為CPUA的80%,分支指令的比例為: 20%/80% = 25% 2分這些分支指令占用2個(gè)時(shí)鐘周期,而剩下的75%的指令占用1個(gè)時(shí)鐘周期,因此: CPIB = 0.25 ´ 2 + 0.75 ´ 1 = 1.25 1分因?yàn)镃PUB不執(zhí)行比較,故: ICB = 0.8 ´ ICA因此CPUB性能為: 總

7、CPU時(shí)間B = ICB ´ CPIB ´ 時(shí)鐘周期B = 0.8 ´ ICA ´ 1.25 ´ (1.25 ´ 時(shí)鐘周期A) = 1.25 ´ ICA ´ 時(shí)鐘周期A 2分在這些假設(shè)之下,盡管CPUB執(zhí)行指令條數(shù)較少,CPUA因?yàn)橛兄痰臅r(shí)鐘周期,所以比CPUB快。如果CPUA的時(shí)鐘周期時(shí)間僅僅比CPUB快1.1倍,則 時(shí)鐘周期B = 1.10 ´ 時(shí)鐘周期ACPUB的性能為: 總CPU時(shí)間B = ICB ´ CPIB ´ 時(shí)鐘周期B = 0.8 ´ ICA ´

8、 1.25 ´ (1.10 ´ 時(shí)鐘周期A) = 1.10 ´ ICA ´ 時(shí)鐘周期A因此CPUB由于執(zhí)行更少指令條數(shù),比CPUA運(yùn)行更快。 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5842、題型:計(jì)算題3、難度級(jí)別:24、知識(shí)點(diǎn):一、計(jì)算機(jī)體系結(jié)構(gòu)的基本概念5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:CPU性能公式8、試題內(nèi)容:對(duì)于一臺(tái)400MHz計(jì)算機(jī)執(zhí)行標(biāo)準(zhǔn)測(cè)試程序,程序中指令類型,執(zhí)行數(shù)量和平均時(shí)鐘周期數(shù)如下:指令類型指令執(zhí)行數(shù)量平均時(shí)鐘周期數(shù)整數(shù)450001數(shù)據(jù)傳送750002浮點(diǎn)80004分支150

9、02求該計(jì)算機(jī)的有效CPI、MIPS和程序執(zhí)行時(shí)間。9、答案內(nèi)容:解: 1分 3分 3分 程序執(zhí)行時(shí)間=()400=575s 3分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5852、題型:計(jì)算題3、難度級(jí)別:24、知識(shí)點(diǎn):一、計(jì)算機(jī)體系結(jié)構(gòu)的基本概念5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:CPI8、試題內(nèi)容:假定要在一個(gè)時(shí)鐘速率為40MHz的標(biāo)量處理機(jī)上執(zhí)行20萬條目標(biāo)代碼指令的程序,該程序中含有4種主要類型指令,每種指令類型所占的比例及CPI數(shù)如圖所示。要求計(jì)算:(1)在單處理機(jī)上執(zhí)行該程序的平均CPI.(2)根據(jù)(1)所得到的CPI值,計(jì)算相應(yīng)的M

10、IPS速率。指令類型CPI指令所占比例ALU160%LOAD/STORE指令(Cache命中時(shí))418%Branch指令412%訪存指令(Cache 不合中時(shí))810%9、答案內(nèi)容:解:=CPIi ICi/IC=1 0.6+4 0.18+4 0.12+8 0.1=2.24 5分階段 5分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5892、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:1、假設(shè)一條指令的解釋分為取指、分析與執(zhí)行三個(gè)階段,每個(gè)階段所需時(shí)間為t取指、t分析、t執(zhí)行。(1)

11、寫出用下列幾種方式執(zhí)行100條指令所需的時(shí)間的通式:1)順序方式;2)僅"執(zhí)行k"、與"取指k+1"重疊;3)僅"執(zhí)行K"、"分析k+1"和"取指k+2"重疊。(2)當(dāng)t取指=t分析=2,t執(zhí)行=3以及t取指=t分析=4,t執(zhí)行=2時(shí),用上述通式計(jì)算所需時(shí)間。9、答案內(nèi)容:解:(1)以下是各方式執(zhí)行100條指令所需時(shí)間的通式:1)順序方式:100t=t取指i+t分析i+t執(zhí)行i i=1 =100t取指i+t分析i+t執(zhí)行i 2分2)“執(zhí)行i”與“取指k”重疊:100t=t取指1+ t分析i=1

12、100+maxt執(zhí)行i,t取指i +t執(zhí)行100 2分 i=23)僅“執(zhí)行k”、“分析K+1”與“取指K+2”重疊:t=t取指1+maxt分析1,t取指2100+maxt執(zhí)行i2,t分析i1,t取指ii=3+maxt分析100,t執(zhí)行99 2分+t執(zhí)行100(2)當(dāng)T取指=T分析=2,T執(zhí)行=3時(shí),用上述通式計(jì)算所需時(shí)間 3分1)T=100(2+2+3)=7002)T=2+2×100+3×99+3=5023)T=2+2+3×97+3+3=301當(dāng)T取指=T執(zhí)行=4,T分析=2時(shí),用上述通式計(jì)算所需時(shí)間為:1)T=100(4+2+4)=10002)T=4+2

13、5;100+4×99+4=6043)T=4+4+4×97+4+4=404 1分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5902、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:一個(gè)流水線由四段組成,其中每當(dāng)流經(jīng)第三段時(shí),總要在該段循環(huán)一次才能流到第四段。如果每段經(jīng)過一次的時(shí)間都是t,問:當(dāng)在流水線的輸入端每t時(shí)間輸入任務(wù)時(shí),該流水線會(huì)發(fā)生什么情況?此流水線的實(shí)際吞吐率為多少?如果每2t輸入一個(gè)任務(wù),連續(xù)處理10個(gè)任務(wù)的實(shí)際吞吐率和效率是多少?當(dāng)每段時(shí)間不變時(shí),如

14、何提高該流水線的吞吐率?仍連續(xù)處理10個(gè)任務(wù) 時(shí),其吞吐率提高多少?9、答案內(nèi)容:解:(1)會(huì)發(fā)生流水線阻塞情況。2分(2) 4分(3)重復(fù)設(shè)置部件 4分吞吐率提高倍數(shù)1.6410、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5912、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:有一條流水線如下所示。求連續(xù)輸入10條指令,該流水線的實(shí)際吞吐率和效率;該流水線的瓶頸在哪一段?請(qǐng)采取三種不同的措施消除此“瓶頸”。對(duì)于你所給出的新流水線,計(jì)算連續(xù)輸入10條指令時(shí),其實(shí)際吞吐率和效率。9、答案內(nèi)

15、容:解:(1) 3分(2)瓶頸在3、4段。l 變成八級(jí)流水線(細(xì)分) 3分l 變成兩級(jí)流水線(合并) 2分l 重復(fù)設(shè)置部件123-13-24-14-24-34-4 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。1、試題序號(hào):5932、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:一臺(tái)非流水處理器A的工作時(shí)鐘頻率為25MHz,它的平均CPI為4,處理器B是A的改進(jìn)型,它有一條5段的線性指令流水線。由于鎖定電路延遲及時(shí)鐘扭斜效應(yīng),它的工作時(shí)鐘頻率僅為20MHz。問:(1)若在A和B兩個(gè)處理器上執(zhí)行含有

16、100條指令的程序,則處理器B對(duì)A的加速比為多少?(2)在執(zhí)行上述程序時(shí),計(jì)算A、B處理器各自的MIPS速率為多少?9、答案內(nèi)容:解:(1)Ta=100*4/2.5E7=1.6E-5 秒 Tb=(5+100-1)×4/5)/2E7=4.16E-6 秒 Sp=Ta/tb=3.85 5分(2)MIPSa=100/1.6E-5=6.25MIPSMIPSb=100/4.16E-6=24.04MIPS 5分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5942、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:流

17、水線技術(shù)8、試題內(nèi)容:一個(gè)由4段構(gòu)成的雙輸入端的流水浮點(diǎn)加法器,每一段的延遲為10ns,輸出可直接返回到輸入端或把結(jié)果暫存到相應(yīng)緩沖寄存器中?,F(xiàn)若要將10個(gè)浮點(diǎn)數(shù)相加,問最少需用多少時(shí)間,要求畫出相應(yīng)的流水線工作的時(shí)空?qǐng)D。9、答案內(nèi)容:解:根據(jù)題意,畫出相應(yīng)流水線時(shí)空?qǐng)D: 6分所需最少時(shí)間:Tmin=17*10ns=170ns 4分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5952、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:8、試題內(nèi)容:若有一靜態(tài)多功能流水線分為6段,如圖所示,其中乘法流水線由1、2

18、、3、6段組成,加法流水線由1、4、5、6段組成,通過每段所需時(shí)間如圖所示。使用流水線時(shí),要等某種功能(如加法)操作都處理完畢后才能轉(zhuǎn)換成另種功能(如乘法)。若要計(jì)算:A×B=(a1+b1)×(a2+b2)×(a3+b3),問:(1)在上述流水方式下,完成A×B需要多少時(shí)間?畫出時(shí)空?qǐng)D并計(jì)算此流水線的使用效率和吞吐率。(2)與順序運(yùn)算方式相比,加速比為多少?9、答案內(nèi)容:解:根據(jù)題意,畫出的時(shí)空?qǐng)D為: 6分(1)T=26吞吐率:Tp=5/26效率:E=(2*17)/(26*6)=21.79% 3分(2)加速比:Sp=Tl/Tk=(6*3+8*2)/26=

19、1.31 1分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5962、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:在如下圖所示的靜態(tài)流水線上計(jì)算,流水線的輸出可以直接返回輸入端或暫存于相應(yīng)于的流水線寄存器中,試計(jì)算其吞吐率,加速比,效率。9、答案內(nèi)容:解:該題解題步驟為:(1) 確定適合于流水處理的計(jì)算過程。(2) 畫時(shí)空?qǐng)D(3) 計(jì)算性能 (1) 確定適合于流水處理的計(jì)算過程為:3分(2)根據(jù)所確定的計(jì)算過程,畫出時(shí)空?qǐng)D 4分(3) 根據(jù)時(shí)空?qǐng)D和流水線性能公式,計(jì)算性能 3分故:吞

20、吐率 TP7(20t) 加速比 S(34t)(20t)1.7效率 E(4×43×6)(8×20)0.2110、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5972、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):三、流水線技術(shù)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:流水線技術(shù)8、試題內(nèi)容:假設(shè)各種分支所占指令數(shù)地百分比如下表所示:條件分支20(其中60是成功的)跳轉(zhuǎn)和調(diào)用5現(xiàn)有一深度為4地流水線(流水線有4段),無條件分支在第二個(gè)時(shí)鐘周期結(jié)束時(shí)就被解析出來,而條件分支要到第三個(gè)時(shí)鐘周期結(jié)束時(shí)才能被解析出來。第一個(gè)流水段是完全獨(dú)立于指令類型

21、的,即所有的指令都必須經(jīng)過第一個(gè)流水段的處理。請(qǐng)問在沒有任何結(jié)構(gòu)相關(guān)地情況下,該流水線相對(duì)于存在上述結(jié)構(gòu)相關(guān)情況下地加速比是多少?9、答案內(nèi)容:解:在不存在結(jié)構(gòu)相關(guān)時(shí),每條指令的平均執(zhí)行時(shí)間是1個(gè)時(shí)鐘周期,而存在上述條件相關(guān)的情況下,并假設(shè)條件分支預(yù)測(cè)成功,那么無條件分支和成功的條件分支的等待時(shí)間都是1,而不成功地條件分支等待時(shí)間是2個(gè)周期;所以加速比就等于存在相關(guān)的每條指令的平均執(zhí)行時(shí)間和不存在相關(guān)的每條指令的執(zhí)行時(shí)間1的比值: 4分每條指令的平均等待時(shí)間: 4分所以: 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5982、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)

22、點(diǎn):3.5向量處理機(jī)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:向量處理機(jī)8、試題內(nèi)容:CRAY-1機(jī)器上,按照鏈接方式執(zhí)行下述4條向量指令(括號(hào)中給出了相應(yīng)功能部件的時(shí)間),如果向量寄存器和功能部件之間數(shù)據(jù)傳輸需要1拍,試求此鏈接流水線的通過時(shí)間是多少拍?如果向量長(zhǎng)度為64,則需要多少拍才能得到全部結(jié)果。V0存儲(chǔ)器(從存儲(chǔ)器中取數(shù):7拍)V2V0V1(向量加:3拍)V2V2 < A3(按(A3)左移:4拍)V5V3V4(向量邏輯乘:2拍)9、答案內(nèi)容:解:通過時(shí)間就是每條向量指令的第一個(gè)操作數(shù)執(zhí)行完畢需要的時(shí)間,也就是各功能流水線由空到滿的時(shí)間,具體過程如下圖所示。要得到全部結(jié)

23、果,在流水線充滿之后,向量中后繼操作數(shù)繼續(xù)以流水方式執(zhí)行,直到整組向量執(zhí)行完畢。 2分 6分2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):5992、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):3.5向量處理機(jī)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:向量處理機(jī)8、試題內(nèi)容:向量處理機(jī)有16個(gè)向量寄存器,其中V0V5中分別存放有向量A、B、C、D、E、F,向量長(zhǎng)度均為12,向量各元素均為浮點(diǎn)數(shù);處理部件采用兩個(gè)單功能流水線,加法功能部件時(shí)間為2拍,乘法功能部件時(shí)間為3拍。采用類似CRAY-1的鏈接技術(shù),先計(jì)算(AB)*C,在流水線不停留的情況下,接著計(jì)算(DE

24、)*F。(1) 求此鏈接流水線的通過時(shí)間為多少拍?(設(shè)寄存器入、出各需1拍)假如每拍時(shí)間為50ns,完成這些計(jì)算并把結(jié)果存進(jìn)相應(yīng)寄存器,此處理部件地實(shí)際吞吐率為多少M(fèi)FLOPS?9、答案內(nèi)容:解:(1)我們?cè)谶@里假設(shè)AB的中間結(jié)果放在V6中,(AB)*C地最后結(jié)果放在V7中,DE地中間結(jié)果放在V8中,(DE)*F的最后結(jié)果放在V9中。具體實(shí)現(xiàn)參考下圖:通過時(shí)間應(yīng)該為前者(AB)*C)通過的時(shí)間:T通過= (1+2+1)+(1+3+1) =9(拍) 2分(2)在做完(AB)*C之后,作(CD)*E就不需要通過時(shí)間了。4分 4分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào)

25、:6002、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):四、指令級(jí)并行5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:指令調(diào)度8、試題內(nèi)容:對(duì)于下面的源代碼,轉(zhuǎn)換成DLX匯編語言,在不進(jìn)行指令調(diào)度和進(jìn)行指令調(diào)度兩種情況下,分析代碼一次循環(huán)的執(zhí)行時(shí)間。for (i=1; i<=1000; i+) xi=xi + s;假設(shè):x0 的內(nèi)存地址為 0 (為簡(jiǎn)單起見),R1的初值為x1000的地址,F(xiàn)2中存放的值為常量s。DLX浮點(diǎn)流水線的延遲如下表:產(chǎn)生結(jié)果指令使用結(jié)果指令延遲時(shí)鐘周期數(shù)浮點(diǎn)計(jì)算另外的浮點(diǎn)計(jì)算3浮點(diǎn)計(jì)算浮點(diǎn)數(shù)據(jù)存操作(SD)2浮點(diǎn)數(shù)據(jù)取操作(LD)浮點(diǎn)計(jì)算1浮點(diǎn)數(shù)據(jù)取操作(LD)

26、浮點(diǎn)數(shù)據(jù)存操作(SD)09、答案內(nèi)容:解:不進(jìn)行指令調(diào)度的情況下,根據(jù)表中所給浮點(diǎn)流水線中指令執(zhí)行的延遲,實(shí)際運(yùn)行: (1)LOOP:LDF0,0(R1)(2)(空轉(zhuǎn))(3)ADDDF4,F0,F2(4)(空轉(zhuǎn))(5)(空轉(zhuǎn))(6)SD0(R1),F4(7)SUBIR1,R1,#8(8)(空轉(zhuǎn))(9)BNEZR1,LOOP(10)(空轉(zhuǎn))一共 10 個(gè)時(shí)鐘周期,其中有5個(gè)是空轉(zhuǎn)周期。 4分指令調(diào)度:(1)LOOP:LDF0,0(R1)(2)(空轉(zhuǎn))(3)ADDDF4,F0,F2(4)SUBIR1,R1,#8(5)BNEZR1,LOOP(6)SD8(R1),F4一共 6 個(gè)時(shí)鐘周期,其中有 1

27、個(gè)空轉(zhuǎn)周期。 4分經(jīng)過指令調(diào)度,一個(gè)元素的操作時(shí)間從10個(gè)時(shí)鐘周期減少到6個(gè)時(shí)鐘周期,其中5個(gè)周期是有指令執(zhí)行的,只剩下一個(gè)空轉(zhuǎn)周期。 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6012、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):5.2 Cache基本知識(shí)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:Cache基本知識(shí)8、試題內(nèi)容:VAX-11/780在Cache命中時(shí)的指令平均執(zhí)行時(shí)間是8.5時(shí)鐘周期,Cache失效時(shí)間是6個(gè)時(shí)鐘周期,假設(shè)不命中率是11%,每條指令平均訪存3次。(1)試計(jì)算在考慮了Cache不命中時(shí)的指令平均間,它比Cache命中時(shí)平均

28、執(zhí)行時(shí)間延長(zhǎng)百分之幾?(2)若CPU在Cache命中時(shí)的指令平均執(zhí)行時(shí)間是1.5時(shí)鐘周期,其他條件一樣,結(jié)果如何?從結(jié)果的比較可看出什么問題?9、答案內(nèi)容:解:(1)已知:Tie=8.5 Tm=6 1-Hc=0.11 在Cache命中時(shí),每條指令的訪存時(shí)間是: Tca=3Tc=3 (Tc為平均訪問Cache時(shí)間,一般為1個(gè)時(shí)鐘周期) 2分而在考慮Cache不命中時(shí),每條指令的訪存時(shí)間為:Tcb=3(0.89Tc+0.11×6)=2.67+1.98=4.65因指令執(zhí)行的其他時(shí)間相同,所以Ti=8.5-3+4.65=10.15(10.15-8.5)/8.5=0.194=19.4% 3分(

29、2)根據(jù)題意,Tie=1.5則當(dāng)考慮Cache不命中時(shí),每條指令的平均執(zhí)行時(shí)間為:Ti=1.5-3+4.65=3.15(3.15-1.5)/3.15=0.524=52.4% 3分由比較結(jié)果可以看出,在速度較高的系統(tǒng)中,Cache的命中率對(duì)指令的執(zhí)行速度有較大的影響,從而影響到整個(gè)系統(tǒng)的性能,因此,提高Cache的命中率,降低平均訪存時(shí)間,對(duì)提高系統(tǒng)的性能有著重要作用。 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6022、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):5.2 Cache基本知識(shí)5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:存儲(chǔ)層次8、試題內(nèi)容:有

30、一個(gè)"Cache-主存"存儲(chǔ)層次,主存共分8個(gè)塊(07),Cache分為4個(gè)塊(03),采用組相聯(lián)映象,組內(nèi)塊數(shù)為2塊,替換算法為近期最少使用法(LRU)。(1)畫出主存、Cache存儲(chǔ)器地址的各字段對(duì)應(yīng)關(guān)系;(2)對(duì)于如下主存塊地址流:1、2、4、1、3、7、0、1、2、5、4、6、4、7、2,如主存中內(nèi)空一開始未裝入Cache中,請(qǐng)列出隨時(shí)間變化Cache中各塊的使用情況。;(3)對(duì)于(2),指出塊失效又發(fā)生塊爭(zhēng)用時(shí)刻。(4)對(duì)于(23),求出此間的Cache命中率。9、答案內(nèi)容:解:(1)見下表: 3分nd區(qū)號(hào)q'組號(hào)s'塊號(hào)1位1位1位nmr(塊內(nèi)地

31、址)1位1位ncr(塊內(nèi)地址)qs (2)如下表: 3分訪問順序123456789101112131415地址塊號(hào)124137012546472Cache中塊分配情況111111111144444 - - 4444000555555 - 22227777776662 - - - - 33332222277操作狀態(tài)調(diào)進(jìn)調(diào)進(jìn)調(diào)進(jìn)命中調(diào)進(jìn)替換替換命中替換替換替換替換命中替換替換(3)在第14和15次訪問塊時(shí)產(chǎn)生塊失效又發(fā)生塊爭(zhēng)用現(xiàn)象。 2分(4)命中率:Hc=3/15=20% 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6032、題型:計(jì)

32、算題3、難度級(jí)別:34、知識(shí)點(diǎn):五、存儲(chǔ)層次5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:平均訪存時(shí)間8、試題內(nèi)容:假設(shè)Cache的命中時(shí)間為1個(gè)時(shí)鐘周期,失效開銷為50 個(gè)時(shí)鐘周期,在混合Cache中一次load或store操作訪問Cache的命中時(shí)間都要增加一個(gè)時(shí)鐘周期(因?yàn)榛旌螩ache只有一個(gè)端口,無法同時(shí)滿足兩個(gè)請(qǐng)求,混合Cache會(huì)導(dǎo)致結(jié)構(gòu)沖突),根據(jù)下表所列的失效率,試問指令Cache和數(shù)據(jù)Cache容量均為16KB的分離Cache和容量為32KB的混合Cache相比,哪種Cache的失效率更低?又假設(shè)采用寫直達(dá)策略,且有一個(gè)寫緩沖器,并且忽略寫緩沖器引起的等待。請(qǐng)問上述兩

33、種情況下平均訪存時(shí)間各是多少?表1 指令Cache、數(shù)據(jù)Cache和混合Cache失效率的比較容 量指令 Cache數(shù)據(jù) Cache混合 Cache1 KB3.06%24.61%13.34%2 KB2.26%20.57%9.78%4 KB1.78%15.94%7.24%8 KB1.10%10.19%4.57%16 KB0.64%6.47%2.87%32 KB0.39%4.82%1.99%64 KB0.15%3.77%1.36%128 KB0.02%2.88%0.95%9、答案內(nèi)容:解: 如前所述,約75%的訪存為取指令。因此,分離Cache的總體失效率為: (75%×0.64%)(2

34、5%×6.47%)2.10% 2分 根據(jù)表1容量為32KB的混合Cache的失效率略低一些,只有1.99%。 1分平均訪存時(shí)間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分:平均訪存時(shí)間指令所占的百分比× (指令命中時(shí)間指令失效率×失效開銷)數(shù)據(jù)所占的百分比× (數(shù)據(jù)命中時(shí)間數(shù)據(jù)失效率×失效開銷) 2分所以,兩種結(jié)構(gòu)的平均訪存時(shí)間分別為:平均訪存時(shí)間分離75%×(10.64%×50)25%×(16.47%×50) (75%×1.32)(25%×4.325)0.9901.0592.05 2分平均訪

35、存時(shí)間混合75%×(11.99%×50)25%×(111.99%×50) (75%×1.995)(25%×2.995)1.4960.7492.24 2分故,盡管分離Cache的實(shí)際失效率比混合Cache的高,但其平均訪存時(shí)間反而較低。 1分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6042、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):五、存儲(chǔ)層次5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:Cache失效開銷8、試題內(nèi)容:假設(shè)Cache失效開銷為50個(gè)時(shí)鐘周期,當(dāng)不考慮存儲(chǔ)器停頓時(shí),所有指令的執(zhí)行時(shí)間都

36、是2.0個(gè)時(shí)鐘周期, Cache的失效率為2%,平均每條指令訪存1.33次。試分析Cache對(duì)性能的影響。9、答案內(nèi)容:解:CPU 時(shí)間IC×(CPIexe存儲(chǔ)器停頓周期數(shù)/指令數(shù))×時(shí)鐘周期時(shí)間 2分考慮Cache的失效后,性能為:CPU 時(shí)間有cacheIC×(2.0(1.33×2%×50)×時(shí)鐘周期時(shí)間 IC×3.33×時(shí)鐘周期時(shí)間 4分實(shí)際CPI :3.333.33/2.0 = 1.67(倍) 2分CPU時(shí)間也增加為原來的1.67倍。但若不采用Cache,則: CPI2.0+50×1.3368.5

37、 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6052、題型:計(jì)算題3、難度級(jí)別:44、知識(shí)點(diǎn):五、存儲(chǔ)層次5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:CPU性能8、試題內(nèi)容:考慮兩種不同組織結(jié)構(gòu)的Cache:直接映象Cache和兩路組相聯(lián)Cache,試問它們對(duì)CPU的性能有何影響?先求平均訪存時(shí)間,然后再計(jì)算CPU性能。分析時(shí)請(qǐng)用以下假設(shè):理想Cache(命中率為100)情況下的CPI為2.0,時(shí)鐘周期為2ns,平均每條指令訪存1.3次。兩種Cache容量均為64KB,塊大小都是32字節(jié)。在兩路組相聯(lián)Cache中,我們必須增加一個(gè)多路選擇器,用于根據(jù)標(biāo)

38、識(shí)匹配結(jié)果從相應(yīng)組的塊中選擇所需的數(shù)據(jù)。因?yàn)镃PU的速度直接與Cache命中的速度緊密相關(guān),所以對(duì)于組相聯(lián)Cache,由于多路選擇器的存在而使CPU的時(shí)鐘周期增加到原來的1.10倍。這兩種結(jié)構(gòu)Cache的失效開銷都是70ns。在實(shí)際應(yīng)用中,應(yīng)取整為整數(shù)個(gè)時(shí)鐘周期。 命中時(shí)間為1個(gè)時(shí)鐘周期,64KB直接映象Cache的失效率為1.4%,相同容量的兩路組相聯(lián)Cache的失效率為1.0%。9、答案內(nèi)容:解:由:平均訪存時(shí)間命中時(shí)間失效率×失效開銷 1分 得:平均訪存時(shí)間1路2.0(0.014×70)2.98ns平均訪存時(shí)間2路2.0×1.10(0.010×70

39、)2.90ns 2分兩路級(jí)相聯(lián)Cache的平均訪存時(shí)間比較低。 1分由:CPU 時(shí)間IC×(CPIexe每條指令的平均存儲(chǔ)器停頓周期數(shù))×時(shí)鐘周期時(shí)間 IC ×(CPIexe×時(shí)鐘周期時(shí)間每條指令的平均存儲(chǔ)器停頓時(shí)間) 3分得:CPU時(shí)間1路IC×(2.0×2(1.3×0.014×70)5.27×ICCPU時(shí)間2路IC×(2.0×2×1.10(1.3×0.010×70)5.31×IC 2分相對(duì)性能比為:CPU時(shí)間2路/CPU時(shí)間1路=5.31&#

40、215;IC/5.27×IC=1.01 1分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6062、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):五、存儲(chǔ)層次5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:存儲(chǔ)器性能8、試題內(nèi)容:給定以下的假設(shè),試計(jì)算直接映象Cache和兩路組相聯(lián)Cache的平均訪問時(shí)間以及CPU的性能。由計(jì)算結(jié)果能得出什么結(jié)論?(1) 理想Cache情況下的CPI為2.0,時(shí)鐘周期為2ns,平均每條指令訪存1.2次;(2) 兩者Cache容量均為64KB,塊大小都是32字節(jié);(3) 組相聯(lián)Cache中的多路選擇器使CPU的時(shí)鐘周期增加了10

41、;(4) 這兩種Cache的失效開銷都是80ns;(5) 命中時(shí)間為1個(gè)時(shí)鐘周期;(6) 64KB直接映象Cache的失效率為1.4,64KB兩路組相聯(lián)Cache的失效率為10。9、答案內(nèi)容:解: 平均訪問時(shí)間命中時(shí)間失效率×失效開銷 1分平均訪問時(shí)間1-路=2.0+1.4% *80=3.12ns平均訪問時(shí)間2-路=2.0*(1+10%)+1.0% *80=3.0ns兩路組相聯(lián)的平均訪問時(shí)間比較低。 3分CPUtime=(CPU執(zhí)行+存儲(chǔ)等待周期)*時(shí)鐘周期CPU time=IC(CPI執(zhí)行+總失效次數(shù)/指令總數(shù)*失效開銷) *時(shí)鐘周期=IC(CPI執(zhí)行*時(shí)鐘周期)+(每條指令的訪存

42、次數(shù)*失效率*失效開銷*時(shí)鐘周期) 2分CPU time 1-way=IC(2.0*2+1.2*0.014*80)5.344ICCPU time 2-way=IC(2.2*2+1.2*0.01*80)5.36IC 2分相對(duì)性能比:5.36/5.344=1.003 1分直接映象cache的訪問速度比兩路組相聯(lián)cache要快1.04倍,而兩路組相聯(lián)Cache的平均性能比直接映象cache要高1.003倍。因此這里選擇兩路組相聯(lián)。 1分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6072、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):五、存儲(chǔ)層次5、分值:106、所需時(shí)間:15

43、分鐘7、試題關(guān)鍵字:cache性能8、試題內(nèi)容:假設(shè)一臺(tái)計(jì)算機(jī)具有以下特性:(1) 95的訪存在Cache中命中;(2) 塊大小為兩個(gè)字,且失效時(shí)整個(gè)塊被調(diào)入;(3) CPU發(fā)出訪存請(qǐng)求的速率為109字/秒;(4) 25的訪存為寫訪問;(5) 存儲(chǔ)器的最大流量為109字/秒(包括讀和寫);(6) 主存每次只能讀或?qū)懸粋€(gè)字;(7) 在任何時(shí)候,Cache中 有30的塊被修改過;(8) 寫失效時(shí),Cache采用寫分配法?,F(xiàn)欲給計(jì)算機(jī)增添一臺(tái)外設(shè),為此想先知道主存的頻帶已經(jīng)使用了多少。試對(duì)于以下兩種情況計(jì)算主存頻帶的平均使用比例。(1) 寫直達(dá)Cache;(2) 寫回法Cache。9、答案內(nèi)容:解:

44、采用按寫分配(1)寫直達(dá)cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,更新cache和主存,訪問主存一次。訪問失效,有兩種情況:讀失效,將主存中的塊調(diào)入cache中,訪問主存兩次;寫失效,將要寫的塊調(diào)入cache,訪問主存兩次,再將修改的數(shù)據(jù)寫入cache和主存,訪問主存一次,共三次。上述分析如下表所示。3分訪問命中訪問類型頻 率訪存次數(shù)Y讀95%*75%=71.3%0Y寫95%*25%=23.8%1N讀5%*75%=3.8%2N寫5%*25%=1.3%3一次訪存請(qǐng)求最后真正的平均訪存次數(shù)=(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)0.35已用帶寬

45、=0.35×109/10 9 =35.0% 2分(2)寫回法cache訪問命中,有兩種情況:讀命中,不訪問主存;寫命中,不訪問主存。采用寫回法,只有當(dāng)修改的cache塊被換出時(shí),才寫入主存;訪問失效,有一個(gè)塊將被換出,這也有兩種情況:如果被替換的塊沒有修改過,將主存中的塊調(diào)入cache塊中,訪問主存兩次;如果被替換的塊修改過,則首先將修改的塊寫入主存,需要訪問主存兩次;然后將主存中的塊調(diào)入cache塊中,需要訪問主存兩次,共四次訪問主存。3分訪問命中塊為臟頻 率訪存次數(shù)YN95%*70%=66.5%0YY95%*30%=28.5%0NN5%*70%=3.5%2NY5%*30%=1.5

46、%4所以:一次訪存請(qǐng)求最后真正的平均訪存次數(shù)=66.5*028.5%*0+3.5%*2+1.5%*4=0.13已用帶寬0.13×10 9/10 913% 2分10、評(píng)分細(xì)則:10分/小題,評(píng)分細(xì)則分布在答案內(nèi)容中。-1、試題序號(hào):6082、題型:計(jì)算題3、難度級(jí)別:34、知識(shí)點(diǎn):五、存儲(chǔ)層次5、分值:106、所需時(shí)間:15分鐘7、試題關(guān)鍵字:cache性能8、試題內(nèi)容:偽相聯(lián)中,假設(shè)在直接映象位置沒有發(fā)現(xiàn)匹配,而在另一個(gè)位置才找到數(shù)據(jù)(偽命中)時(shí),需要1個(gè)額外的周期,而且不交換兩個(gè)Cache中的數(shù)據(jù),失效開銷為50個(gè)時(shí)鐘周期。試求:(1) 推導(dǎo)出平均訪存的時(shí)間公式。(2) 利用(1)

47、中得到的公式,對(duì)于2KBCache和128KBCache,重新計(jì)算偽相聯(lián)的平均訪存時(shí)間。請(qǐng)問哪一種偽相聯(lián)更快?假設(shè) 2KB直接映象Cache的總失效率為0.098,2路相聯(lián)的總失效率為0.076;128KB直接映象Cache的總失效率為0.010,2路相聯(lián)的總失效率為0.007。9、答案內(nèi)容:解:不管作了何種改進(jìn),失效開銷相同。不管是否交換內(nèi)容,在同一“偽相聯(lián)”組中的兩塊都是用同一個(gè)索引得到的,因此失效率相同,即:失效率偽相聯(lián)失效率2路。1分偽相聯(lián)cache的命中時(shí)間等于直接映象cache的命中時(shí)間加上偽相聯(lián)查找過程中的命中時(shí)間*該命中所需的額外開銷。命中時(shí)間偽相聯(lián)命中時(shí)間1路偽命中率偽相聯(lián)×1 2分交換或不交換內(nèi)容,偽相聯(lián)的命中率都是由于在第一次失效時(shí),將地址取反,再在第二次查找?guī)淼?。因?偽命中率偽相聯(lián)命中率2路命中率1路(1失效率2路)(1失效率1路)失效率1路失效率2路。交換內(nèi)容需要增加偽相聯(lián)的額外開銷。2分平均訪存時(shí)間偽相聯(lián)命中時(shí)間1路(失效率1路失效率2路)×1失效率2路×失效開銷1路 2分將題設(shè)中的數(shù)據(jù)帶入計(jì)算,得到:平均訪存時(shí)間2Kb=1+(0.098-0.076)*1+(0.076 *50 ) =4.822平均訪存時(shí)間128Kb=1+(0.010-0.007)*1+(0.007 *50 ) =1.353 2分顯然是128

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論