高等計算機系統(tǒng)結(jié)構(gòu)習(xí)題_第1頁
高等計算機系統(tǒng)結(jié)構(gòu)習(xí)題_第2頁
高等計算機系統(tǒng)結(jié)構(gòu)習(xí)題_第3頁
高等計算機系統(tǒng)結(jié)構(gòu)習(xí)題_第4頁
高等計算機系統(tǒng)結(jié)構(gòu)習(xí)題_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1、解釋下列術(shù)語計算機系統(tǒng)結(jié)構(gòu)計算機組成計算機實現(xiàn)【答案】計算機系統(tǒng)結(jié)構(gòu)、計算機組成和計算機實現(xiàn)是三個不同的概念。系統(tǒng)結(jié)構(gòu)定義為由程序設(shè)計者所看到的一個計算機系統(tǒng)的屬性,即概念性結(jié)構(gòu)和功能特性,這里的程序設(shè)計者是指為機器語言或編譯程序設(shè)計者所看到的計算機屬性,是硬件子系統(tǒng)的概念結(jié)構(gòu)及其功能特性,它是計算機系統(tǒng)的軟、硬件的界面。計算機組成是計算機系統(tǒng)結(jié)構(gòu)的邏輯實現(xiàn),包括機器內(nèi)部的數(shù)據(jù)流和控制流的組成以及邏輯設(shè)計等。計算機實現(xiàn)是指計算機組成的物理實現(xiàn)。2、解釋下列術(shù)語系列機兼容機模擬仿真【答案】所謂系列機是指在一個廠家內(nèi)生產(chǎn)的具有相同的系統(tǒng)結(jié)構(gòu),但具有不同組成和實現(xiàn)的一系列不同型號的機器。不同公司

2、廠家生產(chǎn)的具有相同系統(tǒng)結(jié)構(gòu)的計算機成為兼容機。系列機方法能夠在具有相同系統(tǒng)結(jié)構(gòu)的各種機器之間實現(xiàn)軟件移植,為了實現(xiàn)軟件在不同系統(tǒng)結(jié)構(gòu)的機器之間的相互移植,可以采用模擬和仿真。模擬方法是指用軟件方法在一臺現(xiàn)有的計算機上實現(xiàn)另一臺計算機的指令系統(tǒng)。仿真是指用微程序直接解釋另一種機器指令系統(tǒng)的方法。3、SIMD是指()A、單指令流單數(shù)據(jù)流B、單指令流多數(shù)據(jù)流C、多指令流單數(shù)據(jù)流D、多指令流多數(shù)據(jù)流【答案】B4、從執(zhí)行程序的角度看,并行性等級可分為哪些?【答案】指令內(nèi)部并行、指令級并行、任務(wù)級或過程級并行、作業(yè)或程序級并行5、名詞解釋Amdahl定律、CPI【答案】Amdahl定律:系統(tǒng)中某一部件由于

3、采用某種更快的執(zhí)行方式后整個系統(tǒng)性能的提高與這種執(zhí)行方式的使用頻率或占總執(zhí)行時間的比例有關(guān)oFe=(改進(jìn)前可改進(jìn)部分占用的時間)/ (改進(jìn)前整個任務(wù)的執(zhí)行時間)Se=(改進(jìn)前可改進(jìn)部分的執(zhí)行時間)/ (改進(jìn)后改進(jìn)部分的執(zhí)行時間)則,改進(jìn)后整個系統(tǒng)加速比為Sn =(1 -Fe)Fe/Se每條指令平均時鐘周期數(shù)nCPI=CPU時鐘周期數(shù)/IC(指令的條數(shù))=£(CPIii1其中Ii=指令i在程序中執(zhí)行的次數(shù)6、名詞解釋MIPS、MFLOPS喀案IMIPS=執(zhí)*'X06=fMFLOPS=程序中的浮點操作次數(shù)執(zhí)行時間1067、按照計算機系統(tǒng)層次結(jié)構(gòu),算術(shù)運算、邏輯運算和移位等指令應(yīng)屬

4、于()級機器語言。A、傳統(tǒng)機器語言機器B、操作系統(tǒng)機器C、匯編語言機器D、高級語言機器【答案】B8、按照Flynn分類法,多處理機屬于()。A、SISDB、SIMDC、MISDD、MIMD【答案】D9、按照Amdahl定律,假設(shè)將某系統(tǒng)的某一部件的處理速度加快到原來的5倍,但該部件的原處理時間僅為整個運行時間的20%,則采用加快措施后能使整個系統(tǒng)的性能提高到原來的()倍。A、1/0.36B、1/0.24C、1/0.45D、1/0.84【答案】D10、對計算機系統(tǒng)結(jié)構(gòu),下列()是透明的。A、浮點數(shù)據(jù)表示B、程序性中斷C、訪問方式保護(hù)D、陣列運算部件【答案】D11、對匯編語言程序員,下列()不是透

5、明的。A、中斷字寄存器B、乘法器C、移位器D、指令緩沖器【答案】A12、下列()兼容方式對系列機來說是必須做到的。D 、向下兼容A、向前兼容B、向后兼容C、向上兼容13、如果某一個計算任務(wù)用向量方式求解比用標(biāo)量方式求解要快10倍,稱可用向量方式求解部分所花費時間占總時間的百分比為可向量化百分比。請畫出加速比與可向量化比例兩者關(guān)系的曲線,并回答加速比為2和5時,可向量化百分比分別為多少。【答案】解:設(shè)可向量化百分比為x,加速比為y根據(jù)Amdahl定律,有11y=0圖略1_xx1-0.9x10(1-1)5則,x=y/Qg。y=2時,x=55.6%9一.8y=5時,x=88.9%914、用一臺433

6、MHz的處理器執(zhí)行標(biāo)準(zhǔn)測試程序,它包含的各類指令和相應(yīng)的時鐘周期數(shù)如下表,求有效CPI、MIPS速率和程序的執(zhí)行時間指令類型指令數(shù)時鐘周期數(shù)整數(shù)運算500001數(shù)據(jù)傳送350002浮點運算120002控制傳送70002【答案】一/Ii解:CPI='(CPIi*)vIC二(50000*1+35000*2+12000*2+7000*2)/(50000+35000+12000+7000)=1.52周期/指令MIPS=f/(CPI*106)=433*106/(1.52*106)=285MIPS執(zhí)行時間t=(50000*1+35000*2+12000*2+7000*2)/(433*106)=3.

7、649*10$s15、假設(shè)對A機器指令系統(tǒng)的每條指令的解釋執(zhí)行可直接由B機器的一段微程序解釋執(zhí)行,則A稱為()。A、仿真機B、宿主機C、虛擬機D、目標(biāo)機【答案】D16、假設(shè)用軟件方法在A計算機上實現(xiàn)B計算機的指令系統(tǒng),則B稱為()。A、仿真機B、宿主機C、虛擬機D、目標(biāo)機【答案】C17、在計算機系統(tǒng)層次結(jié)構(gòu)圖中,卜列四個級別機器由下到上應(yīng)按()排列:(1)、匯編語百機器(3)、傳統(tǒng)機器語言機器A、(2) (3) (4) (1)(2)、微程序控制機器(4)、操作系統(tǒng)機器B、(2) (4) (3) (1)C、 (3) (2) (1) (4)D、 (1) (2) (3) (4)18 、在計算機系統(tǒng)設(shè)

8、計的方法中,“由中間開始”設(shè)計方法通常把“中間”取在()。A、傳統(tǒng)機器級和操作系統(tǒng)機器級之間B、操作系統(tǒng)機器級和匯編語言機器級之間C、傳統(tǒng)機器級和匯編語言機器級之間D、微程序控制機器級和傳統(tǒng)機器級之間【答案】A19 、在系列機的軟件兼容中,按某檔機器編制的程序,不加修改就能運行于比它高檔的機器,叫做()。A、向下兼容B、向上兼容C、向前兼容D、向后兼容【答案】B20 、什么是訪問的局部性原理,有哪兩種,分別是什么?【答案】局部性原理是指根據(jù)程序的最近情況,可以較精確地預(yù)測出最近地將來將要用到哪些指令和數(shù)據(jù)。局部性分為時間上的局部性和空間上的局部性。時間上的局部性是指最近訪問過的代碼是不久將被訪

9、問的代碼。空間上的局部性是指那些地址上相鄰近的代碼可能會被一起訪問。21 、用于科學(xué)計算的計算機中,標(biāo)志系統(tǒng)性能的主要參數(shù)是()。A、提高CPU主頻B、擴(kuò)大主存容量C、采用非馮.諾依曼結(jié)構(gòu)D、采用并行處理技術(shù)【答案】A22、下列體系結(jié)構(gòu)中,最適合多個任務(wù)并行執(zhí)行的體系結(jié)構(gòu)是()。A、流水線向量機結(jié)構(gòu)B、堆棧處理機結(jié)構(gòu)C、共享存儲多處理機結(jié)構(gòu)D、分布存儲多計算機結(jié)構(gòu)【答案】C23、對計算機系統(tǒng)結(jié)構(gòu)按照Handler法分類,PEPE表示為t(ILLIACIV尸(1,64,64),則在Flynn分類法中,它屬于()。A、SISDB、SIMDC、MISDD、MIMD【答案】B24、在馮諾依曼計算機特征

10、中,機器以()為中心。A、存儲器B、輸入輸出設(shè)備C、運算器D、控制器【答案】C25、如果有一個經(jīng)解釋實現(xiàn)地計算機,可以按功能劃分為3級。每一級為了執(zhí)行一條指令需要下一級的M條指令解釋。若執(zhí)行第一級的一條指令需要Kns的時間,那么執(zhí)行第三級的一條指令需要用()ns時間。A、KMB、K2MC、KM3D、KM2【答案】D26 、從用戶的觀點看,評價計算機系統(tǒng)性能的綜合參數(shù)是()。A、指令系統(tǒng)B、吞吐率C、主存容量D、主頻率【答案】B27 、主頻為400MHz的微處理機,平均每條指令的執(zhí)行時間為兩個機器周期,每個機器周期由兩個時鐘脈沖組成,則當(dāng)存儲器為“零等待”時,機器運行速度為()MIPS。A、10

11、0B、200C、300D、400【答案】A所運行的程序應(yīng)具有的特性是()28、為使虛存系統(tǒng)有效地發(fā)揮其預(yù)期的作用,A、該程序不應(yīng)含有過多的I/O操作B、該程序的大小不應(yīng)該超過實際的內(nèi)存容量C、該程序應(yīng)具有較好的局部性D、該程序的指令相關(guān)不應(yīng)過多【答案】C29 、下列哪個方法不能提高并行性?A、時間重疊B、資源重復(fù)C、資源共享D、分布存儲【答案】D30 、在采用基準(zhǔn)測試程序來測試評價機器的性能時,下列方法按照評價準(zhǔn)確性遞增的順序排列是()。( 1) 、實際的應(yīng)用程序方法( 2) 、核心程序方法( 3) 、玩具基準(zhǔn)測試程序(小測試程序)( 4) 、綜合基準(zhǔn)測試程序A、(1)(2)(3)(4)B、(

12、2)(3)(4)(1)C、(3)(4)(1)(2)D、(4)(3)(2)(1)【答案】D31、每秒百萬指令條數(shù)為()。A、ICB、CPIC、MIPSD、MFLOPS【答案】C32 、軟件和硬件在()意義上是等效的。A、系統(tǒng)結(jié)構(gòu)B、功能C、性能D、價格【答案】B33 、機器工作狀態(tài)的定義和切換對()來說是透明的。A、操作系統(tǒng)操作員B、機器語言程序員C、邏輯設(shè)計員D、硬件維護(hù)員設(shè)計員【答案】A34、某臺計算機只有Load/Store指令能對存儲器進(jìn)行讀/寫操作,其它指令只對寄存器進(jìn)行操作。根據(jù)程序跟蹤實驗結(jié)果,已知每種指令所占的比例及CPI數(shù)如下:指令類型指令所占比例CPI算邏指令Load指令St

13、ore指令轉(zhuǎn)移指令43%21%12%24%(1)求上述情況下的平均CPI(2)假設(shè)程序由M條指令組成。算邏運算中25%勺指令的兩個操作數(shù)中的一個已在寄存器中,另一個必須在算邏指令執(zhí)行前用Load指令從存儲器取到寄存器。因此有人建議增加另一種算邏指令,其特點是一個操作數(shù)取自寄存器,另一個操作數(shù)取自存儲器,即寄存器一存儲器類型,假設(shè)這種指令的CPI等于2。同時,轉(zhuǎn)移指令的CPI變?yōu)?。求新指令系統(tǒng)的平均CPI。【答案】(1) CPI舊=(0.43X1+0.21>2+0.12>2+0.24>2)=1.57(2) 原算邏指令中的25%變成了寄存器一存儲器型指令,所以算邏指令(寄存器一

14、寄存器型)少了(0.25X0.43)M條,Load指令少了(0.25X0.43)M條,而(0.25X0.43)M條的新指令為寄存器一存儲器型指令。指令總數(shù)少了(0.25>43%)M條。設(shè)執(zhí)行算邏指令(寄存器一寄存器型)、Load指令、算邏指令(寄存器一存儲器型)、Store指令和轉(zhuǎn)移指令的周期總數(shù)分別為C1,C2,C3,C4,C5,所以:C1=(0.43-(0.25>0.43)MX1=0.3225MC2=(0.21-(0.25X0.43)M>2=0.205MC3=(0.25>0.43)M>2=0.215MC4=0.12MX2=0.24MC5=0.24X3M=0.7

15、2M新指令總數(shù)N=(1-(0.25X0.43)M=0.8925MCPI新=(C1+C2+C3+C4+C5)/N=1.7025M/0.8925M=1.90835假設(shè)一臺計算機可用兩種運行方式,即常規(guī)方式與提高方式執(zhí)行一個程序,其概率分布分別為a,1-a0(a)假如口在a與b之間變動,0wa<b<1,試用調(diào)和均值概念推導(dǎo)平均加速比因子表達(dá)式(S平均二2n(n -1)(b a) 2,n為性能提高的倍數(shù))試計算aT0和bT1時的加速比因子【答案】(a) S平均2n(n -1)(b a) 2n為性能提高的倍數(shù)(b)S平均=-(n 1)36、假設(shè)在一臺40MHz處理機上運行200,000條指令

16、的目標(biāo)代碼,程序主要由四種指令組成。根據(jù)程序跟蹤實驗結(jié)果,已知指令混合比和每種指令所需的指令數(shù)如下:指令類型CPI指令混合比算術(shù)和邏輯160%高速緩存命中的加載/存儲218%轉(zhuǎn)移412%高速存儲缺失的存儲器訪問810%計算在單處理機上用上述跟蹤數(shù)據(jù)運行程序的平均CPI根據(jù)所得的CPI,計算相應(yīng)的MIPS速率?!敬鸢浮科骄鵆PI=1*60%2*18%4*12%8*10%=2.24MIPSfCPI *10640MHZ2.24* 106= 17.8637、假設(shè)高速緩存Cache工作速度為主存的5倍,且Cache被訪問命中的概率為90%,則采用Cache后,能使整個存儲系統(tǒng)獲得多高的加速比?【答案】C

17、.1c一Speedup=3.570.10.9/538、假定一個計算機設(shè)計者,對高級語言結(jié)構(gòu)的使用進(jìn)行研究,結(jié)果表明過程調(diào)用是最常用的操作之一。該設(shè)計者已設(shè)想了一個優(yōu)化的設(shè)計方案,它能減少過程調(diào)用和返回所需的取存指令次數(shù)。為了進(jìn)行驗證,對未加優(yōu)化和已優(yōu)化的方案進(jìn)行實驗測試,假定所使用的是相同的優(yōu)化編譯器。實驗測得結(jié)果如下:(1)為優(yōu)化方案的時鐘周期比優(yōu)化的快5%(2)未優(yōu)化方案中的取存指令數(shù)占總指令數(shù)的30%1/3,對于其他指令,兩種方案的(3)優(yōu)化方案中的取存指令數(shù)比未優(yōu)化的少動態(tài)執(zhí)行數(shù)沒有變化(4)所有指令,包括取存,均只需1個時鐘周期要求定量的判斷,哪一個設(shè)計方案使計算機工作的速度更快?!?/p>

18、答案】由(1)可知,未優(yōu)化方案的時鐘周期t=0.95t1,t1為優(yōu)化后的時鐘周期由(2)(3)可以得到優(yōu)化方案的指令條數(shù)IC1=(1-1/3)*30%*IC70%*IC=0.9IC由(4)可知,兩種方案的CPI都是1,又因為SpT1IC* CPI *tIC1*CPI1*t1= 1.06所以,優(yōu)化后的方案工作速度更快。39、假定要將某一執(zhí)行部件改進(jìn)后速度提高10倍,改進(jìn)后被改進(jìn)部件執(zhí)行時間占系統(tǒng)總運行時間的50%。問改進(jìn)后,獲得的加速比Sp是多少?【答案】假設(shè)系統(tǒng)在改進(jìn)前后的執(zhí)行時間分別為T1和T2,則工_1T2(1 - Fe) Fe/Se(D由(1)式,得T2=(1Fe)+Fe/Se*T1(2

19、)Fe*T由題意50%T2=(3)10(4)(5)(2)-(3),得50%T2=(1Fe)*T1匚10*T2Fe二2*T1,1T1由(4)(5)可得Sp=l=5.540、某工作站采用時鐘頻率f為15MHz,CPI為1.5的處理機來執(zhí)行一個已知混合程序。假定每次存儲器存取為1個周期延遲,問:(1)此計算機的處理速率為多少MIPS?(2)假定將處理機的時鐘頻率f提高到30MHz,但存儲器子系統(tǒng)的速率不變。這樣,每次存儲器存取需要2個時鐘周期,如果30%指令每條只需要一次存儲存取,而另外5%每條需要2次存儲存取,還假定已知混合程序的指令數(shù)不變,并與原工作站兼容,試求改進(jìn)后的處理機性能?!敬鸢浮?1)

20、MIPS=f/(CPI*106)=15*106/(1.5*106)=10MIPS(2)如題所述,30%的指令需要一次存儲存取,則這些指令在處理器提高時鐘頻率之后需要增加1個時鐘周期;同樣,另外5%的指令需要增加2個時鐘周期。CPInew=(改進(jìn)前執(zhí)行混合程序所需的時鐘周期數(shù)+30%*1*指令數(shù)+5%*2*指令數(shù))/指令數(shù)=CPIold+30%*1+5%*2=1.5+0.3+0.1=1.9處理速率MIPS=fnew/(CPInew*106)=30*106/(1.9*106)=15.79MIPS假設(shè)混合程序的指令數(shù)為IC,則有CPI old * IC / fold= 1.58CPI* newIC

21、/ fnew可見,改進(jìn)后工作站性能提高了41、1臺向量計算機1次只能以下述兩種執(zhí)行方式中的一種運行:一種是向量方式,執(zhí)行速度Rv為10MFLOPS;另一種是標(biāo)量方式,執(zhí)行速度Rs為1MFLOPS設(shè)a是該計算機的典型程序代碼中可向量化部分的百分比。(a)推導(dǎo)出該計算機平均執(zhí)行速度R的公式(b)要使R達(dá)到7.5MFLOPS,問向量化百分比a應(yīng)多大?(c)假設(shè)Rs=1MFLOPS,a=0.7,要使R達(dá)到2MFLOPS,問Rv應(yīng)為多大?10(a)【答案】R=1/10(1-:)10-9:(b) R=7.5,則10=7.5,a=0.96310-9:(c) R=,:/Rv(1-:)/Rs貝(JRv=07=3

22、.5MFLOPS1/R-(1-:)/Rs0.5-(1-0.7)42、假設(shè)我們有一個需要運行100秒的標(biāo)準(zhǔn)程序,其中有90秒是CPU時間而剩下的是I/O占用的時間。如果在以后的五年中,CPU®度每年提高50%且I/O時間保持不變,那么五年后我們的程序要耗費多少時間?【答案】耗費的時間=CPU時間+I/O時間100=90+I/O時間I/O時間=10秒下表計算新的處理器時間和剩下的運行時間:第N年以后CPU時間I/O時間耗費的時間%I/O時間090秒10秒100秒10%190/1.5=60秒10秒70秒14%260/1.5=40秒10秒50秒20%340/1.5=27秒10秒37秒27%4

23、27/1.5=18秒10秒28秒36%518/1.5=12秒10秒22秒45%43、計算機系統(tǒng)有三個部件可以改進(jìn),這三個部件的加速比如下:部件1加速比S1=30;部件2加速比S2=20;部件3加速比S3=10;(1)如果部件1和部件2的可改進(jìn)比例為30%,那么當(dāng)部件3的可改進(jìn)比例為多少時,系統(tǒng)的加速比才可以達(dá)到10?(2)如果三個部件的可改進(jìn)比例為30%、30%和20%,三個部件同時改進(jìn),那么系統(tǒng)中不可加速部分的執(zhí)行時間在總執(zhí)行時間中占的比例是多少?【答案】(1)多個部件可改進(jìn)情況下Amdahl定理的擴(kuò)展S=1百其中,F(xiàn)i為可加速部件I在未優(yōu)化系統(tǒng)中所占的比例,(1-vFi)八旦iiSiSi是

24、部件I的加速比。F1F2F3.S=1-(F1F2F3)一S1S2S310=1-(0.30.3F3)0303F%"302010.F3=0.36=36%(2)1 -(0.3 0.3 0.2)T0.30.30.2TT T 0.2T3020101214.7= 0.82 =82%44、假設(shè)我們考慮條件分支指令的兩種不同設(shè)計方法如下:CPU1:通過比較指令設(shè)置條件碼,然后測試條件碼進(jìn)行分支。CPU2:在分支指令中包括比較過程。在兩種CPU中,條件分支指令都占用2個時鐘周期而所有其他指令占用1個時鐘周期,對于CPU1,執(zhí)行的指令中分支指令占20%;由于每個分支指令之前都需要有比較指令,因此比較指令

25、也占20%。由于CPU1在分支時不需要比較,因此假設(shè)它的時鐘周期時間比CPU2快1.25倍。哪一個CPU更快?如果CPU1的時鐘周期時間僅僅比CPU2快1.1倍,哪一個CPU更快?【答案】對于CPU1,占用2個時鐘周期的分支指令占總指令的20%,剩下的指令占用1個時鐘周期,所以CPI1=0.2*2+0.8*1=1.2總CPU時間T1=IC*1.2*時鐘周期1根據(jù)假設(shè),有:時鐘周期2=1.5*時鐘周期1在CPU2中,沒有獨立的比較指令,所以CPU2的程序量為CPU1的80%,分支指令的比例為:20%/80%=25%這些分支指令占用2個時鐘周期,而剩下的75%的指令占用1個時鐘周期,因止匕:CPI

26、2=0.25*2+0.75*1=1.25IC2=0.8*IC1總CPU時間T2=IC2*CPI2*時鐘周期2=0.8*IC1*1.25*1.25*時鐘周期1=1.25*IC1*時鐘周期1在這些假設(shè)之下,盡管CPU2執(zhí)行指令條數(shù)較少,CPU1因為有著更短的時鐘周期,所以比CPU2快。如果CPU1的時鐘周期僅僅比CPU2快1.1倍,則時鐘周期2=1.1*時鐘周期1T2=1.1*IC1*時鐘周期1因此,CPU2由于只能更少的指令,比CPU1運行更快。45 、從機器(匯編)語言程序員看,以下哪些是透明的?指令地址寄存器;指令緩沖器;時標(biāo)發(fā)生器;條件碼寄存器;乘法器;主存地址寄存器;磁盤外設(shè);先行進(jìn)位鏈

27、;移位器;通用寄存器;中斷字寄存器【答案】透明的有:指令緩沖器、時標(biāo)發(fā)生器、乘法器、磁盤外設(shè)、先行進(jìn)位鏈、移位器46 、實現(xiàn)軟件移植的主要途徑有哪些?它們存在什么問題?適用于什么場合?【答案】( 1) 采用系列機方法,只能在具有相同系統(tǒng)結(jié)構(gòu)的各種機器之間實現(xiàn)軟件移植,一般是一個廠家生產(chǎn)的機器。( 2) 采用模擬與仿真的方法,可在不同系統(tǒng)結(jié)構(gòu)的機器之間相互移植軟件,對于使用頻率較高的指令,盡可能用仿真方法以提高運算速度,而對于使用頻率低且難于用仿真實現(xiàn)的指令則用模擬方法來實現(xiàn)。(3)采用統(tǒng)一的高級語言方法,可以解決結(jié)構(gòu)相同或完全不同的各種機器上的軟件移植,但是,要統(tǒng)一高級語言,語言的標(biāo)準(zhǔn)化很重要

28、,但難以在短期內(nèi)解決。47、在SUNSPARC2工作站上,對SPECBenchmark進(jìn)行測試,獲得了如下所示的速率值,求出其算術(shù)、幾何及調(diào)和平均值(以MFLOPS表示)程序名速率(MFLOPS)GCC10.7Espress08.9Spice2g68.3DODUC5.0NASA78.7Li9.0Eqntott9.7Matrix30011.1FPPPP7.8TOMCATV5.6【答案】1算術(shù)平均值(10.78.98.35.08.79.09.711.17.85.6)=8.4810幾何平均值10(10.7*8.9*8.3*5.0*8.7*9.0*9.7*11.1*7.8*5.6)=8.25調(diào)和平均值

29、10,-7.91/10.71/8.91/8.31/5.01/8.71/9.01/9.71/11.11/7.81/5.648、某計算機系統(tǒng)采用浮點運算部件后,使浮點運算速度提高到原來的20倍,而系統(tǒng)運行一程序的整體性能提高到原來的5倍,試計算該程序中浮點操作所占的比例?!敬鸢浮吭O(shè)該程序中浮點操作所占的比例是x,1有:5=又=0.8/0.95=84.2%(1-x)x/2049、假定我們有一臺計算機,如果所有的cache訪問都命中的話,它的CPI是2.0o唯一的數(shù)據(jù)訪問指令是store和load,它們占指令總數(shù)的40%,不命中損失是25個時鐘周期,不命中率是2%。如果所有的指令訪問cache都命中的

30、話,那么機器的速度是存在cache不命中時的多少倍?【答案】首先計算所有cache訪問都命中時計算機的性能:CPU執(zhí)行時間=(CPU時鐘周期+內(nèi)存停機周期)x時鐘周期時長=(ICXCPI+0)x時鐘周期時長=ICX2.0X時鐘周期時長現(xiàn)在計算考慮cache不命中在內(nèi)的真實計算機性能,我們先計算內(nèi)存停機周期:內(nèi)存停機周期=ICX每條指令訪問內(nèi)存的次數(shù)x不命中率x不命中損失=ICX1+0.4)X0.02X25=IC>0.7其中(1+0.4)代表每條指令訪問一次內(nèi)存,而占指令總數(shù)40%的store和load訪問兩次內(nèi)存,所以平均每條指令訪問訪問(1+0.4)次內(nèi)存。這樣總的性能是:CPU執(zhí)行時間=(I

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論