




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 中國地質大學(武漢) 計算機學院 吳湘寧 計算機體系結構習題及答案第一章 基礎知識 1名詞解釋 翻譯 解釋 模擬 仿真 透明性 程序訪問局部性 答案略 2. 一個經(jīng)解釋實現(xiàn)的計算機可以按功能劃分為四級. 每一級為了執(zhí)行一條指令需要下一級的N條指令. 若執(zhí)行第一級的一條指令需要的時間為K ns, 那么執(zhí)行第二、三、四級的一條指令各需要多少時間? 3. 計算機系統(tǒng)按功能劃分層次結構的好處主要體現(xiàn)
2、在哪些方面? 答案 (1) 有利于理解軟件, 硬件和固件在系統(tǒng)中的地位和作用; (2) 有利于理解各種語言的實質和實現(xiàn)途徑; (3) 有利于推動計算機系統(tǒng)結構的發(fā)展; (4) 有利于理解計算機系統(tǒng)結構的定義. 4. 什么是透明性? 對計算機系統(tǒng)結構, 下列哪些是透明的? 哪些是不透明的? 1) 存儲器的模m交叉存取; 2) 浮點數(shù)據(jù)表示; 3) I/O系統(tǒng)是采用通道方
3、式還是I/O處理機方式; 4) 陣列運算部件; 5) 數(shù)據(jù)總線寬度; 6) 通道是采用結合型的還是獨立型的; 7) 訪問方式保護; 8) 程序性中斷; 9) 串行、重疊還是流水控制方式; 10) 堆棧指令; 11) 存儲器的最小編址單位; 12) Cache存儲器. 答案 一種本來是存在的事務或屬性, 但從某種角度看卻好像不存在, 稱為透明性. 對計算機系統(tǒng)結構來說
4、透明的是: 1), 4), 5), 6), 9), 12) 對計算機系統(tǒng)結構來說不透明的是:2), 3), 7), 8), 10), 11) 5. 什么是計算機體系結構? 什么是計算機組成? 什么是計算機實現(xiàn)? 并說明三者的關系和相互影響? 答案 計算機系統(tǒng)結構是計算機系統(tǒng)的軟, 硬件分界面, 是機器語言程序員或是編譯程序員 所需了解的計算機屬性; 計算機組成是
5、計算機系統(tǒng)結構的邏輯事項; 計算機實現(xiàn)是計算機組成的物理實現(xiàn). 三者的關系和互相影響為: (1) 具有相同系統(tǒng)結構的計算機可以采用不同的組成; (2) (2) 一種計算機組成可以采用多種不同的計算機實現(xiàn); (3) 計算機組成、計算機實現(xiàn)對計算機系統(tǒng)結構有著很大的影響; (4) 計算機系統(tǒng)結構的設計不應限制計算機組成和實現(xiàn)技術,應能用于高檔機,也可用于低擋機; (5) 在不同時期, 計算機系統(tǒng)結構,、組成和實現(xiàn)所包含的內容會有所變化,三者之間的界線常常很模糊.
6、160; 6. 從機器(匯編)語言程序員角度看, 以下哪些是透明的? 1) 指令地址存儲器; 2) 指令緩沖器; 3) 時標發(fā)生器; 4) 條件碼寄存器; 5) 乘法器; 6) 主存地址寄存器; 7) 磁盤外設; 8) 先行進位鏈; 10) 通用寄存器; 11) 中斷字寄存器. 答案 對機器(匯編)語言程序員來說透明的有:
7、2), 3), 5), 6), 8), 9) 對機器(匯編)語言程序員來說不透明的有: 1), 4), 7), 10), 11) 7. 假設在一臺40 MHz處理機上運行200 000條指令的目標代碼, 程序主要由四種類型的指令所組成. 根據(jù)程序跟蹤實驗結果, 各類指令的混合比和每類指令的CPI值如表1.9所示. (1)&
8、#160;試計算在單處理機上執(zhí)行上述該程序時的平均CPI; (2) 根據(jù)(1)所得到的CPI, 計算相應的MIPS速率及程序的執(zhí)行時間. 答案 (1) 2.24 CPI (2) 17.86 MPIS; 0.0112 s 8. 某工作站采用時鐘頻率為15 MHz、處理速率為10 MIPS的處理機來執(zhí)行一個程序,假定每次存儲器存取為1周期延遲, 試問: (1) 此計算機的有效CPI是多少
9、? (2) 假定將處理機的時鐘頻率提高到30 MHz, 但存儲器子系統(tǒng)速率不變, 這樣, 每次存儲器存取需要兩個時鐘周期. 如果30%的指令每條只需要一次存儲存取, 而另外5%的指令每條需要兩次存儲存取, 還假定已知混合程序的指令數(shù)不變, 并與原工作站兼容, 試求改進后的處理機性能. 答案 (1) 1.5 CPI; (2) 15.8 MPIS 9. 什么是并行性?它分為哪兩種類型?開
10、發(fā)計算機系統(tǒng)并行性的主要技術途徑有哪三個?沿這些途徑分別發(fā)展出什么類型的計算機? 答案略 10. 實現(xiàn)軟件移植的途徑有哪些? 答案略 11. 什么是Flynn分類法,按照Flynn分類法可將計算機系統(tǒng)分為哪幾類? 答案略第二章 指令系統(tǒng) 1. 名詞解釋 數(shù)據(jù)類型、數(shù)據(jù)表示、規(guī)格化浮點數(shù)、Huffman編碼、擴展編碼、RISC 答案略 2. 某模型機有8條指令I1I8, 它們的使用頻度分別為0.3, 0.3,&
11、#160;0.2, 0.1, 0.05, 0.02, 0.02, 0.01. (1) 試分別用Huffman編碼和平均碼長最短的等長擴展碼(限定為兩種碼長)對其操作碼進行編碼. (2) 分別計算Huffman編碼和等長擴展碼編碼的平均長度. 答案 (1) 操作碼的Huffman編碼和2-4等長擴展碼編碼如下表1所示. (2) Huffman編碼的平均長度為2.38位; 等長擴展碼編碼的平均碼長為2.8位. 3.&
12、#160;某模型機有10條指令I1I10, 它們的使用頻度分別為0.3, 0.24, 0.16, 0.12, 0.07, 0.04, 0.03, 0.02, 0.01, 0.01. (1) 計算機采用等長操作碼表示時的信息冗余量. (2) 要求操作碼平均碼長最短, 試設計操作碼的編碼, 并計算所設計操作碼的平均長度. (3) 設計2-5擴展操作碼編碼,并計算平均碼長. (4) 設計2-4(2/8)
13、等長擴展碼編碼,并計算平均碼長. 答案 (1) 采用等長操作碼表示時的信息冗余量為33.5%. (2) 操作碼的Huffman編碼如表2所示, 此種編碼的平均長度為2.7位. (3) 操作碼的2-5擴展碼編碼如表2所示, 此種編碼的平均長度為2.9位. (4) 操作碼的2-4(2/4)等長擴展碼編碼如表2所示, 此種編碼的平均長度為2.92位. 4. 何謂指令格式的優(yōu)化? 操作碼和地址碼的優(yōu)化一般采用哪些方法? 答案
14、0;指令格式的優(yōu)化是指通過采用多種不同的尋址方式, 地址制, 地址形式和地址碼長度以及多種指令字長, 并將它們與可變長操作碼的優(yōu)化表示相結合, 就可以構成冗余度盡可能少的指令字. 操作碼的優(yōu)化采用擴展操作碼編碼法. 地址碼優(yōu)化有以下四種方法: (1) 在指令中采用不同的尋址方式; (2) (2) 在指令中采用多地址制; (3) 同一種地址制還可以采用多種地址形式和長度, 也可以考慮利用空白處來存放直接操作數(shù)或常數(shù)等; (4)
15、160;在以上措施的基礎上, 還可以進一步考慮采用多種指令字長度的指令. 5. 若某機設計有如下指令格式的指令: 三地址指令12種, 一地址指令254種, 設計指令的長度為16位, 每個地址碼字段的位數(shù)均為4位. 若操作碼的編碼采用擴展操作碼, 問二地址指令最多可以設計多少種? 答案 二地址指令最多可以設計48種. 6. 一臺模型機共有九條指令I1I9, 各指令的使用頻度分別為0.3,0.2,0.2,0.1,0.08
16、,0.6, 0.03, 0.02, 0.01. 該模型機有8位和16位兩種指令字長. 8位字長指令為寄存器-寄存器(R-R)二地址類型, 16位字長指令為寄存器-存儲器(R-M)二地址變址尋址類型. (1) 試設計有兩種碼長的擴展操作碼, 使其平均碼長最短, 并計算此種編碼的平均碼長. (2) 在(1)的基礎上, 該機允許使用多少個可編址的通用寄存器? (3) 若采用通用寄存器作為變址寄存器, 試設計該機的兩種指令格式, 并標出各字段的
17、位數(shù). (4) 計算變址尋址的偏移地址范圍. 答案 (1) 操作碼的2-5擴展碼編碼如表3所示, 此種編碼的平均長度位2.9位.2) 在(1)的基礎上, 該機允許使用8個可編址的通用寄存器. (3) 該機的兩種指令格式及各字段的位數(shù)如下: R-R型: 操作碼OP (2位) | 源寄存器RS (3位) | 目的寄存器Rd (3位) R-M型: 操作碼OP (5位) |
18、 源寄存器RS (3位) | 變址寄存器RX (3位) | 偏移地址 (5位) (4) 變址尋址的偏移地址范圍為-16+15. 7. 簡述CISC的特點. 答案 CISC的特點如下: (1) 龐大的指令系統(tǒng); (2) 采用了可變長度的指令格式; (3) 指令使用的尋址方式繁多; (4) CISC指令系統(tǒng)中包括一些用于特殊用途的指令, 各種指令
19、的使用頻度相當懸殊. 8. 從指令格式, 尋址方式以及平均CPI三個方面, 比較經(jīng)典CISC和純RISC體系結構. 答案 略 9 簡述RISC設計的一般原則。 答案 1、精簡指令條數(shù),保留使用頻度高的指令; 2、簡化指令格式,采用簡單尋址方式,絕大多數(shù)指令可以在單周期內執(zhí)行完成; 3、采用寄存器間運算結構,減少訪存次數(shù); 4、指令以硬聯(lián)組合電路實現(xiàn)為主,少量指令可以用微程序解釋方式執(zhí)行; 5、優(yōu)化編譯程序的設計。
20、160;10 RISC計算機采用了哪些關鍵技術?各是什么含義? 答案 1、遵循按RISC機器一般原則設計的技術; 2、指令采用交叉和流水的方式解釋執(zhí)行,并采用優(yōu)化延遲轉移技術; 3、在CPU中設置大量的寄存器組,并采用重疊寄存器窗口的技術; 4、在邏輯上采用硬聯(lián)實現(xiàn)為主,適當輔以微程序解釋的技術; 5、優(yōu)化編譯系統(tǒng)設計的技術.。第三章 存儲系統(tǒng) 1. 名詞解釋 低位交叉存儲器、虛擬存儲器、地址映象、地址變換、頁面失效、頁面沖突、替換算法、組相聯(lián)映象、寫直達法 答案略 2
21、60;以頁式虛擬存儲器為例,說明什么是內部地址變換和外部地址變換?什么時候發(fā)生外部地址變換? 答案 程序運行時,虛擬存儲系統(tǒng)按照地址映象方式把虛擬地址轉換成主存物理地址的過程稱為地址變換,又稱為內部地址變換。如果要訪問的指令或數(shù)據(jù)已經(jīng)在主存中,則命中主存,否則就發(fā)生了頁面失效,此時需要進行外部地址變換,即將虛擬地址變換成為輔存物理地址,然后再根據(jù)這個輔存物理地址從輔存上將所需指令或數(shù)據(jù)所在的頁面調入主存??梢?,當發(fā)生頁面失效的時候,需要進行外部地址變換。 3 什么是堆棧型替換算法?哪些算法屬于堆棧型替換算法? 答案 堆棧型
22、替換算法是指如果以任意一個程序的頁地址流作兩次主存頁面數(shù)分配,分別分配m個主存頁面和n個主存頁面,并且有mn。如果在任何時刻t,主存頁面數(shù)集合Bt都滿足關系:Bt(m)Bt(n),則這類算法稱為堆棧型替換算法。堆棧型算法的基本思想是:隨著分配給程序的主存頁面數(shù)增加,主存的命中率也提高,至少不下降。LRU、LFU、OPT算法都是堆棧型算法,而RAND和FIFO算法都不是堆棧型算法。 4 Cache存儲系統(tǒng)中有哪些常用的地址映象方法?各有什么優(yōu)缺點? 答案 Cache存儲系統(tǒng)有以下幾種常用的地址映象方法: 全相聯(lián)地址映象:把
23、主存空間和Cache空間都劃分為大小相等的塊,塊的大小一般是一個主存訪問周期內對主存訪問的信息量,主存的任意一塊可以裝入到Cache中的任意一塊位置上。優(yōu)點是塊沖突概率最低,缺點是要使用相聯(lián)存儲器,所以檢索過程昂貴,需要的硬件成本比較高。而且當Cache較大時,相聯(lián)存儲器的表長也較大,查表速度難以提高。 直接地址映象:把主存空間按照Cache的大小劃分為若干個區(qū),主存各個區(qū)中塊號相同的主存塊只能夠裝入到Cache中具有同一塊號的特定塊位置上。直接映象的優(yōu)點是硬件實現(xiàn)簡單,不需要相聯(lián)查找,不需要頁面替換算法,因而成本較低且地址變換速度快。缺點是塊的沖突的概率高,Cache的
24、利用率低。 組相聯(lián)映象:把主存按照Cache的大小分區(qū),主存中的各區(qū)和Cache再按照同樣大小劃分成數(shù)量相等的組,組內按照同樣大小劃分成塊,主存的組與Cache的組之間采用直接映象,組內的塊之間采用全相聯(lián)映象。具有較好的性能價格比,其優(yōu)缺點介于全相聯(lián)映象和直接映象的優(yōu)缺點之間。與全相聯(lián)映象相比,實現(xiàn)起來更加經(jīng)濟,查表的速度也較快。與直接映象相比,塊的沖突概率顯著降低。 5 什么是Cache的一致性問題?說明單處理機中Cache一致性問題的產(chǎn)生原因及解決方法。 答案 一般情況下,Cache中存放的是主存的部分副本,因此,C
25、ache塊應該與相應主存塊的內容保持一致。但是在某些情況下,Cache塊與相應主存塊的內容會不相同,也就是產(chǎn)生了Cache的一致性問題。 在單處理機中,造成Cache一致性問題的原因主要有: CPU修改了Cache中的內容,而主存中相應內容卻沒有改變; I/O處理機或I/O設備讀入數(shù)據(jù)到主存,修改了主存的內容,而Cache中對應的內容卻沒有改變。 在單處理機中,解決Cache一致性問題主要有兩種方法: 寫直達法:又稱為全寫法、寫貫通法,是指當Cache寫命中時,必須把數(shù)據(jù)同
26、時寫入Cache和主存中。 寫回法:是指當Cache寫命中時,只修改Cache的內容,而不立即寫入主存,只有當這一塊將被替換出Cache的時候,才把已修改的Cache塊寫回到主存。 6 假設二級存儲系統(tǒng)兩級物理存儲器的訪問時間的關系為T25T1,在命中率H為0.9和0.99兩種情況下,分別計算存儲系統(tǒng)的訪問效率。 7 要求主存實際頻寬為4MBs,現(xiàn)設主存每個分體的存取周期為2us,寬度為4個字節(jié),采用模m多分體交叉存取,但實際頻寬只能達到最大頻寬的0.6倍,問主存模數(shù)m應取多少方能使兩者的速度基本匹配?其中m
27、取2的冪。 8 在一個Cache存儲系統(tǒng)中,主存儲器的訪問周期、存儲容量和單位價格分別為60ns、64MB和10元/MB,Cache的訪問周期、存儲容量和單位價格分別為10ns、512KB和100元/MB,Cache的命中率為0.98。 (1) 計算這個Cache存儲系統(tǒng)的等效訪問周期、存儲容量和單位價格。(2)計算這個Cache存儲系統(tǒng)的訪問效率。 9 一個由Cache和主存構成的二級存儲系統(tǒng),已知主存容量為1M字,Cache容量為32K字。采用組相聯(lián)地址映象與變換,Cache共分8組,主存和Cache的塊的大小為64字。 (1)寫
28、出主存和Cache的地址格式,要求說明各字段名稱和位數(shù)。 (2)如果Cache的存取周期為20ns,命中率為0.95,希望采用Cache后的加速比達到10,那么要求主存的存取周期應該為多少? 主存容量為字,故主存地址有20位。Cache的容量為32K字,所以Cache的地址有15位。主存按照Cache的容量分區(qū),所以區(qū)號E長度20155位。 采用組相聯(lián)映象,Cache共分8組,所以組號G和g為3位。主存和Cache的塊的大小為64字,所以塊內地址W和w的長度為6位。塊號B和b的長度15366位。 (2)已知
29、Cache的存取周期TC20ns,命中率H0.95,設主存的存取周期為TM,有: 得到所要求的主存存取周期為: 380ns 10在頁式虛擬存儲器中,一個程序由04共5個虛頁組成,在程序執(zhí)行過程中,訪存虛頁地址流為: 0, 1, 0, 4, 3, 0, 2, 3, 1, 3 假設分配給這個程序的主存空間有3個實頁,分別采用FIFO、LRU、OPT替換算法進行替換調度。 (1)
30、分別畫出3種替換算法對主存3個實頁位置的使用情況。 (2)分別計算3種替換算法的主存命中率。 答案 (1)分別用FIFO、LRU、OPT替換算法對主存3個實頁使用過程如下圖所示,其中“*”表示準備替換出去的頁。 (2)FIFO替換算法的主存命中率:H 2/10 0.20 LRU 替換算法的主存命中率:H 4/10 0.40 OPT 替換算法的主存命中率:H 5/10 0.50
31、60; 11 設某程序包含5個虛頁,其頁地址為4,5,3,2,5,1,3,2,2,5,1,3。當使用LRU法替換時,為獲得最高的命中率,至少應分配給該程序幾個實頁?其可能的最高命中率為多少? 答案:由于LRU是堆棧型替換算法,因此,隨著分配給該程序的實頁數(shù)的增加,主存命中率會單調上升。但是在實頁數(shù)增加到一定的程度后,命中率就不再提高,下面使用堆棧處理法,該程序處理過程如下表所示,其中N為主存頁面數(shù)。 由上表可以看出,采用LRU替換算法,要達到最高命中率,只需要分配該該程序4個實頁,最高命中率為:H=7/12=0.58。第四章 輸入輸出系統(tǒng)
32、60;1 名詞解釋 中斷屏蔽碼、中斷響應次序、中斷處理次序、通道極限流量、通道實際最大流量。 答案略 2 從系統(tǒng)結構的角度來講,I/O系統(tǒng)的設計對整個計算機系統(tǒng)有何影響? 答案 I/O系統(tǒng)的好壞直接影響到整個計算機系統(tǒng)的性能,即會影響系統(tǒng)的處理速度,因為根據(jù)Amdal定律,系統(tǒng)性能的性能受系統(tǒng)中速度最慢部分制約,因此,不論其他部件如CPU,存儲系統(tǒng)速度再快,但是I/O系統(tǒng)比較慢的話,系統(tǒng)的性能仍然比較低。 3簡述通道的工作過程。 答案略 4簡述字節(jié)多路通道、選
33、擇型通道、數(shù)組通道的數(shù)據(jù)傳輸過程。 答案略 5 設中斷屏蔽位“1”對應開放,為“0”對應屏蔽,各級中斷處理程序的中斷屏蔽位設置如下:1)當中斷響應先后次序為1234時,其中斷處理次序是什么? 2)如果所有的中斷處理都各需3t,若在運行用戶程序時,同時出現(xiàn)了2、3級中斷請求,經(jīng)過2t又同時出現(xiàn)了1、4級中斷請求,畫出程序運行過程示意圖。6若計算機共有5級中斷,中斷響應的優(yōu)先次序從高到低依次是12345。 (1)若要將中斷的優(yōu)先次序改為14523,設計各級中斷處理程序的中斷級屏蔽碼(中斷級屏蔽位為“1”對應屏蔽,為“0”對應開放)。
34、160;(2) 若在運行用戶程序時,同時出現(xiàn)了4、2級中斷請求,而在處理第2級中斷未完成時,又同時出現(xiàn)了第1,3,5級中斷請求,請畫出程序運行過程示意圖。 7 設某個字節(jié)多路通道的設備選擇時間為TD9.8üs,傳送一個字節(jié)的數(shù)據(jù)傳送時間為TS0.2üs,若某種低速外設每隔500üs發(fā)出一次傳送請求,那么,該通道最多可連接多少臺這樣的設備? 答案50臺(分析過程略,可參考習題書)。 8 設某個數(shù)組多路通道的設備選擇時間為TS1üs,傳送一個字節(jié)數(shù)據(jù)的傳送時間為TD1üs,一次傳送定長數(shù)
35、據(jù)塊的大小k512B,現(xiàn)有8臺外設的數(shù)據(jù)傳輸率分別如下表所示,問哪些設備可以連接到通道上正常工作?答案2,3,4,5,6,可連接到通道上正常工作(分析過程略,可參考習題書)。9 一個通道型I/O系統(tǒng),由一個字節(jié)多路通道A(其中包括兩個子通道A1和A2),兩個數(shù)組多路通道B1和B2,以及一個選擇通道C構成,各通道所接設備和設備的數(shù)據(jù)傳輸速率如下表所示,(1)分別結算通道A,B1,B2,C的最大流量至少為多少才不會丟失傳送的數(shù)據(jù)? (2)若整個I/O系統(tǒng)的流量占主存頻寬的1/2時,才認為兩者的速度是匹配的,問主存的頻寬應達到多少? 答案 (1)只有當A的最大
36、流量為512KB/s, B1的最大流量為512KB/s, B2的最大流量為512KB/s, C的最大流量為1024KB/s,時,才不會丟失數(shù)據(jù)。 (2) 主存的頻寬應達到5MB/S(分析過程略,可參考習題書)。 10 某個字節(jié)多路通道連接6臺外設,它們的數(shù)據(jù)傳輸率分別如下表所示 (1)計算通道的實際流量fbyte (2)若通道最大流量fmax.byte = fbyte,求通道的工作周期TS +TD (3)設通道對外設數(shù)據(jù)傳送請求的響應優(yōu)先次
37、序按外設的數(shù)據(jù)傳輸速率從高到低排序。若6臺外設同時發(fā)出傳送請求,請畫出該通道處理這6臺外設傳送請求的處理時間示意圖,并由此指出哪臺外設會局部丟失數(shù)據(jù)?試提出避免數(shù)據(jù)丟失的解決方法。答案 (1)通道的實際流量fbyte=200B/s (2)通道的工作周期TS +TD =5üs (3)處理時間示意圖略,避免數(shù)據(jù)丟失的解決方法可參考教材。第五章 流水線技術 1. 名詞解釋 指令的重疊解釋方式: 在解釋第k條指令的操作完成之前, 就可開始解釋第k+1條指令. 一
38、次重疊: 指把一條指令的解釋過程分為”分析”和”執(zhí)行”兩個子過程, 分別由指令分析部件和指令執(zhí)行部件來完成相應的功能. 無論何時, 在指令分析部件和指令執(zhí)行部件內部只有相鄰的兩條指令在重疊執(zhí)行. 操作數(shù)相關: 指在第k條指令和第k+1條指令的數(shù)據(jù)地址之間發(fā)生關聯(lián)而造成第k條指令和第k+1條指令不能同時解釋的現(xiàn)象. 指令相關: 指第k條指令的結果會影響第k+1條指令內容而產(chǎn)生關聯(lián), 造成第k條指令和第k+1條指令不能同時解釋的現(xiàn)象. 靜態(tài)流水線: 指在同一時間內, 多功能流水線
39、中的各個功能段只能按一種功能的聯(lián)接方式工作. 動態(tài)流水線: 指在同一時間內, 多功能流水線中的各個功能段可按不同功能或運算的聯(lián)接方式工作. 線性流水線: 流水線各段串行連接, 沒有反饋回路, 各個段只經(jīng)過一次. 非線性流水線: 流水線中除了由串行連接的通路外, 還有某種反饋回路, 使得一個任務流經(jīng)流水線時, 需經(jīng)過某個段或越過某些段. 流水線的實際吞吐率: 指從啟動流水線處理機開始到流水線操作結束, 單位時間內流出的任務數(shù). 流水線的加
40、速比: 指流水線工作相對于等效的非流水線順序串行工作方式, 速度提高的比值. 流水線的效率: 指流水線設備的利用率. 預約表: 它用于非線性流水線, 是一張二維的表格, 其橫坐標表示流水線工作的時鐘周期, 縱坐標表示流水線的功能段, 中間畫”表示該功能段在這一時鐘周期處于工作狀態(tài), 空白的地方表示該功能段在這個時刻周期不工作. 沖突向量: 用一個有N-1位的位向量來表示后繼新任務間隔各種不同拍數(shù)流入流水線時, 是否會發(fā)生功能段使用的沖突, 稱此位
41、向量為沖突向量. 局部性相關: 指令相關, 主存操作數(shù)相關和通用/變址寄存器組操作數(shù)相關,只影響相關的兩條或幾條指令, 或至多影響流水線某些段的推后工作, 并不會改動指令緩沖器中預取到的指令的內容, 影響是局部的. 全局性相關: 轉移指令和其后的指令之間存在關聯(lián), 使不能同時解釋, 其造成的對流水機器的吞吐率和效率下降的影響要比指令相關, 主存操作數(shù)相關和通用/變址寄存器組操作數(shù)相關嚴重得多, 它可能會造成流水線中很多已被解釋的指令作廢, 需要重新預取指令進入指令緩
42、沖寄存器等, 它將會影響整個程序的執(zhí)行順序. 先寫后讀相關: 若后一條指令的源操作數(shù)地址與前一條指令的目的操作數(shù)地址相同, 就稱這兩條指令發(fā)生了先寫后讀相關. 先讀后寫相關: 若后后一條指令的目的操作數(shù)地址與前一條指令的源操作數(shù)地址相同, 就稱這兩條指令發(fā)生了先讀后寫相關. 寫寫相關: 若前后兩條指令使用了相同的目的操作數(shù)地址, 就稱這兩條指令發(fā)生了寫寫相關. 超標量流水線: 指在每個時鐘周期同時并行發(fā)射多條指令,并產(chǎn)生多個結果的流水線.超流水線: 指在每個基本時鐘
43、周期內分時發(fā)射多條指令, 每一時刻只發(fā)射一條指令, 并產(chǎn)生多個結果的流水線. 超標量超流水線: 是超標量流水線與超流水流水線的結合, 指在一個基本時鐘周期內能分時發(fā)射多條指令, 且每一時刻能同時發(fā)射多條指令, 并產(chǎn)生多個結果的流水線. VLIW: 超長指令字,指在每個時鐘周期發(fā)射一條超長指令,每條超長指令由多個短指令構成,在流水線的執(zhí)行段,這些短指令被分散到不同的運算部件上并行處理,因此該流水線每個始終周期可并產(chǎn)生多個短指令運行結果. 2. 試解釋重疊方式中出現(xiàn)的相關問題和
44、解決辦法. 答 重疊方式中出現(xiàn)的相關問題主要有指令相關, 主存空間數(shù)相關, 通用寄存器組數(shù)相關和通用寄存器組基址值或變址值相關等. 指令相關可轉化成操作數(shù)的相關來處理; 主存空間數(shù)相關的處理辦法一般采用推后相關單元的讀的方法; 通用寄存器組數(shù)相關的處理可采用推后相關單元的讀, 設置相關專用通路兩種方法; 通用寄存器組基址值或變址值相關的處理也可采用推后相關單元的讀, 設置相關專用通路兩種方法. 3. 假設一條指令的執(zhí)行過程分為”取指令”, “分析”
45、60;和”執(zhí)行”三個階段, 每一個階段的執(zhí)行時間分別為,在下列各種情況下, 分別寫出連續(xù)執(zhí)行n條指令所需要的時間表達式. 1) 順序執(zhí)行方式; (2) 僅”取指令”和”執(zhí)行”重疊; (3) 先行控制方式. 4. 一臺非流水處理器X的時鐘頻率為26MHz, 平均CPI為4. 處理器Y是對X機的改進, 它有一條5級流水線, 各級經(jīng)過的時間為一個時鐘周期, 但由于鎖定器延遲和時鐘扭斜效應, 其時鐘頻率僅為20MHz. (1) 若有100條指令的程序運行在兩臺處理機上時, 假設每條指令之間不發(fā)生任何相關, 求處理機Y相對于處理機X的加速比是多少? (2) 計算執(zhí)行此程序時每臺處理機的MIPS速率. 5. 某條流水線由四個功
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司新年開工小活動方案
- 公司競拍活動方案
- 公司案例收集活動方案
- 公司歡迎回來活動方案
- 公司職工健身房策劃方案
- 公司疫情捐贈活動方案
- 2025年裝修工程師職業(yè)資格考試試題及答案
- 公共關系與危機管理的2025年試卷及答案
- 2025年養(yǎng)老服務體系建設考試試卷及答案
- 2025年刑法學知識與實踐應用考核題及答案
- 2025年湖北省高考政治試卷真題(含答案)
- 老齡化社會的數(shù)字包容-洞察及研究
- 廣東省深圳市寶安區(qū)2023-2024學年二年級下冊期末測試數(shù)學試卷(含答案)
- 2025江蘇揚州寶應縣“鄉(xiāng)村振興青年人才”招聘67人筆試備考試題及參考答案詳解
- 北京市順義區(qū)2023-2024學年五年級下學期數(shù)學期末試卷(含答案)
- 2025公基題庫(附答案解析)
- 三大監(jiān)測培訓試題及答案
- 超市商場保密協(xié)議書
- 系統(tǒng)思維與系統(tǒng)決策系統(tǒng)動力學知到智慧樹期末考試答案題庫2025年中央財經(jīng)大學
- 社工社會考試試題及答案
- 跨文化交際知識體系及其前沿動態(tài)
評論
0/150
提交評論