(完整word版)計(jì)算機(jī)體系結(jié)構(gòu)課后習(xí)題原版答案_張晨曦著_第1頁
(完整word版)計(jì)算機(jī)體系結(jié)構(gòu)課后習(xí)題原版答案_張晨曦著_第2頁
(完整word版)計(jì)算機(jī)體系結(jié)構(gòu)課后習(xí)題原版答案_張晨曦著_第3頁
(完整word版)計(jì)算機(jī)體系結(jié)構(gòu)課后習(xí)題原版答案_張晨曦著_第4頁
(完整word版)計(jì)算機(jī)體系結(jié)構(gòu)課后習(xí)題原版答案_張晨曦著_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第1章計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的基本概念1.1 解釋下列術(shù)語計(jì)算機(jī)系統(tǒng)結(jié)構(gòu):傳統(tǒng)機(jī)器程序員所看到的計(jì)算機(jī)屬性,即概念性結(jié)構(gòu)與功能特性。計(jì)算機(jī)組成:計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的邏輯實(shí)現(xiàn),包含物理機(jī)器級(jí)中的數(shù)據(jù)流和控制流的組成以及 邏輯設(shè)計(jì)等。計(jì)算機(jī)實(shí)現(xiàn):計(jì)算機(jī)組成的物理實(shí)現(xiàn),包括處理機(jī)、主存等部件的物理結(jié)構(gòu),器件的集成度 和速度,模塊、插件、底板的劃分與連接,信號(hào)傳輸,電源、冷卻及整機(jī)裝配技術(shù)等。系統(tǒng)加速比:對(duì)系統(tǒng)中某部分進(jìn)行改進(jìn)時(shí),改進(jìn)后系統(tǒng)性能提高的倍數(shù)。Amdahl定律:當(dāng)對(duì)一個(gè)系統(tǒng)中的某個(gè)部件進(jìn)行改進(jìn)后,所能獲得的整個(gè)系統(tǒng)性能的提高, 受限于該部件的執(zhí)行時(shí)間占總執(zhí)行時(shí)間的百分比。并行性:計(jì)算機(jī)系

2、統(tǒng)在同一時(shí)刻或者同一時(shí)間間隔內(nèi)進(jìn)行多種運(yùn)算或操作。只要在時(shí)間上相互重疊,就存在并行性。它包括同時(shí)性與并發(fā)性兩種含義。1.2 試用實(shí)例說明計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)、計(jì)算機(jī)組成與計(jì)算機(jī)實(shí)現(xiàn)之間的相互關(guān)系。答:如在設(shè)計(jì)主存系統(tǒng)時(shí),確定主存容量、編址方式、尋址范圍等屬于計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)。確 定主存周期、邏輯上是否采用并行主存、邏輯設(shè)計(jì)等屬于計(jì)算機(jī)組成。選擇存儲(chǔ)芯片類型、 微組裝技術(shù)、線路設(shè)計(jì)等屬于計(jì)算機(jī)實(shí)現(xiàn)。計(jì)算機(jī)組成是計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的邏輯實(shí)現(xiàn)。計(jì)算機(jī)實(shí)現(xiàn)是計(jì)算機(jī)組成的物理實(shí)現(xiàn)。一種 體系結(jié)構(gòu)可以有多種組成。一種組成可以有多種實(shí)現(xiàn)。1.4 計(jì)算機(jī)系統(tǒng)設(shè)計(jì)中經(jīng)常使用的4個(gè)定量原理是什么?并說出它們的含義。答:(1)

3、以經(jīng)常性事件為重點(diǎn)。在計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)中,對(duì)經(jīng)常發(fā)生的情況,賦予它優(yōu)先的處理權(quán)和資源使用權(quán),以得到更多的總體上的改進(jìn)。(2) Amdahl定律。加快某部件執(zhí)行速度所獲得的系統(tǒng)性能加速比,受限于該部件在系統(tǒng)中所占的重要性。(3) CPU性能公式。執(zhí)行一個(gè)程序所需的 CPU時(shí)間=IC XCPI X時(shí)鐘周期時(shí)間。(4)程序的局部性原理。程 序在執(zhí)行時(shí)所訪問地址的分布不是隨機(jī)的,而是相對(duì)地簇聚。1.6某臺(tái)主頻為400MHz的計(jì)算機(jī)執(zhí)行標(biāo)準(zhǔn)測(cè)試程序,程序中指令類型、執(zhí)行數(shù)量和平均時(shí) 鐘周期數(shù)如下:指令類型指令執(zhí)行數(shù)量平均時(shí)鐘周期數(shù)整數(shù)450001數(shù)據(jù)傳送750002浮點(diǎn)80004分支15002求該計(jì)算機(jī)

4、的有效 CPI、MIPS和程序執(zhí)行時(shí)間。解:(1) CPI =(45000X 1 +75000X2+ 8000X4+ 1500X 2)/ 129500= 1.776(2) MIPS 速率=f/ CPI =400/1.776 = 225.225MIPS(3)程序執(zhí)行時(shí)間 =(45000X 1 +75000X 2+8000X4+ 1500X2)/400=575s1.7將計(jì)算機(jī)系統(tǒng)中某一功能的處理速度加快10倍,但該功能的處理時(shí)間僅為整個(gè)系統(tǒng)運(yùn)行時(shí)間的40%,則采用此增強(qiáng)功能方法后,能使整個(gè)系統(tǒng)的性能提高多少?解 由題可知:可改進(jìn)比例 =40% = 0.4部件加速比 =10根據(jù)Amdahl定律可知:

5、1 系統(tǒng)加速比 1.56250.41 0.410采用此增強(qiáng)功能方法后,能使整個(gè)系統(tǒng)的性能提高到原來的1.5625倍。1.8計(jì)算機(jī)系統(tǒng)中有三個(gè)部件可以改進(jìn),這三個(gè)部件的部件加速比為: 部件加速比1=30;部件加速比2=20;部件加速比3=10(1) 如果部件1和部件2的可改進(jìn)比例均為 30%,那么當(dāng)部件 3的可改進(jìn)比例為多 少時(shí),系統(tǒng)加速比才可以達(dá)到10?(2) 如果三個(gè)部件的可改進(jìn)比例分別為30%、30%和20%,三個(gè)部件同時(shí)改進(jìn), 那么系統(tǒng)中不可加速部分的執(zhí)行時(shí)間在總執(zhí)行時(shí)間中占的比例是多少?解:(1)在多個(gè)部件可改進(jìn)情況下,Amdahl定理的擴(kuò)展:Sn-(1Fi)FiS第3頁共17頁Fi=

6、0.3, F2=0.3,得:已知 Si = 30, S2=20, S3=10, Sn=10,1011-(0.3 0.3 F3) (0.3/30 0.3/20 F3/10)得F3 = 0.36,即部件3的可改進(jìn)比例為 36%。(2)設(shè)系統(tǒng)改進(jìn)前的執(zhí)行時(shí)間為 T,則3個(gè)部件改進(jìn)前的執(zhí)行時(shí)間為:(0.3+0.3+0.2)T = 0.8T,不可改進(jìn)部分的執(zhí)行時(shí)間為0.2T。已知3個(gè)部件改進(jìn)后的加速比分別為Si=30, S2 = 20, S3=10,因此3個(gè)部件改進(jìn)后的執(zhí)行時(shí)間為:0.3T0.3T 0.2TTn0.045T302010改進(jìn)后整個(gè)系統(tǒng)的執(zhí)行時(shí)間為:Tn = 0.045T+0.2T = 0.

7、245T那么系統(tǒng)中不可改進(jìn)部分的執(zhí)行時(shí)間在總執(zhí)行時(shí)間中占的比例是:0.2T0.245T0.821.9假設(shè)某應(yīng)用程序中有 4類操作,通過改進(jìn),各操作獲得不同的性能提高。具體數(shù)據(jù)如下 表所示:操作類型程序中的數(shù)量 (百萬條指令)改進(jìn)前的執(zhí)行時(shí)間 (周期)改進(jìn)后的執(zhí)行時(shí)間 (周期)操彳11021操彳2302015操彳335103操彳41541(1)改進(jìn)后,各類操作的加速比分別是多少?(2)各類操作單獨(dú)改進(jìn)后,程序獲得的加速比分別是多少?(3) 4類操作均改進(jìn)后,整個(gè)程序的加速比是多少?操作類型各類操作的指令條數(shù)在 程序中所占的比例Fi各類操作的加速比Si各類操作單獨(dú)改進(jìn)后, 程序獲得的加速比操彳11

8、1.1%21.06操彳233.3%1.331.09操彳338.9%3.331.37操彳416.7%41.14解:根據(jù)Amdahl定律Sn(1 Fe)可得FeSe4類操作均改進(jìn)后,整個(gè)程序的加速比:-1Sn 2.16(1 Fi )£Si第2章指令集結(jié)構(gòu)的分類2.1 解釋下列術(shù)語堆棧型機(jī)器:CPU中存儲(chǔ)操作數(shù)的單元是堆棧的機(jī)器。累加器型機(jī)器:CPU中存儲(chǔ)操作數(shù)的單元是累加器的機(jī)器。通用寄存器型機(jī)器:CPU中存儲(chǔ)操作數(shù)的單元是通用寄存器的機(jī)器。2.2 區(qū)別不同指令集結(jié)構(gòu)的主要因素是什么?根據(jù)這個(gè)主要因素可將指令集結(jié)構(gòu)分為哪3類?答:區(qū)別不同指令集結(jié)構(gòu)的主要因素是CPU中用來存儲(chǔ)操作數(shù)的存儲(chǔ)

9、單元。據(jù)此可將指令系統(tǒng)結(jié)構(gòu)分為堆棧結(jié)構(gòu)、累加器結(jié)構(gòu)和通用寄存器結(jié)構(gòu)。2.4 指令集應(yīng)滿足哪幾個(gè)基本要求?答:對(duì)指令集的基本要求是:完整性、規(guī)整性、高效率和兼容性。完整性是指在一個(gè)有限可用的存儲(chǔ)空間內(nèi),對(duì)于任何可解的問題, 編制計(jì)算程序時(shí),指令集所提供的指令足夠使用。規(guī)整性主要包括對(duì)稱性和均勻性。對(duì)稱性是指所有與指令集有關(guān)的存儲(chǔ)單元的使用、操作碼的設(shè)置等都是對(duì)稱的。均勻性是指對(duì)于各種不同的操作數(shù)類型、字長(zhǎng)、操作種類和數(shù)據(jù)存儲(chǔ)單元,指令的設(shè)置都要同等對(duì)待。高效率是指指令的執(zhí)行速度快、使用頻度高。2.7 簡(jiǎn)述RISC指令集結(jié)構(gòu)的設(shè)計(jì)原則。答(1)選取使用頻率最高的指令,并補(bǔ)充一些最有用的指令;(2)

10、每條指令的功能應(yīng)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)盡可能簡(jiǎn)單,并在一個(gè)機(jī)器周期內(nèi)完成;( 3) 所有指令長(zhǎng)度均相同;( 4) 只有 Load 和 Store操作指令才訪問存儲(chǔ)器,其它指令操作均在寄存器之間進(jìn)行;(5) 以簡(jiǎn)單有效的方式支持高級(jí)語言。2.10 通常有哪幾種指令格式,請(qǐng)簡(jiǎn)述其適用范圍。答: (1) 變長(zhǎng)編碼格式。如果系統(tǒng)結(jié)構(gòu)設(shè)計(jì)者感興趣的是程序的目標(biāo)代碼大小,而不是性能,就可以采用變長(zhǎng)編碼格式。( 2)固定長(zhǎng)度編碼格式。如果感興趣的是性能,而不是程序的目標(biāo)代碼大小,則可以選擇固定長(zhǎng)度編碼格式。(3) 混合型編碼格式。需要兼顧降低目標(biāo)代碼長(zhǎng)度和降低譯碼復(fù)雜度時(shí),可以采用混合型編碼格式。第 3 章 流水線

11、技術(shù)3.1 解釋下列術(shù)語流水線:將一個(gè)重復(fù)的時(shí)序過程,分解成為若干個(gè)子過程,而每一個(gè)子過程都可有效地在其專用功能段上與其它子過程同時(shí)執(zhí)行。吞吐率:在單位時(shí)間內(nèi)流水線所完成的任務(wù)數(shù)量或輸出結(jié)果的數(shù)量。流水線的加速比:使用順序處理方式處理一批任務(wù)所用的時(shí)間與按流水處理方式處理同一批任務(wù)所用的時(shí)間之比。數(shù)據(jù)相關(guān): 考慮兩條指令i 和 j, i 在 j 的前面,如果下述條件之一成立,則稱指令j 與指令i 數(shù)據(jù)相關(guān):( 1)指令 j 使用指令i 產(chǎn)生的結(jié)果;( 2)指令j 與指令 k 數(shù)據(jù)相關(guān),而指令k 又與指令i 數(shù)據(jù)相關(guān)。數(shù)據(jù)沖突:當(dāng)指令在流水線中重疊執(zhí)行時(shí),因需要用到前面指令的執(zhí)行結(jié)果而發(fā)生的沖突

12、。定向: 用來解決寫后讀沖突的。在發(fā)生寫后讀相關(guān)的情況下,在計(jì)算結(jié)果尚未出來之前,后面等待使用該結(jié)果的指令并不見得是馬上就要用該結(jié)果。如果能夠?qū)⒃撚?jì)算結(jié)果從其產(chǎn)生的地方直接送到其它指令需要它的地方,那么就可以避免停頓。鏈接技術(shù):具有先寫后讀相關(guān)的兩條指令,在不出現(xiàn)功能部件沖突和Vi沖突的情況下,可以把功能部件鏈接起來進(jìn)行流水處理,以達(dá)到加快執(zhí)行的目的。分段開采:當(dāng)向量的長(zhǎng)度大于向量寄存器的長(zhǎng)度時(shí),循環(huán)分段處理,每一次循環(huán)只處理一個(gè)向量段。3.3 簡(jiǎn)述先行控制的基本思想。答: 先行控制技術(shù)是把緩沖技術(shù)和預(yù)處理技術(shù)相結(jié)合。功能部件之間設(shè)置緩沖器,用以平滑它們的工作。工以及預(yù)取操作數(shù)等。采用先行控制

13、方式的處理機(jī)內(nèi)部設(shè)置多個(gè)緩沖站,器三者之間的工作。這樣不僅使它們都能獨(dú)立地工作,令分析部件和運(yùn)算器分別能快速地取得指令和操作數(shù),緩沖技術(shù)是在工作速度不固定的兩個(gè)預(yù)處理技術(shù)是指預(yù)取指令、對(duì)指令進(jìn)行加用于平滑主存、指令分析部件、運(yùn)算充分忙碌而不用相互等待,而且使指大幅度地提高指令的執(zhí)行速度和部件必須把長(zhǎng)向量分成長(zhǎng)度固定的段,然后的效率。 這些緩沖站都按先進(jìn)先出的方式工作,而且都是由一組若干個(gè)能快速訪問的存儲(chǔ)單元和相關(guān)的控制邏輯組成。采用先行控制技術(shù)可以實(shí)現(xiàn)多條指令的重疊解釋執(zhí)行。3.4 設(shè)一條指令的執(zhí)行過程分成取指令、分析指令和執(zhí)行指令三個(gè)階段,每個(gè)階段所需的時(shí)間分別為 t、at和24t。分別求出

14、下列各種情況下,連續(xù)執(zhí)行n條指令所需的時(shí)間。( 1)順序執(zhí)行方式;( 2)只有“取指令”與“執(zhí)行指令”重疊;( 3) “取指令”、 “分析指令”與“執(zhí)行指令”重疊。解:(1)每條指令的執(zhí)行時(shí)間為: t+4t + 24t=44t連續(xù)執(zhí)行N條指令所需的時(shí)間為:4NAt(2)連續(xù)執(zhí)行N條指令所需的時(shí)間為:4At+3 (N-1) At= (3N+1) At(3)連續(xù)執(zhí)行N條指令所需的時(shí)間為:4At+2 (N-1) At= (2N+2) At3.5 簡(jiǎn)述流水線技術(shù)的特點(diǎn)。答:流水技術(shù)有以下特點(diǎn):(1) 流水線把一個(gè)處理過程分解為若干個(gè)子過程,每個(gè)子過程由一個(gè)專門的功能部件來實(shí)現(xiàn)。因此, 流水線實(shí)際上是把

15、一個(gè)大的處理功能部件分解為多個(gè)獨(dú)立的功能部件,并依靠它們的并行工作來提高吞吐率。(2) 流水線中各段的時(shí)間應(yīng)盡可能相等,否則將引起流水線堵塞和斷流。(3) 流水線每一個(gè)功能部件的前面都要有一個(gè)緩沖寄存器,稱為流水寄存器。(4) 流水技術(shù)適合于大量重復(fù)的時(shí)序過程,只有在輸入端不斷地提供任務(wù),才能充分發(fā)揮流水線的效率。(5) 流水線需要有通過時(shí)間和排空時(shí)間。在這兩個(gè)時(shí)間段中,流水線都不是滿負(fù)荷工作。3.6 解決流水線瓶頸問題有哪兩種常用方法? 答:細(xì)分瓶頸段與重復(fù)設(shè)置瓶頸段3.10 簡(jiǎn)述三種向量處理方式,它們對(duì)向量處理機(jī)的結(jié)構(gòu)要求有何不同?答(1)橫向處理方式:若向量長(zhǎng)度為N則水平處理方式相當(dāng)于執(zhí)

16、行N次循環(huán)。若使用流水線,在每次循環(huán)中可能出現(xiàn)數(shù)據(jù)相關(guān)和功能轉(zhuǎn)換,不適合對(duì)向量進(jìn)行流水處理。(2)縱向處理方式:將整個(gè)向量按相同的運(yùn)算處理完畢之后,再去執(zhí)行其他運(yùn)算。適合對(duì)向量進(jìn)行流水處理,向量運(yùn)算指令的源/ 目向量都放在存儲(chǔ)器內(nèi),使得流水線運(yùn)算部件的輸入、輸出端直接與存儲(chǔ)器相聯(lián),構(gòu)成M-M型的運(yùn)算流水線。(3)縱橫處理方式:把長(zhǎng)度為N的向量 分為若干組,每組長(zhǎng)度為 n,組內(nèi)按縱向方式處理,依次處理各組,組數(shù)為 N/n,適合流 水處理??稍O(shè)長(zhǎng)度為n 的向量寄存器,使每組向量運(yùn)算的源/ 目向量都在向量寄存器中,流水線的運(yùn)算部件輸入、輸出端與向量寄存器相聯(lián),構(gòu)成R-R型運(yùn)算流水線。3.11 可采用

17、哪些方法來提高向量處理機(jī)的性能?答:可采用多種方法: 1) 1)設(shè)置多個(gè)功能部件,使它們并行工作; 2) 2)采用鏈接技術(shù),加快一串向量指令的執(zhí)行;第 7 頁 共 17 頁計(jì)算機(jī)系統(tǒng)結(jié)構(gòu) 3) 采用循環(huán)開采技術(shù),加快循環(huán)的處理; 4) 采用多處理機(jī)系統(tǒng),進(jìn)一步提高性能。3.12 有一指令流水線如下所示入一1 T 2 一 3 一 4出50ns 50ns 100ns200ns(1)求連續(xù)輸入10條指令,該流水線的實(shí)際吞吐率和效率;(2)該流水線的 瓶頸”在哪一段?請(qǐng)采取兩種不同的措施消除此瓶頸”。對(duì)于你所給出的兩種新的流水線,連續(xù)輸入10條指令時(shí),其實(shí)際吞吐率和效率各是多少?解:(1)mT pip

18、elineti ( n 1)tmaxi 1(50 50 100 200) 9 2002200(ns)TPnT pipeline1220 ms )23 t第9頁共17頁m ti i 1 i4005E TP TP45.45%m411(2)瓶頸在3、4段。變成八級(jí)流水線(細(xì)分)入11150ns一 ,出2一 3_1一 3_2_ 4_1一4_4一50ns 50ns50ns50ns50nsmT pipelineti (n 1) tmaxi 150 8 9 50850(ns)TP n4pipeline185 ms )mtii 140010E TP - TP58.82%m817重復(fù)設(shè)置部件TP nTpipel

19、ine185 ms )E 400 101058 82%E850 817 58.82%52481323456789345678910時(shí)間能流到第4 一次所需 問:段。如果每段經(jīng)過要的時(shí)間都是 t,850ns3.13 有一個(gè)流水線由4段組成,其中每當(dāng)流經(jīng)第 3段時(shí),總要在該段循環(huán)一次,然后才(1)當(dāng)在流 水線的 輸入端 連續(xù)地 每 t時(shí)間輸入任務(wù)時(shí),該流水線會(huì)發(fā)生什么情況?(2)此流水線的最大吞吐率為多少?如果每 2 t輸入一個(gè)任務(wù),連續(xù)處理 10個(gè)任務(wù) 時(shí)的實(shí)際吞吐率和效率是多少?4321時(shí)間(3)當(dāng)每段時(shí)間不變時(shí),如何提高該流水線的吞吐率?仍連續(xù)處理10個(gè)任務(wù)時(shí),其吞吐率提高多少?解:(1)會(huì)

20、發(fā)生流水線阻塞情況。第1個(gè)任務(wù)S1S2S3S3S4第2個(gè)任務(wù)S1S2stallS3S3S4第3個(gè)任務(wù)S1stallS2stallS3S3S4第4個(gè)任務(wù)S1stallS2stallS3S3S4TPmax23 tpipeline54.35%(3)重復(fù)設(shè)置部件時(shí)間14 tTPnT pipeline吞吐率提高倍數(shù)=3.14 有一條靜態(tài)多功能流水線由5段組成,加法用1、3、4、5段,乘法用1、2、5段,第3段的時(shí)間為24t,其余各段的時(shí)間均為 t,而且流水線的輸出可以直接返回輸入端或(Ai Bi),畫出其時(shí)空?qǐng)D,并計(jì) i 1暫存于相應(yīng)的流水寄存器中?,F(xiàn)要在該流水線上計(jì)算 算其吞吐率、加速比和效率。計(jì)算機(jī)

21、系統(tǒng)結(jié)構(gòu)解:首先,應(yīng)選擇適合于流水線工作的算法。對(duì)于本題,應(yīng)先計(jì)算Ai+Bi、A2+B2、A3+B3和 A4+B4;再計(jì)算(Ai+Bi) X (A2+B2)和(A3+B3) X(A4+B4);然后求總的結(jié)果。其次,畫出完成該計(jì)算的時(shí)空?qǐng)D,如圖所示,圖中陰影部分表示該段在工作。段54321輸入Bi B2 B3 B4B DCX D由圖可見,它在i8個(gè)At時(shí)間中,給出了TP7個(gè)結(jié)果。所以吞吐率為:7is"!如果不用流水線,由于一次求積需(4X5+3X3) At =29Ato所以加速比為:3At, 一次求和需54t,則產(chǎn)生上述 7個(gè)結(jié)果共需29 ti87i.6i該流水線的效率可由陰影區(qū)的面積

22、和5個(gè)段總時(shí)空區(qū)的面積的比值求得:4 5 3 35 i80.322第4章指令級(jí)并行第#頁共17頁3.15 動(dòng)態(tài)多功能流水線由 6個(gè)功能段組成,如下圖:加法乘法其中,Si、S4、S5、S6組成乘法流水線,Si、S2、S3、S6組成加法流水線,各個(gè)功能段時(shí)間均為 50ns,假設(shè)該流水線的輸出結(jié)果可以直接返回輸入端,而且設(shè)置有足夠的緩沖5寄存器,若以最快的方式用該流水計(jì)算:xiyizii i(i)畫出時(shí)空?qǐng)D;(2)計(jì)算實(shí)際的吞吐率、加速比和效率。解:機(jī)器一共要做i0次乘法,4次加法。42.421效率=3.18在CRAY-1機(jī)器上,按照鏈接方式執(zhí)行下述4條向量指令(括號(hào)中給出了相應(yīng)功能部件的執(zhí)行時(shí)間)

23、,如果向量寄存器和功能部件之間的數(shù)據(jù)傳送需要1拍,試求此鏈接流水線的通過時(shí)間是多少拍?如果向量長(zhǎng)度為64,則需多少拍才能得到全部結(jié)果?V 0一存儲(chǔ)器(從存儲(chǔ)器中取數(shù):7拍)V 2-Vo+Vi(向量加:3拍)V 3-2 2VA 3(按(A3 左移:4 拍)V 5-3 3A V4(向量邏輯乘:2拍)解:通過時(shí)間就是每條向量指令的第一個(gè)操作數(shù)執(zhí)行完畢需要的時(shí)間,也就是各功能流 水線由空到滿的時(shí)間,具體過程如下圖所示。要得到全部結(jié)果,在流水線充滿之后,向 量中后繼操作數(shù)繼續(xù)以流水方式執(zhí)行,直到整組向量執(zhí)行完畢。,A3 IT 通過=(7+1) + (1+ 3+1) + (1+4+1) + (1+ 2+1

24、) =23(拍)T 總共 T 通過+ (641) =23+ 63= 86(拍)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)4.1 解釋下列術(shù)語指令級(jí)并行:簡(jiǎn)稱ILP。是指指令之間存在的一種并行性,利用它,計(jì)算機(jī)可以并行執(zhí)行兩 條或兩條以上的指令。指令調(diào)度:通過在編譯時(shí)讓編譯器重新組織指令順序或通過硬件在執(zhí)行時(shí)調(diào)整指令順序來消除沖突。指令的動(dòng)態(tài)調(diào)度:是指在保持?jǐn)?shù)據(jù)流和異常行為的情況下,通過硬件對(duì)指令執(zhí)行順序進(jìn)行重新安排,以提高流水線的利用率且減少停頓現(xiàn)象。是由硬件在程序?qū)嶋H運(yùn)行時(shí)實(shí)施的。指令的靜態(tài)調(diào)度:是指依靠編譯器對(duì)代碼進(jìn)行靜態(tài)調(diào)度,以減少相關(guān)和沖突。它不是在程序執(zhí)行的過程中、而是在編譯期間進(jìn)行代碼調(diào)度和優(yōu)化的。保留站:在

25、采用Tomasulo 算法的 MIPS 處理器浮點(diǎn)部件中,在運(yùn)算部件的入口設(shè)置的用來保存一條已經(jīng)流出并等待到本功能部件執(zhí)行的指令(相關(guān)信息)。4.2 簡(jiǎn)述 Tomasulo 算法的基本思想。答:核心思想是: 記錄和檢測(cè)指令相關(guān),操作數(shù)一旦就緒就立即執(zhí)行,把發(fā)生 RAW 沖突的可能性減小到最少;通過寄存器換名來消除 WAR沖突和 WAW沖突。寄存器換名是通過保留站來實(shí)現(xiàn),它保存等待流出和正在流出指令所需要的操作數(shù)?;舅枷耄褐灰僮鲾?shù)有效,就將其取到保留站,避免指令流出時(shí)才到寄存器中取數(shù)據(jù),這就使得即將執(zhí)行的指令從相應(yīng)的保留站中取得操作數(shù),而不是從寄存器中。指令的執(zhí)行結(jié)果也是直接送到等待數(shù)據(jù)的其

26、它保留站中去。因而, 對(duì)于連續(xù)的寄存器寫,只有最后一個(gè)才真正更新寄存器中的內(nèi)容。一條指令流出時(shí),存放操作數(shù)的寄存器名被換成為對(duì)應(yīng)于該寄存器保留站的名稱(編號(hào))。第 5 章 存儲(chǔ)層次5.1 解釋下列術(shù)語失效開銷:CPU 向二級(jí)存儲(chǔ)器發(fā)出訪問請(qǐng)求到把這個(gè)數(shù)據(jù)調(diào)入一級(jí)存儲(chǔ)器所需的時(shí)間。強(qiáng)制性失效:當(dāng)?shù)谝淮卧L問一個(gè)塊時(shí),該塊不在Cache 中, 需要從下一級(jí)存儲(chǔ)器中調(diào)入Cache,這就是強(qiáng)制性失效。容量失效:如果程序在執(zhí)行時(shí),所需要的塊不能全部調(diào)入Cache中,則當(dāng)某些塊被替換后又重新被訪問,就會(huì)產(chǎn)生失效,這種失效就稱作容量失效。沖突失效:在組相聯(lián)或直接映象Cache中,若太多的塊映象到同一組(塊)中

27、,則會(huì)出現(xiàn)該組中某個(gè)塊被別的塊替換(即使別的組或塊有空閑位置),然后又被重新訪問的情況。2: 1Cache 經(jīng)驗(yàn)規(guī)則:大小為N 的直接映象Cache 的失效率約等于大小為N /2 的兩路組相聯(lián) Cache 的實(shí)效率。Victim Cache:位于Cache和存儲(chǔ)器之間的又一級(jí) Cache,容量小,采用全相聯(lián)策略。用于 存放由于失效而被丟棄(替換)的那些塊。每當(dāng)失效發(fā)生時(shí),在訪問下一級(jí)存儲(chǔ)器之前,先檢查 Victim Cache 中是否含有所需塊。非阻塞Cache: Cache在等待預(yù)取數(shù)據(jù)返回時(shí),還能繼續(xù)提供指令和數(shù)據(jù)。請(qǐng)求字優(yōu)先:調(diào)塊時(shí),首先向存儲(chǔ)器請(qǐng)求CPU 所要的請(qǐng)求字。請(qǐng)求字一旦到達(dá),

28、就立即送往CPU,讓CPU繼續(xù)執(zhí)行,同時(shí)從存儲(chǔ)器調(diào)入該塊的其余部分。5.4降低Cache失效率有哪幾種方法?簡(jiǎn)述其基本思想。答:常用的降低 Cache失效率的方法有下面幾種:(1)增加Cache塊大小。增加塊大小利用了程序的空間局部性。(2)增加Cache的容量。( 3) 提高相聯(lián)度,降低沖突失效。(4)偽相聯(lián)Cache,降低沖突失效。當(dāng)對(duì)偽相聯(lián)Cache進(jìn)行訪問時(shí),首先是按與直接映象相同的方式進(jìn)行訪問。如果命中,則從相應(yīng)的塊中取出所訪問的數(shù)據(jù),送給CPU,訪問結(jié)束。如果不命中,就將索引字段的最高位取反,然后按照新索引去尋找“偽相聯(lián)組”中的對(duì)應(yīng)塊。如果這一塊的標(biāo)識(shí)匹配,則稱發(fā)生了“偽命中 ”。

29、否則,就訪問下一級(jí)存儲(chǔ)器。( 5) 硬件預(yù)取技術(shù)。在處理器提出訪問請(qǐng)求前預(yù)取指令和數(shù)據(jù)。( 6) 由編譯器控制的預(yù)取,硬件預(yù)取的替代方法,在編譯時(shí)加入預(yù)取的指令,在數(shù)據(jù) 被用到之前發(fā)出預(yù)取請(qǐng)求。( 7) 編譯器優(yōu)化,通過對(duì)軟件的優(yōu)化來降低失效率。( 8) “犧牲" Cacheo在Cache和其下一級(jí)存儲(chǔ)器的數(shù)據(jù)通路之間增設(shè)一個(gè)全相聯(lián)的小Cache,存放因沖突而被替換出去的那些塊。每當(dāng)發(fā)生不命中時(shí),在訪問下一級(jí)存儲(chǔ)器之 前,先檢查“犧牲”Cache中是否含有所需的塊。如果有,就將該塊與Cache中某個(gè)塊做交換,把所需的塊從“犧牲”Cache 調(diào)入Cache。5.5 簡(jiǎn)述減小Cache失

30、效開銷的幾種方法。答:讓讀失效優(yōu)先于寫、寫緩沖合并、請(qǐng)求字處理技術(shù)、非阻塞Cache或非鎖定Cache技術(shù)、采用二級(jí)Cache。5.6 通過編譯器對(duì)程序優(yōu)化來改進(jìn)Cache性能的方法有哪幾種?簡(jiǎn)述其基本思想。答: ( 1 )數(shù)組合并。通過提高空間局部性來減少失效次數(shù)。有些程序同時(shí)用相同的索引來訪問若干個(gè)數(shù)組的同一維,這些訪問可能會(huì)相互干擾,導(dǎo)致沖突失效,可以將這些相互獨(dú)立的數(shù)組合并成一個(gè)復(fù)合數(shù)組,使得一個(gè)Cache塊中能包含全部所需元素。(2)內(nèi)外循環(huán)交換。 循環(huán)嵌套時(shí),程序沒有按數(shù)據(jù)在存儲(chǔ)器中的順序訪問。只要簡(jiǎn)單地交換內(nèi)外循環(huán),就能使程序按數(shù)據(jù)在存儲(chǔ)器中的存儲(chǔ)順序進(jìn)行訪問。( 3) 循環(huán)融合

31、。有些程序含有幾部分獨(dú)立的程序段,它們用相同的循環(huán)訪問同樣的數(shù)組,對(duì)相同的數(shù)據(jù)作不同的運(yùn)算。通過將它們?nèi)诤铣梢粋€(gè)單一循環(huán),能使讀入Cache 的數(shù)據(jù)被替換出去之前得到反復(fù)的使用。( 4)分塊。通過改進(jìn)時(shí)間局部性來減少失效。分塊不是對(duì)數(shù)組的整行或整列進(jìn)行訪問,而是對(duì)子矩陣或塊進(jìn)行操作。5.10 假設(shè)對(duì)指令 Cache的訪問占全部訪問的75%;而對(duì)數(shù)據(jù) Cache的訪問占全部訪問第 15 頁 共 17 頁計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)的25%。Cache的命中時(shí)間為1個(gè)時(shí)鐘周期,失效開銷為 50個(gè)時(shí)鐘周期,在混合 Cache中 一次load或store操作訪問Cache的命中時(shí)間都要增加一個(gè)時(shí)鐘周期,32KB的指

32、令Cache的失效率為0.39%, 32KB的數(shù)據(jù) Cache的失效率為4.82%, 64KB的混合 Cache的失效率為 1.35%。又假設(shè)采用寫直達(dá)策略,且有一個(gè)寫緩沖器,并且忽略寫緩沖器引起的等待。試問指令Cache和數(shù)據(jù)Cache容量土勻?yàn)?2KB的分離 Cache和容量為64KB的混合Cache相比, 哪種Cache的失效率更低??jī)煞N情況下平均訪存時(shí)間各是多少?解:(1)根據(jù)題意,約75%的訪存為取指令。因此,分離 Cache 的總體失效率為:(75%X0.15%) + ( 25% X 3.77%) = 1.055%;容量為128KB的混合Cache的失效率略低一些,只有 0.95%

33、。(2)平均訪存時(shí)間公式可以分為指令訪問和數(shù)據(jù)訪問兩部分:平均訪存時(shí)間=指令所占的百分比X (讀命中時(shí)間+讀失效率X失效開銷)+ 數(shù)據(jù)所占的百分比X (數(shù)據(jù)命中時(shí)間+數(shù)據(jù)失效率X失效開銷)所以,兩種結(jié)構(gòu)的平均訪存時(shí)間分別為:分離 Cache 的平均訪存時(shí)間= 75% X (1+0.15%X50) + 25% X (1 + 3.77%X50) =(75% X 1.075) + ( 25% X 2.885) = 1.5275混合 Cache 的平均訪存時(shí)間= 75% x (1+0.95%X50) + 25% x ( 1 + 1 + 0.95% x 50) =(75% X 1.475) + ( 25

34、% X 2.475) = 1.725因此,盡管分離 Cache的實(shí)際失效率比混合 Cache的高,但其平均訪存時(shí)間反而較低。分離Cache提供了兩個(gè)端口,消除了結(jié)構(gòu)相關(guān)。第6章輸入輸出系統(tǒng)6.1 解釋以下術(shù)語可靠性:指系統(tǒng)從某個(gè)初始參考點(diǎn)開始一直連續(xù)提供服務(wù)的能力,它通常用平均無故障時(shí)間來衡量??捎眯裕褐赶到y(tǒng)正常工作的時(shí)間在連續(xù)兩次正常服務(wù)間隔時(shí)間中所占的比率??尚判裕褐阜?wù)的質(zhì)量,即在多大程度上可以合理地認(rèn)為服務(wù)是可靠的。分離事務(wù)總線:將總線事務(wù)分成請(qǐng)求和應(yīng)答兩部分。在請(qǐng)求和應(yīng)答之間的空閑時(shí)間內(nèi),總線可以供給其它的I/O使用。采用這種技術(shù)的總線稱為分離事務(wù)總線。通道:專門負(fù)責(zé)整個(gè)計(jì)算機(jī)系統(tǒng)輸

35、入/輸出工作的專用處理機(jī),能執(zhí)行有限的一組輸入輸出指令。6.2 假設(shè)一臺(tái)計(jì)算機(jī)的I/O處理時(shí)間占10%,當(dāng)其CPU性能改進(jìn)為原來的100倍,而I/O性 能僅改進(jìn)為原來的2倍時(shí),系統(tǒng)總體性能會(huì)有什么樣的變化?解:加速比110%/2 90%/10016.94第17頁共17頁6.3 RAID有哪些分級(jí)?各有何特點(diǎn)?計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)答: (1) RAID0 。亦稱數(shù)據(jù)分塊,即把數(shù)據(jù)分布在多個(gè)盤上,實(shí)際上是非冗余陣列,無冗余信息。(2)RAID1 。亦稱鏡像盤,使用雙備份磁盤。每當(dāng)數(shù)據(jù)寫入一個(gè)磁盤時(shí),將該數(shù)據(jù)也寫到另一個(gè)冗余盤,這樣形成信息的兩份復(fù)制品。如果一個(gè)磁盤失效,系統(tǒng)可以到鏡像盤中獲得所需要的信息

36、。鏡像是最昂貴的解決方法。特點(diǎn)是系統(tǒng)可靠性很高,但效率很低。(3)RAID2 。位交叉式海明編碼陣列。即數(shù)據(jù)以位或字節(jié)交叉的方式存于各盤,采用海明編碼。原理上比較優(yōu)越,但冗余信息的開銷太大,因此未被廣泛應(yīng)用。(4)RAID3 。位交叉奇偶校驗(yàn)盤陣列,是單盤容錯(cuò)并行傳輸?shù)年嚵?。即?shù)據(jù)以位或字節(jié)交叉的方式存于各盤,冗余的奇偶校驗(yàn)信息存儲(chǔ)在一臺(tái)專用盤上。(5)RAID4 。專用奇偶校驗(yàn)獨(dú)立存取盤陣列。即數(shù)據(jù)以塊 (塊大小可變)交叉的方式存于各盤,冗余的奇偶校驗(yàn)信息存在一臺(tái)專用盤上。(6)RAID5 。塊交叉分布式奇偶校驗(yàn)盤陣列,是旋轉(zhuǎn)奇偶校驗(yàn)獨(dú)立存取的陣列。即數(shù)據(jù)以塊交叉的方式存于各盤,但無專用的校

37、驗(yàn)盤,而是把冗余的奇偶校驗(yàn)信息均勻地分布在所有磁盤上。(7)RAID6 。雙維奇偶校驗(yàn)獨(dú)立存取盤陣列。即數(shù)據(jù)以塊(塊大小可變)交叉的方式存于各盤,冗余的檢、糾錯(cuò)信息均勻地分布在所有磁盤上。并且, 每次寫入數(shù)據(jù)都要訪問一個(gè)數(shù)據(jù)盤和兩個(gè)校驗(yàn)盤,可容忍雙盤出錯(cuò)。6.5 計(jì)算機(jī)系統(tǒng)字長(zhǎng)32 位, 包含兩個(gè)選擇通道和一個(gè)多路通道,每個(gè)選擇通道上連接了兩臺(tái)磁盤機(jī)和兩臺(tái)磁帶機(jī),多路通道上連接了了兩臺(tái)行式打印機(jī),兩臺(tái)讀卡機(jī),10 臺(tái)終端,假定各設(shè)備的傳輸率如下:磁盤機(jī):800KBps磁帶機(jī):200KBps行打機(jī):6.6KBps讀卡機(jī):1.2KBps終 端: 1KBps計(jì)算該計(jì)算機(jī)系統(tǒng)的最大I/O 數(shù)據(jù)傳輸率。

38、解:本題要求計(jì)算通道的吞吐率,而且機(jī)器有一個(gè)多路通道,這就有兩種可能:字節(jié)多路通道和數(shù)組多路通道。因?yàn)槿绻麑⒍嗦吠ǖ澜M織成數(shù)組多路通道,某個(gè)時(shí)刻通道只能為一臺(tái)設(shè)備傳送數(shù)據(jù),所以它的傳輸率是所有設(shè)備的傳輸率的最大值,而如果將它組織成字節(jié)多路通道,該通道的最大傳輸率就是所有設(shè)備的傳輸率之和。所以在本題中,從性能上考慮,應(yīng)組織成字節(jié)多路通道形式。所以此類通道的最大傳輸率為:11) fBYTE = E fi = f打印機(jī)傳輸率X 2 + f讀卡機(jī)傳輸率X 2+ f終端傳輸率X 10= 25.6KBps(i = 1.14)( 2)兩個(gè)選擇通道連接的設(shè)備相同,所以只要計(jì)算其中一個(gè)通道的傳輸率既可。因?yàn)榇疟P

39、機(jī)的傳輸率大于磁帶機(jī)。所以此類通道的傳輸率為:max800 , 200 = 800KBps所以本系統(tǒng)的最大數(shù)據(jù)傳輸率為:f系統(tǒng)=2 X 800+ 25.6= 1625.6KBps。6.6 簡(jiǎn)述通道完成一次數(shù)據(jù)傳輸?shù)闹饕^程。答: ( 1 )在用戶程序中使用訪管指令進(jìn)入管理程序,由CPU 通過管理程序組織一個(gè)通道程序, 并啟動(dòng)通道。(2) 通道處理機(jī)執(zhí)行CPU 為它組織的通道程序,完成指定的數(shù)據(jù)I/O工作。 (3) 通道程序結(jié)束后向CPU 發(fā)中斷請(qǐng)求。CPU 響應(yīng)這個(gè)中斷請(qǐng)求后,第二次進(jìn)入操作系統(tǒng),調(diào)用管理程序?qū)/O 中斷請(qǐng)求進(jìn)行處理。第 7 章 互連網(wǎng)絡(luò)7.1 解釋以下術(shù)語靜態(tài)互連網(wǎng)絡(luò):各結(jié)

40、點(diǎn)之間有固定的連接通路、且在運(yùn)行中不能改變的網(wǎng)絡(luò)。動(dòng)態(tài)互連網(wǎng)絡(luò):由交換開關(guān)構(gòu)成、可按運(yùn)行程序的要求動(dòng)態(tài)地改變連接狀態(tài)的網(wǎng)絡(luò)?;ミB函數(shù):用變量x 表示輸入,用函數(shù)f(x) 表示輸出。則f(x) 表示:在互連函數(shù)f 的作用下,輸入端 x 連接到輸出端f(x) 。 它反映了網(wǎng)絡(luò)輸入端數(shù)組和輸出端數(shù)組之間對(duì)應(yīng)的置換關(guān)系或排列關(guān)系,所以互連函數(shù)有時(shí)也稱為置換函數(shù)或排列函數(shù)。網(wǎng)絡(luò)直徑:指互連網(wǎng)絡(luò)中任意兩個(gè)結(jié)點(diǎn)之間距離的最大值。7.3 設(shè) E 為交換函數(shù),S 為均勻洗牌函數(shù),B 為蝶式函數(shù),PM2I 為移數(shù)函數(shù),函數(shù)的自變量是十進(jìn)制數(shù)表示的處理機(jī)編號(hào)。現(xiàn)有32臺(tái)處理機(jī),其編號(hào)為 0, 1, 2,,31。(

41、1)分別計(jì)算下列互連函數(shù)E2(12)S(8)B(9)PM2I+3(28)E0(S(4)S(E0(18)(2)用Eo和S構(gòu)成均勻洗牌交換網(wǎng)(每步只能使用E0和S一次),網(wǎng)絡(luò)直徑是多少?從 5 號(hào)處理機(jī)發(fā)送數(shù)據(jù)到7 號(hào)處理機(jī),最短路徑要經(jīng)過幾步?請(qǐng)列出經(jīng)過的處理機(jī)編號(hào)。( 3)采用移數(shù)網(wǎng)絡(luò)構(gòu)成互連網(wǎng),網(wǎng)絡(luò)直徑是多少?結(jié)點(diǎn)度是多少?與2 號(hào)處理機(jī)距離最遠(yuǎn)的是幾號(hào)處理機(jī)?解: ( 1)共有32 個(gè)處理機(jī),表示處理機(jī)號(hào)的二進(jìn)制地址應(yīng)為5 位。E2 (12) = E2 (01100) = 01000 (8)S (8) = S (01000) = 10000 (16)B (9) = B (01001) =

42、11000 (24)PM2I +3 (28) = 28+ 23 mod32 = 4E0 (S (4) = E0 (S (00100) = 01001 (9)S (E0 (18) = S (E0 (10010) = S (10011) = 00111 (7)(2) 2n個(gè)結(jié)點(diǎn)的均勻洗牌交換網(wǎng)的網(wǎng)絡(luò)直徑為2n-1 , 32個(gè)結(jié)點(diǎn)的均勻洗牌交換網(wǎng)的網(wǎng)絡(luò)直徑為9。從 5 號(hào)處理機(jī)發(fā)送數(shù)據(jù)到7 號(hào)處理機(jī),最短路徑要經(jīng)過6 步:00101f 00100f 01000f 01001f 10010f 10011f 00111( 3)網(wǎng)絡(luò)直徑是3,結(jié)點(diǎn)度是9,與 2 號(hào)處理機(jī)距離最遠(yuǎn)的是13、 15、 21 、

43、 23 號(hào)處理機(jī)。7.7 用一個(gè) N=8 的三級(jí) Omega 網(wǎng)絡(luò)連接8個(gè)處理機(jī)(P0P7) , 8 個(gè)處理機(jī)的輸出端分別依序連接Omega網(wǎng)絡(luò)的8個(gè)輸入端07, 8個(gè)處理機(jī)的輸入端分別依序連接Omega網(wǎng)絡(luò)的8個(gè)輸出端07。如果處理機(jī)P6要把數(shù)據(jù)播送給處理機(jī) P0P4,處理機(jī)P3要把數(shù)據(jù)播送給處 理機(jī)P5P7,那么,Omega網(wǎng)絡(luò)能否同時(shí)為它們的播送要求實(shí)現(xiàn)連接?畫出實(shí)現(xiàn)播送的Omega網(wǎng)絡(luò)的開關(guān)狀態(tài)圖。解:Omega網(wǎng)絡(luò)使用的2X2開關(guān)有4種狀態(tài):直送、交叉、上播、下播。置換連接只使用直送和交叉狀態(tài),播送連接還需要使用上播和下播狀態(tài)。分別畫出實(shí)現(xiàn)處理機(jī)P6和P3的播送連接要求使用的開關(guān)狀態(tài)

44、,如果沒有開關(guān)狀態(tài)和開關(guān)輸出端爭(zhēng)用沖突,就可以使用播送連接。實(shí)際上,它們的播送要求沒有沖突,因此,可以同時(shí)實(shí)現(xiàn),同時(shí)實(shí)現(xiàn)的Omega 網(wǎng)第 19 頁 共 17 頁計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)絡(luò)開關(guān)狀態(tài)圖如下所示。第8章多處理機(jī)8.1 解釋以下術(shù)語集中式共享多處理機(jī):也稱為對(duì)稱式共享存儲(chǔ)器多處理SMP。它一般由幾十個(gè)處理器構(gòu)成,各處理器共享一個(gè)集中式的物理存儲(chǔ)器,這個(gè)主存相對(duì)于各處理器的關(guān)系是對(duì)稱的,分布式共享多處理機(jī): 它的共享存儲(chǔ)器分布在各臺(tái)處理機(jī)中,每臺(tái)處理機(jī)都帶有自己的本地存儲(chǔ)器,組成一個(gè)“處理機(jī) -存儲(chǔ)器”單元。但是這些分布在各臺(tái)處理機(jī)中的實(shí)際存儲(chǔ)器又 合在一起統(tǒng)一編址,在邏輯上組成一個(gè)共享存儲(chǔ)器。

45、這些處理機(jī)存儲(chǔ)器單元通過互連網(wǎng)絡(luò)連接在一起,每臺(tái)處理機(jī)除了能訪問本地存儲(chǔ)器外,還能通過互連網(wǎng)絡(luò)直接訪問在其他處 理機(jī)存儲(chǔ)器單元中的遠(yuǎn)程存儲(chǔ)器”。多Cache 一致性:多處理機(jī)中,當(dāng)共享數(shù)據(jù)進(jìn)入Cache,就可能出現(xiàn)多個(gè)處理器的Cache中都有同一存儲(chǔ)器塊的副本,要保證多個(gè)副本數(shù)據(jù)是一致的。寫作廢協(xié)議:在處理器對(duì)某個(gè)數(shù)據(jù)項(xiàng)進(jìn)行寫入之前,它擁有對(duì)該數(shù)據(jù)項(xiàng)的唯一的訪問權(quán)。寫更新協(xié)議:當(dāng)一個(gè)處理器對(duì)某數(shù)據(jù)項(xiàng)進(jìn)行寫入時(shí),它把該新數(shù)據(jù)廣播給所有其它Cache。這些Cache用該新數(shù)據(jù)對(duì)其中的副本進(jìn)行更新。8.2 一個(gè)具有32臺(tái)處理機(jī)的系統(tǒng),對(duì)遠(yuǎn)程存儲(chǔ)器訪問時(shí)間是 2000ns。除了通信以外, 假設(shè)計(jì)算中的訪問均命中局部存儲(chǔ)器。當(dāng)發(fā)出一個(gè)遠(yuǎn)程請(qǐng)求時(shí),本地處理機(jī)掛起。 處理機(jī)的時(shí)鐘周期時(shí)間是10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論