體系結構概念總結_第1頁
體系結構概念總結_第2頁
體系結構概念總結_第3頁
體系結構概念總結_第4頁
體系結構概念總結_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第1章 計算機系統(tǒng)結構的基本概念層次機構:按照計算機語言從低級到高級的次序,把計算機系統(tǒng)按功能劃分成多級層次結構,每一層以一種不同的語言為特征。這些層次依次為:微程序機器級,傳統(tǒng)機器語言機器級,匯編語言機器級,高級語言機器級,應用語言機器級等。翻譯:先用轉換程序把高一級機器上的程序轉換為低一級機器上等效的程序,然后再在這低一級機器上運行,實現程序的功能。解釋:對于高一級機器上的程序中的每一條語句或指令,都是轉去執(zhí)行低一級機器上的一段等效程序。執(zhí)行完后,再去高一級機器取下一條語句或指令,再進行解釋執(zhí)行,如此反復,直到解釋執(zhí)行完整個程序。計算機系統(tǒng)結構:傳統(tǒng)機器程序員所看到的計算機屬性,即概念性結

2、構與功能特性。透明性:在計算機技術中,把這種本來存在的事物或屬性,但從某種角度看又好像不存在的概念稱為透明性。計算機組成:計算機系統(tǒng)結構的邏輯實現,包含物理機器級中的數據流和控制流的組成以及邏輯設計等。計算機實現:計算機組成的物理實現,包括處理機、主存等部件的物理結構,器件的集成度和速度,模塊、插件、底板的劃分與連接,信號傳輸,電源、冷卻及整機裝配技術等。系統(tǒng)加速比:對系統(tǒng)中某部分進行改進時,改進后系統(tǒng)性能提高的倍數。Amdahl定律:當對一個系統(tǒng)中的某個部件進行改進后,所能獲得的整個系統(tǒng)性能的提高,受限于該部件的執(zhí)行時間占總執(zhí)行時間的百分比。大概率事件優(yōu)先原則的基本思想是:對于大概率事件(最

3、常見的事件),賦予它優(yōu)先的處理權和資源使用權,以獲得全局的最優(yōu)結果。程序的局部性原理:程序執(zhí)行時所訪問的存儲器地址不是隨機分布的,而是相對地簇聚。包括時間局部性和空間局部性。CPI:每條指令執(zhí)行的平均時鐘周期數。CPI=執(zhí)行程序所需的時鐘周期數/所執(zhí)行的指令條數CPU性能公式:CPU時間=執(zhí)行程序所需的時鐘周期數×時鐘周期時間CPU時間=IC×CPI×時鐘周期時間 ,IC為所執(zhí)行的指令條數并行性:計算機系統(tǒng)在同一時刻或者同一時間間隔內進行多種運算或操作。只要在時間上相互重疊,就存在并行性。它包括同時性與并發(fā)性兩種含義。時間重疊:在并行性概念中引入時間因素,讓多個處

4、理過程在時間上相互錯開,輪流重疊地使用同一套硬件設備的各個部分,以加快硬件周轉而贏得速度。資源重復:在并行性概念中引入空間因素,以數量取勝。通過重復設置硬件資源,大幅度地提高計算機系統(tǒng)的性能。資源共享:這是一種軟件方法,它使多個任務按一定時間順序輪流使用同一套硬件設備。異構型多處理機系統(tǒng):由多個不同類型、至少擔負不同功能的處理機組成,它們按照作業(yè)要求的順序,利用時間重疊原理,依次對它們的多個任務進行加工,各自完成規(guī)定的功能動作。同構型多處理機系統(tǒng):由多個同類型或至少擔負同等功能的處理機組成,它們同時處理同一作業(yè)中能并行執(zhí)行的多個任務。第2章 指令集結構的分類2.1 區(qū)別不同指令集結構的主要因素

5、是什么?根據這個主要因素可將指令集結構分為哪3類?答:區(qū)別不同指令集結構的主要因素是CPU中用來存儲操作數的存儲單元。據此可將指令系統(tǒng)結構分為堆棧結構、累加器結構和通用寄存器結構。2.2 CISC指令集結構的計算機有什么缺點?答:缺點: (1) CISC結構的指令集中,各種指令的使用頻率相差懸殊。(2)CISC結構指令的復雜性帶來了計算機體系結構的復雜性,這不僅增加了研制時間和成本,而且還容易造成設計錯誤。(3)CISC結構指令集的復雜性給VLSI設計增加了很大負擔,不利于單片集成。(4)CISC結構的指令集中,許多復雜指令需要很復雜的操作,因而運行速度慢。 (5) 在CISC結構的指令集中,

6、由于各條指令的功能不均衡性,不利于采用先進的計算機體系結構技術(如流水技術)來提高系統(tǒng)的性能。2.3 簡述RISC指令集結構的設計原則。答(1) 選取使用頻率最高的指令,并補充一些最有用的指令;(2)每條指令的功能應盡可能簡單,并在一個機器周期內完成;(3)所有指令長度均相同;(4)只有Load和Store操作指令才訪問存儲器,其它指令操作均在寄存器之間進行; (5) 以簡單有效的方式支持高級語言。2.4RISC和CISC處理機的指令系統(tǒng)結構在指令格式、尋址方式和每條指令的周期數(CPI)三方面有哪些區(qū)別?比較內容CISCRISC指令格式變長編碼定長編碼尋址方式各種都有只有l(wèi)oad/store

7、指令可以訪存CPI遠遠大于1為12.5 通常有哪幾種指令格式,請簡述其適用范圍。答: (1) 變長編碼格式。如果系統(tǒng)結構設計者感興趣的是程序的目標代碼大小,而不是性能,就可以采用變長編碼格式。(2)固定長度編碼格式。如果感興趣的是性能,而不是程序的目標代碼大小,則可以選擇固定長度編碼格式。 (3) 混合型編碼格式。需要兼顧降低目標代碼長度和降低譯碼復雜度時,可以采用混合型編碼格式。第3章 流水線技術流水線:將一個重復的時序過程,分解成為若干個子過程,而每一個子過程都可有效地在其專用功能段上與其它子過程同時執(zhí)行。單功能流水線:指流水線的各段之間的連接固定不變、只能完成一種固定功能的流水線。多功能

8、流水線:指各段可以進行不同的連接,以實現不同的功能的流水線。靜態(tài)流水線:指在同一時間內,多功能流水線中的各段只能按同一種功能的連接方式工作的流水線。當流水線要切換到另一種功能時,必須等前面的任務都流出流水線之后,才能改變連接。動態(tài)流水線:指在同一時間內,多功能流水線中的各段可以按照不同的方式連接,同時執(zhí)行多種功能的流水線。它允許在某些段正在實現某種運算時,另一些段卻在實現另一種運算。吞吐率:在單位時間內流水線所完成的任務數量或輸出結果的數量。流水線的加速比:使用順序處理方式處理一批任務所用的時間與按流水處理方式處理同一批任務所用的時間之比。流水線的效率:即流水線設備的利用率,它是指流水線中的設

9、備實際使用時間與整個運行時間的比值。數據相關:考慮兩條指令i和j,i在j的前面,如果下述條件之一成立,則稱指令j與指令i數據相關: (1)指令j使用指令i產生的結果;(2)指令j與指令k數據相關,而指令k又與指令i數據相關。名相關:如果兩條指令使用了相同的名,但是它們之間并沒有數據流動,則稱這兩條指令存在名相關??刂葡嚓P:是指由分支指令引起的相關。它需要根據分支指令的執(zhí)行結果來確定后面該執(zhí)行哪個分支上的指令。結構沖突:因硬件資源滿足不了指令重疊執(zhí)行的要求而發(fā)生的沖突。數據沖突:當指令在流水線中重疊執(zhí)行時,因需要用到前面指令的執(zhí)行結果而發(fā)生的沖突??刂茮_突:流水線遇到分支指令或其它會改變PC值的

10、指令所引起的沖突。定向技術:用來解決寫后讀沖突的。在發(fā)生寫后讀相關的情況下,在計算結果尚未出來之前,后面等待使用該結果的指令并不見得是馬上就要用該結果。如果能夠將該計算結果從其產生的地方直接送到其它指令需要它的地方,那么就可以避免停頓。寫后讀沖突(RAW):考慮兩條指令i和j,且i在j之前進入流水線,指令j用到指令i的計算結果,而且在i將結果寫入寄存器之前就去讀該寄存器,因而得到的是舊值。讀后寫沖突(WAW):考慮兩條指令i和j,且i在j之前進入流水線,指令j的目的寄存器和指令i的源操作數寄存器相同,而且j在i讀取該寄存器之前就先對它進行了寫操作,導致i讀到的值是錯誤的。寫后寫沖突(WAR):

11、考慮兩條指令i和j,且i在j之前進入流水線,指令j和指令i的結果單元(寄存器或存儲器單元)相同,而且j在i寫入之前就先對該單元進行了寫入操作,從而導致寫入順序錯誤。這時在結果單元中留下的是i寫入的值,而不是j寫入的。向量處理方式:a.橫向處理方式 b.縱向處理方式c縱橫處理方式簡述三種向量處理方式,它們對向量處理機的結構要求有何不同?答 (1)橫向處理方式:若向量長度為N,則水平處理方式相當于執(zhí)行N次循環(huán)。若使用流水線,在每次循環(huán)中可能出現數據相關和功能轉換,不適合對向量進行流水處理。 (2)縱向處理方式:將整個向量按相同的運算處理完畢之后,再去執(zhí)行其他運算。適合對向量進行流水處理,向量運算指

12、令的源/目向量都放在存儲器內,使得流水線運算部件的輸入、輸出端直接與存儲器相聯(lián),構成M-M型的運算流水線。 (3)縱橫處理方式:把長度為N的向量分為若干組,每組長度為n,組內按縱向方式處理,依次處理各組,組數為N/n,適合流水處理??稍O長度為n的向量寄存器,使每組向量運算的源/目向量都在向量寄存器中,流水線的運算部件輸入、輸出端與向量寄存器相聯(lián),構成R-R型運算流水線。第4章 指令級并行超標量(superscalar):一種多指令流出技術。它在每個時鐘周期流出的指令條數不固定,依代碼的具體情況而定,但有個上限。超流水線處理機(superpipelining):在一個時鐘周期內分時流出多條指令。

13、超長指令字VLIW(Very Long Instruction Word):一種多指令流出技術。VLIW處理機在每個時鐘周期流出的指令條數是固定的,這些指令構成一條長指令或者一個指令包,在這個指令包中,指令之間的并行性是通過指令顯式地表示出來的。(1).超標量結構對程序員來說是透明的,因為處理機能自己檢測下一條指令能否流出,從而不需要重新排列指令來滿足指令的流出。(2).即使是沒有經過編譯器針對超標量結構進行調度優(yōu)化的代碼或是舊的編譯器生成的代碼頁可以運行,當然運行的效果不是很好。(3).超標量處理機是通過重復設置多份硬件來提高性能的,即設置多個取指部件,設置多個譯碼,執(zhí)行,訪存,寫結果等部件

14、,并讓它們同時工作。它要增加比較多的硬件。而超流水線處理機則不同,它只需要增加少量硬件,是通過各部分硬件的充分重疊工作來提高性能的。超標量處理機采用的是空間并行性,而超流水線處理機采用的是時間并行性。第5章 存儲層次性能參數(C、H、TA)公式(略);P155全相聯(lián)映象:主存中的任一塊可以被放置到Cache中任意一個地方。直接映象:主存中的每一塊只能被放置到Cache中唯一的一個地方。組相聯(lián)映象:主存中的每一塊可以放置到Cache中唯一的一組中任何一個地方(Cache分成若干組,每組由若干塊構成)。目錄表:目錄表所包含的項數與Cache的塊數相同,每一項對應于Cache中的一個塊,用于指出當前

15、該塊中存放的信息是哪個主存塊的。替換算法:由于主存中的塊比Cache中的塊多,所以當要從主存中調一個塊到Cache中時,會出現該塊所映象到的一組(或一個)Cache塊已全部被占用的情況。這時,需要被迫騰出其中的某一塊,以接納新調入的塊。LRU:選擇最近最少被訪問的塊作為被替換的塊。實際實現都是選擇最久沒有被訪問的塊作為被替換的塊。寫直達法:在執(zhí)行寫操作時,不僅把信息寫入Cache中相應的塊,而且也寫入下一級存儲器中相應的塊。寫回法:只把信息寫入Cache中相應塊,該塊只有被替換時,才被寫回主存。按寫分配法:寫失效時,先把所寫單元所在的塊調入Cache,然后再進行寫入。不按寫分配法:寫失效時,直

16、接寫入下一級存儲器中,而不把相應的塊調入Cache。命中時間:訪問Cache命中時所用的時間。失效率:CPU訪存時,在一級存儲器中找不到所需信息的概率。失效開銷:CPU向二級存儲器發(fā)出訪問請求到把這個數據調入一級存儲器所需的時間。強制性失效:當第一次訪問一個塊時,該塊不在Cache中,需要從下一級存儲器中調入Cache,這就是強制性失效。容量失效:如果程序在執(zhí)行時,所需要的塊不能全部調入Cache中,則當某些塊被替換后又重新被訪問,就會產生失效,這種失效就稱作容量失效。沖突失效:在組相聯(lián)或直接映象Cache中,若太多的塊映象到同一組(塊)中,則會出現該組中某個塊被別的塊替換(即使別的組或塊有空

17、閑位置),然后又被重新訪問的情況。2:1Cache經驗規(guī)則:大小為N的直接映象Cache的失效率約等于大小為N /2的兩路組相聯(lián)Cache的實效率。相聯(lián)度:在組相聯(lián)中,每組Cache中的塊數。TLB:一個專用高速存儲器,用于存放近期經常使用的頁表項,其內容是頁表部分內容的一個副本。5.2 簡述“Cache主存”層次與“主存輔存”層次的區(qū)別。答: 存儲層次比較項目“Cache主存”層次“主存輔存”層次目的為了彌補主存速度的不足為了彌補主存容量的不足存儲管理的實現全部由專用硬件實現主要由軟件實現訪問速度的比值(第一級比第二級)幾比一幾萬比一典型的塊(頁)大小幾十個字節(jié)幾百到幾千個字節(jié)CPU對第二級

18、的訪問方式可直接訪問均通過第一級不命中時CPU是否切換不切換切換到其它進程5.3 地址映象方法有哪幾種?它們各有什么優(yōu)缺點?答:(1) 全相聯(lián)映象。實現查找的機制復雜,代價高,速度慢。Cache空間的利用率較高,塊沖突概率較低,因而Cache的失效率也低。(2)直接映象。實現查找的機制簡單,速度快。Cache空間的利用率較低,塊沖突概率較高,因而Cache的失效率也高。(3)組相聯(lián)映象。組相聯(lián)是直接映象和全相聯(lián)的一種折衷。5.4 降低Cache失效率有哪幾種方法?簡述其基本思想。答:常用的降低Cache失效率的方法有下面幾種:(1) 增加Cache塊大小。增加塊大小利用了程序的空間局部性。(2) 增加Cache的容量。(3) 提高相聯(lián)度,降低沖突失效。(4) 偽相聯(lián)Cache,降低沖突失效。當對偽相聯(lián)Cache進行訪問時,首先是按與直接映象相同的方式進行訪問。如果命中,則從相應的塊中取出所訪問的數據,送給CPU,訪問結束。如果不命中,就將索引字段的最高位取反,然后按照新索引去尋找“偽相聯(lián)組”中的對應塊。如果這一塊的標識匹配,則稱發(fā)生了“偽命中”。否則,就訪問下一級存儲器。(5) 硬件預取技術。在處理器提出訪問請求前預取指令和數據。(6) 由編譯器控制的預取,硬件預取的替代方法,在編譯時加入預取的指令,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論