![計算機體系結構第三章-1_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/16/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e1.gif)
![計算機體系結構第三章-1_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/16/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e2.gif)
![計算機體系結構第三章-1_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/16/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e3.gif)
![計算機體系結構第三章-1_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/16/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e4.gif)
![計算機體系結構第三章-1_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-7/16/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e/2c8590d4-5ab6-43f0-8431-9bff01c1cb3e5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第三章第三章 流水線技術流水線技術 主要內(nèi)容 n3.1 重疊執(zhí)行和先行控制 n3.2 流水線的基本概念 n3.3 流水線的性能指標 n3.4 流水線的相關與沖突 n3.5 流水線的實現(xiàn) u引入引入 提高計算機性能(速度)的兩個重要方法: 1. 縮短執(zhí)行每條指令所需的平均周期數(shù)CPI。 如:RISC技術 2. 提高處理機在執(zhí)行指令中的并行度,即同一時刻中 處理機內(nèi)同時運行多條指令。 如:采用流水線技術 第三章第三章 流水線技術流水線技術 n3.1 重疊執(zhí)行和先行控制 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 一一. .指令的重疊執(zhí)行指令的重疊執(zhí)行 一條指令的執(zhí)行過程可以粗略地分為:取
2、指令、分析 和執(zhí)行三個階段,且這個次序是不能改變的。 取指令取指令執(zhí)行執(zhí)行分析分析 t Ti 用Ti表示執(zhí)行一條指令所需的時間,可以寫成: Ti = t取指令 取指令 + t分析分析 + t執(zhí)行執(zhí)行 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 如果連續(xù)執(zhí)行多條指令(一段程序),計算機對前后相鄰 指令的執(zhí)行過程可以有兩種不同的方式: 1. 順序執(zhí)行方式,即等前一條指令執(zhí)行完畢,緊接著執(zhí) 行下一條指令。 取指取指分析分析執(zhí)行執(zhí)行取指取指分析分析執(zhí)行執(zhí)行 k+ 1k 如果取指令、指令分析和指令執(zhí)行 的時間相等,都是t,則n條指令順 序執(zhí)行的時間為 : T=3nt 優(yōu):控制簡單。優(yōu):控制簡單
3、。 缺:速度慢;缺:速度慢; 功能部件利用率低。功能部件利用率低。 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 l一次重疊執(zhí)行方式: 取指取指分析分析執(zhí)行執(zhí)行 取指取指分析分析執(zhí)行執(zhí)行 取指取指分析分析執(zhí)行執(zhí)行 第第k條指令條指令 第第k + 1條指令條指令 第第k + 2條指令條指令 如果三個階段所需時間t相等,n條指令 順序執(zhí)行的時間為 : T=(1+2n)t 2. 讓前后連續(xù)的指令在處理機內(nèi)以重疊的方式執(zhí)行. 優(yōu):總執(zhí)行時間減少近優(yōu):總執(zhí)行時間減少近 1/3; 功能部件利用率提高。功能部件利用率提高。 缺:需增加硬件;缺:需增加硬件; 控制過程更復雜。控制過程更復雜。 二次重疊
4、執(zhí)行方式: 取指取指k分析分析k執(zhí)行執(zhí)行k 取指取指k+1分析分析k+1執(zhí)行執(zhí)行k+1 取指取指k+2分析分析k+2執(zhí)行執(zhí)行k+2 第第k條指令條指令 第第k + 1條指令條指令 第第k + 2條指令條指令 如果三個階段所需時間t相等,n條指令順 序執(zhí)行的時間為 : T=(2+n)t 優(yōu):總執(zhí)行時間減少近優(yōu):總執(zhí)行時間減少近 2/3; 功能部件利用率進功能部件利用率進 一步提高。一步提高。 缺:增加硬件;缺:增加硬件; 主存沖突。主存沖突。 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 二二. .先行控制技術先行控制技術 1實現(xiàn)重疊
5、執(zhí)行存在的問題 (1)問題一:)問題一: 需要獨立的取指部件,分析部件,執(zhí)行部件。 解決方案: 分別設置對應存儲控制器,指令控制器和運算控制器。 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 (2 2)問題二:)問題二: 主存訪問沖突 n取指令,處理機按指令計數(shù)器PC的指示訪問存儲器; n分析指令,可能需要從存儲器中獲取操作數(shù); n執(zhí)行指令,可能要求將結果寫回到存儲器中。 處理機中三個獨立的部件可能同時提出對存儲器讀 寫的請求,從而發(fā)生存儲器訪問沖突。 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 解決方案:解決方案: 1)分別設置兩個獨立的存儲器:指令存儲器和數(shù)據(jù)存儲器, 或
6、一級Cache分為程序Cache和數(shù)據(jù)Cache ,同時工作解 決同時讀指令和讀數(shù)據(jù)引起的沖突。 n程序空間和數(shù)據(jù)空間相互獨立并具有獨立的指令總線和數(shù) 據(jù)總線的系統(tǒng)結構就稱為哈佛結構哈佛結構 n缺點:缺點:結構復雜,需要大量的數(shù)據(jù)線;對匯編程序員和機 器程序員不透明 2)多體交叉存儲器結構也可減少沖突的發(fā)生。 3)先行控制先行控制技術是最根本的辦法 n在主存和指令分析部件之間增設指令緩沖站指令緩沖站(先行指令指先行指令指 令緩沖站令緩沖站) n先行指令傳沖站組成和工作原理先行指令傳沖站組成和工作原理 先行程序計數(shù)器先行程序計數(shù)器 PC1 現(xiàn)行程序計數(shù)器現(xiàn)行程序計數(shù)器 PC 指令分析部件指令分析
7、部件 指令寄存器指令寄存器 IR 控制邏輯控制邏輯 主存控制器主存控制器 指令緩沖指令緩沖 存存 儲儲 區(qū)區(qū) PC1PC1:用于從主存預?。河糜趶闹鞔骖A取 指令指令 p 每分析完一條指令,就自動向指每分析完一條指令,就自動向指 令緩沖站發(fā)出取下令緩沖站發(fā)出取下 一條指令的請求。一條指令的請求。 指令取出之后就把指令緩沖站中的指令取出之后就把指令緩沖站中的 該指令作廢。該指令作廢。 p 指令緩沖站中存放的指令的條數(shù)指令緩沖站中存放的指令的條數(shù) 是動態(tài)變化的。是動態(tài)變化的。 p 按隊列方式工作。按隊列方式工作。 p 只要指令緩沖站不滿,它只要指令緩沖站不滿,它 就自動地向主存控制器發(fā)取就自動地向主
8、存控制器發(fā)取 指令請求,不斷地預取指令。指令請求,不斷地預取指令。 PC: 用來記錄當前正用來記錄當前正 在分析的指令的地址在分析的指令的地址 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 n問題:問題:在復雜的計算機指令系統(tǒng)中,各種指令在分析和執(zhí)行 階段所需的時間可能有很大的差別。于是,前面對三個階段 所需時間t相等的假設就可能不成立,所得到的節(jié)約三分之二 時間的結論也被動搖了。下圖形象地表示了這種情況所造成 的影響。 第第k條指令條指令 分析分析k執(zhí)行執(zhí)行k 第第k+2條指令條指令執(zhí)行執(zhí)行k+2分析分析k+2 第第k+1條指令條
9、指令分析分析k+1 執(zhí)行執(zhí)行k+1 這種情況可用先行控制先行控制技術來緩解。 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 2采用先行控制技術的處理機 運算控制器運算控制器 先先 行行 指指 令令 棧棧 后后 行行 寫寫 數(shù)數(shù) 棧棧 先先 行行 讀讀 數(shù)數(shù) 棧棧 存存 儲儲 控控 制制 器器 去主存儲器去主存儲器 地址線地址線 指指 令令 分分 析析 器器 先行操作棧先行操作棧 運運 算算 器器 通通 用用 寄寄 存存 器器 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 n 緩沖站實際上是一個以先進先出(FIFO)方式工作的 移位寄存器組,上圖表示了緩沖棧所處的地位。前置 部件
10、的輸出不直接送入后置部件,而是通過緩沖棧暫 存后才輸出。 前置部件前置部件 后置部件后置部件 緩沖站緩沖站 運算控制器運算控制器 先先 行行 指指 令令 棧棧 后后 行行 寫寫 數(shù)數(shù) 棧棧 先先 行行 讀讀 數(shù)數(shù) 棧棧 存存 儲儲 控控 制制 器器 去主存儲器去主存儲器 地址線地址線 指指 令令 分分 析析 器器 先行操作棧先行操作棧 運運 算算 器器 通通 用用 寄寄 存存 器器 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 3先行控制原理 通過先行指令計數(shù)器通過先行指令計數(shù)器 PC1預取指令序列預取指令序列 通過現(xiàn)行指令計數(shù)器通過現(xiàn)行指令計數(shù)器PC取取 出現(xiàn)行指令出現(xiàn)行指令 指令分
11、析器指令分析器 指令分析器指令分析器:對取自先行指令棧的指令進行預處理對取自先行指令棧的指令進行預處理. 1.對于程序控制類的指令,如轉(zhuǎn)移指令,指今分析對于程序控制類的指令,如轉(zhuǎn)移指令,指今分析 器可以直接完成指令的執(zhí)行器可以直接完成指令的執(zhí)行. 2.對于數(shù)據(jù)運算型指令,指令分析器要將它們變換對于數(shù)據(jù)運算型指令,指令分析器要將它們變換 成寄存器成寄存器-寄存器(寄存器(RR型)指令,即將操作數(shù)預先型)指令,即將操作數(shù)預先 存到寄存器中,使指令能快速執(zhí)行存到寄存器中,使指令能快速執(zhí)行. 立即尋址立即尋址 傳數(shù)據(jù)傳數(shù)據(jù) 變址尋址變址尋址 或存儲器或存儲器 型指令型指令,傳傳 地址地址 RR*指令指
12、令 3.1 3.1 重疊執(zhí)行和先行控制重疊執(zhí)行和先行控制 n先行控制技術中采取了兩個根本的措施:指令預處理指令預處理 技術技術和緩沖技術緩沖技術。由于指令和數(shù)據(jù)的緩沖,保證了指 令分析和指令的執(zhí)行都能全速地運行。 第第k條指令條指令分析分析k執(zhí)行執(zhí)行k 第第k+2條指令條指令執(zhí)行執(zhí)行k+2分析分析k+2 第第k+1條指令條指令分析分析k+1 執(zhí)行執(zhí)行k+1 第第k條指令條指令 分析分析k執(zhí)行執(zhí)行k 第第k+2條指令條指令執(zhí)行執(zhí)行k+2分析分析k+2 第第k+1條指令條指令分析分析k+1 執(zhí)行執(zhí)行k+1 改進前改進前 改進后改進后 n3.2 流水線的基本概念 3.2 3.2 流水線的基本概念流水
13、線的基本概念 一一. .什么是流水線什么是流水線 1. 流水線技術(pipelining) 把一個重復的過程分解為若干個子過程,每個子過 程由專門的功能部件來實現(xiàn)。 把多個處理過程在時間上錯開,依次通過各功能段, 這樣,每個子過程就可以與其他的子過程并行進行。 流水線流水線中的每個子過程及其功能部件稱為中的每個子過程及其功能部件稱為流水線的流水線的 級或段級或段,段與段相互連接形成流水線。流水線的段數(shù)稱,段與段相互連接形成流水線。流水線的段數(shù)稱 為為流水線的深度流水線的深度(Pipeline Depth)。 3.2 3.2 流水線的基本概念流水線的基本概念 2流水線結構 重疊執(zhí)行是流水線結構的
14、思想基礎,只要在指令分析器 與指令執(zhí)行部件之后都加上一個鎖存器,就成了一個簡單的 流水線結構。 指令執(zhí)行部件指令執(zhí)行部件 指令分析器指令分析器 鎖存器鎖存器 鎖存器鎖存器 分析分析k+1執(zhí)行執(zhí)行k t2 t1 結果出結果出指令入指令入 在流水線的每一個功能部件的后面都要有一個緩沖寄存器, 或稱為鎖存器、閘門寄存器等,它的作用是保存本流水段的執(zhí)行 結果。 3時空圖:可以直觀地表現(xiàn)流水線的工作過程 橫軸表示時間,即各條指令在處理機中經(jīng)歷各個操作時占用的時間段。橫軸表示時間,即各條指令在處理機中經(jīng)歷各個操作時占用的時間段。 縱軸表示空間,即流水線的各個子操作過程,通常也稱為縱軸表示空間,即流水線的各
15、個子操作過程,通常也稱為“功能段功能段”。 k t (n-1)t n-1n-1 123 n n n-1n-1 1 23 n n n-1n-1 1 23 n n n-1n-1 123 n n 時間時間 空間空間 S1 S2 S3 S4 n-1n-1 123 n n S5 填入填入 填滿填滿排空排空 通過時間排空時間 3.2 3.2 流水線的基本概念流水線的基本概念 4流水線的工作特點 1)一條流水線通常由多個流水段多個流水段組成,在每一個流水段有 專門的功能部件專門的功能部件來實現(xiàn)。 2)各流水段所需的時間應盡可能相等,否則將引起流水線 堵塞、斷流。時間較長的段將成為流水線瓶頸流水線瓶頸。 3)
16、流水線每個功能部件后面都有一個緩沖寄存器,稱為流 水寄存器。 4)流水線的工作一般分為3個階段,即填入填入( (建立建立) )、填滿和填滿和 排空排空。 5)流水線技術適合于大量重復大量重復的時序過程時序過程,只有在輸入端 不斷地提供任務,才能充分發(fā)揮流水線的效率。 3.2 3.2 流水線的基本概念流水線的基本概念 二二. . 流水線的種類流水線的種類 1.按處理機分類 (1)操作部件級 為最低級別的流水線。是把處理機的算術邏輯運算部 件分段。如果某一部件的處理過程比較復雜,如浮點運算, 需要較長的時間。這時可以將該部件分為若干子部件,分 別完成浮點運算中有關的子操作,這種在部件范圍內(nèi)形成 的
17、流水線稱為操作部件級流水線。 3.2 3.2 流水線的基本概念流水線的基本概念 例如:一個浮點加法部件的流水線: 求階差求階差對階對階尾數(shù)加尾數(shù)加規(guī)格化規(guī)格化 入入出出 部件級流水線通常是流水線處理機中的一部分,這時 的處理機由于流水級數(shù)較多,又稱為超流水線處理機。 3.2 3.2 流水線的基本概念流水線的基本概念 (2)處理機級 又稱為指令流水線,就是將一條指令的解釋執(zhí)行過程分 解成若干個子過程,使每個子過程分別在一個部件中完成。 取指令取指令譯碼譯碼執(zhí)行執(zhí)行存結果存結果 入入出出 3.2 3.2 流水線的基本概念流水線的基本概念 (3)處理機間級 處理機間流水線通常是多處理機系統(tǒng)中對任務采
18、取的一種處 理策略。 上圖是處理機間流水線示意圖,圖中每個處理機是以任務 為單位進行處理的,而處理機間的任務傳遞則是由公用存儲 器完成的。應當指出,圖中給出的是一個處理的“流水”, 并沒有涉及更多的硬件結構。實際上這個過程更應該看作是 一種任務的調(diào)度策略。 處理機處理機2 M 處理機處理機n M 輸出輸出 處理機處理機1 M 輸入輸入 任務任務1 任務任務2 任務任務n 3.2 3.2 流水線的基本概念流水線的基本概念 2.按流水線功能多少分類 (1)單功能流水線 指一條流水線只能完成一種單一的任務。 (2)多功能流水線 指能夠在一個時間段內(nèi)或不同時間段間改變部件之間 的連接,從而達到改變其功
19、能的流水線。 n在標量運算中,各種運算是混在一起的。 n例如:ASC處理機,運算流水線(浮點加減法運算+定點 乘法運算) ASC處理機的多功能流水線 求求 階階 差差 對對 階階 相相 加加 規(guī)格化規(guī)格化 相相 乘乘 累累 加加 輸輸 出出 1 2 3 4 6 5 7 8 輸輸 入入 輸輸 入入 相相 加加 規(guī)格化規(guī)格化 輸輸 出出 輸輸 出出 累累 加加 相相 乘乘 輸輸 入入 求求 階階 差差 對對 階階 2 3 4 5 6 7 8 6 7 8 (b)浮點連接)浮點連接 (a)分段)分段 (c)定乘連接)定乘連接 1 1 2 3 4 5 3、 按照工作方式分類 (1)靜態(tài)流水線 當執(zhí)行某一
20、規(guī)定功能的指令全部流出后,才允許改變部件間 連接的流水線。 3.2 流水線的基本概念流水線的基本概念 (可以是單功能流水線也可以是多功能流水線)(可以是單功能流水線也可以是多功能流水線) 3.2 3.2 流水線的基本概念流水線的基本概念 (2)動態(tài)流水線 沒有這種時間上的限制,可以在任何時候根據(jù)需要改變其連 接。 (只能是多功能流水線)(只能是多功能流水線) 3.2 3.2 流水線的基本概念流水線的基本概念 4.按連接方式分類 (1)線性流水線 是指在部件上沒有反饋連接的流水線。在這種流水 線中,指令依次通過各個部件僅一次,完成指令執(zhí)行的 全過程。目前所使用的流水線絕大部分都是這類線性流 水線
21、。 (2)非線性流水線 是指在各部件除了串行的連接外,還通過反饋線使 某些部件得以重復使用。指令在通過這種流水線時,可 能在反饋部件上重復運行若干次。 3.2 3.2 流水線的基本概念流水線的基本概念 反饋回路反饋回路 S1S2 S3 入入 出出 S3S3 S1S1 S2S2 時間時間 非線性流水線工作特性示意圖非線性流水線工作特性示意圖 3.2 3.2 流水線的基本概念流水線的基本概念 5.按流入流出順序分類 (1)順序流水線 其輸出的結果與輸入的次序相同,早期的流水線又稱 為順序流水線。 (2)亂序流水線 將原始的輸入次序打亂,以最有利于處理機執(zhí)行的方 式運行,在輸出結果時才恢復原次序。
22、在一些現(xiàn)代處理機中,如Pentium 4在流水線運行過程中采用了 亂序方式。 3.2 3.2 流水線的基本概念流水線的基本概念 除了上述幾種分類方法以外,還可以根據(jù)各種不同的觀點對流水 線進行區(qū)分。比如: n按照數(shù)據(jù)表示方式的不同,可以將流水線分為標量流水 線和向量流水線兩種。在標量處理機中使用的當然是標 量流水線。 n根據(jù)流水線在各級之間流動時的控制方法不同,又可以 分成同步和異步兩種流水線。 n處理機內(nèi)的指令流水線都是同步流水線,即使用統(tǒng)一的時 鐘控制各級同時開始同時完成動作。 n而處理機間的流水線通常都是異步流水線,需要在任務傳 送時進行應答,以確保傳輸?shù)目煽啃浴?課后練習課后練習 (下
23、面的練習可以鞏固你的知識!下面的練習可以鞏固你的知識!) 1. 如果一條指令的執(zhí)行需要取指、譯碼和執(zhí)行三個過程,每一 級分別需要Dt, 2Dt和3Dt。畫出按順序執(zhí)行、一次重疊、二 次重疊及先行控制四種方式工作時的時空圖。 n3.3 流水線的性能指標 3.3 3.3 流水線的性能指標流水線的性能指標 吞吐率、加速比和效率是表明流水線性能的主要指標。 一一. .吞吐率吞吐率 定義:在單位時間內(nèi)流水線所完成的任務數(shù)量。 k T n TP = n:任務總數(shù) Tk:處理完成n個任務所用的時間 3.3 流水線的性能指標流水線的性能指標 n1. 各段執(zhí)行時間相等的流水線 一條k段的流水線完成n個任務的時空
24、圖: S1 S2 S3 S4 空間空間 時間時間 1 (單位:單位:t) 1 1 1 2 2 2 2 3 3 3 3 n-1 n-1 n-1 n-1 n n n n kt (n-1)t Tk 所需總時間為:tnkTkD=) 1( 最大吞吐率為: ttnk n TP n D = D = 1 ) 1( lim max 實際吞吐率為: tnk n TP D = ) 1( 3.3 流水線的性能指標流水線的性能指標 分母Tk :當n時,(k 1) 可以忽略不計,Tknt q 只有當nk時,才有TPTPmax。 n2. 各級執(zhí)行時間不等的流水線 執(zhí)行時間不等的流水線時空圖 3.3 流水線的性能指標流水線的
25、性能指標 n12 3 123 n n 321 312 n (n-1)t2 Tk 時間 空間 S4 S3 S2 S1 D = k i i t 1 各段時間不等的吞吐率吞吐率: 同樣,當n時的最大吞吐率為: = DDDD = k i ki tttnt n TP 1 21 ),(max)1( ),(max 1 21 max kttt TP DDD = 3.3 流水線的性能指標流水線的性能指標 n3. 流水線瓶頸問題 如果流水線中各級的執(zhí)行時間不相等,其中 時間最長的段就成了流水線中的“瓶頸”。瓶頸 問題對流水線的吞吐率影響是明顯的,所以消除 “瓶頸”是設計流水線的一個重要原則。 n“瓶頸”問題的消除
26、 采用的方法主要有兩種: 1)分割瓶頸部件的工作)分割瓶頸部件的工作 2)重復設置瓶頸部件)重復設置瓶頸部件 3.3 流水線的性能指標流水線的性能指標 3.3 流水線的性能指標流水線的性能指標 消除消除“瓶頸瓶頸”影響的兩種方法示意圖:影響的兩種方法示意圖: t S1S2S3 S4 t3t t S1 S2 入入 出出 S4 t t t t t t S3a S3c S3b S1 S3a S2 S3b 入入 出出 S3c S4 t t t 3t 細分瓶頸段 : 重復瓶頸段 : 3.3 流水線的性能指標流水線的性能指標 段段 S3b S3a S2 S3c S4 時間時間 S1 1 6 2 3 4 5
27、 7 1 2 3 4 5 6 7 8 9 8 9 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 重復設置瓶頸段后的時空圖 缺點:控制邏輯比較復雜,所需的硬件增加了。 不消除“瓶頸”時的吞吐率: 兩種方式在效果上是可以等效的,在輸入n條指令的情況 下,實際吞吐率都為: tn n tn n TP D = D = )5() 16( = DDDD = k i ki tttnt n TP 1 21 ),(max)1( = 63D Dtnt n )1( = 3D t3n n )( 3.3 流水線的性能指標流水線的性能指標 3.3 流水線的性能指標流水線的性能指標 二二. .加速比
28、加速比 n處理同一批任務,不用流水線(順序執(zhí)行)與采用流水 線所花費的時間之比,稱為流水線的加速比流水線的加速比。 n設不使用流水線所用的時間為T Ts s,使用流水線所用時 間為T Tk k,那么加速比就是: k s T T S = n1. 流水線各段時間均相等流水線各段時間均相等(都是t) n一條k段流水線完成n個連續(xù)任務 n順序執(zhí)行n個任務的時間:Ts = nkt n采用流水線所需時間為: Tk = ( k + n 1 )t n加速比為: 1)1( s = D D = nk nk tnk tkn T T S k n 當nk, 最大加速比: k nk nk S n = = 1 lim ma
29、x 3.3 流水線的性能指標流水線的性能指標 n2. 流水線的各段時間不完全相等流水線的各段時間不完全相等(ti表示第i段的執(zhí)行時間) n一條k k段流水線完成n n個連續(xù)任務,一條指令的執(zhí)行時間是 各級運行時間之和ti。 n順序執(zhí)行n個任務的時間:Ts = nti n采用流水線所需時間為: Tk =ti+(n-1)max (t1, t2, tk, ) n加速比為: = = DDDD D = k i ki k i i tttnt tn S 1 21 1 ),(max)1( 3.3 流水線的性能指標流水線的性能指標 3.3 流水線的性能指標流水線的性能指標 三三. . 效率效率 n定義:流水線中
30、的設備實際使用時間與整個運行時間的比值, 即流水線設備的利用率。 n1. 假設各級執(zhí)行時間相等假設各級執(zhí)行時間相等 S1 S2 S3 S4 空間空間 時間時間 1 (單位:單位:t) 1 1 1 2 2 2 2 3 3 3 3 n-1 n-1 n-1 n-1 n n n n kt (n-1)t Tk n顯然,n越大,空閑部件占據(jù)的比例就小,流水線表現(xiàn)的效率越 高。最高效率為: 1 1 lim max = = nk n E n 3.3 流水線的性能指標流水線的性能指標 流水線效率等于: k kT tkn E D = 1 = nk n 注:上式僅適用于各段時間相等流水線。 3.3 流水線的性能指標
31、流水線的性能指標 2.從時空圖上看,效率就是n個任 務占用的時空面積和k個段總的 時空面積之比。 n流水線效率的一般公式一般公式: (直觀,通用) 空區(qū)個流水線級占用的總時 條指令占用的時空區(qū) k n E = n 例如:各級執(zhí)行時間不等的流水線中的效率 = = DDDD D = k i ki k i i tttntk tn E 1 21 1 ),(max) 1( S1 S2 S3 S4 空間空間 時間時間 1 (單位:單位:t) 1 1 1 2 2 2 2 3 3 3 3 n-1 n-1 n-1 n-1 n n n n kt (n-1)t Tk n同樣, 效率公式: 加速比公式: 兩者相結合得
32、出:E = S/k 或 S = k E 1 = nk nk S 1 = nk n E 效率公式: tnk n TP D = )1( 吞吐率公式: 1 = nk n E 兩者相結合得出:E = TP t 或TP = E /t 3.3 流水線的性能指標流水線的性能指標 3.效率與吞吐率、加速比的關系(各級時間相等的流水線) 例:一個5級的線性流水線,可完成兩個數(shù)相加運算。若 要進行8個操作數(shù)連續(xù)相加運算,如何實現(xiàn)?性能如何? 分析:分析: 假設 M=A+B+C+D+E+F+G+H 首先,選擇一種效率較高的運算方法。若按從左至右順序 相加進行運算,效率很低??刹捎脙蓛上嗉樱?M=(A+B)+(C+D
33、)+(E+F)+(G+H) 1 23 4 56 7 3.3 流水線的性能指標流水線的性能指標 工作時空圖: 從時空圖中看出,由于輸入任務的不連續(xù),全部7個任務(加法指 令),總共需要18個時鐘周期后完成。 如每段執(zhí)行時間均等于t,吞吐率TP為: 時間 空間 1234567 1234567 1234567 1234567 1234567 1 2 3 18 4 5 6 7 8 9 10 11 12 13 14 15 16 17 S5 S1 S2 S3 S4 ttT n TP k D = D = 1 389. 0 18 7 M=(A+B)+(C+D)+(E+F)+(G+H) 123 4 5 6 7
34、94. 1 18 57 = D D = t t T T S k s 這時流水線的加速比為: 而效率達到: 389. 0 185 57 = D D = t t k n E 段總的時空區(qū) 區(qū)個任務實際占用的時空 時間 空間 1234567 1234567 1234567 1234567 1234567 1 2 3 18 4 5 6 7 8 9 10 11 12 13 14 15 16 17 S5 S1 S2 S3 S4 效率為何仍然 不高? 整個流水線的效率很低的原因:整個流水線的效率很低的原因: (1) 存在有數(shù)據(jù)相關,當發(fā)生數(shù)據(jù)相關時,必須等待前一個運算結 果產(chǎn)生之后,下一個運算才能開始; (2) 流水線有填入與排空部分,當輸入到流水線中的任務不多時, 填入與排空部分所占的比例比較大。 3.3 流水線的性能指標流水線的性能指標 n練習:(線性多功能練習:(線性多功能靜態(tài)流水線靜態(tài)流水線,輸入任務是不連續(xù)的情況,輸入任務是不連續(xù)的情況, 計算流水線的吞吐率、加速比和效率。)計算流水線的吞吐率、加速比和效率。) n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 12富起來到強起來 第一課時(說課稿)-2023-2024學年道德與法治五年級下冊統(tǒng)編版
- 13《貓》說課稿-2023-2024學年四年級語文下冊統(tǒng)編版
- Unit 4 Customs and Traditions:Review of Passives 語法銜接活動案例說課稿-2024-2025學年高中英語滬外版必修第一冊
- 8 安全記心上《平安出行》(說課稿)-部編版道德與法治三年級上冊
- 西藏小區(qū)變壓器施工方案
- 27《巨人的花園》(說課稿)-2023-2024學年統(tǒng)編版語文四年級下冊
- 《3 我的本領大-循環(huán)模塊與執(zhí)行器模塊組合應用》說課稿-2023-2024學年清華版(2012)信息技術六年級下冊001
- 9元日說課稿-2023-2024學年三年級下冊語文統(tǒng)編版
- Unit 3 Seasons Lesson 2(說課稿)-2023-2024學年人教新起點版英語二年級下冊
- 倒賣人口合同范例
- 邵陽市職工勞動能力鑒定表
- 稀土配合物和量子點共摻雜構筑發(fā)光軟材料及其熒光性能研究
- 衛(wèi)生部手術分級目錄(2023年1月份修訂)
- JJG 921-2021環(huán)境振動分析儀
- 中藥炮制學-第五、六章
- 中國風軍令狀誓師大會PPT模板
- 小兒高熱驚厥精品課件
- 2023機械工程師考試試題及答案
- 2022年電拖實驗報告伍宏淳
- 豐田汽車戰(zhàn)略規(guī)劃與戰(zhàn)略管理體系研究(2021)
- 即興口語(姜燕)-課件-即興口語第一章PPT-中國傳媒大學
評論
0/150
提交評論