




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、u第第 7 7 周周 第第 1 1 節(jié)課節(jié)課u授課教師:授課教師: 陳天洲陳天洲u課件下載課件下載 http:/控制競爭造成的性能損失比數(shù)據(jù)競爭大控制競爭造成的性能損失比數(shù)據(jù)競爭大u最簡單的處理方法最簡單的處理方法ID知道轉(zhuǎn)移后,暫停流水線,直到知道轉(zhuǎn)移后,暫停流水線,直到MEM后后PC確定下來確定下來IF ID EX MEM WB IF s s IF ID 3拍拍 若轉(zhuǎn)移指令占若轉(zhuǎn)移指令占30% ,1+30%*3 = 1.9 u盡早知道轉(zhuǎn)移是否成功盡早知道轉(zhuǎn)移是否成功 將將 =0檢測移入檢測移入ID級級u盡早計算出目標地址盡早計算出目標地址 在在ID級計算目標地址,引入級計算目標地址,引入A
2、dder 3拍拍 1拍拍圖圖 改進后的改進后的DLX流水線數(shù)據(jù)通路流水線數(shù)據(jù)通路 注意:注意:u若一條若一條ALU指令后跟一條轉(zhuǎn)移指令,可能引起數(shù)據(jù)指令后跟一條轉(zhuǎn)移指令,可能引起數(shù)據(jù)競爭競爭u流水線級數(shù)越多,轉(zhuǎn)移損失越大流水線級數(shù)越多,轉(zhuǎn)移損失越大uCPI越小,轉(zhuǎn)移造成的性能損失所占比例越大越小,轉(zhuǎn)移造成的性能損失所占比例越大 表表4-4 修改后修改后ID流水級工作過程流水級工作過程1616 流水級流水級轉(zhuǎn)移指令轉(zhuǎn)移指令 IFIF/ID.IRMemPC;IF/ID.NPC,PC (if ID/EX.cond ID/EX.NPC else PC+4); IDI D / E X . A R e g
3、 s I F / I D . I R 6 . . 1 0 ; ID/EX.BRegsIF/ID.IR11.15;ID/EX.NPCIF/ID.NPC+(IR16)#IR16.31;ID/EX.IRIF/ID.IR; ID/EX.cond(RegsIF/ID.IR6.10 op 0);ID/EX.Imm(IR16)#IR16.31 EX MEM WB u條件轉(zhuǎn)移使用頻度條件轉(zhuǎn)移使用頻度 無條件轉(zhuǎn)移無條件轉(zhuǎn)移 (據(jù)(據(jù)165圖)圖)int condition branch = 16.6% 82% jump = 3.6% 18% 20.2% fp condition branch = 8.4% 86
4、% jump = 1.4% 14% 9.8%1%0%0%4%2%8%4%1%2%3%1%0%2%4%2%4%3%4%2%3%2%9%10%6%6%11%12%11%22%11%0%5%10%15%20%25%su2cormdljdphydro2deardoducligccespressoeqntottcompress無條件轉(zhuǎn)移向后條件轉(zhuǎn)移向前條件轉(zhuǎn)移u正向轉(zhuǎn)移正向轉(zhuǎn)移 反向轉(zhuǎn)移反向轉(zhuǎn)移 int fp 綜合綜合 80% 正向正向 13.4% 正向正向 6.6% 10.0% 20% 反向反向 3.2% 反向反向 1.8% 2.5% u正向轉(zhuǎn)移成功率正向轉(zhuǎn)移成功率 1u指令執(zhí)行所需時鐘周期數(shù)不同,到
5、達指令執(zhí)行所需時鐘周期數(shù)不同,到達WB級順級順序不同于發(fā)射次序,所以有序不同于發(fā)射次序,所以有WW競爭(無競爭(無WAR競爭)競爭)u指令完成順序不同于發(fā)射順序,所以中斷會出指令完成順序不同于發(fā)射順序,所以中斷會出現(xiàn)新的問題現(xiàn)新的問題uRAW競爭引起的競爭引起的Stall 增多增多 例例 p192 /p174u在在ID級跟蹤級跟蹤Reg寫口使用情況寫口使用情況移位寄存器移位寄存器 代價:移位寄存器、寫競爭檢測邏輯代價:移位寄存器、寫競爭檢測邏輯 優(yōu)點:在優(yōu)點:在ID級檢測,控制簡單級檢測,控制簡單 缺點:操作功能部件推遲占用,使缺點:操作功能部件推遲占用,使RAW競爭帶來的競爭帶來的延時更厲害
6、延時更厲害u在進入在進入MEM或或WB級前檢測級前檢測 優(yōu)點:優(yōu)點: 競爭檢測邏輯簡單競爭檢測邏輯簡單 有兩處檢測競爭,插入有兩處檢測競爭,插入Stall,控制復(fù)雜,控制復(fù)雜 WAW競爭解決方法:競爭解決方法:u推遲發(fā)射推遲發(fā)射LD,直到,直到ADDD進入進入MEM級級u檢測到競爭后,取消第一次寫,立即發(fā)射檢測到競爭后,取消第一次寫,立即發(fā)射LD(都在(都在 ID 級檢測)級檢測)u困難之處:如何知道困難之處:如何知道LD在在ADDD之前結(jié)束(各操作之前結(jié)束(各操作部件的流水級數(shù)部件的流水級數(shù)+當前當前ADDD所在位置)所在位置)u簡單處理方法:簡單處理方法: if 本指令的目的本指令的目的R
7、eg = 已發(fā)射指令的目的已發(fā)射指令的目的Reg then 暫停發(fā)射當前指令暫停發(fā)射當前指令u浮點寄存器浮點寄存器 + 通用寄存器通用寄存器uLoad/Store 指令與浮點指令之間指令與浮點指令之間 FP-integer 寄存器傳送指令寄存器傳送指令小結(jié):(在發(fā)射前需作的競爭檢測)小結(jié):(在發(fā)射前需作的競爭檢測)u檢查是否有結(jié)構(gòu)競爭(非完全流水引起)檢查是否有結(jié)構(gòu)競爭(非完全流水引起)u檢查是否有檢查是否有RAW數(shù)據(jù)競爭數(shù)據(jù)競爭u檢查是否有檢查是否有WAW數(shù)據(jù)競爭數(shù)據(jù)競爭 競爭檢測邏輯與整數(shù)流水線類似競爭檢測邏輯與整數(shù)流水線類似 u困難之處:困難之處: 按序發(fā)射,亂序完成按序發(fā)射,亂序完成
8、195/176可能的解決方法可能的解決方法u按不精確中斷方法處理按不精確中斷方法處理u緩沖操作結(jié)果,直到所有先發(fā)射的指令都完成緩沖操作結(jié)果,直到所有先發(fā)射的指令都完成 歷史文件歷史文件/未來文件未來文件u允許中斷在某種程度上不精確,但保持信息使允許中斷在某種程度上不精確,但保持信息使 自陷處理例程能生成精確中斷的執(zhí)行序列。自陷處理例程能生成精確中斷的執(zhí)行序列。 196u混合方法。當確定當前發(fā)射指令前的所有指令不會混合方法。當確定當前發(fā)射指令前的所有指令不會引起競爭而能順利執(zhí)行時才允許發(fā)射當前指令引起競爭而能順利執(zhí)行時才允許發(fā)射當前指令u指令可變長、指令執(zhí)行時間可變指令可變長、指令執(zhí)行時間可變
9、流水級不均衡,使競爭檢測、精確中斷維流水級不均衡,使競爭檢測、精確中斷維護變復(fù)雜護變復(fù)雜u復(fù)雜的尋址方式復(fù)雜的尋址方式 修改修改Reg的尋址使沖突檢測變復(fù)雜的尋址使沖突檢測變復(fù)雜 使指令重執(zhí)變得困難使指令重執(zhí)變得困難 需多次訪存的指令使流水線控制復(fù)雜需多次訪存的指令使流水線控制復(fù)雜u隱含置條件碼隱含置條件碼增加轉(zhuǎn)移延時調(diào)度的困難增加轉(zhuǎn)移延時調(diào)度的困難u8級流水線級流水線 IF取指的一半。取指的一半。PC選擇,訪指令選擇,訪指令Cache啟動啟動IS 完成指令完成指令Cache 訪問訪問RF譯碼譯碼.取取Reg.競爭檢測競爭檢測.ICache命中檢測命中檢測 EX 執(zhí)行(執(zhí)行((轉(zhuǎn)移)地址計算、
10、轉(zhuǎn)移)地址計算、ALU、條件判斷)、條件判斷)DF取數(shù)據(jù),訪數(shù)據(jù)取數(shù)據(jù),訪數(shù)據(jù)Cache。DS完成數(shù)據(jù)完成數(shù)據(jù)Cache訪問訪問TCTag匹配,命中檢測匹配,命中檢測WBLoad 和和R-R ALU運算結(jié)果寫回運算結(jié)果寫回uLoad 延時:延時: 2 Stall (202)uBranch 延時:延時: 3 Stall 硬件預(yù)測硬件預(yù)測untaken, 延時轉(zhuǎn)移調(diào)度:延時轉(zhuǎn)移調(diào)度: 1 slot 指令指令+ 2 nop 轉(zhuǎn)移成功:轉(zhuǎn)移成功:2 Stall; 不成功:不成功:0 Stallufrowarding path 產(chǎn)生數(shù)據(jù):產(chǎn)生數(shù)據(jù):EX/DF; DF/DS; DS/TC; TC/WBu浮
11、點流水線浮點流水線 205 浮點功能部件:浮點功能部件:DIVD, MULD, ADDD 操作所需時鐘周期數(shù):操作所需時鐘周期數(shù):2(取負)(取負) 112(開方)(開方)u性能性能 Load - 2stall Branch -成功轉(zhuǎn)移有成功轉(zhuǎn)移有2個個stall FP操作操作-RAW競爭引起的競爭引起的Stall -爭用同一流水級引起的結(jié)構(gòu)競爭爭用同一流水級引起的結(jié)構(gòu)競爭u指令級并行性指令級并行性(Instruction Level Parallelism) -指令間潛在的可重疊執(zhí)行的特性指令間潛在的可重疊執(zhí)行的特性u三大途徑三大途徑 減小數(shù)據(jù)競爭、控制競爭帶來的影響減小數(shù)據(jù)競爭、控制競爭帶
12、來的影響 提高處理器的并行處理能力提高處理器的并行處理能力 利用編譯技術(shù)提高利用編譯技術(shù)提高ILPu轉(zhuǎn)移發(fā)生概率:轉(zhuǎn)移發(fā)生概率:15%,平均,平均67條指令一次轉(zhuǎn)條指令一次轉(zhuǎn) - 開發(fā)基本塊間的開發(fā)基本塊間的ILPu效率:依賴于程序本身的效率:依賴于程序本身的ILP, 功能部件延時功能部件延時u產(chǎn)生結(jié)果指令產(chǎn)生結(jié)果指令 用結(jié)果指令用結(jié)果指令 延遲(時鐘周期延遲(時鐘周期) FP ALU op FP ALU op 3 FP ALU op Store double 2 Load double FP ALU op 1 Load double Store double 0Loop: LD F0, 0(
13、R1)Loop: LD F0, 0(R1) ADDD F4, F0, F2 ADDD F4, F0, F2 SD 0(R1), F4 SD 0(R1), F4 SUBI R1, R1, 8 SUBI R1, R1, 8 BNEZ R1, Loop BNEZ R1, LoopF D X M W F D s A1 A2 A3 A4 W F s D s s X W F s s D X M W F s D X M W 10 CC F F 10 CC F F塊內(nèi)調(diào)度塊內(nèi)調(diào)度+ +延時轉(zhuǎn)移延時轉(zhuǎn)移Loop: LD F0, 0(R1)Loop: LD F0, 0(R1) SUBI R1, R1,#8 SUB
14、I R1, R1,#8 ADDD F4, F0, F2 ADDD F4, F0, F2 BNEZ R1, Loop BNEZ R1, Loop SD 0(R1), F4 SD 0(R1), F4F D X M W F D X M W F DA1A2A3A4W F D X M W F D s X M W 6 CC F F s D X M Wu循環(huán)展開循環(huán)展開4次次 2264+6+6+6+6=2828/4 = 7 CCu展開展開4次次+塊內(nèi)調(diào)度塊內(nèi)調(diào)度 227+延遲轉(zhuǎn)移延遲轉(zhuǎn)移沒有沒有Stall14/4 = 3.5重要性:調(diào)度依據(jù)、并行度、如何開發(fā)重要性:調(diào)度依據(jù)、并行度、如何開發(fā)u數(shù)據(jù)相關(guān)數(shù)據(jù)相關(guān) OUT i = INj ij (真相關(guān))真相關(guān)) -RAW競爭競爭解決方法:維持相關(guān),避免競爭(指令調(diào)度)解決方法:維持相關(guān),避免競爭(指令調(diào)度) 改變改變 代碼,消除相關(guān)代碼,消除相關(guān) ( p231)u命名相關(guān)命名相關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB14-T 1621-2025 白靈菇仿生態(tài)栽培技術(shù)規(guī)程
- 商務(wù)樓宇辦公室轉(zhuǎn)租合作協(xié)議范本
- 禁止過戶原因復(fù)雜房產(chǎn)買賣合同規(guī)范文本
- 跨區(qū)域車輛抵押擔保協(xié)議樣本
- G6PD缺乏癥的護理
- 2025年初中物理八年級下冊(滬科版)教學課件 第九章 第一節(jié)
- 2025年公共關(guān)系與廣告行業(yè)考試試卷及答案
- 比特幣挖礦能耗評估
- 餐飲業(yè)員工福利保障合作協(xié)議書
- 房地產(chǎn)開發(fā)財務(wù)合同部成本控制管理約定
- 大學物理上冊總復(fù)習
- 《土壤與土壤改良》課件
- 2024安全員知識考試題及參考答案
- 【MOOC】證券投資學-江西財經(jīng)大學 中國大學慕課MOOC答案
- 網(wǎng)絡(luò)工程師職稱評定個人工作經(jīng)歷總結(jié)
- 手衛(wèi)生知識答題及答案
- 海洋權(quán)益《基本概念》教案
- ()初中語文必背古詩文填空題附完整答案【題】
- 專題06手拉手模型(原卷版+解析)
- 2024年河南高考成績一分一段表(理科+文科)
- 2024年會計知識競賽考試題庫及答案(共170題)
評論
0/150
提交評論