講義參考成果_第1頁(yè)
講義參考成果_第2頁(yè)
講義參考成果_第3頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一、Lecture25MemoryLatencyToleranceII:Prefetching1、ToleratingMemoryLatency 適用于普通內(nèi) 模預(yù)取不規(guī) 不規(guī)則的不能預(yù)取的緩存缺失,;需要大量的硬件資源長(zhǎng)時(shí)間延遲RunaheadRunaheadExecution:一種獲得器水平的并行度大指令窗口好處的技runaheadINV和下降當(dāng)原來(lái)的缺失返回,Runahead2、RunaheadProblem:DependentCacheMissesRunahead執(zhí)行不能并行化依賴缺失如果這種限制能被理想的克服,Runahead25%ParallelizingDependentCache理念:runaheadL2HowL2-miss地址(指針)=AVD負(fù)載,負(fù)載值是被預(yù)測(cè)的。預(yù)測(cè)值=有效地址-AVD。TraversalAddressLeafAddressIdentifyingAddressLoadsinWhat預(yù)取什么地址。i****ii我們?nèi)绾沃涝擃A(yù)?。?基于過(guò)去的模式預(yù)測(cè)iii預(yù)取算法確定預(yù)取。When何時(shí)啟動(dòng)預(yù)取的請(qǐng)求。*預(yù)取太早:預(yù)取的數(shù)據(jù)可能不會(huì)在被使用之前移出器*prefetcherPrefetcher*使其更積極:盡量保持遙遙領(lǐng)先的處理器的流(硬件*早些時(shí)候移動(dòng)預(yù)取指令代碼(軟件Where在哪里預(yù)提取數(shù)據(jù)。+簡(jiǎn)單的設(shè)計(jì),——可以有用的需求數(shù)據(jù)(緩存污染+數(shù)據(jù)保護(hù)需求從緩存預(yù)?。](méi)有污染——更復(fù)雜的系統(tǒng)設(shè)計(jì)——何時(shí)預(yù)取緩沖器(并行與串行緩存———L2,L1將預(yù)取緩存中的數(shù)據(jù)在哪里L(fēng)RUprefetcher放置在哪里L(fēng)1L1L2一個(gè)更完整的模式+—Prefetcher需要檢查的請(qǐng)How軟件、硬件、execution-based、合作。*工作很常規(guī)的基于數(shù)組的模式。問(wèn)題——預(yù)取指令占用處理/*預(yù)取多早?確定這是——預(yù)取距離取決于硬件實(shí)現(xiàn)(內(nèi)存延遲、緩存大小、時(shí)間之間的循環(huán)迭代)便——在代碼減少精度(分支機(jī)構(gòu))*需要“特殊”ISA預(yù)取指令31視為預(yù)取(r310)PowerPCdcbt(數(shù)據(jù)緩存塊接觸)指令—— 行為,專門的硬件觀察load/store模式和預(yù)取 Execution-based一個(gè)“線程”是主程序執(zhí)行預(yù)取數(shù)據(jù);可以通過(guò)軟件/4、Prefetcher準(zhǔn)確性(使用預(yù)取/發(fā)送預(yù)取覆蓋(預(yù)取的缺失/所有缺失及時(shí)性(準(zhǔn)時(shí)預(yù)取/使用預(yù)取Prefetcheraggressivenessaggressivenessprefetcher類型。對(duì)于大多數(shù)硬件預(yù)取器:Prefetchdistance:領(lǐng)先于需求流多少;Prefetchdegree:每次有多少預(yù)取。 Prefetching&EmergingMemoryTechnologies1、Execution-based預(yù)取投機(jī)線程:Pre-executed程序塊可以被認(rèn)為是一個(gè)“線程**在一個(gè)單獨(dú)的硬件線程上下文(想想細(xì)粒度多線程iv如何構(gòu)建投機(jī)線程:*基于軟件的修剪和“產(chǎn)生”*基于硬件的修剪和“產(chǎn)生”v投機(jī)的線程*避免等待/停止和/*獲得成功,*純粹的投機(jī),2、EmergingMemoryTheMainMemory需要主存容量、帶寬、QoSDRAMDRAM在電容器(charge-based內(nèi)存),電容器必須大到足以可靠感應(yīng)晶體管應(yīng)足夠大以保證低泄漏和高保留時(shí)間。擴(kuò)展超出40-35nm是具有 的。DRAM能力、成本和能源/功耗規(guī)模需衡。 iDRAMSystem-DRAMDRAM架構(gòu)、接口功能;更好的廢物管理(有效利用率)。ii關(guān)鍵問(wèn)題解決:*****Enableemergingmemorytechnologiestoeliminate/minimizeDRAM內(nèi)存技術(shù)似乎更可伸縮(和非易失性HybridMemory3、SolveThe(1):使DRAM和控制器更智新接口、功能架構(gòu):system-DRAM消除或最小化:DRAM;重新思考內(nèi)存和Embraceit:heterogeneous-reliability容錯(cuò)數(shù)據(jù)映射到不可靠的部分存4、Chargevs.ResistiveChargeMemories(如:內(nèi)存、DRAM、閃光燈):通過(guò)捕獲電荷寫入數(shù)據(jù);通過(guò)檢測(cè)電壓V數(shù)據(jù)。Limits:的電荷和控可靠的感應(yīng)電荷單元大小減少變得/dt寫入數(shù)據(jù);通過(guò)檢測(cè)電阻R數(shù)據(jù)5、EmergingResistiveMemoryPCM:注入電流來(lái)改變材料的階段,電阻由相位決定。PCM是電阻:高阻(0),低電阻(1),PCM單元可以可靠和快速的切換狀態(tài)。相變材料(硫族化物玻璃)中存在兩種狀態(tài)重置:TmeltDRAM,Flash*需要電流脈沖,*9nm(2022(也是*20nm(IBMJRDRaoux+,2008)iiDRAM由于大電阻范圍一個(gè)單元可以多個(gè)字iii85c>10iv不需要刷新,磁隧道結(jié)*參考層:*自由層:a

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論