設(shè)計和分析的自適應(yīng)處理器

上傳人：l*** IP屬地：安徽上傳時間：2023-03-22 格式：DOC 頁數(shù)：53 大?。?0.50KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩48頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

-.z設(shè)計和分析的自適應(yīng)處理器TAKANO,三洋大規(guī)模集成電路設(shè)計系統(tǒng)軟**。一個新的putationmodel稱為緩存(緩存架構(gòu)ConfigurableHardware引擎)在這篇文章中。該模型不需要一個專用的主機處理器及其軟件利用重構(gòu)。自動重新配置應(yīng)用working-setdatapaths內(nèi)執(zhí)行。緩存模型有很多副作用;緩存、資源分配和部署位置和路由和碎片整理,處理數(shù)組本身和一個專用存放器稱為working-set注冊文件。模型旨在減少三個主要工作負載:(1)處理器和應(yīng)用程序設(shè)計工作負載,(2)運行時資源管理和調(diào)度工作負載,和(3)重新配置負載。在為了減少這些工作負載,處理器體系構(gòu)造無疑是不同于傳統(tǒng)的計算模型及其微處理器體系構(gòu)造。有三個主要的思想構(gòu)建計算系統(tǒng):(1)收發(fā)器working-setmodelmainly為了控制流的加載和存儲,即控制交通量引入管理費用,(2)一個芯片上的僵局主要是為了管理資源和屬性模型不斷配置相應(yīng)datapathsworking-set窗口,(3)緩存內(nèi)存技術(shù)為這些模型工作,相當于working-set窗口機制,和緩存內(nèi)存的過程相當于資源請求、獲取和釋放死鎖的屬性。第一個模型集中到流媒體應(yīng)用程序,例如向量和矩陣運算,過濾器,等等,這需要粗粒度的操作,如整數(shù)操作c語言。關(guān)于性能相比需求方,來自不斷的在不同的規(guī)模的應(yīng)用程序吞吐量。此外,擴展模型中,我們稱之為Instantmodeldatapath公司的自動生成實例,優(yōu)于需求方。這論文展示了其計算模型、體系構(gòu)造、底層設(shè)計和分析根本特征的執(zhí)行。類別和SubjectDescriptors:C.1.2[ProcessorArchitecture]:多個數(shù)據(jù)流體系構(gòu)造-數(shù)組和向量處理器一般條款:設(shè)計、管理額外的關(guān)鍵詞和短語:可重構(gòu)體系構(gòu)造、運行時重新配置,運行時管理,流處理、設(shè)計和分析工作集模型芯片,芯片,死鎖屬性模型堆棧構(gòu)造ACM參考格式:Takano,s.2012。設(shè)計和分析的自適應(yīng)processor.ACMTrans。Reconfig。工藝。1系統(tǒng)。5日,第五條(2012年3月),34頁。DOI=10.1145/2133352.21333573352.21333571。介紹微處理器是演變成類似于fpgamany-core處理器,與概念層次粒度many-core處理器之間唯一的區(qū)別和一個FPGA。這就引入了many-core處理器和fpga的主要問題。硅半導(dǎo)體技術(shù)的改進提供了一個更大的預(yù)算一樣的芯片尺寸縮小設(shè)計規(guī)則和設(shè)計空間擴大。這是眾所周知的摩爾定律(摩爾1995年)。然而,這種收縮了努力使數(shù)字或許可的副本局部或全部個人或教室使用的這項工作沒有提供拷貝不了費用或分布式的利潤或商業(yè)優(yōu)勢和此通知副本顯示在第一頁或初始屏幕顯示連同完整的引用。的組件擁有的這項工作比ACM必須尊敬別人。抽象與信用是允許的。復(fù)制否則,再版,*貼的效勞器上,重新分配列表,或使用的任何組件之前工作在其他工作需要特定的權(quán)限和/或費用。權(quán)限可能要求出版物、ACM,Inc.,2佩恩廣場,701套房,紐約,美國紐約10121-0701,+1(212)869-0481,或發(fā)至。c2012ACM1936-7406/2012/03art510.00美元DOI10.1145/2133352.2133357ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。2sTakano更多wire-delay金屬互連層[Matzke1997]。此外,片裝和off-chip帶寬差距增加了。需要大量的周期外部主內(nèi)存,這是一個memory-wall[沃爾夫和麥基1995]。這可以被看作是一個時機來改變目前的架構(gòu)。先前的研究[Kozyrakis1999;納etal.2001]檢查芯片上多個內(nèi)存銀行(MMBs)。為了執(zhí)行并行執(zhí)行,這樣的記憶銀行必須在相對較短的同時延遲。大規(guī)模的單處理器會降低其復(fù)雜性的可伸縮性,其中的設(shè)計參數(shù)問題的寬度和指令窗口大小(Palacharlaetal.1997年)。而不是一個單一的大規(guī)模的處理器,chipmultiprocessor(CMP)討論[哈蒙德etal。1997]。多核小指令寬度有更好的之間的權(quán)衡問題應(yīng)用程序的并行性和處理器的并行性,以適應(yīng)應(yīng)用程序計算機系統(tǒng)有效[Olukotunetal.2007]。今天,數(shù)以萬計的處理器和地方的記憶芯片可以放在[Wentzlaffetal.2007]。這樣的芯片需要更多的內(nèi)存。這將創(chuàng)立一個memory-wall因為更高包的局限性。因此,通過結(jié)合百萬桶和CMP,數(shù)以萬計的內(nèi)存元素和處理元素(Sankaralingam可以放置在同一芯片etal.2006年)。另一方面,fpga正開場被用來加速計算,而不是僅僅用于測試和驗證邏輯電路,在90年代,現(xiàn)場可編程自定義計算機器如Vuilleminetal。[1996]。今天,fpga是耦合的與主機處理器(s)和用于科學(xué)應(yīng)用etal.2007][過活。他們的field-programmability和靈活性能夠找到最優(yōu)的組合軟件和硬件的應(yīng)用程序。然而,可重構(gòu)計算(RC),混合傳統(tǒng)的基于微處理器的運算稱為時間計算,應(yīng)用程序加速器使用fpga計算稱為空間計算介紹了復(fù)雜性,使應(yīng)用程序設(shè)計師有必要了解軟件和硬件設(shè)計(Mangione-Smithetal.1997年)。指令和數(shù)據(jù)等信息的流動決定了計算機系統(tǒng)體系構(gòu)造。一些應(yīng)用程序域都有自己的特定的數(shù)據(jù)流模式。計算機架構(gòu)師決定計算機基于配置文件的規(guī)*的教學(xué)構(gòu)造,分布的尋址模式,解決inde*-lengths,等等。架構(gòu)師必須設(shè)計考慮減少此類信息流量和額外的交通預(yù)測或猜測。傳統(tǒng)的處理器有一個減少大量的邏輯電路,在后面的小節(jié)中討論。關(guān)于鋼筋混凝土系統(tǒng),有三種類型的流:主機的指令流處理器,數(shù)據(jù)流在主機和RC硬件,配置數(shù)據(jù)流在RC硬件。RC模型必須照顧的管理和調(diào)度其順序和配置系統(tǒng)中的數(shù)據(jù)流。映射到應(yīng)用程序任務(wù)計算資源必須靈活或浮動有效地支持任務(wù)級別的并行計算。小規(guī)模的百萬桶&CMP處理器執(zhí)行浮動映射任務(wù)的核心芯片上的環(huán)網(wǎng)(安斯沃思和品克斯頓2007;西勒etal.2008年)。今天的大規(guī)模百萬桶&CMP處理器往往執(zhí)行靜態(tài)映射任務(wù)在每個核心[Sankaralingametal.2006;Wentzlaffetal.2007;陳etal.2008;Tranetal.2009],或靜態(tài)映射暫時VLIW指令的執(zhí)行任務(wù)(Khailanyetal.2001年)。增加核心芯片的數(shù)量不能被容忍,因為我們面臨一個資源管理和調(diào)度困難類似于鋼筋混凝土模型。操作系統(tǒng)必須照顧超過數(shù)以萬計的處理和內(nèi)存資源。這包括資源分配和任務(wù),位置和更換,碎片整理,和路由。靜態(tài)調(diào)度應(yīng)用程序編譯器是由多更復(fù)雜的與一個復(fù)雜的系統(tǒng)體系構(gòu)造。發(fā)布一個產(chǎn)品,需要時間ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。設(shè)計和分析的自適應(yīng)處理器反映了上市時間的需求。計算機硬件和應(yīng)用程序需要驗證時間(Luddenetal.2002;Manolios2005)和優(yōu)化時間,分別。驗證所需的時間努力繼續(xù)增加甚至對于一個處理器使用多核,小更新造成的核心實現(xiàn)SMT(同步多線程),它允許內(nèi)存資源共享在線程(Victoretal.2005年)。傳統(tǒng)的基于處理器的系統(tǒng)已經(jīng)到達了極限,順序執(zhí)行系統(tǒng)即將成為并行處理系統(tǒng)。盡管RC系統(tǒng)放松限制,它需要復(fù)雜的設(shè)計應(yīng)用程序設(shè)計人員的努力。的減少交通需要高效的計算涉及到眾多的邏輯電路,一個大在操作系統(tǒng)上的工作量,和/或優(yōu)化應(yīng)用程序設(shè)計人員的努力。操作系統(tǒng)執(zhí)行資源管理的困難的工作和調(diào)度,涉及多個任務(wù)。我們稱之為努力參與設(shè)計的處理器、編譯器和應(yīng)用程序,作為一個工作負載,可以減少適當?shù)姆峙湫畔⒔煌考捌涔芾砗驼{(diào)度。為了解決這些問題,我們的工程主要集中在“新居〞的三個主要領(lǐng)域:(1)處理器和應(yīng)用程序設(shè)計工作量減少,(2)運行時資源管理和調(diào)度工作量減少,(3)重新配置工作量減少。這些都是基于一個特定的構(gòu)造處理數(shù)組,以抑制這些問題不需要額外的硬件資源和系統(tǒng)軟件在主機。這些減少是基于一個簡單的計算模型,是在一個可伸縮的核心為核心處理數(shù)組。這個簡化的計算模型可以減少很多處理器和應(yīng)用程序設(shè)計的工作,盡管我們的根本知識計算模型和處理器體系構(gòu)造是必需的。本文也有目標作為一個根本的信息指南。一個新的處理器管道作為一種資源任務(wù)datapath公司請求,并行任務(wù)取得,獲得資源釋放。我們考慮一個自治RC構(gòu)造數(shù)組的重構(gòu)技術(shù)datapath公司不能配置一個大型應(yīng)用程序。這種方法使用應(yīng)用程序依賴基于working-set大型應(yīng)用程序重新配置datapaths。通過使用cycle-accurate模擬,我們演示和分析重新配置序列及其計算模型。下一節(jié)解釋了模型的根底。新重組的機制第三節(jié)解釋技術(shù)。第四局部解釋了內(nèi)存過程涉及重新配置。的解釋常見的邏輯電路提供用于處理單元在第五局部。第六個節(jié)討論相關(guān)工作編譯器減少工作負載,內(nèi)存流量減少、資源管理和調(diào)度和重構(gòu)方法。第七局部州的工作量減少處理的優(yōu)點之前的局部。討論了根本模型的擴展在第八局部。第九局部顯示了評估結(jié)果,和第十節(jié)總結(jié)了紙。2。緩存模式本節(jié)介紹了計算模型稱為緩存(緩存架構(gòu)可配置硬件引擎)。首先,計算的根本思想是解釋說。working-set模型(1968年丹寧)和死鎖屬性模型[霍爾特1972]應(yīng)用于資源分配和任務(wù)。緩存和碎片整理技術(shù)介紹了處理元素數(shù)組被稱為一個對象數(shù)組(對象空間)。對象數(shù)組和一套專用存放器,working-set存放器用于自動地點和路線。working-set,整個datapath公司的一局部,和配置在運行時發(fā)布。表我顯示了摘要的方法來減少工作量。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。五sTakano表一、減少工作負載及其方法計算系統(tǒng)模型處理器和應(yīng)用資源管理重新配置設(shè)計工作負載和調(diào)度工作負載工作負載減少了簡單計算減少Working-set模型中,死鎖屬性模型,模型:緩存機制(堆棧構(gòu)造化對象數(shù)組):配置數(shù)據(jù)顯示開掘——處理器流水線處理器管道dency對象之間的資源請求,獲取,獲取階段激活——依賴配置datapath公司和釋放階段對象流量減少換入/出棧的棧構(gòu)造構(gòu)造芯片Working-set模型-確定性放置地點和路線的支持資源管理:尋找可替換的對象——死鎖屬性模型芯片Working-Set存放器文件Working-Set注冊文件工作地點為這些模型-檢查能力限制獲取信號的選擇——高速緩沖存儲器技術(shù)端口可伸縮的架構(gòu)與原因,消除交通引起的基于位置的地方和路線能夠響應(yīng)2.1。粗粒度的計算與分布式內(nèi)存塊通過memory-wall很高,很長的延遲意味著漫長的根本路徑ALUandmainmemory之間的長度。這一事實可能導(dǎo)致一個分布式的使用內(nèi)存塊芯片上,這可能需要多個周期加載和存儲,和溝通內(nèi)存塊和ALU之間。不需要理想的概念內(nèi)存層次構(gòu)造。此外,而不是一個內(nèi)存塊,多個內(nèi)存塊應(yīng)該實現(xiàn)和并行來提高性能。中可以看到這個向量處理器(Espasa1997;Asaovic′1998;Kozyrakis1999]。有90/10的經(jīng)歷法則,10%的靜態(tài)程序在近90%的動態(tài)執(zhí)行時間。我們專注到熱點與可重構(gòu)加速處理元素的計算有很多資源和內(nèi)存塊。這引入了一個working-set模型假設(shè)一點新的資源和請求版本可能大量資源。我們將這一概念應(yīng)用于可重構(gòu)計算系統(tǒng),即局部運行時重新配置就足夠了。資源請求可以頻繁,因此,關(guān)于局部重新配置一個單位,一個大配置數(shù)據(jù)大小不適合這種方法。我們調(diào)查的目的選擇一個粗粒度的可重構(gòu)構(gòu)造稱為物理對象(PO)經(jīng)營一個整數(shù)操作配置一個標量配置數(shù)據(jù)。時間計算和重構(gòu)由堆棧構(gòu)造2.2。Working-Set模型芯片當我們關(guān)注式芯片(套核心和本地內(nèi)存),一個相當大的代價是可能working-set大小,即本地內(nèi)存的大小。這導(dǎo)致修復(fù)本地內(nèi)存大小作為一個單元。因此,我們不能改變的working-set在第一次生產(chǎn)這樣的處理器。而不是滾動working-set為一組核心和本地內(nèi)存,我們鋪了working-set數(shù)組的一個模型本地內(nèi)存對象組成的ALU和單個條目。通過使用一個內(nèi)存塊和對象數(shù)組芯片,我們可以配置applicationspecific管線式datapath公司的working-set(圖1和圖2所示),單一入口本地內(nèi)存用于重新定時(流水線)展開array.Wedatapath公司可以從源圖像流流內(nèi)存塊,管線式datapath公司嗎水槽內(nèi)存塊,如圖1所示。datapath公司是working-set收集所需的資源和發(fā)布終止并行資源。我們實現(xiàn)了working-set及其窗口概念在芯片內(nèi)存緩存機制。2.3。死鎖屬性模型的籌碼計算資源包括硬件資源和軟件資源。硬件資源稱為物理對象(PO)。本地配置數(shù)據(jù)的軟件資源是theset尋址操作和單上的數(shù)據(jù)條目本地內(nèi)存映射到PO。這組被稱為邏輯對象。資源管理是發(fā)生在收集和發(fā)布,即請求和釋放,資源。我們的模型使用一個僵局[霍爾特1972]構(gòu)造屬性模型芯片上的資源管理。這個過程被配置為一個處理器管道與請求、獲取和釋放階段。這個過程是解釋3.1節(jié)。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。設(shè)計和分析的自適應(yīng)處理器5:5模塊化構(gòu)造與全球網(wǎng)絡(luò)圖1。流處理自適應(yīng)處理器。圖2。管道工程配置。當請求和獲得資源超過working-set的容量芯片,未使用和邏輯對象發(fā)布swapped-out內(nèi)存塊,以騰出空間為新請求。必須建立一個時間表配置特定于應(yīng)用程序的管線式working-setdatapath公司。配置順序是由配置數(shù)據(jù)流。分支的配置數(shù)據(jù)流,就像一個傳統(tǒng)的分支指令流,創(chuàng)立一個動態(tài)的秩序。我們實現(xiàn)了僵局屬性模型與處理器管道過程,高速緩沖存儲器技術(shù)作為一個工作地點。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。2.4。緩存對象數(shù)組的行為當一個發(fā)布邏輯芯片再次請求對象,對象可以獲得。當請求的邏輯對象不是芯片,必須swappedin的邏輯對象芯片。如前所述,換出可能發(fā)生的能力限制。這些行為導(dǎo)致緩存機制,引入對象數(shù)組本身,一個對象的行為作為一個緩存條目。為了實現(xiàn)緩存機制,用短的對象數(shù)組本身找時間,我們的模型使用重構(gòu)管道[Schmit1997]當?shù)鼗ミB網(wǎng)絡(luò)移動邏輯對象的數(shù)組。這種方法實現(xiàn)了一個堆棧構(gòu)造中使用的芯片高速緩沖存儲器的研究評估馬特森etal.1970年)。因此,換入的位置總是在堆棧換出的候選人是棧的底部附近。這種行為是一樣的電子布告欄系統(tǒng)(BBS),在一個更新的話題總是的和不活潑的主題列表底部的列表。找到換出的候選人與特定實現(xiàn)互連網(wǎng)絡(luò)通過構(gòu)造一個時間表,如5.6節(jié)中解釋。堆棧構(gòu)造數(shù)組支持可再定位性。因此,碎片整理程序的支持。2.5。配置:對象之間的路由位置現(xiàn)在解釋道。一個方法來路線或?qū)ο笾g的交流下一個問題。首先,我們的模型使用前面提到的對象緩存機制,隨著working-set。一個條目working-set登記專用存放器文件名為working-set注冊文件(WSRF)。通過一個獲取信號每個working-set存放器,獲取信號發(fā)送到PO數(shù)組時請求對象緩存命中的芯片。因此,檢測到緩存的緩存命中對象mechanismmakesobjectwake,并從theworking-set獲取信號可以使用注冊選擇的通信端口。這個過程是解釋3.3節(jié)2.6。新的重新配置片上working-set模型介紹了對象緩存的方法。對象緩存機制和working-set存放器介紹自動位置和路由硬件資源管理和調(diào)度。而不是整個datapath公司,所需的一局部datapath公司對應(yīng)working-set配置運行時,其中包括換入的邏輯對象如果請求緩存小姐,換出的邏輯對象如果系統(tǒng)滿足容量限制,和一堆從堆棧的頂部轉(zhuǎn)移到棧的底部。重新配置管道模型中用于實現(xiàn)堆棧構(gòu)造。通過使用multi-conte*t重新配置,堆?？梢詮膽?yīng)用程序的隱藏的轉(zhuǎn)變執(zhí)行。因此,拖延執(zhí)行是沒有必要的。因此,結(jié)合這些重新配置需要,測序的配置數(shù)據(jù)流條件,使用堆棧構(gòu)造(緩存機制)引入了一個新的獨立的局部重新配置模型。本身是一個條目在緩存中記憶。因此,活動對象數(shù)組扮演緩存。資源管理和調(diào)度、位置和路由邏輯對象、對象緩存和碎片整理是實現(xiàn)使用一個統(tǒng)一的硬件將緩存技術(shù),堆棧構(gòu)造,僵局屬性和working-set。這是一個硬件的解決方案,使用配置數(shù)據(jù)流提供了靈活性和可編程性。我們可以改變緩存和小姐回寫式序列通過改變配置數(shù)據(jù)流。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月設(shè)計和分析的自適應(yīng)處理器7棧頂棧底堆棧的轉(zhuǎn)變?nèi)峙渲脭?shù)據(jù)流數(shù)據(jù)流Req0Req1Re2緩存檢測數(shù)據(jù)圖書館配置數(shù)據(jù)圖書館個人電腦Ack搜索加載一個加載BC(A,B)D(DC)TMPTMPmpyAcc0*00*10*20*3二進制文件編譯/Dot-product*定義tmpinit0*0*定義Btmpinit0*1*定義CMpyinit0*2*定義DAccinit0*3加載一個mem[];從mem加載B[];C(A,B);//繁殖D(DC);//積累源程序文件13547861緩存錯過檢測(3.1節(jié)、3.1、3.2)2資源請求(3.1節(jié)、3.3.2)3成認3.1(3.1節(jié))4緩存加載小姐(3.1節(jié))5LRU替換(5.6節(jié))6地點和路線(年代我3242)7堆棧的轉(zhuǎn)變(年代)8內(nèi)存(4)換入換出99釋放令牌(我3圖3。緩存計算模型。2.7。緩存計算模型圖3顯示了緩存計算模型。不包括關(guān)注編程嗎模型。對象描述文件(源程序文件)是三個分區(qū)二進制文件的本地配置數(shù)據(jù),每個對象上定義了一個操作,全球配置數(shù)據(jù)(GCFG數(shù)據(jù)),序列應(yīng)用datapath公司的整個配置,和初始數(shù)據(jù)集。GCFG數(shù)據(jù)流,相當于傳統(tǒng)的簡單指令流顯示了一個根本的依賴。詳細的操作分開流。細節(jié)是在本地配置中定義的數(shù)據(jù)。這種方法意味著GCFG數(shù)據(jù)獨立于處理器的微體系構(gòu)造。由當?shù)刈鰷蕚渑渲脭?shù)據(jù)圖書館,GCFG數(shù)據(jù)可以在任何自適應(yīng)處理器上運行有不同的細節(jié),基于緩存模型。2.8。指導(dǎo)后面的局部圖4說明了指南建議的想法。關(guān)于單datapath公司,由平行處理streamings和消除額外的交通改善了性能。除了這樣的流處理,datapathsmulti-datapath處理實例通過擴展模型生成實現(xiàn)線性擴展的性能。本文提出的自動重新配置有根本區(qū)別和優(yōu)勢;專用控制器資源管理和重新配置是一個集中的模式已難以擴展處理數(shù)組。我們的模型,分布式模型,有限只有線延遲擴展。一個應(yīng)用程序分區(qū)在傳統(tǒng)模式可以采取幾個重試找一個“更好〞的結(jié)果。在而且,很難動態(tài)調(diào)度的基于局部調(diào)整這樣分區(qū)動態(tài)位置和路由局部datapath公司集,因為局部datapaths動態(tài)配置的位置也會影響到對方的決定的位置。關(guān)于我們的模型,沒有應(yīng)用程序分區(qū),這簡化了應(yīng)用程序設(shè)計過程保持位置和路由的靈活性動態(tài)調(diào)度。此外,基于堆棧的轉(zhuǎn)變使一個地方地點和路線的對象。堆棧是放置的位置,位置是確定的。底堆棧的LRU更換,容易找到的候選人。處理數(shù)組本身在沒有大量的額外工作。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月8sTakano打擊Req0打擊Req2打擊Req1Req2網(wǎng)絡(luò)Req1網(wǎng)絡(luò)請求(搜索)Req0Req1Req2配置數(shù)據(jù)32101230123Working-Set存放器文件PO-0PO-1po-2PO-(n-1)(PO)-n-2棧底:對象替換位置3.3和5.6節(jié))連鎖網(wǎng)絡(luò)(5.4.2節(jié))根本:直導(dǎo)線擴展:通道分割分布(9.8.2節(jié))緩存命中檢測比較單元(5.2節(jié))的堆棧:對象放置位置(3.3節(jié))路由器:飛機(5.4節(jié))堆棧的轉(zhuǎn)變(5.4節(jié))(一)主題的組織po-2上下文0上下文1PO-0上下文0下文1PO-1上下文0上下文1上下文0上下文1上下文0上下文1上下文0上下文1之前堆棧轉(zhuǎn)變堆棧轉(zhuǎn)變b)棧的轉(zhuǎn)變存儲用來隱藏發(fā)送上下文最近鄰對象存儲用于執(zhí)行OBJAOBobjCobjDobjDbjCOBobje上下文切換(5.1節(jié))圖4。指南建議意見組織處理器。3。自動重新配置本節(jié)解釋如何配置datapath公司的應(yīng)用程序。首先,它引入了一個新的處理器管道。第二,它說明了路由鏈對象。放置和替換序列直接與堆棧算法實現(xiàn)芯片。3.1。處理器管道一個處理器管道不同于傳統(tǒng)的處理器。管道工程等緩存內(nèi)存。因此,術(shù)語“緩存〞和“緩存命中〞可用于關(guān)系到管道。此外,每個對象的配置數(shù)據(jù)“本地〞配置數(shù)據(jù)。(1)管道階段1:請求一)元素的配置數(shù)據(jù)請求注冊(RR)請求對象。(b)如果所有請求的對象在對象空間(緩存命中),沒有執(zhí)行對象是后天獲得的,請求獲得,和配置數(shù)據(jù)存儲WSRF。轉(zhuǎn)到管道階段2。c)如果執(zhí)行對象已經(jīng)收購了,等待發(fā)布執(zhí)行的對象。(d)如果所請求的對象不是在對象空間(緩存)邏輯對象和地方配置數(shù)據(jù)存儲到一個物理對象。(e)如果沒有物理對象存儲,沒有收購對象是用于替換它。(2)管道階段2:獲取(一)收購對象執(zhí)行操作后本地配置數(shù)據(jù)。發(fā)送結(jié)果數(shù)據(jù)對象(s)。(b)在釋放令牌觸發(fā)時,轉(zhuǎn)到管道階段3。(3)管道階段3:釋放以下對象發(fā)送最終結(jié)果和釋放令牌。辭退對象不執(zhí)行配置操作。一個ID用于確定每個對象。配置數(shù)據(jù)表達了id;因此,使用一樣的ID在配置數(shù)據(jù)流顯示依賴。釋放令牌保證順序盡快釋放對象,也就是這原因釋放分配的資源作為一個從working-set換出。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。3.2。對象圖5(一個)顯示簡化處理器的配置及其處理器管道。有系統(tǒng)邏輯電路為請求注冊(RR),working-set登記文件(WSRF),目標對象。死鎖的屬性模型[霍爾特1972]處理器的管道,包括請求、獲取和發(fā)布階段[Takano2004]。處理器管道過程如下。(1)發(fā)送請求對象空間,搜索與ID。2)發(fā)送緩存命中時確認為搜索。(3)存儲配置數(shù)據(jù)元素,并將獲取的信號發(fā)送給對象空間。(4)緩存命中對象(s)在收到鏈通道(飛機),并發(fā)送確認的成就。過程(1)和(2)請求管道階段,和程序(3)和(4)是取得管道階段。釋放管道取得之后出現(xiàn)管道階段。這些管道階段重疊。3.3。位置、更換和路由本節(jié)解釋了該處理器管道、放置和替換。圖5(b)顯示了必要的設(shè)備配置,阿寶數(shù)組中的角色置換算法。盡管請求由水槽和源字段,鏈的來源是省略為了簡化的解釋。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。表二。重新配置負載組成每個因素的開銷因素描述Cconfig=Chost:主機系統(tǒng)上周期開銷+Ctraffic:周期配置交通開銷+Crouting:周期動態(tài)路由開銷+Cswitch:周期設(shè)置Datapath公司的開銷Chost=Cplacement:開銷循環(huán)尋找放置的位置+Crepalcement:開銷循環(huán)尋找LRU替代候選人Ctraffic=Cload:開銷循環(huán)加載配置數(shù)據(jù)(換入)+Cstore:開銷循環(huán)存儲配置數(shù)據(jù)(換出)表3。重新配置的工作量減少因素函數(shù)或命令傳統(tǒng)的模型緩存模式CplacementO(NappMapps,T)O(1)CrepalcementO(NappMapps,T)O(1)CloadB×Napp×cconf+clatency(1?β)×(B×3×1+3×clatency)CstoreB×Napp×cconf+clatency(1?β)×(B×3×1+3×clatency)Croutingdhops×(Napp?1)×CroutingO(1)Napp面料用于配置Mapps面料用于已經(jīng)配置應(yīng)用程序T可重構(gòu)場的拓撲因素(倉庫每個節(jié)點的數(shù)量)B為加載和存儲帶寬cconfig配置數(shù)據(jù)構(gòu)造的大小clatency平均數(shù)量的周期內(nèi)存延遲β對象緩存命中的概率dhops平均數(shù)之間的跳轉(zhuǎn)面料crouting平均周期建立首先,有四個邏輯處理器中的對象,如ID3所示,2、0、5。有一個緩存命中時邏輯對象5請求,如圖5所示(c)。確實認從緩存命中存儲空WSR的請求。WSR將獲取的信號發(fā)送到路由器。緩存命**號和成就信號形成一個鏈,端口可以用于請求的邏輯對象5。當緩存命中的請求(例如,閑置邏輯對象4)PE-3請求再次,緩存命中的邏輯對象移動到堆棧的頂部(PE-0),導(dǎo)致一堆從PE-0轉(zhuǎn)向3,如圖5所示(d)和(e),當有一個緩存的請求(例如,邏輯對象5以上)后,緩存邏輯對象加載到堆棧的頂部,這也導(dǎo)致一個堆棧的轉(zhuǎn)變。3.4?？偨Y(jié)提出了重新配置表2顯示了一個根本的重新配置負載組成的開銷周期Cconf。讓我們關(guān)注到每一個開銷因素,如表3所示。在托管效勞為根底的情況下重新配置,它可以采取許多周期地方和替換取決于所使用的算法。一個配置交通(swapin/)是增加了datapath公司的規(guī)模配置應(yīng)用程序。動態(tài)表中顯示的是一個路由開銷wormwhole像路由增加面料之間的物理距離。關(guān)于我們的模型,放置確定性的堆?？偸欠衔恢?。發(fā)現(xiàn)LRU替換由處理數(shù)組本身也是并行完成的方式與當?shù)鼗ミB網(wǎng)絡(luò)。配置交通可以減少緩存機制。的根本的三個管道階段工作的路由。動態(tài)路由是在單一的完成循環(huán)管道和特殊存放器組稱為working-set注冊文件。的重新配置我們的模型是一個局部重疊和datapath公司的運行時執(zhí)行緩存錯過時,加載和存儲需要高達三個對象。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月。設(shè)計和分析的自適應(yīng)處理器4。內(nèi)存塊音序器對象附加到一個內(nèi)存塊(MB)和界面塊(IB)對象,如圖1所示。音序器對象地址的線性內(nèi)存空間。存儲和加載數(shù)據(jù)通過內(nèi)存數(shù)據(jù)存放器(MDR)對象,如圖1所示。請求內(nèi)存請求音序器和MDR對象的內(nèi)存。音序器和耐多藥IDs不解決配置數(shù)據(jù)流的應(yīng)用程序的元素。應(yīng)用程序不能使用IDs的隔離空間;一個是執(zhí)行對象的空間(向前地面空間),而另一個是內(nèi)存背景空間(空間)。連接兩個空間是由一個中斷處理程序(IH)。這種隔離使得內(nèi)存映射和內(nèi)存配置更靈活。這分段描述了內(nèi)存序列。4.1。程序內(nèi)存內(nèi)存的過程如下。(1)檢測音序器請求(IH內(nèi)存檢測)。2)發(fā)送中斷配置數(shù)據(jù)元素RR,配置數(shù)據(jù)元素請求IH參照對象的id,以評估內(nèi)存。(3)取得的請求,鏈IH的參考數(shù)據(jù)。(4)絕對地址生成地址生成單元(AGU)。(5)查找音序器,MDRID和邊界地址ID分配人單位。6)配置數(shù)據(jù)組成元素配置數(shù)據(jù)(GCFG作曲家)單元。(7)組成的參考數(shù)據(jù)集對參考數(shù)據(jù)(有效的和無效的數(shù)據(jù))作曲家(RDC)單元。8)請求配置數(shù)據(jù)元素組成在步驟6。(9)獲取請求,鏈引用數(shù)據(jù)集(有效數(shù)據(jù))定序器對象。(10)繼續(xù)1-9直到是有效的。(11)返回請求中斷配置數(shù)據(jù)流。IH中斷當前配置數(shù)據(jù)流和插入一個中斷配置數(shù)據(jù)流(元素)。特殊的中斷配置數(shù)據(jù)請求參考數(shù)據(jù)連接到首席執(zhí)行官,這被稱為中斷參考存放器(IRR)數(shù)據(jù)。IRR數(shù)據(jù)引用,因此音序器對象指令和操作數(shù)數(shù)據(jù)。4.2。中斷處理程序中斷處理程序(IH)對象對于打斷一些效勞是必要的優(yōu)先級高于目前的執(zhí)行。IH用于當前的內(nèi)存效勞。IH檢查配置數(shù)據(jù)元素前一個請求RR(存儲)。圖6顯示了一個首席執(zhí)行官的框圖。它有四個主要局部:DCFG檢查器,操作數(shù)的作曲家,作曲家(GCFG數(shù)據(jù)全局配置數(shù)據(jù)作曲家),參考數(shù)據(jù)作曲家(RDC)。圖7顯示了一個圖的內(nèi)存效勞。當IH檢測內(nèi)存請求,配置數(shù)據(jù)元素引用數(shù)據(jù)用于生成內(nèi)存。原來的配置數(shù)據(jù)請求參考數(shù)據(jù)描述一個內(nèi)存模式,IH的請求執(zhí)行對象。請求的成就后,IH獲得內(nèi)存通過引用的數(shù)據(jù)模式信息。地址的一代在IH計算單元(AGU)絕對的基地址。絕對的基地址絕對基addressis用于查找音序器和MDRid,以及上邊界和底部邊界地址。查找單位是ID分配人單位。如果內(nèi)存“負載〞數(shù)據(jù),MDRID和索引數(shù)據(jù)的值存儲在“Req0〞融合緩存中解釋8.1節(jié)。存儲的數(shù)據(jù)用于以下請求。操作數(shù)的作曲家將引用數(shù)據(jù)劃分為向量的值長度、跨步、索引和定序器指令。ACM交易可重構(gòu)技術(shù)和系統(tǒng),5卷,1號,第五條,出版時間:2012年3月4.2.1。準備操作數(shù)的作曲家。操作數(shù)的作曲家使用生成的信息內(nèi)存。上邊界地址,底部邊界地址,音序器ID和MDRID分配人單位抬頭的ID。IDs是用來生成一個配置數(shù)據(jù)元素。4.2.2。GCFG數(shù)據(jù)。全局配置數(shù)據(jù)(GCFG數(shù)據(jù))配置一個或多個配置數(shù)據(jù)元素。這包括三個單元路由互聯(lián)網(wǎng)絡(luò)。一個內(nèi)存請求配置一個或兩個全局配置數(shù)據(jù)元素。第一個是第一階段,一個普通的配置數(shù)據(jù)元素。第二個是第二階段,使用配置數(shù)據(jù)元素只有一個內(nèi)存請求。第二階段融合鏈式加載時可以跳過使用?？偸鞘褂昧说诙A段配置數(shù)據(jù)元素存儲在請求MDR對象和鏈從源對象或?qū)ο蟆?.2.3.。參考數(shù)據(jù)。引用數(shù)據(jù)(RDC)配置有效參考數(shù)據(jù)(有效數(shù)據(jù)1和2如圖6所示),IH的譯碼器顯示在圖6中執(zhí)行反向工程。RDC是配置單元生成有效的參考數(shù)據(jù)。生成的參考數(shù)據(jù)存儲在中斷參考存放器(irr)。5。計算單位:物理對象本節(jié)討論物理對象的主要局部。常見的局部上下文切換單元,比較器單元(ID),并釋放令牌單元,如圖1所示,堆棧的轉(zhuǎn)變以及路由器,LRU對象找到邏輯電路和執(zhí)行面料。5.1。上下文切換單元鋼筋混凝土構(gòu)造有兩個上下文。一個上下文用于執(zhí)行,而另一個是用于在執(zhí)行堆棧的轉(zhuǎn)變。上下文切換單位決定上下文通過檢查數(shù)量確實認面料和執(zhí)行堆棧轉(zhuǎn)變邏輯電路,請求堆棧轉(zhuǎn)變。事件觸發(fā)設(shè)置堆棧轉(zhuǎn)變一到三的計數(shù)器值通過設(shè)置位串行移位存放器。開關(guān)使信號切換上下文值:“0→1〞或“1→0。〞5.2。比較器比較器是用來檢測一個緩存命中。比較器發(fā)送一個確認當一個緩存命中發(fā)生在比較器。此外,確認包括anti-data的檢測結(jié)果和輸出的依賴,在那里一樣的請求ID。5.3。令牌檢查器令牌檢查檢查請求和應(yīng)答令牌是否已經(jīng)到達。它包括兩個階段,第一階段檢查請求和的到來確認信號,和第二階段檢查發(fā)射的令牌。執(zhí)行在啟用了織物請求和應(yīng)答令牌都檢測到。令牌的條件發(fā)射同異步系統(tǒng)。啟用后執(zhí)行,Muller-C用于切換請求和應(yīng)答值。令牌檢查程序可以集成到一個路由器(稱為飛機)。5.4。堆棧的轉(zhuǎn)變和路由器5.4.1之前。堆棧轉(zhuǎn)變的邏輯。堆棧轉(zhuǎn)變的微體系構(gòu)造的核心執(zhí)行對象的遷移尋找LRU對象(s),并執(zhí)行碎片整理。圖8顯示了堆棧構(gòu)造的轉(zhuǎn)變。包括,不僅當?shù)嘏渲脭?shù)據(jù)和結(jié)果數(shù)據(jù),而且路由數(shù)據(jù)等等。多種環(huán)境中(上下文0和1在圖8)用于隱藏堆棧轉(zhuǎn)變,這可能是完成頻繁。一個上下文用于鋼筋混凝土構(gòu)造。另一個背景是用于存儲堆棧將上下文。如圖8所示,Muller-C值是用來制造它可以編寫從堆棧的頂部數(shù)據(jù)上下文。當一個上下文改變,事件檢查邏輯電路斷言事件。上下文切換事件執(zhí)行一個自我參照Muller-C值成認物理對象因為每個對象棧轉(zhuǎn)移。5.4.2。鏈路由器。圖9顯示了一個簡化的鏈路由器邏輯電路。鏈路由器是通信層如圖1所示,支持可再定位性放置后的棧構(gòu)造物理對象數(shù)組。鏈路由器由飛機,源對象和水槽之間對象鏈。激活標簽內(nèi)存對象緩存命中結(jié)果的對象,和信號的獲取WSRF,形成鏈。獲取信號選擇一個平面。一個釋放的信號是發(fā)送到一個特定的WSRF條目,通過一個平面。釋放的信號版本中,不僅是對象,而且鏈互連和WSRF條目。5.5。釋放令牌釋放令牌中扮演一個重要的角色在高效的計算,與減少的目標的空閑時間。當釋放令牌被辭退,對象被釋放。這發(fā)布涉及互連網(wǎng)絡(luò)的發(fā)布和working-set登記用于獲取。釋放信號發(fā)送到WSRF通過收購端口(平面)和互連網(wǎng)絡(luò),如圖5所示。釋放令牌設(shè)置維護當對象之前不鏈到其他源對象的作為一個源對象緩存命中,除非從內(nèi)存加載。釋放對象盡快收購另一個配置。雖然傳統(tǒng)的POs數(shù)據(jù)流(數(shù)組)處理模型需要時間等待通過關(guān)鍵路徑,我們的模型快速釋放未使用datapath公司的一局部,類似于working-set窗口。5.6。發(fā)現(xiàn)LRU對象找到一個LRU對象在對象空間是一個重要的問題。第一個自適應(yīng)處理器體系構(gòu)造使用一個基于優(yōu)先級的線性多路互連網(wǎng)絡(luò)。跟蹤的數(shù)量是三(緩存對象需要參考資料)。圖10顯示了線性多路一片互連網(wǎng)絡(luò)訂單。多路復(fù)用器選擇一個對象或一個對象的結(jié)果信息(ID數(shù)據(jù))。棧的底部附近的一個對象被選中,如果對象是一個釋放狀態(tài)。LRU對象的id是鎖定在緩存時處理程序和鎖定/小姐緩存錯過發(fā)生。5.6.1?？偨Y(jié)替代候選人。必須有三種類型的對象擦除或swapped-out堆棧(回信:世行)的轉(zhuǎn)變,如表4所示。最高優(yōu)先級的對象是一個空對象,相當于一個緩存條目的感冒開場和空對象不需要世行序列,因為沒有更新。5.6.2。順序查找為尋找LRU對象序列。圖11(一個)顯示了一個例如的一個對象空間。有一個緩存命中對象第三,LRU對象與一個不是骯臟的對象,兩個臟對象第二和第六POs。信號傳向堆棧的頂部,如圖11所示(一個)。關(guān)于LRU對象,多路互聯(lián)網(wǎng)絡(luò)應(yīng)用。對象的狀態(tài)空間表達的表,如圖11所示(b)。緩存命中的表是一致的左欄,LRU的其他表對象已經(jīng)假定多路復(fù)用與左欄的互連網(wǎng)絡(luò)。這三個合并成一個結(jié)果表如表,堆棧換擋規(guī)律所示圖11(c)。使用前三的內(nèi)容。因此,第二列的不使用骯臟的對象表。表顯示了次堆棧必須轉(zhuǎn)變在每個訂單執(zhí)行。阿寶和“1〞旗幟需要n次堆棧轉(zhuǎn)變,0≤n≤3。5.7。執(zhí)行面料可重構(gòu)計算構(gòu)造必須支持運營商支持高層描述語言如c語言等等。定序器對象計算內(nèi)存塊的地址或外部內(nèi)存。使用這個地址從內(nèi)存加載到一個MDR對象或存儲流元素通過MDR對象。量的跨越半字位域。因此,一個32位的字支持一個65535的距離。該指數(shù)(設(shè)置基地址)是一種半字簽名印度之行中(±32)或一個詞。目前的音序器織物架構(gòu)支持64公斤的內(nèi)存塊。MDR對象接口的內(nèi)存塊,數(shù)據(jù)元素必須通過這個對象。6。相關(guān)工作6.1。編譯器的工作量減少但是。存放器分配和調(diào)度消除。對于傳統(tǒng)的系統(tǒng),性能存放器分配敏感(Espasaetal.1995;黃和彭2002]。因此,注冊調(diào)度已經(jīng)深入研究(布里格斯1992年)。的依賴關(guān)系處理器管道插入泡沫,導(dǎo)致存放器文件,減少存放器重命名(2000年硅鎂層)。工程Ri*neretal。[2000]說明一個存放器文件的復(fù)雜性。這工程使用分布式存放器文件配置的位置在一個任務(wù)。這介紹了硬件和軟件的復(fù)雜性。需要更多的硬件資源對互連網(wǎng)絡(luò)和存放器文件創(chuàng)立一個層次構(gòu)造。這個軟件需要更多的數(shù)據(jù)流調(diào)度,因為大量的存放器?？偟膩碚f,分布式存放器文件犧牲硅資源和編譯器負載到達峰值帶寬在每個層次的水平。我們的模型消除了注冊文件。注冊的調(diào)度和存放器重命名并不是必要的。而不是硅資源分配注冊文件和其網(wǎng)絡(luò),我們的模型分配互連網(wǎng)絡(luò)資源,等等。6.1.2。自動位置和路由。工程的燒傷等。[1997]支持運行時地點和路線針對*ilin**C6200FPGA。因為它需要一個專用的主機執(zhí)行它,它需要時間來執(zhí)行。它關(guān)注的局部重新配置,有可能涉及高頻重構(gòu)的一局部。我們的模型需要線性陣列構(gòu)造作為一個堆棧。堆棧構(gòu)造和working-set登記工作鏈依賴對象,選擇一個端口(通道)。由于multiconte*t,執(zhí)行一個datapath公司基于working-set可以維護的路線,和搬遷不會影響路由。Network-on-Chip(NoC)關(guān)于網(wǎng)格拓撲和路由器有一個縮放限制的通信延遲和每個路由器的流量,分別(Qietal.2010年)。基于瓷磚數(shù)組的運行位置和路由有困難需要許多周期找到更好的結(jié)果。為了減少延遲,和的地方路線必須基于位置的工作最小化物理距離。陳的工程etal。[2008]是基于位置的映射到一個CMP,然而piletime,不是一個動態(tài)的地點和路線。其他也CMP的靜態(tài)配置位置和路由(Tranetal.2009年)。工程的霍華德etal。[2011]消息傳遞接口及其支持指令和邏輯電路。CMP不關(guān)心位置直接影響到延遲。一個更高的維度拓撲顯然有更高的復(fù)雜性和路線。我們的模型使用一個線性的堆棧數(shù)組構(gòu)造,提供基于位置的移動對象,使更短物理距離。飛機的通信是點對點的根底上,這并不需要一個緩沖抑制路由器上的交通。6..2。內(nèi)存流量減少工程Khailanyetal。[2001]討論了基于內(nèi)存流量減少在一個應(yīng)用程序任務(wù)級別的生產(chǎn)國和消費國局部性和硬件帶寬的層次構(gòu)造。任務(wù)級別的生產(chǎn)國和消費國的位置,應(yīng)用程序配置任務(wù)級別的管道,和之間的位置作為一個進程間的任務(wù)位置。流消費從流存放器文件(SRF)和生產(chǎn)對由ALU基因集群。當?shù)夭恍枰獌?nèi)存。帶寬層次構(gòu)造支持intratask位置,內(nèi)部執(zhí)行的地方任務(wù)是展開一個互連網(wǎng)絡(luò)和分布式存放器文件。我們的模型是在兩個進程間和intratask地方。一個進程間位置支持分布式內(nèi)存塊芯片。intratask位置是支持通過擴展互連網(wǎng)絡(luò)的根本模型。一個通道分割分布通常用于應(yīng)用fpga(布朗etal.1992]互連網(wǎng)絡(luò)[Takano2004]。數(shù)據(jù)必須依賴距離短于對象數(shù)組的大小,以防止緩存小姐擴展互連網(wǎng)絡(luò)假設(shè)短依賴配置之間的距離數(shù)據(jù)流,在應(yīng)用程序中扮演著主要的角色datapath公司因我們使用一個working-set模型。正如前面提到的,涉及的內(nèi)存流量調(diào)度是減少。6.3。資源管理和調(diào)度6.3.1。的資源管理和調(diào)度。幾乎每一個可重構(gòu)系統(tǒng)需要基于主機處理器的管理和調(diào)度(Brebner1996;Wigley)和科爾尼2001;BondalapatiPrasanna2002],因為沒有規(guī)*可重構(gòu)硬件。此類軟件建立模型與一個專用主機處理器的時間和費用增加主機處理器和互連網(wǎng)絡(luò)。托管軟件增加了復(fù)雜性,不僅可重構(gòu)硬件資源,而且主機本身,因為主機資源和影響對方。工程Maestreetal。[2000]提出amanagementinmulticonte*t系統(tǒng),需要指數(shù)周期發(fā)現(xiàn)replacealbe對象,根據(jù)探索深度。我們的模型不需要主機,管理和調(diào)度后階段。分區(qū)程序內(nèi)核在主機和內(nèi)核可重構(gòu)硬件資源是完全沒有必要的。這些優(yōu)勢簡化系統(tǒng)模型,并介紹應(yīng)用程序的設(shè)計和優(yōu)化。再。自動的重新定位和碎片整理?；谟布陌徇w和碎片整理討論了康普頓etal。[2002]。它使用一個配置緩沖暫存區(qū)域維護的配置數(shù)據(jù)存儲到一個特定的位置可重構(gòu)的硬件資源。它使用一個專門的互連網(wǎng)絡(luò)存儲從緩沖區(qū),和加載和存儲緩沖為了搬遷,從而整理磁盤碎片。它仍然需要一個主機來處理位置和碎片整理。此外,它不討論路由后放置和碎片整理。此外,在搬遷,datapath公司不相關(guān)重新配置必須停頓。我們的模型使用了普通的全球和本地用于互連網(wǎng)絡(luò)緩沖和放置在堆棧的頂部,將邏輯對象從頂部的堆棧的底部。我們的模型不需要主機、停滯或維護對象之間的路由。6.4。重新配置方法6.4.1。局部重新配置。典型的方法有局部調(diào)整主機或管理部門提出了盤工程硬件指令方法(Wirthin和欽斯1995年)。一個主機系統(tǒng)資源是必要的管理和調(diào)度。除了資源管理和調(diào)度,的動態(tài)重新配置硬件指令只激活一個硬件指令。結(jié)果是一個連續(xù)的硬件指令順序執(zhí)行。此外,資源管理和調(diào)度位置/替換也主機系統(tǒng)的考慮,必須照顧碎片(RC)織物。6.4.2。Multi-Conte*t重新配置。的工程DeHon[1996]和豪澤Wawrzynek[1997]使用嚴密耦合的主機處理器和織物有多個(RC)配置數(shù)據(jù)的上下文。該工程設(shè)備必須緩存最頻繁使用datapaths因為只有少量的上下文緩存。關(guān)于我們方法,multi-conte*t僅用于重疊執(zhí)行和重新配置working-set的一局部。雖然可能重組開銷相比照上下文切換的方法只有在上下文的數(shù)量回收,我們的方法可以消除時域資源管理和調(diào)度,嘗試的地方/上下文替換一些調(diào)度程序軟件/硬件[Bobda2007]。此外,我們的方法不浪費資源。6.4.3。重新配置管道。重新配置管道[Schmit1997]也是協(xié)處理器模型與專用控制器和內(nèi)存單元。的重新配置管道需要在一個管道階段均衡的執(zhí)行時間和配置時間在另一個管道階段減少空閑時間和維護高通量我們的方法消除了拓撲約束,在一個應(yīng)用程序(1997年Schmit)必須配置為一個線性流水線datapath公司沒有繞過路徑。6.4.4。重新配置緩存。的工程DeHon[1996],豪澤和Wawrzynek[1997],Trimbergeretal。[1997]在FPGA使用緩存上下文。當前執(zhí)行邏輯,執(zhí)行新邏輯不能重疊,為了防止阻塞的綁定和執(zhí)行新的邏輯。之間有一個權(quán)衡資源浪費和開銷路由配置的規(guī)模緩存。如果規(guī)模過大,資源會被浪費,而且它不會有效,甚至盡管路由負載后綁定新的邏輯將被承受。如果規(guī)模太小,路由時間和本錢將會增加,即使它會有效在利用資源。關(guān)于我們的模型,這樣不發(fā)生重疊的緩存。堆棧構(gòu)造緩存機制不浪費資源。堆棧(緩存的結(jié)合內(nèi)存)構(gòu)造和working-set存放器照顧路由。的路由發(fā)生的緩存不需要額外的資源。6.5。硬件和軟件的工作量傳統(tǒng)的微處理器必須找到獨立的指令來執(zhí)行。這是一個并行性的難題,這些指令是很難找到,因為獨立性是隱式應(yīng)用程序所示,每個語句的地方連接與其他語句作為一個依賴,并構(gòu)造一個原子塊(根本塊)?；趧討B(tài)發(fā)現(xiàn)獨立可執(zhí)行指令條指令窗口[史密斯和Sohi1995],和無序的執(zhí)行是基于標記的標記方案,見表訴流水線微處理器需要填充空管道階段可執(zhí)行指令。空管道階段依賴和內(nèi)存延遲發(fā)生,總結(jié)如表六世。是一個本錢的硬件資源的指令調(diào)度,然后硬件是復(fù)雜的,或執(zhí)行時間的本錢schedulingwith一個編譯器使編譯器復(fù)雜。這導(dǎo)致長時間驗證硬件方或長時間優(yōu)化軟件。而不是尋找獨立性,依賴中顯式地表示指令(配置數(shù)據(jù)元素)是在我們的模型中使用。自適應(yīng)處理器配置原子塊,并流。的流需要時間(周期)生產(chǎn)(中級)(年代)。這一事實導(dǎo)致原子的重疊配置執(zhí)行塊。原子塊是并行執(zhí)行的。這種方法提供了一個簡單的處理器構(gòu)造,小的設(shè)計過程和本錢。讓我們比較的特點與模型傳統(tǒng)的微處理器。沒有注冊文件和注冊是完全分布。因此,這兩個存放器重命名的硬件支持和注冊著色編譯器的支持是不必要的。因為沒有管道風險datapath公司的模型是動態(tài)重新配置。帶寬之間的差距處理器和內(nèi)存很小,集成的RC織物和內(nèi)存塊在同一芯片。盡管投機執(zhí)行提高了性能,但增加硬件本錢。我們的模型不使用投機執(zhí)行。分支預(yù)測是不必要的,因為處理器管道使用最小數(shù)量的管道階段的請求,獲取和發(fā)布。微體系構(gòu)造的主要問題是如何對待數(shù)據(jù)的依賴和數(shù)據(jù)流流量減少功能單位的閑置時間,從而改善的性能。我們的模型積極使用應(yīng)用程序的數(shù)據(jù)依賴關(guān)系atapath公司對應(yīng)working-set,積極使用多個內(nèi)存塊芯片上消除intra-task存放器文件中的數(shù)據(jù)流調(diào)度水平.我們的模型不使用指令窗口,存放器重命名,等等因此,我們的模型大大減少了硬件和軟件的本錢。相反,模型使用基于硬件的資源管理和調(diào)度,位置/更換,碎片整理和路由。此外,該模型不使用中央解碼器。這里引入了一個新的教學(xué)理念,ISA顯示簡單依賴性,這意味著硬件/軟件由ISA作為分區(qū)是不固定的接口。接口可變量,hardware-oriented或面向軟件庫支持。這種先進的概念提供了特定于應(yīng)用程序的平衡分配硬件和軟件,在RISC和CISC方法。傳統(tǒng)的可重構(gòu)計算機器需要一個主機處理器或系統(tǒng)利用可重構(gòu)計算加速器。這需要分區(qū)和調(diào)度的應(yīng)用程序。自治重構(gòu)模型不需要這個。這些支持減少了硬件和軟件設(shè)計的工作負載,從而減少處理器和應(yīng)用程序設(shè)計。7。工作量減少緩存模型可減少或消除以下編譯器和操作系統(tǒng)工作負載。1)存放器分配和調(diào)度消除。(2)中表達的加載和存儲配置數(shù)據(jù)僅是必要的流媒體數(shù)據(jù)。3)對象分配、分配和調(diào)度從編譯器工作負載的硬件支持。(4)我們的模型不需要攤位的碎片整理程序的執(zhí)行。(5)對象的位置和路由從編譯器的工作負載硬件支持。(6)使用的全球互聯(lián)網(wǎng)絡(luò)路由對象沒有限制datapath公司的配置,任何datapath公司的拓撲可以映射到它。7)應(yīng)用程序的分區(qū)是沒有必要的,因為沒有分解內(nèi)核在主機軟件和硬件內(nèi)核在RC硬件?；谟布蜍浖恼{(diào)度數(shù)據(jù)流的計算是必要的。為了減少或消除調(diào)度工作負載,內(nèi)存流量應(yīng)該減少。這些優(yōu)點介紹編譯器和操作系統(tǒng)問題減少內(nèi)存交通量。(1)通過消除存放器文件,額外的通信造成的泄漏/填補作品消除。(2)它不會創(chuàng)立額外的加載和存儲一個對象從低質(zhì)量的調(diào)度。(3)任務(wù)切換的頻率資源管理/操作軟件和調(diào)度是減少。(4)堆棧構(gòu)造陣列消除了碎片整理的任務(wù)和任務(wù)切換。(5)運行時的位置和路由由硬件、執(zhí)行和任務(wù)任務(wù)切換是不必要的。(6)圖轉(zhuǎn)換適合在互連網(wǎng)絡(luò)是不必要的。(7)沒有分區(qū)應(yīng)用程序不需要主機之間的通信和RC硬件。最后提出的模型提供了有效的計算系統(tǒng),如下所示。(1)命令(指令流)相關(guān)注冊文件調(diào)度、資源分配碎片整理,任務(wù)地點和路線,不需要。這些取消啟用一個緊湊的應(yīng)用程序代碼。(2)所有處理資源可以用于計算或緩存的可再定位性邏輯對象的棧構(gòu)造數(shù)組。當浪費資源存在,這些資源可以用作緩存內(nèi)存,或用于多個datapath公司配置。雖然應(yīng)用程序的流媒體關(guān)鍵路徑必須適合一個物理對象數(shù)組,相當于working-set窗口,datapath公司超過能力working-set盡快配置的概念8。根本模型的擴展8.1。擴展1:融合鏈簡單的和加載到一個對象MDR對象需要一個臨時對象如圖12所示(c)。Req0對象是一個臨時對象,沒有操作。時態(tài)對象的開銷增加的頻率和內(nèi)存請求減少可執(zhí)行對象的數(shù)量。這樣一個時間對象必須被消除。融合鏈是解決方案。請求ID的值作為一個標簽顯示鍵直接加載MDR對象執(zhí)行的對象。圖12(d)、(e)和(f)顯示融合鏈。計數(shù)器是必要的來生成惟一的id幾個重復(fù)的無效內(nèi)存請求。計數(shù)器的值是一個擴展的ID。因此,重置計數(shù)器值是在一個有效的內(nèi)存。緩存中存儲的數(shù)據(jù)融合包括MDRID、“Req0〞價值,計數(shù)器值。數(shù)據(jù)存儲在負載發(fā)生內(nèi)存。數(shù)據(jù)加載當請求斷言融合國旗。8.2。擴展2:實例方案為了減少冗余配置數(shù)據(jù)、實例datapaths應(yīng)該生成從一個模式描述。例如,一個數(shù)字濾波器有固定的構(gòu)造,配置應(yīng)該只有單一的配置數(shù)據(jù)挖掘處理。實例datapath公司方案配置等常規(guī)方法構(gòu)造。該方案提出了這是去研究,因此,我們顯示了當前開發(fā)工作。圖13顯示了根本對象空間和方法來創(chuàng)立一個實例。當一個全局配置數(shù)據(jù)流用于構(gòu)造loop-body屢次提取,對象的一局部loop-bodydatapath公司復(fù)制。用于復(fù)制的對象構(gòu)造新的實例。一個物理對象包括標簽2,標簽1,最重要的是使用(MSU)國旗,和其他信息。標簽1對象ID標簽2。是額外的數(shù)據(jù)實例方案,這是一個實例ID。密歇根州立大學(xué)國旗也更多數(shù)據(jù),它顯示了最重要的使用和請求的對象。實例方案一樣遵循。-Object緩存錯過案例沒有對象請求對象ID(標簽1)。存儲緩存對象后,集零值標簽2,密歇根州立大學(xué)國旗。-Object緩存命中情況有一個物體(s)請求對象ID(標簽1)。密歇根州立大學(xué)的對象聲明國旗是復(fù)制的來源。Copy對象并設(shè)置標簽2+1的值時,標簽2所請求的對象已經(jīng)收購了。設(shè)置密歇根州立大學(xué)國旗復(fù)制對象的新實例配置和重置密歇根州立大學(xué)的旗幟在源對象實例。——緩存命中對象執(zhí)行請求時配置的操作對象不是收購。-Write-Back回寫式的對象不是骯臟的和/或不主*密歇根州立大學(xué)標志被忽略。方案在這種情況下的實例,實例的對象ID包含ID(標簽2)和對象ID(標簽1)。因此,全局配置數(shù)據(jù)元素不能解決一個對象ID。這一方案是只適合動態(tài)loop-unrolling。然而,這是非常簡單的。它需要一個加法器來計算標簽2的值。9。評估本節(jié)顯示了評價結(jié)果。評價的目的是演示緩存模型和其內(nèi)部的行為,而不是簡單地顯示提高性能。這需要使用簡單的流媒體應(yīng)用程序進展觀察和分析。首先,評估系統(tǒng)模型是解釋說。模擬器和應(yīng)用程序用于評價然后解釋道。9.1。與DSP相比緩存模型是數(shù)字信號處理器(DSP)。的比較DSP是LPDSP32由三洋設(shè)計大規(guī)模集成電路設(shè)計系統(tǒng)軟(SLDS)[SLDS2010]。的LPDSP32有三個管道階段(取指令、指令譯碼和執(zhí)行),與72位dual-MAC蓄電池,雙重加載/存儲。雙重加載/存儲不本評價中使用,為了比較DSP的根本模型。9.2。評估模型所有的評估模型使用融合緩存擴展。有兩種類型的棧轉(zhuǎn)變模式。一個模型是一個嚴格堆棧轉(zhuǎn)移模型(SSS模型),堆棧變化總是在一個對象的要求配置數(shù)據(jù)流。另一個模型不是一個嚴格的堆棧轉(zhuǎn)移模型(NSS模型);相反,堆棧的轉(zhuǎn)變是在完成的對象緩存小姐,兩種模型都已被觀察到的根本行為以前的工作[Takano2004]。摘要評估基于cycle-accurate仿真模擬,而不是功能。實例方案(即時模型)可用于SSS模型。共有三種模式(SSS模型,SSS+即時模型,和NSS模型)進展了評估。9.3。參數(shù)和處理器配置表七顯示總結(jié)參數(shù)對處理器配置。一個對象緩存命中一個物理對象接近堆棧的頂部必須省略消除額外的運動對象的緩存命中的位置堆棧。這種消除需要決定該地區(qū)的堆棧的轉(zhuǎn)變可以執(zhí)行。的最大請求數(shù)在一個配置數(shù)據(jù)元素三,因此閾值大于或等于三。在這個評估中,我們使用三個。目前的模型使用一個32位的長度,一個對象ID使用8位。的RC構(gòu)造的對象的最大數(shù)量是有限長度的配置數(shù)據(jù)元素。套內(nèi)存塊的數(shù)量也決定了這個限制。這個評估使用16個RC構(gòu)造對象和16個內(nèi)存塊。上的延遲球線被認為是平均延遲時間,因為我們不知道數(shù)組的物理布局。延遲可以超過或等于零周期延遲。為了簡單起見,所有的內(nèi)存塊具有一樣的內(nèi)存延遲。在本評價中,我們使用一個顯式的一個周期延遲等全球電線全球互聯(lián)網(wǎng)絡(luò)以及zero-cycle內(nèi)存延遲9.4。APsim:Cycle-Accurate模擬器為了評估緩存模型的能力,我們開發(fā)了一個cycle-accurate模擬器用c語言編寫的,叫做APsim。APsim是事件驅(qū)動的,一個事件檢查函數(shù)信號信息。這個事件可以檢查功能用拖鞋和一個小邏輯電路實現(xiàn)。APsim執(zhí)行每個物理對象的事件在一個單一的周期延遲時間。9.5。評估使用的應(yīng)用程序為了觀察緩存模型及其根本性能的特點,使用一些簡單的應(yīng)用程序。9.5.1。吞吐量:冷杉過濾器。吞吐量是由流的吞吐量內(nèi)存性能)。因為自適應(yīng)處理器配置一個特定于應(yīng)用程序的管線式datapath公司,吞吐量總是常數(shù)不同流長度。自適應(yīng)處理器總是3周期通信當內(nèi)存延遲對象之間是零。數(shù)字濾波器是最用于數(shù)字信號處理。multiply-accumulate(MAC)用于應(yīng)用程序。這類似于dot-product稍后討論。通過級聯(lián)MAC(乘法器和加法器,最多兩個對象)以對象,多個閥門可以配置如圖14所示。關(guān)于順序執(zhí)行需求方,吞吐量下降了敲擊的次數(shù)。自適應(yīng)處理器并不會導(dǎo)致這樣的水龍頭時減少配置在芯片領(lǐng)域。因此,自適應(yīng)處理器上的吞吐量是常數(shù),結(jié)果每1/3周期,在不同數(shù)量的水龍頭。然而,后來的結(jié)果所示,配置開銷不能被忽略。9.5.2。Dot-Product。在這種評價,向量的長度*圍從1到16k。的dot-product程序顯示了流水線處理的吞吐量。圖15和與LPDSP3216顯示的比較。dot-productLPDSP32,吞吐量是每3周期生成一個結(jié)果。因此,執(zhí)行周期LPDSP32相當于3×L,L在哪里流的長度或數(shù)量的步驟從一開場的執(zhí)行。自適應(yīng)處理器具有一樣的吞吐量,但開銷配置從冷啟動小姐執(zhí)行周期自適應(yīng)處理器上LPDSP32是一樣的,除了這個配置的開銷。配置周期引起的冷啟動小姐還沒有優(yōu)化。這兩個數(shù)據(jù)和本地配置數(shù)據(jù)總是加載配置緩沖對象,甚至雖然它通常是沒有必要來加載數(shù)據(jù)。NSS模型自適應(yīng)處理器有一個小數(shù)量的周期比SSS模型在短流長度(或啟動階段的執(zhí)行)。這個結(jié)果不同于前面的評價[Takano2004],因為第一次評價是基于功能模擬,不包括邏輯電路及其延遲的擔憂和cycle-accurate模擬器系統(tǒng)狀態(tài)和靈活memory-mapping(如圖6所示),增加執(zhí)行周期。結(jié)果SSS+即時模型對應(yīng)的SSS模型,因為實例沒有生成。這意味著以前發(fā)布的對象被回收。當配置周期Econfig常數(shù)Cconfig周期,和執(zhí)行周期Ee*ec吞吐量T流長度l.則,的總數(shù)執(zhí)行周期,Etotal,對于這類應(yīng)用程序當前cycle-accuratedot-product模擬器需要數(shù)以百計的周期配置小姐在冷啟動的情況下減少配置的開銷直接降低了總執(zhí)行周期。9.5.3。矩陣向量乘法?；赿otproduct矩陣向量乘法這是包裝的循環(huán)。因此,它包含的配置在循環(huán)的dot-product,inde*-calculation內(nèi)存塊加載流和儲存標量的結(jié)果。外循環(huán)是基于hardware-loop音序器對象支持的控制流和生成內(nèi)存塊的地址。dot-product*圍從1到16k,hardware-loop*圍從1到4。因此,它組成1×1到4×16k矩陣。傳統(tǒng)的DSP使用許多執(zhí)行周期成正比的總MAC操作。NSS模型和SSS的模型自適應(yīng)處理器有一樣的結(jié)果,如圖17所示18兩個實例代(硬件循環(huán)指數(shù)兩個),和數(shù)字19和20四個實例代(硬件循環(huán)指數(shù)四個)。由于優(yōu)化LPDSP32代碼的編譯器對于每個向量的長度,它有最小的執(zhí)行周期。自適應(yīng)處理器只是使用一樣的代碼在不同的向量長度。這將創(chuàng)立一個大的開銷在短流長度在兩個模型。此外,這個應(yīng)用程序還用于觀察對象實例的效果方案。18日和20日的數(shù)據(jù)顯示,即時模式潛在的高性能處理。執(zhí)行cyclesmay減少N(N倍hardware-loop的指數(shù))。這導(dǎo)致N倍執(zhí)行和Ndatapaths動態(tài)生成和并行執(zhí)行。然而,這個問題忽略了關(guān)于可用的內(nèi)存塊的數(shù)量。因此,理想的加速,Sinstant自適應(yīng)處理器與即時模型對這種應(yīng)用程序是Sinstant∝米,在M和M的內(nèi)存塊總數(shù)芯片上的數(shù)量內(nèi)存塊用于hardware-loopdatapath公司,分別。的加速傳統(tǒng)的基于微處理器的系統(tǒng)有一定的限制,波拉克的規(guī)則,在那里加速成正比√一個,一個是可用的晶體管數(shù)量芯片。因此,即時模型優(yōu)于傳統(tǒng)模型在長執(zhí)行時間。在短流長度,都是一樣的,因為主要的執(zhí)行周期執(zhí)行周期的因素是配置開銷,和處理器執(zhí)行并行處理。因此,dot-products隱藏在的執(zhí)行配置工作。9.5.4。摘要績效評估的應(yīng)用程序。實際的問題吞吐量如下:(1)的吞吐量datapath公司正是配置由每個內(nèi)存塊的內(nèi)存吞吐量。(2)一個記憶塊的內(nèi)存延遲可以等于或大于關(guān)鍵路徑延遲一個鋼筋混凝土構(gòu)造。(3)外部存儲器單元內(nèi)存延遲超過芯片上的延遲。因此,即使我們有一個高性能的織物,它必須等待數(shù)據(jù)(流從內(nèi)存塊元素)到達,并必須等待數(shù)據(jù)(流元素)完全發(fā)送到內(nèi)存塊。因此,我們選擇簡單的功能單元幾乎每一個物理對象織物為了平衡功能部件和延遲內(nèi)存塊延遲。這種方法使得高密度的實現(xiàn)成為可能,它提供了相對更多的并行處理在同一芯片區(qū)域。正如在之前研究的結(jié)果[Takano2004],長向量或流提高了性能.吞吐量不斷在我們的模型中。通過減少的影響造成的開銷配置、自適應(yīng)處理器優(yōu)于傳統(tǒng)的需求方,減少與循環(huán)應(yīng)用程序吞吐量熱的地方。9.6。評估的配置和發(fā)布階段在本文中,一種新的重構(gòu)技術(shù)進展了探討。圖21和22顯示活動2-TAP冷杉過濾器NSS模型workingset的數(shù)量注冊獲取和對象的數(shù)量。其配置由一個1-TAP加載例如數(shù)據(jù)聲明中,三種語句(如圖14所示(b),并使用2-TAP),和一個存儲結(jié)果的聲明中,共有八個語句。在冷啟動的情況下小姐,如圖21所示,所有的對象鋼筋混凝土構(gòu)造的陣列。因此,重復(fù)配置序列,八時報?顯示堆棧轉(zhuǎn)變事件。在250周期之前,它是配置階段。注意,處理器使用流水線資源管理。因此,第一個結(jié)果數(shù)據(jù)生成之前的配置。的配置是配置數(shù)據(jù)的重疊,獲得元素消耗和保持SRF。因此working-set存放器的數(shù)量增加。活動的數(shù)量對象也有所提高。緩存錯過序列,從而配置序列,使用額外的對象配置的緩沖區(qū),IRR,MDR,音序器,為了內(nèi)存塊的數(shù)據(jù)和配置數(shù)據(jù)。配置序列使用每40個周期。序列由加載本地配置的兩個階段數(shù)據(jù)和加載數(shù)據(jù)。因此,可以減少最多,半周期如果初始數(shù)據(jù)不是必需的。當所有對象緩存命中,執(zhí)行周期的總數(shù)小,如圖22所示。坡展示了取得(請求)帶寬,其中一個取得大約需要8個周期。事實上,資源管理流水線,從而有效帶寬小于1/8。這種情況下不使用內(nèi)存,因此沒有堆棧的轉(zhuǎn)變是由于緩存小姐。因此,總的來說,活動對象的數(shù)量小于冷啟動的情況下。執(zhí)行的最后一步是釋放階段。這兩種情況下減少數(shù)量在這一階段的活動對象。datapath公司并使釋放令牌傳播每個對象和working-set注冊發(fā)布數(shù)據(jù)流的方式。因為釋放令牌,datapath公司的一局部是盡快發(fā)布。9.7。評價堆棧轉(zhuǎn)變緩存模型使用一個堆棧轉(zhuǎn)變?yōu)榱藰?gòu)造一個對象作為緩存working-set窗口。本節(jié)討論了堆棧的數(shù)量在每一個變化鋼筋混凝土構(gòu)造,如圖23和24所示。ID0是堆棧的頂部。它顯示了累積值。評估應(yīng)用程序四個dotproducts組成的矩陣向量乘法通過循環(huán)。向量長度是16。只有當NSS模型使用堆棧轉(zhuǎn)變對象緩存是錯過了。九個棧的變化發(fā)生在幾乎每一個RC構(gòu)造對象,和對象被回收。請注意,沒有垃圾在RC構(gòu)造數(shù)組對象在初始狀態(tài)為冷啟動小姐SSS模型使用一堆時的轉(zhuǎn)變對象緩存到達或小姐,總共8RC構(gòu)造對象被要求為每個迭代。dot-product由8語句(元素的配置數(shù)據(jù))。數(shù)量棧的變化是增加了。多路復(fù)用互連網(wǎng)絡(luò),鋼筋混凝土構(gòu)造對象接近堆棧的頂部有一個大量的堆棧的轉(zhuǎn)變。9.8。緩存模型的總結(jié)重新配置是存儲配置數(shù)據(jù)到一個特定的存儲控制互連網(wǎng)絡(luò)的切換(在)或作為源數(shù)據(jù)。例子,在FPGA,CLB和LUT)數(shù)據(jù),存儲路由數(shù)據(jù)。此外,重新配置有一個階段的資源管理和調(diào)度。在本文中,死鎖屬性模型和working-set模型被用來建立通過管理和調(diào)度數(shù)據(jù)重組序列,包括配置數(shù)據(jù)流量通過控制加載和存儲的數(shù)據(jù)集。與working-set模型,動態(tài)改變數(shù)據(jù)集使用的概念working-set窗口,包括資源請求和釋放(或填充和泄漏)。資源請求和釋放由系統(tǒng)管理效勞資源獲取從應(yīng)用程序的任務(wù)。數(shù)據(jù)流量已深入研究作為一個內(nèi)存層次構(gòu)造。在傳統(tǒng)的系統(tǒng)中,高速緩沖存儲器的數(shù)據(jù)流量放松(內(nèi)存子系統(tǒng)),它實現(xiàn)了研究了屬性的堆棧算法。堆棧算法是用來取代內(nèi)存子系統(tǒng)的數(shù)據(jù)集。這意味著堆棧算法是等價的為釋放working-set模型算法。此外,緩存命中堆棧算法或內(nèi)存子系統(tǒng)相當于更新系統(tǒng)狀態(tài)當一個沒有再次請求數(shù)據(jù)集獲取但釋放working-set模型。此外,緩存堆棧算法或內(nèi)存子系統(tǒng)小姐是等價的更新系統(tǒng)狀態(tài),旨在請求而不是內(nèi)存子系統(tǒng)。進入緩存數(shù)據(jù)集小姐內(nèi)存子系統(tǒng)相當于進入數(shù)據(jù)集working-set窗口。在這個概念中,相當于working-set窗口內(nèi)存子系統(tǒng),記憶本身是資源死鎖屬性模型。這些行為發(fā)生在堆棧算法或緩存內(nèi)存,和working-set模型是用來平衡系統(tǒng)通過控制界面上的數(shù)據(jù)流量注視著子系統(tǒng)。效勞數(shù)據(jù)流量的過程基于僵局屬性模型,它檢查和獲得應(yīng)用程序的請求和釋放的任務(wù)。僵局屬性模型是數(shù)據(jù)事務(wù)和資源管理過程。working-set模型是一個規(guī)則系統(tǒng)的平衡(數(shù)據(jù)流量)和資源調(diào)度。內(nèi)存子系統(tǒng)的工作地點是死鎖的屬性模型和working-set模型。重新配置是創(chuàng)立事務(wù)和數(shù)據(jù)流量。它包括前面提到的資源管理的屬性內(nèi)存子系統(tǒng)和調(diào)度。因此,內(nèi)存子系統(tǒng)本身可重構(gòu)計算系統(tǒng)的計算單位。9.8.1。我們的模型和現(xiàn)有模型之間的關(guān)系。而傳統(tǒng)working-set模型使用一個常數(shù)時間間隔τ,因此靜態(tài)窗口大小,可重構(gòu)計算有困難使用恒定的時間間隔和窗口大小。主問題,這是一個事實,那就是重構(gòu)時間通常需要更多的時間采樣間隔τ。因此,預(yù)測資源需求和調(diào)度是困難的。它需要一些調(diào)整應(yīng)用到可重構(gòu)計算模型。間隔過程時間τ可以建立一系列的配置或資源請求就像一個頁面引用原始模型。關(guān)于一個單一的邏輯塊的可重構(gòu)硬件、堆棧中使用的算法LRU置換算法是有用的考慮。τWorking-setW(t)使用在我們的模型構(gòu)造堆棧,堆棧可以使用最大間隔時間距離=C,C所示的緩存容量馬特森etal.[1970]。一個單一的邏輯塊的限制,working-set相當于LRU置換算法。同時系統(tǒng)對傳統(tǒng)working-setmodel包括內(nèi)存和需求處理器的要求,RC模型也有兩個要求。例如,測序控制流可能的處理器和內(nèi)存需求包括邏輯blockon內(nèi)存資源。特別是,一個自治的應(yīng)用程序,這是一個collectionof邏輯塊在可重構(gòu)硬件和本地內(nèi)存,只能有內(nèi)存需求。因此,應(yīng)用程序的系統(tǒng)需求可以統(tǒng)一andestablished僅使用的內(nèi)存需求。列的重新配置緩存率,成功函數(shù)(馬特森etal.1970]跟蹤L,命中率β(),如下:其中n()的次數(shù)堆棧距離觀察處理跟蹤。參考間隔距離與棧,包括重新配置時間藍新特因子(重新配置邏輯塊的大小)。參考區(qū)間包括時間序列Tseq∝藍新特過程Pi∈(邏輯塊)。因此,返回流量率?i[丹寧過程(邏輯塊)Pi∈如下?i=(1?βi)1+(1?βi)·Tseq內(nèi)存的平衡我迪用于構(gòu)造系統(tǒng)平衡,和平衡政策(1968年丹寧)可以應(yīng)用到系統(tǒng)的運行時配置硬件。在一個典型的情況下使用的主機和系統(tǒng)模型可重構(gòu)硬件、傳統(tǒng)working-set模型可以應(yīng)用,盡管注視著需求maymake有必要將注視著之間的調(diào)度主機處理和邏輯塊的資源配置。該系統(tǒng)平衡W(t,τ)=我作業(yè)指導(dǎo)書(t,τ),連接到主機(自治)系統(tǒng),必須照顧抖動。9.8.2。未來的工作。即時模式,不允許inter-iteration之間的依賴在當前的模型實例。類似于融合緩存技術(shù),一個對象ID可以用作實例之間的標簽,而不是一個ID。數(shù)組的規(guī)模的影響并非本文中討論。它增加了線延遲,從而降低性能或時鐘周期時間,即時的模型。當前全球線延遲是固定為一個單一的周期延遲。未來的工作將與陣列的規(guī)模varythe延遲。此外,作為下一步,額外的評估應(yīng)用程序是必要的觀察緩存機制方面的影響緩存的命中率,這是有關(guān)緩存命中位置RC構(gòu)造數(shù)組馬特森etal.1970年)。我們還必須檢查使用的全球互聯(lián)網(wǎng)絡(luò)。這紙,上的延遲互連網(wǎng)絡(luò)是固定在一個周期。短延時和小面積模型相當于channelsegmentation分布的權(quán)衡模型[Takano2004]。這種模式下使用一個短的距離thesink和源對象的對象數(shù)組。之間的距離相當于dependencydistance應(yīng)用程序的語句。它配置N-channels分段互連網(wǎng)絡(luò),其中N是源和水槽對象之間的最大距離。此外,它相當于距離地質(zhì)學(xué)用于緩存行為(馬特森etal.1970年),和形式的記憶交通模型提出了working-set模型[丹寧1968]。然而,它介紹了調(diào)度object-request秩序的距離短。這意味著我們可以控制重新配置的內(nèi)存流量通過調(diào)整距離的依賴。這依賴關(guān)系的調(diào)整可以通過重新執(zhí)行程序的語句。10。結(jié)論本文集中到處理器的三個工作負載和應(yīng)用程序設(shè)計運行時資源管理和調(diào)度,和重新配置。為了減少這些工作負載,我們提出了新的計算模型稱為緩存模型。緩存芯片上working-set模型的模型由,芯片上的僵局屬性模型和緩存內(nèi)存的棧構(gòu)造機制。簡單的構(gòu)造由模塊

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

設(shè)計和分析的自適應(yīng)處理器

文檔簡介

溫馨提示

最新文檔

評論

設(shè)計和分析的自適應(yīng)處理器

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔