版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、【W(wǎng)ord版本下載可任意編輯】 可擴(kuò)展動(dòng)態(tài)重配置的新型FPGA平臺(tái)設(shè)計(jì) 一臺(tái)在未知的土地上行進(jìn)的自動(dòng)機(jī)器人;一部能夠根據(jù)信號(hào)強(qiáng)度改變解壓縮格式的視頻解碼器;一套寬帶電子對(duì)抗系統(tǒng);一種用于機(jī)動(dòng)車(chē)輛的自適應(yīng)圖像跟蹤算法這些都屬于大量涌現(xiàn)的隨環(huán)境瞬變做出快速響應(yīng)的新興嵌入式或者關(guān)鍵任務(wù)應(yīng)用。在過(guò)去,靜態(tài)決策壞情況分配曾為嚴(yán)格的實(shí)時(shí)約束提供了解決方案,而現(xiàn)在靈活性也成為一項(xiàng)要求。法國(guó)某研究項(xiàng)目建議使用的解決方案是一種分布在 FPGA 資源上,對(duì)軟硬件線(xiàn)程開(kāi)展管理的操作系統(tǒng)。 我們的目標(biāo)是設(shè)計(jì)一種支持新的系統(tǒng)分區(qū)類(lèi)型的架構(gòu),讓軟/硬件組件遵循同一執(zhí)行模型。這就要求高度靈活的可擴(kuò)展操作系統(tǒng)。近年來(lái),特別是
2、在嵌入式系統(tǒng)中,隨著片上系統(tǒng) (SoC) 密度的增大,可以通過(guò)并行處理任務(wù)和數(shù)據(jù),來(lái)增加運(yùn)算單元,終滿(mǎn)足設(shè)計(jì)約束的要求。目前,隨著異構(gòu)計(jì)算內(nèi)核的參加,這種趨勢(shì)仍在繼續(xù)。不過(guò)這種技術(shù)遇到了難以逾越的復(fù)雜性障礙,因?yàn)樗枰獙?duì)編程模型開(kāi)展更高層次的抽象。 為了攻克這些難題,我們建議定義一個(gè)統(tǒng)一的執(zhí)行模型,不管線(xiàn)程是映射到硬件還是軟件上都可以使用。該執(zhí)行模型的硬件實(shí)現(xiàn)高度依賴(lài)動(dòng)態(tài)可重配置邏輯的使用。全分布式架構(gòu)結(jié)合傳統(tǒng)多核軟件子系統(tǒng),可同時(shí)兼?zhèn)滠?硬件的優(yōu)點(diǎn)。軟件部分很適用于智能化事件控制和決策,而硬件部分則擅長(zhǎng)于提高能效、吞吐量以及數(shù)字運(yùn)算。通過(guò)兩者的結(jié)合,無(wú)論是針對(duì)每種特定的應(yīng)用,還是針對(duì)某一應(yīng)用
3、的某一特定狀態(tài),我們都能在性能與資源利用率之間實(shí)現(xiàn)平衡。 新型 FPGA 平臺(tái)具有高度的靈活性和可擴(kuò)展性,且集成度高,能夠在單個(gè)或兩個(gè)芯片上集成一個(gè)完整的異構(gòu)動(dòng)態(tài)運(yùn)算系統(tǒng)。 自適應(yīng)硬件在諸如導(dǎo)彈電子和軟件無(wú)線(xiàn)電等功耗和系統(tǒng)尺寸有限,同時(shí)對(duì)環(huán)境高度敏感的應(yīng)用中非常有用。采用動(dòng)態(tài)重配置技術(shù),可以在不增加系統(tǒng)功耗或電路板尺寸的情況下,實(shí)現(xiàn)支持不同應(yīng)用模式的專(zhuān)用架構(gòu)。傳統(tǒng)解決方案?jìng)?cè)重于控制部分,現(xiàn)在看來(lái)似乎已經(jīng)不能有效地滿(mǎn)足執(zhí)行單元的數(shù)量及其異構(gòu)性要求。只有采用兼具靈活性和可擴(kuò)展性的分布式方案,才能夠創(chuàng)立出面向未來(lái)的架構(gòu)。 雖然這種技術(shù)潛力無(wú)限,但對(duì)整個(gè)業(yè)界來(lái)說(shuō),動(dòng)態(tài)重配置的使用仍然有相當(dāng)大的難度。工
4、程師需要一種清晰明確的設(shè)計(jì)方式,既能夠充分地發(fā)揮動(dòng)態(tài)重配置的優(yōu)勢(shì),又不影響應(yīng)用描述,而且重要的是,不增加開(kāi)發(fā)成本。為了將動(dòng)態(tài)性和高性能結(jié)合起來(lái),我們建議采用基于多線(xiàn)程的執(zhí)行模型對(duì)異構(gòu)性開(kāi)展抽象。開(kāi)發(fā)人員可以將應(yīng)用當(dāng)作線(xiàn)程集來(lái)開(kāi)展編程,而不必考慮線(xiàn)程是在標(biāo)準(zhǔn)處理器還是專(zhuān)用硬件上執(zhí)行。在這種情況下,動(dòng)態(tài)重配置的作用是開(kāi)展線(xiàn)程優(yōu)先調(diào)度(thread preemption)和上下文切換。由法國(guó)國(guó)家研究署 (French National Research Agency (ANR) 贊助的 FOSFOR(靈活的可重配置平臺(tái)操作系統(tǒng))項(xiàng)目就專(zhuān)門(mén)負(fù)責(zé)開(kāi)發(fā)這種新一代嵌入式、分布式實(shí)時(shí)操作系統(tǒng)。 1 FOSFO
5、R 架構(gòu)根底 我們的目標(biāo)是設(shè)計(jì)一種支持新的系統(tǒng)分區(qū)類(lèi)型的架構(gòu),讓軟/硬件組件遵循同一執(zhí)行模型。這就要求高度靈活的可擴(kuò)展操作系統(tǒng),能夠?yàn)檐浖蚝陀布蛱峁┫嗨频慕涌?。與傳統(tǒng)方法不同,這種操作系統(tǒng)是完全分布式的,整個(gè)平臺(tái)從應(yīng)用的角度來(lái)看是同構(gòu)的。這就意味著既能以靜態(tài)方式,也能以動(dòng)態(tài)方式在軟件(處理器)或者硬件(可重配置單元)中部署應(yīng)用線(xiàn)程,對(duì)分布式服務(wù)開(kāi)展無(wú)差異的訪問(wèn)。 為了實(shí)現(xiàn)高效率,我們?cè)诰o鄰可重配置區(qū)的硬件中實(shí)現(xiàn)操作系統(tǒng)服務(wù)。我們?cè)诋悩?gòu)操作系統(tǒng)內(nèi)核之間實(shí)現(xiàn)了一個(gè)通信層,以確保從應(yīng)用角度看服務(wù)是同構(gòu)的。因此,將操作系統(tǒng)當(dāng)作大量模塊和執(zhí)行單元部署在架構(gòu)上,可以充分發(fā)揮虛擬化機(jī)制的優(yōu)勢(shì),從而使應(yīng)用
6、線(xiàn)程在未預(yù)知任務(wù)的情況下運(yùn)行和通信。 從編程人員的角度來(lái)看,該應(yīng)用只是個(gè)線(xiàn)程集。我們可以利用賽靈思 FPGA 的動(dòng)態(tài)重配置功能來(lái)提議這種硬件線(xiàn)程的新概念,同時(shí)也可采用與軟件線(xiàn)程相同的方式來(lái)實(shí)現(xiàn)這一概念。我們的實(shí)現(xiàn)方式充分發(fā)揮了專(zhuān)用計(jì)算 IP 模塊的性能優(yōu)勢(shì)。 除了要考慮到多處理器 SoC 中的執(zhí)行單元,存儲(chǔ)器構(gòu)造還必須滿(mǎn)足以下幾項(xiàng)要求:應(yīng)用線(xiàn)程需要的數(shù)據(jù)存儲(chǔ)、每個(gè)線(xiàn)程執(zhí)行上下文的存儲(chǔ)以及線(xiàn)程間的數(shù)據(jù)交換。對(duì)于執(zhí)行上下文的存儲(chǔ),我們認(rèn)為有多種可能性。一種方式是集中存儲(chǔ)執(zhí)行上下文,這樣為將其分配到不同執(zhí)行單元提供介質(zhì)。我們可以確認(rèn)平臺(tái)內(nèi)的三種通信流:應(yīng)用數(shù)據(jù)、控制信號(hào)和重配置/執(zhí)行上下文。對(duì)于硬件
7、線(xiàn)程之間的高帶寬數(shù)據(jù)路徑,我們使用專(zhuān)用的片上網(wǎng)絡(luò) (NoC)。 圖1 通用 FOSFOR 架構(gòu) 圖中文字: 靈活的操作系統(tǒng) 軟件 線(xiàn)程 應(yīng)用 中間件(虛擬化、分布、靈活性) 操作系統(tǒng) 1(X 服務(wù)) 操作系統(tǒng) n(Y 服務(wù)) 硬件抽象層 (HAL) 軟件通信單元 硬件通信單元 硬件 軟件節(jié)點(diǎn) (GPP) 硬件節(jié)點(diǎn)(可重配置區(qū)域) 片上網(wǎng)絡(luò) 共享存儲(chǔ)器 2 全局架構(gòu) 全局架構(gòu)如圖1 所示,其組成包括: 一系列非專(zhuān)用(通用)處理器 (GPP)。GPP 負(fù)責(zé)支持軟件線(xiàn)程的執(zhí)行,以及包括線(xiàn)程調(diào)度在內(nèi)的一系列操作系統(tǒng)服務(wù)。GPP 在指令集架構(gòu)和提供的服務(wù)數(shù)量方面不必同構(gòu)。 一系列動(dòng)態(tài)可重配置分區(qū)(也稱(chēng)可
8、重配置區(qū)域 (RR)。動(dòng)態(tài)可重配置分區(qū)負(fù)責(zé)并行或串行執(zhí)行一系列硬件線(xiàn)程。與 GPP 相似,由于采用硬件操作系統(tǒng) (HwOS),RR 也支持操作系統(tǒng)服務(wù)的執(zhí)行。這些區(qū)域?qū)?yīng)著精粒度 (FPGA) 或粗粒度(可重配置處理器)架構(gòu)。 共享著一條或多條物理通信通道的虛擬通信通道,用于控制、數(shù)據(jù)和配置??刂仆ǖ镭?fù)責(zé)把操作系統(tǒng)服務(wù)之間的通信分配給執(zhí)行單元(GPP 和 RR)。數(shù)據(jù)通道負(fù)責(zé)傳輸與環(huán)境(器件、傳感器)有關(guān)的信息和線(xiàn)程之間的信息交換。配置通道負(fù)責(zé)在配置存儲(chǔ)器和執(zhí)行單元之間傳輸軟件線(xiàn)程(二進(jìn)制代碼)和硬件線(xiàn)程(部分比特流)的配置。 每個(gè)處理器都有自己的本地存儲(chǔ)器。該存儲(chǔ)器負(fù)責(zé)存儲(chǔ)本地?cái)?shù)據(jù),在適用的
9、情況下,也可存儲(chǔ)軟件代碼。連接到數(shù)據(jù)通道的共享存儲(chǔ)器可以實(shí)現(xiàn)不同處理器上線(xiàn)程間的數(shù)據(jù)共享。每個(gè)執(zhí)行單元都可以訪問(wèn)共享存儲(chǔ)器上存儲(chǔ)的數(shù)據(jù)和軟件執(zhí)行資源程序。每個(gè)資源還可以訪問(wèn)配置存儲(chǔ)器,以保存和恢復(fù)其執(zhí)行上下文。采用這種構(gòu)造,可以在任何執(zhí)行資源上實(shí)現(xiàn)任何線(xiàn)程或服務(wù)。 在 RR 內(nèi)部,只有硬件任務(wù)需要?jiǎng)討B(tài)重配置。負(fù)責(zé)托管任務(wù)的動(dòng)態(tài)區(qū)域 (DR) 被包含操作系統(tǒng)服務(wù)硬件實(shí)現(xiàn)的靜態(tài)區(qū)域 (SR) 所包圍,同時(shí)在 RR 內(nèi)外部提供通信介質(zhì)。內(nèi)部數(shù)據(jù)流通信依靠專(zhuān)用的片上網(wǎng)絡(luò)。DR 和 SR 之間的接口采用總線(xiàn)宏并且有固定的位置。為實(shí)現(xiàn)該約束以及通信介質(zhì)異構(gòu)性的抽象,我們采用中間件方案來(lái)提供到可重配置分區(qū)的
10、虛擬訪問(wèn)。RR 根據(jù)圖 2 中定義的模型構(gòu)建。FOSFOR 原型平臺(tái)由能夠直接支持這種架構(gòu)模型的動(dòng)態(tài)可重配置 FPGA 器件構(gòu)成。我們選用了 Virtex-5? 器件,因?yàn)槠淠軌蛑嘏渲镁匦螀^(qū)域。 我們根據(jù)預(yù)先測(cè)算的應(yīng)用線(xiàn)程資源需求定義了調(diào)度布局算法,以確保每個(gè) RR 中 FPGA 元件(LUT、存放器、分布式存儲(chǔ)器、I/O)的高效利用。 圖2 可重配置區(qū)域構(gòu)造 圖中文字: 控制 上下文(比特流) 靜態(tài)區(qū)域 可重配置區(qū)域 靜態(tài)區(qū)域 數(shù)據(jù) 硬件操作系統(tǒng) 控制 動(dòng)態(tài)區(qū)域 線(xiàn)程 數(shù)據(jù) 片上網(wǎng)絡(luò) 硬件分區(qū) 3 操作系統(tǒng)、片上網(wǎng)絡(luò)及中間件 為具備靈活性,F(xiàn)OSFOR 架構(gòu)使用了至少兩個(gè)操作系統(tǒng)實(shí)例:一個(gè)為
11、運(yùn)行在每個(gè)處理器上且負(fù)責(zé)處理軟件線(xiàn)程的軟件操作系統(tǒng);另一個(gè)為能夠管理硬件線(xiàn)程的硬件操作系統(tǒng)。為了在性能、開(kāi)發(fā)時(shí)間以及標(biāo)準(zhǔn)化之間實(shí)現(xiàn)平衡,我們使用了現(xiàn)有的軟件操作系統(tǒng)和全新的硬件操作系統(tǒng)。 該硬件操作系統(tǒng)利用賽靈思 FPGA 的動(dòng)態(tài)部分重配置功能,在調(diào)度硬件線(xiàn)程方面與傳統(tǒng)操作系統(tǒng)調(diào)度軟件線(xiàn)程一樣靈活。 對(duì)軟件操作系統(tǒng)的要求是實(shí)時(shí)行為、能夠處理多個(gè)處理器并提供基本的進(jìn)程間通信服務(wù)。我們選用了一個(gè)的開(kāi)源操作系統(tǒng) RTEMS。出于兼容性原因,我們選用了 LEON Sparc 軟核處理器,同軟件節(jié)點(diǎn)一樣,其也是和開(kāi)源的。 該硬件操作系統(tǒng)(HwOS)利用賽靈思 FPGA 的動(dòng)態(tài)部分重配置功能,在調(diào)度硬件線(xiàn)
12、程方面與傳統(tǒng)操作系統(tǒng)調(diào)度軟件線(xiàn)程一樣靈活。硬件線(xiàn)程由動(dòng)態(tài)和靜態(tài)兩大部分組成。動(dòng)態(tài)部分內(nèi)含一個(gè)用來(lái)執(zhí)行線(xiàn)程功能的 IP 模塊和一個(gè)用來(lái)使服務(wù)調(diào)用次序與硬件操作系統(tǒng)同步的有限狀態(tài)機(jī)。靜態(tài)部分則內(nèi)含一個(gè)與硬件操作系統(tǒng)相連的控制接口和一個(gè)用于與其它軟硬件任務(wù)開(kāi)展交換數(shù)據(jù)的網(wǎng)絡(luò)接口。 為支持多種線(xiàn)程間數(shù)據(jù)傳輸需要,我們開(kāi)發(fā)出了一種靈活的片上網(wǎng)絡(luò) DRAFT。傳統(tǒng)操作系統(tǒng)的通信服務(wù)足以支持軟件線(xiàn)程間的通信。但在我們的設(shè)計(jì)中,操作系統(tǒng)還需要支持硬件線(xiàn)程間的通信。為此,我們專(zhuān)門(mén)設(shè)計(jì)了 DRAFT 網(wǎng)絡(luò)。我們針對(duì)一個(gè)或者多個(gè) DR 逐一綜合硬件線(xiàn)程,同時(shí)靜態(tài)地定義每個(gè) DR 接口。 通信接口的靜態(tài)定義讓我們可以
13、定義靜態(tài)的片上網(wǎng)絡(luò)。一般來(lái)說(shuō),硬件線(xiàn)程要求高帶寬和低時(shí)延,故片上網(wǎng)絡(luò)必須提供高性能。我們?yōu)?DRAFT 選擇的拓?fù)涫且环N胖樹(shù)拓?fù)涞臄U(kuò)展。我們?cè)O(shè)計(jì)的主要目的是為了限制資源開(kāi)銷(xiāo),同時(shí)實(shí)現(xiàn)高性能的線(xiàn)程間通信。 硬件平臺(tái)的異構(gòu)性是設(shè)計(jì)人員部署應(yīng)用時(shí)面臨的主要的復(fù)雜性障礙。在 FOSFOR 項(xiàng)目中,這種異構(gòu)性不僅來(lái)自軟件域中的不同嵌入式處理器,還來(lái)自在單個(gè)平臺(tái)上同時(shí)集成軟件和硬件計(jì)算模型的做法。 采用中間件在硬件和軟件間建立抽象層,并提供同構(gòu)編程模型,可以很好地解決這一問(wèn)題。中間件實(shí)現(xiàn)了一組虛擬通道,可以在不必理會(huì)線(xiàn)程的實(shí)現(xiàn)區(qū)域的情況下開(kāi)展線(xiàn)程間通信。這些服務(wù)跨平臺(tái)分布,提供了一個(gè)靈活的可擴(kuò)展抽象層,讓
14、 FOSFOR 設(shè)想臻于完善。 4 性能加速 構(gòu)建硬件操作系統(tǒng)的主要原因出于性能和靈活性方面的考慮。該操作系統(tǒng)本可以采用純軟件或純硬件。由于每次調(diào)用操作系統(tǒng)原語(yǔ)都會(huì)涉及開(kāi)銷(xiāo),即線(xiàn)程等待時(shí)間,操作系統(tǒng)速度越快,浪費(fèi)的時(shí)間就越少。為了評(píng)估開(kāi)銷(xiāo),我們必須就硬件操作系統(tǒng)的時(shí)序和原始的軟件操作系統(tǒng) RTEMS 做一比較。 硬件本地運(yùn)行只需要數(shù)十個(gè)周期,而為了訪問(wèn)共享存儲(chǔ)器,硬件全局運(yùn)行需要數(shù)百個(gè)周期。經(jīng)我們?cè)u(píng)估,與軟件操作系統(tǒng)的運(yùn)行結(jié)果相比,本地創(chuàng)立-刪除操作速度提高了 60 倍,其它操作速度也提高了約 50 倍。 硬件操作系統(tǒng)的資源使用(表 1)相差較大,這主要取決于激活的服務(wù)的數(shù)量及功能,比方我們?yōu)槊宽?xiàng)服務(wù)選擇對(duì)象(信號(hào)量、線(xiàn)程等)的數(shù)量。我們使用賽靈思 Virtex-5 FX100T 來(lái)實(shí)現(xiàn)系統(tǒng)。表中列出了硬件操作系統(tǒng)使用的資源。余下的資源可用于實(shí)現(xiàn)其它系統(tǒng)組件及硬件線(xiàn)程自身。 表1 硬件操作系統(tǒng) (Virtex-5 FX100) 的資源使用情況 對(duì)于網(wǎng)絡(luò)性能,在 DRAFT 連接 8 個(gè)32 位字寬、緩沖深度為 4 個(gè)字,頻率為100MHz 的組件的配置下,片上網(wǎng)絡(luò)可使每個(gè)連接的組件的數(shù)據(jù)速率高達(dá) 1,040Mbps。網(wǎng)絡(luò)的拓?fù)浜吐酚蓞f(xié)議保證不會(huì)出現(xiàn)爭(zhēng)用和擁堵現(xiàn)象。在兩個(gè)互連的組
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024屆安徽省合肥市重點(diǎn)中學(xué)普通高中畢業(yè)班單科質(zhì)量檢查數(shù)學(xué)試題
- 電冰箱、空調(diào)器安裝與維護(hù)電子教案 4.2 系統(tǒng)管道安裝
- 湘教版九年級(jí)上冊(cè)美術(shù)教案
- 螺桿式冷水機(jī)組技術(shù)規(guī)格書(shū)
- 福建省龍巖市12校2024-2025學(xué)年高二上學(xué)期11月期中生物試題(含答案)
- 玩具真多課件教學(xué)課件
- 實(shí)驗(yàn)室用化學(xué)反應(yīng)器產(chǎn)業(yè)深度調(diào)研及未來(lái)發(fā)展現(xiàn)狀趨勢(shì)
- 家庭日用紡織品產(chǎn)業(yè)深度調(diào)研及未來(lái)發(fā)展現(xiàn)狀趨勢(shì)
- 家用電烹飪爐產(chǎn)業(yè)深度調(diào)研及未來(lái)發(fā)展現(xiàn)狀趨勢(shì)
- 切肉餐刀市場(chǎng)需求與消費(fèi)特點(diǎn)分析
- 正余弦定理知識(shí)點(diǎn)權(quán)威總結(jié)18頁(yè)
- 國(guó)企紀(jì)檢監(jiān)察嵌入式監(jiān)督的探索與實(shí)踐
- 淺議小升初數(shù)學(xué)教學(xué)銜接
- 旁站監(jiān)理記錄(高區(qū)空調(diào))
- 嬰幼兒大腦發(fā)育第一ppt課件
- 核磁共振實(shí)驗(yàn)報(bào)告
- 深基坑工程降水技術(shù)及現(xiàn)階段發(fā)展
- 暫堵壓裂技術(shù)服務(wù)方案
- 美的中央空調(diào)故障代碼H系列家庭中央空調(diào)(第一部分多聯(lián)機(jī))
- 鋼芯鋁絞線(xiàn)參數(shù)
- 商品分類(lèi)PPT演示課件
評(píng)論
0/150
提交評(píng)論