


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 基于CCNUMA的多處理器系統(tǒng)研究對于多處理器系統(tǒng),比較流行的有3種模式,對稱多處理(SymmetricMultiprocessing,SMP)模式、非均勻存儲訪問(NonUniformMemoryAccess,NUMA)模式、大規(guī)模并行處理(MassivelyParallelProcessing,MPP)模式。SMP模式即將2個或2個以上的同樣的處理器連接到一個共享的主存上。在SMP系統(tǒng)中,所有的處理器可以同時訪問同一個物理存儲器,即運行同一個操作系統(tǒng),因此也被稱為均勻性存儲訪問系統(tǒng)。這種結構比較簡單,但是由于其是共享存儲器對于多處理器系統(tǒng),比
2、較流行的有3種模式,對稱多處理(Symmetric Multiprocessing,SMP)模式、非均勻存儲訪問(Non Uniform Memory Access,NUMA)模式、大規(guī)模并行處理(Massively Parallel Processing,MPP)模式。SMP模式即將2個或2個以上的同樣的處理器連接到一個共享的主存上。在SMP系統(tǒng)中,所有的處理器可以同時訪問同一個物理存儲器,即運行同一個操作系統(tǒng),因此也被稱為均勻性存儲訪問系統(tǒng)。這種結構比較簡單,但是由于其是共享存儲器,容易在訪存時產生系統(tǒng)瓶頸,可擴展性也比較差。MPP是分布式存儲器模式,可擴展性好,但是需要并行編程和并行編譯
3、,在軟件系統(tǒng)構建上比較復雜,使用不便。NUMA架構將若干個單元通過專門的互聯(lián)設備聯(lián)結在一起組成分布式和共享內存空間。每一個處理器可以訪問自己的存儲器,也可以訪問其他處理器或者共享的存儲器,所有訪存有遠近、時延長短之分,稱為非均勻存儲訪問。在某個處理器訪問空間上比較遠的存儲器時,會有很大的時延,為了緩解這個問題,通過高速緩存一致性使得處理器訪問存儲器的幾率大大降低,在某種程度上提高了系統(tǒng)效率,這種架構稱為CCNUMA即一致性緩存非均勻存儲訪問模式。這種架構繼承了SMP和MPP系統(tǒng)的一些優(yōu)點,在處理器個數(shù),內存大小、IO連接能力和帶寬上有很大的伸縮性,又保持了SMP系統(tǒng)單一操作系統(tǒng)、簡單的應用程序
4、編程模式和易于管理的優(yōu)點。1 CCNUMA基本架構 CCNUMA架構的系統(tǒng)最出名的莫過于SGI公司的ORIGIN系列,SGI公司很好的發(fā)展和擴展了CCNUMA技術,其基本架構被廣泛應用。圖1是其ORIGIN2000的基本原理圖,每一個節(jié)點擁有2個處理器,2個二級緩存,主存,用于互聯(lián)的HUB芯片,1個IO接口,1個互聯(lián)網(wǎng)絡的路由器接口,它的每個節(jié)點可以看作是一個SMP,通過互聯(lián)網(wǎng)絡可擴展至128個處理器的多處理器系統(tǒng)。Origin 2000的所有結點通過CrayLink高性能互聯(lián)網(wǎng)絡相互聯(lián)接,路由器是構成CrayLink的基本單位,它包含6個端口,內部采用交叉
5、開關實現(xiàn)端口間的全互聯(lián)。每個路由器的2個端口用于聯(lián)接結點,其余4個端口實現(xiàn)路由器間的互聯(lián),形成互聯(lián)網(wǎng)絡拓撲結構。該CrayLink的半分帶寬與結點個數(shù)成線性遞增關系,對任意2個結點,至少能提供兩條路徑,保證了結點間的高帶寬、低延遲聯(lián)接和互聯(lián)網(wǎng)絡的穩(wěn)定性和容錯能力。2 兩種比較新的架構 SGI公司的Origin系列多處理器系統(tǒng)是一種比較通用的架構,但是還是比較復雜。后來,分別由Corepaq公司的AlphaEV7框架的處理器Alpha 21364和AMD公司的Opteron處理器組成的CCNUMA架構的多處理器系統(tǒng)簡單很多,這兩種處理器都是針對多處理系統(tǒng)領域推
6、出的,其有著特有的專為多處理器系統(tǒng)應用設計的處理器結構。21 Alpha 21364處理器 2000年,Compaq公司推出了Alpha處理器的第四代產品Alpha21364,這是一款RISC處理器,在當時非常先進,在業(yè)內首次在處理器內集成了內存控制器,特別是它還有先進的多處理互聯(lián)功能,在建造多處理器系統(tǒng)上很方便。 21364的簡化圖如圖2所示。21364是64位處理器,擁有15 MB的L2 CACHE,支持緩存一致性協(xié)議。內部集成了2個RDRAM內存控制器,在RDRAM中對于頁命中點對點的延遲是30 ns,加載應用的延遲
7、是75 ns,對應高達12 GBs的帶寬。最大的不同就是有一個路由器,有4個連接通道可與附近處理器相連,并與本地端口和IO端口相連,每個連接通道提供62 GBs的帶寬。 21364的處理器問互聯(lián)總線提供了CCNUMA多處理器架構間的無粘合連接,如圖3所示。處理器間的二維拓撲互聯(lián)架構滿足了最遠的處理器間的最小系統(tǒng)延遲設計。這種架構可擴展至128個處理器互聯(lián)。22 Opteron處理器 AMD公司在2001年推出了其第8代處理器K8架構的Opteron處理器。Opteron處理器基于X86系統(tǒng)架構并對其做了根本性改善,屬于64位處理器,并兼容32位X86處理器架構。Opteron處理器集成了內存控制器,降低了訪存延遲,加大了訪存帶寬。HyperTransport(超傳輸)互連控制器也被集成到Opteron處理器內部,在處理器和IO子系統(tǒng)之間提供了拓展性極強的數(shù)據(jù)連接帶寬。在Opteron處理器內部的數(shù)據(jù)通道為雙向16位的通訊,可以達到1 600 MTs(每秒百萬次傳送)的工作效率,可提供雙向為64 GBs的帶寬。AMD Opteron處理器之間以及處理器同IO子系統(tǒng)之間如何通過HyperTransport(超傳輸)技術進行互連。處理器之間的互連采用的是一致性協(xié)議(CoherentProtocol),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貨物運輸合同(水路)
- 醫(yī)療行業(yè)人才引進合同
- 房地產開發(fā)商與購房者合同大全
- 勞動用工安全責任合同模板:應對與處理
- 地區(qū)授權代理合同書
- 基礎設施建設項目土地征用合同
- 房地產 -鏈家地產 二手房業(yè)務知識與經驗介紹
- 安全責任的落實強化企業(yè)安全主體責任考核試卷
- 攝影器材行業(yè)知識產權保護與合規(guī)經營策略研究考核試卷
- 數(shù)據(jù)結構與算法基礎考核試卷
- 供熱管網(wǎng)施工主要工序施工方法
- 第1課中華文明的起源與早期國家的形成【中職專用】《中國歷史》(高教版2023基礎模塊)
- 接觸網(wǎng)設備結構-接觸網(wǎng)的組成
- 全國青少年機器人技術等級考試二級第一課-直升機課件
- 數(shù)學原來可以這樣學:小學篇
- 初中生物學七年級下冊第四單元《生物圈中的人》 單元作業(yè)設計
- stag 200 4plus 4eco 300isa21裝配1版電控系統(tǒng)連接圖
- 儀器分析緒論
- 音樂劇《貓》賞析分析課件
- 回族做禮拜的念詞集合6篇
- 陽臺玻璃欄桿施工方案方案
評論
0/150
提交評論