版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Power系列處理技術(shù)對(duì)比1、 power處理器歷史回顧1990年IBM第一款使用Power(Performance Optimization With Enhanced RISC)處理器的RS/6000推向市場(chǎng),IBM的POWER處理器真正等上歷史舞臺(tái)。20多年來(lái),IBM Power系列處理器7代架構(gòu)卓越相承,在商業(yè)應(yīng)用與技術(shù)運(yùn)算應(yīng)用上占得一席重要地位。以下簡(jiǎn)要回顧Power系列處理器發(fā)展歷程:1990年,Power1,集成了800,000個(gè)晶體管,并被火星探險(xiǎn)任務(wù)用作中央處理器;1993年,Power2,集成了1,500萬(wàn)個(gè)晶體管,新加了第二個(gè)浮點(diǎn)處理單元和更多緩存;1998年,Power
2、3,第一個(gè)64位對(duì)稱多處理器,以銅作為連接介質(zhì),在相同價(jià)格下獲得兩倍的性能;2001年,Power4,集成了1億7,400萬(wàn)個(gè)晶體管,是第一個(gè)單板上具有多核心設(shè)計(jì)的服務(wù)器處理器;2004年,Power5,引入SMT(Simultaneous Multithreading)同步多線程技術(shù),大幅提升處理器的并行計(jì)算能力;2007年,Power6,第一個(gè)內(nèi)置十進(jìn)制浮點(diǎn)加速器的處理器;2010年,Power7,12億晶體管,8個(gè)處理器內(nèi)核。由上可以看出,Power系列處理器的發(fā)展,前期基本遵循摩爾定律發(fā)展,隨著晶體管工藝的不斷提升,芯片集中晶體管數(shù)也越來(lái)越多,CPU主頻也不斷得到提升。但隨著主頻的不斷
3、提高,Cpu的計(jì)算性能慢慢地也發(fā)展到了一個(gè)瓶頸,隨后開始以多核、并行技術(shù)為主要發(fā)展方向,Cpu的性能又得到進(jìn)一步飛躍。作為商業(yè)處理器,Power系列處理器根據(jù)市場(chǎng)的需求,不斷在性能、能耗、價(jià)格、體積等方面探索與發(fā)展,在商業(yè)領(lǐng)域是一款十分成功的處理器。2、 Power5.6.7差異Power5Power6Power7制造工藝130nm65nm45nm尺寸389mm2341mm2567mm2晶體管數(shù)276M790M1.2B新技術(shù)特性Dual CoreEnhanced ScalingSMTMemory bandwidth +Distributed Switch +Core Parallelism +
4、FP Performance +VirtualizationDual CoreHigh Frequencies SMT +Memory Subsystem +Altivec Instruction RetryDyn Energy MgmtProtection KeysVirtualization +Multi CoreOn-Chip eDRAM SMT+Mem Subsystem +Reliability +VSM & VSX (AltiVec)Protection Keys+Power Optimized Cores1、 Power5技術(shù)特性Power5處理器晶體管數(shù)比Power4多了將近1
5、億個(gè),其對(duì)性能的提升主要體現(xiàn)在Cache與SMT技術(shù)上。 由上圖可以看出,Power5的L1 Cache采用4-way associative LRU,大大提升了L1的訪問速度;提高了L2、L3緩存的容量,提高了Cache的命中率,提升了cpu到內(nèi)存的帶寬;SMT技術(shù)增加了對(duì)多線程和微分區(qū)的支持。Power5系統(tǒng)結(jié)構(gòu)上的一個(gè)重大改進(jìn)是提供了從L2緩存到L3緩存控制器再到L3緩存的直接通道,而不像Power4芯片那樣通過芯片上的分布式告訴開關(guān)訪問L3緩存控制器,且增大了的L3緩存也不再和內(nèi)存使用同一個(gè)通道。這將提高芯片的帶寬,降低分布式告訴開關(guān)沖突。另一個(gè)重大改進(jìn)是將內(nèi)存控制器集成到Power5
6、芯片中,降低了內(nèi)存訪問延遲,提高了內(nèi)核訪問內(nèi)存的性能。 SMT技術(shù)使得Power6處理器支持2個(gè)并發(fā)線程,更充分利用內(nèi)核中的8個(gè)執(zhí)行單元,提高了效率,在操作系統(tǒng)和應(yīng)用程序看來(lái),一個(gè)“雙核心、雙線程”的Power5芯片可以提供4個(gè)邏輯處理器,并且對(duì)應(yīng)用程序沒有特別要求。2、 Power6技術(shù)特性隨著生產(chǎn)工藝提升到60nm,Power6處理器最大的特點(diǎn)是超高的主頻處理速度,與Power5相比,幾乎提到了一倍的主頻。與Power5相比,Power6在計(jì)算單元上多了VMX和DP2個(gè)部件,支持單精度浮點(diǎn)運(yùn)算,同時(shí)也支持十進(jìn)制浮點(diǎn)運(yùn)算。Power6處理器,Cache性能也得到很大提升。L1 Cache提升
7、到64KB,8-way;L2 Cache提高到24 MB容量;L3 Cache也提升到16-way,同時(shí)L3 Cache集成了目錄與控制器芯片??偟膩?lái)說,Cache訪問速度更快、命中率更高,因此訪問效率也得到很大提高。由上圖可以看出,Power6的SMT技術(shù)在Power5的基礎(chǔ)上有更大提升,2個(gè)線程同一個(gè)周期可以支持7條指令,并行技術(shù)能力得到進(jìn)一步提升。Power6的另一個(gè)重要改進(jìn),就是它引入了從 POWER3 到 POWER4 的轉(zhuǎn)移以來(lái)最大的改變,第二代的 ViVA, ViVA-2。其通過多個(gè)Power6處理器節(jié)點(diǎn)組合,可以支持向量計(jì)算,由上圖所示。最后Power6的節(jié)能技術(shù)有很大的改進(jìn),
8、盡管主頻提升了一倍,但其能耗與Power差不多,這在控制能耗和發(fā)熱量上有很大改進(jìn)。3、 Power7技術(shù)特性Power7處理器比Power6性能有很大提升,首先從內(nèi)核來(lái)看,從雙核提升到8核,而且單核性能也提升至Power6單核性能的1.2倍至1.5倍。這點(diǎn)突破了多內(nèi)核設(shè)計(jì)在架構(gòu)上以降低單線程性能來(lái)妥協(xié)多核的協(xié)同處理的傳統(tǒng)設(shè)計(jì),成為第一款在多核情況下還能保持單核性能的處理器。 1)8個(gè)處理內(nèi)核 和以往的IBM Power處理器不太一樣,IBM Power7是一個(gè)單晶片的八核處理器,而不是如Power5那樣由多個(gè)晶圓合體。IBM Power7是一個(gè)典型的多核心處理器,每個(gè)核心的架構(gòu)如下圖: 單個(gè)I
9、BM Power7核心 Power7處理核心的最大特點(diǎn)是它具有12個(gè)執(zhí)行單元,以及4個(gè)同步多線程。這12個(gè)執(zhí)行單元是: 兩個(gè)FXU整數(shù)單元一個(gè)DFU十進(jìn)制整數(shù)單元四個(gè)VSX FPU向量/標(biāo)量擴(kuò)展浮點(diǎn)單元:和傳統(tǒng)的FPU不同,它可以進(jìn)行向量計(jì)算。Power7基于Power Architecture版本2.06,擴(kuò)展了指令集以支持向量運(yùn)算,對(duì)比于通常的SIMD,向量運(yùn)算會(huì)具有更高的效率,它可以更好地利用寄存器 共四個(gè)LSU存取單元:內(nèi)存存取Load兩個(gè),Store兩個(gè)因此它緊挨著L1,以及L2 一個(gè)CRU條件寄存器單元和BRU分支單元:一種特別的浮點(diǎn)運(yùn)算是由額外的單元執(zhí)行而不是由通用整數(shù)單元執(zhí)行,
10、這就是和POWER架構(gòu)的condition register條件寄存器相關(guān)的運(yùn)算,它由CRU來(lái)執(zhí)行 BRU分支單元執(zhí)行分支指令,實(shí)際上,它和CRU結(jié)合緊密,因此合在一起;CRU和BRU都有點(diǎn)偏向于控制單元(如IFU和ISU這樣的就是徹頭徹尾的控制單元),控制著指令的走向,因此它們靠近IFU指令拾取單元,也靠近L1/L2的位置 Power7是OOOE(Out-of-Order Execution,亂序執(zhí)行)架構(gòu)的處理器,和上一代Power6的IOE(In-Order Execution,順序執(zhí)行)不同有趣的是,Power5是OOOE的,也就是說,Power7又變回去了。 順序執(zhí)行的結(jié)構(gòu)簡(jiǎn)單,可以
11、獲得較高的運(yùn)行頻率,亂序執(zhí)行則可以獲得更好的運(yùn)行效率,但是設(shè)計(jì)會(huì)變得復(fù)雜設(shè)計(jì)不是問題,問題是發(fā)熱量也隨之增大。從結(jié)果來(lái)看,Power7的頻率應(yīng)該比Power6低一點(diǎn)。至于執(zhí)行效率本身,亂序本身顯然更好,Power7的流水線級(jí)數(shù)進(jìn)行了縮減和優(yōu)化以提升運(yùn)行頻率。 Power7的內(nèi)核相對(duì)來(lái)說是非常復(fù)雜的,12個(gè)相對(duì)獨(dú)立執(zhí)行單元的設(shè)計(jì)可不常見,如Nehalem約有9個(gè)執(zhí)行單元(不過執(zhí)行端口只有6個(gè):三個(gè)運(yùn)算端口,三個(gè)存取端口。三個(gè)運(yùn)算端口可以同時(shí)執(zhí)行三個(gè)整數(shù)運(yùn)算和三個(gè)浮點(diǎn)運(yùn)算)。強(qiáng)大的執(zhí)行能力讓Power7可以具有更多的多線程能力:根據(jù)不同模式,智能支持SMT1,SMT2,SMT4,最大限度利用處理器
12、資源。每個(gè)Power7具有4個(gè)同步多線程,Power5和Power6都是兩個(gè)。同步多線程是充分利用亂序架構(gòu)的好方法,相對(duì)來(lái)說,順序架構(gòu)利用起來(lái)就比較難。近年來(lái)處理器的發(fā)展是追求低功耗、大規(guī)模并行,越來(lái)越走向多路處理了,既然走向了多核心,那么走向更多路的SMT同步多線程也就順理成章了,相對(duì)來(lái)說Power7的功耗并不高,見后。 2)CacheIBM Power7具有3層緩存架構(gòu)。首先每個(gè)核心具有單獨(dú)的32KB的L1(L1-I和L1-D分別32KB)和256KB的L2,以及32MB的L3緩存,在這32MB L3當(dāng)中,有4MB的緩存,其延遲只是L3的1/5,特別快,有觀點(diǎn)認(rèn)為它形成了一個(gè)新的緩存層。這
13、個(gè)緩存層屬于L3的一部分,可以被其他核心訪問。 與POWER6處理器不同,POWER7處理器把三級(jí)緩存從芯片外移動(dòng)到了芯片內(nèi)部,Power7的L3L4緩存容量達(dá)到了32MB。實(shí)際上,這些緩存屬于DRAM(Dynamic RAM,動(dòng)態(tài)內(nèi)存),和通常CPU使用的SRAM(Static RAM,靜態(tài)內(nèi)存)不同,IBM稱之為eDRAM,embedded DRAM,集成動(dòng)態(tài)內(nèi)存。DRAM也就是我們通常的內(nèi)存條使用的技術(shù)。 DRAM和SRAM的區(qū)別是:DRAM使用一個(gè)晶體管和一個(gè)電容存儲(chǔ)一個(gè)bit,由于電容會(huì)漏電,因此必須周期性地充電以維持?jǐn)?shù)據(jù),優(yōu)點(diǎn)是簡(jiǎn)單、便宜;SRAM則用6個(gè)晶體管(Nehalem則使
14、用了8個(gè)晶體管以降低功耗)組成的雙穩(wěn)態(tài)觸發(fā)器電路來(lái)存儲(chǔ)一個(gè)bit,不需要周期性地充電,速度很快,然而占地面積大,耗電高,造價(jià)也高。 為什么要用DRAM呢?不是說DRAM的速度慢么?我認(rèn)為可以從多個(gè)方面來(lái)考慮:首先是容量,Power7本身的8個(gè)核心以及4路多線程要求具有大容量的緩存以維持一定的性能水準(zhǔn),至少要達(dá)到30MB;其次是功耗,假如采用SRAM的話,其功耗將會(huì)非常高的:32MB的緩存會(huì)消耗大量的電力,并且設(shè)計(jì)更加復(fù)雜,多個(gè)核心的內(nèi)部互聯(lián)也變得麻煩(4核心的Itanium 3 Tukwila具有30MB的SRAM L3,不過目前處于難產(chǎn)階段),使用DRAM的話,只需要傳統(tǒng)SRAM 1/3的空
15、間,1/5的電力,但降低250倍的錯(cuò)誤幾率,減少1.5B晶體管,實(shí)現(xiàn)POWER7 on-chip 32MB L3緩存,較片外緩存延遲只有1/6,帶寬提升2倍。唯一的缺點(diǎn)是性能,這一點(diǎn)無(wú)法避免,這應(yīng)該就是L2.5或者說L3存在的原因,這個(gè)特別快速的4MB區(qū)域可能仍然是SRAM構(gòu)成的。 3)內(nèi)置雙DDR3內(nèi)存控制器大容量的L3通過內(nèi)部互聯(lián)結(jié)構(gòu)連接,據(jù)說處理器核心互聯(lián)的帶寬達(dá)到了500GB/s!經(jīng)過了大容量L3(L4)的篩選之后,仍然需要大量的內(nèi)存帶寬,Power7提供了兩個(gè)DDR3內(nèi)存控制器,每個(gè)控制器支持4個(gè)DDR3通道,大約支持到主流水準(zhǔn):DDR3-1600,這樣內(nèi)存控制器可以提供100GB/
16、s的帶寬!內(nèi)置內(nèi)存控制器的設(shè)計(jì)并不容易,需要提供各種RAS特性,并需要面對(duì)多種不同廠商不同型號(hào)不同參數(shù)的內(nèi)存模組。為了更好地支持多個(gè)內(nèi)存通道,并提高性能,Power7每個(gè)內(nèi)存控制器都具有16KB的重調(diào)度緩存來(lái)重新排序內(nèi)存存取請(qǐng)求。 4) SMP4連接總線Power7通過三個(gè)方面的設(shè)計(jì)來(lái)達(dá)到32路SMP能力:巨大的帶寬、特別的拓?fù)浣Y(jié)構(gòu)和特別的一致性協(xié)議。Power7的處理器間總線可以提供360GB/s的帶寬。 本地組與遠(yuǎn)程組Power7拓?fù)浣Y(jié)構(gòu):32路SMP系統(tǒng)Power7使用了一個(gè)兩層的拓?fù)淠P停?個(gè)處理器組成一個(gè)本地SMP組(需要7個(gè)本地I/O總線),然后8個(gè)SMP組之間兩兩直接互聯(lián)(每個(gè)SMP組需要7個(gè)外部I/O總線),為了實(shí)現(xiàn)這個(gè)目標(biāo),Power7提供了兩個(gè)總線:一個(gè)用于本地SMP,一個(gè)用于遠(yuǎn)程SMP。總線的位寬是120Byte。 此外為了支持這個(gè)拓?fù)浣Y(jié)構(gòu),Power7的一致性協(xié)議混合了兩種一致性消息的廣播方法:一種是全局廣播,一種是本地SMP組的猜測(cè)性廣播。這個(gè)一致性協(xié)議定義了13種狀態(tài),并通過緩存線上額外的設(shè)置位,Power7最終實(shí)現(xiàn)了復(fù)雜的結(jié)構(gòu),在32路處理器、8核心、總共256個(gè)處理內(nèi)核的SMP系統(tǒng)里,可以同時(shí)維持20000個(gè)緩存一致性操作。 最后Power7在節(jié)能設(shè)計(jì)上
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Windows Server網(wǎng)絡(luò)管理項(xiàng)目教程(Windows Server 2022)(微課版)9.1 知識(shí)引入-VPN
- Windows Server網(wǎng)絡(luò)管理項(xiàng)目教程(Windows Server 2022)(微課版)7.3 任務(wù)2 配置網(wǎng)絡(luò)負(fù)載均衡
- 《心理健康教育概論》串講
- 人教版九年級(jí)英語(yǔ)Unit 8 It must belong to Carla. Section B 3a - Self Check課時(shí)作業(yè)
- 2014-2020熔接機(jī)行業(yè)投資戰(zhàn)略規(guī)劃研究報(bào)告
- 2024至2030年中國(guó)大口徑雙埋弧直縫焊管行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國(guó)臺(tái)式砂光機(jī)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024至2030年中國(guó)單動(dòng)型點(diǎn)膠機(jī)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024至2030年中國(guó)內(nèi)襯白紙鋁箔膠帶數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024年中國(guó)鋁鐵防銹漆市場(chǎng)調(diào)查研究報(bào)告
- 五星級(jí)酒店工程部標(biāo)準(zhǔn)化管理資料
- 股權(quán)收購(gòu)項(xiàng)目盡調(diào)清單
- 民族團(tuán)結(jié)實(shí)踐活動(dòng)總結(jié)范文5篇
- 《網(wǎng)店運(yùn)營(yíng)與管理》課件(完整版)
- 網(wǎng)店客服(第二版)整書電子教案完整版教學(xué)課件全套ppt教學(xué)教程最全課件最新
- GB∕T 20975.3-2020 鋁及鋁合金化學(xué)分析方法 第3部分:銅含量的測(cè)定
- 小學(xué)校園污染防控管理制度
- 2022年三年級(jí)上冊(cè)音樂全冊(cè)教案3
- 管理學(xué)-原理與方法(第七版)重點(diǎn)
- 優(yōu)化綠色低碳發(fā)展區(qū)域布局實(shí)施方案
- (完整ppt)氣候?qū)n}課件
評(píng)論
0/150
提交評(píng)論