![AMD 推土機系列CPU構(gòu)架_第1頁](http://file4.renrendoc.com/view/3adf1f7fe9a4c3db4deb9f61eb59d50c/3adf1f7fe9a4c3db4deb9f61eb59d50c1.gif)
![AMD 推土機系列CPU構(gòu)架_第2頁](http://file4.renrendoc.com/view/3adf1f7fe9a4c3db4deb9f61eb59d50c/3adf1f7fe9a4c3db4deb9f61eb59d50c2.gif)
![AMD 推土機系列CPU構(gòu)架_第3頁](http://file4.renrendoc.com/view/3adf1f7fe9a4c3db4deb9f61eb59d50c/3adf1f7fe9a4c3db4deb9f61eb59d50c3.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
《AMD推土機系列CPU構(gòu)架》AMD推土機架構(gòu)采用了模塊化設(shè)計,每個模塊內(nèi)有兩個整數(shù)核心和一個浮點核心,各自搭配專用的調(diào)度器,而且浮點核心可為兩個整數(shù)核心所共享使用。因為有自己的調(diào)度器,浮點核心不必依賴整數(shù)調(diào)度器去安排浮點命令,也無需借助整數(shù)資源去執(zhí)行256位命令。相比之下,Intel的架構(gòu)中整數(shù)和浮點核心共用一個調(diào)度器,它必須同時處理整數(shù)和浮點命令。推土機架構(gòu)圖推土機架構(gòu)會在指令集方面做出大幅度的擴展,加入支持SSSE3、SSE4?1/4?2、AVX、AES、FMA4、XOP、PCLMULQDQ等等,其中最關(guān)鍵的就是AVX。AVX指令集可以執(zhí)行256位浮點指令,但需要澄清的是,并沒有什么所謂的“256位命令〃。單精度命令都是32位的,雙精度則是64位。使用今天標(biāo)準(zhǔn)的128位浮點單元,可以在一個時鐘周期內(nèi)并行執(zhí)行四個單精度命令或者兩個雙精度命令。有了AVX效率就可以翻一番,亦即每時鐘周期內(nèi)執(zhí)行八個32位單精度命令,或者兩個64位雙精度命令。當(dāng)然了,這得要應(yīng)用程序支持AVX才行,否則的話256位浮點單元只會運行在128位模式下一一正因為如此,AMD提出了彈性浮點單元。如今的典型數(shù)據(jù)中心負載都以整數(shù)運算為主,浮點運算只占很小一部分,所以絕大多數(shù)情況下一個龐大的256位浮點單元只會白白消耗內(nèi)核面積和功耗,坐視整數(shù)單元忙得要死。推土機通過在兩個整數(shù)核心之間共享一個256位浮點單元,既節(jié)省了內(nèi)核面積和功耗,也能靈活滿足實際負載需求。FlexFP彈性浮點單元由兩個128位FMAC(乘法累加器)組成,每一個都可以在每時鐘周期內(nèi)執(zhí)行FMAC、FADD(浮點加法)、FMUL(浮點乘法),而Intel的架構(gòu)中只能通過單個FADD管線執(zhí)行FADD指令,F(xiàn)MUL亦然。有了FMAC單元,乘法和加法命令不會像標(biāo)準(zhǔn)FADD、FMUL那樣擁堵在一起,兩個單元都可以靈活處理這些計算命令。如果一個程序只使用FADD,那么兩個FMAC單元都可以全力執(zhí)行FADD。這種設(shè)計的其他好處還有:支持FMA4指令而實現(xiàn)非破壞性DEST,降低寄存器的壓力;消除中間反復(fù)步驟,提高精確度。順便再說說AES。如果應(yīng)用程序符合美國商務(wù)部FIPS197加密標(biāo)準(zhǔn),AES就能為其實現(xiàn)硬件加速。推土機的FlexFP單元也能執(zhí)行這些一次16個字節(jié)的指令,速度為每時鐘周期一個,是現(xiàn)有帶寬的兩倍。FlexFP的設(shè)計理念對降低功耗也大有好處,能讓設(shè)計人員在同樣的功耗指標(biāo)下放入更多繁忙的整數(shù)單元。事實上,F(xiàn)lexFP的設(shè)計目標(biāo)之一就是將其空閑功耗降至峰值功耗的區(qū)區(qū)2%。FlexFP的美妙之處在于它既是單個256位浮點單元,又被兩個整數(shù)核心所共享。每個時鐘周期內(nèi),每個整數(shù)核心都可以通過兩個128位指令或者一個256位指令來來操作256位并行數(shù)據(jù),或者每個整數(shù)核心同時執(zhí)行128位命令。這種硬件設(shè)計對BIOS、軟件編程來說也并不復(fù)雜,可以隨著每個處理器時鐘周期兒變化,以滿足特定時刻的需求。以下是每個周期內(nèi)的四種可能場景:1、 核心1:兩個128位AVX或者未編譯SSE命令;核心2:無浮點命令2、 核心1:無浮點命令;核心2:兩個128位AVX或者未編譯SSE命令3、 核心1:128位浮點命令;核心2:128位浮點命令4、 核心1:無浮點命令;核心2:無浮點命令可以看出,浮點單元的彈性設(shè)計使得整個系統(tǒng)都更加靈活,也優(yōu)化了每個周期內(nèi)每個核心的性能。對于應(yīng)用程序來說,256位AVX指令集需要它們重新編譯才能充分利用,這顯然需要時間和反復(fù)測試,因此AVX的普及也不會是一朝一夕的事情,而靈活的FlexFP浮點單元設(shè)計有望加速這一進程。TurboCore新技術(shù)同時AMD“推土機”中引入了一個全新的性能加速技術(shù),叫做TurboCore,TurboCore技術(shù)主要是指對于一些沒有完全消耗到最大程度的工作負載,去加快時鐘速度。在多種不同工作負載上,使用了TurboCore可以最大增加500兆赫茲的性能。最重要的一點,TurboCore加速指的是所有核的加速,不同以往的核加速技術(shù)可能需要關(guān)閉一些核,只對部分核進行加速。dependingonCPUM^delGamtnggedter"ful 甘ad她twn蚌dependingonCPUM^delGamtnggedter"ful 甘ad她twn蚌AutomaticallyswitchtothreeturbochargedCOREsAMDTurboCOREtechnologyIgnttMPerformanceanDemandCreate,editrrenderandtransferHDvideowithoutskippingabeat1AMDTurboCOREtechnologyDigitalAudio,Internetwhenyouneedrawspeed1采用TurboCore技術(shù)采用TurboCore技術(shù),最多可以使所有核增速500兆赫茲,如果再關(guān)閉一些核運轉(zhuǎn)的情況下,加速將會超過500兆赫茲。同時AMD對內(nèi)存控制器進行了進一步優(yōu)化,從而提高內(nèi)存的吞吐量。通過該技術(shù)關(guān)鍵是只在有工作負載要求時才加速,這也就意味著整個處理器達到高利用率時,這個技術(shù)才會啟動從而導(dǎo)致能耗提高,一般情況下用戶不會看到能耗提高。此外,所有Bulldozer架構(gòu)處理器產(chǎn)品都會有TurboCore技術(shù),而不是僅限
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度國防軍事訓(xùn)練合作合同范本
- 玉溪2025年云南玉溪市第二幼兒園龍湖園區(qū)招聘編制外人員筆試歷年參考題庫附帶答案詳解
- 漯河2024年河南漯河市沙澧河建設(shè)運行保障中心人才引進5人筆試歷年參考題庫附帶答案詳解
- 湖南2025年湖南農(nóng)業(yè)大學(xué)招聘58人筆試歷年參考題庫附帶答案詳解
- 河南2025年河南省醫(yī)學(xué)科學(xué)院電生理研究所招聘20人筆試歷年參考題庫附帶答案詳解
- 池州2024年安徽池州學(xué)院招聘事業(yè)編制黨政管理崗筆試歷年參考題庫附帶答案詳解
- 杭州浙江杭州市臨平區(qū)沾橋中學(xué)招聘2024學(xué)年第二學(xué)期臨時聘用教師筆試歷年參考題庫附帶答案詳解
- 2025年中國塑料鏈條市場調(diào)查研究報告
- 2025年金融查詢機外殼項目可行性研究報告
- 2025至2031年中國非離子表面活性劑行業(yè)投資前景及策略咨詢研究報告
- 合同工期延期補充協(xié)議書
- 新《卷煙營銷》理論知識考試題庫(附答案)
- 2024年廣西電力行業(yè)職工職業(yè)技能大賽電氣值班員(光伏發(fā)電運維)理論試題庫(含答案)
- 燃氣管網(wǎng)改造項目資金申請報告-超長期特別國債投資專項
- 肉類食品配送服務(wù)投標(biāo)方案(技術(shù)方案)
- DL∕ T 969-2005 變電站運行導(dǎo)則
- 應(yīng)急小組成立通知
- 關(guān)于如何做好清單招標(biāo)控制價的幾點建議
- 地鐵前期工程交通疏解施工方案
- NB-T32019-2013太陽能游泳池加熱系統(tǒng)技術(shù)規(guī)范
- 小學(xué)升初中六年級數(shù)學(xué)考試試卷含答案(達標(biāo)題)
評論
0/150
提交評論