Intel Xeon phi計算卡片的解析_第1頁
Intel Xeon phi計算卡片的解析_第2頁
Intel Xeon phi計算卡片的解析_第3頁
Intel Xeon phi計算卡片的解析_第4頁
Intel Xeon phi計算卡片的解析_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

IntelXeonphi協(xié)處理器實際上它更像是與CPU協(xié)同工作的GPU。XeonPhi協(xié)處理器在很大程度上繼承了流產(chǎn)的獨立顯卡項目Larrabee的遺志,外部造型看似顯卡,其實是和Tesla類似的專用加速計算卡,其架構(gòu)采用順序、雙發(fā)射x86,支持64位運算,每個核心支持最多四個線程,最多61個核心、244個線程,并且每個核心都搭配一個512-bitSIMD矢量引擎。當(dāng)然了,這里的"核心”跟Tesla里邊的CUDA核心是沒有直接可比性的,它們分別來自CPU、GPU的世界。雖然在性能預(yù)估上與NVIDIA的TeslaK20核心相比沒有占到上風(fēng),但是XeonPhi在編程易用性上有優(yōu)勢,除非開發(fā)者需要使用新功能,否則多數(shù)代碼都不需要重寫。英特爾推出這款處理器就是為了達到和英偉達和AMD處理器一樣的效果,提高軟件的并行加速計算能力。英特爾公布了兩個XeonPhi系列,其中一個系列是XeonPhi5110P,現(xiàn)在已經(jīng)上市,而另外一個系列XeonPhi3100需要到2013年第一季度上市。這兩個系列處理器都是采用22nm的COMS制程工藝,擁有50億個晶體管,采用的是英特爾Many-IntegratedCore(MIC)眾核架構(gòu)。XeonPhi5110P擁有60個核心,每一個核心都有著4個線程,1.05GHz,2級緩存為30MB,最大支持8GB的GDDR5內(nèi)存尋址,內(nèi)存帶寬高達32OGbps,雙精度浮點計算能力能夠達到1TFLOPS,在此次超級計算機TOP500中,戴爾的Stampede采用的是一個客戶定制版本SE10,擁有著61個核心,2級緩存也比30M要大一點。對于2013年將要發(fā)布的XeonPhi3100,XeonPhi3100擁有57個核心,頻率1.1GHz,位寬384bit,搭配6GBGDDR5顯存,支持ECC,帶寬超過240GB/S,可提供1TFLOPS雙精度浮點性能,TDP為300W。在并行加速計算領(lǐng)域,似乎將要演變成為x86協(xié)同處理器與GPU加速器之間的競爭,英特爾區(qū)分這兩者之間的區(qū)別是theXeonPhi能夠運行操作系統(tǒng),而GPU加速器則不能,XeonPhi能夠運行紅帽Linux或者是SuSELinux。不過更為重要的是這些并行加速處理器是怎樣提高超級計算機的計算性能,在這些方面軟件等方面起到的作用要比操作系統(tǒng)更重要。例:田納西州大學(xué)的田納西高級計算中心(TACC)正在他們的新超級計算機“Stampede”(驚跑)里安裝XeonPhi,也讓我們得以一睹其真容:不明說的話肯定會以為這是塊標(biāo)準(zhǔn)的顯卡吧?Tesla其實也是這個樣子,標(biāo)準(zhǔn)的雙插槽體積PCI-Exl6擴展卡,而且是因為專用于計算的,都沒有視頻輸出接口(AMD的還有)。XeonPhi也有主動散熱、被動散熱兩種版本,這里用的是被動散熱的,外殼下邊是厚

重的均熱板和散熱片,尾部則能看到一個六針和一個八針輔助供電接口,最大供電能力300W。至于實際性能如何,很可能現(xiàn)在哪兒都不具備測試條件,畢竟這玩意兒因為架構(gòu)的緣故要求操作系統(tǒng)、工具軟件都得在一定程度上重新編寫和優(yōu)化,Intel也一再強調(diào)優(yōu)化的重要性。Intel也沒有一味夸大加速計算的優(yōu)勢,而是首先澄清了一個誤解。Intel拿出了一段Fortran代碼,先運行未優(yōu)化的單線程代碼,然后優(yōu)化并以XeonPhi運行,性能差異達到了恐怖的300倍。NVIDIATesla宣稱的性能提升差不多就是這樣對比而來的,讓加速計算的結(jié)果和單線程結(jié)果對比,幾十乃至幾百倍的提升就輕松得來。Intel則證明了其謬誤:在雙路XeonE5上重新運行相同的代碼,XeonPhi只快了大

約兩倍而已。也就是說,如果代碼本身就針對多核心處理器做過優(yōu)化,加速計算的真實優(yōu)勢會小得多。CompiiewithGEZCC++,measurewalltime[Generatessnngrethreadedcode)在另一個C++的例子中,109倍的提升被證明其實只有2-2.5倍。AnatomyofaCompiiewithGEZCC++,measurewalltime[Generatessnngrethreadedcode)在另一個C++的例子中,109倍的提升被證明其實只有2-2.5倍。Anatomyofa109xImprovement~693secsThe>1OxperformancegaincomesfromparalletismRunsamecodeonInterXewi'ProcessorT耳「q已tingCPU,nocoprocessorOptimizeforIntel*XeonPh廠usingParallelStudioXEjbo^lsjNohandcodedassenib^*495^ExampleofapublicfinanetaidsrivaliumapplicatianccmbinincibinomialtreesndMonteCarlo,writteninC++隨后,Intel展示了XeonPhi協(xié)處理加速計算所帶來的真正性能提升,通過IntelMKL理論測試得到的幅度為最多2.2-2.9倍,實際應(yīng)用中則普遍只有最多1.7-2.53倍,只有金融服務(wù)方面取得了10倍左右的突飛猛進(布萊克斯克爾斯期權(quán)定價模型和蒙特卡羅算法)。SGEMMfUF")upto2,5X9.M4DGEMHWF/?)gto2.5io~STREAMTriadXeonPhi?CoprtK?$w:Increa-sesApplicationPerformanceuptolOxApplicationPerformanceExamplesCw^tornvrAppH-at-jpn-Pl<f>[>rVMn?flIlKiTMM'1W,J筆斗*ft■LcrsAlamMNalMularDyrajiflllCIUp申弧昨Wv啊審避0T*ftfer*i>9E^p<YdinibhtrrlwrtfLab*LAHiCtQCD叩ta2.Z7xFlgnctyServicesBlKkScholHSPW&nteCwto51*vptalC,75xno2a.^ix5IK41M4[耐0斤0Upth2.52j(J5oncl?mtaMMFE葉mE>RwiiMWJOtDJ.Tx1bvt*)Rji^TriKlnDfivcFwrm■4Pt|'UptDi.Wjt'B工w■3種耳丘R比聲雪粧仲j■tt*nEl■&nMlSBKwnMVI^血rg^jiKM8LJ¥XW味feKHalHh"爐阿囲詞屮審爐1打斡"“和?暉屮 UrimiPimiiw3-BL1VM1wt 4JKW.M"34rHd?ck^tov,nti *k^JBKima"{[[xncmMmicLutH[■PriBriWT*a<rimflwrihckd1juw-RiTgprnorifJQbMrtb|■W WWIntelXeonPhi"CoprocessorFamilyReferenceTablerHiiteuktaNmUCWf*nr|-faSMPlACIMm■wwLt.yIMtA如"WtSJf-4111KJ■?>K4f

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論