VASPGPU平臺速度測試PPT課件_第1頁
VASPGPU平臺速度測試PPT課件_第2頁
VASPGPU平臺速度測試PPT課件_第3頁
VASPGPU平臺速度測試PPT課件_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、張文帥USTC SCC縱軸中,括號外為硬件資源,56NP表示使用56進(jìn)程(核心),括號內(nèi)為軟件配置,NSIM32表示NSIM參數(shù)設(shè)置為32結(jié)果解析:相同顏色條(代表使用相同的硬件資源)下,不同的軟件配置參數(shù),顯著影響計算速度。因為本算例具有多K點,在多卡間K點并行效率較高,所以PCI-E版本的4卡A100計算速度,與NVLink版本的4卡A100的計算速度接近。默認(rèn)設(shè)置下:單卡A100所需計算時間(72s)是56個E5-2680計算核心計算時間(132s)的54%,加速1.83倍。在優(yōu)化的GPU/CPU配置下:單卡A100所需計算時間(72s)是56個E5-2680計算核心計算時間(88s)的

2、82%,加速1.22倍體系 Ni 27 C H 4: NIONS=32 NBANDS=224 ENCUT=380eV LHFCALC=.TRUE. IALGO=48 NKPT=5。A100平臺下的測試均使用OpenACC版本,其他GPU計算使用CUDA版本。1328816213219115012210797988787193157139135727340247239231505010015020025056NP, E5-2680 (default )56NP, E5-2680 (NCORE7)40NP, E5-2698 (NCORE1 )40NP, E5-2698 (NCORE10)1V100

3、, DGX1 (default)1V100, DGX1 (SM70,NSIM4 )2V100, DGX1 (SM70,NSIM4 )2V100, DGX1 (SM70,NSIM8 )2V100, DGX1 (SM70,NSIM32)4V100, DGX1 (SM70,NSIM8 )4V100, DGX1 (SM70,NSIM16)4V100, DGX1 (SM70,NSIM32)8V100, DGX1 (SM70,NSIM4 )8V100, DGX1 (SM70,NSIM8 )8V100, DGX1 (SM70,NSIM16)8V100, DGX1 (SM70,NSIM32)1A100, PC

4、IE (default)1A100, PCIE (NSIM32)2A100, PCIE (NSIM32)4A100, PCIE (NSIM32)1A100, NVLink (NSIM32)2A100, NVLink (NSIM32)4A100, NVLink (NSIM32)8A100, NVLink (NSIM32)三個電子步總計算時間(相同硬件資源以相同的顏色標(biāo)識)縱軸中,括號外為硬件資源,40NP表示使用40進(jìn)程(核心),括號內(nèi)為軟件配置,NSIM32表示NSIM參數(shù)設(shè)置為32結(jié)果解析:相同顏色條(代表使用相同的硬件資源)下,不同的軟件配置參數(shù),同樣顯著影響計算速度。4卡到8卡的并行效率

5、較好(79%)因為本算例K點較少,所以PCI-E版本的4卡A100計算時間(83s),與NVLink版本的4卡A100的計算時間(71)有可見差異。該算例下,CPU計算時運行參數(shù)優(yōu)化效果較差,1個A100 GPU,相比40個 E5-2698 CPU 核心,具有10.5倍加速。體系 C 108 N 3 Co:NIONS=112 NBANDS=384eV NELECT=456 ENCUT=400 LHFCALC=.TRUE. IALGO=38 NKPT=2。A100平臺下的測試均使用OpenACC版本,其他GPU計算使用CUDA版本。31903249281326692598369019181085

6、85784211918026534784584032812491408324613371450500100015002000250030003500400040NP, E5-2698 (NCORE1 )40NP, E5-2698 (NCORE5 )40NP, E5-2698 (NCORE10)40NP, E5-269840NP, E5-26981K80 (NSIM4 )2K80 (NSIM4 )4K80 (NSIM4 )4K80 (NSIM32)4K80 (NSIM64)1V100, DGX1 (NSIM4 )1V100, DGX1 (NSIM64)2V100, DGX1 (NSIM4 )2V

7、100, DGX1 (NSIM32)2V100, DGX1 (NSIM64)4V100, DGX1 (NSIM4 )4V100, DGX1 (NSIM16)1A100, PCIE (NSIM32)2A100, PCIE (NSIM8 )4A100, PCIE (NSIM32)1A100, NVLink (NSIM32)2A100, NVLink (NSIM32)4A100, NVLink (NSIM32)8A100, NVLink (NSIM32)三個電子步總計算時間(相同硬件資源以相同的顏色標(biāo)識)縱軸中,括號外為硬件資源,384NP表示使用384進(jìn)程(核心),括號內(nèi)為軟件配置,NSIM32表

8、示NSIM參數(shù)設(shè)置為32結(jié)果解析:不同的軟件配置參數(shù),同樣顯著影響計算速度。因為本算例只有一個K點,多卡間通訊較多,所以在NVLink版本的4卡A100下的計算(36s),相比PCI-E版本4卡A100下計算(63s),具有1.75倍加速,NVLink效果明顯。該算例下,CPU計算時運行參數(shù)優(yōu)化效果較好(353s - 183s),且從192擴(kuò)展為398核心時具有并行效率73%。即便如此,1個A100 GPU下的計算時間為64s,384個 E5V4 CPU 核心下的計算時間為183s,前者的速度是后者的2.86倍。體系 Zr 216 N 216 Cl 198:NIONS=630 NBANDS=3

9、045 NELECT=5058 ENCUT=400eV LHFCALC=.FALSE. IALGO = 38 NKPT=1。在A100與V100平臺的測試均使用OpenACC版本37926835318318512111815812489104105651148466330716310064100577936603531050100150200250300350400192NP, E5V4 (default)192NP, E5V4 (NCORE8)384NP, E5V4 (default)384NP, E5V4 (NCORE8)1V100, PCIE (NCORE1,NSIM64)1V100,

10、PCIE (NCORE1,NSIM32)1V100, PCIE (NCORE1,NSIM4 )2V100, PCIE (NCORE2,NSIM4 )2V100, PCIE (NCORE1,NSIM4 )2V100, PCIE (NCORE1,NSIM32)1A100, PCIE (NCORE1,NSIM4 )1A100, PCIE (NCORE4,NSIM4 )1A100, PCIE (NCORE1,NSIM32)2A100, PCIE (NCORE2,NSIM4 )2A100, PCIE (NCORE1,NSIM4 )2A100, PCIE (NCORE1,NSIM32)4A100, PCIE (NCORE4,NSIM4 )4A100, PCIE (NCORE1,NSIM4 )4A100, PCIE (NCORE1,NSIM32)1A100, NVLink (NCORE1,NSIM4 )1A100, NVLink (NCORE1,NSIM32)2A100, NVLink (NCORE2,NSIM4 )2A100, NVLink (NCORE1,NSIM32)4A10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論