下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、張文帥USTC SCC縱軸中,括號外為硬件資源,56NP表示使用56進(jìn)程(核心),括號內(nèi)為軟件配置,NSIM32表示NSIM參數(shù)設(shè)置為32結(jié)果解析:相同顏色條(代表使用相同的硬件資源)下,不同的軟件配置參數(shù),顯著影響計算速度。因為本算例具有多K點,在多卡間K點并行效率較高,所以PCI-E版本的4卡A100計算速度,與NVLink版本的4卡A100的計算速度接近。默認(rèn)設(shè)置下:單卡A100所需計算時間(72s)是56個E5-2680計算核心計算時間(132s)的54%,加速1.83倍。在優(yōu)化的GPU/CPU配置下:單卡A100所需計算時間(72s)是56個E5-2680計算核心計算時間(88s)的
2、82%,加速1.22倍體系 Ni 27 C H 4: NIONS=32 NBANDS=224 ENCUT=380eV LHFCALC=.TRUE. IALGO=48 NKPT=5。A100平臺下的測試均使用OpenACC版本,其他GPU計算使用CUDA版本。1328816213219115012210797988787193157139135727340247239231505010015020025056NP, E5-2680 (default )56NP, E5-2680 (NCORE7)40NP, E5-2698 (NCORE1 )40NP, E5-2698 (NCORE10)1V100
3、, DGX1 (default)1V100, DGX1 (SM70,NSIM4 )2V100, DGX1 (SM70,NSIM4 )2V100, DGX1 (SM70,NSIM8 )2V100, DGX1 (SM70,NSIM32)4V100, DGX1 (SM70,NSIM8 )4V100, DGX1 (SM70,NSIM16)4V100, DGX1 (SM70,NSIM32)8V100, DGX1 (SM70,NSIM4 )8V100, DGX1 (SM70,NSIM8 )8V100, DGX1 (SM70,NSIM16)8V100, DGX1 (SM70,NSIM32)1A100, PC
4、IE (default)1A100, PCIE (NSIM32)2A100, PCIE (NSIM32)4A100, PCIE (NSIM32)1A100, NVLink (NSIM32)2A100, NVLink (NSIM32)4A100, NVLink (NSIM32)8A100, NVLink (NSIM32)三個電子步總計算時間(相同硬件資源以相同的顏色標(biāo)識)縱軸中,括號外為硬件資源,40NP表示使用40進(jìn)程(核心),括號內(nèi)為軟件配置,NSIM32表示NSIM參數(shù)設(shè)置為32結(jié)果解析:相同顏色條(代表使用相同的硬件資源)下,不同的軟件配置參數(shù),同樣顯著影響計算速度。4卡到8卡的并行效率
5、較好(79%)因為本算例K點較少,所以PCI-E版本的4卡A100計算時間(83s),與NVLink版本的4卡A100的計算時間(71)有可見差異。該算例下,CPU計算時運行參數(shù)優(yōu)化效果較差,1個A100 GPU,相比40個 E5-2698 CPU 核心,具有10.5倍加速。體系 C 108 N 3 Co:NIONS=112 NBANDS=384eV NELECT=456 ENCUT=400 LHFCALC=.TRUE. IALGO=38 NKPT=2。A100平臺下的測試均使用OpenACC版本,其他GPU計算使用CUDA版本。31903249281326692598369019181085
6、85784211918026534784584032812491408324613371450500100015002000250030003500400040NP, E5-2698 (NCORE1 )40NP, E5-2698 (NCORE5 )40NP, E5-2698 (NCORE10)40NP, E5-269840NP, E5-26981K80 (NSIM4 )2K80 (NSIM4 )4K80 (NSIM4 )4K80 (NSIM32)4K80 (NSIM64)1V100, DGX1 (NSIM4 )1V100, DGX1 (NSIM64)2V100, DGX1 (NSIM4 )2V
7、100, DGX1 (NSIM32)2V100, DGX1 (NSIM64)4V100, DGX1 (NSIM4 )4V100, DGX1 (NSIM16)1A100, PCIE (NSIM32)2A100, PCIE (NSIM8 )4A100, PCIE (NSIM32)1A100, NVLink (NSIM32)2A100, NVLink (NSIM32)4A100, NVLink (NSIM32)8A100, NVLink (NSIM32)三個電子步總計算時間(相同硬件資源以相同的顏色標(biāo)識)縱軸中,括號外為硬件資源,384NP表示使用384進(jìn)程(核心),括號內(nèi)為軟件配置,NSIM32表
8、示NSIM參數(shù)設(shè)置為32結(jié)果解析:不同的軟件配置參數(shù),同樣顯著影響計算速度。因為本算例只有一個K點,多卡間通訊較多,所以在NVLink版本的4卡A100下的計算(36s),相比PCI-E版本4卡A100下計算(63s),具有1.75倍加速,NVLink效果明顯。該算例下,CPU計算時運行參數(shù)優(yōu)化效果較好(353s - 183s),且從192擴(kuò)展為398核心時具有并行效率73%。即便如此,1個A100 GPU下的計算時間為64s,384個 E5V4 CPU 核心下的計算時間為183s,前者的速度是后者的2.86倍。體系 Zr 216 N 216 Cl 198:NIONS=630 NBANDS=3
9、045 NELECT=5058 ENCUT=400eV LHFCALC=.FALSE. IALGO = 38 NKPT=1。在A100與V100平臺的測試均使用OpenACC版本37926835318318512111815812489104105651148466330716310064100577936603531050100150200250300350400192NP, E5V4 (default)192NP, E5V4 (NCORE8)384NP, E5V4 (default)384NP, E5V4 (NCORE8)1V100, PCIE (NCORE1,NSIM64)1V100,
10、PCIE (NCORE1,NSIM32)1V100, PCIE (NCORE1,NSIM4 )2V100, PCIE (NCORE2,NSIM4 )2V100, PCIE (NCORE1,NSIM4 )2V100, PCIE (NCORE1,NSIM32)1A100, PCIE (NCORE1,NSIM4 )1A100, PCIE (NCORE4,NSIM4 )1A100, PCIE (NCORE1,NSIM32)2A100, PCIE (NCORE2,NSIM4 )2A100, PCIE (NCORE1,NSIM4 )2A100, PCIE (NCORE1,NSIM32)4A100, PCIE (NCORE4,NSIM4 )4A100, PCIE (NCORE1,NSIM4 )4A100, PCIE (NCORE1,NSIM32)1A100, NVLink (NCORE1,NSIM4 )1A100, NVLink (NCORE1,NSIM32)2A100, NVLink (NCORE2,NSIM4 )2A100, NVLink (NCORE1,NSIM32)4A10
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河北省保定市長城高級中學(xué)2025屆生物高二上期末考試模擬試題含解析
- 2025屆江蘇省南通市通州區(qū)高一數(shù)學(xué)第一學(xué)期期末聯(lián)考模擬試題含解析
- 云南省大理州2025屆高三生物第一學(xué)期期末檢測模擬試題含解析
- 2025屆廣西壯族自治區(qū)百色市田陽縣田陽高中高三英語第一學(xué)期期末復(fù)習(xí)檢測試題含解析
- 2025屆上海市嘉定區(qū)封浜高級中學(xué)高二數(shù)學(xué)第一學(xué)期期末聯(lián)考模擬試題含解析
- 2025屆湖南省重點中學(xué)數(shù)學(xué)高一上期末調(diào)研試題含解析
- 2025屆福建省漳州第八中學(xué)高一數(shù)學(xué)第一學(xué)期期末檢測模擬試題含解析
- 上海市市轄區(qū)(2024年-2025年小學(xué)五年級語文)部編版期中考試((上下)學(xué)期)試卷及答案
- 水利工程合同(2篇)
- 開展科協(xié)活動合同(2篇)
- 玻璃幕墻工程施工圖文
- 醫(yī)院績效管理醫(yī)技輸血科室工作指標(biāo)
- 跌落試驗報告
- 廣西餐飲行業(yè)食品安全員專業(yè)知識測試 含答案
- 李氏桿菌病課件
- 20KV以下配電網(wǎng)工程預(yù)算定額說明
- 固定式鋼梯及平臺安全要求
- DB2301T 56-2019 哈爾濱既有小區(qū)供水設(shè)施改造技術(shù)導(dǎo)則
- 案例geogebra使用手冊
- 量子力學(xué)完整版課件
- 農(nóng)田水利渠道灌溉與排水課件
評論
0/150
提交評論