什么是GPU多實(shí)例(MIG)

上傳人：賈*** IP屬地：重慶上傳時間：2022-09-01 格式：DOCX 頁數(shù)：5 大?。?6.74KB 積分：25 舉報 版權(quán)申訴

免費(fèi)預(yù)覽已結(jié)束，剩余1頁可下載查看

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、什么是GPU多實(shí)例(MIG) ？導(dǎo)讀：AMD收購Xilinx(點(diǎn)擊閱讀)，Intel、AMD和Nvidia三家脫穎而出，F(xiàn)PGA芯片行業(yè)完成新一輪清洗，Nvidia在協(xié)處理器芯片行業(yè)內(nèi)功深厚，三足鼎立之勢已經(jīng)形成。隨著 GPU 的應(yīng)用越來越廣泛，應(yīng)用場景愈發(fā)多元，對 GPU 的利用率的要求也不斷提升，傳統(tǒng)虛擬化方法之下，GPU 計算資源的浪費(fèi)對計算效率造成的的影響日漸凸顯，提升算力以外，破解資源浪費(fèi)難題也已迫在眉睫。多實(shí)例GPU（MIG）就這樣應(yīng)運(yùn)而生.單個 GPU 內(nèi)含七個加速器多實(shí)例 GPU (MIG) 可提升每個 NVIDIA A100 Tensor 核心 GPU 的性能和價值。MI

2、G 可將 A100 GPU 劃分為多達(dá)七個實(shí)例，每個實(shí)例均與各自的高帶寬顯存、緩存和計算核心完全隔離。現(xiàn)在，管理員可以支持從大到小的各項(xiàng)工作負(fù)載，為每項(xiàng)工作提供規(guī)模適當(dāng)?shù)?GPU，而且服務(wù)質(zhì)量 (QoS) 穩(wěn)定可靠，從而優(yōu)化利用率，讓每位用戶都能享用加速計算資源。優(yōu)勢概覽更多用戶享受到 GPU 加速能力借助 MIG，您可以在單個 A100 GPU 上獲得多達(dá)原來 7 倍的 GPU 資源。MIG 為研發(fā)人員提供了更多的資源和更高的靈活性。優(yōu)化 GPU 利用率MIG 允許您靈活選擇許多不同的實(shí)例大小，從而為每項(xiàng)工作負(fù)載提供適當(dāng)規(guī)模的 GPU 實(shí)例，最終優(yōu)化利用率并使數(shù)據(jù)中心投資充分發(fā)揮成效。同時運(yùn)

3、行混合工作負(fù)載憑借 MIG，能以確定性延遲和吞吐量，在單個 GPU 上同時運(yùn)行推理、訓(xùn)練和高性能計算 (HPC) 工作負(fù)載。技術(shù)工作原理若不使用 MIG，則同一 GPU 上運(yùn)行的不同工作（例如不同的 AI 推理請求）會爭用相同的資源（例如顯存帶寬）。顯存帶寬更大的工作會占用其他工作的資源，導(dǎo)致多項(xiàng)工作無法達(dá)成延遲目標(biāo)。借助 MIG，工作可同時在不同的實(shí)例上運(yùn)行，每個實(shí)例都有專用的計算、顯存和顯存帶寬資源，從而實(shí)現(xiàn)可預(yù)測的性能，同時符合服務(wù)質(zhì)量并盡可能提升 GPU 利用率。利用多實(shí)例 GPU 大幅提升性能和利用率，觀看視頻：實(shí)現(xiàn)超高的數(shù)據(jù)中心靈活性一個 NVIDIA A100 GPU 可劃分成不

4、同大小的 MIG 實(shí)例。例如，管理員可以創(chuàng)建兩個各有 20 千兆字節(jié) (GB) 內(nèi)存的實(shí)例、三個各有 10 GB 內(nèi)存的實(shí)例、七個各有 5 GB 內(nèi)存的實(shí)例或者它們的組合。因此，系統(tǒng)管理員可以根據(jù)不同類型的工作負(fù)載為用戶提供適當(dāng)規(guī)模的 GPU 資源。管理員還可以動態(tài)地重新配置 MIG 實(shí)例，從而能根據(jù)不斷變化的用戶和業(yè)務(wù)需求調(diào)整 GPU 資源。例如，白天可以使用七個 MIG 實(shí)例進(jìn)行低吞吐量推理，而夜間可以重新配置為一個大型 MIG 實(shí)例，以進(jìn)行深度學(xué)習(xí)訓(xùn)練。提供出色的服務(wù)質(zhì)量每個 MIG 實(shí)例都有一套專用于計算、內(nèi)存和緩存的硬件資源，從而能為工作負(fù)載提供穩(wěn)定可靠的服務(wù)質(zhì)量 (QoS) 和有效

5、的故障隔離。這樣一來，如果某個實(shí)例上運(yùn)行的應(yīng)用程序發(fā)生故障，并不會影響其他實(shí)例上運(yùn)行的應(yīng)用程序。而且，不同的實(shí)例可以運(yùn)行不同類型的工作負(fù)載，包括交互式模型開發(fā)、深度學(xué)習(xí)訓(xùn)練、AI 推理或高性能計算應(yīng)用程序等。由于這些實(shí)例并行運(yùn)行，因此工作負(fù)載也在同一個物理 A100 GPU 上同時運(yùn)行，但它們彼此相互獨(dú)立、隔離。MIG 非常適合 AI 模型開發(fā)和低延遲推理等工作負(fù)載。這些工作負(fù)載可以充分利用 A100 的功能，并且很適合在每個實(shí)例的已分配內(nèi)存中運(yùn)行。為 IT 和開發(fā)運(yùn)營打造每個 MIG 實(shí)例對于應(yīng)用程序都像獨(dú)立 GPU 一樣運(yùn)行，因此 CUDA 編程模式?jīng)]有變化。容器（例如來自 NGC 的容器）中的 AI 模型和高性能計算應(yīng)用程序可以通過 NVIDIA Container Runtime 直接在 MIG 實(shí)例上運(yùn)行。MIG 實(shí)例作為附加的 GPU 資源出現(xiàn)在 Kubernetes 等容器編排工具中，這些工具可以安排容器化工作負(fù)載在特定 GPU 實(shí)例內(nèi)運(yùn)行。這項(xiàng)功能很快便可通過適用于 Kubernetes 的 NVIDIA 設(shè)備插件提供組織可以通過 NVIDIA Virtual Compute Server (vCS) 在 MIG GPU 實(shí)

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > IT計算機(jī)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

什么是GPU多實(shí)例(MIG)

文檔簡介

溫馨提示

最新文檔

評論

什么是GPU多實(shí)例(MIG)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔