




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
通明湖人工智能開發(fā)與應用大會多模態(tài)大模型加速算法與ZOMI醬華為昇騰生態(tài)-技術首席多模態(tài)大模型趨勢與挑戰(zhàn)多模態(tài)大模型趨勢與挑戰(zhàn)1.2多模態(tài)算法結(jié)構(gòu)業(yè)界主要的視頻生成模型:視頻生成大模型催生新應用及新需求:勢以MovieGen30B的模型為例,數(shù)據(jù)量:100M視頻文本對和1B級圖片以MovieGen30B的模型為例,數(shù)據(jù)量:100M視頻文本對和1B級圖片文本對,集群規(guī)模:6144H100技術趨于成熟模態(tài)理解模型技術趨于成熟多模態(tài)生成理解原生訓練統(tǒng)一模型例如:EMU3、Janus技術尚不成熟解原生訓練統(tǒng)一模型例如:例如:JanusFlow、Transfusion技術尚不成熟覆蓋圖文音視頻的全模態(tài)模型技術尚不成熟已支持的技術??1F1B?分布式優(yōu)化器(ZeRO-1)?ZeRO-2/ZeRO-3在研技術2.1MindSpeed-MM架構(gòu)設計2.2MindSpeed-MM模型開發(fā)2.3MindSpeed-MM加速方法典型典型LLM模型通信優(yōu)化昇騰系列硬件昇騰系列硬件軟件架構(gòu)統(tǒng)一的多模態(tài)大模型套件體架構(gòu)強耦合,可快速支持圖像生成能力。預置模型預置模型原生適配功能任務預訓練預訓練全參微調(diào)低參微調(diào)在線推理評估AEModel公共模塊公共模塊數(shù)據(jù)工程通信優(yōu)化通信優(yōu)化實例化模型InternVL2MindSpeed-MM/modelsmodel.json實例化模型InternVL2VisionModelVisionModelMLPMLP實例化選擇/開發(fā)原子模型開發(fā)配置實例化選擇/開發(fā)原子模型開發(fā)配置ProjectorInternLMGPTModelInternLMGPTModel組合并實例化模組合并實例化模型選擇原子模型設計模型結(jié)構(gòu)編寫模型配置OpenSoraPlanMindSpeed-MM/models選擇/開發(fā)開發(fā)配置text_encod選擇/開發(fā)開發(fā)配置text_encod原子模型VideoDiTpredictorVideoDiTpredictorDDPMdiffusionDDPMdiffusionmodel.json實例化模型實例化實例化組合并實例化模組合并實例化模型選擇原子模型設計模型結(jié)構(gòu)編寫模型配置PP:切分模型權重,降低內(nèi)存異構(gòu)PP:靈活切分模型,提高負載均衡跨節(jié)點RingP2PZeRO1:節(jié)點間通信ZeRO3:節(jié)點內(nèi)通信TP通信:2次all-reduce,前向?qū)斎隺ll-reduce,反向?qū)μ荻萢llTP-SP:對Sequence進行切分,作用于layernorm和dropout,將計算和激活切分到多個deviceTP-SP通信:2次all-gather,2次reduce-scatterDiTs(PTD并行)模型,采用與LLM相同的并行策略,流水線并行空泡大。DP采用相同的BatchSize,計算負載差距大,由于動LLMEncoderLLMEncoder預處理計算單元1計算單元2計算單元3?獨立并行:針對不同結(jié)構(gòu)的模型,獨立設置多維并行利用數(shù)據(jù)、模型參數(shù)等特性,設置最優(yōu)性能的資源?分離部署:根據(jù)最優(yōu)性能配置,將異構(gòu)模型Encoder、1111 0113.1TOP客戶商業(yè)案例3.2原生支持案例1:北大OpenSoraPlan3.2原生支持案例2:360qihooT2X客戶類型一(深度使用&聯(lián)創(chuàng))客戶類型二(開箱即用&POC&特性參考)展參數(shù)到15B~30B,需支持720P200幀及1080P200幀,基于MindSpeed-MM合?D/E客戶:某互聯(lián)網(wǎng)大廠使用FLUX進行百?D客戶:某大模型廠商POC任務,使3.3昇騰
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 機器學習原理與應用電子教案 5.5決策樹
- 2025年湖北輕工職業(yè)技術學院單招職業(yè)傾向性測試題庫1套
- 第六單元 教學設計-2024-2025學年統(tǒng)編版語文三年級上冊
- 機器學習原理與應用課件 第11章 人工神經(jīng)網(wǎng)絡
- 2025至2030年中國新型電火花加工液數(shù)據(jù)監(jiān)測研究報告
- 商業(yè)用房租房合同模板(9篇)
- 2025年廣州民航職業(yè)技術學院單招職業(yè)傾向性測試題庫參考答案
- 二零二五年度三人共同投資開設智能機器人制造工廠協(xié)議
- 二零二五年度特色小吃檔口租賃經(jīng)營協(xié)議
- 二零二五年度商場租賃權轉(zhuǎn)讓及管理服務協(xié)議
- 2025年供應鏈管理公司合作項目協(xié)議書
- 2025年度度假村景觀設計及施工一體化合同
- 2025年山東化工職業(yè)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 《如何規(guī)劃養(yǎng)禽場》課件
- 2024-2025學年云南省昆明市盤龍區(qū)三年級(上)期末數(shù)學試卷(含答案)
- 物業(yè)公司行政人事部職責
- (正式版)HG∕T 21633-2024 玻璃鋼管和管件選用規(guī)定
- 張祖慶祖父的園子教學課件
- 人教版《道德與法治》二年級下冊全冊優(yōu)秀課件
- ARM學習資料.Cortex-M3處理器體系結(jié)構(gòu)
- 色彩的形式美感
評論
0/150
提交評論