精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

解密萬億參數M6模型預訓練背后的分布式框架Whale

開發 開發工具 分布式
M6是國內首個實現商業化落地的多模態大模型。M6擁有超越傳統AI的認知和創造能力,擅長繪畫、寫作、問答,在電商、制造業、文學藝術等諸多領域擁有廣泛應用前景。

[[418050]]

最近,阿里云PAI團隊和達摩院智能計算實驗室一起發布“低碳版”巨模型M6,大幅降低萬億參數超大模型訓練能耗。借助我們自研的Whale框架僅使用480卡GPU,即訓練出了規模達人類神經元10倍的萬億參數多模態大模型M6,與傳統海外公司實現萬億參數規模相比,能耗降低超八成、效率提升近11倍。

M6是國內首個實現商業化落地的多模態大模型。M6擁有超越傳統AI的認知和創造能力,擅長繪畫、寫作、問答,在電商、制造業、文學藝術等諸多領域擁有廣泛應用前景。

這里來為大家介紹支持萬億參數模型訓練的Whale框架設計。

一、模型發展趨勢和挑戰

1.模型發展趨勢

隨著深度學習的火爆,模型的參數規模也增長迅速,OpenAI數據顯示:

  • 2012年以前,模型計算耗時每2年增長一倍,和摩爾定律保持一致;
  • 2012年后,模型計算耗時每3.4個月翻一倍,遠超硬件發展速度。

近一年模型參數規模飛速增長,谷歌、英偉達、阿里、智源研究院都發布了萬億參數模型,有大廠也發布了百億、千億參數模型。同時,隨著模型參數規模增大,模型效果也在逐步提高,Nvidia測試Bert模型不同參數規模,發現模型困惑度隨模型參數規模增加而降低。

Google在GShard paper中也發現MoETransformer 模型參數規模越大,翻譯質量越高。

2.大模型訓練的挑戰

大模型帶來模型效果提升的同時,也為訓練框架帶來更大的挑戰,例如當我們要訓練一個萬億規模的模型時會面臨如下挑戰:

  • 訓練難:
    • GPU顯存已經不夠存放模型副本,數據并行已經不能滿足需求;
    • 需要框架提供新的并行策略,協同多GPU能力來存放和訓練模型;
    • 如何給用戶提供簡潔、易用的接口,讓用戶能很容易實現分布式版模型;
    • 超大規模模型對計算效率、通信效率都帶來很大挑戰,如何提高計算和通信效率;
    • 下游任務如何對接,如何支持批量預測和在線推理需求;
  • 成本高:
    • 以萬億模型為例,模型參數有4TB大小、梯度也有4TB,加上optimizer states和active tensor,顯存需求巨大;
    • 業界訓練同等規模模型需要的資源:英偉達 3072 A100、谷歌 2048 TPU v3,成本太高很難落地;
    • 如何降本增效,使用更少的資源,更快的訓練收斂;

當前已經有一些分布式訓練框架,例如:Horovod、Tensorflow Estimator、PyTorch DDP等支持數據并行,Gpipe、PipeDream、PipeMare等支持流水并行,Mesh Tensorflow、FlexFlow、OneFlow、MindSpore等支持算子拆分,但這些框架還有一些不足:

  • 模式單一:很多框架只支持部分并行策略,不能完全支持各種混合并行;
  • 接入門檻高:用戶實現模型分布式版本難度大、成本高,需要有領域專家經驗才能實現高效的分布式并行策略;
  • 遷移代價大:不同分布式框架并行化實現割裂,不同框架有各自定義的DSL,當用戶要切換并行策略時,需要學習各種接口,重新改寫模型;
  • 性能不理想:部分框架實現未考慮集群物理環境;

為了應對當前分布式訓練的挑戰,我們研發了分布式訓練框架Whale,主要目標是:

  • 統一多種并行策略:在一個框架中支持各種并行策略以及這些策略的各種組合;
  • 簡潔易用的接口:用戶只需添加幾行annotation即可完成并行策略的配置,模型代碼不需要改動;
  • 高效的訓練框架:結合硬件資源、網絡拓撲和模型進行協同優化,打造高效分布式訓練框架;

二、PAI自研Whale框架

1.Whale架構

我們推出統一多種并行策略的高性能分布式訓練框架Whale,從如下角度來應對分布式訓練的挑戰:

  • 將不同并行化策略進行統一抽象、封裝,在一套分布式訓練框架中支持多種并行策略;
  • 基于Tensorflow設計一套分布式并行接口,完全兼容Tensorflow,用戶僅僅只需添加幾行annotation就可以實現豐富的分布式并行策略;
  • 結合模型結構和網絡拓撲進行調度和通信優化,提供高效的分布式訓練能力。

Whale框架如下圖所示,主要分4個模塊:

  • API:提供簡潔易用接口,讓用戶組合使用各種混合并行策略;
  • Whale IR:將并行策略轉成內部表達,通過TaskGraph、Multi-Dimension、VirtualDevices抽象來表達各種并行策略;
  • Whale Engine:基于WhaleIR,通過圖編輯工具來構建分布式執行圖;
  • Runtime:將分布式執行圖轉成TFGraph,再調用TF 的Runtime來執行;

2.Whale簡介易用接口

Whale提供簡潔易用的接口來描述各種并行策略,主要的原語:

  • cluster:配置Virtual Device的劃分方法
  • replica:數據并行
  • stage:劃分TaskGraph
  • pipeline:流水并行
  • split:算子拆分

用這些接口可以組合各種并行策略,例如:

  • 數據并行:

  • 流水并行:

流水并行+數據并行:

更多并行策略示例:

3.Whale訓練流程

使用Whale進行分布式訓練流程:

  • 并行策略配置:
    • 使用Whale API來為模型配置并行策略,只需添加幾行annotation,無需修改模型代碼,方法如 2.2節 所示;
    • 可以將模型劃分為多個TaskGraph,TaskGraph支持配置多個并行策略,每個TaskGraph可以配置不同的并行策略;
  • 虛擬資源劃分:
    • 按并行策略來劃分Virtual Device,每個TaskGraph對應一個Virtual Device;
    • 按GPU資源和網絡topo來為Virtual Device選擇Physical Device;
  • 分布式執行圖:
    • 基于并行策略和資源分配信息,使用圖編輯工具來編輯執行圖(圖拷貝、拆分、插入通信節點等),生成最終的分布式執行圖;
    • 調用TF的runtime來執行分布式Graph;

三、萬億M6模型預訓練

萬億模型的算力需求非常大,為了降低算力需求,Whale中實現了MoE(Mixture-of-Experts)結構,MoE的主要特點是稀疏激活,使用Gating(Router)來為輸入選擇Top k的expert進行計算(k常用取值1、2),從而大大減少算力需求。

Whale中實現了MoE(Mixture-of-Experts) layer,并支持專家并行,將experts拆分到多個Devices上,降低單個Device的顯存和算力需求。同時數據并行有利于提升訓練的并發度,因此采用數據并行+專家并行組合的混合并行策略來訓練M6模型:MoElayer采用專家并行,其他layer采用數據并行。

Whale中提供簡潔易用的接口來進行模型的混合并行訓練,只需要增加幾行annotation來配置并行策略,模型本身不需要任何修改。M6模型采用數據并行+專家并行的策略,只需要增加如下圖的annotation:

同時為了節約訓練資源,提高訓練效率,Whale中提供各種優化技術:

顯存優化:

  • Auto Gradient Checkpoint,自動選擇最優checkpoint節點,節約activation的顯存;
  • Group-wise Apply,優化Optimizer Apply階段的顯存;
  • CPU Offload技術,優化Optimizer status和Weight的顯存;
  • 通信池化,控制通信的數據塊大小和并發,節約通信的顯存;

計算、通信加速:

  • 采用DP+EP混合并行策略,降低算力需求;
  • 采用分組融合通信、半精度通信、拓撲感知的All2All通信算子等技術來提高通信效率;
  • 結合混合精度、編譯優化等技術提高訓練效率;
  • 借助Whale框架,首次在480 V100 上,3天內完成萬億M6模型的預訓練。相比此前英偉達使用3072 A100 GPU實現萬億參數、谷歌使用2048 TPU實現1.6萬億參數大模型,此次達摩院僅使用480卡V100 32G GPU就實現了萬億模型M6,節省算力資源超80%,且訓練效率提升近11倍。

四、結語

模型參數規模已越來越大,大模型已成為發展趨勢,為解決超大模型訓練的挑戰,我們自研Whale框架,將不同并行化策略進行統一抽象、封裝,在一套分布式訓練框架中支持多種并行策略。Whale提供簡潔易用的接口,用戶只需添加幾行annotation即可實現各種并行策略,不需要對模型本身進行修改。同時我們結合硬件資源、網絡topo、模型進行軟硬件協同優化,提供高效分布式訓練框架。

通過Whale框架,我們用480 V100 GPU卡訓練萬億規模模型,并在3天內完成模型訓練收斂,為超大規模模型訓練落地提供了可能,后續我們會進一步完善Whale框架,從更大規模、更快速度、更高性價比3個維度去擴展Whale框架的能力。同時也會推動Whale能力在更多業務場景落地,讓技術能力到產品能力的轉變。

 

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2022-03-09 08:05:26

框架分布式開源

2021-06-25 10:40:38

阿里云AIM6

2009-04-16 09:02:30

Eclipse開發平臺版本發布

2017-09-01 05:35:58

分布式計算存儲

2023-10-26 18:10:43

分布式并行技術系統

2023-04-19 16:51:54

分布式Primus開源

2025-10-24 10:41:33

2018-05-19 00:26:13

UAI Train分布式訓練

2019-05-05 08:37:39

分布式PyTorchGPU

2021-02-01 09:35:53

關系型數據庫模型

2021-09-09 15:45:17

機器學習人工智能Ray

2023-06-26 00:14:28

Openjob分布式任務

2025-06-20 14:29:02

模型訓練大數據

2015-12-14 17:35:21

GemFire12306分布式

2019-06-19 15:40:06

分布式鎖RedisJava

2009-12-21 13:47:29

WCF分布式事務

2015-09-24 15:08:28

分布式框架反思分布式系統

2024-09-13 17:02:29

2014-06-30 14:20:05

NoSQL數據庫
點贊
收藏

51CTO技術棧公眾號

亚洲人123区| 亚洲另类视频| 日韩欧美高清在线| 日本wwwcom| 视频国产一区二区三区| 首页欧美精品中文字幕| 久久精品中文字幕免费mv| 免费啪视频在线观看| 自拍偷拍欧美视频| 亚洲精品欧美综合四区| 久久国产精品免费一区| 中文字幕日产av| 激情欧美亚洲| 色哟哟入口国产精品| 不许穿内裤随时挨c调教h苏绵| 欧美xoxoxo| 一区二区高清视频在线观看| 日韩国产一区久久| 亚洲男人天堂久久| 人人狠狠综合久久亚洲| 欧美精品福利在线| 日本 欧美 国产| 久久激情av| 91精品国产一区二区人妖| 日韩av一二三四区| 青春草视频在线观看| 日本一区免费视频| 国产欧美日韩一区二区三区| 97超碰人人模人人人爽人人爱| 国产精品亚洲综合久久| 欧美美最猛性xxxxxx| 精品一区二区三孕妇视频| 久久精品色播| 日韩免费一区二区| xxx中文字幕| 成人免费一区| 色网综合在线观看| 91成人在线观看喷潮教学| 成人日韩欧美| 国产精品女人毛片| 日韩黄色影视| 免费国产在线观看| 99久久99久久精品国产片果冻| 亚洲qvod图片区电影| 在线中文字幕网站| 青青草国产精品亚洲专区无| 国产成人av网| 久久精品视频5| 国产日韩欧美在线播放不卡| 国模精品系列视频| 日韩精品在线免费看| 国产综合精品一区| 久久久久久久久网站| 久久久久久久久久91| 欧美激情五月| 欧美极品少妇全裸体| 麻豆影视在线播放| 欧美久色视频| 日韩在线www| www.com.av| 911精品美国片911久久久 | 日韩免费不卡av| 精品国产一区二区三区四| 国产精品视区| 国产精品wwwwww| 一级全黄裸体免费视频| 久久99最新地址| 成人欧美一区二区三区在线 | 国产成人av影院| av色综合网| 日韩在线视频免费| 97精品国产露脸对白| 欧美久久在线| 日本三级视频在线播放| 亚洲精品伦理在线| 91成人综合网| av综合电影网站| 欧美日本在线看| 免费黄色在线播放| 欧美亚洲大陆| 日韩最新av在线| 久久国产精品波多野结衣av | 九热视频在线观看| 亚洲青青一区| 精品国产1区2区3区| 在线天堂www在线国语对白| 日韩大片在线免费观看| 国产一区二区三区日韩欧美| 老熟妻内射精品一区| 激情一区二区| 国产福利成人在线| a视频免费在线观看| 99久久精品免费看国产免费软件| 日韩av图片| 国产成人l区| 性欧美大战久久久久久久久| 最近免费中文字幕中文高清百度| 成人国产精品久久| 日韩精品www| 午夜成人亚洲理伦片在线观看| 黄色亚洲精品| 国产精品热视频| 内射无码专区久久亚洲| 国产精品三级视频| 黄色www网站| 国产精品一区二区精品| 亚洲人精品午夜在线观看| 黄色片子在线观看| 丝袜美腿亚洲一区二区图片| 成人免费观看网站| av成人手机在线| 亚洲成在人线免费| av中文字幕网址| 猛男gaygay欧美视频| 另类美女黄大片| 国产精品51麻豆cm传媒| 97久久久精品综合88久久| 一本一本a久久| 都市激情亚洲综合| 精品福利一区二区三区免费视频| 免费黄色在线网址| 亚洲欧美日韩一区在线观看| 51国偷自产一区二区三区的来源| 国产精品久久久久久久龚玥菲 | 欧美黑人xxxx| 97精品久久人人爽人人爽| 26uuu亚洲综合色| 无码人妻精品一区二区蜜桃网站| 99精品国产九九国产精品| 亚洲免费小视频| 日本一级一片免费视频| 国产成人福利片| 国产av第一区| 粉嫩av国产一区二区三区| 中文字幕久久亚洲| 无码人妻丰满熟妇奶水区码| 97精品国产露脸对白| 黄色一级在线视频| 永久免费精品视频| 欧美区二区三区| 国产成人三级一区二区在线观看一| 国产欧美精品国产国产专区| 男女曰b免费视频| 欧美日韩直播| 欧美亚洲成人免费| 完全免费av在线播放| 精品999视频| 欧美日韩亚洲网| 无码一区二区精品| 亚洲精品美女| 久久精品国产99精品国产亚洲性色| 波多野结衣在线播放| 精品人伦一区二区色婷婷| 青青草手机在线视频| 国产乱码精品一区二区三区五月婷| 国产精品亚洲天堂| 麻豆精品在线| 欧美激情中文网| 日批视频在线播放| 欧美日韩午夜激情| 日韩乱码人妻无码中文字幕久久| 欧美一级久久| 天堂社区 天堂综合网 天堂资源最新版 | 亚洲欧美一区二区久久| 黑人巨大猛交丰满少妇| 亚洲网站啪啪| 久久综合婷婷综合| 欧洲av一区二区| 久久精品国产免费观看| 国产高潮在线观看| 婷婷成人激情在线网| 强伦人妻一区二区三区| 美女一区二区视频| 日本精品福利视频| 欧美一级三级| 国产精品亚洲精品| 永久免费网站在线| 日韩麻豆第一页| 中文字幕资源网| 一区二区成人在线视频| 中文字幕一区三区久久女搜查官| 丝袜美腿高跟呻吟高潮一区| 亚洲视频电影| 黑人久久a级毛片免费观看| 欧洲精品在线视频| 黄色网页在线免费看| 精品sm捆绑视频| 成人免费一级片| 一区二区三区欧美| 91国模少妇一区二区三区| 久草中文综合在线| 久久综合色视频| 欧美激情电影| 极品尤物一区二区三区| 久久电影天堂| 欧美性做爰毛片| 亚洲精品一线| 亚洲系列中文字幕| 亚洲精品久久久久avwww潮水| 欧美性xxxxxxxxx| 免费视频一二三区| 国产欧美精品区一区二区三区| 亚洲一二三四五| 久久精品久久精品| av观看免费在线| 欧美日韩国产免费观看| 日韩性感在线| 欧美国产极品| 99国产盗摄| 日韩亚洲国产免费| 51久久精品夜色国产麻豆| 成人免费视屏| 永久免费精品影视网站| 偷拍精品一区二区三区| 91精品国产91热久久久做人人| 中文字幕在线欧美| 亚洲成人动漫精品| 在线观看美女av| 国产欧美精品国产国产专区| aaaaaav| 成人免费视频视频| 伊人成人免费视频| 精一区二区三区| 国产高潮免费视频| 三级亚洲高清视频| 国产精品第12页| 国产精品尤物| 大j8黑人w巨大888a片| 国产精品a久久久久| 操bbb操bbb| 亚洲精品久久| 一本—道久久a久久精品蜜桃| 精品国产精品国产偷麻豆| 久久精品五月婷婷| 国产成人tv| 国产精品一区二区三区四区五区 | 欧美aaa视频| 国产91精品黑色丝袜高跟鞋| 黄视频免费在线看| 久久久久中文字幕| 男男gaygays亚洲| 欧美高跟鞋交xxxxhd| 色婷婷在线播放| 欧美日韩福利视频| 欧洲性视频在线播放| 欧美日本啪啪无遮挡网站| av毛片在线播放| 欧美日韩成人黄色| 国产91足控脚交在线观看| 欧美日本中文字幕| segui88久久综合9999| 国外色69视频在线观看| 亚洲精品中文字幕| 日韩av电影院| 福利一区在线| 91香蕉嫩草影院入口| 美女日韩一区| 国产98在线|日韩| 欧美日韩导航| 日韩欧美国产二区| 国产高清欧美| 丁香色欲久久久久久综合网| 最新亚洲一区| 欧美xxxxx在线视频| 日韩av午夜在线观看| 欧美成人乱码一二三四区免费| 国产一区二区在线观看免费| 国产69视频在线观看| 91在线一区二区三区| 在线观看国产精品一区| 国产精品成人一区二区艾草 | 91麻豆精品国产91久久综合| 国产精品电影一区二区| 欧美日韩激情在线观看| 精品国产91乱高清在线观看| 五月婷婷六月婷婷| 制服丝袜成人动漫| 婷婷开心激情网| 在线丨暗呦小u女国产精品| 好了av在线| 久久免费精品视频| 经典三级一区二区| 亚洲va码欧洲m码| 天海翼精品一区二区三区| 亚洲mv在线看| 一区在线观看| 蜜臀av免费观看| av亚洲产国偷v产偷v自拍| 毛片aaaaaa| 亚洲成在线观看| 亚洲图片视频小说| 日韩成人av一区| 思思99re6国产在线播放| 97在线看免费观看视频在线观看| 99精品国自产在线| 国产精品国产三级国产专区53 | 欧美巨大黑人极品精男| 成人美女视频| 99re在线视频观看| 欧美亚洲精品在线| 97视频在线免费| 精品一区二区免费| 女尊高h男高潮呻吟| 亚洲欧美日本在线| 无码视频一区二区三区| 欧美变态tickling挠脚心| 成人77777| 97成人精品视频在线观看| 欧美黄色一级| 亚洲一区二区三区欧美| 久久xxxx精品视频| 女同性αv亚洲女同志| 中文字幕日韩欧美一区二区三区| 国产精品久久久久久久妇| 日韩一区二区精品在线观看| 992tv免费直播在线观看| 热re91久久精品国99热蜜臀| 国产伦精品一区二区三区在线播放| 一区二区三区av| 日韩精品福利网| 97人妻天天摸天天爽天天| 一区2区3区在线看| 91精品人妻一区二区三区果冻| 亚洲欧美日韩精品久久亚洲区 | 五月综合激情日本mⅴ| 国产三级第一页| 日韩中文字幕免费| 欧美日韩精品一区二区三区视频| 九九九久久久| 99热精品在线| 黑丝av在线播放| 午夜在线电影亚洲一区| 欧美 日韩 综合| 欧美激情影音先锋| 深夜激情久久| 人妻激情另类乱人伦人妻 | 色噜噜日韩精品欧美一区二区| 午夜视频一区在线观看| 亚洲精品久久久蜜桃动漫| 欧美噜噜久久久xxx| 日韩影片在线观看| 男人天堂网站在线| 国产精品18久久久久久久久| 欧美国产日韩在线观看成人| 欧美一区二区三区四区视频| www久久日com| 99热在线国产| 影音先锋中文字幕一区二区| 香港三日本8a三级少妇三级99| 亚洲va欧美va人人爽午夜| 免费观看毛片网站| 97在线日本国产| 一区三区在线欧| 性生交免费视频| 国产精品二三区| 精品国产无码一区二区三区| 欧美激情久久久久| 欧美激情极品| 国产xxxxx视频| 国产精品国产a| av一区二区三| 久久久久久国产免费| 女人抽搐喷水高潮国产精品| 欧美a在线视频| 中文无字幕一区二区三区 | 日韩欧美三级在线观看| 亚洲天堂av高清| 久久久免费人体| 女人床在线观看| 97久久超碰国产精品电影| 波多野结衣电车| 久久精品国产成人精品| 福利片一区二区| 一本久道综合色婷婷五月| 国产精品久久久久三级| 亚洲AV无码乱码国产精品牛牛| 69精品小视频| 日韩在线视屏| 国产清纯白嫩初高中在线观看性色| 欧美性猛交xxxxx免费看| 在线激情网站| 国产伦精品一区二区三区在线 | 人妻aⅴ无码一区二区三区 | 人妻一区二区三区免费| 国产z一区二区三区| 亚洲综合自拍| 五级黄高潮片90分钟视频| 欧美高清视频在线高清观看mv色露露十八 | 9l视频自拍九色9l视频成人| 免费在线激情视频| 国产精品国产精品国产专区不蜜 | 高潮毛片又色又爽免费| 久久久999精品免费| 亚洲电影一级片| 色姑娘综合天天| 91高清在线观看| 538在线视频| 最新欧美日韩亚洲| 久久在线免费观看| wwwav网站|