精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析

發(fā)布于 2024-8-9 16:50
瀏覽
0收藏

一、背景

之前我們已經(jīng)總結(jié)過 FP8 的發(fā)展歷程,以及其在大規(guī)模語言模型(LLM)訓(xùn)練和推理中的應(yīng)用。如今,F(xiàn)P8 推理幾乎已經(jīng)成為行業(yè)共識,許多 LLM 推理框架已經(jīng)支持 FP8 推理,且多家公司也開源了相應(yīng)的 FP8 模型。例如,Meta 在最近發(fā)布的 LLaMA-3 技術(shù)報告中就提到了 FP8 推理的應(yīng)用。

FP8 推理相比 INT8 推理的最大優(yōu)勢在于其后訓(xùn)練量化(PTQ,Post Training Quantization)能夠獲得幾乎無損的精度,同時顯著提升推理速度。例如,相比 FP16,在 NVIDIA H20 上可以實現(xiàn) 2 倍的加速效果,而在 H100 上也可以獲得超過 1.5 倍的加速。

與此同時,還比較少看到使用 FP8 進行 LLM 訓(xùn)練的工作,目前看到的有如下幾個:

  • 微軟發(fā)布 FP8-LM 論文[2310.18313] FP8-LM: Training FP8 Large Language Models,并開源相應(yīng)的代碼 MS-AMP。
  • 零一萬物在零一萬物面向萬卡集群的 AI Infra 建設(shè)中提到了 FP8 預(yù)訓(xùn)練。
  • NVIDIA 和 Mistral AI 聯(lián)合發(fā)布 Mistral-NeMo-12B 模型,提到了使用 FP8 量化感知訓(xùn)練,但沒有介紹更多細節(jié)。
  • NVIDIA 的 Megatron-LM 也早已通過 Transformer-Engine 庫支持了 FP8 訓(xùn)練。

然而,也有一些工作對 FP8 訓(xùn)練持懷疑態(tài)度,因此我們決定自己做一些實驗,以進一步驗證 FP8 訓(xùn)練。此外,有關(guān) FP8 訓(xùn)練可能的問題,也可以參考 NVIDIA 的官方文檔:探索 FP8 訓(xùn)練中 Debug 思路與技巧。

二、To FP8 and Back Again

2.1. 摘要

在 [2405.18710] To FP8 and Back Again: Quantifying the Effects of Reducing Precision on LLM Training Stability 中,作者指出,之前使用 FP16 訓(xùn)練的穩(wěn)定性不如 BF16,而 FP8 的 Bit 數(shù)更少,可能導(dǎo)致更多穩(wěn)定性問題。因此,作者認為降低精度的訓(xùn)練方案必須具有與更高精度的訓(xùn)練方案相似的訓(xùn)練穩(wěn)定性和超參敏感性,才能具有成本效益。同時,作者發(fā)現(xiàn)目前可用的 FP8 訓(xùn)練方法不夠穩(wěn)健,無法將它們用作當(dāng)前方案的替代品。

PS:當(dāng)然,作者也強調(diào)了使用 FP8 進行 LLM 推理是完全沒問題的。

2.2. 實驗

2.2.1 FP8 訓(xùn)練實驗

作者使用微軟開源的 https://github.com/Azure/MS-AMP.git(作者使用的是 v0.3.0,當(dāng)前最新的為 v0.4.0)來進行 FP8 訓(xùn)練驗證。如下圖 Figure 5 所示,作者使用 8 個 H100 GPU 進行實驗,其中 MS-AMP 僅使用 O1 優(yōu)化,其在 GPT-2 124M 和 LLaMA 120M 上都有比較嚴重的收斂性問題,在 LLaMA 120M 上使用 FP8 訓(xùn)練甚至無法收斂

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

2.2.2 降低 Bit 數(shù)實驗

如下圖 Figure 6 所示,使用 E8M3、E8M4 和 E8M5 來訓(xùn)練 TinyLLaMA 120M 模型,依然會出現(xiàn) Loss 不收斂的問題:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖 Figure 7 所示,進一步使用 E8M3、E8M4、E8M5 和 E8M6 訓(xùn)練 LLaMA 7B,在 E8M5 和 E8M6 時才能保證相對的穩(wěn)定性:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

三、Megatron-LM FP8 訓(xùn)練驗證

3.1. 摘要

對于上述論文中的實驗我們持懷疑態(tài)度,與我們之前看到的各種結(jié)論不符,因此決定進行相應(yīng)的復(fù)現(xiàn)。同時我們也在考慮一個問題:如果無法充分保證 FP8 訓(xùn)練的穩(wěn)定性以及可比 BF16 訓(xùn)練的精度,怎么權(quán)衡是否要使用 FP8 訓(xùn)練。比如說,F(xiàn)P8 訓(xùn)練相比 BF16 訓(xùn)練可以加速 30%,但是 Loss 下降會慢一些,那么是否要使用 FP8 訓(xùn)練呢?除此之外,我們也進一步測試了 GPT3 系列模型在不同 Batch Size 和 Seq Length 下 FP8 相比 BF16 訓(xùn)練的加速比,以便為相關(guān)決策提供參考。

3.2. FP8 訓(xùn)練 Loss 對比

訓(xùn)練在 8*H100 機器進行,訓(xùn)練數(shù)據(jù)集采用 cerebras/SlimPajama-627B · Datasets at Hugging Face。使用 NVIDIA 的 GitHub - NVIDIA/Megatron-LM: Ongoing research training transformer models at scale 訓(xùn)練框架,具體示例可以參考其 examples 中的 gpt3。

如下圖所示為一個 1B 模型使用 FP8 訓(xùn)練和 BF16 訓(xùn)練的 loss 對比,總共訓(xùn)練了 21K 個 Step,其 BF16 的 loss 基本上和 FP8 相當(dāng),并且收斂趨勢完全一致。當(dāng)然,我們也發(fā)現(xiàn) FP8 的 loss 始終會比 BF16 高一點:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示,我們的結(jié)論與 Benchmarking Large Language Models on NVIDIA H100 GPUs with CoreWeave (Part 1) | Databricks Blog 中的結(jié)論基本一致:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

除了 1B 模型之外,我們還驗證了 345M 模型和 13B 模型,結(jié)論基本與上述一致。

3.3. FP8 訓(xùn)練速度對比

在驗證收斂性的同時我們也同步驗證了加速比,其 13B 模型 FP8 相比 BF16 可以獲得 30% 左右的加速,而 1B 模型可能只有 20% 左右,更小的模型加速比甚至小于 10%。(PS:不同的分布式策略都可能產(chǎn)生不同的結(jié)果,我們這里只是簡單同配置下的驗證)

如下圖所示,Benchmarking Large Language Models on NVIDIA H100 GPUs with CoreWeave (Part 1) | Databricks Blog 中 1B,3B 和 7B 模型的 FP8 訓(xùn)練相比 BF16 的訓(xùn)練加速比也只有 1.2x-1.3x:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

為了對比不同配置下的性能,我們使用 Transformer-Engine 構(gòu)建了一個 1 層的 Transformer Block 進行速度對比,同樣在 8*H100 上驗證,采用 8TP,具體示例可以參考 Getting Started — Transformer Engine 1.8.0 documentation。

如下圖所示為 GPT-3 系列模型在 Seq Length=1024 時的性能,其中:

  • 紅色:表示加速比小于 1,通常是模型比較小,Batch Size 比較小的情況。
  • 藍色:表示加速比大于 1 并且小于 1.3,通常是模型相當(dāng)比較大或者 Batch Size 比較大。
  • 綠色:表示加速比大于 1.3,同時是模型很大或者 Batch Size 很大。?

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示為 Seq Length 為 2048 的情況:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示為 Seq Length 為 4096 的情況:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示為 Seq Length 為 8192 的情況:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

從上述結(jié)論可以看出,要想獲得比較大的加速比,通常需要具有比較大的模型或者比較大的 Batch Size、Seq Length。當(dāng)然,也并不是說 Seq Length 越大越好,可以看出,Seq Length 為 8K 是其加速比反而不如 4K。此外,也可以看出,大部分加速比不超過1.5x,甚至很多不超過 1.3x。(在實際使用中最好經(jīng)過一些充分的分析和實驗)

3.4. 零一萬物的實踐

LLM 預(yù)訓(xùn)練的代價很高,比如可能需要上千個 GPU 訓(xùn)練幾個月的時間,30% 的加速比似乎有很大的吸引力。然而,其結(jié)果又像薛定諤的貓,除非同時訓(xùn)練一個 BF16 模型和 FP8 模型,才能確定 FP8 模型是否真的符合預(yù)期。

為了解決上述問題,零一萬物在 零一萬物面向萬卡集群的 AI Infra 建設(shè) 中提到了一個 Trick 的方法。如下圖所示,每隔一段時間就會 Load FP8 的 Checkpoint 并使用 BF16 進行訓(xùn)練,驗證 Loss 是否和 FP8 訓(xùn)練的 Loss 一致。如果出現(xiàn)不一致的情況,就會使用 BF16 的訓(xùn)練代替 FP8,并在一段時間后繼續(xù)使用 FP8 訓(xùn)練。最終作者獲得了 1.3x 的吞吐提升,不過并沒有說明這個提升是純粹的 FP8 相比 BF16 還是也包含了 BF16 的校驗預(yù)算。

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

四、參考鏈接

  1. https://arxiv.org/abs/2310.18313
  2. https://01-ai.github.io/
  3. https://mp.weixin.qq.com/s/ezdGxxmTRfEnzXmrVtwq7g
  4. https://arxiv.org/abs/2405.18710
  5. https://github.com/Azure/MS-AMP.git
  6. https://huggingface.co/datasets/cerebras/SlimPajama-627B
  7. https://github.com/NVIDIA/Megatron-LM
  8. https://www.databricks.com/blog/coreweave-nvidia-h100-part-1
  9. https://docs.nvidia.com/deeplearning/transformer-engine/user-guide/examples/quickstart.html

本文轉(zhuǎn)載自??AI閑談??,作者: AI閑談 ????

收藏
回復(fù)
舉報
1條回復(fù)
按時間正序
/
按時間倒序
wx671aff8936b5b
wx671aff8936b5b

2.2.1 FP8 訓(xùn)練實驗的實驗是錯的,《To FP8 and Back Again》的作者沒有讓最后一層線性層保持高精度。

低比特訓(xùn)練需要讓最后一層線性層保持高精度,其他線性層用低精度。

MS-AMP訓(xùn)練的FP8 GPT-2 124M能夠和BF16模型對齊:

??https://github.com/Azure/MS-AMP/issues/178??


基于nanoGPT整合MS-AMP的代碼已開源:

??https://github.com/wkcn/nanoGPT??


回復(fù)
2024-10-25 10:19:46
回復(fù)
相關(guān)推薦
日韩精品在线视频观看| 亚洲欧洲av另类| 欧美一区二区三区艳史| 国产sm调教视频| 国产一区二区| 精品欧美aⅴ在线网站| 色女人综合av| 不卡的日韩av| 全部av―极品视觉盛宴亚洲| 久久av在线播放| 中文字幕免费在线播放| 欧美v亚洲v综合v国产v仙踪林| 亚洲激情中文1区| 欧美一区二区综合| 精品人妻一区二区三区三区四区| 午夜一区二区三区不卡视频| 久久久999国产精品| 中文字幕在线观看网址| 国产一精品一av一免费爽爽| 欧美日韩一区二区三区| 久久久久久久久久久久久国产| 无码精品黑人一区二区三区| 国产一区二区在线影院| 国产精品www色诱视频| 国产精彩视频在线观看| 999国产精品| 精品视频在线播放| 又色又爽又黄18网站| 久久精品 人人爱| 欧美网站在线观看| 女人被男人躁得好爽免费视频| 第一页在线观看| 91蜜桃婷婷狠狠久久综合9色| 成人妇女淫片aaaa视频| 亚洲自拍一区在线观看| 99热免费精品| 欧美激情性做爰免费视频| 日韩免费av一区| 狠狠色狠狠色综合婷婷tag| 亚洲福利视频专区| 中国男女全黄大片| 精品国产欧美| 91精品国产综合久久精品性色| 九色porny91| 国产伦精品一区二区三区视频金莲| 亚洲综合丁香婷婷六月香| 中文字幕一区二区三区四区五区人 | 日本中文字幕有码| 不卡精品视频| 欧美精品第一页| 成人亚洲精品777777大片| 欧美粗大gay| 岛国av午夜精品| 好吊妞无缓冲视频观看| 黄色aa久久| 精品福利在线视频| 一女被多男玩喷潮视频| 老色鬼在线视频| 精品国产精品自拍| 91猫先生在线| 日韩三级影视| 欧美亚洲一区三区| 天天干天天操天天做| 热久久久久久| 欧美一区二区三区色| 亚洲图片 自拍偷拍| 国产精品美女久久久久人| 欧美一区二区三区人| 中文字幕永久免费| 一区二区视频| 亚洲国产精品一区二区三区| 久久国产精品影院| 精品国产一区二区三区久久久樱花 | 伊人五月天婷婷| 欧美h版在线观看| 精品免费一区二区三区| 黄色工厂在线观看| av一区二区高清| 久久久91精品国产| 国产黄色片视频| 久久永久免费| 成人高清视频观看www| 国产香蕉在线观看| 久久综合视频网| 中文字幕中文字幕在线中心一区 | 日韩动漫一区| 尤物yw午夜国产精品视频明星| 性生交大片免费全黄| 在线不卡视频| 国产精品电影在线观看| www日本高清视频| 久久婷婷国产综合精品青草| 视频一区视频二区视频| a毛片在线观看| 欧美日韩中文在线| 亚洲18在线看污www麻豆| 电影一区二区在线观看| 在线观看国产精品日韩av| 动漫性做爰视频| 亚洲免费在线| 亚洲www在线观看| 日韩一二三四| 悠悠色在线精品| 美女网站免费观看视频| 999久久久精品一区二区| 亚洲丝袜在线视频| 免费在线看黄网址| 久久精品国产第一区二区三区| 国产日韩精品一区观看| 素人av在线| 疯狂蹂躏欧美一区二区精品| www.国产福利| 视频一区中文| 午夜精品久久久99热福利| 一级黄在线观看| 91麻豆精品在线观看| 免费观看亚洲视频| a成人v在线| 日韩高清中文字幕| 欧美日韩精品亚洲精品| 久久久久久黄| 国产欧美亚洲日本| 超碰caoporn久久| 欧美无人高清视频在线观看| 欧美深性狂猛ⅹxxx深喉| 欧美特黄一区| 国产在线视频2019最新视频| 国产最新视频在线观看| 亚州成人在线电影| xxxx视频在线观看| 久久久国产精品| 国产精品成人在线| 清纯唯美亚洲色图| 欧美日韩国产色| 少妇一级淫片免费放播放| 国产高清久久| 国产在线一区二区三区| 国产二区在线播放| 色婷婷亚洲精品| av网站免费在线播放| 在线成人欧美| 国产高清一区视频| 牛牛精品在线| 日韩精品在线网站| avove在线播放| 狠狠色丁香九九婷婷综合五月| 视频一区国产精品| 国产精品99久久久久久董美香| 亚洲老司机av| 激情视频网站在线观看| 久久久99精品免费观看| 亚洲中文字幕无码不卡电影| 妖精一区二区三区精品视频 | 成人视屏在线观看| 亚洲片国产一区一级在线观看| 五月天综合激情| 91色porny| 久章草在线视频| 精品视频免费| 国产原创欧美精品| 最新黄网在线观看| 亚洲第一综合天堂另类专| 日韩免费一级片| 久久亚洲二区三区| 9久久婷婷国产综合精品性色| 日韩在线观看| 亚洲综合国产精品| 9lporm自拍视频区在线| 国产丝袜高跟一区| 波多野结衣一区二区三区四区| 欧美—级在线免费片| 中文字幕在线观看日| 欧美1区2区| 精品无码久久久久国产| 欧美电影网站| 日韩在线欧美在线| 亚洲免费一级片| 欧美午夜xxx| 无码人妻精品中文字幕| 成人激情综合网站| 日韩欧美xxxx| 亚洲字幕久久| 精品国产aⅴ麻豆| 日本国产欧美| 欧美丰满片xxx777| 四虎国产精品永远| 欧美二区三区91| 国产成人免费观看视频| 国产精品国产三级国产普通话三级| 日本一区二区三区在线免费观看| 在线欧美亚洲| 亚洲欧洲日夜超级视频| 97久久综合区小说区图片区| 国产精品99久久久久久久久 | 性视频1819p久久| 9i精品一二三区| 亚洲成年人在线播放| 中文字幕乱码无码人妻系列蜜桃| 亚洲综合偷拍欧美一区色| 亚洲av综合一区二区| 国产综合一区二区| 国产精品50p| 亚洲澳门在线| 欧美日韩综合精品| 中文一区二区三区四区| 国产福利视频一区| 黄网在线免费看| 社区色欧美激情 | 日韩在线免费播放| 日韩精品最新网址| 在线播放国产一区| 色综合久久久久综合99| 黄色一级视频免费| 国产精品情趣视频| 欧美色图亚洲激情| 国产91精品免费| 在线播放av中文字幕| 香蕉成人久久| 久久这里只有精品23| 性欧美69xoxoxoxo| 亚洲一卡二卡三卡四卡无卡网站在线看| 国产精品中文字幕制服诱惑| 91热福利电影| 福利一区和二区| 欧美一区二区三区免费观看| av影片在线| 欧美黑人巨大xxx极品| 国产一二三区在线观看| 国产一区二区三区网站| 色猫av在线| 日韩精品在线播放| 天天射天天操天天干| 日韩精品一区二区三区四区| 97超碰资源站| 欧美日韩美少妇| 中文字幕 视频一区| 一本久久a久久精品亚洲| 日韩三级一区二区三区| 亚洲国产乱码最新视频| 久久99久久98精品免观看软件| 中文字幕一区二区三区av| 阿v天堂2014| 国产精品全国免费观看高清| 久久久久久久毛片| 久久精品一区二区| 亚洲黄色小说视频| 国产亚洲综合性久久久影院| 在线免费观看日韩av| 久久久久久久性| 在线观看福利片| 91麻豆成人久久精品二区三区| 这里只有精品在线观看视频| av福利精品导航| 中文字幕丰满孑伦无码专区| 久久精品亚洲精品国产欧美kt∨| 欧美熟妇一区二区| 国产午夜精品一区二区三区四区| 国产中年熟女高潮大集合| 国产欧美日本一区视频| 免费看一级黄色| 一区二区视频免费在线观看| 国产一级做a爰片在线看免费| 亚洲成在线观看| 国产精品第5页| 欧美视频自拍偷拍| 91成品人影院| 日韩三级视频在线看| 黄色美女一级片| 日韩电影中文字幕在线观看| 大地资源中文在线观看免费版| 日韩视频中文字幕| 永久免费网站在线| 91av视频在线免费观看| 日韩免费小视频| 成人精品aaaa网站| av不卡一区二区| 欧美日韩三区四区| 欧美aaaa视频| av网站手机在线观看| 午夜一级久久| 中文 日韩 欧美| 9i在线看片成人免费| 性猛交ⅹxxx富婆video| 专区另类欧美日韩| 国产情侣在线视频| 欧美系列日韩一区| www.国产免费| 亚洲欧美日韩精品| 青青青青在线| 91av在线国产| 91视频亚洲| 蜜桃日韩视频| 88国产精品视频一区二区三区| 欧美不卡在线播放| 久久机这里只有精品| 在线观看免费视频黄| 国产蜜臀97一区二区三区| 久久久久久久久久综合| 欧美中文字幕一区| 六月丁香色婷婷| 久久精品99久久香蕉国产色戒 | 国产精品成人国产乱一区 | 欧美黑人3p| 欧美高清一区| 亚洲色图 在线视频| 成人av在线一区二区| 亚洲精品天堂网| 欧美性生活大片免费观看网址| 99久久精品国产一区色| 一区二区欧美在线| 免费av不卡在线观看| 国产欧美日韩中文字幕| 九九综合久久| 丰满的少妇愉情hd高清果冻传媒| 久久国产夜色精品鲁鲁99| 亚洲av无码国产精品久久| 亚洲制服丝袜一区| 国产一区二区三区在线观看| 亚洲一级黄色片| 国产污视频在线播放| 99九九视频| 66久久国产| 午夜免费福利在线| 久久先锋影音av鲁色资源网| 国产无遮挡又黄又爽又色| 91精品国产综合久久小美女| eeuss影院在线观看| 日韩69视频在线观看| 欧洲亚洲成人| 日韩网站在线免费观看| 国产精品99久久久久久有的能看| 99在线视频免费| 日本久久一区二区三区| 天堂а在线中文在线无限看推荐| 欧美噜噜久久久xxx| 国产精品亚洲欧美一级在线| 亚洲无玛一区| 蜜乳av一区二区| 自拍偷拍你懂的| 欧美三级三级三级爽爽爽| 国产在线超碰| 日本sm极度另类视频| 深夜福利久久| 999精品视频在线| 中文字幕乱码一区二区免费| 波多野结衣电车| 国产一区二区三区在线| 精品网站在线| 亚洲春色综合另类校园电影| 日本va欧美va瓶| 精品熟妇无码av免费久久| 欧美日韩国产片| 超碰在线免费播放| 99在线视频播放| 亚洲精品看片| 成人片黄网站色大片免费毛片| 日韩欧美国产一区二区| 国产青青草在线| 国产精品亚洲片夜色在线| 99久久99久久精品国产片果冰| 黄色小视频免费网站| 亚洲日本电影在线| 精品人妻少妇嫩草av无码专区| 色综合久久88| 日韩有码一区| 91国产精品视频在线观看| 国产精品福利一区二区三区| 国产精品人妻一区二区三区| 久久91精品国产91久久跳| 国产伦精品一区二区三区在线播放 | 欧美激情日韩| aaaa黄色片| 91福利在线导航| 国产精品久久久久久福利| 国产精品99久久久久久久| 免费中文字幕日韩欧美| 黄色国产在线播放| 精品久久久久久久久久久院品网| 免费在线小视频| 亚洲成人18| 成人午夜电影网站| 在线观看免费av片| 日韩有码在线电影| 国产成人在线中文字幕| 冲田杏梨av在线| 一区二区三区中文字幕精品精品 | 国产亚洲精品日韩| 精品一区二区三区亚洲| 亚洲 高清 成人 动漫| 中文字幕在线不卡视频| 色窝窝无码一区二区三区成人网站| 国产激情久久久| 好吊日精品视频| 国产精品无码无卡无需播放器| 欧美成人精精品一区二区频| 免费观看成人性生生活片| 国产一级大片免费看| 国产日韩欧美高清在线| 成人久久精品人妻一区二区三区| 国产成人鲁鲁免费视频a|