精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta 新作:FlashAttention 的數值偏差有多大?

發布于 2024-5-28 10:41
瀏覽
0收藏

一、背景

最近 Meta 的研究員開發了一個新的框架來了解 LLM 訓練中數值偏差的影響,并基于該框架評估了 LLM 中廣泛采用的 FlashAttention 的數值偏差。

對應的論文為:[2405.02803] Is Flash Attention Stable?

PS:其實論文很簡單,結論也很簡單:使用 FlashAttention 相比 Baseline Attention 確實會帶來數值偏差。但帶來的數值偏差比從 FP32 到 FP16 的數值偏差小得多,甚至小于不同初始化方法帶來的偏差。吐槽一下,論文中的圖都比較模糊。

二、摘要

LLM 預訓練的代價很高,也更加的復雜。很多 LLM 在預訓練中都遇到了訓練過程不穩定的情況,通常表示為損失的毛刺(Spike)。數值偏差(Numeric Deviation)被認為是導致這種訓練不穩定的潛在原因,但由于訓練的成本很高,量化這一點非常有挑戰性。

本文中,作者開發了一種系統性的方法來理解數值偏差的影響,并使用廣泛采用的 FlashAttention 來驗證了該框架。作者發現,與 Baseline Attention 相比,在單個前向傳播中,BF16 下的 FlashAttention 會有超過一個數量級的數值偏差。然而,使用基于 Wasserstein 距離的數據驅動分析來提供數值偏差對訓練過程中模型權重影響的上限,發現 FlashAttention 中的數值偏差比低精度訓練的影響小 2-5 倍。

三、引言

3.1 數值精度

如下圖為常見的浮點數值精度,其中 sign 表示符號位,exponent 表示指數位,fraction 表示尾數位。相比 float32,float16 的指數位和尾數位都更小,而 bfloat16 的指數位和 float32 相同,只是尾數位更少。因此,通常 float32 轉 float16 時通常會帶來較大的精度損失,而 float32 轉 bfloat16 通常只需要做小數位的截斷,損失相對較小。現在的 LLM 預訓練中通常都會使用 bfloat16。

  • Float32:指數位 8 位,尾數位 23 位,數據范圍為[1.18e-38, 3.40e+38]
  • float16:指數位 5 位,尾數位 10 位,數據范圍為[6.10e-05, 6.55e+04]
  • bfloat16:指數位 8 位,尾數位 7 位,數據范圍為[1.18e-38, 3.39e+38]

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

3.2 數值誤差

在浮點數的計算中會存在兩種常見的誤差:

  • 溢出誤差(Overflow Error):浮點都有一個有限的表示范圍,當計算結果超出這個表示范圍時就會產生溢出錯誤,往往表現為無窮大。比如,令 float a = FLT_MAX * 2,此時 a 的值為正無窮大。
  • 舍入誤差(Rounding Error):浮點數有固定的有效位數,當一個數值不能被精確表示時,就會被舍入到最接近的可表示的浮點數。這種輸入在數值計算中是不可避免的,因為大多數實數在計算機中無法被精確表示。比如在 C 中打印 0.1f,printf("a = %.20f\n", 0.1f),其輸出結果為 0.10000000149011611938,是一個近似值。

除此之外,有時也會提到下溢誤差(Underflow Error):當一個非常小的非零結果小于浮點數表示范圍下限時發生,通常導致結果被舍入為零。

由于 float16 和 bfloat16 的不同指數位和尾數位,也就導致它們出現誤差的場景不太一樣。

  • float16:指數位較少,尾數位較多,表示范圍有限,但表示精度更高,因此更容易發生溢出誤差
  • bfloat16:指數位較多,尾數位較少,表示范圍更大,但表示精度有限,因此更容易發生舍入誤差。下溢誤差也更多一些。

3.3 訓練損失毛刺

在 Meta OPT、BigScience Bloom、Google PaLM、TII Falcon 以及智源 GLM 訓練中都出現了訓練損失出現毛刺的情況,也有一些有效的手段可以緩解,但依舊不知道其根因。比如 Google PaLM 中驗證了其并非是單個樣本導致的。

如下圖所示,是 [2211.05100] BLOOM: A 176B-Parameter Open-Access Multilingual Language Model 中遇到的毛刺現象:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

3.4 評估指標

Wasserstein 距離,也稱為 Earth Mover’s Distance (EMD),是一種衡量兩個概率分布之間差異的方法。這種距離的直觀含義是,將一個概率分布轉變成另一個概率分布所需要的“工作量”或“成本”,其中“工作量”可以理解為將一堆形狀不同的沙子(一個概率分布)鏟動并重塑為另一堆沙子(另一個概率分布)所需要的努力。

Wasserstein 距離基于最優運輸理論。給定兩個概率分布 P 和 ??,以及一個成本函數 ??(??,??),Wasserstein 距離定義為將分布 P 轉變為 Q 所需的最小成本。數學上,它表示為:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

這里的 π 是 P 和 ?? 之間的所有可能的聯合分布的集合,而 Π(P,Q) 表示所有這些聯合分布中,邊際分布分別是 P 和 Q 的集合。

相比其他距離度量(如歐氏距離或 KL 散度),Wasserstein 距離的一個主要優勢在于其能夠更加有效地處理概率分布之間的微小變化,特別是當這些分布不重疊或僅部分重疊時。這使得 Wasserstein 距離在數據稀疏或異構的情況下特別有用。

四、方法&實驗

4.1 方法

作者開發了一個 microbenchmark 來隔離和研究 FlashAttention 引起的數值偏差。其設計如下圖 Fig 2 所示,在原始的 FlashAttention 中只支持 FP16 和 BF16 格式,因此作者重新實現了 FlashAttention,以便分析不同的數值精度的影響。作者進一步修改模型,可以在每次調用 Attention 時計算 Baseline Attention 和 FlashAttention 的注意力矩陣輸出,從而可以使用最大差異(max difference)以及 Wasserstein 距離來度量差異。作者也進行了一系列訓練來度量整個訓練過程中模型權重的差異。

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

4.2 數據類型的影響

如下圖 Fig.3 所示,作者對比了不同數據類型下 Baseline Attention 和 FlashAttention 的數值偏差,可以看出,數值精度越高,偏差越小:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

為了進一步分析這種數值偏差,作者探索了序列長度對數值偏差的影響,其中會保持 FlashAttention 的 tile 大小和 SRAM 大小相同。如下圖所示,隨著序列長度的增加,數值偏差也會適當增加。其中左圖(a)表示最大誤差,右圖(b)表示誤差的均值。由于序列變長,也就需要更多的 tile,相應也有更多的 resaling,這也就可能產生更多的誤差:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

4.3 算法配置的影響

如下圖 Fig 6 所示,作者進一步探索了 FlashAttention 中不同配置的影響:

  • (a)和(c)針對不同的 Block/tile Area 大小的影響,使用比較大的 Block 后 Baseline Attention 和 FlashAttention 的差異很小,主要是因為 rescaling 計算更少一些。
  • (b)使用 Square Block 對 Baseline Attention 和 FlashAttention 的影響不大。?

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

4.4 模型權重的變化

作者進一步驗證了訓練中模型權重的變化(對比 Baseline Attention 和 FlashAttention),如下圖 Fig 7 所述,不管是最大誤差還是 Wasserstein 距離都會隨著訓練的迭代而逐漸變大,并且趨勢類似:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

如下圖 Fig.8 所示,作者進一步驗證了整個訓練中其他變量帶來的模型權重的偏差。可以看出,雖然 Baseline Attention 和 FlashAttention 會導致權重產生誤差,但是其甚至比不同初始化方法帶來的誤差還小,更是遠小于 FP16 vs BF16 和 FP16 vs FP32 帶來的誤差:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

五、參考鏈接

  1. ???https://arxiv.org/abs/2405.02803???
  2. ???https://arxiv.org/abs/2211.05100????

本文轉載自 ??AI閑談??,作者: AI閑談

收藏
回復
舉報
回復
相關推薦
精品国产青草久久久久96| 日本少妇xxxx| 污污在线观看| 久久一区二区三区四区| 国产精品在线看| 精品无码一区二区三区电影桃花 | 欧美一级精品在线| 国模吧无码一区二区三区| yourporn在线观看中文站| 国产成人综合亚洲网站| 日韩免费在线播放| 久久精品www人人爽人人| 国产成人影院| 精品日韩欧美在线| 日本特黄a级片| 成入视频在线观看| 综合久久综合久久| 日韩av免费电影| 人妻偷人精品一区二区三区| 日韩高清不卡一区二区三区| 久久精品资源| a美女胸又www黄视频久久| 国产精品成人一区| 日韩黄色三级视频| 亚洲h色精品| 亚洲视频第一页| 欧美一区二区免费在线观看| 久久视频免费| 欧美亚男人的天堂| 欧洲黄色一级视频| 波多野结衣在线高清| 国产精品久久午夜夜伦鲁鲁| 免费日韩av电影| 懂色av蜜臀av粉嫩av分享吧| 激情六月婷婷综合| 国产精品直播网红| 黄色污污网站在线观看| 国产亚洲综合精品| 欧美风情在线观看| 国产a免费视频| 天天操夜夜操国产精品| 在线视频免费一区二区| 久久中文字幕人妻| 色哟哟精品丝袜一区二区| 日韩精品专区在线| av在线天堂网| 91麻豆精品国产91久久久久推荐资源| 在线不卡一区二区| 日韩av片免费观看| 电影一区二区三区久久免费观看| 欧美日韩成人激情| jizz18女人| 亚洲三级电影| 欧美一区二区网站| 少妇伦子伦精品无吗| 亚洲不卡在线| 亚洲精品一区二区三区四区高清 | 亚洲欧美日韩成人| 国产精品一区二区入口九绯色| 国产精品久av福利在线观看| 亚洲成人网在线观看| 欧美在线一级片| 欧美一区 二区| 亚洲乱亚洲乱妇无码| 国产精品无码久久久久一区二区| 日韩最新在线| 亚洲欧美中文日韩v在线观看| 成人片黄网站色大片免费毛片| 国产成人高清精品免费5388| 亚洲精品国产suv| 波多野结衣福利| 日韩欧美不卡| 美女999久久久精品视频| 青娱乐国产精品| 在线亚洲伦理| 国产精品久久久| 国产精品爽爽久久| 成人视屏免费看| 美日韩免费视频| 超碰国产在线| 亚洲免费观看高清在线观看| 青青在线视频免费观看| 麻豆理论在线观看| 欧美在线不卡一区| 宇都宫紫苑在线播放| 青青久久av| www.亚洲一区| 特一级黄色大片| 青青草成人在线观看| 91成人免费观看| 亚洲色偷精品一区二区三区| 久久综合久久久久88| 亚洲精品日韩精品| 久草在线资源站资源站| 一本色道久久综合亚洲aⅴ蜜桃| 九九热在线免费| 国产一区二区三区黄网站| 亚洲国产精品免费| 亚洲女人毛茸茸高潮| 在线播放一区| 国产精品永久免费视频| 天天摸夜夜添狠狠添婷婷| 国产精品卡一卡二卡三| 欧美精品自拍视频| 91国内外精品自在线播放| 精品国产乱子伦一区| 2017亚洲天堂| 亚洲欧美日韩一区在线观看| 91精品中文在线| 福利在线视频导航| 午夜在线电影亚洲一区| 亚洲综合伊人久久| 国内成人精品| 97在线免费观看视频| 国产精品热久久| 国产视频一区在线播放| 欧美视频在线观看视频| 亚洲午夜国产成人| 亚洲性av在线| av大片在线免费观看| 国产精品中文字幕一区二区三区| 欧日韩一区二区三区| 美女的胸无遮挡在线观看| 欧美一卡二卡在线| 99热这里只有精品4| 日韩国产欧美在线观看| 久久av一区二区| 黑人玩欧美人三根一起进| 欧美高清视频一二三区| 免费黄在线观看| 久久xxxx| 精品视频免费观看| 美洲精品一卡2卡三卡4卡四卡| 欧美久久久一区| wwwww黄色| 久久婷婷久久| 欧美三级网色| 三上悠亚亚洲一区| 精品亚洲一区二区三区| 国产尤物在线视频| 99久久精品免费| 欧美亚洲精品一区二区| 国产成人一二片| 国内精品视频在线| 欧美天堂在线视频| 欧美日韩免费网站| 秘密基地免费观看完整版中文| 欧美一区久久| 成人免费视频网站入口| 欧洲一区二区三区| 精品国产青草久久久久福利| 18精品爽视频在线观看| 福利电影一区二区三区| 女人帮男人橹视频播放| 福利欧美精品在线| 欧美一区第一页| 牛牛热在线视频| 欧美最猛性xxxxx直播| 日本精品久久久久中文| 精品一区二区免费| 视频一区二区视频| 亚洲va欧美va人人爽成人影院| 久久久久久成人精品| 蜜桃视频污在线观看| 精品国产91久久久久久老师| a级在线观看视频| 老司机精品视频网站| 亚洲自拍的二区三区| 麻豆久久一区| 97视频在线观看视频免费视频| 天堂中文在线8| 欧美性做爰猛烈叫床潮| 日韩成人短视频| 国产+成+人+亚洲欧洲自线| 好吊妞无缓冲视频观看| 精品国内自产拍在线观看视频| 日韩男女性生活视频| 日本中文字幕在线视频| 欧美成人精品福利| 黄色片免费观看视频| 中文字幕久久午夜不卡| av影片在线播放| 香蕉久久久久久久av网站| 亚洲一区二区三区免费观看| 亚洲开心激情| 国产精品福利在线观看网址| 国产激情在线观看| 精品五月天久久| 99精品免费观看| 日韩欧美黄色动漫| 中文字幕在线观看2018| 99re6这里只有精品视频在线观看| 日日摸天天爽天天爽视频| 中文字幕一区二区三区久久网站 | 国产精品毛片a∨一区二区三区|国| 男人和女人做事情在线视频网站免费观看| 日韩久久久精品| 做爰无遮挡三级| 亚洲mv在线观看| 黄色免费一级视频| 97精品久久久午夜一区二区三区 | 久久久精品久久久| 日批免费在线观看| 欧美乱妇一区二区三区不卡视频| 一级aaa毛片| 国产精品第五页| 大又大又粗又硬又爽少妇毛片| 激情六月婷婷久久| 国产黄色片免费在线观看| 日韩在线观看一区 | 日韩www视频| 激情久久五月天| 少妇黄色一级片| 99精品国产一区二区青青牛奶| 色中文字幕在线观看| 亚洲精品亚洲人成在线| 99久热re在线精品视频| 国产 日韩 欧美| 国产精品久久久久久亚洲影视 | 欧洲亚洲女同hd| 婷婷在线播放| 久久久97精品| av中文资源在线| 亚洲美女自拍视频| 天天操天天干天天插| 日韩一区二区免费在线观看| 一个人看的www日本高清视频| 日韩欧美在线播放| 九九热精品视频在线| 亚洲成精国产精品女| 久久久精品视频在线| 一区二区三区四区中文字幕| 亚洲精品一区二区三区在线播放| 国产精品天干天干在线综合| 亚洲国产天堂av| 国产午夜精品一区二区三区四区 | 国产男男gay网站| 欧美挠脚心视频网站| 中文字幕 自拍偷拍| 色婷婷亚洲精品| 久久久久在线视频| 色婷婷综合在线| 天堂网免费视频| 色婷婷久久久久swag精品| 久久精品视频7| 色婷婷狠狠综合| 波多野结衣黄色网址| 日韩欧美主播在线| 男人天堂视频网| 在线观看日韩毛片| 中文字幕无码乱码人妻日韩精品| 欧美性大战久久| 91片黄在线观看喷潮| 欧美一区二区美女| 秋霞av鲁丝片一区二区| 日韩av在线网址| 男人天堂综合| 最近2019年好看中文字幕视频| av网站在线播放| 欧美巨乳在线观看| 91视频欧美| 欧美一级淫片丝袜脚交| 国产a亚洲精品| 成人免费视频网| 91综合精品国产丝袜长腿久久| 精品产品国产在线不卡| 国产一区二区三区日韩精品| 亚洲精品欧美精品| 欧美日韩免费观看一区=区三区| 久久看人人爽人人| 国产免费毛卡片| 日韩高清电影一区| 国产精品久久久久野外| 99久久精品国产毛片| 蜜桃av乱码一区二区三区| 亚洲男同性视频| 国产无遮挡又黄又爽又色| 一本色道久久综合精品竹菊| 亚洲一区 中文字幕| 精品精品国产高清a毛片牛牛| 婷婷在线免费视频| 在线成人中文字幕| 国产盗摄精品一区二区酒店| 日韩免费在线视频| 欧美经典影片视频网站| 久久国产精品高清| 婷婷亚洲综合| 一女被多男玩喷潮视频| 老司机精品视频一区二区三区| 丰满人妻一区二区三区53视频| 26uuu欧美| 免费国产羞羞网站美图| 香蕉久久一区二区不卡无毒影院| 进去里视频在线观看| 日韩精品一区国产麻豆| 国产免费永久在线观看| 欧美国产乱视频| 99久久伊人| 久久久免费看| 欧美三级第一页| 欧美三级理论片| 91毛片在线观看| 国产十六处破外女视频| 欧美综合在线视频| 韩国av在线免费观看| 色偷偷9999www| 中文字幕一区久| av免费观看久久| 久久久久久久久久久9不雅视频| 九色在线视频观看| 国产91精品一区二区麻豆网站 | 国产成人自拍一区| 综合国产在线视频| 英国三级经典在线观看| 2019国产精品视频| 日韩精品午夜| 欧美黄色一级片视频| aaa国产一区| 久草视频在线资源| 91精品国产色综合久久久蜜香臀| 国产资源在线看| 国产91精品久| 久久大胆人体视频| 青青青在线观看视频| 精品系列免费在线观看| 国产成人免费观看网站| 日韩欧美一区二区三区| 污视频网站免费观看| 美女av一区二区三区| av在线精品| 大地资源第二页在线观看高清版| 奇米精品一区二区三区在线观看 | 午夜精品中文字幕| 国产欧美日韩视频一区二区| 五月婷婷视频在线| 日韩精品久久久久久久玫瑰园| missav|免费高清av在线看| 99理论电影网| 狠狠入ady亚洲精品经典电影| 永久免费黄色片| 亚洲视频在线一区观看| 国产免费黄色片| 欧美区二区三区| 成人免费在线电影网| 国产亚洲黄色片| 波波电影院一区二区三区| 国产系列精品av| 日韩精品在线免费观看| 亚洲黄色免费看| 日韩和欧美的一区二区| 免费看欧美女人艹b| 老司机深夜福利网站| 欧美日韩国产精品自在自线| 日韩黄色影院| 999热视频| 日韩香蕉视频| 欧美成人午夜精品免费| 91久久精品日日躁夜夜躁欧美| 国产福利片在线| 亚洲精品女av网站| 狠狠色丁香久久综合频道| 日本一区二区免费视频| 欧美日韩国产中字| 国产在线观看网站| 国产日韩欧美在线视频观看| 亚洲一级淫片| 日韩免费高清一区二区| 色婷婷综合视频在线观看| 调教视频免费在线观看| 999热视频在线观看| 国产精品五区| 亚洲 欧美 国产 另类| 欧美成va人片在线观看| 咪咪网在线视频| 亚欧精品在线| 国产高清精品在线| 草久久免费视频| 精品国产一区二区三区久久久狼| 日韩免费精品| 久久9精品区-无套内射无码| 中文字幕一区二区三区色视频| 亚洲精品国产手机| 国产v综合v亚洲欧美久久| 国产精品毛片一区二区在线看| 老熟妇精品一区二区三区| 欧美三区在线观看| 久久av色综合| 亚洲成人精品电影在线观看| 国产成人无遮挡在线视频| 久久久久久不卡| 久久97精品久久久久久久不卡| 少妇一区二区三区| 国产资源中文字幕| 日本高清不卡视频| 蜜桃成人365av| 一区二区三区四区在线视频| 99久精品国产| 国产情侣自拍小视频| 日本午夜人人精品| 欧美激情性爽国产精品17p|