精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無損減少80%激活值內存,提升5倍訓練序列長度,僅需兩行代碼

人工智能 新聞
來自港中文(深圳)和上海交通大學的團隊提出?StreamBP?算法。通過對鏈式法則進行線性分解和分步計算,StreamBP 將大語言模型訓練所需的激活值內存(logits 和 layer activation)降低至梯度檢查點(gradient checkpointing)的 20% 左右。

本文的第一作者羅琪竣、第二作者李夢琦為香港中文大學(深圳)計算機科學博士生,本文在上海交通大學趙磊老師、香港中文大學(深圳)李肖老師的指導下完成。

長序列訓練對于模型的長序列推理等能力至關重要。隨著序列長度增加,訓練所需儲存的激活值快速增加,占據訓練的大部分內存。即便使用梯度檢查點(gradient checkpointing)方法,激活值依然占據大量內存,限制訓練所能使用的序列長度。

來自港中文(深圳)和上海交通大學的團隊提出 StreamBP 算法。通過對鏈式法則進行線性分解和分步計算,StreamBP 將大語言模型訓練所需的激活值內存(logits 和 layer activation)降低至梯度檢查點(gradient checkpointing)的 20% 左右。

圖片

  • 論文標題:StreamBP: Memory-Efficient Exact Backpropagation for Long Sequence Training of LLMs
  • 論文:https://arxiv.org/abs/2506.03077
  • 代碼:https://github.com/Ledzy/StreamBP

在相同內存限制下,StreamBP 最大序列長度為梯度檢查點的 2.8-5.5 倍。在相同序列長度下,StreamBP 的速度和梯度檢查點接近甚至更快。StreamBP 適用于 SFT、GRPO、PPO 和 DPO 等常見 LLM 目標函數。代碼已開源,可集成至現有訓練代碼。

激活值內存和梯度檢查點

在反向傳播(Backpropagation, BP)的過程中,計算模型梯度需要用到模型的中間輸出(激活值)。舉例來說,對于模型中的線性變換圖片的梯度為圖片,因而計算圖片的梯度時需要儲存相應的激活值圖片。

對于模型中的任意函數變換 圖片 的梯度由以下鏈式法則計算:

圖片

其中 L 為目標函數,圖片為 Jacobian 矩陣。為了計算以上 Jacobian-vector product,需要在模型 forward 時儲存函數變換圖片的中間值(激活值),其內存消耗與 batch size、序列長度以及中間值維度正相關。

為了減少激活值的內存消耗,梯度檢查點(gradient checkpointing)方法在 forward 時只儲存每一層網絡的輸入,而不儲存該層的中間值。在 backward 至該層時,將重新 forward 此層輸入來計算得到該層激活值。使用梯度檢查點時儲存的激活值包括:

  • 所有層的輸入,一般為激活值內存的 5%-15%。
  • 單層的完整激活值,占據超過 85% 的激活值內存。

StreamBP 的核心思想

不同于梯度檢查點,StreamBP 避免儲存單層的完整激活值,而將單層的 BP 過程進行線性分解,序列化計算并累加。注意到對于函數變換圖片,鏈式法則存在以下線性分解:

圖片

StreamBP 基于以下觀察:對于 LLM 中的大部分函數變換圖片,如 Transformer 層、lmhead 層,可通過策略性地將輸出分塊圖片,使得計算塊 Jacobian-vector product 圖片所需的激活值遠小于計算完整的 Jacobian-vector product?;谠撚^察,StreamBP 依次計算上式中 D 個塊的 Jacobian-vector product 并累加,得到準確的梯度。

為了計算塊 Jacobian-vector product,需要分析圖片輸入和輸出的相關性,每次 forward 塊輸入圖片 得到塊輸出圖片,建立對應子計算圖。以簡單的線性變換圖片 為例,輸出和輸入在行維度上一一對應。StreamBP 按行分塊,每次計算單行的 Jacobian-vector product 并累加。下圖對比了標準 BP 和 StreamBP 在上述線性變換下的實現:

圖片

D 步累加得到的圖片圖片即為圖片圖片準確梯度。相比于標準 BP,StreamBP 僅需儲存圖片圖片,且總計算 FLOPs 相同。下表為 StreamBP 和標準 BP 的內存和時間對比:

圖片

LLM 訓練中的 StreamBP

StreamBP 應用于 LLM 中的 Transformer 層和 lmhead 層,分別用于降低層激活值和 logits 的內存消耗。

與線性變換不同,由于 Transformer 層存在注意力機制,塊輸出圖片并非僅由對應位置的塊輸入圖片決定,而與該塊及以前所有位置的輸入圖片都有關。StreamBP 利用圖片只與塊圖片有關的性質,建立了如下計算圖:

圖片

StreamBP 所需儲存的激活值和注意力掩碼(橙色)大幅低于梯度檢查點(橙色 + 白色部分)。

對于 lmhead 層,當以 SFT 或 GRPO 為目標函數時,觀察到不同位置的 logits 對于目標函數的影響相互獨立。因此,StreamBP 從序列維度分塊,每次計算單塊損失函數的梯度,從而只需儲存單塊 logits 和 logits 梯度。

圖片

圖:StreamBP for SFT

圖片

圖:StreamBP for GRPO

對于 DPO,由于非線性 sigmoid 函數的存在,每個位置的 logits 對于目標函數的影響并不獨立。StreamBP 利用 logits 梯度在序列維度的獨立性,分塊進行梯度計算。

圖片

圖:StreamBP for DPO

實驗結果

我們在單張 A800-80GB GPU 上測試了不同大小的模型,StreamBP 的最大 BP 序列長度為標準 BP 的 23-36 倍,梯度檢查點的 2.5-5.5 倍。

圖片

圖:不同序列長度下的 BP 峰值內存

在現有 Transformers 框架下,StreamBP 的實現可避免計算掩碼部分的 pre-attention score(見論文 3.2.2 部分),在長序列訓練下相較于梯度檢查點實現了加速。

圖片

通過使用 StreamBP,不同目標函數下最大的序列長度得到了大幅提升。在同樣的序列長度下,StreamBP 允許更大的批處理大小以加速訓練。

圖片

表:Qwen 3-4B 單個樣本 BP 時間,序列長度為 9000。

在 Deepspeed ZeRO 分布式訓練模式下,Distributed StreamBP 比梯度檢查點的最大可訓練序列長度提升了5—5.6倍。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-11 08:54:00

2022-05-25 10:04:43

Go編程

2023-01-12 08:07:03

Python代碼版權

2020-07-22 08:30:02

代碼開發工具

2020-03-26 12:38:15

代碼節點數據

2024-11-27 14:30:00

模型訓練

2022-03-09 14:57:53

Numbapython

2023-09-12 14:58:00

Redis

2021-06-18 10:12:09

JS代碼前端

2025-05-15 13:40:13

數據訓練模型

2023-12-06 18:09:01

2025-06-18 10:05:26

2024-02-20 12:49:00

CSS函數前端

2017-02-28 15:35:09

OPPO

2022-06-07 08:07:05

GoNode.js

2024-04-03 12:32:00

數據訓練

2022-10-19 14:03:45

開源AI

2024-02-19 00:00:00

SQLite3數據庫代碼

2020-02-21 16:51:58

前端可視化傳染病

2022-09-25 23:10:53

Python數據集機器學習
點贊
收藏

51CTO技術棧公眾號

性欧美暴力猛交另类hd| 嫩草国产精品入口| 一区二区三区四区国产精品| 97自拍视频| 国产又爽又黄的视频| 18精品爽国产三级网站| xxx性欧美| 国产午夜精品一区二区三区嫩草| 91精品国产综合久久香蕉最新版| 青娱乐在线视频免费观看| 丝袜连裤袜欧美激情日韩| 欧美色精品天天在线观看视频| 大桥未久一区二区| 神马电影在线观看| 激情图片小说一区| 91精品国产91久久久| 日韩免费av一区| 久久九九热re6这里有精品| 欧美中文字幕亚洲一区二区va在线 | 精品亚洲成av人在线观看| 久久人人爽人人爽人人片av高请| 摸摸摸bbb毛毛毛片| 伊人久久噜噜噜躁狠狠躁| 在线精品视频小说1| 黄色激情在线视频| 免费黄色在线网站| 久久久国产精品不卡| 亚洲一区二区三区香蕉| 波多野结衣一区二区在线 | 精品国产欧美一区二区三区成人| 自拍视频一区二区| 国产精品亚洲四区在线观看| 欧美午夜电影在线| 免费人成自慰网站| 秋霞a级毛片在线看| 久久麻豆一区二区| 国产一区二区三区四区五区加勒比 | 日本性生活一级片| 精品欧美视频| 欧美日韩视频第一区| 亚洲中文字幕无码中文字| 国产亚av手机在线观看| 亚洲人成精品久久久久久| 四虎一区二区| 九色网友自拍视频手机在线| av欧美精品.com| 成人免费视频网站入口| 国产麻豆免费观看| 久久99最新地址| 国产精品视频999| 中文字幕视频在线播放| 蜜桃在线一区二区三区| 国产成人亚洲综合| 中文字幕在线播| 水野朝阳av一区二区三区| 欧洲美女7788成人免费视频| 国产尤物在线视频| 在线亚洲观看| 2018国产精品视频| 特黄视频免费看| 香蕉精品999视频一区二区| 欧美亚洲国产视频| 国产成人免费看| 久久只有精品| 国产精品欧美一区二区| 91女人18毛片水多国产| 国产一区二区剧情av在线| 91亚洲精品视频| 亚洲AV无码成人片在线观看| 成人三级伦理片| 久久99九九| 久色视频在线| 中文字幕一区免费在线观看| 只有这里有精品| 午夜在线激情影院| 亚洲精品第一国产综合野| 国产91porn| 少女频道在线观看高清 | 天天插天天射天天干| 日韩高清成人在线| 日韩国产高清污视频在线观看| 亚洲天堂av网站| 日韩人体视频| 亚洲男人天堂2023| 久久久久亚洲AV成人无在| 久久性感美女视频| 综合久久五月天| 久久久久久激情| 在线亚洲自拍| 国产精品成人一区二区三区吃奶| 国产精品久久久久久久久夜色| 日本不卡视频一二三区| 成人免费高清完整版在线观看| 97成人免费视频| 国产成人av一区二区三区在线| 国产精品福利视频| 国产中文字幕在线看| 国产精品人妖ts系列视频| 日韩xxxx视频| 怡红院成人在线| 777午夜精品视频在线播放| 下面一进一出好爽视频| 国产精品一区二区三区美女| 精品香蕉在线观看视频一| 国产无遮挡在线观看| 亚洲影视一区| 91精品国产色综合久久不卡98| 亚洲 欧美 日韩 综合| 久久国产夜色精品鲁鲁99| 亚洲最大的成人网| 视频三区在线观看| 椎名由奈av一区二区三区| 欧美精品久久久久久久自慰| 日本另类视频| 日韩欧美亚洲国产精品字幕久久久| 黄色网址在线视频| 日韩av自拍| 91精品国产高清久久久久久久久| 久久精品五月天| 国产大陆精品国产| 欧美午夜精品久久久久久蜜| 成人影院在线观看| 欧美性猛交xxxx乱大交极品| 亚洲精品无码久久久久久久| 蜜桃成人av| 欧美日韩成人在线观看| 日批视频免费观看| 成人午夜电影网站| 亚洲精品人成| 一区二区三区电影大全| 日韩欧美aaaaaa| 正在播放国产对白害羞| 国产九九精品| 超碰在线观看97| 毛片网站在线免费观看| 欧美性xxxxxx| 五月天丁香花婷婷| 色综合咪咪久久网| 欧美亚洲另类在线| 性猛交xxxx乱大交孕妇印度| 国产欧美日韩视频在线观看| 亚洲熟妇无码另类久久久| 免费观看亚洲视频大全| 国产亚洲人成a一在线v站| 免费在线不卡视频| 高清国产一区二区| 在线不卡日本| 国产精品xxx| 亚洲视频在线免费观看| 日本午夜小视频| 国产91综合网| 欧美一二三不卡| 国产精品成人3p一区二区三区| 一区二区三区日韩在线| 国产精品2020| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 一区二区视频在线免费观看| 久久久午夜精品理论片中文字幕| 黄色大片在线免费看| 豆花视频一区二区| 九九精品在线观看| 国产aⅴ一区二区三区| 国产精品盗摄一区二区三区| 国产精品拍拍拍| 成人av二区| 国产精品激情av电影在线观看| 福利视频在线播放| 欧美日韩一卡二卡三卡| 大胸美女被爆操| 久久er精品视频| 欧美日韩视频免费在线观看| 国产电影一区| 欧美精品中文字幕一区| 99精品视频在线播放免费| 中文字幕在线观看一区二区| 中日韩av在线播放| 久久理论电影| 91文字幕巨乱亚洲香蕉| 欧美精品videosex| 精品国产一区二区三区四区四| 免费看一级一片| 成人18视频在线播放| 北条麻妃69av| 精品国产一区一区二区三亚瑟 | 成人永久在线| 欧美精品videofree1080p| 婷婷av一区二区三区| 色综合天天综合给合国产| 久久丫精品忘忧草西安产品| 老司机精品视频在线| 日韩精品第1页| 国产精品一区二区中文字幕| 欧美在线性爱视频| 91社区在线高清| 在线观看成人免费视频| 999精品在线视频| 国产成人午夜精品影院观看视频| 久草免费福利在线| 夜色77av精品影院| 91精品久久久久| 羞羞的网站在线观看| 精品偷拍各种wc美女嘘嘘| 日韩欧美一级大片| 一区二区三区四区激情| 中文字幕在线看高清电影| 蜜臀av一级做a爰片久久| 欧美另类videosbestsex日本| 激情av综合| 国产精品一久久香蕉国产线看观看| 久cao在线| 国产一区二区三区日韩欧美| 国产视频第二页| 黑人巨大精品欧美一区二区一视频| 亚洲欧美va天堂人熟伦| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 欧美大片欧美激情性色a∨久久| 三区在线视频| 欧美日韩国产高清一区二区| 天天干天天色综合| 亚洲综合激情网| 中文天堂资源在线| 成人精品免费看| 视频在线观看免费高清| 亚洲青色在线| 亚洲人久久久| 美国十次av导航亚洲入口| 91久久大香伊蕉在人线| 在线国产成人影院| 欧美精品九九久久| 欧美午夜电影一区二区三区| 日韩精品在线视频| 99热这里只有精品1| 欧美三日本三级三级在线播放| 全网免费在线播放视频入口| 中文字幕亚洲电影| 久久久久久久久久久久| 成人av在线资源网| 亚洲视频一二三四| 日韩精品一级二级 | 国产在线视频欧美一区二区三区| www久久久| 国产精品久久97| 成年美女黄网站色大片不卡| 欧美极品少妇xxxxⅹ免费视频 | 欧美二区在线播放| 久热国产在线| 国产小视频国产精品| 图片区 小说区 区 亚洲五月| 欧美一级片在线| 92久久精品一区二区| 欧美午夜一区二区| 国产免费一级视频| 色综合欧美在线| 国产一级一片免费播放放a| 亚洲综合免费观看高清完整版在线 | 四虎永久国产精品| 国产精品xxxav免费视频| 国产精品对白一区二区三区| 青草伊人久久| 999国产在线| 色播一区二区| 国产精品久久久久久久久久直播 | 亚洲大尺度视频在线观看| 美国一级黄色录像| 国产精品国产三级国产专播品爱网 | 久草福利资源在线观看| 亚洲一区二区中文在线| 久久久久久久久久久网| 亚洲一区国产视频| 丁香六月婷婷综合| 色婷婷久久一区二区三区麻豆| 国产污污视频在线观看| 狠狠爱在线视频一区| 在线观看 中文字幕| 精品女厕一区二区三区| 黄色免费av网站| 色哟哟亚洲精品| 91亚洲视频在线观看| 宅男噜噜噜66一区二区66| 99久久精品国产色欲| 欧美精品一区二区三区蜜臀| 亚洲av成人精品一区二区三区在线播放 | 欧美一级做a| 91精品在线看| www999久久| 免费日韩电影在线观看| 国产一区二区精品福利地址| 杨幂一区欧美专区| 欧美日本免费| 欧美精品色婷婷五月综合| 日韩成人一区二区三区在线观看| 国产黄色特级片| 激情小说亚洲一区| 国产人妻精品午夜福利免费| 成人国产精品免费网站| 少妇真人直播免费视频| 国产精品乱人伦一区二区| 久久无码精品丰满人妻| 午夜久久久久久| 依依成人在线视频| 精品欧美一区二区在线观看| 日本精品专区| 久久国产天堂福利天堂| 天堂电影一区| 成人国产精品免费视频| xxxx日韩| 波多野结衣三级在线| 一区二区日韩免费看| 午夜免费看毛片| caoporen国产精品视频| 免费一级suv好看的国产网站| 亚洲电影第三页| 国产又粗又猛又黄视频| 亚洲福利在线观看| 婷婷免费在线视频| 97av在线视频| 国产精品一区二区三区www| 欧美精品国产精品久久久 | 电影亚洲精品噜噜在线观看| 亚洲综合色av| 成人中文视频| 精品久久久久久久久久中文字幕| 九一久久久久久| www.中文字幕av| 亚洲综合图片区| 91福利免费视频| 亚洲日韩欧美视频一区| 久草在线资源站资源站| 国产精品一久久香蕉国产线看观看| 黄色免费大全亚洲| 日韩视频在线观看视频| 久久国产一二区| 黄色国产在线视频| 亚洲一卡二卡三卡四卡五卡| 在线观看免费观看在线| 日韩高清免费观看| 在线视频中文字幕第一页| 国产精品女主播| 国产一区二区三区四区二区| 激情小视频网站| 国产成人精品aa毛片| 精品女人久久久| 色偷偷88欧美精品久久久| 人人妻人人澡人人爽人人欧美一区| 久久久久999| 欧美性生活一级| 亚洲在线欧美| 免费成人在线视频观看| 蜜桃av免费看| 五月婷婷激情综合网| 亚洲免费一级片| 欧美激情视频一区二区| 一区二区三区在线免费看| 国产精品av免费观看| 激情综合色播五月| www.com.av| 9191国产精品| 老司机午夜在线视频| 成人a视频在线观看| 无码一区二区三区视频| 在线一区二区不卡| 国产精品久久久久久久久果冻传媒 | 国产精品色哟哟网站| 中文字幕资源网| 久久精品国产亚洲精品2020| 日本欧美韩国| 成人在线观看www| 国产精品综合二区| 永久久久久久久| 欧美tickling网站挠脚心| 牛牛精品视频在线| 国产精品国产一区二区| 裸体一区二区| 国产成人免费观看网站| 欧美美女黄视频| 免费黄色网页在线观看| 亚洲影院色无极综合| 欧美 日韩 国产 一区| 中文字幕乱视频| 欧美日韩在线看| 精品视频一二三| 国产欧美日韩中文字幕| 亚洲精品二区三区| 91香蕉视频在线观看视频| 亚洲sss视频在线视频| 欧美婷婷久久五月精品三区| 国产成人精品在线观看| 日韩精品久久| 日韩精品――色哟哟| 一本久久a久久精品亚洲| 国产尤物视频在线| 91久久精品国产91久久性色| 好看的日韩av电影| 亚洲人成人无码网www国产| 91久久精品日日躁夜夜躁欧美| 精品麻豆一区二区三区| 国产伦视频一区二区三区| 日韩高清一级片| 欧美色图亚洲天堂| 日韩激情av在线免费观看|