精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節豆包大模型團隊突破殘差連接局限!預訓練收斂最快加速80%

人工智能 新聞
字節跳動豆包大模型團隊于近日提出超連接(Hyper-Connections),一種簡單有效的殘差連接替代方案。面向殘差連接的主要變體的局限問題,超連接可通過動態調整不同層之間的連接權重,解決梯度消失和表示崩潰(Representation Collapse)之間的權衡困境。在 Dense 模型和 MoE 模型預訓練中,超連接方案展示出顯著的性能提升效果,使收斂速度最高可加速 80%。

自從 ResNet 提出后,殘差連接已成為深度學習模型的基礎組成部分。其主要作用是 —— 緩解梯度消失問題,使得網絡的訓練更加穩定。

但是,現有殘差連接變體在梯度消失和表示崩潰之間存在一種 “蹺蹺板式” 的權衡,無法同時解決。

為此,字節豆包大模型 Foundation 團隊于近日提出超連接(Hyper-Connections),針對上述 “蹺蹺板式” 困境,實現了顯著提升。

該方法適用于大規模語言模型(LLMs)的預訓練,在面向 Dense 模型和 MoE 模型的實驗中,展示了顯著性能提升效果,使預訓練收斂速度最高可加速 80%。

圖片

研究團隊還發現,超連接在兩個小型的視覺任務中表現同樣優異,這表明,該方法在多個領域有廣泛的應用前景。

圖片

  • 論文標題:Hyper-Connections
  • 論文鏈接:https://arxiv.org/pdf/2409.19606

1. 超連接的核心思想

前文提及,殘差連接的兩種主要變體 Pre-Norm 和 Post-Norm 各自都有其局限性,具體體現如下:

  • Pre-Norm:在每個殘差塊之前進行歸一化操作,可有效減少梯度消失問題。然而,Pre-Norm 在較深網絡中容易導致表示崩潰,即深層隱藏表示過于相似,從而削弱了模型學習能力。
  • Post-Norm:在殘差塊之后進行歸一化操作,有助于減少表示崩潰問題,但也重新引入梯度消失問題。在 LLM 中,通常不會采用此方法。

超連接的核心思路在于 —— 引入可學習的深度連接(Depth-connections)和寬度連接(Width-connections)。

從理論上,這使得模型不僅能夠動態調整不同層之間的連接強度,甚至能重新排列網絡層次結構,彌補了殘差連接在梯度消失和表示崩潰(Representation Collapse)之間的權衡困境。

深度連接與寬度連接

起初,該方法會將網絡輸入擴展為 n 個隱向量(n 稱作 Expansion rate)。之后每一層的輸入都會是 n 個隱向量,超連接會對這些隱向量建立以下兩類連接:

  • 深度連接(Depth-Connections):這些連接類似于殘差連接,只為輸入與輸出之間的連接分配權重,允許網絡學習不同層之間的連接強度。
  • 寬度連接(Width-Connections):這些連接使得每一層多個隱藏向量之間可進行信息交換,從而提高模型表示能力。

靜態與動態超連接

超連接可以是靜態的,也可以是動態的。

其中,靜態超連接(Static Hyper-Connections, SHC)意味著連接權重在訓練結束后固定不變。而動態超連接(Dynamic Hyper-Connections, DHC)則對應連接權重可根據輸入動態調整。實驗表明,動態超連接效果更好。

2. 技術細節

超連接(Hyper-connections)

首先,考慮第 層的輸入隱藏向量圖片,網絡的初始輸入為圖片,并將其復制 n 次,形成初始的超隱藏矩陣(Hyper Hidden Matrix):

圖片

這里,n 稱為擴展率(Expansion Rate)。在第 k 層,輸入是上一層的超隱藏矩陣圖片,即:

圖片

對最后一層的超隱藏矩陣逐行求和,得到所需的隱藏向量,并通過一個投影層輸出網絡最終的結果(在 Transformer 中即為歸一化層和解嵌入層)。

為了簡化后續分析的符號表示,作者省略層索引,直接將超隱藏矩陣表示為:

圖片

超連接可以用一個矩陣來表示,對于擴展率為 n 的情況,超連接矩陣 HC 如下:

圖片

考慮一層網絡圖片,它可能是 Transformer 中的 attention 層或者是 FFN 層。超連接的輸出 圖片可以簡單地表示為:

圖片

也就是說,用 圖片作為權重對輸入 圖片進行加權求和,得到當前層的輸入圖片

圖片

同時,圖片用于將 圖片映射到殘差超隱藏矩陣圖片,表示如下:

圖片

最終的輸出表達式為:

圖片

偽代碼如下:

圖片

動態超連接的實現

超連接矩陣 圖片的元素可以動態依賴于輸入 圖片,動態超連接的矩陣表示為:

圖片

同樣,給定層 圖片和輸入圖片,可以得到動態超連接的輸出:

圖片

在實際操作中,團隊結合了靜態和動態矩陣來實現動態超連接,動態參數通過線性變換獲得。

為了穩定訓練過程,團隊在線性變換前引入歸一化,并在其后應用 tanh 激活函數,通過一個可學習的小因子進行縮放。動態參數的計算公式如下:

圖片

實驗表明,動態超連接在語言建模任務中優于靜態超連接。

3. 為什么使用超連接(Hyper-Connections)

研究團隊認為,殘差連接的兩種變體,即前歸一化(Pre-Norm)和后歸一化(Post-Norm),可以被視為不可訓練的超連接。

隨后,團隊引入了順序 - 并行二象性概念,展示了超連接如何動態優化層的排列以提升網絡性能。

殘差連接是不可訓練的超連接

前歸一化和后歸一化的殘差連接可以表示為以下擴展率為 圖片的超連接矩陣:

圖片

其中,圖片和 圖片 分別表示神經網絡層輸入和輸出的標準差,圖片表示它們之間的協方差。

對于 Pre-Norm,其超連接矩陣是一個 圖片的矩陣,右下三角部分填充為 1,其余部分為占位符 0。對于 Post-Norm,權重依賴于輸入和輸出的方差及協方差,形成一個 圖片的矩陣。因此,它們的超連接矩陣是不可訓練的。

而本工作提出的方法的超連接矩陣是 圖片矩陣,且權重是可訓練的,甚至可以基于輸入進行動態預測。

順序 - 并行二象性

給定一系列神經網絡模塊,我們可以將它們順序排列或并行排列。作者認為,超連接可以學習如何將這些層重新排列,形成順序和并行配置的混合。

圖片

在不失一般性的情況下,可以將擴展率設置為 n=2。如果超連接以如下矩陣形式學習,神經網絡將被順序排列:

圖片

在這種情況下,深度連接退化為殘差連接,如圖 (a) 所示。

當奇數層和偶數層的超連接矩陣分別定義為以下形式時,神經網絡每兩層將被并行排列,類似于 Transformer 中的 parallel transformer block 的排列方式,如圖 (b) 所示。

圖片

因此,通過學習不同形式的超連接矩陣,網絡層的排列可以超越傳統的順序和并行配置,形成軟混合甚至動態排列。對于靜態超連接,網絡中的層排列在訓練后保持固定;而對于動態超連接,排列可以根據每個輸入動態調整。

4. 實驗結果

實驗主要集中在大規模語言模型的預訓練上,涵蓋了 Dense 模型和 MoE 模型。

實驗結果表明,使用超連接的模型顯著優于使用殘差連接的模型。

1B Dense 模型實驗

圖片

只要擴展率 > 1,效果就十分顯著,且訓練更穩定,消掉了訓練 loss 的 spikes。

7B Dense 模型實驗

團隊甚至 Scale 到了 7B 模型,效果也十分亮眼,同時可以看到有超連接的網絡訓練更穩定。

7B 候選激活 1.3B 的 MoE 模型實驗

圖片

可以看到,下游指標全漲,在 ARC-Challenge 上甚至漲了 6 個百分點。

圖片

綜上,研究團隊介紹了超連接(Hyper-Connections),它解決了殘差連接在梯度消失和表示崩潰之間的權衡問題。實驗結果表明,超連接在大規模語言模型的預訓練以及視覺任務中都表現出顯著的性能提升。

值得注意的是,超連接的引入幾乎不增加額外的計算開銷或參數量,團隊認為,該成果具有廣泛的應用潛力,可以推廣到文音視圖模態的不同任務上,包括多模態理解、生成基座模型等。

5. 寫在最后

團隊關注底層問題,尤其在 LLMs 和多模態方面,期望實現更多突破。

更多團隊技術研究進展,可以進入「豆包大模型團隊」技術解讀欄目了解。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-29 11:56:10

AI模型

2025-04-29 09:10:00

2024-11-02 10:28:03

2024-08-08 17:48:56

2023-01-05 09:33:37

視覺模型訓練

2025-03-18 08:00:00

豆包文生圖技術Seedream

2025-11-04 16:02:42

模型訓練AI

2024-05-15 10:59:40

火山引擎豆包扣子

2025-05-26 09:00:00

2025-08-24 09:24:07

2024-11-08 14:10:00

模型視頻生成

2025-11-05 08:53:45

語言模型訓練AI

2024-11-04 00:24:56

2025-06-19 10:09:55

2025-08-13 01:00:00

2024-11-01 20:25:28

2023-07-18 15:05:00

開源大模型

2024-10-23 08:24:13

2025-06-11 17:31:28

點贊
收藏

51CTO技術棧公眾號

a天堂中文字幕| 亚洲激情图片一区| 色偷偷成人一区二区三区91| 国产精品亚洲一区二区三区| 久久久高清视频| 在线观看精品一区二区三区| 视频免费一区二区| 免费不卡在线视频| 亚洲国产欧美一区| 男女激烈动态图| 中文字幕一区二区三区四区免费看 | 99国产在线播放| 精品久久久久久久| 一区二区成人在线视频| 精品国产一区二区精华| 亚欧精品在线| 国产精品777777| 97色成人综合网站| 亚洲精品日产精品乱码不卡| 国产精品高潮粉嫩av| 中国黄色a级片| 国产剧情av在线播放| 成人午夜视频网站| 欧美精品精品精品精品免费| 精品国产一二区| 国模私拍视频在线播放| 国产成人在线视频播放| 欧美成人一区二区三区电影| 亚洲 国产 图片| 色多多视频在线观看| 欧美96一区二区免费视频| 欧美国产亚洲精品久久久8v| 无码人妻丰满熟妇啪啪网站| www中文字幕在线观看| 国产精品网站一区| 国产一区二区在线播放| 久久久久亚洲AV成人无在 | 香蕉久久夜色精品国产更新时间| 亚洲大尺度视频在线观看| 国产免费一区二区三区| 日韩 欧美 精品| 亚洲另类av| 欧美日韩综合色| 免费成人深夜夜行网站视频| 你懂的在线看| 精品写真视频在线观看| 九九久久综合网站| 亚洲最大的黄色网| av激情成人网| 亚洲靠逼com| 亚洲永久一区二区三区在线| 国产精品久久久久久在线| 亚洲综合色站| 亚洲高清久久网| 国产一区视频免费观看| 免费在线观看黄色| 大白屁股一区二区视频| 91精品国产99久久久久久红楼| 精品少妇久久久久久888优播| 日韩欧美黄色| 亚洲精品美女在线| 欧美日韩一区二区三区69堂| 肉体视频在线| 久久免费视频一区| 91影视免费在线观看| 亚洲激情视频一区| 99精品免费视频| 丝袜亚洲欧美日韩综合| 日韩成人av影院| 6080成人| 欧美酷刑日本凌虐凌虐| 黄色片网址在线观看| 91电影在线播放| 国产精品久久久久久久久晋中| 国产中文一区二区| 日本啊v在线| 国产精品中文欧美| 国产成人一区二区在线| 久草福利资源在线观看| 成人久久综合| 亚洲国产精品人久久电影| 网站免费在线观看| 欧美日韩伦理在线免费| 色偷偷88888欧美精品久久久| 日韩一卡二卡在线观看| 亚洲三级网址| 色久欧美在线视频观看| 国产黄色片在线免费观看| 欧洲杯半决赛直播| 日韩在线观看视频免费| 青青草原在线免费观看| 国产日韩高清一区二区三区在线| 久久精品国产综合| 亚洲综合欧美综合| 婷婷综合一区| 主播福利视频一区| 久久久久久九九九九九| 高潮按摩久久久久久av免费| 欧洲一区二区三区在线| 欧美,日韩,国产在线| 3d欧美精品动漫xxxx无尽| 午夜精品久久久久久久| 91国在线高清视频| 国产美女在线观看| 亚洲欧美影音先锋| 中文字幕一区二区三区乱码| av在线第一页| 国产精品美女久久久久久久| 日韩欧美在线电影| 可以在线观看的av网站| 中文字幕一区二| 日韩在线视频在线观看| 欧美一级鲁丝片| 欧美日韩免费看| 一本大道熟女人妻中文字幕在线| 久久日本片精品aaaaa国产| 欧美系列亚洲系列| 另类小说第一页| 少妇一区视频| 精品日韩欧美在线| 亚洲视频 中文字幕| 色狮一区二区三区四区视频| 日韩中文视频免费在线观看| 黄色一级片免费看| 欧美在线综合| 日韩免费中文字幕| 日韩中文字幕高清| 美女视频黄免费的久久| 久久精品人人做人人爽电影| 五十路在线观看| 久久人人爽人人爽| 国产欧美123| 精品国产一区二区三区2021| 日韩一区二区三区高清免费看看| 男人的天堂免费| 久久五月天小说| 久久99视频免费| 一区二区日韩在线观看| 国产在线精品一区二区夜色| 亚洲在线观看视频网站| 亚洲国产精品久久久久久久| 99在线热播精品免费| 欧美久久久久久一卡四| 91免费在线| 色香色香欲天天天影视综合网| 在线观看av中文字幕| 在线日韩欧美| 国产精品久久电影观看| 日本在线视频1区| 精品日本美女福利在线观看| 在线观看亚洲免费视频| 亚洲国产高清一区二区三区| 国产女人水真多18毛片18精品 | 羞羞色国产精品| 免费日韩一级片| 北岛玲一区二区三区四区| 日韩精品视频在线观看视频| 激情黄产视频在线免费观看| 日韩精品一区二| 久久视频精品在线观看| 久久久久久一区二区| 欧美一级二级三级九九九| 日本在线观看www| 欧美日韩精品欧美日韩精品一 | 红杏成人性视频免费看| 亚洲欧洲黄色网| 欧美黑人性猛交xxx| 亚洲综合国产| 97在线中文字幕| 啪啪免费视频一区| 欧美三级中文字幕| 综合 欧美 亚洲日本| 日韩午夜黄色| 欧美人与物videos另类| 国精产品一区一区三区四川| 日韩在线小视频| 精品久久无码中文字幕| 日本一二三四高清不卡| 在线黄色免费看| 欧美视频一区| 亚洲japanese制服美女| 日韩激情av| 亚洲精品一区二三区不卡| 欧美精品久久久久性色| www.成人网.com| 午夜dv内射一区二区| 清纯唯美亚洲经典中文字幕| 久久91精品国产91久久跳| 日本黄视频在线观看| 一区二区在线看| 一级性生活大片| 亚洲激情影院| 亚欧洲精品在线视频免费观看| 成人噜噜噜噜| 中日韩美女免费视频网址在线观看| 国产又粗又猛又爽又黄的| 亚洲aⅴ怡春院| chinese全程对白| 日本亚洲一区二区| 欧美精品一区二区三区四区五区 | 亚洲综合av影视| 亚洲小少妇裸体bbw| 亚洲福利精品在线| 中文字幕在线2018| 亚欧色一区w666天堂| 手机看片国产日韩| 91亚洲精品一区二区乱码| 久久精品国产sm调教网站演员| 国产一区二区欧美| 国产成人亚洲综合青青| 91麻豆一二三四在线| 欧美精品aⅴ在线视频| 亚洲精品午夜久久久久久久| 国产精品二区一区二区aⅴ污介绍| 男男做爰猛烈叫床爽爽小说| 精品一区二区三区欧美| 亚洲精品高清视频| 日韩国产大片| 日韩在线观看免费网站| 亚洲日本在线播放| 欧美变态tickle挠乳网站| 中文字幕av影视| 欧美午夜精品在线| 亚洲黄色在线网站| 国产成人精品网址| 网站在线你懂的| 国语自产精品视频在线看8查询8| 国产99在线播放| 在线观看v片| 久久免费视频在线观看| 香蕉视频911| 日韩欧美第一区| 国产日韩精品suv| 欧美精品在欧美一区二区少妇| 国产一区二区视频网站| 成人欧美一区二区三区1314| 中字幕一区二区三区乱码| 91片在线免费观看| 天天爽夜夜爽一区二区三区| 亚洲色图欧美| 黄频视频在线观看| 久久影院资源站| 国产精品香蕉视屏| 欧美free嫩15| 国产精品伦子伦免费视频| 中国av在线播放| 久久影视免费观看 | 亚洲天堂av在线播放| 日本在线丨区| 国产一区二区久久精品| 999精品国产| 欧美一区二区美女| 欧美黑人一区二区| 91福利在线观看| 久久久久久久久99| 亚洲一二三区在线观看| 黄色av免费播放| 国产精品盗摄一区二区三区| 蜜桃av免费在线观看| 日韩美女视频一区| 激情五月婷婷在线| 亚洲第一综合色| 天码人妻一区二区三区在线看| 国产精品视频yy9299一区| 美国精品一区二区| 亚洲综合色噜噜狠狠| 国产无码精品一区二区| 国产精品的网站| 精国产品一区二区三区a片| 亚洲无线码一区二区三区| 国产无人区码熟妇毛片多| 一区二区三区小说| 日韩欧美视频在线免费观看| 一本色道亚洲精品aⅴ| 伊人亚洲综合网| 日韩免费视频一区| 四虎影院在线域名免费观看| 日韩一区二区三区电影在线观看| 国产黄色av网站| 欧美卡1卡2卡| 丁香花免费高清完整在线播放| 欧美三级中文字| 精品国自产在线观看| 亚洲欧美精品中文字幕在线| 国内老熟妇对白xxxxhd| 亚洲精品国产综合久久| av资源种子在线观看| 欧美激情免费在线| 欧美xxx视频| 日本sm极度另类视频| 黄在线观看免费网站ktv| 国产欧美日韩精品丝袜高跟鞋| 91国内精品| 亚洲电影免费| 亚洲福利专区| 婷婷无套内射影院| 国精品一区二区三区| 国产成人无码av在线播放dvd| 国产主播一区二区| 青青草福利视频| 亚洲综合免费观看高清完整版| 黄色片视频免费| 精品国产乱码久久久久久夜甘婷婷| 极品美乳网红视频免费在线观看| 日韩精品高清视频| h片在线免费观看| 欧美精品在线极品| 欧美精选视频一区二区| 国产精品高清一区二区三区| 日韩欧美中字| 欧美性大战久久久久xxx| 国产伦精品一区二区三区视频青涩 | 中文字幕 视频一区| 日韩第一页在线| 欧美aaaaaaa| 成人淫片在线看| 午夜久久av| 亚洲精品成人a8198a| 久久精品一区| 国产成人无码一区二区在线观看| 亚洲另类一区二区| 91禁在线观看| 中文字幕在线看视频国产欧美在线看完整 | 欧美天堂亚洲电影院在线播放| 日韩中文字幕影院| 精品国产1区2区3区| 黄色网在线免费观看| 国产成人亚洲综合91| 中文字幕伦av一区二区邻居| www.日本在线播放| 懂色av一区二区三区免费看| 日韩片在线观看| 亚洲va欧美va国产va天堂影院| 午夜精品一二三区| 久久国产色av| 久久国际精品| 大陆极品少妇内射aaaaaa| 国内外成人在线| 顶臀精品视频www| 91精品国产综合久久久久久| 麻豆传媒视频在线观看| 成人黄色激情网| 一区二区三区午夜视频| 8x8x成人免费视频| 日韩毛片精品高清免费| 99久久国产免费| 欧美黑人又粗大| 操欧美女人视频| 男人天堂网视频| 国产一区 二区 三区一级| 999精品在线视频| 欧美一卡二卡三卡四卡| 青草在线视频在线观看| 国产精品一区二区不卡视频| 亚洲精品人人| 免费看污片网站| 欧美人妇做爰xxxⅹ性高电影 | 精品国自产在线观看| 欧美激情奇米色| 色橹橹欧美在线观看视频高清| 欧美 激情 在线| 国产精品视频第一区| 国产乱淫a∨片免费观看| 欧美激情乱人伦| 日韩精品福利一区二区三区| 免费av网址在线| 国产精品成人网| www.黄色国产| 啪一啪鲁一鲁2019在线视频| 欧美亚洲高清| 亚洲成人福利视频| 欧美色另类天堂2015| av黄色在线观看| 成人精品一二区| 欧美1级片网站| 麻豆av免费看| 色欧美日韩亚洲| 国产原厂视频在线观看| 国模精品娜娜一二三区| 日韩成人一区二区| 欧美 日本 国产| 精品视频1区2区3区| 亚洲wwwww| 欧美亚洲国产免费| 国产乱淫av一区二区三区| 日韩精品一区二区不卡| 影音先锋欧美精品| 亚洲天堂av影院| 国产精品我不卡| 免费高清在线一区| 精品在线视频观看| 中文字幕免费精品一区高清| 亚洲视频精选| wwwwxxxx日韩| 午夜视频一区二区| 欧美a免费在线| 欧美一区激情视频在线观看| 高清不卡一区二区| 中文字幕一二三四| 国产69精品久久久久久|