精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比知識蒸餾好用,田淵棟等提出連續概念混合,再度革新Transformer預訓練框架

人工智能 新聞
來自 Meta 等機構的研究者提出了一種新穎且高效的預訓練框架:連續概念混合(Continuous Concept Mixing, CoCoMix),其將離散的下一個 token 預測與連續概念相結合。

近年來,大型語言模型(LLMs)的進展徹底改變了自然語言處理領域,并因此成為各種現實應用中的核心技術,例如代碼助手、搜索引擎和個人 AI 助手。

這些突破的核心在于對「下一個 token 預測」的范式。

然而,自然語言 token 代表的意思通常是表層的(例如 the 或 a 這樣的功能性詞匯),需要模型進行大量訓練才能獲得高級推理和對概念的理解能力,同時也限制了它們處理長期任務(如規劃)的能力。

為了解決這一問題,最近的研究探索了超越 token 層面信號的方法。例如有研究表明稀疏自編碼器(Sparse Autoencoders, SAEs)能夠通過捕捉高級語義概念,有效地分離出大型語言模型(LLMs)中有意義的潛在特征。

本文,來自 Meta 等機構的研究者提出了一種新穎且高效的預訓練框架:連續概念混合(Continuous Concept Mixing, CoCoMix),其將離散的下一個 token 預測與連續概念相結合

CoCoMix 用來預測從預訓練的稀疏自編碼器中學習到的連續概念,并通過與 token 隱藏表示交錯的方式將其混合到模型的隱藏狀態中。

具體來說,本文使用經過預訓練的 SAE 提取語義概念,并根據歸因(attribution)分數選擇最具影響力的概念,這些分數量化了每個概念對模型輸出的影響。然后,模型通過交叉熵損失訓練,從其隱藏狀態中預測這些選定的概念。一旦預測出多個概念,就將它們壓縮為單個連續概念,并通過與 token 嵌入交錯的方式混合(或插入)到隱藏狀態中,從而直接貢獻于下一個 token 的預測。

本文通過在多個語言建模基準和不同規模的預訓練模型(從百萬級到十億級參數規模)上進行了評估,從而證明了 CoCoMix 的有效性。

結果表明,CoCoMix 采樣效率更高,優于標準的下一個 token 預測、知識蒸餾以及插入停頓 token。本文發現,在端到端的框架中結合概念學習和交錯技術對于性能提升至關重要。

CoCoMix 性能有多好?舉例來說,當將 CoCoMix 應用于一個 1.38B 規模的模型時,CoCoMix 在減少 21.5% 訓練 token 的情況下,實現了與下一個 token 預測相當的性能。

此外,CoCoMix 在弱監督到強監督的場景中表現出顯著改進,其中從小模型中提取的概念甚至可以用作監督更大模型訓練的標簽。

圖片

  • 論文標題:LLM Pretraining with Continuous Concepts
  • 論文地址:https://arxiv.org/pdf/2502.08524
  • 項目地址:https://github.com/facebookresearch/RAM/tree/main/projects/cocomix

此前,Meta 提出了大型概念模型(LCM),同樣也是通過概念而非 token 進行學習和推理,被許多聲音認為是大模型范式變革的新起點?,F在看來,CoCoMix 出現,讓 Meta 在創新算法逐步取代「連續預測下一個 token」這條道路上又邁出了重要的一步。

CoCoMix 介紹

CoCoMix 是一個使用連續概念擴展下一個 token 預測的框架。

其核心訓練流程包括:一個概念選擇框架(參見圖 1 左),以及兩個用于學習和利用連續概念的訓練步驟(step)(參見圖 1 右)。

  • 首先,本文使用歸因分數選擇重要概念,該分數衡量了每個概念對輸出的影響。
  • 然后,本文提出通過交叉熵損失從模型的隱藏狀態中預測選定的概念,使模型能夠隱式地學習哪些概念應被編碼為隱藏表示。
  • 最后,本文利用預測的概念創建一個連續概念,并將其交錯插入到隱藏狀態中,使模型能夠顯式地學習如何使用連續概念以及 token 隱藏狀態。直觀上,模型選擇性地學習哪些概念對下一個 token 預測有用,以及如何將這些概念與 token 表示混合。


圖片

實驗

實驗部分,研究者主要通過以下幾個問題對 CoCoMix 進行了實證評估: 

  • CoCoMix 能否提高 LLM 預訓練中下一個 token 預測的性能?(圖 2 和圖 3) 
  • 與其他知識提煉方法相比,CoCoMix 在弱到強監督設置中是否有所改進?(表 1 和圖 4) 
  • CoCoMix 是否引入了模型的可解釋性和可操縱性?(圖 5) 
  • CoCoMix 的每個建議組件對性能有何貢獻?(圖 6) 

首先是兩個核心結果:

  1. 在相對大規模的預訓練設置中與 NTP 的比較;
  2. 與 KD 基線的比較,尤其是在從小模型中提取的概念用于指導大模型的弱到強監督場景中。

大規模使用 CoCoMix 改進 NTP

如圖 3 所示,CoCoMix 在各種規模的模型上都能持續顯著提高下游任務的整體性能。結果還表明,較大的模型(如 386M 和 1.38B)可以從使用從較小的 124M 模型中提取的概念中獲益,顯示了有效的弱到強監督。

圖片

如圖 2 所示,在十億級規模的模型上,CoCoMix 與 NTP 相比持續提高了性能。例如,CoCoMix 的性能與 NTP 相近,但使用的 token 卻減少了 21.5%,顯示了很高的采樣效率。最后,值得注意的是,使用 CoCoMix 所獲得的性能增益隨著訓練步驟的增加而增加,顯示出很強的泛化性能。

圖片

與 KD 基線的比較

研究者還將 CoCoMix 與 KD 基線在多種情況下進行了比較,包括:

  1. 較強的教師模型教授較小的學生模型;
  2. 弱到強的監督,即較弱的教師教授較大的學生模型;
  3. 分布轉移,即學生在不同于教師預訓練分布的語料庫上接受訓練。

如表 1 所示,在這些模型配置中,CoCoMix 都比 KD 有所改進。特別是,CoCoMix 在從弱到強的監督設置中表現出了顯著的性能提升,例如在 386M 中平均復雜度提高了 2.8,而 KD 并沒有表現出很大的改進。這是因為較弱的教師可能會引入噪聲或次優知識,尤其是當學生的能力超過教師時。

圖片

在圖 4 中也可以觀察到這一趨勢,當學生的能力超過教師時(尤其是在分布轉移場景中),使用 KD 訓練的模型在訓練中途會落后于標準訓練。相比之下,CoCoMix 選擇性地利用了有用的概念,從而實現了持續的性能提升。

圖片

CoCoMix 的可解釋性和可操縱性

CoCoMix 的另一個核心優勢在于其可解釋性和模型操縱。具體來說,由于模型經過訓練后可以預測其隱藏狀態中的概念,因此研究者可以根據概念預測結果來分析其重點關注的概念。此外,通過放大預測概念 z_t 的大小,可以控制模型的輸出生成。

為了驗證可操縱性是否達到預期效果,研究者在預訓練模型的 SAE 潛在空間 c 中對同一概念的激活進行操縱,并確認輸出是否表現出相應的概念。這里使用的是用 CoCoMix 訓練的 386M 參數模型,其中預訓練模型為 GPT-2。

如圖 5 所示,當與「網站地址」相關的概念被放大時,兩個模型都開始生成實際的網站地址。這表明本文模型成功地學習了 GPT-2 對齊概念。

圖片

CoCoMix 有效性分析

隨后,研究者對 CoCoMix 進行了詳細分析,以驗證每個提出的組件的效果。角度如下:

  1. 歸因分數對選擇概念的有效性;
  2. 概念預測與直接隱藏狀態預測(即用連續損失預測隱藏狀態,而不是用 SAE 將隱藏狀態離散化)之間的比較;
  3. 壓縮權重的稀疏性;
  4. 通過分析概念預測和混合的貢獻進行成分分析;
  5. 通過比較將概念向量添加到原始隱藏狀態和混合(將概念向量與 token 隱藏表示交錯),對概念調節進行設計選擇;
  6. CoCoMix 與 Pause token(即添加可學習 token)之間的比較。

此處,研究者使用了 69M Transformer,并在 OpenWebText 數據集中的 20B token 上進行訓練。

更多研究細節,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-26 00:20:00

AI模型

2024-12-19 09:48:07

2025-10-08 10:19:29

2025-03-03 09:16:00

Meta模型預測

2024-03-08 12:35:41

模型數據

2023-06-12 09:57:22

AIChatGPT

2021-12-06 09:53:09

自然語言神經網絡人工智能

2024-12-12 09:00:00

2025-06-20 08:47:00

量子計算AI模型

2023-03-17 08:28:17

GPT-4AI

2022-11-02 14:02:02

強化學習訓練

2024-10-16 13:50:00

模型AI

2024-10-28 08:50:00

2025-03-25 09:12:00

LIMAI模型

2021-11-15 10:00:22

模型人工智能NLP

2020-09-22 09:54:19

谷歌Android開發者

2025-10-23 12:28:40

2023-12-07 06:51:18

AI模型

2024-02-27 11:46:40

2024-09-20 15:35:33

點贊
收藏

51CTO技術棧公眾號

手机免费av片| 亚洲精品乱码视频| 国产三级av片| 日本在线电影一区二区三区| 欧美一区二区福利视频| www..com日韩| 99se视频在线观看| 国产成人福利片| 青青草原一区二区| 日本一二三区在线观看| 欧美亚洲国产日韩| 91精品国产欧美一区二区| 欧美v在线观看| 精品自拍一区| 久久久国产精品午夜一区ai换脸| 国产免费一区二区三区在线能观看| 小泽玛利亚一区| 亚洲国产精品嫩草影院久久av| 6080国产精品一区二区| 女人喷潮完整视频| 综合久久2019| 国产精品丝袜在线| 精品久久久久久中文字幕动漫| 亚洲特级黄色片| 亚洲福利国产| 久久精品国产视频| 免费看91的网站| 欧美日韩精品一区二区三区在线观看| 91 com成人网| 少妇一级淫免费放| 成人性教育av免费网址| 亚洲成人av电影在线| 最新欧美日韩亚洲| 成年人视频免费在线观看| 99久免费精品视频在线观看 | 九九热在线免费观看| 欧美aⅴ99久久黑人专区| 色狠狠av一区二区三区香蕉蜜桃| 精品人妻无码一区二区三区| 1204国产成人精品视频| 91精品国产综合久久精品app| 亚洲精品一二三四五区| 少妇淫片在线影院| 欧美日韩国产精品一区二区不卡中文 | 国产精品久久久久久久久快鸭 | 成人午夜电影在线播放| 国产精品一品二区三区的使用体验| 久久最新视频| 国产91精品网站| 一级黄色av片| 日本美女一区二区| 国产精品久久久| 欧美三级网站在线观看| 日韩激情在线观看| 国产精品视频久久久久| 中日精品一色哟哟| 美女国产一区二区三区| 国产精品视频一区国模私拍| 中日韩在线观看视频| 美女视频黄久久| 成人av资源在线播放| 97超视频在线观看| 国产一区不卡视频| 国产高清一区二区三区| 日日夜夜精品免费| 91蜜桃在线免费视频| 欧美日韩大片一区二区三区| 福利在线播放| 成人欧美一区二区三区黑人麻豆| 欧美日韩在线免费观看视频| 91蜜桃在线视频| 亚洲超丰满肉感bbw| 国产精品va无码一区二区| 伊伊综合在线| 欧美日韩在线免费视频| caoporm在线视频| 亚洲精品一二三**| 国产视频精品久久久| 欧美大波大乳巨大乳| 亚洲啊v在线观看| 久久久久久av| 日韩久久中文字幕| 久久国产麻豆精品| 91手机在线播放| 污污网站免费在线观看| 中文在线资源观看网站视频免费不卡| 一区二区三区偷拍| 91破解版在线观看| 欧美综合亚洲图片综合区| 九九九九九伊人| 欧美男人操女人视频| 中文字幕日韩专区| 久久久无码精品亚洲国产| 亚洲综合激情| 91沈先生在线观看| 瑟瑟在线观看| ...xxx性欧美| 99色精品视频| www999久久| 亚洲理论在线a中文字幕| 999福利视频| 亚洲免费网址| 91九色在线免费视频| 色哟哟在线观看| 亚洲美女偷拍久久| 国产精品人人妻人人爽人人牛| 久久爱www.| 国产亚洲成av人片在线观看桃| 久久久久99精品成人片毛片| 日本中文在线一区| 精品国产免费久久久久久尖叫 | 欧美亚洲视频在线观看| jlzzjlzz亚洲女人18| 久久久久久久免费视频了| 高清无码一区二区在线观看吞精| 一二区成人影院电影网| 亚洲精品一区二区三区福利 | 亚洲熟妇一区二区| 第一会所sis001亚洲| 97热精品视频官网| 国产男男gay体育生白袜| 国产视频一区在线观看| 成熟丰满熟妇高潮xxxxx视频| 91精品一区| 在线日韩精品视频| 6080午夜伦理| 95精品视频在线| 免费高清一区二区三区| 999色成人| 日韩中文字幕视频在线| 懂色av中文字幕| 久久久久青草大香线综合精品| 免费拍拍拍网站| 精品一区二区三区视频在线播放| 在线视频欧美性高潮| 国产美女www| 久久九九久久九九| av网站在线观看不卡| 久久精品色综合| 久久久亚洲网站| 亚洲精品人妻无码| 亚洲免费高清视频在线| 国产精品嫩草影院8vv8| 久久一区二区中文字幕| 国产精品永久免费观看| 2019中文字幕在线视频| 欧美亚洲精品一区| 手机免费观看av| 捆绑调教美女网站视频一区| 亚洲成人av动漫| 国产亚洲精彩久久| 久久九九亚洲综合| 国产日韩欧美一区二区东京热| 中文字幕在线一区免费| 91pony九色| 欧美喷水视频| 国产一区在线观| 麻豆免费版在线观看| 亚洲精品天天看| 午夜一级黄色片| 中文字幕一区二区三区视频| 日韩欧美中文视频| 伊人久久亚洲影院| 久久riav二区三区| 欧美日韩成人影院| 中文字幕在线国产精品| 一级做a爱片性色毛片| 亚洲美女少妇撒尿| 免费黄色三级网站| 久色成人在线| 国产免费色视频| 成人免费在线电影网| 日本成人在线视频网址| 色大18成网站www在线观看| 日韩一区二区三| 国产成人亚洲欧洲在线| 国产日产亚洲精品系列| 午夜免费福利网站| 日韩亚洲在线| 视频一区三区| 视频一区在线| 国产成人精品视频在线| www.久久久久.com| 精品伊人久久97| 91中文字幕在线视频| 亚洲国产aⅴ天堂久久| 五月天精品视频| 国产福利91精品一区二区三区| 国内性生活视频| 一区二区蜜桃| 欧美一级片免费观看| 电影91久久久| 日本精品久久久| 老司机在线永久免费观看| 精品国产91洋老外米糕| 最近日韩免费视频| 亚洲综合视频在线| 91l九色lporny| 成人午夜精品一区二区三区| 男女男精品视频站| 日韩一级在线| 中国黄色录像片| 国产一区网站| 国产亚洲一区二区三区在线播放| 激情中国色综合| 欧美一区二区三区四区在线| 最爽无遮挡行房视频在线| 国产亚洲精品日韩| 天天干天天舔天天射| 欧美一区二区在线不卡| 瑟瑟视频在线免费观看| 精品日韩中文字幕| 国产一级免费av| 亚洲视频在线一区二区| 免费看黄色av| 久久久久久久久免费| 午夜剧场免费看| 国产一区在线观看麻豆| 爱情岛论坛成人| 亚洲欧美激情诱惑| av片在线免费| 欧美在线播放| 亚洲第一页在线视频| 久久久综合色| 天天好比中文综合网| 免费观看久久av| 久久精品综合一区| 麻豆一区一区三区四区| 成人久久18免费网站漫画| japansex久久高清精品| 91精品久久久久久| 日本综合视频| 国产成人涩涩涩视频在线观看| 午夜久久中文| 91高潮精品免费porn| 极品av在线| 69精品小视频| 水蜜桃在线视频| 欧美一级淫片丝袜脚交| 妞干网免费在线视频| 午夜欧美不卡精品aaaaa| aaa在线播放视频| 国内外成人免费激情在线视频网站| 欧美hdxxxx| 欧美激情图片区| xxxx成人| 欧美性资源免费| 日韩在线影院| 国产精品私拍pans大尺度在线| 素人啪啪色综合| 国产精品嫩草视频| 亚洲精品无播放器在线播放| 91精品视频一区| 欧美成年网站| 国产精品白丝jk白祙| 久久久久97| 日本一区二区三区视频在线观看 | 欧美三级午夜理伦三级在线观看 | 国产吃瓜黑料一区二区| 福利一区福利二区| yy1111111| 国产香蕉久久精品综合网| 欧美老女人性生活视频| 国产精品不卡视频| 青娱乐国产精品| 午夜精品一区二区三区免费视频 | 日韩视频永久免费| 天天色棕合合合合合合合| 亚洲美女黄色片| 五月天婷婷在线视频| 久久99亚洲热视| 深夜成人在线| 成人激情视频在线播放| h视频久久久| 欧美lavv| 无码一区二区三区视频| 被灌满精子的波多野结衣| 久久天堂成人| 国产黑丝在线视频| 2017欧美狠狠色| 侵犯稚嫩小箩莉h文系列小说| 亚洲一区二区三区在线播放| av图片在线观看| 欧美一区二区三区的| 日本1级在线| 成年人精品视频| 在线观看福利电影| 成人女保姆的销魂服务| 亚洲欧洲色图| 椎名由奈jux491在线播放| 亚洲精品美女91| 欧美在线aaa| 99精品视频中文字幕| 欧美一区二区三区粗大| 亚洲国产精品人人做人人爽| 最好看的日本字幕mv视频大全| 精品少妇一区二区三区免费观看 | 亚洲一卡二卡三卡四卡五卡| 久久久久久久亚洲| 亚洲国产91精品在线观看| 日本中文字幕在线视频| 57pao成人国产永久免费| 3d动漫一区二区三区在线观看| 久久手机视频| 欧美午夜国产| 做a视频在线观看| 国产日韩欧美电影| 日本网站在线播放| 日韩一区二区三区视频在线观看| 国产福利在线看| 97av在线视频免费播放| 欧美影院在线| 一区不卡视频| 日韩精品1区2区3区| av无码av天天av天天爽| 一个色妞综合视频在线观看| 91极品身材尤物theporn| 亚洲精品美女久久久久| 日韩专区av| 91久久精品美女高潮| 欧美一级本道电影免费专区| 日本成年人网址| 99热精品一区二区| 国产真人真事毛片| 91麻豆精品国产91久久久使用方法 | 男男受被啪到高潮自述| 国产精品久久久久天堂| 中文字幕免费高清网站| 亚洲欧美国产一本综合首页| 日本黄色免费在线| 国产一区二区高清视频| 国精品一区二区| 少妇精品无码一区二区| 亚洲欧美另类久久久精品| 在线观看免费视频a| 中文字幕欧美日韩va免费视频| 欧美黑人粗大| 欧美日韩国产精品一卡| 欧美中文字幕| 国产手机在线观看| 欧美性少妇18aaaa视频| 免费在线黄色网址| 国产成+人+综合+亚洲欧洲| 亚洲精品无吗| 欧美v在线观看| 国产午夜精品久久久久久久| 探花国产精品一区二区| 深夜福利亚洲导航| va天堂va亚洲va影视| 黄色一级视频播放| 国产一区二区看久久| 草视频在线观看| 欧美精品一区二区久久久| tube8在线hd| 久久精品国产精品国产精品污 | 亚洲四虎影院| 亚洲国产精品123| 极品少妇一区二区三区精品视频| jizz亚洲少妇| 精品国产三级a在线观看| 亚洲精品中文字幕| 日韩欧美亚洲在线| 另类小说视频一区二区| 99热精品免费| 亚洲国产成人精品久久| 国产免费不卡| 亚洲一区二区三区精品动漫| 国产美女av一区二区三区| 国产在线视频在线观看| 精品一区精品二区| 日韩在线你懂得| 国产一线二线三线女| 久久久亚洲国产美女国产盗摄| 亚洲一级在线播放| 欧美激情精品久久久久久大尺度 | 国产一区一区三区| 成人av手机在线观看| 久久亚洲精品石原莉奈| 久久精品亚洲94久久精品| 大型av综合网站| 手机看片福利日韩| 亚洲黄色av一区| 欧美日本网站| 成人中心免费视频| 国产精品一二| 日本在线一级片| 日韩av影视综合网| 亚洲狼人在线| www.四虎成人| 亚洲免费观看在线观看| 国产小视频福利在线| dy888夜精品国产专区| 日韩精品成人一区二区三区| 国产亚洲小视频| 中文字幕欧美专区| 日韩大片在线免费观看| 亚洲妇熟xx妇色黄蜜桃| 欧美午夜宅男影院在线观看| 污污网站在线看| 亚洲国产激情一区二区三区|