精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Qwen3 變身擴散語言模型?不從零訓練也能跑,30B參數創紀錄

人工智能 新聞
這是一個實驗性的?30B 參數稀疏 MoE 模型,其中有?3B 激活參數,由一個預訓練的 AR 模型(Qwen3-30BA3B)轉換而來,并在持續預訓練中累積訓練?500B 個 token,以實現完整的擴散行為。作者同步開源了模型、訓練配方、推理代碼以及樣例輸出。

擴散語言模型(Diffusion Language Models,DLM)一直以來都令研究者頗感興趣,因為與必須按從左到右順序生成的自回歸模型(Autoregressive, AR)不同,DLM 能實現并行生成,這在理論上可以實現更快的生成速度,也能讓模型基于前后文更好地理解生成語境。

然而,盡管其潛力巨大,DLM 的訓練仍然充滿挑戰,主要原因是它在 scaling 上的效率相對低于 AR 模型。例如,直接訓練 DLM 需要在有限的數據集上進行更多次迭代,才能超越直接訓練的 AR 模型。此外,AR 模型還擁有顯著的「先發優勢」—— 包括成熟的訓練基礎設施、穩定的訓練配方以及廣泛的從業者經驗積累。

為了克服這些難點,來自 Radical Numerics(一個新的 AI 初創)的研究團隊選擇了另一條路:在現有自回歸模型的基礎上進行改造,讓它具備擴散語言模型的能力。

他們剛剛發布的 RND1-Base(Radical Numerics Diffusion)是迄今為止規模最大的開源擴散語言模型。其生成效果如下:

這是一個實驗性的 30B 參數稀疏 MoE 模型,其中有 3B 激活參數,由一個預訓練的 AR 模型(Qwen3-30BA3B)轉換而來,并在持續預訓練中累積訓練 500B 個 token,以實現完整的擴散行為。作者同步開源了模型、訓練配方、推理代碼以及樣例輸出。

  • 技術報告:Training Diffusion Language Models at Scale using Autoregressive Models
  • 報告鏈接:https://www.radicalnumerics.ai/assets/rnd1_report.pdf
  • 代碼鏈接:https://github.com/RadicalNumerics/RND1
  • HuggingFace 鏈接:https://huggingface.co/radicalnumerics/RND1-Base-0910

這項研究的主要貢獻包括:

  • 系統性研究了大規模 A2D(Autoregressive-to-Diffusion)轉換過程中的關鍵因素,如初始化策略、層級學習率和臨界批大小。
  • 識別出能夠實現可擴展性與穩定性的關鍵因素,并證明當這些因素與成熟的自回歸預訓練方法結合時,簡單的技術組合也能催生可擴展的 DLM。
  • 推出了迄今為止最大的基礎擴散語言模型 RND1-30B,展示了將自回歸預訓練經驗科學化轉換后可在多項基準測試中取得卓越表現。

具體來說,研究者在推理(MMLU、ARC-C、RACE、BBH)、STEM(GSM8K)以及代碼生成(MBPP)等通用基準測試中測試了 RND1。結果顯示,它在所有評測中均穩定超越現有 Dream-7B 和 LLaDA-8B,同時保持了其自回歸基礎模型的強大性能。

這些結果表明,將擴散語言模型規模擴展到 80 億參數以上不僅可行,而且切實有效。A2D 轉換可能是訓練 DLM 更優的策略。RND1 也是首個在此規模上成功展示擴散模型訓練的開源項目。

不過,需要指出的是,研究者并未將 RND1 與 Llada 系列的最新模型 ——LLaDA-MoE-7B-A1B 進行對比。從部分指標來看,RND1 并未超越 LLaDA-MoE-7B-A1B 的表現。兩個模型哪個更強還需要進一步 PK。

圖源:https://arxiv.org/pdf/2509.24389

簡單持續預訓練(SCP)

從一個自回歸檢查點訓練擴散語言模型,會引出兩個核心問題:

第一,如何在一個原本僅支持因果注意力(causal attention)的架構中引入雙向上下文?

第二,如何在轉換過程中保留 AR 模型從數萬億 token 預訓練中獲得的語言與事實知識?

早期研究提出了多階段復雜流程,例如注意力掩碼退火(attention mask annealing),通過逐步放松因果掩碼實現雙向注意力;或嫁接法(grafting),即系統性修改模型結構,用雙向注意力替換因果注意力。

這些方法在小規模模型上有效,但往往引入額外設計選擇(如掩碼變化策略、退火 / 嫁接調度),難以穩定地推廣至大規模。

相較之下,作者發現了一種更簡單的方法 —— 簡單持續預訓練(SCP),能夠達到與這些復雜 A2D 轉換流程相當的性能。

其配方極為直接:

  • 從一個強大的 AR 檢查點開始;
  • 在初始化時將因果掩碼替換為雙向掩碼;
  • 在掩碼擴散目標下繼續預訓練,并采用學習率預熱。

通過層級學習率保留 AR 預訓練知識

A2D 轉換面臨的主要風險之一是災難性遺忘:模型可能在轉換過程中丟失原有的事實知識。 既有研究表明,Transformer 類語言模型中的知識(尤其是事實關聯)主要編碼在 FFN/MLP 層中 ?;谶@一認識,他們在不同參數組間采用了分層學習率策略:

在轉換期間,注意力層使用更高的學習率以便快速適應雙向上下文,而非注意力層(如 MLP 與嵌入層)使用較低學習率,以最大程度保留 AR 預訓練知識。

A2D 轉換在大 batch size 訓練下表現更佳

自回歸訓練與擴散訓練的一個細微但關鍵的區別在于:每個批次提供的監督信號量不同。 在 AR 模型中,每個 token 都會參與損失計算;而在擴散訓練中,只有序列中被掩蓋的位置會參與監督。在標準掩碼擴散目標下,平均掩碼比例約為 50%,也就是說只有一半的 token 參與學習。 這種較弱的學習信號意味著,用于 scale batch size 和學習率的標準自回歸啟發式方法不一定適用于擴散訓練。

為更好理解這一點,作者估計了臨界批大小(Critical Batch Size, CBS)—— 即當數據并行度繼續增大時,損失改進收益開始遞減的閾值。按照其他論文中的方法,他們通過分支訓練實驗來實證確定該點。

從一個在 SCP 配方下已訓練 600 億 token 的 40 億參數模型檢查點出發,作者啟動了四個僅在全局批量大小上不同的并行訓練分支。他們調整學習率、保持優化器設置與權重衰減不變,并在 token 空間上對齊預熱與衰減調度。每個分支再訓練額外 50 億 token。

實驗結果表明,在 40 億參數規模下,隨著批量增大,擴散損失持續單調下降,直到約 800 萬 token 仍有收益。換句話說,擴散語言模型在持續預訓練階段能夠有效利用更大的 batch size—— 這對大規模訓練是一個積極信號。

為什么要改造自回歸模型? 

RND1 展示了如何在不推倒重來的情況下,高效探索新架構與新訓練范式。

這種效率體現了 Radical Numerics 核心理念的本質 —— 構建一個能夠遞歸自我改進的自動化 AI 研究平臺,讓 AI 系統幫助設計和優化下一代 AI。

通過自動化實驗循環,他們能夠更快地遍歷搜索空間,驗證更大膽的想法。RND1 正是這一理念的首個具體成果之一。

Radical Numerics 的創始成員來自 DeepMind、Meta、Liquid、Stanford 等頂級機構,偏好混合架構、Hyena 和 Evo 等技術。在一個社交媒體帖子中,公司創始人之一 Michael Poli 闡述了他們的信念和愿景。

感興趣的讀者可以查閱更多資料了解該公司。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-14 13:22:08

Qwen3訓練小模型

2025-08-19 16:10:46

AI模型開源

2025-09-15 08:52:00

AI模型開源

2025-05-06 13:43:31

零代碼Qwen3微調

2025-05-14 01:00:00

2025-11-05 09:00:29

2025-04-29 08:14:14

2025-06-06 14:32:20

阿里開源Qwen3

2024-05-24 08:42:29

智能體訓練

2025-06-06 09:12:53

2025-08-08 09:06:00

2025-09-05 09:02:00

2022-06-25 21:17:15

人工智能訓練

2025-05-22 05:00:00

2025-02-17 12:30:00

2025-05-21 09:04:38

2025-06-17 08:45:00

模型智能工具

2025-04-30 10:59:04

2013-10-16 14:16:45

iPhone 3GSiOS 7
點贊
收藏

51CTO技術棧公眾號

日韩免费av| 桃子视频成人app| 99在线精品免费| 日产精品久久久一区二区福利| 五级黄高潮片90分钟视频| 精品成人av| 一区二区在线免费| 欧美视频观看一区| 国产女人18毛片18精品| 亚洲黄色毛片| www.亚洲一区| 亚洲精品视频大全| 国产不卡精品| 在线视频欧美精品| 欧美少妇一级片| 水莓100在线视频| 国内精品久久久久影院色| 久久男人的天堂| 日本成人精品视频| 偷拍精品福利视频导航| 91麻豆精品国产91久久久| www一区二区www免费| 久久综合之合合综合久久| 久久综合五月天婷婷伊人| 91网站在线免费观看| 国产a∨精品一区二区三区仙踪林| 久久精品国产99久久| 亚洲精品国偷自产在线99热| 在线一区二区不卡| 校园春色亚洲色图| 精品久久久久久久久中文字幕| 一区二区三区一级片| 国产日本在线观看| 99精品黄色片免费大全| 成人动漫视频在线观看免费| 亚洲天堂aaa| 久久久久.com| 97香蕉久久超级碰碰高清版 | 无码人妻av免费一区二区三区| 亚洲欧美在线专区| 日韩在线视频线视频免费网站| 免费a级黄色片| 久久视频在线观看| 精品国产乱码久久| 国产精品99精品无码视亚| 日韩av黄色| 日本韩国精品在线| 日本在线视频www| 在线观看爽视频| 欧美日韩亚洲视频一区| 大伊香蕉精品视频在线| 国产天堂在线播放视频| 一区二区三区丝袜| 99久久免费观看| 欧美卡一卡二| 亚洲电影中文字幕在线观看| 男人天堂av片| 日韩欧美精品一区二区三区| 舔着乳尖日韩一区| 777精品久无码人妻蜜桃| а√天堂8资源中文在线| 天天爽夜夜爽夜夜爽精品视频| 亚洲精品蜜桃久久久久久| 国模雨婷捆绑高清在线| 亚洲福利一区二区| 国产中文字幕在线免费观看| 女海盗2成人h版中文字幕| 欧美日韩午夜视频在线观看| 国产亚洲精品网站| 欧美va视频| 欧美男同性恋视频网站| 国产一级特黄a大片免费| 亚洲伊人一本大道中文字幕| 精品电影在线观看| 亚洲黄色在线观看| 亚洲高清无码久久| 丝袜美腿一区二区三区动态图| 日韩成人激情在线| 亚洲天堂久久新| 激情五月综合网| 中文字幕亚洲欧美| www色aa色aawww| 国产一区久久| 国产69精品久久久久久| 黄色av一区二区| 狠狠网亚洲精品| 国产精品中出一区二区三区| 三级无遮挡在线观看| 国产欧美日韩三区| 亚洲av综合色区| 蜜桃麻豆影像在线观看| 欧美亚洲国产怡红院影院| aaaaaaaa毛片| 日韩av不卡一区| 日韩一区二区久久久| 豆国产97在线 | 亚洲| 三级影片在线观看欧美日韩一区二区 | 91av视频导航| 一级特黄aa大片| 成人一区二区三区| 亚洲一区二区免费视频软件合集| 欧洲性视频在线播放| 在线亚洲+欧美+日本专区| 91网址在线观看精品| 日韩精品导航| 欧美巨大黑人极品精男| 无码人妻丰满熟妇区五十路| 国产成人午夜片在线观看高清观看| 久久精品国产美女| www久久日com| 在线日韩av片| 国产黑丝一区二区| 亚洲第一偷拍| 欧美综合在线第二页| h狠狠躁死你h高h| 国产日韩欧美制服另类| 日韩中文字幕在线免费| 亚洲成人a级片| 亚洲欧洲日产国码av系列天堂 | 欧美日韩激情视频8区| 亚洲小视频网站| 欧美女优在线视频| 韩国精品美女www爽爽爽视频| 一本一道人人妻人人妻αv| www.成人在线| 黄色网在线视频| 婷婷激情成人| 亚洲欧洲国产精品| 国产美女激情视频| 国产精品亚洲人在线观看| 视频一区二区在线观看| 美女在线视频免费| 亚洲第一中文字幕| 国产亚洲精品久久久久久无几年桃 | 99久久.com| 国产精品igao视频| 秋霞av在线| 精品久久香蕉国产线看观看亚洲 | 美国一区二区| 欧美疯狂xxxx大交乱88av| 91tv国产成人福利| 国产精品久久久久永久免费观看| 国产又黄又猛视频| 影视先锋久久| 国产91色在线免费| 欧美巨乳在线| 色av成人天堂桃色av| 人妻少妇一区二区| 麻豆91精品| 欧美在线播放一区二区| 日韩av福利| 国产亚洲精品高潮| 国产精品欧美综合| 国产精品视频线看| 成人黄色一级大片| 欧美在线精品一区| 99久久精品免费看国产四区| 美女网站视频在线| 精品国产乱码久久久久久闺蜜 | 亚洲国产精品第一区二区三区| 亚洲资源在线看| 成人黄视频在线观看| 欧美一区二区高清| 久久久久久欧美精品se一二三四| 国产成人av影院| r级无码视频在线观看| 欧美调教网站| 国产精品久久久久av| 欧美r级在线| 日韩三级在线免费观看| 精品无码人妻一区二区三| 99亚偷拍自图区亚洲| 妺妺窝人体色www在线观看| 日韩精品看片| 国产激情美女久久久久久吹潮| 成人黄色动漫| 永久免费精品影视网站| 国产模特av私拍大尺度 | 看黄色一级大片| 亚洲欧洲另类国产综合| 亚洲自拍偷拍精品| 久久综合影音| 中文字幕在线乱| 欧美电影完整版在线观看| 日本高清视频精品| 国产黄a三级三级三级av在线看| 日韩精品一区二区三区四区视频| 国产又爽又黄的视频| 国产精品久久综合| 欧美成人精品一区二区综合免费| 久久久夜夜夜| 亚洲精品天堂成人片av在线播放 | 色一情一乱一乱一区91| 狠狠久久伊人| 91精品久久久久久久| freexxx性亚洲精品| 中文字幕日韩av综合精品| 亚洲精品久久久久久无码色欲四季| 色综合天天性综合| 欧美成人777| 91在线视频在线| 又色又爽又黄视频| 久久久久久久欧美精品| 91嫩草国产丨精品入口麻豆 | 国产又大又长又粗又黄| 噜噜噜天天躁狠狠躁夜夜精品| 国产日韩欧美一二三区| www视频在线观看| 欧美成人小视频| 成人高潮成人免费观看| 亚洲精品短视频| 国产不卡av在线播放| 欧美伊人精品成人久久综合97| 久久免费视频播放| 日韩一区日韩二区| 丰满圆润老女人hd| 99久久久无码国产精品| 又黄又爽又色的视频| 人人狠狠综合久久亚洲| 缅甸午夜性猛交xxxx| 午夜日韩激情| 亚洲人成网站在线观看播放 | 国产福利一区二区三区视频 | 99re在线视频这里只有精品| 亚洲午夜精品一区| 男女视频一区二区| 亚洲国产精品久久久久爰色欲| 欧美日本中文| 日本一级淫片演员| 91日韩免费| 亚洲精品视频一区二区三区| 久久综合影院| 你懂的视频在线一区二区| 美女视频亚洲色图| 国产九区一区在线| 国产精品毛片久久久| 999日本视频| 精品视频在线播放一区二区三区| 国产ts在线观看| 国产主播在线播放| 亚洲人成精品久久久久久| 超碰97av在线| 久久亚洲一区二区三区四区| 亚洲国产第一区| av亚洲精华国产精华精华| 亚洲一区和二区| 国产精品1024| 少妇丰满尤物大尺度写真| 韩国女主播成人在线观看| 在线观看岛国av| 久久99久久99精品免视看婷婷| 亚洲欧美自偷自拍另类| 欧美aⅴ一区二区三区视频| wwww.国产| 美女在线一区二区| 久久久久久综合网| 国产一区二区精品久久| 在线观看一区二区三区视频| 国产成人在线网站| 91精品又粗又猛又爽| 9久草视频在线视频精品| 一本加勒比北条麻妃| 国产无人区一区二区三区| 五月婷六月丁香| 亚洲视频 欧洲视频| 波多野结衣亚洲色图| 亚洲大型综合色站| 中文字幕av影院| 精品视频在线免费看| 国产色综合视频| 精品福利一二区| 可以免费看污视频的网站在线| 亚洲天堂网在线观看| 麻豆网站视频在线观看| 欧美日韩电影在线观看| 老色鬼在线视频| 国产精品欧美一区二区| 深夜激情久久| 久久国产一区二区| 91嫩草亚洲精品| 日韩av高清在线看片| 天堂蜜桃91精品| 亚洲精品乱码久久久久久动漫| 从欧美一区二区三区| 女人被狂躁c到高潮| 国产精品天美传媒沈樵| 欧美日韩精品亚洲精品| 粉嫩老牛aⅴ一区二区三区| 中文人妻熟女乱又乱精品| 日韩欧美激情一区| 毛片在线免费| 美女少妇精品视频| 成人小电影网站| 91久久久在线| 在线成人动漫av| 欧美 国产 精品| 亚洲欧美久久久| 亚洲精品视频三区| 波多野结衣中文字幕一区 | 日韩avxxx| 国产精品一二三四| 人人人妻人人澡人人爽欧美一区| 一区二区三区欧美在线观看| 无码人妻av免费一区二区三区| 精品日韩在线观看| 天堂а√在线资源在线| 7777精品久久久久久| 欧美高清hd| 亚洲人成影视在线观看| 亚洲精品影视| 一个人看的视频www| 国产午夜精品福利| 国产高潮久久久| 日韩欧美色综合| 日本视频在线| 国产福利成人在线| 久久久亚洲欧洲日产| 肉大捧一出免费观看网站在线播放 | 国产美女www爽爽爽视频| 亚洲欧美激情另类校园| av在线加勒比| 亚洲一区二区三区sesese| 欧美日韩激情| 欧美一级黄色片视频| 92国产精品观看| 国产第一页第二页| 精品国产网站在线观看| 欧美极品另类| 国产深夜精品福利| 日韩欧美一区二区三区免费看| 成人免费观看毛片| 91麻豆国产在线观看| 国产第一页第二页| 精品国精品国产尤物美女| 中文字幕资源网在线观看| 国产日韩在线免费| 日韩精品免费| 五月天开心婷婷| 亚洲色图都市小说| 亚洲专区在线播放| 中文字幕亚洲欧美一区二区三区| 激情开心成人网| 日韩av高清| 日本sm残虐另类| 伊人影院综合网| 欧美日韩综合在线免费观看| 91电影在线播放| 91精品国产综合久久香蕉最新版 | 午夜两性免费视频| 国产欧美精品日韩区二区麻豆天美| 亚洲黄色免费观看| 亚洲免费中文字幕| 国产成人精品亚洲日本在线观看| 青青成人在线| 蜜臀久久99精品久久久画质超高清| 欧美丰满美乳xxⅹ高潮www| 欧美性感一区二区三区| 久久久久久久久免费视频| 91精品在线看| 在线不卡视频| 成年人免费观看视频网站| 在线观看91精品国产入口| 午夜免费播放观看在线视频| 国产日韩欧美成人| 欧美三级网页| 在线免费播放av| 在线观看免费亚洲| 黄色免费在线网站| 波多野结衣久草一区| 宅男噜噜噜66一区二区| 色一情一交一乱一区二区三区 | 老司机久久精品| 一区二区三区欧美久久| 天堂在线视频网站| 国产精品久久久久久久久久99| 天天综合网91| 亚洲一区二区在线免费| 日韩人体视频一二区| 免费黄网站在线播放| 国产精品国产精品| 日韩在线一区二区| 日韩a级片在线观看| 亚洲国产古装精品网站| 国产电影一区二区三区爱妃记| 国产av不卡一区二区| av在线一区二区三区| 一级久久久久久久| 97av在线视频| 欧美高清视频手机在在线| 欧美日韩人妻精品一区在线| 91福利视频久久久久| 在线欧美三级| 欧美一区二区三区精美影视| 国产精品资源在线看| 国产性生活视频| 久久99久久99精品中文字幕| 国产伦一区二区三区| 国产chinesehd精品露脸| 在线一区二区三区四区| a级片免费在线观看|