精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節Seed團隊發布循環語言模型Ouro,在預訓練階段直接「思考」,Bengio組參與

人工智能 新聞
字節 Seed 團隊聯合多家機構推出了 Ouro,一類被稱為循環語言模型(Looped Language Models)的新型預訓練模型,其名稱源于象征循環與自我吞噬的「銜尾蛇」(Ouroboros)。

現代 LLM 通常依賴顯式的文本生成過程(例如「思維鏈」)來進行「思考」訓練。這種策略將推理任務推遲到訓練后的階段,未能充分挖掘預訓練數據中的潛力。

為解決這一問題,字節 Seed 團隊聯合多家機構推出了 Ouro,一類被稱為循環語言模型(Looped Language Models)的新型預訓練模型,其名稱源于象征循環與自我吞噬的「銜尾蛇」(Ouroboros)。

Ouro 另辟蹊徑通過(i)在潛在空間中進行迭代計算,(ii)采用熵正則化目標以實現學習型深度分配,以及(iii)擴展至 7.7T tokens 的數據規模,將推理能力直接構建到了預訓練階段。 這些設計使得模型能夠在預訓練階段直接學習和構建推理能力,而非僅依賴后期微調。

  • 論文標題:Scaling Latent Reasoning via Looped Language Models 
  • 論文地址:https://arxiv.org/pdf/2510.25741
  • 項目主頁:https://ouro-llm.github.io/
  • HuggingFace:https://huggingface.co/collections/ByteDance/ouro

通過對照實驗,研究者發現 Ouro 的性能提升并非源于知識存儲量的增加,而是得益于其更高效的知識操控與推理能力。進一步分析表明,Ouro 的潛在推理過程相比標準 LLM,更接近真實的人類推理機制。

Ouro 循環語言模型的性能。(左)參數共享的循環架構。(中與右)雷達圖比較了 Ouro 1.4B 與 2.6B 模型(均采用 4 個循環步,紅色)與單獨的 Transformer 基線模型。我們的模型表現出強勁性能,可與更大規模的基線模型相媲美,甚至在部分任務上超越它們。

最終,Ouro 的 1.4B 和 2.6B 參數規模的 LoopLM,分別能在幾乎所有基準測試中達到與 4B 和 8B 標準 Transformer 相當的性能,實現了 2–3 倍的參數效率提升,顯示了其在數據受限時代下作為一種新型擴展路徑的潛力。

在高級推理基準測試中的表現。Ouro-Thinking 系列模型與強大的基線模型(如 Qwen3 和 DeepSeek-Distill)進行對比。Ouro-1.4B-Thinking R4 的性能可與 4B 規模模型相媲美,而 Ouro-2.6B-Thinking R4 在多個數學與科學數據集上的表現達到或超越了 8B 規模模型。

另外,LoopLM 架構在 HEx-PHI 基準上顯著降低了有害性,且隨著循環步數(包括外推步)增加,模型的安全性進一步提升。與傳統的 CoT 方法不同,研究者的迭代潛變量更新機制產生的是因果一致的推理過程,而非事后的合理化解釋。

循環架構

LoopLM 架構的靈感來源于「通用 Transformer」。其核心思想是在一個固定的參數預算內實現「動態計算」。具體而言,該架構包含一個由 N 個共享權重層組成的「層堆棧」。

在模型的前向傳播過程中,這個共享的層堆棧會被循環應用多次,即經歷多個「循環步驟」。這種設計將模型的計算規模從「參數數量」解耦到了「計算深度」。

該架構的關鍵特性是其自適應計算能力。它集成了一個學習到的「退出門」,當模型處理輸入時:簡單輸入可能會在經歷較少的循環步驟后就提前退出,從而節省計算資源;復雜輸入則會自然地被分配更多的迭代次數,以進行更深層的處理。

這種迭代重用被視為一種「潛在推理」。與 CoT 在外部生成顯式文本步驟不同,LoopLM 是在模型的內部隱藏狀態中構建了一個「潛在思想鏈」。每一次循環都是對表征的逐步精煉,從而在不增加參數的情況下提升了模型的知識操縱能力。

訓練流程

Ouro 的訓練流程是一個多階段過程,總共使用了 7.7T tokens 的數據。

如圖 4 所示,該流程始于一個通用的預熱階段,隨后是使用 3T token 的初始穩定訓練階段。在此之后,模型通過「upcycling」策略分支為 1.4B 和 2.6B 兩種參數規模的變體。

兩種變體均獨立經歷后續四個相同的訓練階段:第二次穩定訓練(3T token)、CT 退火(CT Annealing, 1.4T token)、用于長上下文的 LongCT(20B token)以及中途訓練(Mid-Training, 300B token)。

這個過程產生了 Ouro-1.4B 和 Ouro-2.6B 兩個基礎模型。最后,為了強化特定能力,模型還額外經歷了一個專門的推理監督微調階段,以創造出專注于推理的 Ouro-Thinking 系列模型。

在訓練穩定性方面,團隊發現最初使用 8 個循環步驟會導致損失尖峰等不穩定問題,因此在后續階段將循環步驟減少到 4,以此在計算深度和穩定性之間取得了平衡。

為了讓模型學會何時「提前退出」,訓練流程采用了新穎的兩階段目標:

循環語言模型架構概覽。

左圖為訓練階段。在訓練過程中,模型使用共享參數的 N 層堆疊結構,并執行 n 個循環步驟(R = 1 到 R = n)。在每個循環步驟 i,一個退出門預測退出概率 p?,而語言建模頭 L? 則計算對應的任務損失。 訓練目標函數結合了所有循環步驟的期望任務損失,并加入熵正則化項 H(p?,…,p?),以鼓勵模型探索不同的計算深度。

右圖為推理階段。在推理時,模型可根據由退出概率計算得到的累計分布函數(CDF)提前終止。當超過設定閾值時,模型將在第 i 個循環步驟停止,從而實現自適應計算:為復雜輸入分配更多循環步數,同時在簡單輸入上保持高效推理。圖中的虛線表示模型在提前退出后可能被跳過的后續步驟。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-04 16:02:42

模型訓練AI

2025-04-29 09:10:00

2025-06-13 09:29:51

2024-11-07 15:10:00

2025-08-05 09:02:00

2020-03-13 15:33:54

Google 開源技術

2025-11-07 09:28:08

2025-06-27 08:50:40

2022-06-16 19:53:51

AIAI模型

2025-06-19 10:09:55

2025-08-13 01:00:00

2025-08-21 10:14:18

2022-03-04 19:07:03

模型視覺人工智能

2024-01-03 18:53:13

語言模型LLM

2025-10-11 09:23:28

RLPT強化學習預訓練數據

2025-08-04 08:23:00

2017-08-28 21:31:37

TensorFlow深度學習神經網絡

2021-09-09 09:29:03

AI 數據模型

2025-08-12 15:19:32

字節跳動生成模型工具鏈

2024-01-29 00:24:07

圖像模型預訓練
點贊
收藏

51CTO技術棧公眾號

粉嫩av一区二区三区天美传媒| 成人精品一区二区三区电影黑人| 亚洲av无码一区二区三区观看| 成人性生交大片免费观看网站| 欧美人与拘性视交免费看| 欧美影院一区二区| 免费视频爱爱太爽了| 你懂的视频在线| 美女视频第一区二区三区免费观看网站| 久久成年人视频| 国产精品一区二区入口九绯色| 欧美激情福利| 国产日产亚洲精品系列| 91天堂在线视频| 女人裸体性做爰全过| 亚洲精品高潮| 欧美日韩三级在线| 日韩在线视频在线观看| www在线视频| 久久久国产午夜精品| 在线成人欧美| 久久免费看少妇高潮v片特黄 | 国产片侵犯亲女视频播放| 欧美一区二区三区爱爱| 伊人成人网在线看| 国产精品13p| 色综合久久久无码中文字幕波多| 欧美老女人性生活视频| 日本精品在线播放 | 亚洲午夜精品一区二区三区| 色婷婷综合视频| 国产一区二区精品久久91| 日本久久久久久久久久久| 手机在线免费观看毛片| 美足av综合网| 亚洲欧美另类久久久精品2019| 欧洲高清一区二区| 天天干天天干天天干| 国产美女在线精品| 91精品久久久久久久久久久久久| 潘金莲一级淫片aaaaaa播放| 国产精品久久777777毛茸茸 | 欧美mv日韩mv| 性鲍视频在线观看| av成人在线网站| 欧美日韩国产高清一区二区 | 北岛玲一区二区三区四区 | 亚洲黄色录像| 亚洲精品国产精品国产自| 国产在线观看免费播放| 麻豆国产一区二区三区四区| 51精品国自产在线| 裸体大乳女做爰69| 天天在线视频色| 国产精品久久久久久久久图文区| 日本视频精品一区| 激情小说 在线视频| 久久嫩草精品久久久精品一| 国产美女久久久| 久久久久久久亚洲| 日本美女一区二区三区视频| 国产精品久久在线观看| 中文字幕视频二区| 久久狠狠亚洲综合| 亚洲永久在线观看| 亚洲第一页在线观看| 成人高清在线视频| 鲁丝一区二区三区免费| 亚洲午夜精品久久久| 蜜桃传媒麻豆第一区在线观看| 国产精品网站入口| 国产精品无码免费播放| 国产乱子伦一区二区三区国色天香| 久久久免费高清电视剧观看| av永久免费观看| 久久一区二区三区电影| 精品国产欧美一区二区三区成人| 日本黄色片免费观看| 欧美日韩1区| 欧美在线观看网址综合| www.亚洲激情| 国产成人精品免费看| 国产亚洲情侣一区二区无| 欧美一区二区公司| 国产清纯白嫩初高生在线观看91 | 欧美三级黄色大片| 欧美日一区二区三区在线观看国产免| 国产做受高潮69| 久久精品偷拍视频| 国产九色精品成人porny| 国产一区二区三区四区hd| 精品欧美不卡一区二区在线观看 | 精品无码m3u8在线观看| 国产精品日韩精品欧美精品| 国产精品手机播放| 高h放荡受浪受bl| 久久久久久夜精品精品免费| 不卡中文字幕在线| 在线能看的av网址| 欧美一区二区女人| 国产特黄级aaaaa片免| 欧美久久综合网| 欧美激情一区二区三区在线视频观看 | 日韩免费观看av| 国产高潮在线观看| 国产视频一区不卡| 久久av综合网| 欧美午夜三级| 精品调教chinesegay| 三级全黄做爰视频| 天堂av在线一区| 国产高清精品一区| 三区四区在线视频| 欧美性猛交xxx| 中文字幕无人区二| 久久裸体网站| 日本人成精品视频在线| 性欧美18一19性猛交| 中文字幕乱码久久午夜不卡| 国产一区在线观| 在线免费看黄网站| 色av一区二区| 超碰97在线资源站| 欧美激情麻豆| 成人免费午夜电影| 91在线看片| 福利一区福利二区微拍刺激| www.欧美com| 亚洲成av人片一区二区密柚| 国产精品视频26uuu| 男女视频在线观看| 激情成人在线视频| 色悠悠在线视频| 午夜天堂精品久久久久| 亚洲va久久久噜噜噜| 色老头视频在线观看| 在线观看av一区| aaaaa一级片| 一区二区三区国产盗摄| 成人欧美一区二区三区黑人免费| v天堂福利视频在线观看| 欧美日韩免费观看一区二区三区 | 夜夜精品浪潮av一区二区三区| 日韩av卡一卡二| 波多野结衣一区| 国产999在线观看| 精品av中文字幕在线毛片| 欧美日韩亚洲一区二区| 亚洲狠狠婷婷综合久久久久图片| 在线成人黄色| 久久香蕉综合色| 一区二区三区短视频| 精品亚洲一区二区三区在线播放 | 国产欧美亚洲一区| 精品视频一区二区三区四区| 欧美13videosex性极品| 91国产视频在线观看| 国产成人无码精品久久二区三| 欧美3p在线观看| 成人春色激情网| 国产一区久久精品| 日韩精品一区二区三区视频| 国产一级特黄视频| 91丨porny丨中文| 成人一区二区三| 欧美gvvideo网站| 亚洲专区在线视频| 丁香花电影在线观看完整版| 91成人网在线| 日韩在线视频免费看| 韩国三级在线一区| 无码日本精品xxxxxxxxx| 牛牛影视一区二区三区免费看| 午夜精品久久久久久久男人的天堂 | 久久久久成人网站| av不卡一区二区三区| 国产福利视频在线播放| 色综合五月天| 国产精品亚洲一区| 欧美成人ⅴideosxxxxx| 日韩一区二区久久久| 性猛交富婆╳xxx乱大交天津 | 中文字幕免费在线观看视频一区| 欧美一级特黄aaa| 亚洲美女网站| 亚洲一区3d动漫同人无遮挡 | 欧美成人免费看| 三级亚洲高清视频| 亚洲精品高清视频| 在线精品自拍| 国产精品福利网站| av网站大全在线| 亚洲日本aⅴ片在线观看香蕉| 日产欧产va高清| 中文字幕电影一区| 亚洲婷婷在线观看| 美国欧美日韩国产在线播放| 国产一区 在线播放| 国产欧美日韩| 91精品国产99久久久久久红楼| 台湾佬成人网| 久久久久久久久电影| av网站大全在线观看| 亚洲高清在线观看| 97人妻精品一区二区三区软件 | 国产精品自拍片| 性欧美69xoxoxoxo| 日本婷婷久久久久久久久一区二区 | 欧美久久成人| 亚洲精品日韩成人| 欧美午夜寂寞| 懂色av一区二区三区在线播放| 精品日韩视频| 欧美在线激情网| 国产美女福利在线观看| 久久久国产91| 国产中文字幕在线| 日韩成人中文字幕| 日韩成年人视频| 亚洲人成伊人成综合网小说| 成人午夜剧场视频网站| 成人黄色综合网站| 毛毛毛毛毛毛毛片123| 美女视频一区二区三区| 男女av免费观看| 国产亚洲亚洲| www国产精品内射老熟女| 欧美网站在线| 国产 欧美 日韩 一区| 欧美一区精品| 玖玖精品在线视频| 午夜av一区| 久久这里只有精品首页| 亚洲国产精品久久人人爱| 一区二区三区四区影院| 韩国视频一区二区| 亚洲精品午夜在线观看| 日本午夜一本久久久综合| aa在线免费观看| 国产精品视频久久一区| 老太脱裤让老头玩ⅹxxxx| 欧美午夜电影在线观看 | 91在线国产电影| 亚洲欧美专区| 亚洲一区二区三区在线免费观看| 开心久久婷婷综合中文字幕| 国产精品美女久久久免费| 美女网站视频一区| 国产精品久久久久久久久借妻| 成人福利视频| 国产精品大片wwwwww| 希岛爱理一区二区三区av高清| 欧美伊久线香蕉线新在线| 在线手机中文字幕| 国产精品扒开腿做| 成人午夜一级| 91在线观看免费观看| 在线一区二区三区视频| 大波视频国产精品久久| 欧美激情影院| 欧美一区二区高清在线观看| 欧美亚洲精品在线| 中文字幕中文字幕在线中一区高清 | 99视频有精品| 亚欧洲乱码视频| 国产精品电影院| 2021亚洲天堂| 精品日本高清在线播放| 在线免费观看av网址| 7777精品久久久大香线蕉| av男人天堂网| 亚洲激情小视频| а天堂8中文最新版在线官网| 久久精品国产一区二区电影| 黄色的视频在线观看| 奇米四色中文综合久久| 日本免费一区二区三区等视频| 亚洲综合色激情五月| 日韩激情网站| 麻豆中文字幕在线观看| 亚洲国产美女| 亚洲综合日韩欧美| 粉嫩av亚洲一区二区图片| 成年人免费观看视频网站| 亚洲美女偷拍久久| 少妇一级淫片免费放中国 | 国产一区二区影视| 久久精品国产免费观看| 婷婷电影在线观看| 成人高清视频观看www| 女同一区二区三区| 综合网五月天| 亚洲一区观看| 国产精品久久久久久久99| 亚洲精选在线| 亚欧在线免费观看| 成人高清伦理免费影院在线观看| 国产一二三四区在线| 亚洲国产成人91porn| 伊人免费在线观看高清版| 亚洲国产精彩中文乱码av| 日本中文字幕视频在线| 欧美亚洲视频一区二区| 日韩精品成人在线观看| 污视频在线免费观看一区二区三区| 国产主播精品| 99热一区二区| 久久久久国产成人精品亚洲午夜| 69xx绿帽三人行| 欧美日韩中文一区| 青青久在线视频| 午夜精品理论片| 永久免费精品视频| 欧美日韩一区二区三区电影| 噜噜噜久久亚洲精品国产品小说| 超级砰砰砰97免费观看最新一期| 国产欧美一区视频| 99久久精品国产亚洲| 欧美精品一区二区三区四区| 欧美69xxxx| 国产精品午夜一区二区欲梦| 亚洲理论电影| 黄色免费福利视频| 成人免费视频视频在线观看免费| 久久久久亚洲av无码网站| 国产精品人成在线观看免费| 视频国产一区二区| 亚洲欧美激情小说另类| 97人妻精品视频一区| 国产视频欧美视频| segui88久久综合9999| 91中文字精品一区二区| 91精品国产自产拍在线观看蜜 | 久久9999久久免费精品国产| 欧美精品少妇一区二区三区| 91免费在线| 国产精品青青在线观看爽香蕉| 亚洲警察之高压线| 国产极品美女高潮无套久久久| 99久久久久久99| 国产精品一区二区6| 亚洲黄色有码视频| 欧美三级网站| 久久久久免费网| 国产一区二区三区久久久久久久久| 中文字幕一区二区三区乱码不卡| 亚洲自拍另类综合| 天堂av中文字幕| 91高清视频免费| 亚洲精品中文字幕99999| 欧美成人免费高清视频| 久久精品亚洲乱码伦伦中文| 波多野结衣一区二区在线| 国产一区二区三区在线| 日韩在线观看不卡| 伊人色综合影院| 国产麻豆视频一区二区| 国产亚洲精品成人| 亚洲精品久久久久| 欧美日韩精品免费观看视欧美高清免费大片| 日本视频一区在线观看| 麻豆专区一区二区三区四区五区| 久久精品一区二区三区四区五区| 制服丝袜国产精品| 精灵使的剑舞无删减版在线观看| 国产精品久久一区二区三区| 99热精品在线观看| 亚洲无人区码一码二码三码的含义| 欧美日韩在线观看一区二区| 国产1区在线| 国产区欧美区日韩区| 日日摸夜夜添夜夜添精品视频 | 亚洲人成色777777精品音频| 日韩av成人在线| 婷婷丁香综合| 日本五十肥熟交尾| 一本久久精品一区二区| 国产丰满果冻videossex| 久久久久一本一区二区青青蜜月| 日韩三区视频| 在线观看免费不卡av| 亚洲第一福利一区| 国产精品秘入口| 99视频网站| 日韩国产成人精品| 激情视频在线播放| 亚洲欧美一区二区三区久久| 亚洲热av色在线播放| 国产精品国产亚洲精品看不卡| 国产欧美一区二区精品秋霞影院 | 国产高清不卡二三区| 中文字幕第15页| 精品国产拍在线观看| 色老板在线视频一区二区| 91 在线视频观看| 精品国产乱码久久久久久天美| 麻豆视频在线观看免费| 久久久久国产精品视频| 国产一区二区导航在线播放| 欧美一区二区三区不卡视频|