精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節(jié)Seed團(tuán)隊(duì)發(fā)布循環(huán)語言模型Ouro,在預(yù)訓(xùn)練階段直接「思考」,Bengio署名

人工智能 新聞
字節(jié) Seed 團(tuán)隊(duì)聯(lián)合多家機(jī)構(gòu)推出了 Ouro,一類被稱為循環(huán)語言模型(Looped Language Models)的新型預(yù)訓(xùn)練模型,其名稱源于象征循環(huán)與自我吞噬的「銜尾蛇」(Ouroboros)。

現(xiàn)代 LLM 通常依賴顯式的文本生成過程(例如「思維鏈」)來進(jìn)行「思考」訓(xùn)練。這種策略將推理任務(wù)推遲到訓(xùn)練后的階段,未能充分挖掘預(yù)訓(xùn)練數(shù)據(jù)中的潛力。

為解決這一問題,字節(jié) Seed 團(tuán)隊(duì)聯(lián)合多家機(jī)構(gòu)推出了 Ouro,一類被稱為循環(huán)語言模型(Looped Language Models)的新型預(yù)訓(xùn)練模型,其名稱源于象征循環(huán)與自我吞噬的「銜尾蛇」(Ouroboros)。

Ouro 另辟蹊徑通過(i)在潛在空間中進(jìn)行迭代計(jì)算,(ii)采用熵正則化目標(biāo)以實(shí)現(xiàn)學(xué)習(xí)型深度分配,以及(iii)擴(kuò)展至 7.7T tokens 的數(shù)據(jù)規(guī)模,將推理能力直接構(gòu)建到了預(yù)訓(xùn)練階段。 這些設(shè)計(jì)使得模型能夠在預(yù)訓(xùn)練階段直接學(xué)習(xí)和構(gòu)建推理能力,而非僅依賴后期微調(diào)。

  • 論文標(biāo)題:Scaling Latent Reasoning via Looped Language Models 
  • 論文地址:https://arxiv.org/pdf/2510.25741
  • 項(xiàng)目主頁:https://ouro-llm.github.io/
  • HuggingFace:https://huggingface.co/collections/ByteDance/ouro

通過對(duì)照實(shí)驗(yàn),研究者發(fā)現(xiàn) Ouro 的性能提升并非源于知識(shí)存儲(chǔ)量的增加,而是得益于其更高效的知識(shí)操控與推理能力。進(jìn)一步分析表明,Ouro 的潛在推理過程相比標(biāo)準(zhǔn) LLM,更接近真實(shí)的人類推理機(jī)制。

Ouro 循環(huán)語言模型的性能。(左)參數(shù)共享的循環(huán)架構(gòu)。(中與右)雷達(dá)圖比較了 Ouro 1.4B 與 2.6B 模型(均采用 4 個(gè)循環(huán)步,紅色)與單獨(dú)的 Transformer 基線模型。我們的模型表現(xiàn)出強(qiáng)勁性能,可與更大規(guī)模的基線模型相媲美,甚至在部分任務(wù)上超越它們。

最終,Ouro 的 1.4B 和 2.6B 參數(shù)規(guī)模的 LoopLM,分別能在幾乎所有基準(zhǔn)測(cè)試中達(dá)到與 4B 和 8B 標(biāo)準(zhǔn) Transformer 相當(dāng)?shù)男阅埽瑢?shí)現(xiàn)了 2–3 倍的參數(shù)效率提升,顯示了其在數(shù)據(jù)受限時(shí)代下作為一種新型擴(kuò)展路徑的潛力。

在高級(jí)推理基準(zhǔn)測(cè)試中的表現(xiàn)。Ouro-Thinking 系列模型與強(qiáng)大的基線模型(如 Qwen3 和 DeepSeek-Distill)進(jìn)行對(duì)比。Ouro-1.4B-Thinking R4 的性能可與 4B 規(guī)模模型相媲美,而 Ouro-2.6B-Thinking R4 在多個(gè)數(shù)學(xué)與科學(xué)數(shù)據(jù)集上的表現(xiàn)達(dá)到或超越了 8B 規(guī)模模型。

另外,LoopLM 架構(gòu)在 HEx-PHI 基準(zhǔn)上顯著降低了有害性,且隨著循環(huán)步數(shù)(包括外推步)增加,模型的安全性進(jìn)一步提升。與傳統(tǒng)的 CoT 方法不同,研究者的迭代潛變量更新機(jī)制產(chǎn)生的是因果一致的推理過程,而非事后的合理化解釋。

循環(huán)架構(gòu)

LoopLM 架構(gòu)的靈感來源于「通用 Transformer」。其核心思想是在一個(gè)固定的參數(shù)預(yù)算內(nèi)實(shí)現(xiàn)「動(dòng)態(tài)計(jì)算」。具體而言,該架構(gòu)包含一個(gè)由 N 個(gè)共享權(quán)重層組成的「層堆棧」。

在模型的前向傳播過程中,這個(gè)共享的層堆棧會(huì)被循環(huán)應(yīng)用多次,即經(jīng)歷多個(gè)「循環(huán)步驟」。這種設(shè)計(jì)將模型的計(jì)算規(guī)模從「參數(shù)數(shù)量」解耦到了「計(jì)算深度」。

該架構(gòu)的關(guān)鍵特性是其自適應(yīng)計(jì)算能力。它集成了一個(gè)學(xué)習(xí)到的「退出門」,當(dāng)模型處理輸入時(shí):簡(jiǎn)單輸入可能會(huì)在經(jīng)歷較少的循環(huán)步驟后就提前退出,從而節(jié)省計(jì)算資源;復(fù)雜輸入則會(huì)自然地被分配更多的迭代次數(shù),以進(jìn)行更深層的處理。

這種迭代重用被視為一種「潛在推理」。與 CoT 在外部生成顯式文本步驟不同,LoopLM 是在模型的內(nèi)部隱藏狀態(tài)中構(gòu)建了一個(gè)「潛在思想鏈」。每一次循環(huán)都是對(duì)表征的逐步精煉,從而在不增加參數(shù)的情況下提升了模型的知識(shí)操縱能力。

訓(xùn)練流程

Ouro 的訓(xùn)練流程是一個(gè)多階段過程,總共使用了 7.7T tokens 的數(shù)據(jù)。

如圖 4 所示,該流程始于一個(gè)通用的預(yù)熱階段,隨后是使用 3T token 的初始穩(wěn)定訓(xùn)練階段。在此之后,模型通過「upcycling」策略分支為 1.4B 和 2.6B 兩種參數(shù)規(guī)模的變體。

兩種變體均獨(dú)立經(jīng)歷后續(xù)四個(gè)相同的訓(xùn)練階段:第二次穩(wěn)定訓(xùn)練(3T token)、CT 退火(CT Annealing, 1.4T token)、用于長(zhǎng)上下文的 LongCT(20B token)以及中途訓(xùn)練(Mid-Training, 300B token)。

這個(gè)過程產(chǎn)生了 Ouro-1.4B 和 Ouro-2.6B 兩個(gè)基礎(chǔ)模型。最后,為了強(qiáng)化特定能力,模型還額外經(jīng)歷了一個(gè)專門的推理監(jiān)督微調(diào)階段,以創(chuàng)造出專注于推理的 Ouro-Thinking 系列模型。

在訓(xùn)練穩(wěn)定性方面,團(tuán)隊(duì)發(fā)現(xiàn)最初使用 8 個(gè)循環(huán)步驟會(huì)導(dǎo)致?lián)p失尖峰等不穩(wěn)定問題,因此在后續(xù)階段將循環(huán)步驟減少到 4,以此在計(jì)算深度和穩(wěn)定性之間取得了平衡。

為了讓模型學(xué)會(huì)何時(shí)「提前退出」,訓(xùn)練流程采用了新穎的兩階段目標(biāo):

循環(huán)語言模型架構(gòu)概覽。

左圖為訓(xùn)練階段。在訓(xùn)練過程中,模型使用共享參數(shù)的 N 層堆疊結(jié)構(gòu),并執(zhí)行 n 個(gè)循環(huán)步驟(R = 1 到 R = n)。在每個(gè)循環(huán)步驟 i,一個(gè)退出門預(yù)測(cè)退出概率 p?,而語言建模頭 L? 則計(jì)算對(duì)應(yīng)的任務(wù)損失。 訓(xùn)練目標(biāo)函數(shù)結(jié)合了所有循環(huán)步驟的期望任務(wù)損失,并加入熵正則化項(xiàng) H(p?,…,p?),以鼓勵(lì)模型探索不同的計(jì)算深度。

右圖為推理階段。在推理時(shí),模型可根據(jù)由退出概率計(jì)算得到的累計(jì)分布函數(shù)(CDF)提前終止。當(dāng)超過設(shè)定閾值時(shí),模型將在第 i 個(gè)循環(huán)步驟停止,從而實(shí)現(xiàn)自適應(yīng)計(jì)算:為復(fù)雜輸入分配更多循環(huán)步數(shù),同時(shí)在簡(jiǎn)單輸入上保持高效推理。圖中的虛線表示模型在提前退出后可能被跳過的后續(xù)步驟。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-11-05 08:53:45

語言模型訓(xùn)練AI

2025-04-29 09:10:00

2025-06-13 09:29:51

2024-11-07 15:10:00

2025-08-05 09:02:00

2020-03-13 15:33:54

Google 開源技術(shù)

2025-11-07 09:28:08

2025-06-27 08:50:40

2022-06-16 19:53:51

AIAI模型

2025-06-19 10:09:55

2025-08-13 01:00:00

2025-08-21 10:14:18

2022-03-04 19:07:03

模型視覺人工智能

2024-01-03 18:53:13

語言模型LLM

2025-10-11 09:23:28

RLPT強(qiáng)化學(xué)習(xí)預(yù)訓(xùn)練數(shù)據(jù)

2025-08-04 08:23:00

2017-08-28 21:31:37

TensorFlow深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

2021-09-09 09:29:03

AI 數(shù)據(jù)模型

2025-08-12 15:19:32

字節(jié)跳動(dòng)生成模型工具鏈

2024-01-29 00:24:07

圖像模型預(yù)訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产亚洲一区| 黄色高清视频网站| www.玖玖玖| 国产精品天天操| 欧美美女在线直播| 亚洲蜜桃精久久久久久久| 欧美怡春院一区二区三区| 警花观音坐莲激情销魂小说| 黄瓜视频在线免费观看| 亚洲一区二区三区在线免费| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 日日摸夜夜添夜夜添亚洲女人| 日韩视频免费观看高清完整版在线观看 | 从欧美一区二区三区| 中文字幕久久亚洲| 日本精品久久久久中文字幕| 五月天婷婷在线播放| 亚洲视屏一区| 欧美成人r级一区二区三区| www亚洲国产| 少妇精品高潮欲妇又嫩中文字幕| 狠狠色丁香久久综合频道| 亚洲精品少妇网址| 国产一区二区三区精彩视频| 黄色视屏免费在线观看| 日韩精品一卡| 欧美日韩中文国产| 亚洲欧美电影在线观看| 一级特黄aaa大片| 国产精品99在线观看| 欧美精品一卡二卡| 成人在线观看www| 国产在线观看精品一区| 日本午夜精品一区二区三区电影| 欲色天天网综合久久| 中文字幕国产传媒| 免费av不卡| 国产一区二区剧情av在线| 成年无码av片在线| 高清中文字幕mv的电影| 五月天av在线| 欧美激情一区二区在线| 91精品国产综合久久香蕉922| 可以免费看av的网址| 精品国模一区二区三区欧美| 亚洲香肠在线观看| 久久伊人一区二区| 中文字幕一区2区3区| 中文字幕乱码亚洲无线精品一区 | 久久久精品黄色| 国产精品99免视看9| 午夜时刻免费入口| 91国产一区| 夜夜精品视频一区二区| 狼狼综合久久久久综合网| 精品女同一区二区三区| 国产亚洲精品久久久久婷婷瑜伽| 亚洲日韩欧美视频一区| 日本国产一级片| 青春草视频在线| 久久伊99综合婷婷久久伊| 国产一区二中文字幕在线看 | 欧美美女直播网站| 在线观看免费av网址| 欧洲亚洲精品| 亚洲成人激情综合网| 欧美在线一二三区| www.精品视频| 国产不卡视频一区二区三区| 青青草一区二区| 日本福利片在线观看| 欧美三级电影在线| 亚洲欧美日韩中文在线制服| 午夜影院免费版| 奇米777日韩| 亚洲综合激情小说| 99在线观看视频免费| yw视频在线观看| 成人av网站免费观看| 国产日韩欧美在线看| 国产免费高清av| 丝袜美腿高跟呻吟高潮一区| 欧美激情一区二区三区久久久| 色屁屁草草影院ccyy.com| 大伊香蕉精品在线品播放| 欧美三区免费完整视频在线观看| 污污动漫在线观看| 亚洲一二三四| 亚洲国产色一区| 欧美日韩在线中文| 亚洲精品三区| 亚洲成人国产精品| 中文字幕日韩久久| 国产精品久久久久久久久久齐齐| 国产精品美女一区二区在线观看| 国产伦理久久久| 国产精品无码在线播放| 成人美女视频在线看| 欧美日韩一区二区三区免费| 日韩专区第一页| 国产欧美视频一区二区三区| 国产专区在线视频| av免费看在线| 国产精品大尺度| 丁香花在线影院观看在线播放 | 久久久国产精品午夜一区ai换脸| 天堂一区二区三区| 男人的天堂在线视频| 成人黄色a**站在线观看| 欧美极品jizzhd欧美| 男人天堂久久久| 精品国产老师黑色丝袜高跟鞋| 精品人妻人人做人人爽| 成人性生交大片免费网站| 91精品国产综合久久精品| 亚洲天堂av一区二区| 91亚洲精品| 日韩av网址在线观看| 一级特级黄色片| 人人精品视频| 欧美www在线| 久久久久久av无码免费网站| 欧美69wwwcom| 欧美日韩国产成人高清视频| 青青操视频在线播放| 欧美日韩1080p| 欧美激情欧美激情在线五月| 日韩av在线天堂| 一本久道久久综合婷婷鲸鱼| 欧美性受xxx| 北条麻妃一二三区| 国产精品国产三级国产aⅴ入口 | 久久久久无码国产精品一区| 天天综合天天综合| 亚洲欧美日韩人成在线播放| 毛片在线视频观看| 欧美日韩破处视频| 亚洲区一区二区| 99热在线观看免费精品| 青青国产91久久久久久| 另类欧美小说| 国产精品一区二区日韩| 色丁香久综合在线久综合在线观看| 日韩中文字幕组| 日韩mv欧美mv国产网站| 国产亚洲欧洲黄色| 免费高清在线观看电视| 韩国一区二区三区在线观看| 91天堂在线观看| 欧美一级在线免费观看| 久久亚洲欧美国产精品乐播| 全黄性性激高免费视频| 中文久久电影小说| 欧美大片免费看| 亚洲精品一区二区三区蜜桃| 国产午夜精品久久久久久免费视| 亚洲一区二区在线免费观看| 欧美性受ⅹ╳╳╳黑人a性爽| 91精品国产全国免费观看| 欧美美女性生活视频| 91久久黄色| 国产日韩在线视频| 欧美高清视频| 91精品国产综合久久国产大片| 男人操女人的视频网站| 国产精品99久久久久久久vr| 欧美精品人人做人人爱视频| 日本三级一区| 这里是久久伊人| 国产又黄又粗又猛又爽的视频| 在线欧美一区| 91精品国产综合久久久久久蜜臀 | aa免费在线观看| 国产精品va视频| 亚洲欧洲在线观看| 精人妻无码一区二区三区| 国产成人综合网站| 免费网站永久免费观看| 欧美日韩另类图片| 日本视频久久久| 狠狠综合久久av一区二区| 国产农村妇女毛片精品久久麻豆| 成人在线观看a| 99精品视频在线观看播放| 亚洲伊人一本大道中文字幕| 春暖花开成人亚洲区| 欧美日韩国产影片| 天天躁日日躁aaaa视频| 毛片av一区二区| 欧美日韩在线高清| 四虎国产精品免费久久5151| 欧美劲爆第一页| 黑人与亚洲人色ⅹvideos| 91精品视频网| yjizz国产| av一区二区三区黑人| 欧美一级中文字幕| 任你躁在线精品免费| 国产精品一区二区三区免费视频| 欧美大片aaa| 欧美精品亚洲一区二区在线播放| 精品少妇久久久| 欧美激情一区二区三区全黄| 中文字幕一二三区| 亚洲成av人片一区二区密柚| 国产欧美在线观看| av老司机免费在线| 亚洲国产精品电影| 中文字幕乱码视频| 午夜精品在线看| 艳妇乳肉豪妇荡乳xxx| 亚洲五月婷婷| 亚洲精品成人a8198a| 国产一区调教| 成人在线小视频| 原纱央莉成人av片| 欧美高清视频在线观看| 午夜毛片在线| 欧美一级欧美三级在线观看| 丰满少妇xoxoxo视频| 有码一区二区三区| 亚洲国产精品狼友在线观看| 蜜臀av性久久久久蜜臀av麻豆| 亚洲不卡1区| 日韩欧美另类中文字幕| 欧美精品www| 国产网站在线免费观看| 亚洲性无码av在线| 深夜福利视频一区| 一本大道久久a久久精品综合| 三上悠亚影音先锋| 蜜桃久久久久久久| 亚洲精品乱码久久久久久自慰| 亚洲视频高清| 日本精品福利视频| 68国产成人综合久久精品| 亚洲精品一区二区毛豆| 国产成人久久| 欧美久久在线| 亚洲人成伊人成综合图片| 国产精品 欧美在线| 精品极品在线| 高清欧美性猛交| 国产午夜在线观看| 欧美精品高清视频| 伊人22222| 欧美日韩免费观看一区二区三区| 免费观看日批视频| 亚洲美女精品一区| 伊人在线视频观看| 亚洲男人的天堂在线观看| 免费成人深夜夜行网站| 亚洲三级理论片| 国产一区二区视频在线观看免费| 自拍偷拍国产精品| 日本黄色免费观看| 成人短视频下载| 漂亮人妻被黑人久久精品| av在线播放一区二区三区| 亚洲中文字幕一区| 91麻豆福利精品推荐| 一级片黄色免费| 国产精品一级在线| 精品久久久久久久无码| 欧美三级在线| 国产成人一区二区三区别| 黄色日韩在线| 国产黄页在线观看| 欧美大片专区| 黄色激情在线视频| 色综合久久网| 一本—道久久a久久精品蜜桃| 91精品国产调教在线观看| 亚洲五码在线观看视频| 欧美在线观看视频一区| 精品国产乱码久久久久久蜜柚| 外国成人毛片| 99在线视频播放| 青青伊人久久| 99高清视频有精品视频| 欧洲亚洲一区二区三区| 色涩成人影视在线播放| 一级欧洲+日本+国产 | 99视频+国产日韩欧美| 黄色动漫网站入口| 美女视频第一区二区三区免费观看网站| 三区视频在线观看| zzijzzij亚洲日本少妇熟睡| 亚洲做受高潮无遮挡| 懂色av一区二区三区蜜臀| 亚洲人人夜夜澡人人爽| 成人av免费在线| 欧洲女同同性吃奶| 亚洲三级在线免费观看| 午夜精品三级久久久有码| 欧美日韩在线免费视频| 亚洲精品无amm毛片| 亚洲欧洲自拍偷拍| 欧美黄色视屏| 国产精品久久久久久久久久新婚| 涩涩视频网站在线观看| 国产日韩在线播放| 伊人成综合网yiren22| 超级碰在线观看| 日日骚欧美日韩| 丝袜熟女一区二区三区| 成人黄色小视频在线观看| a天堂中文字幕| 亚洲一区二区三区免费视频| 中文永久免费观看| 亚洲福利在线视频| av在线免费播放| 九九热视频这里只有精品| 日韩大尺度黄色| 国产精品久久久久久久免费大片| 日韩激情免费| 欧美色图另类小说| 懂色av一区二区三区免费观看| 免费一级suv好看的国产网站| 色综合中文字幕| 人妻中文字幕一区| 欧美成人精品一区二区| 国产激情欧美| 久久久com| 在线成人av| 亚洲av无一区二区三区久久| 国产精品视频九色porn| 欧美a视频在线观看| 日韩h在线观看| av在线网页| 成人毛片网站| 亚洲a级精品| 97超碰国产精品| 国产老妇另类xxxxx| 国精品人伦一区二区三区蜜桃| 91精品91久久久中77777| 天堂√在线中文官网在线| 国产亚洲一级高清| 密臀av在线播放| 精品亚洲一区二区三区四区五区高| 亚洲成人免费| 99精品999| 亚洲婷婷综合色高清在线| 91成品人影院| 日韩中文字幕在线视频| 久久不射影院| 999在线观看免费大全电视剧| 88国产精品视频一区二区三区| 三上悠亚在线一区| 国产精品久久久久久久午夜片| 真实的国产乱xxxx在线91| 一区二区三区国产视频| 国产黄色一区| 福利在线小视频| 福利一区在线观看| 国产一二三四在线| 亚洲精品福利视频| 免费在线午夜视频| 成人午夜在线观看| 九九热精品视频在线观看| 美国av在线播放| 精品亚洲国内自在自线福利| 中文字幕免费在线播放| 午夜精品久久久久久久| 乱色精品无码一区二区国产盗| 午夜剧场成人观在线视频免费观看| 国产精品久久久久久妇女| 资源网第一页久久久| 国产精品视区| 黄色工厂在线观看| 欧美性猛片xxxx免费看久爱| 免费观看a视频| 欧美亚洲视频在线看网址| 成人在线视频免费观看| 日韩视频在线观看一区二区三区| 一区二区三区蜜桃网| 欧洲免费在线视频| 国产欧美在线观看| 在线播放精品| 国产7777777| 日韩欧美的一区| 巨大荫蒂视频欧美另类大| 99久久精品免费看国产四区| 日韩视频一区| 国产综合精品在线| 日韩一区二区三区高清免费看看| 98色花堂精品视频在线观看 | 日韩在线观看| wwwww在线观看| 中文字幕一区二区三中文字幕| 国产免费一区二区三区最新不卡| 久久久免费av| 欧美偷拍自拍| 极品白嫩的小少妇| 欧美三区在线视频| 91www在线| 亚洲欧洲三级| 99久久精品国产精品久久| 国产精品成人av久久| 日韩欧美一区在线|