精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

循環語言模型:提升參數效率的潛在推理新范式

人工智能
Ouro模型展現了卓越的參數效率,其1.4B和2.6B參數規模的模型性能可以匹配甚至超越12B參數的SOTA模型。這種效率提升主要源于模型的循環架構設計,使得相同的參數可以被重復使用,從而在固定參數預算內實現更深的計算深度。

現代大型語言模型(LLM)主要通過顯式文本生成方式進行"思考",例如思維鏈(Chain-of-Thought, CoT),這種方法將推理延遲到訓練后階段,未能充分利用預訓練數據。本文介紹了一種名為Ouro的開源預訓練循環語言模型(LoopLM)家族,其命名靈感來自遞歸的銜尾蛇(Ouroboros),通過三種關鍵創新將推理能力直接構建到預訓練階段:(1)潛在空間中的迭代計算,(2)用于學習深度分配的熵正則化目標函數,以及(3)擴展到7.7萬億token的訓練規模。

核心創新與技術亮點

Ouro模型展現了卓越的參數效率,其1.4B和2.6B參數規模的模型性能可以匹配甚至超越12B參數的SOTA模型。這種效率提升主要源于模型的循環架構設計,使得相同的參數可以被重復使用,從而在固定參數預算內實現更深的計算深度。

如上圖所示,Ouro模型采用參數共享的循環架構(左),使得1.4B和2.6B參數的模型(紅色)能夠與更大規模的基線模型相媲美或超越(中、右)。

循環語言模型(LoopLM)架構

LoopLM的核心思想是通過遞歸地重復應用共享權重的層,在固定參數預算內實現動態計算。與標準Transformer不同,LoopLM將L層Transformer塊視為一個可重復應用T次的單元:

H^(t) = TransformerLayer_θ(H^(t-1)), for t=1,...,T, with H^(0) asinput

這種設計使得計算深度與參數數量解耦,模型可以通過增加遞歸步數(T)來增強推理能力,而無需增加參數數量。

自適應計算與早退機制

Ouro模型的另一個創新是自適應計算深度分配機制。通過學習的早退門控函數,模型可以根據輸入復雜度動態決定需要多少遞歸步驟:

如上圖所示,訓練階段(左),模型應用N個共享權重層進行n次遞歸步驟。每一步i,退出門預測概率p_i,語言建模頭計算任務損失。訓練目標結合了所有步驟的期望任務損失與熵正則化項。推理階段(右),模型可以基于累積分布函數(CDF)提前退出,為簡單輸入分配更少步驟,為復雜輸入分配更多步驟。

熵正則化訓練目標

為了讓模型學會何時應該退出遞歸計算,作者設計了一個熵正則化的訓練目標:

? = ∑(t=1 to Tmax) qφ(t|x)·?^(t) - β·H(qφ(·|x))

其中第一項是期望任務損失,第二項是退出步驟分布的熵正則化。與之前工作不同,Ouro采用均勻先驗而非幾何先驗,這使得模型能夠在不受偏見的情況下探索所有可能的計算深度。

實驗結果與性能分析

參數效率

Ouro模型展現了卓越的參數效率,1.4B參數模型(4次遞歸)性能可匹配4B標準Transformer,2.6B參數模型可匹配8B標準模型,實現了2-3倍的參數效率提升。

如上圖所示,Ouro-Thinking模型在多項數學和科學數據集上與更大規模的基線模型相當或超越。

遞歸深度與性能關系

研究發現,增加遞歸步數通常會提高模型性能,但這種提升在達到訓練深度(T=4)后會出現飽和。有趣的是,即使在超出訓練配置的步數(T>4)時,模型的安全性仍會持續提高,表明迭代精煉過程對安全對齊有積極影響。

知識容量與操作能力

通過控制實驗,研究者發現LoopLM的優勢不是來自增加的知識存儲容量(每參數約2比特,與非循環模型相同),而是來自顯著增強的知識操作能力。在需要事實組合和多跳推理的任務上,LoopLM表現出明顯優勢。

如上圖所示,左側展示了循環模型與標準模型在知識容量上的相似性,而右側表格展示了循環模型在知識操作任務上的優勢。

安全性、忠實性與一致性

安全性

研究表明,隨著遞歸步數的增加,Ouro模型在HEx-PHI基準測試上的有害性降低,這一趨勢甚至在超出訓練配置的步數(5-8步)時仍然持續。

如上圖所示,隨著遞歸步數增加,模型在HEx-PHI上的有害性得分和有害率均顯著下降。

推理忠實性

與標準LLM的思維鏈不同,LoopLM的潛在推理過程與最終答案因果相關。研究者通過在Quora Question Pairs數據集上的實驗發現,隨著遞歸深度增加,模型的決策會發生實質性變化,表明內部推理確實影響最終輸出。

如上圖所示,左側展示了不同遞歸步驟中線性探針的ROC AUC,右側熱圖顯示了不同步驟間預測標簽的一致性。這種系統性的不一致表明,模型在遞歸深化過程中確實在更新其決策。

技術實現細節

訓練流程

Ouro模型采用多階段訓練流程,包括預熱、穩定訓練、CT退火、長上下文訓練和中間訓練等階段,總計在7.7萬億token上進行訓練。

如上圖所示,訓練過程從共同的預熱階段開始,然后分為兩個流:一個保持1.3B參數(產生Ouro-1.4B),一個上循環至2.6B參數(產生Ouro-2.6B)。兩個流獨立經歷相同的后續四階段訓練過程,最后通過推理SFT階段創建Ouro-Thinking模型。

KV緩存共享策略

為解決循環架構導致的內存開銷問題,研究者探索了KV緩存重用策略,發現在解碼階段,只保留最后一步的KV緩存或所有步驟的平均KV緩存,可以在幾乎不損失性能的情況下將內存需求降低4倍。

未來展望與應用前景

循環語言模型(LoopLM)為大語言模型的發展提供了一個新的擴展方向,超越了傳統的參數規模和數據量兩個維度。未來研究可以從以下幾個方面進一步探索:

  1. 遞歸機制的優化:探索更復雜的遞歸結構,如條件遞歸或混合遞歸,進一步提高模型的推理能力和參數效率。
  2. 自適應深度分配的精細化:開發更精確的門控機制,能夠在token級別動態分配計算資源,為不同類型的輸入內容提供最優的計算深度。
  3. 多模態LoopLM:將循環架構擴展到多模態領域,探索在視覺-語言任務中的應用潛力,特別是需要多步推理的復雜場景理解任務。
  4. 邊緣設備部署:利用LoopLM的參數效率優勢,開發適用于資源受限設備的高效推理系統,實現本地化的復雜推理能力。
  5. 結合神經符號方法:將LoopLM與神經符號推理系統結合,探索如何利用循環結構更好地實現符號操作和邏輯推理。

這些方向不僅可以進一步提升模型性能,還有望在實際應用中解決計算資源限制問題,使高級推理能力更廣泛地應用于各種場景。

結論

Ouro循環語言模型展示了通過架構創新實現參數效率提升的巨大潛力。通過在預訓練階段直接構建迭代計算和自適應深度分配機制,LoopLM在固定參數預算內實現了卓越的推理性能。這種方法不僅提高了模型效率,還增強了安全性和推理忠實性,為未來大語言模型的發展提供了新的思路。

相關資源

  • 模型主頁:http://ouro-llm.github.io/
  • 論文鏈接:https://arxiv.org/abs/2510.25741
責任編輯:武曉燕 來源: 頓數AI
相關推薦

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-06-26 09:06:59

2025-06-09 09:32:35

2025-05-30 02:00:00

獎勵模型RRMAI

2025-09-15 09:43:33

分層推理模型循環網絡推理

2023-11-15 14:17:23

微軟語言模型AI 模型

2025-10-23 08:50:32

2023-10-11 12:32:53

AI模型

2025-05-28 02:40:00

AdaptThink推理模型AI

2019-06-10 00:45:01

谷歌開源圖像識別

2025-03-06 09:46:00

AI模型代碼

2025-05-21 13:52:39

LLM模型

2025-04-08 09:16:00

推理模型AI

2022-07-15 09:25:01

AI制藥

2025-11-06 08:45:00

AI語言模型算法

2025-02-12 10:17:12

2024-12-19 09:48:07

2025-06-30 08:49:00

2024-02-19 07:10:00

視覺模型

2025-05-16 08:44:01

點贊
收藏

51CTO技術棧公眾號

色视频欧美一区二区三区| 精品二区在线观看| av资源网站在线观看| 色播一区二区| 日本欧美在线看| 欧美成人vr18sexvr| 日韩精品国内| 激情五月色婷婷| 欧美三级一区| 最新成人av在线| 国产精品成人一区二区| 黄色网址在线视频| 韩国日本一区| 国产精品 日产精品 欧美精品| 亚洲男子天堂网| 老太脱裤让老头玩ⅹxxxx| 国产精品毛片一区视频播| 国产欧美日韩影院| 欧美性猛交xxx| 明星裸体视频一区二区| 久久露脸国语精品国产91| 成人激情视频| 欧美婷婷六月丁香综合色| 久久久精彩视频| 伊人久久综合视频| 91精品精品| 在线成人免费视频| 日本高清xxxx| 亚洲成人一二三区| 亚洲欧美一级二级三级| 精品剧情在线观看| 最新天堂在线视频| 黄色网在线免费观看| 日本sm残虐另类| 欧美综合一区第一页| 蜜桃精品成人影片| 蜜桃视频成人m3u8| 中文字幕一区日韩精品欧美| 国产欧美中文字幕| 国产精品国产三级国产传播| 高清不卡一区| 亚洲人成人一区二区在线观看| 92福利视频午夜1000合集在线观看 | av中文天堂在线| 96av麻豆蜜桃一区二区| 性色av一区二区三区免费| 人妻av一区二区| 欧美色网一区| 亚洲天堂福利av| 日韩和欧美的一区二区| 日韩午夜影院| 奇米888四色在线精品| 欧洲亚洲在线视频| 亚洲午夜18毛片在线看| 久久99性xxx老妇胖精品| 欧美三级三级三级| 欧美成人精品免费| 天天av综合网| 久久精品国产一区二区| 欧美精品久久一区二区| 在线免费看黄视频| 狠狠久久伊人中文字幕| 一区二区三区在线高清| 久久riav二区三区| 天堂在线中文资源| 久久综合色综合88| 成人伊人精品色xxxx视频| 欧美三日本三级少妇99| 夜夜嗨网站十八久久| 中国人与牲禽动交精品| 免费黄视频在线观看| 中文字幕在线视频网站| 亚洲欧洲性图库| 在线播放 亚洲| 欧美老女人性开放| 国产在线麻豆精品观看| 欧洲日韩成人av| 超碰在线97观看| 国产字幕视频一区二区| 中文字幕av一区| 国产老头老太做爰视频| 免费欧美一区| 在线观看欧美日韩| 久久福利小视频| 精品国产欧美| 亚洲福利视频二区| 手机在线免费毛片| 国产精品亚洲d| 欧美日韩国产一区在线| 亚洲五码在线观看视频| 午夜视频1000| 懂色av一区二区三区免费观看| 日韩av免费在线看| 中国一级免费毛片| 亚洲人成人一区二区三区| www.国产一区| av中文字幕免费观看| 成人嫩草影院| 久久久久久久一区二区| 波多野结衣日韩| 国产亚洲毛片| 88国产精品欧美一区二区三区| 激情小说中文字幕| 成人在线观看毛片| aiai在线| 久久综合色之久久综合| 致1999电视剧免费观看策驰影院| 人妻偷人精品一区二区三区| 精品亚洲成av人在线观看| 日韩av免费在线播放| 91成品人影院| 久久精品二区亚洲w码| 成人三级在线| 国产特级aaaaaa大片| 久久国产综合精品| 好吊色欧美一区二区三区| 亚洲黄色片视频| 欧美国产欧美综合| 涩涩涩999| 在线免费看黄网站| 无吗不卡中文字幕| 男女激情无遮挡| 中文成人激情娱乐网| 欧美日韩电影在线| 天天干天天色天天干| 亚洲成a人片777777久久| 欧美另类高清zo欧美| 午夜理伦三级做爰电影| 国模大胆一区二区三区| 成人a在线视频| 久久这里精品| 懂色av中文一区二区三区天美| 美女被艹视频网站| 国产精品久久久久久| 久久99精品久久久久久琪琪| 欧美三根一起进三p| 黑丝一区二区三区| 亚洲一区二区三区毛片 | 台湾佬成人网| 亚洲精品国产综合区久久久久久久 | 欧美一级黄色片| 欧美黄色性生活| 美女视频一区| 一区二区三区精品99久久| 在线观看免费国产视频| 成人91在线观看| 日韩三级电影网站| 范冰冰一级做a爰片久久毛片| 91福利在线导航| 日本黄色特级片| 久久国产中文字幕| 色综合视频一区中文字幕| 久久精品美女视频| 亚洲免费网站| 91九色在线视频| 午夜成人鲁丝片午夜精品| 亚洲va在线va天堂| 中文字幕成人在线视频| 天堂久久av| 欧美激情视频三区| 国产91久久久| 国产婷婷色一区二区三区在线| 在线综合视频网站| 亚洲精品tv| 欧美成人午夜激情在线| 五月婷婷激情视频| 国产成人在线色| 激情五月婷婷六月| 亚洲精品一区av| 久久国产精品99国产精| 丰满少妇在线观看bd| 婷婷国产v国产偷v亚洲高清| 中文字幕在线观看的网站| 麻豆亚洲精品| 国产伦精品一区二区三| 国产福利在线看| 亚洲电影第三页| 国产性生活一级片| 狠狠色狠狠色综合婷婷tag| 国产福利精品av综合导导航| 日本人妻丰满熟妇久久久久久| 性欧美疯狂xxxxbbbb| 女人被狂躁c到高潮| 老司机精品视频一区二区三区| 玖玖精品在线视频| 天美av一区二区三区久久| 操人视频在线观看欧美| 日韩欧美国产另类| **欧美大码日韩| 蜜臀av粉嫩av懂色av| 日韩精品免费视频人成| 国产亚洲欧美一区二区三区| 麻豆网站视频在线观看| 在线视频你懂得一区| 欧美在线一级片| 蜜臀国产一区二区三区在线播放| 久久人人爽爽人人爽人人片av| 亚洲天堂1区| 欧美日韩成人在线播放| 日韩美女一级视频| 91精品欧美福利在线观看| caopeng视频| 国产伦精品一区二区三区免费迷| 青娱乐一区二区| 亚洲一区资源| 不卡av在线网站| 色综合888| 日韩欧美一区二区视频| 高h视频免费观看| 久久久国产午夜精品| 成熟老妇女视频| 外国成人在线视频| 91在线观看欧美日韩| 三上悠亚一区二区| 午夜精品www| av在线免费观看网址| 日韩一区二区三免费高清| 中文字幕在线欧美| 亚洲综合一区二区精品导航| 亚洲成人福利视频| 美女精品自拍一二三四| a级黄色一级片| 欧美影视一区| 一区一区视频| 俺要去色综合狠狠| 欧美视频观看一区| 日韩免费福利视频| 国内精品久久久久久中文字幕 | 韩国精品免费视频| 蜜臀视频一区二区三区| 欧美色女视频| 就去色蜜桃综合| 伦理一区二区| 国产精品草莓在线免费观看 | 亚洲大片免费看| 国产高清在线免费观看| 成人免费在线视频| 波多野结衣家庭教师在线观看 | 欧美日韩在线免费| 国产精品99精品| 亚洲国产精品天堂| 国产亚洲精品成人| 26uuu欧美日本| wwwwxxxx日韩| 欧美日本一区| 久久综合久久久| 日本中文字幕在线一区| 国产精品一区二区三区久久| 老司机午夜在线| 色系列之999| 欧美一区二区三区成人片在线| 日韩亚洲电影在线| 国产熟女一区二区三区五月婷| 91.成人天堂一区| 国产av精国产传媒| 日韩午夜在线观看视频| 亚洲AV无码国产精品午夜字幕 | 国产一区二区在线免费视频| 欧美v亚洲v综合v国产v仙踪林| 国产日韩欧美在线播放| 伊人久久精品| 99在线国产| 成人性生交大片免费网站| 欧洲美女7788成人免费视频| 日韩欧美一区二区三区在线观看| 国产精品1234| www.成人| 国产日韩欧美一区二区三区四区| 日韩精品免费一区二区夜夜嗨| 欧美极品日韩| 国产精品99一区二区三| 国产女主播av| 亚洲色诱最新| 91亚洲免费视频| 国产成a人亚洲| 91av视频免费观看| 国产精品一级黄| 国产白嫩美女无套久久| 国产女人aaa级久久久级| www国产视频| 国产日产欧美一区| 欧美激情图片小说| 国产精品网站一区| 免费在线观看h片| 亚洲18色成人| 在线观看亚洲国产| 欧美午夜精品久久久久久人妖 | 久久亚洲资源| 日韩中文字幕视频在线| 99在线播放| 日韩视频第一页| √最新版天堂资源网在线| 美女扒开尿口让男人操亚洲视频网站| 麻豆av在线播放| 国产精品美女久久| av在线不卡精品| 99精品国产高清一区二区| 九九久久成人| 亚洲精品国产suv一区88| 中文无码久久精品| 国产一二三四区在线观看| 亚洲永久在线| 波多野结衣网页| 中文字幕免费一区| 欧美一级视频免费观看| 欧美日韩国产一级| 日韩资源在线| 欧美日韩不卡合集视频| 国产激情欧美| 成人福利视频网| 亚洲国产欧美日韩在线观看第一区| 国产精品区一区| 欧美日韩黑人| 奇米影视首页 狠狠色丁香婷婷久久综合| 中文在线播放一区二区| 亚洲国产精品三区| 91视频国产观看| 激情五月少妇a| 欧美精品久久99| 在线视频91p| 国产福利视频一区二区| 日韩欧美在线精品| 久久亚洲a v| 国产综合久久久久久久久久久久| 少妇无套高潮一二三区| 中文字幕不卡在线观看| 亚洲 欧美 视频| 亚洲国产91色在线| 肉肉视频在线观看| 青青久久aⅴ北条麻妃| 91精品日本| 欧美久久在线| 在线亚洲一区| 中文字幕在线永久| 亚洲国产视频在线| youjizz在线视频| 欧美成人一区二区三区片免费| 欧美性猛交xxx乱大交3蜜桃| 国产精品欧美一区二区三区奶水| 国产精品羞羞答答在线观看| 国产男女无遮挡| 麻豆精品蜜桃视频网站| 99精品欧美一区二区| 色综合激情久久| 国产伦一区二区| 久久久国产一区二区| 日本蜜桃在线观看视频| 国产精品狼人色视频一区| 国产成人调教视频在线观看| 免费裸体美女网站| 国产人久久人人人人爽| 国产天堂第一区| 神马国产精品影院av| www.久久99| 日本男女交配视频| 成人av免费网站| 精品人妻一区二区三区免费看| 亚洲毛茸茸少妇高潮呻吟| 色婷婷综合久久久中字幕精品久久| 日本精品视频一区| 毛片一区二区三区| 潘金莲一级黄色片| 日韩欧美资源站| 国产传媒在线| 91久久精品在线| 在线成人直播| 国产国语老龄妇女a片| 欧美性xxxx18| yourporn在线观看视频| 成人福利在线视频| 在线播放精品| 天天看片天天操| 亚洲女人****多毛耸耸8| 欧美男人天堂网| xx视频.9999.com| 成人在线视频中文字幕| 一区二区精品国产| 欧美亚洲网站| 天天干天天操天天拍| 黑人巨大精品欧美一区免费视频| 国产三级在线免费| 91免费看国产| 日韩视频不卡| 性少妇xx生活| 亚洲成人1234| 久久亚洲国产精品尤物| 日b视频免费观看| 国产网站一区二区| 亚洲黄色在线观看视频| 青草热久免费精品视频| 91高清一区| 丰满少妇高潮一区二区| 91精品国产综合久久精品图片| av在线免费一区| 99精彩视频在线观看免费| 青青草一区二区三区| 国产在线视频你懂的| 中文字幕综合一区| 国产精品丝袜在线播放| 国产av人人夜夜澡人人爽麻豆 |