精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只用2700萬參數,這個推理模型超越了DeepSeek和Claude

人工智能 新聞
近日,受到人腦分層和多時間尺度處理機制啟發,來自 Sapient Intelligence 的研究者提出了分層推理模型(HRM),這是一種全新循環架構,能夠在保持訓練穩定性和效率的同時,實現高計算深度。

大模型的架構,到了需要變革的時候?

在對復雜任務的推理工作上,當前的大語言模型(LLM)主要采用思維鏈(CoT)技術,但這些技術存在任務分解復雜、數據需求大以及高延遲等問題。

近日,受到人腦分層和多時間尺度處理機制啟發,來自 Sapient Intelligence 的研究者提出了分層推理模型(HRM),這是一種全新循環架構,能夠在保持訓練穩定性和效率的同時,實現高計算深度。

具體來說,HRM 通過兩個相互依賴的循環模塊,在單次前向傳遞中執行順序推理任務,而無需對中間過程進行明確的監督:其中一個高級模塊負責緩慢、抽象的規劃,另一個低級模塊負責處理快速、細致的計算。HRM 僅包含 2700 萬個參數,僅使用 1000 個訓練樣本,便在復雜的推理任務上取得了卓越的性能。

該模型無需預訓練或 CoT 數據即可運行,但在包括復雜數獨謎題和大型迷宮中最優路徑查找在內的挑戰性任務上卻取得了近乎完美的性能。此外,在抽象與推理語料庫 (ARC) 上,HRM 的表現優于上下文窗口明顯更長的大型模型。ARC 是衡量通用人工智能能力的關鍵基準。

由此觀之,HRM 具有推動通用計算變革性進步的潛力。

paper.png

  • 論文:Hierarchical Reasoning Model 
  • 論文鏈接:https://arxiv.org/abs/2506.21734

如下圖所示:左圖 ——HRM 的靈感源自大腦的層級處理和時間分離機制。它包含兩個在不同時間尺度上運行的循環網絡,用于協同解決任務。右圖 —— 僅使用約 1000 個訓練樣本,HRM(約 2700 萬個參數)在歸納基準測試(ARC-AGI)和具有挑戰性的符號樹搜索謎題(Sudoku-Extreme、Maze-Hard)上就超越了最先進的 CoT 模型,而 CoT 模型則完全失敗。HRM 采用隨機初始化,無需思維鏈,直接根據輸入完成任務。

1.png

分層推理模型

復雜推理中深度的必要性如下圖所示。

左圖:在需要大量樹搜索和回溯的 Sudoku-Extreme Full 上,增加 Transformer 的寬度不會帶來性能提升,而增加深度則至關重要。右圖:標準架構已飽和,無法從增加深度中獲益。HRM 克服了這一根本限制,有效地利用其計算深度實現了近乎完美的準確率。

2.png

HRM 核心設計靈感來源于大腦:分層結構 + 多時間尺度處理。 具體包括:

分層處理機制:大腦通過皮層區域的多級層次結構處理信息。高級腦區(如前額葉)在更長的時間尺度上整合信息并形成抽象表示,而低級腦區(如感覺皮層)則負責處理即時、具體的感知運動信息。

時間尺度分離:這些層次結構的神經活動具有不同的內在時間節律,體現為特定的神經振蕩模式。這種時間分離機制使得高級腦區能穩定地指導低級腦區的快速計算過程。

循環連接特性:大腦具有密集的循環神經網絡連接。這種反饋回路通過迭代優化實現表示精確度的提升和上下文適應性增強,但需要額外的處理時間。值得注意的是,這種機制能有效規避反向傳播時間算法(BPTT)中存在的深層信用分配難題。

HRM 模型由四個可學習的組件組成:輸入網絡 f_I (?; θ_I ),低級循環模塊 f_L (?; θ_L) ,高級循環模塊 f_H (?; θ_H)  和輸出網絡 f_O (?; θ_O) 。

HRM 將輸入向量 x 映射到輸出預測向量 y′。首先,輸入 x 被網絡投影成一個表示image.png

image.png

模塊在一個周期結束時的最終狀態為:

image.png

最后,在經過 N 個完整周期后,從 H 模塊的隱藏狀態中提取預測 image.png

image.png

HRM 表現出層級收斂性:H 模塊穩定收斂,而 L 模塊在周期內反復收斂,然后被 H 重置,導致殘差出現峰值。循環神經網絡表現出快速收斂,殘差迅速趨近于零。相比之下,深度神經網絡則經歷了梯度消失,顯著的殘差主要出現在初始層(輸入層)和最終層。

3.png

HRM 引入了:

首先是近似梯度。循環模型通常依賴 BPTT 計算梯度。然而,BPTT 需要存儲前向傳播過程中的所有隱藏狀態,并在反向傳播時將其與梯度結合,這導致內存消耗與時間步長 T 呈線性關系(O (T))。

HRM 設計了一種一步梯度近似法,核心思想是: 使用每個模塊最后狀態的梯度,并將其他狀態視為常數。

上述方法需要 O (1) 內存,不需要隨時間展開,并且可以使用 PyTorch 等自動求導框架輕松實現,如圖 4 所示。

image.png

其次是深度監督,本文將深度監督機制融入 HRM。

給定一個數據樣本 (x, y),然后對 HRM 模型進行多次前向傳遞,每次傳遞稱為一個段。令 M 表示終止前執行的段總數。對于每個段 m ∈ {1, ..., M},令image.png表示段 m 結束時的隱藏狀態,包含高級狀態分量和低級狀態分量。圖 4 展示了深度監督訓練的偽代碼。

自適應計算時間(ACT)。大腦在自動化思維(System 1)與審慎推理(System 2)之間動態切換。

受上述機制的啟發,本文將自適應停止策略融入 HRM,以實現快思考,慢思考。

圖 5 展示了兩種 HRM 變體的性能比較。結果表明,ACT 能夠根據任務復雜性有效地調整其計算資源,從而顯著節省計算資源,同時最大程度地降低對性能的影響。

image.png

推理時間擴展。有效的神經模型應當能夠在推理階段動態利用額外計算資源來提升性能。如圖 5-(c) 所示,HRM 模型僅需增加計算限制參數 Mmax,即可無縫實現推理計算擴展,而無需重新訓練或調整模型架構。

實驗及結果

該研究中,作者跑了 ARC-AGI、數獨和迷宮基準測試,結果如圖 1 所示:

1a.png

HRM 在復雜的推理任務上表現出色,但它引出了一個耐人尋味的問題:HRM 神經網絡究竟實現了哪些底層推理算法?解答這個問題對于增強模型的可解釋性以及加深對 HRM 解決方案空間的理解至關重要。

作者嘗試對 HRM 的推理過程進行可視化。在迷宮任務中,HRM 似乎最初會同時探索多條潛在路徑,隨后排除阻塞或低效的路徑,構建初步解決方案大綱,并進行多次優化迭代;在數獨任務中,該策略類似于深度優先搜索方法,模型會探索潛在解決方案,并在遇到死胡同時回溯;HRM 對 ARC 任務采用了不同的方法,會對棋盤進行漸進式調整,并不斷迭代改進,直至找到解決方案。與需要頻繁回溯的數獨不同,ARC 的解題路徑遵循更一致的漸進式,類似于爬山優化。

更重要的是,該模型可以適應不同的推理方法,并可能為每個特定任務選擇有效的策略。不過作者也表示,我們還需要進一步研究以更全面地了解這些解題策略。

7.png

HRM 在基準任務中對中間預測結果的可視化。上圖:MazeHard—— 藍色單元格表示預測路徑。中圖:Sudoku-Extreme—— 粗體單元格表示初始給定值;紅色突出顯示違反數獨約束的單元格;灰色陰影表示與上一時間步的變化。下圖:ARC-AGI-2 任務 —— 左圖:提供的示例輸入輸出對;右圖:求解測試輸入的中間步驟。

下圖為 HRM 模型與小鼠皮層的層級維度組織結構對比。

例如,在小鼠皮層中可以觀察到維度層次,其中群體活動的 PR( Participation Ratio )從低水平感覺區域到高水平關聯區域單調增加,支持維度和功能復雜性之間的這種聯系(圖 8 a,b)。

圖 8-(e,f) 所示的結果顯示出明顯對比:未經過訓練的模型中,高層模塊與低層模塊沒有表現出任何層級分化,它們的 PR 值都較低,且幾乎沒有差異。

這一對照實驗表明,維度層級結構是一種隨著模型學習復雜推理任務而自然涌現的特性,并非模型架構本身固有的屬性。 

2025-06-30_154319.png

作者在進一步討論中表示,HRM 的圖靈完備性與早期的神經推理算法(包括 Universal Transformer)類似,在給定足夠的內存和時間約束的情況下,HRM 具有計算通用性。

換句話說,它克服了標準 Transformer 的計算限制,屬于可以模擬任何圖靈機的模型類別。再加上具有自適應計算能力,HRM 可以在長推理過程中進行訓練,解決需要密集深度優先搜索和回溯的復雜難題,并更接近實用的圖靈完備性。

除了 CoT 微調之外,強化學習(RL)是最近另一種被廣泛采用的訓練方法。然而,最近的證據表明,強化學習主要是為了解鎖現有的類似 CoT 能力,而非探索全新的推理機制 。此外,使用強化學習進行 CoT 訓練以其不穩定性和數據效率低而聞名,通常需要大量的探索和精心的獎勵設計。相比之下,HRM 從基于梯度的密集監督中獲取反饋,而不是依賴于稀疏的獎勵信號。此外,HRM 在連續空間中自然運行,這在生物學上是合理的,避免了為每個 token 分配相同的計算資源進而導致的低效。

更多內容,請參閱原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-05 00:22:00

2025-02-25 09:13:16

2025-03-06 10:14:39

2025-03-06 09:55:49

2025-02-08 09:15:00

2025-02-10 06:50:00

AIDeepSeek推理模型

2025-02-25 14:46:59

2025-01-21 11:53:53

2025-02-10 08:37:04

2025-02-14 11:18:57

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2025-06-08 14:15:42

2024-12-26 14:42:23

2025-09-15 09:43:33

分層推理模型循環網絡推理

2025-06-10 03:30:00

2025-03-11 08:37:42

2025-05-28 02:40:00

AdaptThink推理模型AI

2025-04-11 12:10:33

點贊
收藏

51CTO技術棧公眾號

超碰高清在线| 国产7777777| 啦啦啦中文在线观看日本| 懂色av噜噜一区二区三区av| 欧美激情一级欧美精品| 久久久午夜精品福利内容| 在线能看的av网址| 国产精品污污网站在线观看| 51国偷自产一区二区三区 | 成人三级视频| 4438亚洲最大| av之家在线观看| 欧美三级黄网| 91蜜桃视频在线| 成人乱人伦精品视频在线观看| 青青草手机在线视频| 蜜桃a∨噜噜一区二区三区| 7777精品伊人久久久大香线蕉经典版下载| 成人一级生活片| 丁香婷婷在线观看| 成人99免费视频| 91精品久久久久久久久久入口| 国产一级二级三级| 久久性感美女视频| 亚洲精品小视频| 欧美激情国内自拍| 国精产品一区一区三区四川| 亚洲国产日韩a在线播放| 亚洲一区二区三区午夜| 久久久久久久久亚洲精品| 国产高清视频一区| 国产欧美最新羞羞视频在线观看| 69成人免费视频| 欧美午夜精品| 欧美超级免费视 在线| 天堂av网手机版| 精品国产91乱码一区二区三区四区| 精品粉嫩aⅴ一区二区三区四区| 2025韩国理伦片在线观看| 欧美特大特白屁股xxxx| 激情懂色av一区av二区av| 综合久久国产| 日本www在线观看| 国产精品毛片久久久久久| 欧洲精品一区色| 欧美少妇另类| 久久综合狠狠综合久久激情 | 一区二区高清视频在线观看| 中国成人亚色综合网站| 91ph在线| 国产精品每日更新在线播放网址| 四虎一区二区| av国产在线观看| 中文字幕乱码久久午夜不卡 | 最新国产在线观看| 欧美激情一区二区三区四区| 日本黑人久久| jyzzz在线观看视频| 中文字幕精品一区二区三区精品| 色噜噜一区二区| av在线播放网| 国产精品白丝在线| 99热这里只有精品7| 国产激情视频在线| 一区二区三区四区激情| 性一交一乱一伧国产女士spa| 高h视频在线播放| 精品久久久久久亚洲国产300| 亚洲色图欧美视频| 中文一区二区| 欧美壮男野外gaytube| 国产精品suv一区二区三区| 国产婷婷精品| 日韩av免费在线| 中文字幕一区二区人妻| 麻豆一区二区99久久久久| 成人福利网站在线观看| 精品国产免费无码久久久| 国产精品18久久久久久久网站| 99视频在线免费观看| 日韩在线视频第一页| 久久综合一区二区| 色噜噜狠狠一区二区三区| 欧美成人性生活视频| 亚洲免费观看高清完整版在线| 国产成人永久免费视频| 樱桃视频成人在线观看| 在线视频亚洲一区| 91精品视频国产| 成人h动漫精品一区二区器材| 亚洲国产另类久久精品| 久久精品视频18| 图片区亚洲欧美小说区| 午夜精品理论片| 凹凸精品一区二区三区| 国产精品1区2区| 欧美日韩精品免费观看| 3d成人动漫在线| 一区二区三区成人| 免费午夜视频在线观看| 成人污污www网站免费丝瓜| 精品国产乱码久久久久久久| 亚洲AV无码成人精品区明星换面| 亚洲一区二区日韩| 欧美亚洲成人免费| 国产情侣一区二区| 2014亚洲片线观看视频免费| 91xxx视频| 全亚洲第一av番号网站| 91精品国产aⅴ一区二区| 亚洲中文字幕一区| 欧美在线国产| 国产精品久久999| 高潮毛片7777777毛片| 国产女人18毛片水真多成人如厕 | 狠狠色噜噜狠狠狠狠97| 国产永久免费网站| 亚洲三级网页| 欧美放荡办公室videos4k| 中文字幕一区二区人妻视频| 国产成人精品午夜视频免费| 视频一区在线免费观看| mm视频在线视频| 欧美一区二区日韩| 天天操天天舔天天射| 亚洲看片一区| 147欧美人体大胆444| 天堂资源在线中文| 日韩欧美一区二区三区久久| 国产ts在线观看| 午夜精品毛片| 国产伦精品免费视频| 九色在线播放| 欧美日韩亚洲激情| 日本一级大毛片a一| 综合视频在线| 91久久国产精品| 午夜视频在线观看免费视频| 91国产丝袜在线播放| 免费在线观看你懂的| 亚洲精品乱码久久久久久蜜桃麻豆| 亚洲精品欧美一区二区三区| 日本视频在线观看| 欧美日韩一级二级| 亚洲综合第一区| 蜜臀久久99精品久久久久久9| 欧美专区一二三 | 中文精品久久| 91夜夜未满十八勿入爽爽影院| 天天影视久久综合| 在线播放91灌醉迷j高跟美女 | 人妻无码一区二区三区| 亚洲每日更新| 久久99精品久久久久久水蜜桃 | 国产精品成人99一区无码| 欧美日韩国产综合网| 99久久一区三区四区免费| av毛片在线播放| 日本毛片在线免费观看| 亚洲小说区图片区都市| 91精品国产综合久久精品app| 手机av在线不卡| 久久9热精品视频| 久久精品日产第一区二区三区精品版| 国产精品成人久久久| 91美女片黄在线| 国产一区二区视频免费在线观看| 中文字幕一区二区三区四区免费看| 国产91对白在线观看九色| a级片一区二区| 丁香婷婷成人| 欧美在线观看视频| 国产高清一区在线观看| 欧美日韩国产首页在线观看| 日韩免费电影一区二区三区| 亚洲一区二区三区四区| 中文字幕v亚洲ⅴv天堂| 国产一区二区在线视频观看| 亚洲精品免费在线播放| 五月天激情小说| 久久久精品日韩| 伊人久久大香线蕉成人综合网| 欧美不卡在线观看| 2025国产精品视频| 日本最新在线视频| 精品久久国产老人久久综合| 国产小视频在线免费观看| 国产日韩欧美电影| 国内av免费观看| 99成人在线| 一本色道久久99精品综合| 视频国产精品| 国产不卡av在线免费观看| 黄视频网站在线| 日韩精品一二三四区| 一区二区日韩在线观看| 亚洲一区二区三区四区在线免费观看| 91久久免费视频| 国产乱子伦视频一区二区三区| 欧美爱爱视频免费看| 天天天综合网| 久久久久高清| 免费一级欧美片在线观看网站| 欧美亚洲国产视频小说| 国产精品剧情一区二区在线观看| 亚洲精品电影网在线观看| 在线免费观看中文字幕| 精品成人av一区| 欧美 日韩 国产 一区二区三区| 91色婷婷久久久久合中文| 亚洲综合20p| 日韩avvvv在线播放| 福利视频一二区| 久久亚洲国产| 日本免费一区二区三区| 国产精品18hdxxxⅹ在线| 国产精品综合久久久| 三级在线观看视频| 欧美高清不卡在线| 黄色网页在线播放| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 国产69精品久久| 97av在线视频| 岛国毛片av在线| 欧美插天视频在线播放| 免费在线看a| 伊人激情综合网| 可以在线观看的av网站| 亚洲精品99999| 国产日产亚洲系列最新| 欧美日韩你懂得| 蜜臀尤物一区二区三区直播| 午夜精品久久久久久久久久久| 青草影院在线观看| 国产精品理论在线观看| 免费在线观看污| 91首页免费视频| 日韩成人av一区二区| 国产成人午夜片在线观看高清观看| 伊人国产在线视频| 免费国产亚洲视频| 手机视频在线观看| 毛片av中文字幕一区二区| 99视频免费播放| 日韩国产一区二| www.日本xxxx| 日本午夜一区二区| 狠狠热免费视频| 久久精品国语| 国产一级不卡毛片| 日本在线观看不卡视频| 又色又爽又高潮免费视频国产| 久久久久久久波多野高潮日日| 欧美视频第三页| 日韩精品91亚洲二区在线观看| 亚洲人成无码www久久久| 日韩电影在线一区二区三区| 国产视频一区二区视频| 日本成人在线不卡视频| 五月婷婷六月丁香激情| 久久99精品久久久| 欧美高清精品一区二区| 国产成人亚洲综合a∨婷婷图片| 午夜性福利视频| 91网上在线视频| 久久丫精品忘忧草西安产品| 国产精品美女一区二区三区| 日韩欧美123区| 性久久久久久久久久久久| 亚洲免费黄色网址| 欧美日韩中字一区| av免费观看在线| 亚洲国产精品女人久久久| 久草在线青青草| 久久久成人av| a天堂资源在线| 国产成人免费av电影| 欧美风情在线视频| 99高清视频有精品视频| 欧美一级全黄| 亚洲午夜精品一区二区三区| 女同性一区二区三区人了人一| 分分操这里只有精品| 美日韩精品视频| 中文av字幕在线观看| 成人午夜视频在线观看| 男女做爰猛烈刺激| 亚洲欧美日韩久久精品| 久久久国产精品成人免费| 欧美三级在线视频| 国产18精品乱码免费看| 中文字幕亚洲激情| 超碰97国产精品人人cao| 国产成人拍精品视频午夜网站| 韩国一区二区三区视频| 欧美精品123| 欧美视频网站| 日日噜噜噜噜久久久精品毛片| 国产成人精品综合在线观看 | 中文字幕一区二区三区在线观看| 久久久久久国产精品视频| 在线亚洲人成电影网站色www| 国产成人免费看一级大黄| 亚洲精品资源在线| 亚洲夜夜综合| 成人伊人精品色xxxx视频| 欧美aaaaaaaa牛牛影院| 中文字幕在线乱| 久久久精品五月天| 中文字幕 日本| 亚洲欧美色图小说| 中文字幕免费视频观看| 亚洲成人av在线| 亚洲性图自拍| 成人欧美一区二区三区黑人孕妇| 中文字幕伦av一区二区邻居| 国产在线视频综合| 精品一区免费av| 一区二区三区久久久久| 午夜电影久久久| www.蜜桃av.com| 久久精品国产视频| 福利视频亚洲| 日本10禁啪啪无遮挡免费一区二区| 韩日欧美一区| 中文字幕无码毛片免费看| 国产精品久久久久久久久免费桃花 | v天堂福利视频在线观看| 国产精品久久久久国产a级| 人体久久天天| 日韩精品 欧美| 成人亚洲精品久久久久软件| 国产又黄又爽又无遮挡| 在线成人小视频| 一级毛片视频在线| 国产精品视频午夜| 国产一区网站| 老司机午夜av| 中文在线资源观看网站视频免费不卡| 在线观看亚洲天堂| 亚洲精品一区二区三区不| 中文字幕人成乱码在线观看| 国产视频一区二区不卡| 亚洲先锋成人| 成年人小视频在线观看| 亚洲国产日韩av| 五月激情婷婷综合| 4k岛国日韩精品**专区| 同性恋视频一区| www.四虎成人| 国产视频一区二区三区在线观看| 午夜精品一区二| 中文字幕av一区中文字幕天堂| 农村妇女一区二区| 欧美日韩在线免费观看视频| 国内精品久久久久影院一蜜桃| 国模无码国产精品视频| 欧美mv和日韩mv国产网站| 菠萝蜜视频在线观看www入口| 国产精品免费一区二区三区四区| 影音先锋中文字幕一区| 岛国av免费观看| 欧美日韩另类字幕中文| 久色视频在线| 91精品久久久久久| 欧美片第1页综合| 性欧美丰满熟妇xxxx性久久久| 疯狂欧美牲乱大交777| 成人h小游戏| 91久久精品国产91久久性色tv | 亚洲黄色片免费看| 亚洲综合色噜噜狠狠| 五月天久久久久久| 国产精品美女主播| 亚洲久久久久| 国产一级二级视频| 欧亚一区二区三区| 97超碰资源站在线观看| 国产亚洲精品美女久久久m| 久久一二三四| 欧美成人三级在线观看| 亚洲精品美女视频| 国产精品成人国产| 欧美极品少妇无套实战| 2020国产精品久久精品美国| 中文字幕无码乱码人妻日韩精品| 久久99热精品这里久久精品| 啪啪激情综合网| 亚洲小视频网站| 午夜精品久久久久久久久久 | 亚洲欧美另类一区| 国产成人精品日本亚洲专区61| 国产大片一区| 在线观看国产网站| 3d动漫精品啪啪一区二区竹菊| 国产ktv在线视频| 亚洲免费视频一区| 99精品黄色片免费大全| 国产欧美综合视频| 国产不卡av在线免费观看|