精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o1推理框架最新成果:斯坦福&伯克利提出元鏈式思維,升級模型推理能力

人工智能 新聞
在最新的一篇長達100頁的論文中,他們將o1模型背后的推理機制提煉成了一個通用的框架——元鏈式思維(Meta-CoT)。

o1背后的推理原理,斯坦福和伯克利幫我們總結好了!

在最新的一篇長達100頁的論文中,他們將o1模型背后的推理機制提煉成了一個通用的框架——元鏈式思維(Meta-CoT)

圖片

這個元鏈式思維(Meta-CoT)到底是什么意思呢?

簡單來說,它可以讓模型在推理過程中反思推理任務——

這樣不僅能得出結論,它還可以幫助我們找到更多新的研究思路和方法

比如在經典的24點問題中,傳統的CoT雖然也能得出正確的結論,但是Meta-CoT在推理過程中不止會關注輸入的問題,而是在推理過程中思考更多的子問題并進行嘗試

圖片

這也是o1模型可以在HARP等數學基準中大幅領先的原因:

圖片

SynthLabs公司的CEO Nathan Lile還自信地表示:

元鏈式思維(Meta-CoT)是通往超級智能(Superintelligence)的正確道路。下一波人工智能就是元鏈式思維(Meta-CoT)循環。

圖片

元鏈式思維(Meta-CoT)框架

為什么傳統CoT不管用了

在提出新框架之前,我們先要理解一個問題:為什么傳統模型經常在高級推理任務中“卡殼”。

其實啊,主要原因在于大語言模型的預訓練和指令調整語料庫數據中,不包含真實數據生成過程

以數學問題為例,網上和教科書中雖有會有解答,但對于錯誤的論證方法為何失效,卻很少有相關的資料,

如此一來,在遇到復雜推理問題時,被中間環節困住的模型就很難調整到正確的思考方向。

而在全新的高中奧數水平數學基準測試中,OpenAI的o1模型系列表現出眾,不僅遠超以往的模型,而且問題越難優勢越明顯。

圖片

從生成tokens數量看,其他大語言模型生成的解決方案長度與人類相近,這也就是說明,它們只是在搜索匹配訓練數據。

而o1模型在簡單問題上生成的tokens數與人類相當,在高難度問題上,生成tokens數則大幅增加,與傳統模型拉開差距。

這表明o1模型的CoT覆蓋范圍更廣,能更好地接近真實數據生成過程。

圖片

Meta-CoT的主要思想

我們先來看一道2011年國際數學奧林匹克競賽的 “風車問題”:

平面上有至少兩個點的有限集合,假設任意三點不共線,從過其中一點的直線開始,讓直線繞該點順時針旋轉,碰到集合中另一點時,新點成為旋轉軸繼續旋轉,此過程無限持續。能否選一個點和過該點的直線,讓集合中每個點都無限次成為旋轉軸呢?

圖片

官方給出的解答如下:

圖片
圖片

這道題的解答雖然很簡短,不依賴先驗知識,但卻是競賽中最難的題之一,600 多名參賽者中只有少數人答對。

主要難點在于,它的解答過程不是線性的。很多人會選擇用凸包構造或哈密頓圖論方法,最終都會失敗。

而答對的人主要是依靠大量幾何探索和歸納推理,才最終找到了答案。

也就是說,這個解答過程不是從左到右按部就班生成的。

從潛在變量過程角度看,經典思維鏈是對潛在推理鏈進行邊緣化,得出最終答案的概率。

但對于復雜問題,真實解答生成過程應該是解答的聯合概率分布,取決于潛在生成過程

這就是團隊所說的元思維鏈(Meta - CoT)過程,使用這個思路,就可以大大提升大語言模型在復雜問題上的推理能力。

內部化搜索過程

Meta-CoT的一個重要步驟是,在面對高級推理問題時,大語言模型會努力提高搜索的效率

以前模型通常會使用Best-of-N方法,也就是獨立生成多個完整答案,然后挑出最好的,但這個方法比較耗時。

在Meta-CoT中,研究人員把推理過程想象成一個“步步走”的游戲,也就是馬爾可夫決策過程(MDP)

圖片

在這個過程里,他們還引入一個過程獎勵模型(PRM),它可以用來評估中間步驟能能否得出正確答案。

如果發現某個解答方向沒希望,模型就會盡快停下,回到可能成功的中間狀態,重新尋找解決方案。

這種樹搜索方法在簡單推理任務里已經顯出明顯的優勢,在實際應用中也有成功案例。

論文的主要作者之一Rafael Rafailov是斯坦福畢業的博士,也參加過很多數學競賽,他表示這個新的搜索過程和他自己解答題目時的狀態也是一樣的:

評估解決方案的潛在方法、修剪沒有取得進展的方向、探索其他可能的分支主張、嘗試根據直覺構建通往最終目標的路徑

圖片

合成元鏈式思維

另外一個挑戰在于,大模型通常會使用強化學習方法從過去經驗里學習好的推理策略,但當遇到新領域的推理問題時,用傳統RL訓練出來的策略就不太好用了。

為了提高大模型解決不熟悉領域問題的能力,研究人員嘗試在Meta-CoT中讓大模型把推理過程當成一場“冒險游戲”,也就是部分可觀測馬爾可夫決策過程(POMDP),非常適合用來升級模型。

在這個過程中,模型可以根據不同情況調整策略。

以下圖中的迷宮游戲為例,模型一開始可以隨意行走,但慢慢地,通過將不同的頂點加入到路徑數據集或刪除數據集中,就會逐漸找到正確的方向。

圖片

而且,通過過程監督,模型能及時得到反饋,知道自己是否走在正確的解答道路上。

圖片

研究人員還發現,讓模型主動探索不同的推理路徑,能大大提升它的表現。在實驗里,模型會努力嘗試各種方法,結果在解決復雜問題時,答對的概率也提高了很多。

論文還探討了通過搜索算法(如下圖中的蒙特卡羅樹搜索(MCTS)和A*搜索)生成合成訓練數據的更多方法,這些方法可以幫助模型在上下文中學習并執行復雜的搜索策略。

圖片

圖片

使用新框架的LLM表現全面提升

那么相比原始的CoT,使用Meta-CoT新框架的LLM性能到底變強了多少呢?下面一起來看看論文中的實驗部分。

實驗設計

數據收集方面,本論文主要使用了多個數學問題數據集,包括HARP、NuminaMath、Omni-MATH和OpenMathInstruct-2。通過對這些數據集進行過濾和處理,生成了適合訓練的合成數據。

實驗中的模型包括當前主流的多個LLM,包括Llama 3.1 8B、70B和GPT-4o等。

實驗設計包括指令調優和強化學習后訓練兩個階段。指令調優階段使用線性化的搜索軌跡進行訓練,強化學習后訓練階段使用E-RL2目標進行訓練。

在指令調優階段,團隊使用了多種優化目標,包括標準過程克隆方法和元鏈式思維優化目標。

在強化學習后訓練階段,他們使用了不同的折扣率和優化算法,如PPO和REINFORCE。

結果與分析

小規模的實驗結果:在小規模實驗中,使用MCTS和A*搜索算法生成的合成數據顯著提高了模型在復雜數學問題上的表現。

圖片

上下文探索的實驗結果:在上下文探索實驗中,模型在數學問題上的表現隨著上下文探索序列長度的增加而提高。然而,過長的序列長度也會導致性能下降,這也提醒我們需要在探索和推理之間找到平衡。

圖片

回溯實驗結果:在回溯實驗中,o1、DeepSeek-R1、Gemini 2.0 Flash Thinking等模型在解答數學題的過程中,在復雜數學問題上的表現都隨著回溯次數的增加而提高。這表明回溯是一種有效的錯誤糾正機制。

圖片

綜合實驗結果:綜合實驗結果表明,使用元鏈式思維框架可以顯著提高LLMs在復雜推理任務上的表現。例如,使用 E-RL2 目標訓練的模型在HARP數學基準測試中的表現比基線模型提高了約25%。

圖片

團隊還在規劃更多數學研究

論文提出的通過自教推力器、A*算法等方法進行合成的元鏈式思維(Meta-CoT)的框架,通過顯式建模推理過程和搜索過程,使得LLMs在各項常見的實驗任務中進行復雜推理的表現都有所提升。

團隊成員也表示,未來會進一步驗證所提出方法效率的必要性,開發出更有效的過程監督和驗證技術。

此外,針對當前LLM普遍在數學問題等邏輯性較強的任務上表現不佳的現象,他們還正在構建大數學(Big Math) 項目。

這個項目的目標是聚合超過50萬個高質量、可驗證的數學問題,并最終完全開源

圖片

對相關項目感興趣的朋友們可以點擊下面的鏈接了解更多內容~

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-10-15 09:05:05

2023-04-04 13:17:00

GPUCMU開源

2024-06-11 08:25:00

2025-02-14 09:20:00

模型數據訓練

2025-04-30 09:09:00

2024-09-24 11:01:03

2025-04-23 09:10:00

AI系統模型

2023-01-13 13:29:33

量子研究

2023-12-25 09:23:07

模型技術

2025-04-18 08:42:52

模型推理AI

2023-11-15 13:40:00

訓練數據

2025-03-12 10:38:05

2023-03-31 13:55:00

模型智能

2025-11-10 08:51:00

LLMOpenAI模型

2024-09-23 14:46:27

2024-11-15 13:42:25

2018-10-09 14:00:41

SQL深度學習神經網絡

2025-11-04 08:42:27

2025-01-13 00:00:00

訓練數據模型

2025-07-21 11:51:12

模型AI工具
點贊
收藏

51CTO技術棧公眾號

日韩激情视频在线| 狠狠躁夜夜躁久久躁别揉| 亚洲自拍小视频| 成人免费看片98| 综合色就爱涩涩涩综合婷婷| 一本久道中文字幕精品亚洲嫩| 性高潮久久久久久久久| 99久久精品国产色欲| 亚洲三级色网| 俺去亚洲欧洲欧美日韩| 一区二区免费在线观看视频| 成人四虎影院| 欧美日韩国产激情| 女女百合国产免费网站| 久久精品a一级国产免视看成人| 久久国产精品一区二区| 2020国产精品视频| 日本精品人妻无码77777| 日韩三级视频| 日韩欧美在线影院| 中文字幕国产传媒| free性m.freesex欧美| ...av二区三区久久精品| 欧美日韩国产不卡在线看| 国内精品国产成人国产三级| 日韩和欧美一区二区| 久久久久久久久久久久久久久久久久av| 中文人妻一区二区三区| 亚洲综合色婷婷在线观看| 欧美色图一区二区三区| 日韩欧美国产免费| 成人超碰在线| 亚洲欧美偷拍三级| 神马欧美一区二区| 欧美日韩伦理片| av亚洲精华国产精华| 97se在线视频| 国产青青草视频| 蜜臀av性久久久久蜜臀aⅴ四虎| 69视频在线播放| 精品成人久久久| 激情一区二区| 欧美激情免费看| 一区二区在线观看免费视频| 国产精品麻豆久久| 最近2019年好看中文字幕视频 | 亚洲国产欧美国产第一区| 欧美在线综合视频| 男女爽爽爽视频| 日韩毛片免费观看| 色婷婷精品久久二区二区蜜臂av| 日本丰满少妇xxxx| 麻豆成全视频免费观看在线看| 亚洲自拍偷拍av| 激情六月天婷婷| 色yeye免费人成网站在线观看| 自拍偷自拍亚洲精品播放| 伊人久久大香线蕉精品| 男女啪啪在线观看| 综合欧美一区二区三区| 日本免费在线视频观看| 草莓福利社区在线| 亚洲精品视频一区二区| 日本福利视频网站| 七七久久电影网| 亚洲午夜在线视频| 国产精品50p| 手机看片久久| 欧美日韩精品高清| theporn国产精品| 香蕉成人app| 亚洲国产精品资源| 四虎永久免费影院| 不卡中文字幕| 久久国产精品网站| 日韩久久精品视频| 视频一区二区国产| 国产日韩在线一区| 超碰人人人人人人| wwww国产精品欧美| 亚洲一卡二卡三卡| 国内老司机av在线| 色综合久久中文综合久久97 | 国产麻豆精品在线| 国产日韩三区| 成人免费视频| 一区二区日韩av| 成人免费在线小视频| 91在线成人| 日韩欧美国产综合一区| 人妻在线日韩免费视频| 成人激情诱惑| 色综合久久88色综合天天看泰| 国产精品黄色网| 久久成人18免费观看| 国产精品国产亚洲精品看不卡15| 欧美精品少妇| 亚洲视频在线一区二区| 日本中文字幕网址| 久久伊人国产| 亚洲精品xxx| 亚洲人与黑人屁股眼交| 一区二区福利| 91亚洲精品久久久| 加勒比一区二区三区在线| 一区二区三区在线看| 欧美激情精品久久久久久小说| 国产95亚洲| 国产一区二区三区免费视频| 久久国产在线观看| 免费成人在线观看| 久久精品人人做人人爽电影| 国产黄色在线观看| 91久久精品午夜一区二区| 任你躁av一区二区三区| 欧美3p视频| 日本成人免费在线| 高h放荡受浪受bl| 1000部国产精品成人观看| 成人中文字幕av| 开心激情综合| 欧美激情亚洲另类| 国产日韩欧美中文字幕| 欧美国产激情一区二区三区蜜月| 成人免费毛片在线观看| 日韩综合一区二区三区| 日韩在线高清视频| 日韩不卡高清视频| 久久天堂av综合合色蜜桃网 | 亚洲欧美不卡| 国产精品sss| 午夜在线激情影院| 91精品国产综合久久福利软件| 欧美偷拍一区二区三区| 久久福利一区| 久久精品国产一区二区三区不卡| 国产网红女主播精品视频| 678五月天丁香亚洲综合网| 精品亚洲aⅴ无码一区二区三区| 国产视频一区三区| 国产嫩草一区二区三区在线观看| 日韩精品亚洲人成在线观看| 欧美丰满少妇xxxxx高潮对白| 免费黄色片网站| 久久久久网站| 欧美日韩一区二区视频在线| 特黄毛片在线观看| 日韩成人久久久| a v视频在线观看| 91丨九色丨国产丨porny| 成人黄色av片| 亚洲成aⅴ人片久久青草影院| 午夜欧美不卡精品aaaaa| 欧美一级免费片| 婷婷久久综合九色综合绿巨人 | 国产尤物久久久| 青青久久aⅴ北条麻妃| 深夜福利视频在线观看| 狠狠躁夜夜躁人人躁婷婷91| 中文字幕在线看高清电影| 久久一区中文字幕| 手机成人在线| 色999韩欧美国产综合俺来也| 久久九九全国免费精品观看| 国产男女无套免费网站| 亚洲综合视频网| 日韩免费高清一区二区| 视频在线观看91| 亚洲视频电影| 97人人澡人人爽91综合色| 亚洲3p在线观看| 久久天堂电影| 欧美日韩1区2区| 久久精品www人人爽人人| av在线一区二区三区| 国产中文字幕免费观看| 成人直播大秀| 91成人伦理在线电影| 超碰91在线观看| 一区二区三区亚洲| 国产日韩在线观看一区| 福利一区视频在线观看| 黄色一级片一级片| 国产成人免费视频网站高清观看视频| 成年人看的毛片| 精品产国自在拍| 91在线看网站| 超薄肉色丝袜脚交一区二区| 欧美成人精品xxx| 视频二区在线| 777久久久精品| 亚洲午夜18毛片在线看| 日韩美女视频一区二区 | 欧美国产成人精品| 秘密基地免费观看完整版中文| 久久精品一区| 国产精品三级一区二区| 欧美久久精品一级c片| www.久久久| 国产成人精选| 7777免费精品视频| 顶级网黄在线播放| 亚洲欧洲午夜一线一品| 亚洲第一天堂影院| 欧美日韩一区久久| 日本在线免费观看| 一色桃子久久精品亚洲| 无码人妻精品一区二区三区温州| 激情小说亚洲一区| 日韩手机在线观看视频| 亚洲激情成人| 日韩国产小视频| 91久久久精品国产| 日韩欧美一区二区在线观看 | 成人亚洲网站| 51色欧美片视频在线观看| 在线看福利影| 日韩在线观看免费av| 日韩av视屏| 亚洲电影免费观看| 99国产在线播放| 欧美三电影在线| 久久久久久久久久成人| 欧美日韩国产中文字幕 | 麻豆免费在线观看| 亚洲天堂久久av| 青春有你2免费观看完整版在线播放高清| 91精品国产乱| 亚洲无码精品在线观看| 91福利区一区二区三区| 国产一级做a爱片久久毛片a| 亚洲综合偷拍欧美一区色| 国产精品国产精品88| 国产精品久久久99| 天天摸日日摸狠狠添| 国产性色一区二区| 一二三不卡视频| 91在线精品一区二区| www.啪啪.com| 国产成人精品免费看| 日韩欧美中文在线视频| 国产资源在线一区| 天天色天天干天天色| 国产毛片精品一区| 永久免费看片在线观看| 国产精品亚洲视频| 国产又黄又嫩又滑又白| 国产激情精品久久久第一区二区| 日本精品一区在线| 国产馆精品极品| 亚洲熟女乱综合一区二区| 国产成人av一区| 男人网站在线观看| www久久久久| 国产成人免费观看网站| 国产精品久久夜| 多男操一女视频| 亚洲自拍偷拍九九九| 日韩高清精品免费观看| 精品久久久久久久久久国产| 五月天婷婷久久| 日本韩国一区二区| 中文字幕制服诱惑| 日韩一区二区在线看| 日本高清视频在线| 亚洲天堂色网站| 麻豆网站在线看| 国内精品久久久久久影视8| 天堂网在线最新版www中文网| 日本道色综合久久影院| 日韩毛片免费看| 成人自拍偷拍| 精品久久久亚洲| 99热一区二区三区| 激情久久五月| 高清一区二区视频| 国产黑丝在线一区二区三区| 国产一级伦理片| 中文字幕第一区二区| 欧洲猛交xxxx乱大交3| 欧美日韩精品二区| 久久久久久久久久一级| 欧美成人三级在线| 国产原创av在线| 九九热99久久久国产盗摄| 三级在线观看视频| 国产色综合天天综合网| 成人h动漫精品一区二区器材| 欧美精品一区二区三区四区五区 | 在线免费观看日韩视频| 日韩欧美国产1| 国产综合在线观看| 欧美日韩成人在线播放| 欧美一级大片| 999视频在线观看| 精品日产免费二区日产免费二区| 亚洲小视频在线播放| 老鸭窝毛片一区二区三区| 四虎成人在线播放| 国产亚洲欧洲一区高清在线观看| 中文字幕在线2021| 在线精品视频一区二区三四| 亚洲精品视频专区| 中文字幕亚洲一区二区三区| 爱情岛亚洲播放路线| 国产综合色香蕉精品| 五月国产精品| 免费看毛片的网址| 麻豆精品国产91久久久久久| 91黄色免费视频| 亚洲精品va在线观看| 中文亚洲av片在线观看| 亚洲激情成人网| 日韩激情av| 亚洲aⅴ男人的天堂在线观看| 国产精品一在线观看| 日本阿v视频在线观看| 韩日av一区二区| 夫妇交换中文字幕| 色老汉av一区二区三区| 天堂av中文字幕| 久久99热精品这里久久精品| 人人精品久久| 色播五月综合| 久久福利毛片| 麻豆av免费观看| 亚洲aaa精品| 欧美 日韩 国产 精品| 欧美大片在线影院| 日韩中文字幕一区二区高清99| 伊人久久婷婷色综合98网| 日韩激情视频网站| 人妻视频一区二区| 91高清在线观看| 国产福利片在线| 国产a∨精品一区二区三区不卡| 精品午夜电影| 免费无码不卡视频在线观看| www.欧美亚洲| 日本在线视频免费| 日韩成人在线免费观看| 激情国产在线| 精品视频在线观看| 亚洲专区一区| 91中文字幕永久在线| 在线精品视频免费观看| 高清性色生活片在线观看| 国产精品美女久久久免费 | 在线视频欧美性高潮| 精品3atv在线视频| 亚洲免费久久| 国产一区二区三区av电影| 顶臀精品视频www| 欧美一区二区三区四区久久| 色呦呦在线看| 国产在线精品日韩| 欧美亚洲免费| 男人的天堂官网 | 亚洲a视频在线观看| 欧美精品久久久久久久| 日本午夜精品| 天天爱天天操天天干| 亚洲桃色在线一区| 国产 欧美 精品| 日韩av免费在线播放| 日韩电影免费网址| 中文字幕avav| 欧美日韩美女在线观看| 国产黄色免费在线观看| 成人免费看吃奶视频网站| 欧美日韩hd| 久久av无码精品人妻系列试探| 在线观看不卡视频| 99热国产在线中文| 久久99精品久久久久久三级 | 91人妻一区二区| 欧美性高潮在线| 欧美边添边摸边做边爱免费| 成人动漫视频在线观看完整版| 国产视频一区在线观看一区免费| 久久久精品成人| 日韩你懂的在线播放| 涩涩视频在线| 国产成人精品免费看在线播放 | av中文字幕在线看| 欧美日韩一区二区三区在线观看免 | 国产日韩欧美综合在线| 国产喷水福利在线视频| 91精品国产91久久久久久最新 | 日韩a∨精品日韩在线观看| 国产日韩欧美一区二区三区综合| 国产又黄又粗又长| 91av在线网站| 亚洲激情五月| 日韩精品电影一区二区| 日韩欧美美女一区二区三区| 日韩一区二区三区在线免费观看 | 久久久久久亚洲精品不卡4k岛国 | 成人ssswww在线播放| 亚洲精美视频|