精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌揭秘:Multi-Agent 推理時擴展才是未來

人工智能
OpenAI o1 和 DeepSeek R1 的路線是讓單個模型深度思考,本質上還是在同一個推理框架內擴展。TUMIX告訴我們,通過多樣化的Agent和工具混合,可以用更低的成本達到更好的效果。

嘿,大家好!這里是一個專注于前沿AI和智能體的頻道~

谷歌 DeepMind 和 MIT 聯合發了一篇論文,名叫 TUMIX(Tool-Use Mixture)

大概就是說,Multi-Agent 才是 test-time- scaling的終極打開方式,可以以一半的成本,在HLE上,準確率從 21.6% 飆升到 34.1%,超越 Gemini-2.5-Pro Deep Research。

除此之外,他們還做了一個彩蛋,讓Agent設計Agent,效果比人工設計的更牛~

圖片圖片

一個反常識

Agent多樣性 > 瘋狂采樣

目前主流的推理時擴展方法是什么?

重復采樣同一個最強模型,然后用多數投票選答案。

感覺也沒毛病,但谷歌驗證后,說:錯了。

他們做了個實驗:

  • 單Agent重復15次 vs 15個不同Agent各推理1次
  • 在相同的推理成本下,15個不同Agent的準確率和覆蓋率都明顯更高

為什么呢?

因為不同Agent采用不同的工具使用策略(純文本推理、代碼執行、網頁搜索、雙工具混合等),能探索更廣闊的解空間。而單Agent重復采樣,本質上還是在同一個思維框架里打轉。

圖片圖片

他們還對比了三種工具組合:

  • Code_Text(只能用代碼,不能搜索)
  • Search_Text(只能搜索,不能用代碼)
  • Code_Search_Text(兩者都能用)

結果,雙工具Agent組的覆蓋率和準確率都顯著高于單工具組。

這說明什么?Code Interpreter 和 Search 不是互相替代的關系,而是互補的。

文本推理擅長語義和常識,代碼擅長精確計算,搜索擅長獲取最新知識。只有三者混合,才能發揮LLM的全部潛力。

TUMIX的核心機制

TUMIX的架構其實不復雜,核心就三步:

第一輪

15個不同Agent并行推理。

每個Agent有自己的工具使用策略(CoT、純代碼、搜索優先、代碼搜索混合、引導式雙工具等)

每個Agent最多可以調用工具5次,生成15個初步答案

第二輪及之后

答案共享 + 迭代優化:

把上一輪所有Agent的答案拼接到原問題后面,每個Agent基于原問題+其他Agent的答案生成新答案。

重復這個過程,直到LLM判斷答案已收斂。

終止

LLM-as-Judge,用LLM自動判斷何時停止迭代(最少2輪),最終通過多數投票選出答案

圖片圖片

這個設計既保留了多樣性探索,又通過迭代優化提升了答案質量。

他們還發現了一個有趣的現象:隨著迭代輪次增加,覆蓋率(至少有一個Agent答對)會下降,但平均準確率會上升。

這說明Agent們在互相學習的過程中逐漸趨同,但也會誤刪掉一些正確答案。

所以,關鍵是找到那個——既充分迭代優化,又不過度收斂。

最后

來看看TUMIX的實戰表現:

在Gemini-2.5-Pro上,HLE從21.6%提升到32.3%,GPQA從84.6%提升到87.9%, AIME 24&25,從87.3%提升到96.7%。

對比其他Test-time Scaling方法(Self-MoA、Symbolic-MoE、DEI、SciMaster、GSA),TUMIX在相同推理成本下,平均準確率都有明顯優勢。

圖片圖片

LLM可以自動設計更強的Agent?

論文里還有個彩蛋:他們嘗試讓 Gemini-2.5-Pro 自己設計新的Agent。

做法很簡單:

  1. 給LLM看現有的15個人工設計的Agent
  2. 讓它生成更多樣、更高質量的Agent
  3. 從生成的25個新Agent中篩選出表現最好的15個

結果呢?

混合了人工設計和LLM生成的Agent組,性能比純人工設計的還要高1.2%。

LLM生成的Agent長什么樣?比如:

  • Plan-Verify-Refine:先規劃、再執行(代碼或搜索)、然后驗證并優化
  • SearchThenCode:強制先搜索、再用代碼
  • Debate-CrossExam:模擬提議者和懷疑者辯論,引導工具使用

這些策略和人工設計的完全不同,說明LLM已經具備了一定的Meta-Agent設計能力。

最后

OpenAI o1 和 DeepSeek R1 的路線是讓單個模型深度思考,本質上還是在同一個推理框架內擴展。

TUMIX告訴我們,通過多樣化的Agent和工具混合,可以用更低的成本達到更好的效果。

同時,LLM可以設計更強的Agent架構,這意味著,未來的AI系統可能會自己優化自己的工作流,而不需要人工調參。

責任編輯:武曉燕 來源: 探索AGI
相關推薦

2024-07-01 12:30:09

2025-05-12 00:05:00

2025-07-23 01:00:00

2025-04-29 08:00:00

Rowboat多智能體人工智能

2013-05-22 15:43:39

谷歌web組件web開發

2020-05-21 09:33:06

Reactive編程模型

2023-01-06 13:48:21

自然語言推理算法

2025-08-19 09:20:02

2024-10-22 20:00:00

2015-10-13 10:19:02

數據中心谷歌

2012-08-14 09:44:02

谷歌團隊

2013-01-18 17:20:45

2025-03-03 13:26:39

2016-12-16 19:06:02

擴展數據庫架構

2025-04-08 09:16:00

推理模型AI

2019-03-25 13:20:51

Android 谷歌系統

2015-05-13 15:36:19

虛擬現實環繞計算

2015-10-19 11:28:49

WebAPP未來

2025-04-29 09:16:00

點贊
收藏

51CTO技術棧公眾號

成人网在线观看| 久久综合久久美利坚合众国| 国产淫片av片久久久久久| 久久这里精品| 韩国毛片一区二区三区| 欧美黄色免费网站| 人妻av无码一区二区三区| 亚洲欧美专区| 欧美日韩国产一区中文午夜| 亚洲a∨一区二区三区| 中文字幕丰满人伦在线| 午夜久久99| 国产亚洲精品久久久优势| 999热精品视频| 性xxxxfreexxxxx欧美丶| 国产精品乱码一区二区三区软件 | 人妻丰满熟妇av无码区app| 黄色小网站在线观看| 99久久综合国产精品| 国产欧美日韩丝袜精品一区| 人人干人人干人人干| 久久久久久久久国产一区| 国产视频综合在线| 亚洲三级在线视频| a成人v在线| 精品久久久免费| 欧美另类videosbestsex日本| 免费av在线电影| 不卡视频一二三四| 亚洲综合视频1区| 亚洲视频在线免费播放| 亚洲综合三区| 97久久精品国产| 久久99久久98精品免观看软件 | 波波电影院一区二区三区| 国产精品自产拍在线观看| 国产精品100| 黄色综合网站| 欧美久久久精品| 一级免费黄色录像| 精品亚洲成人| 亚洲图片在线综合| 在线免费观看日韩av| 丁香五月缴情综合网| 91精品国产福利在线观看| 青青草精品视频在线观看| xx欧美xxx| 天天爽夜夜爽夜夜爽精品视频| 亚洲国产一二三精品无码| 美女国产在线| 亚洲欧洲国产日本综合| 亚洲人成网站在线播放2019| 国产在线播放av| 久久青草国产手机看片福利盒子| 激情伦成人综合小说| 懂色av蜜臀av粉嫩av分享吧| 国产suv精品一区二区三区| 97人人干人人| 亚洲第一精品网站| 成人在线视频一区| 国产精品视频福利| 日本黄色不卡视频| 96av麻豆蜜桃一区二区| 精品久久蜜桃| 欧美日韩视频精品二区| 国产欧美视频一区二区三区| 日韩欧美精品一区二区| 四虎久久免费| 亚洲精品国产一区二区三区四区在线| 免费观看国产视频在线| 91cn在线观看| 亚洲丰满少妇videoshd| 日本中文字幕网址| 日韩成人动漫| 欧美日韩一区二区三区视频| 中文字幕 日韩 欧美| 日韩精品视频中文字幕| 亚洲国产精品字幕| 精品人妻互换一区二区三区| 第九色区aⅴ天堂久久香| 久久精品亚洲热| 久久一区二区三| 亚洲永久免费精品| 国产精品中文字幕在线| 亚洲AV无码乱码国产精品牛牛| 99re成人精品视频| 亚洲精品日韩精品| 午夜dj在线观看高清视频完整版| 亚洲国产综合人成综合网站| 可以免费观看av毛片| 黄页免费欧美| 亚洲激情电影中文字幕| 欧美老女人性生活视频| 欧美永久精品| 日韩美女在线观看一区| 国产伦理一区二区| 91视频免费观看| 综合久久国产| 黄在线观看免费网站ktv| 欧美日韩不卡视频| youjizz.com国产| 日韩黄色大片| 午夜精品久久久久久99热| 自拍偷拍精品视频| 99精品视频一区二区| 天堂精品视频| 高清毛片在线观看| 欧美精品1区2区3区| 少妇饥渴放荡91麻豆| 97视频热人人精品免费| 欧美一区二区影院| 国产精品视频第一页| 久久久不卡网国产精品二区| 国产精品免费看久久久无码| 成人影院av| 欧美成人伊人久久综合网| 亚洲av成人无码久久精品| 激情综合自拍| 91在线视频一区| 国产日韩精品在线看| 亚洲影视在线观看| 亚洲黄色片免费| 欧洲杯半决赛直播| 欧美一级大片视频| www黄色在线观看| 中文字幕在线一区二区三区| 大肉大捧一进一出好爽动态图| 国产精品sss在线观看av| 精品国产一区二区在线| 中文字幕在线天堂| 久久婷婷国产综合精品青草| r级无码视频在线观看| 免费精品一区| 久久精品99久久久久久久久 | 91九色在线看| 日韩精品中文字幕一区| 97精品在线播放| 日本va欧美va精品| 日本免费高清一区二区| 亚洲同志男男gay1069网站| 亚洲成色777777女色窝| 麻豆91精品91久久久| 国产精品夜夜爽| ijzzijzzij亚洲大全| 不卡精品视频| 久久伊人色综合| 国产精品无码白浆高潮| 亚洲欧美在线aaa| www.午夜av| 欧美 日韩 国产精品免费观看| 国产日韩精品一区二区| 欧美成人hd| 欧美日高清视频| 天天鲁一鲁摸一摸爽一爽| 捆绑变态av一区二区三区| 亚洲一区二区三区四区中文| 成人高清一区| 久久精品国产69国产精品亚洲 | 在线成人视屏 | 欧美性video| 精品国产一区二区在线观看| 国产福利久久久| www.在线成人| 国产在线观看福利| 国产精品一区二区av交换| 国产精品入口免费视| 午夜在线免费观看视频| 91精品国产免费| 国产精品第108页| 91免费看`日韩一区二区| 日韩欧美在线播放视频| 波多野结衣一区| 亚洲精品免费在线视频| 国产丝袜视频在线播放| 日韩精品高清在线| 青青草视频在线观看免费| 亚洲欧洲精品天堂一级| 亚洲男女在线观看| 久久久噜噜噜久久狠狠50岁| 一本一本a久久| 51社区在线成人免费视频| 78色国产精品| 91在线视频| 欧美tk—视频vk| 伦av综合一区| 亚洲欧美日韩国产成人精品影院 | 亚洲色图在线播放| 99riav国产精品视频| 羞羞答答国产精品www一本 | 黄色免费网站在线| 亚洲高清在线观看| 久久影视中文字幕| 亚洲黄色小说网站| 国产免费一区二区三区网站免费| 国内成人精品2018免费看| 成人性生活视频免费看| 日韩欧美三级| 精品不卡一区二区三区| 日本一区二区中文字幕| 2018日韩中文字幕| 国产在线激情| 亚洲天堂成人在线视频| 精品国产伦一区二区三区| 色综合久久久久久久久| avove在线播放| 欧美激情一区二区三区不卡 | 免费一区二区三区视频导航| 91人成网站www| 小黄鸭精品aⅴ导航网站入口| 九九热精品视频| av福利在线播放| 日韩激情在线视频| 亚洲精品国产精品乱码不卡| 欧美午夜在线观看| 国产午夜在线播放| 亚洲精品国产第一综合99久久 | 狠狠色狠狠色综合日日小说| 九九热最新地址| 国产精品嫩草影院com| 特级西西人体4444xxxx| 国产成人精品网址| 韩国中文字幕av| 久久精品官网| 91好吊色国产欧美日韩在线| 久久久五月天| 一区在线电影| 精品国产网站| 日本一区二区久久精品| 日韩超碰人人爽人人做人人添| 97se国产在线视频| 国产精品成人3p一区二区三区| 欧美一区二区三区免费观看| 色戒汤唯在线| 97久久久久久| 美女扒开腿让男人桶爽久久软| 久久99久久亚洲国产| 91黄色在线| 欧美黑人视频一区| 人人超在线公开视频| 久久高清视频免费| 直接在线观看的三级网址| 久久人体大胆视频| 成人在线直播| 久久精品国产精品亚洲| 黄色网在线免费看| 久久精品国产电影| 黄色大片在线播放| 欧美成人激情图片网| 久操视频在线观看| 不卡av在线播放| 好吊日视频在线观看| 美女视频久久黄| 亚洲资源一区| 国内精品久久久久伊人av| 青草视频在线免费直播| 久久久免费av| 在线天堂资源| 国产精品久久久久av| 欧美视频在线视频精品| 成人福利免费观看| 色妞ww精品视频7777| 国产精品露出视频| 午夜精品福利影院| 日韩精品无码一区二区三区| 久久中文字幕av一区二区不卡| 欧美性视频在线播放| 欧美有码视频| 男人的天堂狠狠干| 久久一区精品| 国产色视频在线播放| 国产精品一级在线| 中国xxxx性xxxx产国| 久久中文娱乐网| 成人性视频免费看| 一区二区欧美国产| 丰满少妇乱子伦精品看片| 91久久国产综合久久| 国产精品嫩草影院精东| 精品日韩99亚洲| 欧美zozo| 久久亚洲成人精品| 涩涩视频网站在线观看| 国产欧美精品久久久| 91久久偷偷做嫩草影院电| 欧美极品jizzhd欧美| 国产精品久久久久9999赢消| 男人天堂av片| 免费精品视频最新在线| 熟妇高潮一区二区| 亚洲国产高清在线| 久久久综合久久| 在线亚洲一区观看| 亚洲精品久久久狠狠狠爱| 亚洲欧美制服丝袜| 性直播体位视频在线观看| 国产suv精品一区二区| 欧美2区3区4区| 欧美激情论坛| 精品1区2区3区4区| 视频二区在线播放| 91偷拍与自偷拍精品| 久久免费看少妇高潮v片特黄| 亚洲国产一区视频| 国产美女免费视频| 亚洲欧美日韩一区二区在线 | 国产精品丝袜高跟| 精品国产导航| 国产高潮呻吟久久久| 久久激情视频| 国产高潮视频在线观看| 国产精品不卡视频| 波多野结衣mp4| 亚洲成色www8888| 精品麻豆一区二区三区 | 青草视频在线观看视频| 日本中文字幕一区二区视频 | 精品国产乱码久久久| 丰满少妇大力进入| 国产一区中文字幕| 精品在线观看一区| 欧美影视一区二区三区| 五月婷中文字幕| 欧美激情影音先锋| 久久久久久亚洲精品美女| 亚洲图色在线| 免费的成人av| 国产成人无码精品久久二区三| 五月天久久比比资源色| 亚洲成人久久精品| 久久国产精品久久久久久| 日韩专区视频| 一区二区三区的久久的视频| 日本不卡一区二区| 欧美多人猛交狂配| 狠狠做深爱婷婷久久综合一区| 人成网站在线观看| 性欧美xxxx| 久久99精品国产自在现线 | 日韩成人伦理电影在线观看| 国产激情视频网站| 精品久久久久久中文字幕一区奶水 | 国产丝袜美腿一区二区三区| 国产无遮挡裸体免费视频| 日韩视频免费观看高清在线视频| 成人免费在线观看| 国产精品99久久久久久www| 国产精品免费不| 蜜臀久久99精品久久久酒店新书| 91一区二区三区在线观看| 在线观看国产亚洲| 亚洲精品视频免费| 中文字幕av一区二区三区佐山爱| 日本一区二区精品| 久久精品72免费观看| 黄色片网站在线播放| 69p69国产精品| 综合久久2o19| 国产精品视频一区二区三区经| 国内精品久久久久久久97牛牛 | 天天摸天天干天天操| 国产最新精品视频| 九九热hot精品视频在线播放| 国产中文字幕视频在线观看| 91小视频免费看| 五月婷婷丁香在线| 日韩有码在线电影| 亚洲日本va中文字幕| 亚洲国产精品成人天堂| 久久这里只精品最新地址| 国产精品传媒在线观看| 精品精品国产国产自在线| 中文一区二区三区四区| 欧美 国产 日本| 欧美国产精品中文字幕| 国产不卡精品视频| 国内揄拍国内精品少妇国语| 国产成人精品一区二区免费看京| 污污的视频免费| 香蕉久久一区二区不卡无毒影院 | 天天躁日日躁成人字幕aⅴ| 波多野结衣作品集| 亚洲色图视频免费播放| 后进极品白嫩翘臀在线视频| 日本高清久久天堂| 羞羞色午夜精品一区二区三区| 北京富婆泄欲对白| 欧美视频在线一区| 日本资源在线| 日韩激情视频| 国产91精品露脸国语对白| 亚洲国产av一区二区三区| 日韩少妇与小伙激情| 欧美挤奶吃奶水xxxxx| 黄色永久免费网站| 午夜国产精品一区| 欧美成人xxx| 麻豆av一区二区三区| 国产九色精品成人porny | 久久国产精品99国产| 黑人巨大精品一区二区在线|