精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首個多輪LLM Router問世, Router-R1可讓大模型學(xué)會「思考–路由–聚合」

人工智能 新聞
本文提出的 Router-R1 不是又一個 “更大的模型”,而是讓多個模型協(xié)同工作的新范式。

Haozhen Zhang 現(xiàn)為南洋理工大學(xué)(NTU)博士一年級學(xué)生,本工作完成于其在伊利諾伊大學(xué)厄巴納-香檳分校(UIUC)實習(xí)期間。Tao Feng 為 UIUC 博士二年級學(xué)生,Jiaxuan You 為 UIUC 計算機系助理教授。團隊長期聚焦 LLM Router 方向,已產(chǎn)出 GraphRouter、FusionFactory 及本文 Router-R1 等多項代表性研究成果。

“如果一個問題只需小模型就能回答,為什么還要讓更貴的大模型去思考?”

在大語言模型(LLM)種類爆炸的時代,這個看似簡單的問題,正成為 AI 系統(tǒng)設(shè)計的關(guān)鍵瓶頸。面對性能、延遲與成本的多重平衡,如何智能地在不同 LLM 之間分配任務(wù),已經(jīng)成為 AI 基礎(chǔ)設(shè)施的新挑戰(zhàn)。

近日,來自伊利諾伊大學(xué)香檳分校(UIUC)的研究團隊在 NeurIPS 2025 上發(fā)布了新作:《Router-R1:Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning》,本文提出了首個多輪 LLM Router 框架 Router-R1,讓 LLM 不止會 “回答”,還會 “思考、調(diào)度與協(xié)調(diào)其他模型” 來達到可控的性能與成本平衡。

  • 論文標(biāo)題:Router-R1: Teaching LLMs Multi-Round Routing and Aggregation via Reinforcement Learning
  • 作者團隊: Haozhen Zhang, Tao Feng, Jiaxuan You
  • 機構(gòu): University of Illinois at Urbana-Champaign
  • 論文地址: https://arxiv.org/abs/2506.09033
  • 代碼地址: https://github.com/ulab-uiuc/Router-R1

背景:從「一個模型回答所有問題」到「智能調(diào)度」

ChatGPT、Claude、Gemini、Qwen、LLaMA……,短短兩年,LLM 家族已從寥寥數(shù)個增長到百余種。不同模型各有優(yōu)勢,有的擅長邏輯推理,有的在知識問答上精準(zhǔn),有的響應(yīng)快、成本低。

但如今的 AI 應(yīng)用,大多依賴單一模型推理,即用戶問題會直接被送入某個固定的 LLM 中進行回答。這種方式雖然簡單,但卻意味著:簡單問題可能導(dǎo)致算力浪費;復(fù)雜問題又可能因模型能力不足而回答錯誤。

因此,“LLM Router” 應(yīng)運而生并正在成為 AI 系統(tǒng)的新前臺大腦:不同于 Token-level Router(如 MoE),LLM Router 在 Query-level 層面進行路由,它能夠判斷一個問題的復(fù)雜度、匹配最合適的模型,甚至動態(tài)組合多個模型完成推理。

然而,現(xiàn)有的 LLM Router(如 GraphRouter、RouterDC 等)大多采用單輪決策機制:給定一個問題,只路由到一個候選模型完成回答,這種單輪路由機制難以處理多跳推理或跨領(lǐng)域的復(fù)雜任務(wù)。

Router-R1:讓 Router 本身成為一個「會思考的 LLM」

本文提出的 Router-R1 的核心創(chuàng)新在于讓 Router 自身成為一個具備推理能力的 Policy LLM。

也就是說,Router-R1 不再只是一個 “Query 分發(fā)器”,而是一個擁有思維鏈,能主動進行 “思考 — 選擇模型 — 聚合” 的智能體,可以在思考,路由,聚合幾種行為之間反復(fù)切換并進行多輪路由迭代,逐步構(gòu)建最終答案:

1?? Think(思考):在接收到 User Query 后,Router-R1 會首先執(zhí)行 “思考” 階段進行內(nèi)部推理分析,并判斷是否需要外部信息進行輔助;

2?? Route(路由):若發(fā)現(xiàn)需要額外信息,Router-R1 則觸發(fā) “路由” 指令根據(jù)每個 LLM 的 Descriptor Prompt 動態(tài)調(diào)用合適的外部候選模型(如 Qwen、LLaMA、Gemma、Mixtral 等)進行回答子問題;

3?? Aggregate(聚合):外部模型調(diào)用的回復(fù)結(jié)果返回后繼續(xù)插入 Policy LLM 的 Evolving Context 進行聚合,并繼續(xù)進行后續(xù)的多輪推理逐步生成最終答案。

這種 “思考–路由–聚合” 的交替機制,使 Router-R1 能充分利用不同 LLM 的互補優(yōu)勢(例如一個擅長數(shù)學(xué)推理、另一個擅長知識檢索),潛在實現(xiàn)真正的多模型協(xié)同推理。

用強化學(xué)習(xí)教 Router 平衡性能與成本

Router-R1 將整個多輪路由過程形式化為一個序列決策問題,并通過強化學(xué)習(xí)訓(xùn)練 Router 使之學(xué)會在復(fù)雜決策空間中優(yōu)化 Performance-Cost Trade-off。論文中設(shè)計了三類直觀的獎勵函數(shù):

1?? Format Reward:輸出 Format 正確性獎勵

確保模型輸出嚴(yán)格遵守如 <think>、<answer> 等格式約束,防止訓(xùn)練早期生成無效文本。

2?? Final Outcome Reward:結(jié)果正確性獎勵

采用 Exact Match(EM)指標(biāo)衡量生成答案與標(biāo)準(zhǔn)答案是否完全一致,直接激勵 Router 輸出正確結(jié)果。

其中 是 LLM 輸出的 prediction, 是 ground truth。

3?? Cost Reward:成本約束獎勵

Router-R1 創(chuàng)新地引入了計算成本獎勵機制,根據(jù)被調(diào)用模型的參數(shù)規(guī)模及輸出 Token 數(shù)設(shè)計反比例獎勵函數(shù):

其中  表示 API 服務(wù)的單位 Token 成本函數(shù), 為被調(diào)用的外部模型的參數(shù)量, 為輸出的 Token 數(shù)量。該機制可促使 Router-R1 在回答問題時考慮到性能與成本的權(quán)衡,以實現(xiàn)可控且動態(tài)的成本感知路由與推理。

綜合三者后,Router-R1 的總獎勵為:

其中超參 α 控制性能與成本的權(quán)衡程度。

七大基準(zhǔn)全面領(lǐng)先:準(zhǔn)確率 + 泛化性雙提升

研究團隊在 7 個 QA Benchmark 上對 Router-R1 進行了系統(tǒng)評測,涵蓋單跳與多跳推理任務(wù),包括 NQ、TriviaQA、PopQA、HotpotQA、2WikiMultiHopQA、Musique 和 Bamboogle。Router-R1 僅在 NQ 與 HotpotQA 數(shù)據(jù)集上進行訓(xùn)練,在其余數(shù)據(jù)集上執(zhí)行 Out-of-domain Evaluation。

如上圖所示,當(dāng) α=0 時(即只優(yōu)化 performance 不考慮 cost),Router-R1 在所有數(shù)據(jù)集上達到了綜合最強的性能,擊敗了如 GraphRouter/RouterDC 等單輪路由方法,并展現(xiàn)出了對 Unseen Dataset 的較強泛化性。

如上圖所示,當(dāng)繼續(xù)改變超參 α 來探究性能成本權(quán)衡時,隨著 α 增加,調(diào)用成本顯著下降,為可控成本的 LLM 智能調(diào)度策略開辟了新的范式。

同時,為了檢測 Router-R1 對外部候選 LLM 的泛化性,如上圖所示在未參與訓(xùn)練的外部模型加入后,無需重新訓(xùn)練即可保證性能的相對穩(wěn)定并在此基礎(chǔ)上實現(xiàn)提升,顯示出 Router-R1 優(yōu)異的零樣本遷移能力。

總結(jié):邁向「多模型協(xié)同智能體」的時代

本文提出的 Router-R1 不是又一個 “更大的模型”,而是讓多個模型協(xié)同工作的新范式。Router-R1 通過強化學(xué)習(xí),讓 LLM 從 “單一回答者” 進化為「多智能體協(xié)調(diào)者」,在性能與成本之間實現(xiàn)動態(tài)平衡。得益于此,Router-R1 能在減少算力和成本開銷的同時保持高質(zhì)量輸出,降低大模型部署的環(huán)境與資源壓力。Router-R1 天然支持模型重用與模塊化組合,只需添加新模型描述即可快速集成,為構(gòu)建可擴展、多模型共生的 AI 基礎(chǔ)設(shè)施奠定了基礎(chǔ)。

值得注意的是,最新的 GPT-5 技術(shù)報告也已明確采用 LLM Router 機制來進行不同版本模型的動態(tài)調(diào)度,這進一步印證了 Router-R1 所代表的趨勢:多模型協(xié)同路由將成為未來大模型生態(tài)不可或缺的底層基礎(chǔ)設(shè)施。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-01-08 08:21:16

2023-05-24 08:14:55

2009-12-04 15:01:43

Router介紹

2025-04-09 09:00:00

開源模型數(shù)據(jù)

2015-02-03 16:09:35

2025-06-13 09:29:51

2012-11-12 10:26:12

SSH協(xié)議路由器Router

2025-09-19 09:46:53

2025-09-28 09:00:00

2024-12-18 18:57:58

2021-12-14 19:40:07

Node路由Vue

2015-04-14 11:19:21

2025-09-18 09:00:47

2023-10-06 20:30:33

大模型LLMtoken

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-03-21 13:00:54

2021-05-14 07:35:06

Vue Router 特性變化

2025-04-07 09:23:00

大模型LLM推理

2025-10-11 09:23:28

RLPT強化學(xué)習(xí)預(yù)訓(xùn)練數(shù)據(jù)

2022-02-02 21:29:39

路由模式Vue-Router
點贊
收藏

51CTO技術(shù)棧公眾號

久久福利电影| 欧美日韩xxx| 欧美午夜影院一区| 97在线免费观看视频| 88久久精品无码一区二区毛片| 欧美xxx视频| 亚洲欧洲国产专区| 久久精品人成| 亚洲中文一区二区三区| 精品动漫一区| 日韩中文字幕亚洲| 亚洲啪av永久无码精品放毛片 | 97在线观看免费| xxxxx99| 91精品国产自产在线丝袜啪| 色欧美乱欧美15图片| 中文字幕精品在线播放| 免费a级毛片在线观看| 精品在线观看免费| 国产97色在线|日韩| 麻豆视频在线观看| 秋霞av在线| av成人影院在线| 日本一区二区三区国色天香 | 99在线无码精品入口| 翔田千里一区二区| 欧美国产日本在线| 中文字幕第69页| 在线一级成人| 欧美精品一区男女天堂| 日韩av一卡二卡三卡| 老司机深夜福利在线观看| 伊人婷婷欧美激情| 一本久道久久综合狠狠爱亚洲精品| 天天操天天干天天舔| 国产精品资源在线| 成人久久久久爱| 亚洲高清在线看| 亚洲三级国产| 久久久亚洲国产| 超碰手机在线观看| 国产国产精品| 色狠狠av一区二区三区香蕉蜜桃| 国产福利在线观看视频| 手机看片1024日韩| 电影av在线| 成人晚上爱看视频| 91视频在线免费观看| 影音先锋国产在线| 免费高清在线视频一区·| 国产成人中文字幕| 久久久久久无码午夜精品直播| 国产精品普通话对白| 97色在线视频| 国产成人精品一区二三区| 国产精品久久777777毛茸茸| 亚州国产精品久久久| 香蕉免费毛片视频| 午夜一区不卡| 国产精品wwwwww| 久久久久亚洲视频| 另类人妖一区二区av| 国产欧美日韩免费看aⅴ视频| 亚洲天堂网视频| 久久97超碰国产精品超碰| 国产日韩欧美视频在线| 国产精品人人爽| 国产风韵犹存在线视精品| 国产91精品入口17c| 视频污在线观看| 国产色91在线| 在线视频不卡国产| 先锋影音在线资源站91| 欧美啪啪网站| 91免费视频观看| 久久国产精品-国产精品| 亚洲人午夜射精精品日韩| 不卡欧美aaaaa| 久久亚洲高清| 噜噜噜噜噜在线视频| 国产欧美一二三区| 亚洲福利av| 国内外激情在线| 亚洲高清视频的网址| 蜜桃视频一区二区在线观看| 亚洲91av| 午夜精品免费在线观看| 能在线观看的av| 四虎成人在线| 色噜噜狠狠成人中文综合| 少妇人妻互换不带套| 99久久久国产精品免费调教网站| 粉嫩老牛aⅴ一区二区三区| 日韩中文字幕组| 少妇高潮一区二区三区99| 日韩一区二区精品葵司在线| 久久久久国产免费| 久久动漫网址| 久久精品成人欧美大片古装| 日本天堂中文字幕| 国产精品入口66mio| 国产精品草莓在线免费观看| 国产精品一区二区免费视频 | 欧美国产日韩一区| 激情五月色婷婷| 老司机亚洲精品| 亚洲www视频| 欧美在线 | 亚洲| 欧美韩日一区二区三区| 久久久久久免费看| 色成人免费网站| 欧美大胆人体bbbb| 少妇精品无码一区二区免费视频 | 99re热视频这里只精品| 日韩欧美99| 激情在线视频播放| 色8久久精品久久久久久蜜| jizz欧美性11| 亚洲国产精品18久久久久久| 成人豆花视频| 精品国产sm最大网站免费看| 国产aaaaaaaaa| 亚洲欧美日韩综合国产aⅴ| 俄罗斯精品一区二区| 麻豆av在线免费看| 狠狠躁夜夜躁人人爽超碰91 | 久久综合影音| 97视频热人人精品| 亚洲人妻一区二区三区| 亚洲成人综合视频| 国产一伦一伦一伦| 神马香蕉久久| 欧美理论片在线观看| 无码视频一区二区三区| 成人动漫视频在线| 伊人久久大香线蕉午夜av| 深夜av在线| 精品乱人伦小说| 希岛爱理中文字幕| 青青草国产成人av片免费| 国产嫩草一区二区三区在线观看| 浪潮av一区| 欧美在线免费视屏| 欧美丰满老妇熟乱xxxxyyy| 国产专区一区| 亚洲aa中文字幕| 午夜在线视频播放| 色老头久久综合| 素人fc2av清纯18岁| 尤物精品在线| 91色视频在线观看| 午夜伦理在线视频| 日韩一区二区免费在线观看| 无码人中文字幕| 日韩精品久久理论片| 鲁丝一区二区三区免费| 美女露胸视频在线观看| 精品国产乱码久久久久久夜甘婷婷| 久久久久无码国产精品| 国产裸体歌舞团一区二区| 亚洲一区二区免费视频软件合集| 经典三级一区二区| 永久555www成人免费| 国产在线一级片| 欧美激情一区二区三区不卡| www日韩视频| 欧美精品尤物在线观看| 国产精品高清网站| 国产福利第一视频在线播放| 范冰冰一级做a爰片久久毛片| 欧美日韩中文在线| 亚洲永久无码7777kkk| 伊人天天综合| 九九九九九精品| sese综合| 伊人久久男人天堂| 亚洲中文字幕在线一区| 一区二区高清在线| 国产精品无码专区| 久久电影一区| 日韩少妇中文字幕| 日本一区二区中文字幕| 久久视频这里只有精品| 国产精品人妻一区二区三区| 精品福利免费观看| 91精彩刺激对白露脸偷拍| 日本不卡中文字幕| 男人天堂成人网| 丁香婷婷成人| 日本韩国欧美精品大片卡二| 国产视频精选在线| 欧美一级黄色片| 日本三级理论片| 国产欧美日韩亚州综合| 日日夜夜精品视频免费观看| 一区在线免费观看| 四虎影院一区二区三区| 亚洲一区有码| 97超碰蝌蚪网人人做人人爽| 国产福利在线看| 精品女同一区二区| 无码视频一区二区三区| 亚洲精品欧美在线| 国产二级一片内射视频播放| 麻豆成人综合网| 秋霞无码一区二区| 国语产色综合| 99精品99久久久久久宅男| 日韩精品av| 久久在线免费视频| 性xxxx视频播放免费| 欧美日韩第一区日日骚| 国产成人亚洲欧洲在线| 亚洲欧美怡红院| 日b视频在线观看| 久久国产精品免费| 日本在线xxx| 国产精品99在线观看| 久久99导航| 国产极品嫩模在线观看91精品| 91国内精品久久| 超碰caoporn久久| 亚洲人成网站999久久久综合| 国产视频www| 在线观看不卡一区| 久久久久免费视频| 亚洲欧洲综合在线| 日韩亚洲欧美综合| 国产精华7777777| 亚洲成av人片在线观看无码| 日本视频在线免费| 国产欧美日韩在线| 精品黑人一区二区三区观看时间| 精品系列免费在线观看| 欧美日韩一区二区在线免费观看| 很黄很黄激情成人| 伊人av成人| 91精品国产91久久久久久密臀| 玛丽玛丽电影原版免费观看1977 | 91精品福利在线| 福利一区二区三区四区| 自拍视频在线观看一区二区| 精品人妻一区二区三区蜜桃视频| 国产精品综合视频| 韩国三级hd中文字幕有哪些| 精品一区二区三区在线视频| 国产精品69页| 久久中文在线| 成年人免费大片| 国产精品五区| 久久精品午夜福利| 亚洲欧美日韩国产一区二区| av在线播放天堂| 欧美+日本+国产+在线a∨观看| 亚洲精品影院| 自拍偷拍精品| 日韩精品欧美专区| 久久91精品| 欧美日本韩国一区二区三区| 日本中文字幕在线一区| 精品国产免费久久久久久尖叫| 福利电影一区| 欧美视频小说| 狠狠做六月爱婷婷综合aⅴ| 欧美高清性xxxxhd | 亚洲7777| 国产高清久久| 91九色国产ts另类人妖| 重囗味另类老妇506070| 欧洲xxxxx| 欧美三级网页| 欧美少妇一区二区三区| 亚洲清纯自拍| aaaaaa亚洲| 久久成人久久鬼色| 激情久久综合网| 成人精品国产一区二区4080| 尤物视频最新网址| 中文字幕一区二区在线观看| 娇妻被老王脔到高潮失禁视频| 国产亚洲一本大道中文在线| 极品尤物一区二区| 中文字幕av一区二区三区免费看| 91国偷自产一区二区三区的观看方式| 国产视频网站在线| 最近2019年好看中文字幕视频 | 一区二区三区av在线| 亚洲一区 二区 三区| www.av蜜桃| 日韩vs国产vs欧美| 色婷婷一区二区三区在线观看| 白白色 亚洲乱淫| 女人又爽又黄免费女仆| 国产欧美精品国产国产专区| 国产稀缺精品盗摄盗拍| 欧美日韩日本国产| 国产绿帽一区二区三区| 日韩大陆毛片av| 中文字幕日本在线观看| 欧美国产日韩视频| 日韩精品一区二区三区| 成人免费91在线看| 九热爱视频精品视频| 先锋影音男人资源| 国产视频久久| 毛片毛片毛片毛| 久久久久久久性| 超碰手机在线观看| 色婷婷av一区二区| www.精品久久| 亚洲日韩欧美视频| 午夜欧美激情| 亚洲最大福利视频网| 蜜臀91精品国产高清在线观看| 中文字幕久久一区| 欧美日韩精品| 亚洲一区二区三区四区精品| 久久久久久久久久看片| 久久久久国产精品夜夜夜夜夜| 在线一区二区三区四区| 精品久久久无码中文字幕| 在线观看视频99| free性护士videos欧美| 国产欧美日韩视频| 久久av网址| 黄色一级在线视频| 成人午夜电影网站| 小泽玛利亚一区| 欧洲激情一区二区| 五月婷婷深深爱| 久久视频在线看| 日本h片久久| 欧美成人综合一区| 亚洲五月婷婷| 男操女免费网站| 国产欧美日韩三区| 国内自拍视频在线播放| 欧美成va人片在线观看| 在线观看免费版| 欧美专区在线播放| 精品中文一区| 国自产拍偷拍精品啪啪一区二区| 国产精品亚洲一区二区三区妖精 | 国产精品人人做人人爽人人添| 国产又大又黄又粗| 日韩成人在线视频| 老熟妇一区二区| 一本色道久久精品| 手机在线国产视频| 亚洲精品中文在线| 91精品人妻一区二区三区果冻| 亚洲天堂av高清| 高清电影一区| 免费一区二区三区| 裸体一区二区| 波多野结衣一本| 色婷婷国产精品| 深夜福利在线视频| 国产成人鲁鲁免费视频a| 五月天亚洲一区| 欧美a在线视频| 久久麻豆一区二区| 在线观看毛片网站| www日韩中文字幕在线看| 影视一区二区三区| 黄瓜视频免费观看在线观看www| 久久国产乱子精品免费女| 91n在线视频| 91精品国产色综合久久ai换脸| 青春草在线视频| 国产精品夜夜夜一区二区三区尤| 国产亚洲精品bv在线观看| 自拍偷拍视频亚洲| 日韩欧美成人网| 国内精品久久久久国产| yy111111少妇影院日韩夜片| 欧美午夜电影在线观看 | 99久久99久久免费精品蜜臀| 可以在线观看av的网站| 亚洲精品视频在线观看视频| 成人在线爆射| 欧美三级午夜理伦三级老人| 岛国av在线一区| 成人在线免费看视频| 在线观看中文字幕亚洲| 日本成人手机在线| 妞干网在线观看视频| 久久久久国产成人精品亚洲午夜 | 欧美性猛交xxxx黑人| 9色在线视频网站| 亚洲一区二区三区四区在线播放| 欧美日韩国产精品一区二区亚洲| 欧美日韩一区二区三区四区五区六区| 欧美性色视频在线| 麻豆av免费在线观看| 成人免费看片网址| 三级亚洲高清视频| 亚洲女人久久久| 亚洲风情亚aⅴ在线发布| 日韩国产网站|