精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

真·MoE?路由LLM最全面探索:一種筆記本也能玩的大模型Scaling Up研究

人工智能 新聞
來自中山大學和普渡大學的研究人員在基于上述海量的記錄做了一番探索之后,發現了一個現象,叫做Model-level Scaling Up。

事關路由LLM(Routing LLM),一項截至目前最全面的研究,來了——

共計收集和整理了涉及8500+個LLM,在12個Benchmark上的共2億條性能記錄!

圖片

先來簡單科普一下路由LLM。

這種方法主要是把像ChatGPT、Qwen、DeepSeek這些成型的LLM當作 “專家” ,當給一個輸入的時候,有分類能力的Router(路由器)就會把這個輸入分配給合適的LLM處理。

如此一來,就能實現高性能、低計算消耗、低幻覺等目標。

而來自中山大學普渡大學的研究人員在基于上述海量的記錄做了一番探索之后,發現了一個現象,叫做Model-level Scaling Up。

一言蔽之,就是一個好的Router,可以讓路由LLM范式的性能隨著LLM候選數量的增加迅速變強。

隨后,他們通過這些數據構建了針對Router設計的評測RouterEval。

值得注意的是,其他研究人員,也可以通過RouterEval在很少的計算資源下(如筆記本、單卡GPU上)就能參與到該路由LLM的研究當中。

2億條記錄中發現的新現象

當大多數研究人員和開發者第一次聽到Mixture-of-Expert (MoE) 的時候,可能第一反應不是現在常見的對結構中的FFN層進行擴展,以FFN層作為”expert”。

而是直接將每一個成型的LLM,比如ChatGPT、Qwen、DeepSeek等直接看做是”expert”。

實際上,這種范式也稱為路由LLM(Routing LLMs)。

圖片

簡單地說,就是給定一個輸入input,一個具有一定分類能力的Router (路由器)會將input分配給指定的LLM進行處理,以達到高性能、低計算消耗或者是低幻覺等各種各樣的目標,或組合目標。

這類問題可以被認為是分類問題、推薦系統問題、Agent規劃甚至是檢索問題(注意,不是檢索數據for LLM,而是檢索LLM for 數據)。

一些典型的例子有:

  1. 人機客服切換:機器人客服無法解決問題的時候自動切換到更高級的客服,比如更智能的機器人,甚至人類;
  2. 強弱LLM切換:比如困難問題給GPT4解決(費用貴),簡單問題給GPT3解決(費用低)
圖片
△路由LLM (Routing LLMs)示意圖

路由LLM具有很高的應用潛力和兼容性,不同LLM都可以被添加到LLM候選Pool中參與routing(包括異構LLM,各種tuning/pretraining方法下得到的LLM,等等),而且可以發揮很強的性能。

比如最近UCB提出的Prompt-to-Leaderboard以很低的訓練成本,以路由LLM的范式下實現和需要數十萬個GPU訓練得到的Grok3相當的性能,并登上Arena排行榜第一。

然而當前路由LLM領域仍然存在一些挑戰影響了Router的發展:

  1. 缺乏統一的benchmark。各個研究都在小范圍的構建各種的benchmark進行研究;
  2. 當前benchmark不夠全面:當前的工作一般只涉及少量的LLM、evaluations,而且大多數是閉源不公開。

于是,研究團隊收集并整理且開源了涉及8567個不同LLMs在12個evaluations下2億條性能記錄,并通過這些記錄發現:

  1. Model-level Scaling Up現象:有一定能力的Router,可以使得routing llm范式下的性能隨著llm pool的擴大而迅速上升。過去的研究由于涉及的不同LLM較少,不容易觀察到這個現象。
  2. 通過這些數據,我們構建了全面的針對Router設計的評測RouterEval。其全面性可以大大幫助Router設計的探索。鑒于該測評已經整理良好且很簡潔,可以被看做是傳統的分類問題,所有研究者都可以以很少的計算消耗(甚至單卡或筆記本電腦)參與該大模型的研究當中。
圖片
△Model-level Scaling Up現象示意圖

利用2億條性能記錄,可以構建完美Router,即oracle Router ro

圖片

接著,根據上式可以構建不同性能的Router ro(p),其中wm為隨機Router,當p→1時,Router ro(p)越解決上界分類性能,當p→0時,ro(p)越接近隨機Router。

從上圖結果來看,隨著LLM候選的數量增加,不同的evaluation在具有一定能力的Router下呈現了Scaling Up現象。

而性能一般的Router,比如隨機Router則幾乎沒有Scaling Up現象。

且快速超過參考模型Ref. LLM的性能(參考模型一般是GPT4)。

另外團隊還可以發現兩個有趣的現象:

圖片

RouterEval涉及的LLM的參數分布

  1. 弱LLM也能組合出非常強的性能。上圖給出了RouterEval中涉及的LLM的參數分布,LLM的參數為7B或以下的情況占優。文章發現,即使較弱的LLM也可以組合出不錯的性能,比如5個性能在少于0.3的情況下,ro可以讓他們互補優勢在MMLU上達到0.95(超越GPT4)的性能。
  2. 少量的LLM候選已經足夠。從Model-level Scaling Up現象示意圖可以看到3-10個LLM候選的時候已經可以達到非常不錯的性能。而且此時的部署成本并不高,具有很高的性價比。

當前Router的結果

通過測試當前的已有的Routers的性能,可以發現現在Router仍然有很大的提升空間。

不過幸運的是,RouterEval進行的Router設計的實驗不需要大量的計算資源,且可以融入不同的已有技術,包括few-show learning,數據增強、推薦系統、正則化方法、預訓練模型、額外數據等等.

因此Router將有希望快速得到實質性改進。

圖片

以及,和當前一些其他范式的區別和關系如下:

圖片

  1. 推薦系統:Routing LLM其實是特殊的推薦系統,LLM的input是推薦系統中的user信息,LLM候選是推薦系統中的商品item,而性能記錄則是推薦系統中的歷史用戶書記記錄;
  2. LLM集成:一般LLM集成是post-decision,即讓多個LLM完成推理后再合并。而Routing LLM是pre-decision,即在LLM推理前就要決定是哪個LLM來處理;
  3. LLM Fusion:LLM融合主要針對是同質的LLM的“合作”,而Routing LLM可以讓“異質”(包括不開源)的LLM進行“合作”
  4. Mixture-of-Experts (MoE): Routing LLM是model-level的MoE

當然,研究團隊也提出一些未來的挑戰。

首先就是缺乏數據。

要獲得足夠好的Router,當然的數據仍然遠遠不夠,因為這些性能記錄的數據一般不開源,且掌握在大公司手中,這需要全社區的共同努力。目前也可以通過算法一定程度緩解數據缺乏的問題。

其次是如何保持在多LLM候選情況下的Router性能的問題。

當LLM候選越多的時候,意味著Router要進行更多類的分類,這對于Router的訓練來說具有很高的挑戰性;

除此之外,還包括RouterEval目前只關注在性能。

盡管routing llm可以考慮計算消耗、幻覺等其他目標。但是目前性能的水平還遠遠不夠,如果現在就過度關注其他目標的話,可能言辭尚早。另外,計算消耗和幻覺等目標的數據不容易搜集,可能采集不到足夠多的LLM的記錄數據,仍然需要全社區的努力。

最后,就是部署的難度。

即使足夠強的Router可以獲得,但是此時LLM候選的部署可能是新的瓶頸,這在計算機系統等領域中也有很多的研究角度,如計算負載,高效分配、動態模型激活等。幸運的是,從論文的觀察來看,3-10個LLM已經能得到出色的結果。

GitHub和論文等地址放下面了,感興趣的小伙伴可以深入研究一下哦~

代碼地址:https://github.com/MilkThink-Lab/RouterEval

論文地址:https://arxiv.org/abs/2503.10657

論文合集:https://github.com/MilkThink-Lab/Awesome-Routing-LLMs

責任編輯:張燕妮 來源: 量子位
相關推薦

2012-05-18 11:40:40

神舟筆記本

2025-05-22 04:00:00

PARSCALE大型語言模型LLM

2011-04-29 10:05:57

主板硬盤

2011-10-26 09:49:38

平板筆記本銷量

2011-08-03 16:30:25

2012-04-13 11:24:46

蘋果筆記本

2024-08-27 00:00:01

AI應用框架

2024-09-02 14:30:00

數據訓練

2025-02-21 13:20:00

2024-04-10 09:29:16

LLM開源大模型

2024-01-18 15:38:17

語言模型大型語言模型

2012-10-24 18:11:40

聯想IdeaPad Yog

2017-08-08 11:15:29

筆記本Titan XpQuadro

2009-03-27 09:19:11

微軟Windows 7操作系統

2020-09-01 14:09:39

筆記本SSD存儲

2024-02-06 10:38:10

昆侖萬維大模型

2024-05-06 07:58:23

MoE模型系統

2011-04-29 10:21:33

筆記本

2017-09-19 10:34:55

無邊框筆記本全面屏

2009-04-16 10:37:34

聯想3G
點贊
收藏

51CTO技術棧公眾號

国产私人尤物无码不卡| www.毛片com| 成人性教育av免费网址| 久久亚洲精品小早川怜子| 国产精品免费看久久久香蕉| 日本不卡一二区| 69精品国产久热在线观看| 污片在线观看一区二区| 亚欧洲精品在线视频免费观看| 国产同性人妖ts口直男| 国产精品久久777777毛茸茸 | 超碰人人cao| 蜜桃视频动漫在线播放| 亚洲欧洲精品一区二区三区| 国产三区二区一区久久| 夜夜嗨aⅴ一区二区三区| 精品成人在线| 色婷婷久久av| 极品白嫩丰满美女无套| 91麻豆精品| 日本高清免费不卡视频| 日韩成人手机在线| 在线a免费看| 91视频一区二区| 99九九电视剧免费观看| 又色又爽又黄无遮挡的免费视频| 亚洲美女色禁图| 久久韩剧网电视剧| 久久久久久久久久久久| 激情av综合| 欧美狂野另类xxxxoooo| 国语对白做受xxxxx在线中国 | 欧美壮男野外gaytube| 亚洲av无码一区二区三区在线| 国产麻豆精品久久| 亚洲精品美女视频| 亚洲少妇一区二区| 99精品在线免费观看| 日本大香伊一区二区三区| av无码久久久久久不卡网站| 成人片在线看| 中文字幕一区二区三区在线观看| 奇米影视首页 狠狠色丁香婷婷久久综合 | 国产乱子伦一区二区三区国色天香| 超碰91人人草人人干| 97国产精品人人爽人人做| 在线观看日本中文字幕| 国产精品白浆| 日韩欧美精品在线| 久久6免费视频| 欧美男女视频| 欧美日韩国产色站一区二区三区| 欧美成人黑人猛交| 蜜桃av在线播放| 亚洲成年人影院| 日韩欧美不卡在线| 免费毛片b在线观看| 午夜成人免费电影| 欧美牲交a欧美牲交| av日韩中文| 亚洲高清免费视频| 免费看国产一级片| 中文字幕乱码在线播放| 色综合视频一区二区三区高清| 日本精品一区二区三区四区| 亚洲天堂资源| 色av成人天堂桃色av| 搡女人真爽免费午夜网站| 成人视屏在线观看| 欧美日韩中文精品| 婷婷激情综合五月天| 欧美另类中文字幕| 亚洲爱爱爱爱爱| 国产国语性生话播放| 亚州精品视频| 中文字幕免费精品一区高清| 国产日韩精品中文字无码| 婷婷综合在线| 欧美丰满少妇xxxx| 午夜毛片在线观看| 色尼玛亚洲综合影院| 色成年激情久久综合| 天天色综合社区| 国产欧美视频在线| 亚洲成人免费在线视频| 欧美色图亚洲激情| 999国产精品永久免费视频app| 久久亚洲精品国产亚洲老地址| 久草国产在线视频| 免费欧美日韩| 91久久精品美女| 欧美少妇bbw| 久久久国产午夜精品| 正义之心1992免费观看全集完整版| av在线app| 疯狂欧美牲乱大交777| 中文字幕第100页| 一区二区网站| 亚洲最新中文字幕| 免费视频网站www| 久久精品动漫| 99c视频在线| 精品av中文字幕在线毛片 | 日本精品免费| 91黄色在线| 色婷婷综合久久久| www.黄色网| 精品视频免费在线观看| 欧美黑人性视频| 亚洲精品毛片一区二区三区| 国产成人免费av在线| 日韩国产欧美一区| 超碰在线97国产| 欧美日本韩国一区二区三区视频| 中文字幕在线视频播放| 97久久视频| 欧美尤物巨大精品爽| 国产成人免费看一级大黄| 久久精品人人做人人爽97 | 视频在线观看91| 国产66精品久久久久999小说| 成a人片在线观看www视频| 亚洲国产wwwccc36天堂| 男生操女生视频在线观看| 国产精品美女久久久久久不卡| 欧美大片免费观看| 在线观看不卡的av| 国产亚洲综合在线| www在线观看免费| 日韩中文字幕无砖| 久久香蕉国产线看观看av| 亚洲欧美日韩一区二区三区四区| av男人天堂一区| 丰满的少妇愉情hd高清果冻传媒 | 欧美精品高清视频| 在线观看国产精品一区| 国产精品嫩草99av在线| 国产精品夜夜夜一区二区三区尤| 国产精品久久麻豆| 精品视频1区2区3区| 色噜噜日韩精品欧美一区二区| 亚洲麻豆av| 高清日韩一区| 男人天堂亚洲天堂| 日韩欧美电影在线| 疯狂试爱三2浴室激情视频| 开心九九激情九九欧美日韩精美视频电影| 免费av一区二区三区| 欧美男男tv网站在线播放| 亚洲国产黄色片| 日韩高清免费av| 成人激情免费电影网址| 97免费视频观看| 成人h动漫精品一区二区器材| 久久91亚洲精品中文字幕| 国产suv一区二区| 一区二区三区中文字幕在线观看| 91欧美一区二区三区| 亚洲成人精选| 91高跟黑色丝袜呻吟在线观看| 在线免费观看污| 精品欧美黑人一区二区三区| 久久久精品99| 99国产精品99久久久久久| 欧美日韩在线一| 真实原创一区二区影院| 国产成人在线视频| 美女免费久久| 精品日韩成人av| 999这里只有精品| 国产午夜亚洲精品午夜鲁丝片 | 亚洲第一中文字幕在线观看| 久久视频免费在线观看| 99国产精品一区| 男人搞女人网站| 91精品观看| 国产精品一区二区欧美黑人喷潮水| 成人黄色动漫| 亚洲色图18p| 99国产精品久久久久久久成人| 亚洲地区一二三色| 国产三级在线观看完整版| 国产原创一区二区| 国产91美女视频| 日韩在线第七页| 精品999在线观看| 六九午夜精品视频| 欧美精品videos另类日本| 欧美在线一卡| 91精品国产高清一区二区三区 | 日韩一本精品| 亚洲精品影片| 国产999精品久久久| 在线视频中文字幕第一页| 亚洲人a成www在线影院| 国产免费高清av| 色综合色狠狠天天综合色| 欧美黑人一级片| 国产亚洲欧美日韩在线一区| 黄色片子免费看| 青草av.久久免费一区| 97在线免费视频观看| 精品一区二区三区在线| 国产精品欧美久久| 亚洲国产91视频| 欧洲成人在线观看| 青青青国内视频在线观看软件| 亚洲欧美中文字幕| 精品国产九九九| 色婷婷av一区二区| 国产五月天婷婷| 国产精品美日韩| 国模无码视频一区| 国产日韩专区| 久草视频国产在线| 999国产精品| 欧美三日本三级少妇三99| 2020最新国产精品| 国产精品久久久久久亚洲影视 | 久久爱www.| 日韩免费在线免费观看| 国产精品免费播放| 亚洲国产欧美久久| 国产婷婷在线视频| 91精品午夜视频| 国产美女www| 亚洲va欧美va人人爽| 亚洲精品成人av久久| 久久久不卡影院| 精品久久久久久无码人妻| 麻豆精品视频在线| 国产亚洲欧美在线视频| 午夜久久久久| 最新av在线免费观看| 国产亚洲一区| 日本黑人久久| 天堂俺去俺来也www久久婷婷 | 成人免费毛片网| 欧美涩涩视频| 成人国产一区二区三区| 婷婷伊人综合| 夜夜爽99久久国产综合精品女不卡| 四虎884aa成人精品最新| 久久综合一区| 欧美电影完整版在线观看| 91精品天堂| 成人黄色免费观看| 成人免费看片视频| 四虎成人精品一区二区免费网站| 国产第一区电影| 日韩精品第一| 日韩av毛片网| 三上悠亚国产精品一区二区三区| 97视频com| 亚洲校园激情春色| 国产va免费精品高清在线| 三级中文字幕在线观看| 韩国日本不卡在线| av网址在线免费观看| 久久这里只有精品99| 最新电影电视剧在线观看免费观看| 日韩在线观看免费高清| 在线国产情侣| 精品国产拍在线观看| 天天操天天干天天舔| 亚洲免费伊人电影在线观看av| 日韩精品系列| 亚洲一区二区福利| 久草中文在线观看| 草民午夜欧美限制a级福利片| a毛片在线观看| 91国语精品自产拍在线观看性色| 日韩脚交footjobhd| 日本国产欧美一区二区三区| 一区二区电影免费观看| 国产在线日韩在线| 日本在线成人| 国产尤物99| 欧美激情黄色片| 99精品一区二区三区的区别| 欧美久久九九| 老司机午夜av| 黄色精品一二区| 五月天丁香社区| 国产欧美日韩另类一区| 999精品视频在线观看播放| 一区二区三区在线视频观看58| 久久久久噜噜噜亚洲熟女综合| 欧美性猛交xxxx乱大交3| 一级黄色在线观看| 欧美一区二区三区四区在线观看| 午夜影院免费体验区| 在线播放日韩av| 先锋影音在线资源站91| 欧洲永久精品大片ww免费漫画| 黄色成人小视频| 国产精品久久亚洲| 欧美r级电影| 日韩中字在线观看| 日本欧美韩国一区三区| 少妇欧美激情一区二区三区| 久久综合色8888| 69夜色精品国产69乱| 亚洲制服丝袜在线| 亚洲天堂免费av| 亚洲成人a级网| av资源种子在线观看| 97婷婷大伊香蕉精品视频| 国产精品99久久久久久董美香| 成人在线观看91| 91精品蜜臀一区二区三区在线| 黄网站欧美内射| 久久精品国产精品青草| 可以直接看的无码av| 玉足女爽爽91| 国产成人麻豆免费观看| 日韩经典中文字幕| av在线免费网站| 国产精品久久久久久久久久免费| 清纯唯美亚洲经典中文字幕| 一区二区免费电影| 久久婷婷麻豆| 国产交换配乱淫视频免费| 亚洲午夜视频在线| 国产精品国产一区二区三区四区| 国产一区二区三区在线视频| 8x8ⅹ拨牐拨牐拨牐在线观看| 国产日韩欧美成人| 日韩黄色大片| 亚洲中文字幕无码专区| 国产成人精品亚洲午夜麻豆| 久久国产美女视频| 欧美日韩一区二区不卡| 久青草国产在线| 91成人天堂久久成人| 国产999精品在线观看| 亚洲自拍的二区三区| 模特精品在线| 精产国品一二三区| 亚洲男人的天堂一区二区| 亚洲天堂狠狠干| 亚洲午夜av久久乱码| 免费v片在线观看| 精品伦理一区二区三区| 日韩午夜电影| 人妻体内射精一区二区三区| 亚洲激情校园春色| 性猛交富婆╳xxx乱大交天津| 久久影视电视剧免费网站| 日本国产亚洲| 糖心vlog在线免费观看| 国产乱码精品一区二区三区av| 国产黄a三级三级| 欧美一区二区在线不卡| 黄色片网站在线观看| 99re在线国产| 国精品一区二区三区| 国产精品久久久久久亚洲色| 亚洲一区在线观看视频| 蜜桃av中文字幕| 日本成人黄色片| 精品日韩毛片| 午夜免费福利小电影| 国产三级精品三级在线专区| 中文字幕在线看人| 日韩网站免费观看高清| 欧美日韩免费电影| 99精品视频网站| 成人精品亚洲人成在线| 日本在线观看中文字幕| 精品99一区二区三区| 亚洲优女在线| 色女人综合av| 日韩精品免费视频人成| 天天干天天操天天拍| 欧美区一区二区三区| 秋霞在线午夜| 久久国产精品一区二区三区四区| 国产日韩一区| 欧美日韩生活片| 欧美一级一区二区| 日本黄色免费在线| 亚洲高清资源综合久久精品| 丝袜美腿成人在线| 青娱乐免费在线视频| 日韩大片在线观看视频| 国模私拍国内精品国内av| 波多野结衣 作品| 99国产精品国产精品久久| 在线观看中文字幕2021| 久久不射电影网| 久久综合欧美| 欧美又黄又嫩大片a级| 午夜欧美视频在线观看 | 超碰国产精品一区二页| 国产青青在线视频| 国产精品乱码妇女bbbb| 丰满人妻一区二区| 国产在线拍揄自揄视频不卡99| 影音先锋久久资源网|