精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta超級(jí)智能實(shí)驗(yàn)室又發(fā)論文,模型混一混,性能直接SOTA

人工智能 新聞
本文中,來(lái)自 Meta、倫敦大學(xué)學(xué)院機(jī)構(gòu)的研究者提出類專家 Soup(Soup Of Category Experts, SoCE),這是一種基于模型 Souping 的系統(tǒng)化方法,它利用基準(zhǔn)測(cè)試的類別構(gòu)成來(lái)挑選最優(yōu)模型候選,并通過(guò)非均勻加權(quán)平均來(lái)最大化整體性能。

大語(yǔ)言模型(LLM)在眾多領(lǐng)域展現(xiàn)出卓越的能力,但它們的訓(xùn)練依然高度依賴算力和時(shí)間,需要龐大的計(jì)算資源以及精細(xì)的訓(xùn)練流程設(shè)計(jì)。

模型 Souping(Model Souping) ,即對(duì)同一架構(gòu)的多個(gè)模型進(jìn)行權(quán)重平均,形成一個(gè)新的、更強(qiáng)的模型。相比訓(xùn)練一個(gè)龐大的統(tǒng)一模型,souping 更輕量、成本更低,同時(shí)能夠融合模型的互補(bǔ)能力。

然而,傳統(tǒng)的模型 souping 方式通常采用簡(jiǎn)單的均勻平均,即把所有候選模型的參數(shù)直接做等權(quán)融合。

本文中,來(lái)自 Meta、倫敦大學(xué)學(xué)院機(jī)構(gòu)的研究者提出類專家 Soup(Soup Of Category Experts, SoCE),這是一種基于模型 Souping 的系統(tǒng)化方法,它利用基準(zhǔn)測(cè)試的類別構(gòu)成來(lái)挑選最優(yōu)模型候選,并通過(guò)非均勻加權(quán)平均來(lái)最大化整體性能。

與以往均勻平均方法不同,本文基于一個(gè)關(guān)鍵觀察:不同基準(zhǔn)類別之間的模型性能往往呈現(xiàn)弱相關(guān)性。因此,SoCE 能夠?yàn)槊總€(gè)弱相關(guān)的類別簇挑選對(duì)應(yīng)的專家模型,并通過(guò)優(yōu)化的加權(quán)方式(而非統(tǒng)一權(quán)重)將它們組合起來(lái)。

實(shí)驗(yàn)結(jié)果表明,SoCE 大大提升了模型效果與穩(wěn)健性,包括在多語(yǔ)言能力、工具調(diào)用、數(shù)學(xué)推理等任務(wù)上,并在 Berkeley Function Calling 排行榜上取得了 SOTA 成績(jī)。

  • 論文地址:https://arxiv.org/pdf/2511.13254
  • 項(xiàng)目地址:https://github.com/facebookresearch/llm_souping?tab=readme-ov-file
  • 論文標(biāo)題:Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance

方法介紹

SoCE 基于這樣一個(gè)洞見(jiàn):基準(zhǔn)測(cè)試中不同類別的模型表現(xiàn)往往呈現(xiàn)高度異質(zhì)的相關(guān)結(jié)構(gòu)。不同模型在不同類別上展現(xiàn)出各自的專長(zhǎng),一些類別之間強(qiáng)相關(guān),而另一些類別之間相關(guān)性較弱,甚至可能呈負(fù)相關(guān)。

研究者為了說(shuō)明這一現(xiàn)象,他們選擇分析 Berkeley Function Calling Leaderboard(BFCL)。BFCL 包含多種不同類型的函數(shù)調(diào)用任務(wù),例如:多輪函數(shù)調(diào)用。這些任務(wù)分別測(cè)試模型不同方面的能力,因此非常適合用來(lái)觀察類別間的能力相關(guān)性。

他們制作了一張相關(guān)性熱力圖(correlation heatmap),顏色越深代表相關(guān)性越強(qiáng)。

強(qiáng)相關(guān)(深綠色區(qū)域):多輪任務(wù)之間的相關(guān)性極高,介于 0.96 到 0.98 之間。這意味著一個(gè)模型如果在某個(gè)多輪任務(wù)上表現(xiàn)優(yōu)秀,它通常在所有多輪相關(guān)場(chǎng)景中都能保持同樣的優(yōu)勢(shì)。

弱相關(guān)甚至負(fù)相關(guān)(淺綠色區(qū)域):二者之間的相關(guān)性僅 0.07。這幾乎意味著它們是兩個(gè)完全不同的能力維度。一個(gè)模型即便在結(jié)構(gòu)化的多輪場(chǎng)景中表現(xiàn)良好,也并不保證在真實(shí)用戶采集的開(kāi)放式函數(shù)調(diào)用任務(wù)中表現(xiàn)可靠。

SoCE 利用上述相關(guān)性模式,來(lái)有策略地選擇并加權(quán)模型進(jìn)行 souping(參數(shù)融合)。其核心思想是:為每個(gè)弱相關(guān)類別簇找到最擅長(zhǎng)該類別的專家模型,并通過(guò)優(yōu)化后的加權(quán)平均將它們?nèi)诤希瑥亩Y(jié)合模型間互補(bǔ)的能力。

算法 1 對(duì)整個(gè)流程進(jìn)行了形式化描述,包含四個(gè)關(guān)鍵步驟:

  • 相關(guān)性分析:識(shí)別類別之間的弱相關(guān)(或不相關(guān))類別對(duì);
  • 專家模型選擇:根據(jù)性能排名,為每個(gè)類別挑選表現(xiàn)最好的專家模型;
  • 權(quán)重優(yōu)化:尋找能最大化整體性能的加權(quán)方案;
  • 加權(quán)模型 souping:根據(jù)優(yōu)化后的權(quán)重對(duì)模型進(jìn)行加權(quán)融合,得到最終模型。

權(quán)重優(yōu)化階段,在一組統(tǒng)一的權(quán)重范圍內(nèi)進(jìn)行搜索。具體而言,對(duì)每個(gè)模型的權(quán)重從 0.1 到 0.9,以 0.1 為步長(zhǎng),遍歷所有可能的權(quán)重組合。

實(shí)驗(yàn)

作者進(jìn)行了大量實(shí)驗(yàn),以評(píng)估 SoCE 在多個(gè)維度上的有效性。

作者在 BFCL 基準(zhǔn)上對(duì)兩組模型進(jìn)行了對(duì)比,分別是 700 億參數(shù)和 80 億參數(shù)的密集模型。

對(duì)于 70B 模型,他們從官方排行榜中篩選出 4 個(gè)候選模型,并在這些模型上應(yīng)用了 SoCE 方法。結(jié)果顯示,SoCE 在 BFCL 上取得了 80.68% 的準(zhǔn)確率,創(chuàng)造了新的 SOTA,相比此前表現(xiàn)最佳的單模型 xLAM-2-70b-fc-r(78.56%)提升了 2.7%。

最佳模型配置由 xLAM-2-70b-fc-r、CoALM-70B 和 watt-tool-70B 組成,它們的最優(yōu)權(quán)重分別為 0.5、0.2 和 0.3。

對(duì)于 8B 模型,SoCE 達(dá)到了 76.50% 的準(zhǔn)確率,超越了此前 8B 模型 xLAM-2-8b-fc-r,相對(duì)提升達(dá) 5.7%。其最優(yōu)權(quán)重配置為:

  • xLAM-2-8b-fc-r:0.7
  • ToolACE-2-8B:0.2
  • watt-tool-8B:0.1

作者還進(jìn)行了消融研究,結(jié)果都顯示,無(wú)論是 70B 還是 8B,SoCE 的模型選擇步驟都帶來(lái)了性能提升。

表 2a 展示了模型在 MGSM(Multilingual Grade School Math)基準(zhǔn)上的實(shí)驗(yàn)結(jié)果。SoCE 的表現(xiàn)優(yōu)于所有候選模型以及平均 souping。

隨后,作者在 MGSM、BFCL、FLORES-36 等多個(gè)基準(zhǔn)上,對(duì)大量候選模型的 checkpoint 進(jìn)行了系統(tǒng)的 model souping 實(shí)驗(yàn)與評(píng)估,并據(jù)此得出以下關(guān)鍵結(jié)論:

類別間線性相關(guān)性在模型 Souping 之后顯著提升:如圖 2 所示。

各類別整體性能穩(wěn)定提升:例如,對(duì)于在 Llama-70B 基礎(chǔ)上微調(diào)的 checkpoint,在 37 項(xiàng)模型 Souping 實(shí)驗(yàn)中的 35 項(xiàng)中,Soup 后的候選模型在 36 個(gè)類別中有超過(guò) 20 個(gè)類別的指標(biāo)得分更高,并且在所有類別上的凈性能增益均為正(見(jiàn)圖 5)。

圖 3a 和 3b 所示,SoCE 能夠找到不同類別的專長(zhǎng)模型,從而帶來(lái)顯著性能提升。

了解更多內(nèi)容,請(qǐng)參考原論文。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-09-08 23:19:25

2025-09-12 09:11:54

Meta語(yǔ)言模型LSP

2025-09-22 10:41:42

2025-07-01 09:04:00

2025-08-20 09:10:00

2025-09-26 08:59:36

2023-10-17 12:33:27

AI模型

2025-10-23 10:17:20

2025-07-02 01:40:00

OpenAI人工智能扎克伯格

2021-08-04 09:48:05

數(shù)字化

2025-08-20 12:41:10

2018-02-07 16:49:20

浦發(fā)銀行

2025-10-11 18:05:23

智能論文AI

2015-02-06 09:23:52

賽可達(dá)實(shí)驗(yàn)室網(wǎng)絡(luò)安全

2015-10-10 11:23:49

2011-05-25 17:51:40

2017-10-12 15:51:14

AI人工智能

2025-10-17 09:20:49

2025-07-29 09:06:00

2009-09-21 11:45:36

CCIE實(shí)驗(yàn)室考試
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品成人免费电影| 久久艹免费视频| 中文字幕 日韩有码| 性欧美video另类hd尤物| 午夜日韩视频| 欧美亚洲国产一卡| 国产亚洲欧美另类一区二区三区| 国产美女网站视频| 亚洲女色av| 国产一区二区电影| 亚洲人在线视频| 国产日韩欧美大片| 欧美性猛交xxxx乱大交hd| 国产香蕉精品| 亚洲精品自拍动漫在线| 国产精品久久久久久久7电影| 国产精品夜夜夜爽阿娇| 欧美日韩尤物久久| 91视视频在线观看入口直接观看www| 久久精品久久久久久| 国产日韩欧美电影在线观看| 黄色av电影网站| 日本美女xxx| 高清毛片在线观看| 欧美亚州一区二区三区| 自拍偷拍21p| 黄色影院在线播放| 男人天堂欧美日韩| 日韩精品999| 亚洲 欧美 日韩 国产综合 在线 | 人妖一区二区三区| 一区二区三区美女视频| 成人欧美一区二区三区黑人孕妇| 天堂在线中文视频| 成人18夜夜网深夜福利网| 一区二区激情视频| 亚洲一区二区精品在线| 国产精品久久综合青草亚洲AV| 首页国产精品| 欧美日韩在线播放三区四区| 秋霞毛片久久久久久久久| 天天操夜夜操视频| 国产精品亚洲片在线播放| 色噜噜狠狠色综合中国| 色姑娘综合网| 国产精品无码久久久久成人app| 一区二区三区四区五区在线| 亚洲精品在线免费播放| 国产69精品久久久久久久| 黄色av电影在线观看| 久久国产综合精品| 日韩在线视频线视频免费网站| 青青草久久伊人| 宅男网站在线免费观看| 99国产精品久久久| 国产精品久久久久免费a∨| 91大神福利视频| 精品成av人一区二区三区| 欧美色爱综合网| mm131午夜| 韩国av免费在线| 一区二区三区在线| 亚洲第一天堂av| 18岁网站在线观看| 欧美男男同志| 久久激情综合| 91黑丝在线观看| 中文字幕日韩三级片| 久草在线资源站手机版| 国产午夜精品理论片a级大结局| 国产69精品99久久久久久宅男| 无码人妻精品一区二区三区99不卡| 草草影院在线观看| 国产成人免费av在线| 国语自产精品视频在线看一大j8| 久草福利资源在线观看| 美腿丝袜亚洲图片| 色综合视频一区二区三区高清| 天堂一区二区三区| 国产大片在线免费观看| 狠狠色丁香久久婷婷综| 91国产精品91| 91久久国产视频| 国产欧美一区二区精品久久久| 亚洲性生活视频在线观看| 熟女人妇 成熟妇女系列视频| 成人好色电影| 久久久国产一区二区三区四区小说| 欧美日韩精品免费在线观看视频| 国内av在线播放| 日本美女视频一区二区| 不卡av电影院| 欧美日韩高清丝袜| 国产精品麻豆| 午夜日韩在线电影| 亚洲精品在线免费| 国产精品视频第一页| 久久国产精品区| 欧美与黑人午夜性猛交久久久| 香蕉影院在线观看| 一区二区三区中文| 欧美国产一区二区三区| 性欧美精品中出| 欧美中文一区二区| 精品国产伦理网| 国产吞精囗交久久久| 日韩1区在线| 日韩精品www| 变态另类ts人妖一区二区| jvid福利在线一区二区| 久久精品视频播放| 免费毛片一区二区三区| 91亚洲国产高清| 欧美日韩成人在线播放| a v视频在线观看| 亚洲国产天堂| 国产精品一区二区在线看| 国内精品一区二区三区| 国产伦精品一区二区三区视频网站| 老司机精品久久| 国产精品视频一区二区三区经| 国产在线视频资源| 亚洲自拍偷拍网站| caoporn超碰97| 中文一区二区三区四区| 欧美日韩亚洲综合一区二区三区| 又黄又爽又色的视频| 在线人成日本视频| 欧美唯美清纯偷拍| 中文字幕在线观看的网站| 亚洲精品成人无限看| 在线观看不卡av| 亚洲熟妇一区二区三区| 亚洲精品91| 国产福利成人在线| 99热只有这里有精品| 精品一区免费av| 精品国产一区二区三区麻豆小说| 中文字幕永久免费视频| 99re这里只有精品首页| 2021国产视频| 国产国产一区| 色成年激情久久综合| 黄页网站在线看| 精品麻豆剧传媒av国产九九九| 91精品婷婷国产综合久久竹菊| 亚洲色图久久久| 亚洲精华液一区二区三区| 日韩亚洲电影在线| 成年人小视频在线观看| 伊人久久大香线| 国产精品永久在线| 蜜桃91精品入口| a级片在线播放| 精品一区二区日韩| 日韩国产精品一区二区| 精品乱码一区二区三四区视频 | 51午夜精品国产| 最近中文字幕免费| 国产精品主播| 欧美在线欧美在线| 国产三级av片| 大白屁股一区二区视频| 欧美三区在线视频| 9191国产视频| 日本中文字幕视频一区| www国产精品com| 亚洲视频久久久| 国内精品久久久久影院一蜜桃| 日日骚一区二区网站| 欧美日韩123区| 欧美久久婷婷综合色| 五月天精品在线| 秋霞影院一区二区| 视频一区视频二区视频| 成人做爰视频www| 中文字幕在线观看日韩| 嫩草av久久伊人妇女超级a| 中文字幕免费高清电视剧网站在线观看| 欧美日韩精品一区二区天天拍小说 | 日韩欧美一区免费| 国产精品网红直播| 免费在线你懂的| 欧美一二三区精品| 精品少妇theporn| 国产情侣久久| 98精品在线视频| 亚洲久久久久久| 日韩最新在线| 国产91成人video| 中文字幕在线免费| 国产精品美女一区二区三区| 成年人网站国产| 欧美videos粗暴| 精品久久久久久久久久久院品网| 国产av 一区二区三区| 国产a级毛片一区| 国产91对白刺激露脸在线观看| 成人在线分类| 欧美激情视频一区二区三区不卡| 国产成人手机在线| 色综合久久综合网97色综合| 中国1级黄色片| 国产精品乱看| 亚洲欧美日产图| 豆花视频一区二区| 国产精欧美一区二区三区| 黄色在线观看网站| 亚洲电影免费观看高清| 四虎影院在线免费播放| 亚洲精品视频免费看| 波多野结衣先锋影音| 男女视频一区二区| 欧美日韩日本网| 国产精品久久久久久久久久久久久久久| 欧美另类交人妖| 成年人视频网站在线| 欧美mv和日韩mv国产网站| 黄色av一区二区| 亚洲无线码一区二区三区| 超碰中文字幕在线观看| 亚洲欧美卡通另类91av| 免费观看中文字幕| 亚洲综合福利| 欧美一级高清免费播放| 免费在线观看av网站| 欧美xxxx在线观看| 免费的毛片视频| 亚洲自拍偷拍网站| 午夜国产小视频| 久久久噜噜噜久久中文字幕色伊伊 | 日韩 中文字幕| 韩国三级在线一区| 农村妇女精品一二区| 成人涩涩网站| 91精品久久久久久久久青青| 亚洲国产福利| 久久久噜噜噜久久| 亚洲图片88| 色偷偷偷综合中文字幕;dd| 涩涩视频在线观看免费| 午夜日韩在线观看| www色aa色aawww| 久久精品国产在热久久| 鲁一鲁一鲁一鲁一澡| 午夜激情一区| 亚洲图片都市激情| 亚洲三级网址| 欧美日韩精品免费观看视一区二区| 成人动态视频| 国产91色在线|亚洲| 在线观看av免费| 日韩中文字幕久久| 成人欧美亚洲| 一区二区亚洲欧洲国产日韩| 人操人视频在线观看| 精品国产91亚洲一区二区三区婷婷| 一区二区三区免费在线| 国产精品国产a| 九九九久久久久久久| 麻豆国产91在线播放| 熟女少妇精品一区二区| 久久久精品午夜少妇| 黑鬼大战白妞高潮喷白浆| 欧美亚洲网站| 免费激情视频在线观看| 老司机午夜精品视频在线观看| 欧美性猛交内射兽交老熟妇| 国产一区二区电影在线观看| 欧美精品在线一区| 你微笑时很美电视剧整集高清不卡| 国产精品一区二区三| 国产乱子精品一区二区在线观看| 国产精品久久久久久久app| 国产综合av| 久久久久久久国产精品视频| 欧美xxxx黑人又粗又长| 久久免费少妇高潮久久精品99| 99re6在线精品视频免费播放| 最近2019中文字幕mv免费看 | 97人人澡人人爽人人模亚洲| 午夜精品久久久久影视| 在线观看亚洲天堂| 色综合天天综合给合国产| 一级片视频在线观看| 色综合 综合色| 欧美高清69hd| 日韩欧美国产综合在线一区二区三区| 丰满人妻一区二区三区免费视频| 欧美精品一区二区三区四区 | 日韩精品在线播放| 成人欧美亚洲| 欧美日韩xxxxx| 亚洲女同av| 国产欧美一区二区三区在线看| 精品福利在线| 岛国视频一区免费观看| 亚洲成在人线免费观看| 亚洲韩国在线| 国产一区久久| 国产精品wwwww| 日日夜夜一区二区| 蜜臀精品一区二区| 国产精品久久777777毛茸茸| 国产精品人人妻人人爽人人牛| 韩国三级电影一区二区| 亚洲天堂美女视频| 国产精品污污网站在线观看| 免费在线看黄网址| 欧美日韩综合视频| 三级黄色片在线观看| 成人免费一区二区三区视频| 日韩视频在线观看一区| 8x8x8国产精品| 色视频在线观看福利| 色天天综合狠狠色| 99爱在线视频| 91美女片黄在线观| 九九热线有精品视频99| 99久久99久久精品| 毛片基地黄久久久久久天堂| 精品少妇人妻av一区二区三区| 亚洲国产精品激情在线观看| 国产精品第72页| 欧美天堂一区二区三区| 丰满大乳国产精品| 深夜福利一区二区| 日韩在线伦理| 91久久精品美女| 久久成人高清| 国产无限制自拍| 国内精品视频666| 男人的天堂官网| 午夜不卡在线视频| 国产高清免费在线观看| 中文字幕一区二区精品| 欧美久久天堂| 久久免费99精品久久久久久| 欧美午夜不卡| 欧美大片久久久| 国产日本亚洲高清| 国产视频91在线| 精品久久一区二区三区| 国产黄大片在线观看画质优化| 国产成人啪精品视频免费网| 怕怕欧美视频免费大全| 日本a视频在线观看| 国产在线视频一区二区三区| 一区二区三区在线观看免费视频| 天天射综合影视| 日韩中文字幕免费观看| 欧美成人黑人xx视频免费观看| 福利视频一区| 在线观看亚洲视频啊啊啊啊| 成人激情开心网| 能在线观看的av| 99久久精品国产导航| 免费人成视频在线| 日韩欧美三级在线| 天堂av资源在线观看| 亚洲自拍av在线| 中文字幕一区二区av| 精产国品一区二区三区| 亚洲免费成人av| 99国产精品久久久久99打野战| 日韩小视频在线观看| 免费视频成人| 中文字幕av导航| 丰满放荡岳乱妇91ww| 国产亚洲精久久久久久无码77777| 欧美一级高清片在线观看| av网站在线免费看推荐| julia一区二区中文久久94| 精品亚洲自拍| 3d动漫一区二区三区| 粉嫩一区二区三区性色av| 久久久久99精品| 亚洲国产精品视频在线观看| 欧美激情20| 日韩影片在线播放| 老司机免费视频一区二区三区| 99久久99久久精品免费看小说.| 欧美一区二区黄色| 激情av在线| 久久综合久久综合这里只有精品| 媚黑女一区二区| 国产99在线 | 亚洲| 欧美裸体bbwbbwbbw| 欧美猛烈性xbxbxbxb| 超碰97人人人人人蜜桃| 国产午夜久久| 国产激情av在线| 欧美一级艳片视频免费观看| cao在线视频| 亚洲精品美女久久7777777| 国产一区亚洲一区| www.天天色| 色一区av在线| 97se亚洲国产一区二区三区| 亚洲 欧美 日韩系列|