精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只需一次指令微調,大模型變身全能專家天團,8B模型性能反超全微調基線 | ACL25 Oral

人工智能
當前預訓練語言大模型(LLM)雖具備通用能力,但適應專業領域需高昂的指令微調成本;稀疏混合專家(SMoE)架構作為可擴展的性能-效率平衡框架,雖能提升推理效率并靈活擴展模型容量,但其從頭訓練消耗巨大資源,因此復用密集大模型參數的升級改造(LLM Upcycling)成為更具成本效益的替代方案。

只需一次指令微調,即可讓普通大模型變身“全能專家天團”?

  • 改造位置自動定位
  • 專家協作動態平衡
  • 8B模型性能反超全微調基線1.6%,安全指標暴漲10%,推理內存直降30%!

圖片圖片

當前預訓練語言大模型(LLM)雖具備通用能力,但適應專業領域需高昂的指令微調成本;稀疏混合專家(SMoE)架構作為可擴展的性能-效率平衡框架,雖能提升推理效率并靈活擴展模型容量,但其從頭訓練消耗巨大資源,因此復用密集大模型參數的升級改造(LLM Upcycling)成為更具成本效益的替代方案。

圖片圖片

然而現有升級方法存在兩大局限:一是依賴人工經驗選擇可擴展的專家位置(如固定替換FFN層),忽視模型層間動態差異與任務特性;二是缺乏系統機制平衡專家專業化與協作,導致冗余或知識碎片化。

為此,來自浙江大學與Thomson Reuters的研究團隊提出全新解決方案稀疏插值混合專家(SIMoE),只需單階段指令微調,即可將普通大模型自動升級為高性能稀疏專家模型。SIMoE通過結構化稀疏優化自動發現神經元級專家參數子集,創新性地結合專家共享增量參數與掩碼正交懲罰在多項基準測試中實現性能、效率的雙重突破

目前相關研究論文已被ICML 2024、ACL 2025 Oral接收,代碼及項目網址也已在GitHub上公開。

圖片圖片

△ICML2024接收

圖片圖片

△ACL 2025 Oral接收

傳統改造為何失靈?

當前大模型升級改造方法用于大模型專業領域適配面臨雙重困境:

局限性一:升級改造位置依賴經驗性設計,缺乏自適應機制。

現有方法在決定大模型參數中”何處升級”(where-to-upcycle)時,普遍采用啟發式規則,例如固定選擇FFN層或Attention模塊進行升級,擴展成為SMoE模組。這種靜態升級策略忽視了兩個關鍵因素:

1、模型特異性:同一預訓練大模型中不同層/參數對模型整體功能的重要性存在顯著差異;2、領域適配需求:不同領域任務會要求特定最優升級位置。

這種算法-模型-數據的脫節導致升級策略僵化,無法自適應特定任務場景,最終導致領域適配性差。如下表所示,傳統經驗性固定升級策略(i.e.,Learnable Upcycling)—例如升級所有FFN層—對比SIMoE的動態升級策略,其ROUGE-L分數低于SIMoE 1.6–2.5%。

圖片圖片

局限性二:專家專業化與協作機制缺失

現有方法缺乏系統化機制平衡專家專業化與協同合作:

1、專業化不足:為促進知識共享,傳統SMoE框架常采用固定共享專家強制協作機制。然而,此類設計會抑制領域專家的專業化能力,極端情況下甚至引發模型崩潰(model collapse)——表現為專家間參數趨同。

2、協作低效:為促進專家專業化,部分升級方法[1]采用獨立微調策略——先針對不同領域數據訓練多個領域專家,再通過額外訓練階段將其合并為統一SMoE模型。然而,獨立訓練阻礙了知識遷移,導致專家參數冗余。

專業化與協作失衡導致泛化性能次優及資源浪費。如圖表所示,當前升級方法[1]相較于SIMoE存在性能與參數效率上的雙重差距。

圖片圖片

圖片

全新升級改造框架:稀疏插值專家

圖片圖片

稀疏插值專家(SIMoE)在概念上類似于MoE原理,通過軟合并來路由和組合特定專家參數,但在實現上與傳統MoE架構不同。SIMoE將每個「插值專家」定義為共享網絡中稀疏參數的特定子集

具體而言,SIMoE包括可訓練的共享的專家參數集θδ(shared expert parameters)和M個可訓練的獨立專家掩碼集圖片(expert masks)。在前向計算中,SIMoE(1)通過由路由網絡hζ生成的加權系數α合并專家,(2)然后與凍結的預訓練大型語言模型參數θpre結合。(3)在指令微調階段,同步施加化稀疏約束(sparsity constraint)與正交懲罰(orthogonality)于可訓練掩碼,在優化標準NLL損失的同時自動化確定升級位置(where-to-upcycle),促進專家專業化與協同合作。

創新1:結構化稀疏升級——將專家定位轉化為可學習的稀疏優化問題

面對傳統LLM升級中人工選擇升級層位的局限,提出一種根本性解法:將”何處升級”轉化為結構化稀疏優化問題。通過在基座模型的每個線性層引入可學習二進制掩碼圖片,構建SIMoE參數更新機制:

圖片

這一設計可帶來三重優勢:

首先,神經元級升級定位實現全局優化。通過引入L0稀疏約束構建可控優化目標:

圖片

其中圖片表示掩碼的期望稀疏度,τ為目標稀疏度。該拉格朗日對偶優化框架通過動態調整λ值,驅使掩碼稀疏度收斂至目標值τ,從而自動篩選基座模型中(1-τ)比例的參數進行升級改造。

其次,結構化稀疏設計攻克硬件瓶頸。當傳統專家參數量級掩碼圖片導致模型所需訓練參數暴漲M倍時,提出將掩碼維度壓縮至輸入神經元數圖片。這種硬件友好型稀疏產生連續內存塊,直接匹配GPU存取模式,使訓練峰值內存降低30%,同時維持神經元級控制粒度——這是實現8B基座模型可擴展性的關鍵。

最終,凍結基座與稀疏增量協同守護知識完整性。式中θpre的凍結設計確保預訓練知識不受擾動,避免指令微調時的災難性遺忘。配合75%稀疏約束τ=0.75,推理時自動剪枝零值神經元級專家,最終模型尺寸較BTX [1] 縮減66%(10.4B vs 30.58B)。

實驗發現

  • LayerNorm層改造強度超30% - 傳統方法忽視的關鍵區域
  • 注意力門控層僅需不到10%改造 - 顛覆”注意力層最重要”的固有認知
  • 多種類別層參與學習的改造方案 - 實現最佳性能,告別手動改造次優解

圖片圖片

創新2:專家團隊內的”防內卷協議”-協作,獨立的完美平衡

區別于傳統SMoE,通過參數共享降低冗余正交約束保證專家專業化的協同的平衡,其數學本質是鼓勵學習一組正交掩碼圖片對共享參數進行結構化調制,使各專家在共享知識基座θδ上形成互補的專業化能力圖片

  • 參數高效:僅需存儲一份θδ,避免參數冗余,大大節約訓練開銷
  • 知識遷移:梯度更新圖片聚合所有專家信號,促進跨任務泛化
  • 專家專業化:每個專家獨享可學習的神經元二進制掩碼→通過對掩碼的正交懲罰 → 自動篩選適領域特定專業化參數

應用場景多適配:

小樣本視覺任務:給定少量任務樣本→動態訓練特定任務的教師模型→通過知識蒸餾引導「插值專家」模型的組合泛化能力,訓練效率提升43%

零樣本指令遵循:通過對「插值專家」二進制掩碼的正交約束→鼓勵「插值專家」參數專業化→通過訓練,達到知識共享于領域專業化的黃金平衡

圖片圖片

實驗驗證

視覺基座模型驗證:Meta-Dataset大規模視覺小樣本學習基準測試。

圖片圖片

SMAT(SIMoE的視覺版本)在零樣本和小樣本遷移場景中全面超越基線模型,OOD任務表現尤為驚艷:在零樣本設置下,SMAT平均準確率達67.65%,較最佳基線提升2.8%;在小樣本場景(few-shot, with gradient-based fine-tuning)中,SMAT以75.02%的準確率刷新SOTA紀錄。

自然語言基座模型驗證:SuperNaturalInstruction跨任務泛化能力基準測試。

圖片圖片

SIMoE在跨任務泛化能力上展現統治級表現。在12類未見任務中,SIMoE在9類任務上顯著領先:3B模型較全微調基線提升2.5%,8B模型提升1.6%。

自然語言基座模型驗證:Tulu-v3 SFT Mixture多領域泛化能力基準測。

圖片圖片

SIMoE在大規模場景仍保持性能統治力。面對8B參數基座模型和百萬級指令數據,SIMoE在MMLU、GSM8K等12項核心基準平均得分61.1%,以0.6%優勢超越當前SOTA模型Tülu-v3-8B-SFT,在指令遵循(IFEval +1.3%)和安全測試(Safety +1.7%)等任務中展現明顯優勢。

引用文獻:

[1] Sainbayar Sukhbaatar, et al. “Branch-train-mix: Mixing expert LLMs into a mixture-of-experts LLM”. In First Conference on Language Modeling.

論文鏈接:

ICML 2024:https://arxiv.org/abs/2403.08477

ACL 2025:https://arxiv.org/pdf/2506.12597

項目鏈接:

https://szc12153.github.io/sparse_meta_tuning/

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-06-07 08:22:59

LLM微調技術

2024-09-26 10:42:20

2024-05-27 09:16:37

2023-09-23 12:35:19

模型參數

2025-04-10 07:59:51

2024-09-09 07:46:16

2023-12-18 13:37:44

天翼云天池大語言模型

2025-10-14 09:00:00

2025-09-03 09:13:18

2023-08-14 13:29:37

2024-12-30 00:01:00

多模態大模型Python

2025-02-28 10:25:09

2025-02-17 12:30:00

2025-05-13 05:11:00

推理模型微調

2024-05-07 08:00:00

自然語言處理機器學習

2024-03-25 08:00:00

2024-04-15 12:50:00

大型語言模型ReFT

2025-05-28 11:42:14

模型框架AI

2024-07-22 08:17:00

模型性能

2024-01-18 15:38:17

語言模型大型語言模型
點贊
收藏

51CTO技術棧公眾號

精品一区二区在线观看视频| 亚洲无吗一区二区三区| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的 | 一区二区三区四区视频在线观看| 国产精品系列视频| 亚洲二区精品| 中文字幕在线视频日韩| 日本精品一二三| 精品日韩视频| 亚洲乱码精品一二三四区日韩在线| 国产麻豆一区二区三区在线观看| 天天操天天干视频| 91精品国产调教在线观看| 日韩电影大片中文字幕| 九九九九九九九九| 9i看片成人免费高清| 亚洲视频精选在线| 天堂精品一区二区三区| 全国男人的天堂网| 精品一区精品二区高清| 青草青草久热精品视频在线网站| 久久久久久久久久97| 蜜桃一区二区三区| 日韩一级片在线观看| 三年中国国语在线播放免费| bl在线肉h视频大尺度| 中文字幕亚洲在| 欧美日韩在线观看一区| 亚洲精品中文字幕成人片| 九一九一国产精品| 国产精品视频网| av网站中文字幕| 影音先锋中文字幕一区二区| 久久精品一本久久99精品| 能免费看av的网站| 欧美成人午夜77777| 日韩免费看网站| 极品粉嫩美女露脸啪啪| 视频一区在线免费看| 欧美日韩免费区域视频在线观看| 奇米777四色影视在线看| 国产中文在线观看| 国产午夜亚洲精品羞羞网站| 久久精品人人做人人爽电影| 色窝窝无码一区二区三区成人网站| 国产精品一品视频| 亚洲综合小说区| 国产精品自拍电影| 久久国产三级精品| 国产日韩欧美成人| 中文字幕视频在线播放| 日韩av不卡在线观看| 国产成人一区二区| 无码人妻丰满熟妇区五十路 | 亚洲欧洲精品天堂一级| 亚洲精品国产精品久久| av在线播放网| 国产精品二区一区二区aⅴ污介绍| 日韩在线电影一区| 第一视频专区在线| 国产精品乱子久久久久| 一区二区三区四区五区精品| 午夜免费视频在线国产| 综合色天天鬼久久鬼色| 激情五月五月婷婷| 黄页在线观看免费| 天天影视色香欲综合网老头| 国产午夜大地久久| 韩国美女久久| 欧美性感一区二区三区| 成人不卡免费视频| 日韩一级淫片| 亚洲国模精品一区| 可以直接看的无码av| 国产剧情一区| 操日韩av在线电影| 国产精品成人网站| 天堂成人国产精品一区| 国产精品一区专区欧美日韩| av在线资源观看| 99国产精品一区| 日本高清一区| caopo在线| 狠狠色噜噜狠狠狠狠97| 国产一二三区av| 视频精品一区| 亚洲精品有码在线| 北条麻妃在线观看视频| 亚洲久久一区| 国产欧美久久一区二区| 乱色精品无码一区二区国产盗| 91丨九色丨蝌蚪丨老版| 伊人久久青草| a√中文在线观看| 欧美性生活久久| 中文字幕99页| 久久国产亚洲精品| 亚州精品天堂中文字幕| 在线观看国产小视频| 国产99久久久精品| 亚洲精品一区二区三| 天堂va在线| 欧美日韩一区二区在线观看视频| 不卡的一区二区| 欧洲杯什么时候开赛| 欧美黑人巨大xxx极品| 久久久久久久久久一级| 成人性生交大片| 一区二区三区四区视频在线| 中文字幕在线高清| 欧美成人伊人久久综合网| 成年人网站免费在线观看| 综合国产精品| 国产欧美 在线欧美| 清纯唯美亚洲色图| 亚洲国产视频网站| 天天摸天天舔天天操| 在线日韩网站| 97精品视频在线播放| 国产精品特级毛片一区二区三区| 91麻豆精东视频| 真人抽搐一进一出视频| 国内不卡的一区二区三区中文字幕| 日韩国产欧美精品一区二区三区| 亚洲欧美一区二区三区四区五区| 免费成人美女在线观看.| 精品一区二区三区视频日产| 日本乱理伦在线| 欧美精选午夜久久久乱码6080| a级大片在线观看| 亚洲视频观看| 国产91视觉| 手机电影在线观看| 91精品国产91久久久久久一区二区 | 亚洲欧美视频在线| 国产视频91在线| 高清免费成人av| 欧美a级免费视频| 久久久久久久久成人| 久久精品99国产精品酒店日本 | 91www在线| 日韩午夜激情免费电影| 九九精品视频免费| 精品一区二区三区在线播放 | 老司机久久99久久精品播放免费| 狠狠色噜噜狠狠狠狠色吗综合| 免费在线看污片| 欧美精品一区二区三区高清aⅴ | 久久精品magnetxturnbtih| 欧洲性视频在线播放| 欧美大片拔萝卜| 国产无套在线观看| a亚洲天堂av| 内射国产内射夫妻免费频道| 四虎884aa成人精品最新| 欧美一级免费看| 青青九九免费视频在线| 欧美亚洲精品一区| 日韩精品久久久久久久的张开腿让| 免费在线观看不卡| 日韩 欧美 自拍| 97人人澡人人爽91综合色| 亚州av一区二区| 狠狠狠综合7777久夜色撩人| 欧美性xxxxxxxx| 午夜爱爱毛片xxxx视频免费看| 国产精品香蕉一区二区三区| 国产96在线 | 亚洲| 日韩影视高清在线观看| 国产精品成熟老女人| 日本成a人片在线观看| 日韩亚洲电影在线| 91av在线免费视频| 国产婷婷一区二区| 国产999免费视频| 在线视频观看日韩| 亚洲精品视频一二三| 日韩欧美一级| 日本精品久久久| 夜级特黄日本大片_在线| 日韩限制级电影在线观看| 日本三级2019| 国产精品人妖ts系列视频| 亚洲国产午夜精品| 99精品国产福利在线观看免费| 色阁综合av| 9999久久久久| 国产精品高潮呻吟久久av黑人| dy888亚洲精品一区二区三区| 日韩av网站电影| 91成人国产综合久久精品| 亚洲一区二区三区影院| 性猛交娇小69hd| 国产精品乡下勾搭老头1| 无码内射中文字幕岛国片| 伊人色**天天综合婷婷| 蜜桃传媒视频第一区入口在线看| 欧美高清免费| 欧美中文字幕在线| 中文字幕伦理免费在线视频| 亚洲男人第一网站| 午夜精品久久久久久久第一页按摩| 日韩欧美国产一区二区| 东方av正在进入| 久久精品欧美一区二区三区不卡| 亚洲av午夜精品一区二区三区| 日韩国产在线观看一区| 国产精品一色哟哟| 亚洲成人国产| 天天综合色天天综合色hd| 免费观看成人www动漫视频| 成人精品一区二区三区电影免费| 永久免费毛片在线播放| 欧美疯狂性受xxxxx另类| 日本高清视频在线观看| 亚洲品质视频自拍网| 男人天堂手机在线观看| 欧美一区在线视频| 中文字幕久久熟女蜜桃| 日韩欧美在线观看视频| 国产在线视频第一页| 综合av第一页| 激情无码人妻又粗又大| 久久久久久亚洲综合影院红桃| 国产精品九九视频| 国产成人精品免费| 尤物网站在线看| 久久成人麻豆午夜电影| 性生交免费视频| 久久精品在线| 日韩毛片在线免费看| 亚洲男人影院| 北条麻妃69av| 国产精品久久久久久久免费软件| 欧美做暖暖视频| 国产精品v一区二区三区 | 黄色动漫在线| 日韩有码视频在线| 午夜小视频在线| 色婷婷**av毛片一区| av在线电影免费观看| 国产亚洲精品一区二555| 每日更新在线观看av| 日韩电影第一页| 国产中文字幕在线视频| 一本色道久久88亚洲综合88| 黄色片在线播放| 中文字幕日韩在线观看| 欧美成人性生活视频| 日韩中文娱乐网| a级毛片免费观看在线| 久久福利视频导航| 四虎影视成人| 国语对白做受69| 中文字幕在线视频久| 国产精品九九九| 免费一级欧美在线观看视频| 成人国产精品久久久| 国产aa精品| 成人在线资源网址| 日韩高清一级| 亚洲成人网上| 中文字幕一区二区三区欧美日韩| www.欧美黄色| 国产欧美欧美| 在线观看的毛片| 国内精品免费**视频| 男男一级淫片免费播放| 91蜜桃视频在线| 在线视频第一页| 亚洲欧美另类小说视频| 久久精品国产亚洲AV无码麻豆| 午夜精品久久久久影视| 中文字幕免费观看| 69堂精品视频| 天天操天天舔天天干| 国产亚洲一区二区在线| 韩国av网站在线| 91po在线观看91精品国产性色| 欧美日韩大片| av一区二区三区四区电影| 天堂网av成人| 欧美一级黄色录像片| 亚洲激情亚洲| 亚洲欧美自拍另类日韩| 成人做爰69片免费看网站| 免费看污片网站| 亚洲天堂av一区| 色婷婷在线观看视频| 欧美日韩一区二区三区高清 | 高清乱码免费看污| 欧美乱熟臀69xxxxxx| 天天摸天天碰天天爽天天弄| 自拍偷拍免费精品| 91九色在线播放| 国产美女精品视频| 欧美日韩直播| 99re99热| 久久资源在线| 国产免费无码一区二区| 国产精品视频在线看| 日韩免费一级片| 欧美精品 日韩| 国产中文在线视频| 69国产精品成人在线播放| 亚洲成人a级片| 免费不卡亚洲欧美| 一区免费视频| 三级黄色片免费看| 欧美国产日韩亚洲一区| 国产乱码久久久久久| 7777精品伊人久久久大香线蕉的 | 国产精品精品国产| 国产精品巨作av| 狠狠精品干练久久久无码中文字幕| 久久久久91| 一本加勒比波多野结衣| 一区二区三区中文字幕电影| 中文字幕视频在线播放| 亚洲日韩欧美视频| 在线免费看h| 狠狠色噜噜狠狠狠狠色吗综合| 91精品91| 99re6在线观看| 国产精品久久久久久福利一牛影视| 国产婷婷色一区二区在线观看 | 永久免费在线观看视频| 国产91色在线免费| 四虎884aa成人精品最新| 九色自拍视频在线观看| 高清在线成人网| 久久久久性色av无码一区二区| 欧美一三区三区四区免费在线看 | 国产成人一区二区三区| 色天天色综合| 日本www在线视频| thepron国产精品| 日韩精品视频免费看| 亚洲精品一区二区三区香蕉| 女人黄色免费在线观看| 成人自拍爱视频| 1000部精品久久久久久久久| 亚洲一级av无码毛片精品| 午夜精品一区二区三区免费视频| 色噜噜一区二区三区| 97国产在线视频| 天堂日韩电影| 国产成人手机视频| 欧美国产精品中文字幕| 在线观看免费视频a| 日韩一级裸体免费视频| 不卡一区视频| 青青草影院在线观看| 国产精品一区二区久久不卡| 麻豆一区产品精品蜜桃的特点| 日韩女优视频免费观看| 丁香花在线电影| 久久人人九九| 久久久久久久波多野高潮日日| 一级黄色片网址| 欧美高清视频在线高清观看mv色露露十八| 欧美激情午夜| 99免费在线视频观看| 亚洲狼人精品一区二区三区| 亚洲一区二区三区蜜桃| 欧美日韩综合在线| 成人黄色在线电影| 国产精品大全| 久久先锋资源| 91高清免费看| 亚洲国产日韩欧美在线99| 国模一区二区| 9999在线观看| www.99精品| 中国一级片黄色一级片黄| 免费av一区二区| 免费看久久久| 色播五月激情五月| 亚洲国产日韩a在线播放| 国产片在线观看| 亚洲aⅴ男人的天堂在线观看| 亚洲区国产区| 大吊一区二区三区| 亚洲成人av中文字幕| 日韩视频网站在线观看| 超碰人人爱人人| 久久久99精品免费观看| 国产乱人乱偷精品视频| 91成人免费观看网站| 欧美激情偷拍自拍| 免费成人深夜夜行p站| 欧美精品乱码久久久久久| 久久影院午夜精品| 日本精品免费视频| 国产欧美在线观看一区| 亚洲经典一区二区| 国产精品视频大全| 一区二区三区福利| 一区视频免费观看| 在线播放国产精品|