精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

利用公開知識定向提升大模型,騰訊優圖&上交大提出新方法,性能達SOTA

人工智能 新聞
本文提出的方法通過 K - shot 數據在模型選擇和數據擴增中發揮重要作用,優于現有方法,并通過消融研究驗證了選擇方法的有效性,展示了一種挖掘開放知識進行定制技能整合的高效流程。

告別傳統指令微調,大模型特定任務性能提升有新方法了。

一種新型開源增強知識框架,可以從公開數據中自動提取相關知識,針對性提升任務性能。

與基線和SOTA方法對比,本文方法在各項任務上均取得了更好的性能。

圖片

該方法由上海交通大學和騰訊優圖實驗室共同提出。

圖片

研究背景

近年來,LLMs 在眾多任務和領域取得了顯著發展,但為了在實際業務場景發揮模型的專業能力,通常需要在領域特定或任務特定的數據上進行指令微調。傳統的指令微調往往需要大量的有標注數據和計算資源,對于實際業務場景這是很難獲得的。

另一方面,開源社區提供了大量的微調模型和指令數據集。這些開源知識的存在使得在特定任務上LLM在特定領域上的適配和應用成為了可能。但是,使用開源的各類SFT模型以及任務相關的數據集時,仍有以下關鍵問題需要解決:

  1. 少量有標注樣本場景下,直接對模型微調或進行in-context-learning的效果往往不能滿足需求,如何利用這些少量的樣本和海量的外部知識(開源世界的模型,數據)對目前已有的知識進行補充,提升模型的任務能力和泛化性能?
  2. 開源社區中有大量微調且對齊的模型和指令數據集,可作為提升 LLMs 特定任務專業能力的良好起點,如何在可能存在知識沖突的情況下,合理融合這些外部知識?現有工作往往聚焦于對已有模型組合方法的設計,無法最大化利用多個模型的知識儲備。
  3. 在開源模型的評價上,現有工作僅僅從單一角度(如測試集上嚴格答案匹配的準確率)進行性能評估,而忽視了這可能帶來的偏差。同時在開源數據的評價上,現有方案通常從通用數據的質量、復雜度等評估角度出發,沒有結合任務導向性來實現數據精選。

針對以上關鍵問題,研究團隊提出了一種切合業務實際的全新實驗設置:K-shot有標簽真實業務數據下的開源知識增強框架。在這樣的框架下,充分利用K-shot樣本來實現LLM的定向任務增強。

具體地,團隊設計了一套可輕松尺度拓展的LLM知識增強管線,并且充分發揮少量的K-shot樣本在開源模型、開源數據篩選上的指導作用。在方案設計上,主要面臨了以下挑戰:

挑戰1: 對于給定的感興趣任務,如何充分利用有限的 K-shot 數據,以高效地確定具有最大潛力的模型。

挑戰2: 如何從開源數據集中識別與 K-shot 任務相關性最強的一批指令數據,以便為 LLMs 注入、補充缺失的領域知識,同時避免過擬合現象。

挑戰3: 當多個 LLMs 均在任務上表現出有效性時,如何構建一個自適應的模型融合系統,以更好地利用這些模型之間互補的知識,從而提高它們在 K-shot 任務中的協同性能并展現出比單模型更優的效果。

本文貢獻

本研究提出了一種結合公開可用模型和數據集,針對特定任務提升大型語言模型性能的方法全流程。主要貢獻包括:

  1. 提出了一種高效篩選具有最大潛力的模型的方法,綜合推理困惑度模型表現模型間知識豐富度進行模型篩選,在有限的 K-shot 數據條件下,能夠充分發揮已有模型的性能。
  2. 設計了一種從開源數據集中提取與感興趣任務或領域相關知識的方法,通過相似性-多樣性的數據篩選策略,為 LLMs 提供補充信息,降低過擬合的風險。
  3. 通過混合專家模型結構構建了一種自適應的模型融合系統,能夠在多個潛在有效的 LLMs 之間實現知識互補和協同優化,從而在感興趣任務上取得更好的性能。

前提儲備:

LoRA Bank Construction:從 Huggingface 選擇 38 個具有代表性且廣泛使用的指令數據集,對每個數據集進行預處理和 LoRA 微調來構建 LoRA Bank。LoRA Bank的引入為特定任務提供了可選擇的預訓練模型集合,并保證了實驗的可重復性以及對比的公平性。

圖片

核心方法:

1、K-shot Guided Expert Model Selection:提出一種專家模型選擇方法,綜合考慮模型的推理困惑度在K-shot數據上的性能表現以及模型多樣性來篩選最有潛力的模型組。

團隊發現,僅僅從推理結果的性能評估(通常用后處理+Exact Match等手段來計算)不能很好地預測得到模型在特定任務上的表現。這是因為模型輸出的答案可能無法被完全后處理解析,導致模型被低估。

團隊發現通過答案的推理困惑度可以判斷模型對某一個領域的理解能力,因此綜合考慮了這兩種手段。

如下圖,部分直接推理指標高的模型在微調后表現可能低于原先推理指標低的模型,但推理困惑度低的模型的微調后的性能會比原先困惑度高的模型更強。

此外,還對模型組的組多樣性進行了評估,即不同模型的知識的差異性要盡量大,這對于混合專家系統的訓練效果有較大提升。

圖片

2、Mixture-of-Experts Initialization:使用混合專家模型結構來利用合理利用 LoRA Bank,用模型篩選步驟中得到的模型做MoE模型的初始化,并訓練Router使模型能夠自動將不同的 token 分配給合適的專家,從而促進不同專家之間的協同合作。

圖片

3、K-shot Guided Sim-Div Data Selection:提出一種相似性優先和多樣性感知的數據選擇策略,通過對原始指令文本進行embedding計算,計算開源數據和K-shot數據相似度,選擇與K-shot數據最相似的數據子集,并通過語義層面上的相似度去重來去除重復度過高的數據,保證數據的多樣性。

數據相似度-多樣性的平衡是篩選過程中著重考慮的點,相似的數據能保證和當前任務的強相關性,多樣性的引入能保持數據整體的豐富度和信息充分性,防止模型過擬合的情況的出現。

圖片

4、Mixture-of-Experts Fine-Tuning:結合增強數據集和K-shot數據集來優化 MoE 系統的Router權重和專家權重,使用交叉熵損失來監督語言建模的輸出。

實驗設置

數據集:使用六個開源數據集(ARC-Challenge、ARC-Easy、PiQA、BoolQ、MBPP 和 GSM8K)作為評估集,從每個數據集的官方訓練集中隨機采樣K條有標注的指令-響應對作為 K–shot數據。

基線:與五種基線方法(基礎模型、隨機選擇模型、基于整個訓練集微調的模型、在測試集上表現最佳的專家模型、對最佳專家進行微調的模型)以及其他 SOTA 方法進行比較。

實驗結果與分析

圖片

1、與基線和 SOTA 方法對比,本文方法在各項任務上均取得了更好的性能。

圖片

2、通過可視化專家的激活模式,發現 MoE 系統沒有等效地坍縮為單個模型,每個專家都對整體有貢獻。

圖片

3、在模型選擇的消融研究中,綜合考慮評測性能、推理困惑度和模型多樣性來選擇有潛力的模型優于單一依賴 K - shot 性能或推理困惑度的方法,且推理困惑度比普通困惑度在模型選擇中更有效。

圖片

4、在數據選擇的消融研究中,基于相似性優先和多樣性感知的數據選擇策略進一步提高了 MoE 系統的性能,同時發現增加數據量時性能先上升后下降,多樣性在平衡分布和緩解過擬合方面起著重要作用,不同的相似性采樣技術對性能也有影響。

圖片
圖片

5、在對 K、N 和 k 的消融研究中,發現增加僅僅需要K=5,即5條有標注樣本在感興趣任務上的就可以取得不錯的效果。

專家候選者之間的差異對于維持任務導向的 MoE 系統至關重要。此外MoE 系統訓練所需的數據量應根據任務進行優化,更困難的任務需要更多高質量訓練數據。總的訓練數據的數量不能太多,隨著k的增加,模型性能會出現先上升后下降的趨勢,證明和任務數據相似度較高的外部數據的引入才能對模型性能有所提升。

從LoRA Bank中選出的專家數量N不需要很多,證明和模型高相關性的適配器的引入才能增強模型的任務能力。

圖片

6、對MoE組合的有效性分析:將數據劃分為All-correct,All-incorrect,Mixed三類數據,其中Mixed代表至少有一個專家做對且至少有一個專家做錯(不同專家出現分歧)的樣本,通過MoE的方式,不同專家的融合能超過最優的專家的效果,證明MoE組合方案的有效性。

圖片
圖片

討論

本方法不依賴數據集和模型的元信息,這是本方法的一大優勢。實際場景下,數據和模型的源信息可能會存在描述不詳細、難以確定相關數據點等問題。開源模型的訓練數據/訓練細節很難具體獲得。

該方法具有多任務適用性和易用性,大多數開源 LLMs 是 LLaMA 和 Mistral 家族的變體,可通過 Huggingface 獲取大量模型,但不同 PEFT 方法之間計算模型間相似性可能不兼容。

結論

本文提出的方法通過 K - shot 數據在模型選擇和數據擴增中發揮重要作用,優于現有方法,并通過消融研究驗證了選擇方法的有效性,展示了一種挖掘開放知識進行定制技能整合的高效流程。


責任編輯:張燕妮 來源: 量子位
相關推薦

2022-12-12 11:31:39

數據學習

2025-06-24 09:06:00

AI推理模型

2024-08-15 15:20:00

模型生成

2024-12-30 07:11:00

大型視覺語言模型VLMs人工智能

2025-06-06 09:15:00

2023-12-18 13:11:00

AI論文

2024-09-03 14:10:00

模型測試

2025-07-25 09:22:13

2023-12-27 18:12:50

2021-11-26 18:37:39

技術人工智能計算機

2023-09-25 10:04:37

模型AI

2022-07-04 15:09:55

超大數據集數據分析瘦身

2024-02-21 12:10:00

模型數據

2025-06-11 09:17:00

2025-10-17 09:56:05

2022-12-08 13:00:10

AI性別偏見

2024-10-23 19:47:54

2024-07-08 08:47:00

2025-10-16 08:52:00

2024-12-23 15:30:00

模型AI測試
點贊
收藏

51CTO技術棧公眾號

欧美日韩在线成人| 国产欧美精品一区二区三区介绍 | 日本一级理论片在线大全| 国产精品综合二区| 久久久久久久久综合| 欧洲美一区二区三区亚洲| 香蕉久久一区| 精品久久久久久久久久久| 性欧美大战久久久久久久免费观看| 国产又粗又猛又黄又爽| 亚洲精品欧美| 97偷自拍亚洲综合二区| 国产精品欧美一区二区三区| 97欧洲一区二区精品免费| 成人毛片在线播放| 一区二区中文| 亚洲最新在线视频| 中文字幕无人区二| 日本国产欧美| 精品女同一区二区三区在线播放| 一区二区视频国产| 亚洲欧美自偷自拍| 国产成人精品在线看| 国产精品电影网| 日本少妇bbwbbw精品| 成人免费电影网址| 亚洲精品一区二区久| 能看毛片的网站| 悠悠资源网亚洲青| 亚洲免费观看高清完整版在线观看 | 亚洲v国产v| 老牛影视av牛牛影视av| 国内成+人亚洲+欧美+综合在线 | 最近2019年好看中文字幕视频| 国产伦精品一区二区三区精品| 韩国精品视频在线观看 | 男人天堂网视频| 97久久人人超碰caoprom| 亚洲色图都市小说| 天堂va久久久噜噜噜久久va| 亚洲av成人精品一区二区三区在线播放| 国产精品一区二区三区乱码| 国产精品视频xxxx| 区一区二在线观看| 久久裸体视频| 欧美做受高潮电影o| 午夜毛片在线观看| 少妇被狂c下部羞羞漫画| a篇片在线观看网站| 91天堂素人约啪| 高清不卡日本v二区在线| 国产毛片毛片毛片毛片毛片| 久久久久国内| 日本精品视频在线播放| 日本视频网站在线观看| 欧美资源在线| 国产91色在线| 中文字幕在线观看视频免费| 久久久久久黄| 国产精品久久一区| 99re热视频| 免费观看久久久4p| 国产精品自产拍在线观 | 欧美一区二区免费视频| 中文字幕在线视频一区二区三区| 久久69成人| 欧美日韩aaa| 毛片毛片毛片毛片毛| 成人亚洲精品| 日韩欧美的一区| 久久久久久婷婷| 亚洲免费观看高清完整版在线观| 日韩精品高清在线| 精品人伦一区二区三电影| 菠萝蜜一区二区| 久久精品一偷一偷国产| 欧美成人三级视频| 精品电影一区| 国产精品18久久久久久麻辣| 亚洲天堂avav| 国产成人自拍在线| 久久riav二区三区| av电影在线观看网址| 中文字幕一区二区三区av| 公共露出暴露狂另类av| caoporn-草棚在线视频最| 一本到三区不卡视频| 九九热精品在线播放| 日韩高清在线观看一区二区| 亚洲精品成人久久电影| 中文字幕在线观看免费高清| 亚洲精品99| 91国自产精品中文字幕亚洲| 做爰无遮挡三级| 国产v综合v亚洲欧| 日韩电影大全在线观看| a黄色片在线观看| 懂色av中文一区二区三区天美| 成人三级视频在线播放| 57pao成人永久免费| 亚洲国产天堂久久国产91| 成人激情五月天| 国产字幕视频一区二区| 国产精品国产自产拍高清av水多| 999av视频| 久久久www成人免费毛片麻豆| 精品国产无码在线| 神马午夜在线视频| 91精品久久久久久久91蜜桃| 北岛玲一区二区| 91高清一区| 国产精品电影观看| 视频污在线观看| 一区二区中文字幕在线| 欧美韩国日本在线| 亚洲精选av| 久久久av亚洲男天堂| 丁香六月婷婷综合| 成人小视频免费观看| 亚洲一区三区视频在线观看| 久久久男人天堂| 欧美不卡一区二区| 三级黄色片在线观看| 亚洲专区一区| 国产精品区二区三区日本| 3p视频在线观看| 色综合久久久久网| 国产精品无码在线| 亚洲视频高清| av一区二区在线看| 色的视频在线免费看| 色女孩综合影院| 国产黄色三级网站| 黄色在线一区| 国产成人精品日本亚洲11| 午夜老司机在线观看| 色狠狠综合天天综合综合| 免费成人深夜夜行p站| 好吊日精品视频| 99久久伊人精品影院| 精品麻豆一区二区三区| 欧美色图12p| 国产一区二区三区四区在线| 免费日韩av片| 麻豆av福利av久久av| 亚洲美女尤物影院| 日韩av最新在线观看| 五月婷婷激情网| av午夜精品一区二区三区| 欧美激情亚洲天堂| 亚洲乱码一区| 97国产成人精品视频| 天堂网2014av| 色婷婷综合久久久中文字幕| 人人妻人人澡人人爽人人精品| 国产欧美91| 欧美婷婷久久| 成人午夜毛片| 欧美xxxx18国产| 不卡av中文字幕| 亚洲国产裸拍裸体视频在线观看乱了| 任你躁av一区二区三区| 国产人成精品一区二区三| 蜜桃网站成人| 国产毛片精品久久| 久久久精品影院| 丰满熟妇乱又伦| 欧美三级xxx| 国产毛片欧美毛片久久久| 麻豆精品在线看| 400部精品国偷自产在线观看| 日韩一区网站| 欧美性受xxx| 超碰免费在线| 91精品国产乱码久久蜜臀| 精品无码久久久久久久| 99国产欧美另类久久久精品| 99草草国产熟女视频在线| 91日韩欧美| 国产伦精品一区二区三| 久久野战av| 久久久成人的性感天堂| 亚洲AV无码国产精品午夜字幕| 亚洲成人黄色影院| 无码 人妻 在线 视频| 激情综合色综合久久| 国产精品久久久久7777| 精品国产aⅴ| 1卡2卡3卡精品视频| 亚洲欧洲美洲av| 国产一区二区三区18| www.好吊色| 色av一区二区| 国产一级片免费| 中文字幕免费在线观看视频一区| 波多野结衣三级视频| 麻豆91精品| 精品一区二区三区无码视频| 国产一区不卡| 成人在线观看av| 成人久久网站| 97av在线视频| 亚洲精品白浆| 中文字幕久久久av一区| 殴美一级特黄aaaaaa| 欧美日韩高清一区二区| av资源免费观看| 怡红院av一区二区三区| 国产123在线| 99久久婷婷国产综合精品电影| 日韩精品视频一二三| 国产精品久久久久毛片大屁完整版| 最新精品视频| 国内亚洲精品| 久久99精品久久久久久三级| 欧洲大片精品免费永久看nba| 国产精品视频不卡| 久久sese| 热久久99这里有精品| 日韩专区av| 久久精品视频在线观看| 91网页在线观看| 亚洲欧美日韩中文在线制服| 蜜桃av中文字幕| 日韩一区二区三免费高清| 中文字幕av资源| 色丁香久综合在线久综合在线观看| 国产午夜福利精品| 亚洲精品国产一区二区三区四区在线 | www.久久久久爱免| 国产精品入口免费视| 三级成人黄色影院| 91黑丝高跟在线| rebdb初裸写真在线观看| 欧美夫妻性生活视频| 综合久久2019| 久久夜色精品国产| 国产视频一区二区| 日韩视频一区在线| 97视频在线观看网站| 中文字幕av一区| av电影在线观看网址| 中文字幕亚洲无线码a| 国产专区在线| 亚洲亚裔videos黑人hd| 黄色电影免费在线看| 国产午夜精品视频免费不卡69堂| 男人天堂资源在线| 亚洲视频在线观看| 久青青在线观看视频国产| 亚洲乱码一区二区| 国产在线观看免费| 亚洲一区二区久久| 亚洲成a人v欧美综合天堂麻豆| 中文字幕久热精品视频在线| av资源种子在线观看| www.美女亚洲精品| а天堂中文在线官网| 欧美巨猛xxxx猛交黑人97人| 亚洲区欧洲区| 国语自产精品视频在线看抢先版图片| 波多野结衣中文在线| 性色av一区二区三区| 亚洲性受xxx喷奶水| 国产精品成人一区二区| 99久久99九九99九九九| 都市激情久久久久久久久久久| 96sao在线精品免费视频| 久久av一区二区| 日韩免费看片| 粉嫩av一区二区三区天美传媒 | 九九视频免费观看视频精品| 日本在线视频不卡| 婷婷综合在线| 亚洲精品久久久久久久蜜桃臀| 99精品视频免费观看| 中文字幕在线导航| 国产精品一区二区三区网站| 国产白嫩美女无套久久| 中文字幕成人av| 精品99在线观看| 在线一区二区观看| 国产精品视频久久久久久| 亚洲第一精品福利| 懂色一区二区三区| 欧美精品日韩www.p站| 免费毛片b在线观看| 国产乱人伦真实精品视频| 亚洲五码在线| 日本高清不卡三区| 最新欧美人z0oozo0| 国产精品秘入口18禁麻豆免会员 | 日韩欧美国产骚| 国产又粗又黄视频| 日韩风俗一区 二区| 黄网页免费在线观看| 91sa在线看| 国产精品久久免费视频| 欧美 日韩 国产在线| 欧美黄色精品| 国产又粗又长又大的视频| 成人一区在线观看| 日本爱爱爱视频| 亚洲成人免费观看| 影音先锋黄色网址| 日韩电影中文字幕av| 巨大荫蒂视频欧美大片| 国产97在线观看| 99精品中文字幕在线不卡| 午夜精品美女久久久久av福利| 在线观看亚洲| 午夜免费一级片| 国产女人18毛片水真多成人如厕| 免费毛片一区二区三区| 日韩一本二本av| 乱人伦中文视频在线| 日本久久久久久久久| 成人av影音| 艳母动漫在线观看| 日韩成人一区二区三区在线观看| 国产熟女高潮一区二区三区| 亚洲欧美日韩中文字幕一区二区三区 | aa成人免费视频| 97精品视频| 欧美日韩在线观看不卡| 久久综合给合久久狠狠狠97色69| 久久激情免费视频| 7777精品伊人久久久大香线蕉最新版 | 成人听书哪个软件好| 国产高清在线免费观看| 欧美日韩性生活| 超碰免费在线| 国产精品入口免费视| 成人午夜国产| 亚洲综合在线网站| 久久久久久**毛片大全| 久久国产黄色片| 日韩电视剧在线观看免费网站| 国产亚av手机在线观看| 成人av男人的天堂| 欧美喷水视频| 一级网站在线观看| 亚洲丝袜另类动漫二区| 一级特黄特色的免费大片视频| 一区二区福利视频| 成人精品电影在线| 日韩久久精品一区二区三区| 男人天堂欧美日韩| 久久亚洲AV无码专区成人国产| 色狠狠综合天天综合综合| 岛国在线视频| 国产精品免费久久久| 日韩欧美精品| 中文 日韩 欧美| 一区二区三区中文字幕在线观看| 国产高清免费在线观看| 欧美日本中文字幕| 风间由美一区二区av101| 国产v片免费观看| 国产亚洲综合在线| 中文字幕777| 超碰97人人做人人爱少妇| 一区二区三区欧洲区| 阿v天堂2018| 久久天天做天天爱综合色| 亚洲综合成人av| 日韩亚洲欧美中文高清在线| 蜜桃精品视频| 蜜臀av无码一区二区三区| 久久久久久97三级| 亚洲一区二区三区网站| 欧美精品在线视频观看| 国产精品白浆| 99视频免费播放| 亚洲视频狠狠干| 天堂在线观看av| 国产精品电影观看| 午夜精品久久久久99热蜜桃导演| 97精品人妻一区二区三区蜜桃| 日韩欧美在线免费| 求av网址在线观看| 国产精品99久久久久久久| 久久99伊人| 91精品国产闺蜜国产在线闺蜜| 亚洲成人久久久久| av一区在线播放| 国产片侵犯亲女视频播放| 久久精品视频免费| 国产乱码一区二区| 欧美有码在线观看视频| 亚洲国产精品久久久久蝴蝶传媒| 中文字幕一区二区人妻电影丶| 欧美图区在线视频| 不卡一本毛片| 亚洲aⅴ天堂av在线电影软件| 成人精品视频网站| 一级黄色片在线| 欧美孕妇毛茸茸xxxx| 中文字幕亚洲综合久久五月天色无吗'' | 黄色av网站免费|