精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

調(diào)整訓(xùn)練數(shù)據(jù)出場順序,大模型就能變聰明!無需擴大模型/數(shù)據(jù)規(guī)模

人工智能 新聞
微軟亞洲研究院提出了一種全新的文本數(shù)據(jù)組織范式DELT(Data Efficacy in LM Training),通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,在不同模型尺寸與規(guī)模下都達到了良好性能。

模型訓(xùn)練重點在于數(shù)據(jù)的數(shù)量與質(zhì)量?其實還有一個關(guān)鍵因素——

數(shù)據(jù)的出場順序。

對此,微軟亞洲研究院提出了一種全新的文本數(shù)據(jù)組織范式DELT(Data Efficacy in LM Training),通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,在不同模型尺寸與規(guī)模下都達到了良好性能。

數(shù)據(jù)效率與效能提升

該方法用優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來讓語言模型學(xué)得更好,還不用增加數(shù)據(jù)量或擴大模型規(guī)模

來看看是怎么做到的。

訓(xùn)練樣本的組織順序很關(guān)鍵

首先,我們先來理清幾個概念。

在語言模型訓(xùn)練中,數(shù)據(jù)使用效率至關(guān)重要。現(xiàn)有研究多關(guān)注于數(shù)據(jù)效率(Data Efficiency),即如何通過數(shù)據(jù)選擇提升模型訓(xùn)練效率并保持優(yōu)異性能。

然而,數(shù)據(jù)效能(Data Efficacy),即如何通過數(shù)據(jù)組織增強模型訓(xùn)練表現(xiàn),卻常常被忽視。

以烹飪?yōu)槔瑪?shù)據(jù)效率就像在市場挑選新鮮、合適的食材,而數(shù)據(jù)效能則像名廚把握投放調(diào)料的時機與分寸,讓菜品發(fā)揮出最佳風(fēng)味。

數(shù)據(jù)組織的重要性

為了避免過擬合,當(dāng)前的大語言模型往往在海量數(shù)據(jù)上進行訓(xùn)練,并且訓(xùn)練的次數(shù)非常有限,甚至僅進行一次完整的訓(xùn)練周期(epoch=1),這與早期模型依賴多次迭代訓(xùn)練(epoch>>1)截然不同。

這些變化讓數(shù)據(jù)呈現(xiàn)的先后順序?qū)Y(jié)果影響巨大

早期的AI模型類似于讓學(xué)生多次反復(fù)翻閱同一本書,在多輪學(xué)習(xí)中慢慢補齊細節(jié);而現(xiàn)在更像只給一遍通讀,不再反復(fù)回看。

這就對閱讀順序提出了極高要求,必須精心規(guī)劃學(xué)習(xí)材料出現(xiàn)的先后和結(jié)構(gòu)。因此,訓(xùn)練樣本的組織順序顯得尤為關(guān)鍵。然而,關(guān)于這一點的研究卻很少。

基于此觀察,微軟亞洲研究院最新提出的文本數(shù)據(jù)組織范式DELT,通過引入數(shù)據(jù)排序策略,充分挖掘訓(xùn)練數(shù)據(jù)潛力,實現(xiàn)了數(shù)據(jù)的高效利用與效能提升。

DELT范式不但通過數(shù)據(jù)選擇提升效率,選取高質(zhì)量數(shù)據(jù),加快訓(xùn)練速度;

而且通過數(shù)據(jù)排序提升效能,在預(yù)訓(xùn)練和后訓(xùn)練階段都顯著提升了模型性能,且適用于通用、數(shù)學(xué)和代碼等多領(lǐng)域任務(wù)。

給模型按部就班安排訓(xùn)練課程

數(shù)據(jù)訓(xùn)練效能定義Data Efficacy

研究首先定義了數(shù)據(jù)訓(xùn)練效能(Data Efficacy),是指通過優(yōu)化訓(xùn)練數(shù)據(jù)的組織方式來最大化語言模型的性能表現(xiàn),而無需改變數(shù)據(jù)內(nèi)容或模型架構(gòu)。

與以往關(guān)注的“數(shù)據(jù)訓(xùn)練效率” (Data Efficiency) 側(cè)重數(shù)據(jù)篩選的研究目的不同,數(shù)據(jù)效能強調(diào)對訓(xùn)練數(shù)據(jù)的評分和排序,以充分挖掘數(shù)據(jù)的潛在價值。

數(shù)據(jù)順序在語言模型訓(xùn)練中的潛力尚未被充分挖掘, 數(shù)據(jù)效能旨在通過合理的數(shù)據(jù)組織方式,使模型在有限的訓(xùn)練數(shù)據(jù)和資源下實現(xiàn)更高的性能和泛化能力,成為提升語言模型性能的一種新興方法。

數(shù)據(jù)組織范式DELT介紹

DELT范式架構(gòu)

DELT(Data Efficacy in LTraining)是一種創(chuàng)新的文本數(shù)據(jù)組織范式。

它集成了數(shù)據(jù)評分(Data Scoring)、數(shù)據(jù)選擇(Data Selection) 和數(shù)據(jù)排序(Data Ordering) 三大核心組件。

數(shù)據(jù)評分根據(jù)特定的屬性為每個樣本賦予分數(shù),如:難度、質(zhì)量、多樣性等。

數(shù)據(jù)選擇通過評分篩選出最優(yōu)子集(如:top-k、按閾值篩選等),然后數(shù)據(jù)排序根據(jù)評分重新組織所選擇數(shù)據(jù)的呈現(xiàn)順序(如:基于課程學(xué)習(xí)的分數(shù)從低到高排列)。 為了兼顧數(shù)據(jù)處理效率,DELT范式的數(shù)據(jù)選擇和數(shù)據(jù)排序共用數(shù)據(jù)評分的結(jié)果。

因此,數(shù)據(jù)評分的規(guī)則設(shè)置非常重要。于是,研究還提出了Learning-Quality Score(LQS)方法。

LQS打分方式

該數(shù)據(jù)評分方式結(jié)合了質(zhì)量可學(xué)習(xí)性兩個關(guān)鍵指標,不但可以篩選出低質(zhì)量數(shù)據(jù),而且也能捕捉數(shù)據(jù)在不同階段的訓(xùn)練價值,進一步提供了可靠的數(shù)據(jù)排列順序。

為了進一步提升數(shù)據(jù)效能,團隊還提出了一種全新的折疊排序方法Folding Ordering(FO)。

基于課程學(xué)習(xí)的排序(即,按分數(shù)升序排序)可能導(dǎo)致模型遺忘和數(shù)據(jù)內(nèi)部分布偏差。

折疊排序策略通過多層“折疊”,將數(shù)據(jù)按分數(shù)分層并多次采樣,無重復(fù)且均衡分布。

Folding排序方式

相比隨機打亂或單一排序,它既保留難度排序優(yōu)勢,又避免模型過度遺忘或依賴特定數(shù)據(jù),提升了魯棒性和泛化能力。

與傳統(tǒng)隨機排序方法相比,DELT范式不僅通過減小數(shù)據(jù)規(guī)模提升了訓(xùn)練效率;而且在不同模型尺寸和數(shù)據(jù)規(guī)模下,在各種評測集上都顯著提升了模型性能。

不同數(shù)據(jù)規(guī)模和模型尺寸下的結(jié)果

DELT給Data-centric AI領(lǐng)域帶來了全新思路。

看來,類比于人類教學(xué)實踐,講究個性化與按部就班地安排學(xué)習(xí)內(nèi)容,AI訓(xùn)練也需要類似的學(xué)習(xí)方法。

論文鏈接:https://arxiv.org/abs/2506.21545

代碼鏈接:https://github.com/microsoft/DELT

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-07-22 10:15:44

2025-10-10 07:48:12

大模型預(yù)訓(xùn)練初始化

2025-10-21 08:00:00

2024-07-22 13:10:12

2025-05-16 09:10:00

2025-10-10 01:25:00

大模型訓(xùn)練數(shù)據(jù)OpenAI

2024-08-07 15:27:50

2025-04-24 09:26:13

大模型AI人工智能

2023-12-04 12:02:05

2024-01-03 18:53:13

語言模型LLM

2025-08-12 09:23:34

2025-11-06 01:20:00

2022-02-21 17:35:50

漏斗模型流程數(shù)據(jù)

2024-10-30 12:21:18

2024-10-10 11:59:11

2023-12-13 12:55:39

模型數(shù)據(jù)

2024-02-26 12:34:52

模型數(shù)據(jù)決策模型

2022-05-09 18:46:28

EOQ模型數(shù)據(jù)分析

2024-09-29 13:10:08

2025-02-24 14:15:00

模型訓(xùn)練AI
點贊
收藏

51CTO技術(shù)棧公眾號

免费黄色在线网址| 久久午夜夜伦鲁鲁一区二区| 黄色av免费观看| 免费一区视频| 精品国产一区二区三区久久久 | 欧美日本亚洲| 99国产精品久久久久久久成人| 亚洲作爱视频| 久久视频在线播放| 波多野结衣办公室33分钟| www久久久| 一本到一区二区三区| 男同互操gay射视频在线看| 深夜福利在线观看直播| 蜜臀a∨国产成人精品| 欧美国产乱视频| 日本午夜精品视频| 九九在线精品| 亚洲аv电影天堂网| gogogo高清免费观看在线视频| 欧美a级在线观看| 亚洲精品菠萝久久久久久久| 日本在线高清视频一区| 熟妇人妻中文av无码| 国内久久精品视频| 国产精品美女久久久久av超清| 伊人365影院| 亚洲国产日韩欧美在线| 在线电影中文日韩| 人妻熟女aⅴ一区二区三区汇编| 成人自拍视频| 欧美日韩精品高清| av免费中文字幕| 久久影院午夜精品| 一区二区三区高清| 肉大捧一出免费观看网站在线播放 | 日本一区二区三区免费看| 亚洲精品综合久久| 国产一区二区三区久久悠悠色av| 国产精欧美一区二区三区| 天堂在线免费观看视频| 国产字幕视频一区二区| 欧美老女人在线视频| 精品少妇一区二区三区密爱| 亚洲人成精品久久久| 亚洲精品成人久久| 中文字幕免费高清视频| jizz性欧美23| 精品国产自在久精品国产| 视频区 图片区 小说区| 成人综合日日夜夜| 3d成人动漫网站| 婷婷中文字幕在线观看| 日韩五码电影| 在线成人免费观看| 色网站在线视频| 国产精品亚洲欧美一级在线| 欧美日韩成人一区| 九九九九九伊人| 99精品国产九九国产精品| 91精品一区二区三区久久久久久| 精品亚洲视频在线| 2020国产精品极品色在线观看| 欧美变态凌虐bdsm| 182在线视频| 一本色道久久综合亚洲精品酒店| 亚洲欧美精品一区二区| 亚洲精品成人av久久| 日韩欧美1区| 欧美成人合集magnet| 久操免费在线视频| 亚洲一区区二区| 国产精彩精品视频| 国产熟女一区二区丰满| 国产a级毛片一区| 国语精品中文字幕| 国产无套粉嫩白浆在线2022年| 国产精品免费久久久久| 国产精品夜夜夜爽张柏芝| a级影片在线| 黄色91在线观看| 日韩免费高清在线| 色综合视频一区二区三区日韩| 日韩天堂在线观看| 无码人妻精品一区二区三区温州 | 影音先锋欧美在线| 午夜dj在线观看高清视频完整版| 精品动漫一区二区三区| 一区二区在线播放视频| 精品入口麻豆88视频| 亚洲国产高潮在线观看| 人妻一区二区视频| 午夜久久福利| 国产v综合ⅴ日韩v欧美大片| 国产乱人乱偷精品视频a人人澡| 国产91在线看| 天堂√在线观看一区二区| 成人看av片| 日韩欧美在线播放| 97超碰人人看| 深夜福利久久| 久久久久久久久久国产| 亚洲精品国产欧美在线观看| 风间由美性色一区二区三区| 青青草国产精品| 日本动漫理论片在线观看网站| 日韩欧美精品网址| a级大片免费看| 深爱激情综合网| 九色成人免费视频| 中文字幕人妻丝袜乱一区三区| 成人免费av在线| 亚洲图片小说在线| 三妻四妾完整版在线观看电视剧| 91麻豆精品久久久久蜜臀| 亚洲蜜桃精久久久久久久久久久久| 久久性感美女视频| 日本亚洲欧美三级| 亚洲国产成人在线观看| 国产精品毛片久久久久久久| 九九九九免费视频| 综合激情久久| 久久亚洲精品网站| 最近日韩免费视频| 久久这里只有精品6| www.一区二区.com| 国产精品亚洲一区二区在线观看| 在线成人免费网站| 国产成人无码专区| 95精品视频在线| 大陆av在线播放| 玖玖玖电影综合影院| 自拍偷拍亚洲区| 久久久久久久久久一级| 久久综合九色欧美综合狠狠| 欧美在线观看黄| av国产精品| 久久精品久久精品亚洲人| 伊人22222| 国产精品美日韩| 国产精品igao| 成人在线免费小视频| 国产999精品久久久影片官网| 午夜av免费在线观看| 午夜亚洲国产au精品一区二区| 国模大尺度视频| 国产精品hd| 91视频免费进入| 91黄色在线| 日韩免费在线观看| 中文字幕影音先锋| 粉嫩aⅴ一区二区三区四区五区| 精品国产一区二区三区在线| 激情久久免费视频| 美日韩在线视频| 精品国产亚洲av麻豆| 一区二区三区欧美视频| 亚洲丝袜在线观看| 黄色av一区| 精品欧美一区二区精品久久| 桃色av一区二区| 亚洲视频在线观看网站| 超碰在线免费97| 国产精品久久影院| 国产精品中文久久久久久| 一区二区三区在线电影| 爱情岛论坛亚洲入口| 草美女在线观看| 亚洲精品国产免费| 波多野结衣大片| 国产精品久久久久久久久快鸭| 亚洲五月激情网| 黄色精品一区| 欧美日韩喷水| 欧美黄色网络| 欧美激情影音先锋| 久青草国产在线| 欧美乱熟臀69xxxxxx| 黄页网站免费观看| 久久综合久久久久88| 在线观看国产福利| 欧美激情 亚洲a∨综合| 久久久久久国产精品一区| 日韩免费小视频| 成年无码av片在线| 欧美zozo| 欧美日韩成人在线一区| 日韩福利片在线观看| 日本一区二区三区久久久久久久久不| 一二三级黄色片| 国产亚洲亚洲| 自拍偷拍99| 亚洲成aⅴ人片久久青草影院| 国产日韩在线播放| 国产精品论坛| 久久婷婷国产麻豆91天堂| 日本黄色三级视频| 欧美日韩一区三区| 日韩精品无码一区二区| 国产精品久久久久久久久久久免费看 | av高清不卡在线| 三上悠亚在线一区二区| 激情久久久久久久| 在线一区亚洲| 一本色道久久综合亚洲精品酒店 | 亚洲欧洲视频在线观看| 欧美二区三区的天堂| 国产情侣自拍av| 亚洲品质自拍视频| 国产精品扒开腿做爽爽| 国产成人无遮挡在线视频| 国产精品第12页| 欧美视频福利| 可以免费看的黄色网址| 欧美伦理在线视频| 精品乱色一区二区中文字幕| 国产一区二区三区精品在线观看| 日本免费在线精品| 91桃色在线| 欧美大尺度在线观看| 91激情在线| 一区二区三区四区精品| 亚洲 另类 春色 国产| 日韩精品一区二区三区中文精品| 亚洲图片视频小说| 色88888久久久久久影院野外| 日本视频www| 亚洲在线观看免费视频| 天天操天天操天天操天天操天天操| 久久精品一区二区| 极品人妻一区二区三区| 成人精品免费视频| 乱码一区二区三区| 国产精品中文字幕日韩精品| 天堂av8在线| 老司机午夜精品| 一区二区三区 欧美| 视频一区在线播放| 99蜜桃臀久久久欧美精品网站| 一二三区精品| 精品少妇人妻av免费久久洗澡| 欧美日韩国产免费观看| 97在线免费视频观看| 欧美久久视频| 日b视频免费观看| 伊人久久综合| 国产原创popny丨九色| 99在线热播精品免费99热| 无罩大乳的熟妇正在播放| 一本色道88久久加勒比精品| 干日本少妇首页| 日韩专区一卡二卡| 黄色手机在线视频| 极品尤物av久久免费看| 深爱五月综合网| 国产麻豆精品视频| 中文字幕天堂av| 91免费观看在线| 西西444www无码大胆| 国产精品污污网站在线观看| 影音先锋男人看片资源| 综合欧美一区二区三区| 国产波霸爆乳一区二区| 亚洲sss视频在线视频| 日韩黄色一级大片| 色噜噜久久综合| 在线播放成人av| 日韩一区二区视频| 天堂av资源网| 亚洲丝袜在线视频| 久久综合网导航| 欧美激情一区二区三区成人| 中老年在线免费视频| 国产精品视频内| 在线视频成人| 九色91在线视频| 日韩影院二区| 日本中文字幕亚洲| 日韩国产欧美在线视频| 999在线精品视频| 成人国产精品免费观看| 黄色片在线观看免费| 亚洲蜜臀av乱码久久精品蜜桃| 久久夜靖品2区| 欧美吻胸吃奶大尺度电影| 精品欧美在线观看| 亚洲精品日韩在线| 国产一二三区在线观看| 2020欧美日韩在线视频| 伊人久久综合网另类网站| 精品无码久久久久国产| 久久综合99| 女人喷潮完整视频| 激情综合色播五月| 久久人人爽人人爽人人片| 亚洲猫色日本管| 中文字幕精品视频在线观看| 日韩三区在线观看| 国产免费av在线| 国语自产精品视频在免费| 国产一区影院| 精品国产一区二区三区日日嗨| 青青一区二区三区| 免费国产a级片| 国产剧情一区在线| 一级特黄曰皮片视频| 亚洲18色成人| 国产高清视频免费观看| 这里精品视频免费| 欲香欲色天天天综合和网| 亚洲一区亚洲二区亚洲三区| 激情婷婷综合| 欧美 国产 综合| 国产99久久久久久免费看农村| 三级黄色录像视频| 色欲综合视频天天天| 天堂成人在线视频| 欧美成在线观看| 国产高清日韩| 一区二区在线中文字幕电影视频| 免播放器亚洲| 国产精品无码一区二区三| 亚洲精品久久久蜜桃| 国产精品久久久久久久久久久久久久久久久久| 精品亚洲国产成av人片传媒 | 日批免费观看视频| 亚洲视频一区在线| 91亚洲精品国偷拍自产在线观看| 国产午夜精品免费一区二区三区| 一区二区三区四区日本视频| 国产亚洲二区| 激情综合中文娱乐网| 波多野结衣三级视频| 亚洲丝袜美腿综合| 91午夜交换视频| y97精品国产97久久久久久| 日韩成人综合网| 亚洲三区在线| 国内精品第一页| 三级全黄做爰视频| 91麻豆精品国产91久久久资源速度 | 韩国中文字幕av| 久久精品视频在线看| 中文字幕精品无码一区二区| 精品夜色国产国偷在线| 欧美粗大gay| 日本精品一区二区三区高清 久久| 亚洲欧美日韩专区| 日韩影视一区二区三区| 欧美日韩一区二区三区高清| h视频网站在线观看| 国产精品综合网站| 亚洲精品国产首次亮相| 国产调教打屁股xxxx网站| 亚洲成av人综合在线观看| 特黄视频在线观看| 日韩免费在线视频| 免费视频一区三区| www欧美激情| 亚洲欧美一区二区三区久本道91 | 国产视频视频一区| 日本中文字幕在线观看视频| 色悠悠久久久久| 久久久久久爱| 欧美 日韩 亚洲 一区| 久久午夜老司机| 亚洲天堂中文字幕在线| 久久99精品视频一区97| 欧洲精品一区| 久久综合伊人77777麻豆最新章节| 国产精品久久久一区麻豆最新章节| 国产日韩在线观看一区| 国产69精品久久久久99| 国产日韩欧美一区二区三区| 天天做天天干天天操| 亚洲1区2区3区4区| 99re在线视频| 成人动漫视频在线观看免费| 亚洲男女自偷自拍| 亚洲熟女少妇一区二区| 精品国产成人在线影院| 自拍偷自拍亚洲精品被多人伦好爽| 亚洲一区二区三区加勒比 | 99在线|亚洲一区二区| 日本不卡一区视频| 亚洲国产精品999| 日韩中文在线播放| 男人天堂手机在线视频| 国产欧美综合色| 亚洲精品.www| 国产精品视频不卡| 日韩午夜av在线| 天天色天天综合| 亚洲毛片在线免费观看| 99精品视频在线免费播放| 韩国一区二区av| 洋洋av久久久久久久一区| av在线播放免费| 精品国产福利| 国产精品自在欧美一区|