精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?

發(fā)布于 2025-11-11 07:22
瀏覽
0收藏

你花數(shù)百萬訓(xùn)練一個大模型。訓(xùn)練完發(fā)現(xiàn)效果不錯。但你不知道的是:模型可能只學(xué)到了數(shù)據(jù)里20%的知識,剩下80%都浪費了。

怎么證明?很簡單:訓(xùn)練完之后,讓模型在回答問題時去原始訓(xùn)練數(shù)據(jù)里"搜一搜",性能立馬提升——提升幅度相當(dāng)于你多花5倍的錢重新訓(xùn)練一個更大的模型。

這是蘋果和斯坦福研究團隊最近發(fā)現(xiàn)的。他們的論文用大白話說就是:大模型訓(xùn)練時學(xué)得太淺了,數(shù)據(jù)價值浪費嚴(yán)重。

論文的實驗設(shè)計很巧妙,分三步:

第一步:正常訓(xùn)練:用一堆數(shù)據(jù)訓(xùn)練模型,就像平時那樣。

第二步:加個"搜索"功能 :訓(xùn)練完后,讓模型回答問題時,先去訓(xùn)練數(shù)據(jù)里搜索相關(guān)內(nèi)容,再回答。

關(guān)鍵:搜索的數(shù)據(jù)和訓(xùn)練的數(shù)據(jù)完全一樣。

第三步:對比效果:看看"訓(xùn)練"和"訓(xùn)練+搜索"的差距有多大。

測試用的是 MMLU:

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

平均下來,搜索相當(dāng)于讓你多花了5倍的錢訓(xùn)練模型。

但注意:模型越大,這個倍數(shù)越小。說明大模型確實學(xué)得更充分一些。

這是作弊嗎?會不會是搜到了答案?研究團隊專門做了"去污染"實驗(就是把可能包含答案的數(shù)據(jù)刪掉),結(jié)果發(fā)現(xiàn):即使刪掉疑似答案的數(shù)據(jù),提升依然很明顯。MMLU 測試題有 14.1% 能在訓(xùn)練數(shù)據(jù)里找到,數(shù)學(xué)題更夸張,有 32.0%。這說明很多公開數(shù)據(jù)集其實有"泄題"問題。

不過,即便排除這些,提升還是很大。

為什么會這樣?簡單說:訓(xùn)練模型就像讓學(xué)生背書,而搜索就像讓學(xué)生開卷考試。

背書:

?需要把所有知識記在腦子里

?記不住的就丟了

?記住的也可能記錯

開卷考試:

?不用全記住,知道在哪查就行

?現(xiàn)場翻書,不會記錯

?還能理解得更深

所以同樣的訓(xùn)練數(shù)據(jù),模型"背"只能學(xué)到20%,"開卷"就能用上100%。

不同科目差異很大有意思的是,不同類型的題目,搜索的幫助程度差很多:

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

理工科受益最大?這很反常識。

一般認(rèn)為,搜索就是"查資料",應(yīng)該對需要記憶的人文學(xué)科幫助更大。但實際上理工科受益更多。搜索不只是"查字典"。搜到的內(nèi)容本身就能幫模型推理和理解,尤其是理工科的復(fù)雜知識。

再加點技巧,效果更炸裂:研究團隊還測試了在搜索基礎(chǔ)上加一些小技巧:

技巧1:重新排序(reranker)搜出來的內(nèi)容再精選一遍,把最相關(guān)的放前面。

技巧2:多試幾次投票(self-consistency)讓模型回答5次,少數(shù)服從多數(shù)。

技巧3:換著搜(variance reduction)每次搜不同的內(nèi)容,增加多樣性。

最終結(jié)果(用 Llama 3.1 8B 這個公開模型測試):

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

看 SimpleQA 那個提升:從1.5%到74.0%,直接提升50倍!綜合算下來,這些技巧加起來相當(dāng)于讓訓(xùn)練成本增加11倍。

兩個意外發(fā)現(xiàn)

發(fā)現(xiàn)1:訓(xùn)練好用的數(shù)據(jù),搜索不一定好用

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

FineWeb-edu 用來訓(xùn)練效果更差,但用來搜索反而更好。

這說明:好的訓(xùn)練數(shù)據(jù)和好的搜索數(shù)據(jù),標(biāo)準(zhǔn)可能不一樣。

發(fā)現(xiàn)2:模型不會用搜到的內(nèi)容

論文統(tǒng)計發(fā)現(xiàn):

?把模型從小換成大的 → 39.7% 的答案變了

?加上搜索功能 → 只有 28.1% 的答案變了

這說明什么?

搜索沒幫上的題目,不是因為搜的內(nèi)容不好,而是模型不會用。就像給學(xué)生一本參考書,但學(xué)生不知道怎么看。

所以未來的方向是:教模型更好地利用搜到的內(nèi)容。

這對我們意味著什么?

1. 預(yù)訓(xùn)練可能浪費了很多錢

如果訓(xùn)練時只學(xué)到了20%,那意味著80%的訓(xùn)練成本打了水漂。

OpenAI、Google 花幾億美元訓(xùn)練模型,如果能把訓(xùn)練效率翻倍,能省多少錢?

2. 不用無限堆算力,優(yōu)化方法就能提升很多

現(xiàn)在大家都在拼"誰的GPU多",但這篇論文說:改進訓(xùn)練方法可能更劃算。

與其花5倍的錢買GPU,不如研究怎么讓模型學(xué)得更充分。

3. "搜索"是個有效的低成本方案

訓(xùn)練一次要幾百萬美元,但加個搜索功能成本很低。

對于中小公司來說,這可能是更現(xiàn)實的路徑:

?用開源模型(Llama 等)

?加上自己領(lǐng)域的數(shù)據(jù)檢索

?用測試時技巧優(yōu)化

效果可能不比大廠的超大模型差多少。

4. 測試時優(yōu)化是新方向

以前大家都專注"怎么訓(xùn)練更好",現(xiàn)在發(fā)現(xiàn)"怎么用更好"也很重要。

就像手機,不只是硬件要強,系統(tǒng)優(yōu)化也很關(guān)鍵。

寫在最后:問題比答案更重要

這篇論文最大的價值不是"搜索能提升效果",而是提出了一個問題:

為什么模型訓(xùn)練時學(xué)得這么淺?

可能的原因:

?? 訓(xùn)練算法有問題,沒有充分利用數(shù)據(jù)

?? 模型結(jié)構(gòu)有局限,記不住那么多

?? 訓(xùn)練時間不夠長,還沒學(xué)會

論文說:

今天的訓(xùn)練方法并沒有充分利用訓(xùn)練數(shù)據(jù)中的信息,這給改進留下了很大空間。

換句話說:不用急著搞更大的模型、更多的GPU,先把現(xiàn)有的用好再說。

大模型的進步,不一定要靠"更大、更貴"。"更聰明"可能才是關(guān)鍵。

?標(biāo)題:Reusing Pre-Training Data at Test Time is a Compute Multiplier              (在測試時重用訓(xùn)練數(shù)據(jù),相當(dāng)于算力加倍)

?鏈接:https://arxiv.org/abs/2511.04234

本文轉(zhuǎn)載自??AI帝國??,作者:無影寺

已于2025-11-11 07:22:33修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
一本久久精品一区二区| 波多野结衣中文一区| 中文字幕亚洲综合久久| 老司机久久精品| 日本一级理论片在线大全| 日韩电影精品| 亚洲一区二区三区四区五区黄 | 亚洲欧美影院| 午夜精品一区二区三级视频| 日韩精品一区国产| 狠狠躁夜夜躁人人爽超碰91| 亚洲成人蜜桃| 黄色三级网站在线观看| 久久成人综合| 精品少妇一区二区三区| 成人精品小视频| 羞羞视频在线观看不卡| 久久久久久久久久久99999| 久久久亚洲精选| 日韩女同一区二区三区| 澳门精品久久国产| 欧美日韩一区精品| 久草热视频在线观看| 日日夜夜精品一区| 2024国产精品| 欧美成人午夜视频| 亚洲图片另类小说| 黄色成人美女网站| 制服丝袜中文字幕一区| av免费网站观看| 国产美女高潮在线观看| 亚洲欧美另类小说| 婷婷五月色综合| 三区在线观看| 成人国产精品免费观看视频| 91久久精品一区| 一区二区乱子伦在线播放| 亚洲成a人片77777在线播放 | 天堂中文视频在线| 三妻四妾完整版在线观看电视剧| 最新国产精品久久精品| 日韩av在线一区二区三区| 人妻无码中文字幕免费视频蜜桃| 国产中文字幕精品| 国产精品视频999| 人妻 日韩精品 中文字幕| 激情亚洲成人| 欧美黄网免费在线观看| 欧美视频亚洲图片| 99欧美精品| 91黄色免费版| 日本爱爱免费视频| 成人国产精品一区二区免费麻豆| 欧美性猛交xxx| 国产视频一视频二| 国产传媒在线| 欧美日韩亚洲91| 日韩欧美国产免费| 深夜在线视频| 一本色道久久综合精品竹菊| 国产成人无码精品久久久性色| 538视频在线| 婷婷成人综合网| 欧美日韩亚洲在线| 欧洲亚洲精品视频| 久久久国产一区二区三区四区小说| 国产精品自拍首页| 国产 欧美 自拍| fc2成人免费人成在线观看播放| 国产精品久久九九| 亚洲av片在线观看| 久久精品欧美一区二区三区不卡| 欧美伦理一区二区| 国产福利在线| 亚洲欧美综合另类在线卡通| 91麻豆天美传媒在线| 亚洲精品一线| 天天影视网天天综合色在线播放| 国产午夜伦鲁鲁| 成人日韩精品| 欧美日韩国产综合久久 | 水蜜桃av无码| 国产精品亲子伦av一区二区三区| 欧美日韩视频专区在线播放| 午夜免费看视频| av日韩久久| 亚洲精品一区二区三区99| 偷拍女澡堂一区二区三区| 国产一区二区三区网| 欧美一区二区日韩| 欧美xxxxx少妇| 国产亚洲欧美日韩在线观看一区二区 | 亚洲一区在线观| 激情综合激情| 日本免费久久高清视频| 97国产成人无码精品久久久| 成人精品在线视频观看| 日韩成人av电影在线| 在线中文字幕第一页| 色综合视频一区二区三区高清| 亚洲综合av在线播放| 国产三级精品三级在线观看国产| 中文精品99久久国产香蕉| 国产精品久久久精品四季影院| 国产日韩欧美一区二区三区在线观看| 国产日韩欧美自拍| 西西人体44www大胆无码| 国产精品每日更新在线播放网址| 久艹在线免费观看| 成人做爰免费视频免费看| 欧美成人a∨高清免费观看| 国产成人无码精品久久二区三| 一级毛片免费高清中文字幕久久网| 午夜精品一区二区三区在线视| 亚洲图片中文字幕| 2024国产精品| av一区二区三区免费观看| jizzyou欧美16| 日韩电影第一页| 欧美日韩在线国产| 麻豆精品在线视频| 欧美日本亚洲| av资源中文在线| 日韩欧美一区二区久久婷婷| 久久久久无码精品国产sm果冻| 亚洲精品乱码久久久久久蜜桃麻豆| 91精品国产自产在线观看永久| 亚洲色大成网站www| 亚洲精品国产一区二区精华液| 国产四区在线观看| 日韩电影av| 亚洲精品国产成人| 激情五月婷婷小说| 亚洲精品一级| 91久久国产综合久久蜜月精品| 搞黄视频在线观看| 欧美午夜无遮挡| 日本一区二区不卡| 警花观音坐莲激情销魂小说| 欲香欲色天天天综合和网| 欧美r级在线观看| 成人免费精品动漫网站| 麻豆久久久久久| 亚洲精品一区二| 主播大秀视频在线观看一区二区| 精品亚洲一区二区三区四区五区| 欧美黄色免费看| 国产一本一道久久香蕉| 91社在线播放| 二区三区精品| 久久久av一区| 国产麻豆一精品一男同| 日韩理论在线观看| 国产美女视频免费看| 99久久这里只有精品| 国产精品一区二区三| yw193.com尤物在线| 在线看日韩精品电影| 免费人成又黄又爽又色| 天堂蜜桃91精品| 色视频一区二区三区| 91福利精品在线观看| 最近2019年日本中文免费字幕| 亚洲综合免费视频| 亚洲欧美日韩一区二区| 九色91porny| 亚洲激情不卡| 久久久久久高清| 国模一区二区| 精品国产区一区二区三区在线观看| 在线观看国产精品入口男同| 国产精品福利在线播放| 成人在线短视频| 日韩美女精品| 日韩av免费在线观看| 国产女主播在线写真| 欧美视频中文一区二区三区在线观看| 极品尤物一区二区| 国产精品中文欧美| 国产精品久久中文字幕| 久久最新网址| 成人福利网站在线观看| 亚洲wwwww| 日韩av在线免费观看| 中国黄色一级视频| 99久久精品国产导航| 成人在线免费观看av| 日韩av久操| 肥熟一91porny丨九色丨| 国产拍在线视频| 中文国产成人精品| 亚洲AV无码国产精品午夜字幕 | 黄色一级视频免费| 99久久精品免费观看| 一区二区三区网址| 国产精品黄色| 日韩欧美亚洲v片| 少妇精品在线| 国产精品69av| 国产丝袜视频在线播放| 在线成人av影院| 日本一区二区三区免费视频| 国产日韩av一区| 色综合久久久无码中文字幕波多| 亚洲一区二区三区四区五区午夜| 一区二区精品免费视频| 久久黄色影视| 91久久在线观看| 成人直播视频| 久久6免费高清热精品| 国产一级片在线| 精品福利视频一区二区三区| 自拍偷拍色综合| 亚洲超丰满肉感bbw| 欧美88888| 2021久久国产精品不只是精品| 国产精品久久久久久9999| 亚洲中午字幕| 久久精品中文字幕一区二区三区 | 在线视频免费在线观看一区二区| 成人激情视频网| 中文在线免费二区三区| 色综合天天狠天天透天天伊人| 成人免费在线视频网| 亚洲国产精品va在线看黑人| 国产精品羞羞答答在线| 亚洲欧美综合在线精品| 在线免费观看日韩av| 成人午夜av影视| 中文字幕在线视频一区二区三区| 狂野欧美一区| 啊啊啊一区二区| 国产精品www994| 欧美 国产 精品| 91免费精品| 亚洲欧美日韩精品在线| 中文有码一区| 欧美色欧美亚洲另类七区| 极品一区美女高清| 国产精品国产精品国产专区蜜臀ah | 欧美日韩国产一区二区三区| 久久久久久久久毛片| 一区二区中文字幕在线| 91无套直看片红桃在线观看| 国产亚洲精品精华液| 新91视频在线观看| 久久久久国产免费免费| 色欲av无码一区二区三区| 2欧美一区二区三区在线观看视频| 亚洲视频在线播放免费| 成人av电影在线网| 亚洲美女在线播放| 成人av网站在线| 六十路息与子猛烈交尾| 波多野结衣中文字幕一区二区三区| 亚洲一级Av无码毛片久久精品| 高清不卡在线观看av| 四虎永久免费观看| 久久综合狠狠| 少妇人妻互换不带套| 日韩精品亚洲专区| 岛国毛片在线播放| 国产揄拍国内精品对白| 香蕉视频xxxx| 成人精品亚洲人成在线| 国产一级二级在线观看| 久久亚洲综合色| 亚洲午夜久久久久久久国产| 国产精品天美传媒| 国产精品成人免费观看| 亚洲一二三级电影| 国产成人精品网| 欧美亚洲国产一卡| 99久久精品国产成人一区二区| 欧美mv日韩mv国产网站app| 少妇荡乳情欲办公室456视频| 欧美亚洲禁片免费| 99精品在线看| 日韩av网址在线观看| 国产女人在线观看| 久久亚洲精品一区二区| 成人免费图片免费观看| 国产精品狠色婷| 97蜜桃久久| 国产91在线高潮白浆在线观看| 国产69精品久久| 亚洲在线www| 欧美人妖在线观看| 亚洲欧美国产精品桃花| 国精品一区二区| 农村妇女精品一二区| 国产一区二区在线看| 强迫凌虐淫辱の牝奴在线观看| 欧美国产禁国产网站cc| 久久婷婷综合国产| 在线一区二区三区| 黄色美女一级片| 自拍偷拍亚洲一区| 男人的天堂免费在线视频| 国产美女精品免费电影| 久久男人av| 欧洲xxxxx| 美女国产一区| 人妻少妇被粗大爽9797pw| 久久99精品国产麻豆婷婷洗澡| 人妻体内射精一区二区三区| 欧美经典一区二区| 国产无套粉嫩白浆内谢| 亚洲午夜精品在线| 自拍偷拍福利视频| 亚洲第一区第二区| 黄色网在线免费看| 国产999精品久久久| jizz性欧美23| 日本一区二区免费高清视频| 裸体素人女欧美日韩| 第一页在线视频| 国产精品第一页第二页第三页| 亚洲精品1区2区3区| 日韩欧美在线1卡| 日本三级视频在线观看| 国产999精品视频| 日韩av午夜| 和岳每晚弄的高潮嗷嗷叫视频| 九九视频精品免费| 1024手机在线观看你懂的| 亚洲国产电影在线观看| 日韩 欧美 综合| 精品国产91亚洲一区二区三区婷婷 | 国产精品诱惑| 日本午夜一区二区三区| 国产视频一区免费看| 俄罗斯黄色录像| 夜夜揉揉日日人人青青一国产精品 | 激情在线小视频| 国产日韩欧美中文在线播放| 精品欧美激情在线观看| 国产成人亚洲精品无码h在线| 9色porny自拍视频一区二区| 久久午夜无码鲁丝片午夜精品| 777奇米四色成人影色区| 成人好色电影| 国产精品久久久久久久av电影| 你懂的视频欧美| 日韩视频免费在线播放| 26uuu精品一区二区| 国产九色在线播放九色| 日韩精品免费在线视频观看| 色资源二区在线视频| 欧美第一黄网| 日韩av成人高清| 亚洲色图 激情小说| 欧美日精品一区视频| 婷婷激情在线| 91影视免费在线观看| 午夜国产一区| 少妇献身老头系列| 亚洲成人在线观看视频| 天堂v视频永久在线播放| 在线观看亚洲区| 国内精品伊人| 中国一级黄色录像| 国产成人鲁色资源国产91色综| 国产小视频在线观看免费| 亚洲第一精品夜夜躁人人爽| 中文字幕在线直播| 亚洲国产一区在线| 国产自产视频一区二区三区| 久久久久无码精品国产| 亚洲韩国青草视频| 校园春色亚洲色图| 成年人免费观看的视频| 国产成人午夜电影网| 成年人免费高清视频| 在线观看不卡av| 国内精品视频| 欧美黑人经典片免费观看| 久久久久久久综合日本| 中文字幕乱码在线观看| 久久成人免费视频| 青青视频一区二区| 亚洲欧美日韩一级| 亚洲综合偷拍欧美一区色| 天堂中文在线8| 91久久夜色精品国产网站| 在线亚洲欧美| 国产又粗又猛又爽又黄的视频小说| 日韩女优av电影| 国产精品专区免费| 国产免费一区二区三区四在线播放| av动漫一区二区| 亚洲中文字幕一区二区| 性欧美激情精品| 欧美高清在线| 日本免费福利视频| 91精品国产综合久久久蜜臀粉嫩 | 性欧美疯狂xxxxbbbb| 成人av毛片| 精品视频导航| 91久久综合|