精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

榨干每一分算力:Distillation Scaling Laws帶你走進高效模型新時代

人工智能
Distillation Scaling Laws(蒸餾縮放定律)為知識蒸餾技術提供了理論基礎,優化了教師與學生模型間的資源分配,使得基于計算預算更科學地預測模型性能成為可能,同時降低了大規模應用蒸餾技術的風險,并揭示了“能力差距”現象的本質,為解決蒸餾過程中的挑戰提供了方向。

初次閱讀這篇文章,感到非常震撼。在DeepSeek將知識蒸餾方法帶入大眾視野后,Apple與牛津大學的研究人員迅速提出了蒸餾縮放定律,并已于2月28日完成了所有實驗及一篇長達67頁的論文上傳至arXiv。這種效率和深度,無疑展示了大公司的研究實力。這種高效的研究速度和成果展示,再次彰顯了大廠在科研領域的強大實力。

作為算力有限的獨立研究者,正好借此深入研究知識蒸餾技術,如何利用蒸餾方法最大化地利用有限的計算資源。通過學習這些前沿研究,或許能夠找到一些優化的思路和方法,從而在有限的條件下實現更好的模型性能。

簡單看下研究動機,總結為以下幾點:

1.模型縮放法則研究現狀:近年來的研究揭示了語言模型性能與模型規模、訓練數據量之間的關系,但在蒸餾場景下的縮放法則尚未有系統研究。

2.模型推理成本問題:隨著語言模型規模增大,推理成本顯著增加,研究如何在不損失性能的前提下降低推理成本成為重要課題。

3. 蒸餾的效率與性能:蒸餾理論上可降低推理成本,然而,學界對蒸餾方法缺乏共識,尤其是在如何合理分配計算資源以產生最強大的模型方面,仍存在很大的不確定性。

圖片

1、知識蒸餾

知識蒸餾的核心思想是將大型教師模型的知識遷移到小型學生模型中。具體來說,教師模型的預測分布被用作學生模型的目標分布,學生模型通過最小化與教師模型的Kullback-Leibler散度(KL Divergence)來學習:

圖片

其中,圖片圖片分別是教師模型和學生模型的輸出logits,是蒸餾溫度,用于控制教師模型輸出的概率分布的熵。

學生模型的總損失函數結合了下一個token預測損失和知識蒸餾損失:

圖片


  • λ:混合系數,控制知識蒸餾損失和下一個token預測損失的權重。
  • 圖片Z-loss的權重,用于提高訓練穩定性。

2、實驗設計

為了擬合蒸餾縮放法則,設計了以下三種實驗方案來生成縮放定律的擬合數據:

固定M教師/學生IsoFLOP配置

固定教師模型規模和訓練數據量,改變學生模型的規模和蒸餾數據量。目的是研究在固定教師模型條件下,學生模型性能如何隨其規模和蒸餾數據量變化。通過這種方式,可以確定學生模型在不同規模和數據量下的最優性能。

圖片

圖片

從實驗結果可以觀察到:

  • 在算力較大的情況下,學生模型參數規模越大,其損失函數越小,而且教師模型規模越大,這種趨勢越明顯。
  • 在學生和教師模型規模確定的情況下,算力越多,學生模型的確表現越好,這也很符合常理。
  • 在算力較小的情況下,模型性能會隨著模型規模先提高,后減弱,這里很容易理解,較大的模型在較小的算力下沒有得到充分訓練。
  • 在特殊情況下,學生模型能夠優于教師模型,表現出泛化能力,個人猜測可能是教師模型訓練欠擬合。

IsoFLOP教師/固定M學生配置

固定學生模型規模和蒸餾數據量,改變教師模型的規模和訓練數據量。目的是研究教師模型性能如何影響學生模型的最終性能。通過這種方式,可以確定最優的教師模型規模和訓練數據量,以最大化學生模型的性能。

圖片

結果可以看到,并非教師模型參數越大,學生模型的交叉熵圖片越低。表明教師模型的性能需要與學生模型的能力相匹配,才能達到最佳蒸餾效果

固定M教師/固定M學生配置

在固定比例下,教師模型和學生模型的性能如何隨其規模變化。這種配置雖然不是擬合縮放法則所必需的,但它提供了一個更廣泛的視角,展示了學生模型性能在不同教師模型條件下的變化。

同時變化教師模型和學生模型的規模:教師模型和學生模型的參數規模圖片圖片以及它們的訓練數據量圖片圖片同時變化,但保持固定的比例圖片圖片

圖片

在圖4中,觀察到容量差距現象,教師模型的規模對學生的性能有顯著影響,但存在一個最優的教師模型規模圖片(但并不一定是最大的模型),使得學生模型的性能圖片最低。即提高教師的表現并不總是提高學生的表現,甚至最終會降低學生的表現

2、Distillation Scaling Laws

先介紹一個預備知識,已有大量理論和實驗證明了交叉熵是可預測的,在監督學習場景下,模型的性能(交叉熵損失L)在模型規模(參數數量 N)和訓練數據量(token數量 D)遵循冪律關系。

圖片

可以使用教師的模型參數量和訓練數據量圖片來擬合監督縮放定律。

基于前面實驗結果,研究人員建立了蒸餾擴展定律的數學模型,用以下公式來表示:

圖片

  • 圖片:教師模型的驗證交叉熵損失。
  • 圖片:學生模型的驗證交叉熵損失。
  • 圖片:如果學生模型以監督學習方式訓練,其預期的驗證交叉熵損失。
  • 圖片:學生模型的非嵌入參數數量。
  • 圖片:學生模型的蒸餾token數量。
  • 圖片是通過實驗擬合的系數

簡單介紹下公式的組成:

  • 教師模型的交叉熵:教師模型的性能通過其交叉熵損失圖片來衡量。較低的圖片表示教師模型具有更好的性能,教師模型的性能直接影響學生模型的最終性能。
  • 容量差距(Capacity Gap):當教師模型的性能遠優于學生模型時,學生模型的性能可能會下降。這被稱為容量差距現象。公式中的圖片圖片用于捕捉這種現象。具體來說,當圖片遠小于圖片時,圖片會變得很大,導致學生模型的性能下降。
  • 學生模型的性能極限:當蒸餾數據量圖片足夠大時,學生模型的性能會趨近于教師模型的性能圖片。公式中的圖片用于描述學生模型在不同規模和數據量下的性能變化。
  • 學生模型的參數數量和蒸餾數據量:學生模型的參數數量圖片和蒸餾數據量圖片對學生模型的性能有顯著影響。公式中的α′和分別描述學生模型的參數數量和蒸餾數據量對性能的影響。
  • 指數項

最后兩個公式的關鍵系數可以參考下表:

圖片

結果可以看到,監督和蒸餾縮放定律在觀察到的數據上擬合得非常好,相對預測誤差小于1%。反映了蒸餾縮放定律的有效性,因此基于教師和學生的模型規模和數據規模可以互相實現最優模型的選擇。

圖片

3、Distillation vs Supervised

為了解蒸餾在何時有益,下圖是在固定計算資源下,蒸餾和監督學習的性能對比。結果展示,監督學習在給定足夠的學生計算或數據時總是優于蒸餾。對于適中的數據預算,蒸餾是有利的,然而,當有大量數據可用時,監督學習優于蒸餾。

總結即,在計算資源有限的情況下,蒸餾通常比監督學習更高效。這是因為蒸餾可以通過教師模型的指導,更快地學習到有效的特征表示,從而在較少的計算資源下達到更好的性能。

圖片

4、教師模型選擇

  • 學習信號強度:不同大小的教師模型可能提供不同的學習信號強度,這通常通過交叉熵損失來衡量。較大的教師模型可能會提供更強的學習信號(較低的交叉熵),從而有助于學生模型更好地學習。
  • 成本增加:使用較大的教師模型會帶來更高的成本,這是因為需要計算教師模型的logits。這意味著更大的教師模型不僅自身訓練成本更高,在用于蒸餾時也會消耗更多的計算資源。

圖7展示了在不同蒸餾數據預算下學生模型的交叉熵損失變化情況。結果顯示,最優教師損失圖片(用紅線表示)隨著學生大小圖片的增大而按冪律遞減,直到學生的損失圖片與最優教師損失圖片相匹配為止。這驗證了最佳教師規模幾乎始終與學生規模呈線性比例關系。

圖片

圖15可以看到,隨著蒸餾數據量圖片的增加,最優教師模型的交叉熵X逐漸降低,但這種降低的速率會隨著圖片的增加而減緩。因此可以得到:在計算資源有限的情況下,選擇較小的教師模型可以減少推理成本,同時仍然能夠提供有效的學習信號給學生模型。

圖片

5、計算最優蒸餾

計算最優蒸餾的目標是,在給定計算預算C的情況下,確定如何生成具有最低交叉熵的所需大小圖片的學生模型。具體來說,需要找到最優的學生訓練數據量圖片、教師模型大小圖片和教師訓練數據量圖片,使得在滿足計算預算約束的情況下,學生的交叉熵最小化。

從圖8中可以看到:

  • 監督學習在足夠的計算預算下總是匹配最優蒸餾:監督學習總是在某個總計算預算下匹配最佳情況蒸餾設置。這意味著,當計算預算足夠大時,監督學習可以達到與蒸餾相同的性能。
  • 當教師訓練包含在計算中時,學生交叉熵總是高于監督設置:這意味著,如果你的唯一目標是生成具有目標大小的最佳模型,并且你沒有訪問教師的權限,那么你應該選擇監督學習,而不是訓練教師然后進行蒸餾。相反,如果目的是蒸餾出一系列模型,或使用教師作為服務模型,那么蒸餾可能比監督學習在計算上更有益。
  • 較小的模型更可能從監督預訓練中受益,而較大的模型更可能從蒸餾中受益:較小的模型在較大的計算預算下更傾向于監督學習,而較大的模型在較大的計算預算下更傾向于蒸餾。

圖片

圖9展示了隨著計算預算的變化,最優教師大小和訓練數據量的變化趨勢。學生和教師模型的token按冪律縮放,學生token的增長速度更快。最佳教師模型規模最初增加,直到略大于學生,之后趨于穩定。這是因為使用大型教師模型進行推理成本很高,并且隨著學生token數量的增加,過擬合教師模型更有效

圖片

6、總結

Distillation Scaling Laws(蒸餾縮放定律)為知識蒸餾技術提供了理論基礎,優化了教師與學生模型間的資源分配,使得基于計算預算更科學地預測模型性能成為可能,同時降低了大規模應用蒸餾技術的風險,并揭示了“能力差距”現象的本質,為解決蒸餾過程中的挑戰提供了方向。

知識蒸餾的潛力是在有限計算成本下能夠訓練出性能更優的模型,因此在得到蒸餾縮放定律后,可以指導有限資源下的許多場景。

責任編輯:龐桂玉 來源: 小白學AI算法
相關推薦

2025-06-06 08:55:00

模型訓練算力

2012-05-17 10:32:20

無人值守

2024-09-29 09:21:46

2023-08-18 19:57:03

華為

2009-07-09 18:46:53

戴爾資金鏈管理

2023-09-05 16:51:48

算力

2024-04-25 09:08:44

西云算力算力

2021-06-24 20:28:44

辦公

2016-09-12 17:28:45

云存儲應用軟件存儲設備

2025-07-10 14:51:29

人工智能AI模型

2023-01-03 08:36:34

MySQL索引

2021-12-02 15:30:55

命令內存Linux

2025-02-06 09:27:02

DeepSeek超算

2011-04-28 15:25:35

噴墨打印機墨盒
點贊
收藏

51CTO技術棧公眾號

欧美亚洲在线播放| 欧美日韩二区三区| 快播日韩欧美| 中文字幕在线一| 久久久人成影片免费观看| 日韩女优av电影| 亚洲欧洲日产国码无码久久99 | 精品国产乱码久久久久久闺蜜| 欧美又粗又长又爽做受| 国产色a在线| 国产高清不卡一区二区| 55夜色66夜色国产精品视频 | 成人在线电影在线观看视频| 欧美一三区三区四区免费在线看| 阿v天堂2017| 麻豆免费在线视频| 久久亚洲综合av| 91丨九色丨国产在线| 日本三级片在线观看| 日韩精品1区| 亚洲成人av片| 伊人国产精品视频| 经典三级一区二区| 亚洲五月六月丁香激情| 一本色道久久综合亚洲精品婷婷| 五月天婷婷在线播放| 韩国女主播成人在线观看| 国产成人91久久精品| 蜜臂av日日欢夜夜爽一区| 欧美性猛交xxxxxx富婆| 日韩精品一区二区三区四| 国产视频网址在线| 99久久国产综合精品麻豆| 亚洲a成v人在线观看| 久久久久在线视频| 在线 亚洲欧美在线综合一区| 中文字幕亚洲色图| 亚洲一级中文字幕| ccyy激情综合| 日韩久久久精品| 在线看免费毛片| а√天堂资源国产精品| 欧美日韩中文字幕在线| 你真棒插曲来救救我在线观看| 黄色成人影院| 国产精品久久久久7777按摩| 欧美一区二区三区四区在线观看地址 | 国产精品丝袜91| 欧美h视频在线| 性xxxx视频| 懂色av一区二区在线播放| 91中文在线视频| 91精品国产乱码久久| 男男成人高潮片免费网站| 日本一区二区在线播放| 免费av网站在线| 9国产精品视频| 久久久噜噜噜久噜久久| 免费一级片视频| 午夜精品影院| 久久久久成人精品| 国产网址在线观看| 99在线观看免费视频精品观看| 亚州国产精品久久久| 日本一区二区三区免费视频| 一本久久知道综合久久| 青草成人免费视频| 国产精品suv一区| 奶水喷射视频一区| 国产精品国语对白| 一本色道久久综合精品婷婷| 久久99国产精品久久99| 2019国产精品视频| 丰满少妇高潮在线观看| k8久久久一区二区三区| 久久精品日韩| 成人精品一区二区三区免费| 国产精品沙发午睡系列990531| 亚洲一卡二卡三卡| 怡红院在线播放| 亚洲电影第三页| 两根大肉大捧一进一出好爽视频| 欧美大胆成人| 欧美日韩成人综合| 杨幂一区二区国产精品| 国产成人夜色高潮福利影视| 亚洲精品日韩久久久| 亚洲av无码一区二区三区人 | 成人午夜碰碰视频| 久久综合狠狠综合久久综青草| 九一国产在线| 亚洲三级电影网站| 极品粉嫩国产18尤物| 中文字幕色婷婷在线视频| 欧美午夜在线一二页| 一起草最新网址| 日韩有码av| 丝袜亚洲另类欧美重口| 久久久综合久久久| 久久久精品日韩| 91久久国产精品91久久性色| 天天干天天色天天| 国产精品污污网站在线观看| 毛片av在线播放| 欧美色999| 日韩欧美国产一二三区| 国产免费一区二区三区网站免费| 忘忧草精品久久久久久久高清| 韩剧1988在线观看免费完整版| 波多野结衣视频观看| 国产精品一二三四| 日本视频一区二区在线观看| 美女网站视频在线| 欧美日韩一区在线观看| 中文字幕乱码在线| 久久久五月天| 国产精品777| 人人妻人人澡人人爽精品日本| 中文字幕欧美日韩一区| 成年人午夜视频在线观看| 99久久99九九99九九九| 亚洲美女久久久| 久久久久国产精品夜夜夜夜夜| 日韩制服丝袜先锋影音| 国产精品伊人日日| www免费视频观看在线| 欧洲国内综合视频| 添女人荫蒂视频| 自拍偷拍欧美专区| 国产日韩欧美在线看| 免费在线黄色影片| 午夜欧美视频在线观看| 日本泡妞xxxx免费视频软件| 欧美大片aaaa| 国产精品国产福利国产秒拍| 日本国产在线| 精品久久久久久久久国产字幕| 亚洲综合在线一区二区| 日韩一区二区在线| 国产精品高潮视频| 理论在线观看| 色综合天天天天做夜夜夜夜做| 97精品人妻一区二区三区蜜桃| 欧美一区影院| 96pao国产成视频永久免费| 婷婷激情在线| 欧美精品亚洲一区二区在线播放| 亚洲精品国产精品国自产网站| 国产九九精品| 久久久综合亚洲91久久98| 黑森林国产精品av| 亚洲国产精品系列| 亚洲精品77777| 99在线精品免费| 日本xxxxxxxxxx75| 精品精品国产三级a∨在线| 久久久久久久影院| 六月婷婷综合网| 午夜精品久久久久久| 日韩www视频| 国产精品一二| 色爱区成人综合网| 精品九九久久| 久久天堂av综合合色| 99久久免费国产精精品| 一区二区三区丝袜| 亚洲天堂2024| 亚洲欧美日韩国产综合精品二区 | 欧美一性一乱一交一视频| 色综合成人av| 欧美性生交片4| 日本黄色录像视频| 粉嫩av一区二区三区| 美女扒开大腿让男人桶| 一本久久青青| 国产色综合天天综合网| 欧美卡一卡二| 亚洲男人的天堂在线播放| 国产99久久久久久免费看| 国产精品成人午夜| 中国免费黄色片| 校园激情久久| 在线免费观看成人网| 日韩视频在线直播| 91成人免费观看网站| 国产视频第一页在线观看| 欧美精品高清视频| 国产福利久久久| 欧美激情在线一区二区三区| www激情五月| 国产欧美一区二区三区国产幕精品| 日本不卡一区| 视频亚洲一区二区| 青草热久免费精品视频| 国产在线更新| 日韩久久精品电影| 国产精品无码久久av| 午夜视频久久久久久| 国产91在线播放九色| 成人精品国产免费网站| 麻豆三级在线观看| 伊人久久久大香线蕉综合直播 | 超碰人人草人人| 亚洲精品偷拍| 在线无限看免费粉色视频| 日韩伦理一区二区三区| 91精品视频在线免费观看| 日本不良网站在线观看| 久久久精品视频在线观看| 桃花色综合影院| 日韩一区二区电影网| 亚洲中文一区二区| 亚洲一区二区精品3399| 懂色av粉嫩av浪潮av| www.一区二区| 亚洲国产欧美日韩在线| 日韩一区精品视频| 欧日韩免费视频| 午夜av一区| 日韩在线电影一区| 欧美国产极品| 国产精品xxxx| 国产一区二区三区国产精品| 国产精品91在线观看| 九色porny丨国产首页在线| 久久久av亚洲男天堂| 波多野结衣在线网站| 亚洲精品网站在线播放gif| 韩国av免费在线| 日韩一区二区不卡| 国产一区二区麻豆| 欧美三片在线视频观看| 日韩美一区二区| 精品久久久久久久久久久久| 久久精品性爱视频| 亚洲一区二区三区四区中文字幕 | 色视频免费在线观看| 精品国产乱码久久久久久久久 | 先锋欧美三级| 欧美综合第一页| 蜜桃视频在线观看播放| 国模叶桐国产精品一区| 污污片在线免费视频| 久久精品视频播放| 日本暖暖在线视频| 色99之美女主播在线视频| 岛国在线大片| 一区二区三区四区视频| 美国成人毛片| 亚洲欧洲在线观看| 可以直接在线观看的av| 亚洲男女性事视频| 免费毛片在线| 在线观看视频亚洲| 91成人高清| 久久天天躁狠狠躁夜夜躁| 免费黄色网页在线观看| 麻豆一区二区在线观看| 在线你懂的视频| 欧美日本亚洲视频| 9999在线视频| 57pao成人永久免费视频| 免费日韩电影| 国产精品视频自在线| 日韩一区中文| 亚洲自拍偷拍色片视频| 99久久人爽人人添人人澡| 国产麻豆一区二区三区在线观看| 久久99国产精品久久99大师| 美女被啪啪一区二区| jlzzjlzz亚洲女人| 亚洲精品偷拍视频| 欧美深夜福利| 国产aaa一级片| 热久久一区二区| 久久久九九九热| av中文字幕一区| 三上悠亚影音先锋| 国产精品成人免费精品自在线观看| 久热这里有精品| 午夜激情一区二区| 日韩久久久久久久久久| 欧美精品v国产精品v日韩精品| www.精品视频| 亚洲女成人图区| 黄网页在线观看| 性色av一区二区三区| 高清亚洲高清| 国产成人精品免费视频大全最热 | 一区不卡字幕| 激情另类综合| 在线观看国产一级片| 成人性色生活片免费看爆迷你毛片| 熟女少妇一区二区三区| 亚洲人成伊人成综合网小说| 五月婷婷开心网| 欧美日韩国产小视频在线观看| www日本高清| 亚洲性69xxxbbb| 久久免费电影| 国产精品一区二区久久久| 亚洲亚洲一区二区三区| 日本精品二区| 亚洲视频综合| gogogo高清免费观看在线视频| 本田岬高潮一区二区三区| 久操视频在线观看免费| 亚洲电影中文字幕在线观看| 一区二区三区精| 精品偷拍一区二区三区在线看| 日本成人网址| 日韩美女在线播放| 91在线一区| 中文字幕一区二区中文字幕| 亚洲综合电影一区二区三区| 无人码人妻一区二区三区免费| 国产欧美日韩在线观看| 日韩精品一区二区三| 777午夜精品免费视频| 国产经典自拍视频在线观看| 69精品小视频| 亚洲伊人影院| 最新精品视频| 奇米精品一区二区三区四区| 香蕉视频黄色在线观看| 亚洲精品成人天堂一二三| 伊人久久国产精品| 亚洲三级av在线| 男人久久天堂| 国产日本一区二区三区| 91精品99| 性生活免费在线观看| 久久久久久久久久久久久女国产乱| 亚洲一区二区91| 精品久久久久久久久久久院品网 | 97高清免费视频| 色悠久久久久综合先锋影音下载| 亚洲视频导航| 日韩成人一级片| 天天躁夜夜躁狠狠是什么心态| 欧美日韩免费看| 四虎永久在线观看| 性色av一区二区三区免费| 激情小说一区| 国产va亚洲va在线va| 成人国产精品免费观看| 久久久久久久伊人| 欧美精品一区二区三区蜜桃| 羞羞的网站在线观看| 91免费看蜜桃| 很黄很黄激情成人| 午夜福利三级理论电影| 一区二区三区久久| 欧日韩在线视频| 午夜精品视频在线| 日韩欧美在线精品| 日韩精品一区二区三区色欲av| 久久久久久免费网| 懂色av蜜臀av粉嫩av喷吹| 日韩中文字幕亚洲| 久久9999免费视频| 女人被男人躁得好爽免费视频| 国产成人av自拍| 精品少妇theporn| 亚洲国产精品悠悠久久琪琪 | 欧美日韩午夜剧场| 天天在线女人的天堂视频| 欧洲s码亚洲m码精品一区| 免费成人结看片| 亚洲最大成人在线观看| 亚洲色图视频网| 黄色av小说在线观看| 91精品国产99| 欧美美女一区| 中文 日韩 欧美| 亚洲成av人片一区二区三区| 色播色播色播色播色播在线| 国产成人一区二区| 91精品一区二区三区综合| 最新国产精品自拍| 狠狠躁夜夜躁久久躁别揉| av网站在线播放| 999国内精品视频在线| 国产欧美日本| www.xx日本| 亚洲国产精品大全| a成人v在线| 九色自拍视频在线观看| 国产欧美日韩在线视频| 国内毛片毛片毛片毛片| 情事1991在线| 欧美伊人影院| 免费看91的网站| 欧美va亚洲va| 国产电影一区二区三区爱妃记| 无码日本精品xxxxxxxxx| 久久久久亚洲蜜桃| 成 人 免费 黄 色| 国产精品wwwwww| 一区二区亚洲|