精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Scaling Laws終結(jié),量化無用,AI大佬都在審視這篇論文

人工智能 新聞
研究表明,你訓(xùn)練的 token 越多,你需要的精度就越高。

最近幾天,AI 社區(qū)都在討論同一篇論文。

UCSD 助理教授 Dan Fu 說它指明了大模型量化的方向。

圖片

CMU 教授 Tim Dettmers 則直接說:它是很長一段時(shí)間以來最重要的一篇論文。OpenAI 創(chuàng)始成員、特斯拉前 AI 高級總監(jiān) Andrej Karpathy 也轉(zhuǎn)發(fā)了他的帖子。

圖片

Tim Dettmers 表示,可以說,人工智能的大部分進(jìn)步都來自計(jì)算能力的提升,而(在最近)這主要依賴于低精度路線的加速(32- > 16 - > 8 位)。現(xiàn)在看來,這一趨勢即將結(jié)束。再加上摩爾定律的物理限制,大模型的大規(guī)模擴(kuò)展可以說要到頭了。

例如,英偉達(dá)最新的 AI 計(jì)算卡 Blackwell 將擁有出色的 8 位能力,并在硬件層面實(shí)現(xiàn)逐塊量化。這將使 8 位訓(xùn)練變得像從 FP16 切換到 BF16 一樣簡單。然而,正如我們從新論文中看到的那樣,對于很多大模型的訓(xùn)練來說,8 位是不夠的。

與其他模型相比,Llama 405B 沒有得到太多應(yīng)用的主要原因是它體量太大了,運(yùn)行 405B 模型進(jìn)行推理非常麻煩。但論文表明,訓(xùn)練較小的模型(例如 70B)時(shí),你也無法在低精度下有效地訓(xùn)練這些模型。見下圖 8B(圓形) 70B(三角形) 405B(星型):

圖片

可見對于 20B Token 數(shù)據(jù)的訓(xùn)練,訓(xùn)練 8B 模型在 16 位中效率更高。對于 70B 模型來說 8 位仍然有效,但效率越來越低。

Tim Dettmers 感嘆道:從我自己的經(jīng)驗(yàn)(大量失敗的研究)來看,效率是無法欺騙的。如果量化失敗,那么稀疏化也會失敗,其他效率機(jī)制也會失敗。如果這是真的,那么我們現(xiàn)在就已經(jīng)接近最優(yōu)了。

那以后我們怎么辦?眼前似乎只有三條可能的路線:

  • 擴(kuò)大數(shù)據(jù)中心規(guī)模:未來約 2 年這仍然是可以做到的事;
  • 通過動態(tài)擴(kuò)展:路由到更小的專門模型或大 / 小模型上;
  • 知識的提煉:這條路線與其他技術(shù)不同,并且可能具有不同的特性。

對于新硬件來說,我們?nèi)匀挥?HBM4 內(nèi)存,這將是一個很好的提升。但 FP4 訓(xùn)練似乎是一個謊言,節(jié)點(diǎn)縮小不會再增加多少效率了。

這篇名為《Scaling Laws for Precision》的論文顧名思義,制定了一個和大語言模型使用數(shù)據(jù)精度有關(guān)的擴(kuò)展定律,涵蓋了訓(xùn)練前和訓(xùn)練后。

圖片

  • 論文標(biāo)題:Scaling Laws for Precision
  • 論文鏈接:https://arxiv.org/abs/2411.04330

據(jù)論文一作,來自哈佛大學(xué)的 Tanishq Kumar 介紹,他們的研究認(rèn)為:

  • 由于當(dāng)代大模型在大量數(shù)據(jù)上經(jīng)歷了過度訓(xùn)練,因此訓(xùn)練后量化已變得非常困難。因此,如果在訓(xùn)練后量化,最終更多的預(yù)訓(xùn)練數(shù)據(jù)可能會造成副作用;
  • 在預(yù)訓(xùn)練期間以不同的精度放置權(quán)重、激活或注意力的效果是一致且可預(yù)測的,并且擬合擴(kuò)展定律表明,高精度(BF16)和下一代精度(FP4)的預(yù)訓(xùn)練可能都是次優(yōu)的設(shè)計(jì)選擇。

低精度訓(xùn)練和推理會影響語言模型的質(zhì)量和成本,但當(dāng)前的大模型 Scaling Law 并未考慮到這一點(diǎn)。在這項(xiàng)工作中,研究人員為訓(xùn)練和推理設(shè)計(jì)了「精度感知」擴(kuò)展定律。

作者提出,以較低的精度進(jìn)行訓(xùn)練會降低模型的有效參數(shù)數(shù)量,從而使我們能夠預(yù)測低精度訓(xùn)練和訓(xùn)練后量化帶來的額外損失。對于推理,隨著模型在更多數(shù)據(jù)上進(jìn)行訓(xùn)練,訓(xùn)練后量化帶來的性能下降會加劇,最終導(dǎo)致額外的預(yù)訓(xùn)練數(shù)據(jù)產(chǎn)生負(fù)面影響。對于訓(xùn)練,擴(kuò)展定律使我們能夠預(yù)測具有不同精度的不同部分的模型的損失,以較低精度訓(xùn)練較大的模型可能是計(jì)算最優(yōu)的。

該工作統(tǒng)一了訓(xùn)練后量化和訓(xùn)練前量化的擴(kuò)展定律,得出一個單一的函數(shù)形式,可以預(yù)測不同精度下訓(xùn)練和推理的性能下降。

預(yù)訓(xùn)練 scaling law 表明,計(jì)算最佳預(yù)訓(xùn)練精度通常獨(dú)立于計(jì)算預(yù)算。然而,令人驚訝的是,如果模型大小受到限制,這種獨(dú)立性就不再成立,在這種情況下,計(jì)算最佳精度在計(jì)算中增長緩慢。

該研究以 3-16 bit 精度預(yù)訓(xùn)練了 465 個語言模型,并對每個模型進(jìn)行了訓(xùn)練后量化。對于具有 N 個參數(shù)的語言模型,在 D 個 token 上進(jìn)行訓(xùn)練,訓(xùn)練精度為 P_train,訓(xùn)練后權(quán)重精度為 P_post,該研究最終找到了一個統(tǒng)一的 Scaling Law,其形式如下:

圖片

其中,A、B、E、α、β 是正擬合常數(shù),δ_PTQ 是指推理前訓(xùn)練后量化引起的損失退化。

研究簡介

該研究首先研究了訓(xùn)練后量化模型權(quán)重的常用方法,發(fā)現(xiàn)訓(xùn)練時(shí)間越長 / 預(yù)訓(xùn)練期間「看到」的數(shù)據(jù)越多,模型在推理時(shí)對量化就越敏感,這解釋了為什么 Llama-3 可能更難量化。

圖片

事實(shí)上,這種損失退化大致是預(yù)訓(xùn)練期間看到的 token / 參數(shù)比值的冪律,因此可以提前預(yù)測關(guān)鍵數(shù)據(jù)大小,超過該數(shù)據(jù)大小的更多數(shù)據(jù)的預(yù)訓(xùn)練會非常有害。直覺可能是,當(dāng)你訓(xùn)練更多的數(shù)據(jù)時(shí),更多的知識被壓縮成權(quán)重,給定的擾動會對模型性能造成更大的損害。

圖片

圖 1:主要發(fā)現(xiàn)示意圖。在 BF16 中將固定大小的模型在各種數(shù)據(jù)預(yù)算上訓(xùn)練,并在最后量化權(quán)重。可以發(fā)現(xiàn),由于訓(xùn)練后量化而導(dǎo)致的退化會隨著預(yù)訓(xùn)練期間看到的 token 數(shù)量增加而增加,因此額外的預(yù)訓(xùn)練數(shù)據(jù)可能會造成損害。

圖片

經(jīng)過擴(kuò)展驗(yàn)證表明,以較低的精度訓(xùn)練較大的模型可以實(shí)現(xiàn)計(jì)算優(yōu)化。

然后該研究將注意力轉(zhuǎn)向低精度訓(xùn)練,主要研究量化感知訓(xùn)練(僅權(quán)重)和低精度訓(xùn)練。該研究將模型分解為權(quán)重、激活和 KV 緩存,找到其中任何一個量化到任意精度時(shí)損失的 Scaling Law,并開發(fā)一種組合且可解釋的函數(shù)形式來預(yù)測在預(yù)訓(xùn)練期間,量化這三者的任意組合對損失的影響。

該研究的 Scaling Law 依賴于「有效參數(shù)計(jì)數(shù)」的概念,研究團(tuán)隊(duì)假設(shè)當(dāng)你降低精度,參數(shù)也降低一定數(shù)量,計(jì)數(shù)就降低,那么包含 FP4 中所有內(nèi)容的 10 億參數(shù)模型具有可比較的數(shù)量 BF16 中 250m 模型的「有效參數(shù)」。

圖片

雖然權(quán)重可以毫無問題地以低精度進(jìn)行訓(xùn)練,但激活和 KV 緩存很敏感。

圖片

最后,該研究將訓(xùn)練前和訓(xùn)練后的發(fā)現(xiàn)統(tǒng)一為可解釋的函數(shù)形式,可以以任何精度組合預(yù)測訓(xùn)練前和訓(xùn)練后的損失。

該研究還發(fā)現(xiàn),低精度的預(yù)訓(xùn)練可以以定量可預(yù)測的方式「增強(qiáng)」模型的訓(xùn)練后量化,但其程度低于直觀預(yù)期。

圖片

作者表示:「該研究在進(jìn)行實(shí)驗(yàn)時(shí)保持受控的架構(gòu)和設(shè)置,但在實(shí)踐中,通常會故意進(jìn)行架構(gòu)調(diào)整以適應(yīng)低精度訓(xùn)練。」這也是這項(xiàng)研究的一點(diǎn)局限性。

感興趣的讀者可以閱讀論文原文,了解更多研究內(nèi)容。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-11-13 15:00:42

2025-01-17 09:20:00

2024-12-30 10:35:00

訓(xùn)練數(shù)據(jù)模型

2025-09-02 12:04:09

2024-11-18 10:15:00

AI模型

2024-11-01 09:45:08

2025-09-02 17:40:11

AI模型深度學(xué)習(xí)

2024-12-16 07:15:00

2025-02-27 12:42:54

2025-05-16 13:50:34

ACL論文競爭

2021-07-08 10:13:04

AI 數(shù)據(jù)人工智能

2021-04-27 07:59:11

內(nèi)聯(lián)匯編 C 語言 asm 關(guān)鍵字

2021-03-05 09:43:47

數(shù)字經(jīng)濟(jì)互聯(lián)網(wǎng)科技公司

2025-11-17 16:30:48

AI大模型論文

2020-01-09 16:45:37

AI人工智能危機(jī)

2025-09-11 09:09:42

2015-03-09 10:10:19

科技兩會

2018-06-05 11:27:12

2025-02-21 13:20:00

2020-02-05 16:50:26

AI人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

色阁综合伊人av| 欧美性猛交xxxx乱大交3| 成人在线中文字幕| 国产乡下妇女做爰| 精品产国自在拍| 777奇米四色成人影色区| 免费一级特黄毛片| h网站视频在线观看| 国产精品一区二区久激情瑜伽| 欧美激情免费在线| 亚洲欧美va天堂人熟伦| 麻豆精品一区| 欧美亚日韩国产aⅴ精品中极品| 特色特色大片在线| 国产污视频在线| 国产69精品久久久久毛片| 国产精品极品美女在线观看免费| 欧美三级日本三级| 亚洲亚洲免费| 日韩精品一区二区三区四区| 91香蕉视频污版| 阿v视频在线| 亚洲女同一区二区| 日本亚洲导航| 天堂在线视频免费| 国产福利精品一区二区| 国产日韩欧美在线播放| 中文字幕在线欧美| 99精品福利视频| 欧美丰满少妇xxxxx做受| 懂色av粉嫩av浪潮av| 四虎影视精品| 精品国产一区二区在线观看| 91在线第一页| 色噜噜成人av在线| 欧洲视频一区二区| 免费在线观看毛片网站| 蜜桃视频在线网站| 午夜伊人狠狠久久| 欧美狂野激情性xxxx在线观| 哥也色在线视频| 亚洲视频1区2区| 曰韩不卡视频| 精品视频在线一区二区| 国产精品嫩草影院com| 日本午夜精品电影| 国产小视频在线观看| 91捆绑美女网站| 精品欧美一区二区久久久伦| 手机看片福利永久| 丁香婷婷综合网| 国产成人成网站在线播放青青| 99久久国产免费| 国产精品一区二区男女羞羞无遮挡| 国产欧美va欧美va香蕉在线| 中文字幕在线观看视频一区| 日韩av中文字幕一区二区三区| 欧洲日韩成人av| 中文字幕在线看人| 日韩av一区二区三区四区| 国产成人在线视频| 伊人精品在线视频| 精品一区二区三区影院在线午夜| 成人激情春色网| 国产av精国产传媒| 成人免费的视频| 国产综合动作在线观看| 十九岁完整版在线观看好看云免费| 99re视频这里只有精品| 欧美婷婷久久| 免费黄色电影在线观看| 一区二区三区毛片| 国产极品粉嫩福利姬萌白酱| 成人午夜视屏| 欧美日韩在线综合| 欧美污在线观看| 久久精品66| 亚洲人成电影网站色www| 亚洲AV成人无码网站天堂久久| 91精品成人| 国a精品视频大全| 国产黄色免费视频| 免费在线观看一区二区三区| 亚洲一区二区免费| 日本在线视频1区| 中文字幕一区二区三区av| 超碰97在线看| 欧美成人h版| 欧美一区二区三区免费视频| 深田咏美中文字幕| 全球成人免费直播| 高清视频欧美一级| 亚洲天堂一二三| 国产**成人网毛片九色 | 日本欧美视频在线观看| 免费福利视频一区二区三区| 欧美男人的天堂一二区| 亚洲少妇18p| 国产韩国精品一区二区三区| 欧美激情女人20p| 人妻中文字幕一区二区三区| 国产激情视频一区二区三区欧美| 欧美亚洲免费高清在线观看| 黄色网在线免费看| 狠狠躁天天躁日日躁欧美| 欧美激情国内自拍| 自拍视频一区| 欧美激情一二区| 在线观看av大片| 91日韩在线专区| 黄网站色视频免费观看| 天天综合网天天| 欧美精品一区二区三区蜜臀| 亚洲精品天堂网| 欧美一区=区| 草莓视频一区| 国产一二区在线| 欧洲人成人精品| 国产chinese中国hdxxxx| 国产精品久久久久无码av| 91国内在线视频| 性欧美videos另类hd| 国产精品久久久久久久蜜臀| aa在线免费观看| 狼人天天伊人久久| 欧美大荫蒂xxx| 国产美女免费视频| 国产精品乱人伦| 日本xxxxxxx免费视频| 国产乱人伦精品一区| 免费97视频在线精品国自产拍| 免费av中文字幕| 91在线精品秘密一区二区| 久久久99精品视频| 国产精品va视频| 久久精品中文字幕一区| 中文字幕有码视频| 国产精品久久久久aaaa樱花| 国产一区视频免费观看| 亚洲97av| 国产成人久久久| 国产裸舞福利在线视频合集| 日本乱人伦一区| a天堂中文字幕| 日韩中文字幕91| 日韩hmxxxx| 91另类视频| 中文字幕亚洲图片| 亚洲视频久久久| 国产精品五月天| 亚洲欧美日本一区二区三区| 欧美国产小视频| 国产日韩综合一区二区性色av| 成人动漫在线免费观看| 欧美专区在线观看一区| 少妇av片在线观看| 精品在线观看视频| 丁香色欲久久久久久综合网| 成人福利免费在线观看| 亚洲3p在线观看| 日本中文字幕电影在线观看| 在线视频中文字幕一区二区| 大胸美女被爆操| 美女视频一区二区三区| eeuss中文| 亚洲伊人影院| 4438全国成人免费| av网站在线免费观看| 69久久99精品久久久久婷婷| 久草国产在线观看| 91亚洲国产成人精品一区二区三 | 青青草原国产视频| 成人的网站免费观看| 欧美日韩国产精品激情在线播放| 一本久久青青| 91久久夜色精品国产网站| 毛片网站在线看| 亚洲人av在线影院| 国产同性人妖ts口直男| 亚洲成av人片一区二区三区| 亚洲一级中文字幕| 国产原创一区二区三区| 精品少妇在线视频| 奇米影视亚洲| 国产精品久久精品国产| 欧美性片在线观看| 欧美精品免费播放| 欧美色综合一区二区三区| 欧美日产在线观看| 国产精品成人网站| 国产精品三级av| 又黄又爽的网站| 美国三级日本三级久久99 | 日韩精品色哟哟| 成人小视频在线观看免费| 久久av影视| 91久久偷偷做嫩草影院| 二吊插入一穴一区二区| 九九久久国产精品| 九色视频在线播放| 精品国产免费一区二区三区四区| 无码人妻丰满熟妇区bbbbxxxx| 亚洲男人的天堂在线观看| 一本色道久久综合亚洲精品图片| 国内成人精品2018免费看| 国产主播在线看| 欧美日韩中文| 中国成人亚色综合网站| 亚洲人和日本人hd| 国精产品一区二区| 国产午夜久久av| 国产精品久久久久久久久粉嫩av | 成人午夜在线观看视频| 亚洲第一福利在线观看| 国产精品久久久久久免费播放| 天天综合网天天综合色| 男人与禽猛交狂配| 国产精品美女久久久久久久久久久| 国产一线在线观看| 国产福利精品一区| 久久精品亚洲天堂| 美腿丝袜亚洲色图| 久久久久久久片| 蜜桃视频一区| 国产午夜大地久久| 在线成人av| 成人免费在线视频播放| 亚洲一区二区| 正在播放久久| 99视频精品全部免费在线视频| 欧洲亚洲一区二区| 亚洲资源网你懂的| 久久精品国产精品青草色艺| 黄色免费大全亚洲| 国产欧美综合精品一区二区| 日本一区二区三区播放| 91视频国产精品| 成人av在线播放| 成人网址在线观看| 999精品嫩草久久久久久99| 国产精品久久77777| 三级成人黄色影院| 国产mv久久久| 欧美三级精品| 国产精品久久久久久久9999 | 中文一区在线| 日本在线xxx| 麻豆久久精品| 亚洲少妇第一页| 免费视频一区二区| 亚洲精品免费一区亚洲精品免费精品一区| 青青国产91久久久久久| 韩国中文字幕av| 精品一区二区在线观看| 天堂网成人在线| 国产成人免费在线| 波多野结衣加勒比| 久久精品亚洲乱码伦伦中文| 2019男人天堂| 国产精品久久久久久久久快鸭| 国产免费久久久久| 一区二区欧美视频| 亚洲精品www久久久久久| 欧美日韩国产一中文字不卡| 免费毛片一区二区三区| 在线一区二区三区四区| 影音先锋国产在线| 日韩一区二区在线观看视频播放| 亚洲成a人片在线| 亚洲精品自产拍| 中文字幕日本在线| 欧美日韩国产999| 在线手机中文字幕| 国产精品对白刺激| 免费看日产一区二区三区| 国产精品对白一区二区三区| 亚洲动漫精品| 香蕉精品视频在线| 亚洲欧洲一级| 亚洲一区二区蜜桃| 粉嫩绯色av一区二区在线观看| 一卡二卡三卡四卡| 国产精品电影院| 国产香蕉视频在线| 欧美日韩夫妻久久| 搡老岳熟女国产熟妇| 一区二区欧美激情| xxx性欧美| 国产精品免费一区二区三区都可以| 精品国产鲁一鲁****| 精品国产区在线| 我不卡神马影院| 69堂免费视频| 国产精品综合在线视频| 久久久久久久久久久国产精品| 中文字幕中文字幕在线一区 | 成人激情五月天| 亚洲制服丝袜av| 亚洲午夜激情视频| 亚洲精品白浆高清久久久久久| 91社区在线高清| 97视频在线观看免费| 成人豆花视频| 日本精品一区二区| 在线亚洲伦理| 特黄特黄一级片| 欧美国产禁国产网站cc| 久久草视频在线| 日韩欧美一级二级| 色视频在线免费观看| 欧美一级视频免费在线观看| 日韩精品三级| 国产91av视频在线观看| 老**午夜毛片一区二区三区| 无码人妻精品一区二区三区99不卡| 国产精品久久777777| 黄色av一区二区| 日韩av一卡二卡| 久草在线视频福利| 亚洲精品日产aⅴ| 国产精品久久天天影视| 99视频免费播放| 91在线国产福利| 日本一区二区网站| 91精品啪在线观看国产60岁| 成人欧美亚洲| 国产v综合v亚洲欧美久久| 欧美sss在线视频| 亚洲精品久久久久久久蜜桃臀| 国产精品一区免费在线观看| 貂蝉被到爽流白浆在线观看| 91传媒视频在线播放| 精品美女视频在线观看免费软件 | 国产激情精品一区二区三区| 日韩一本精品| 日韩一区精品字幕| 男生草女生视频| 日本大香伊一区二区三区| 男女污污视频在线观看| 韩国19禁主播vip福利视频| 在线观看视频一区二区三区| 国产又粗又猛又爽又黄的网站| 国产一区二区不卡在线| 亚洲av无码一区二区三区在线| 欧美酷刑日本凌虐凌虐| 无遮挡的视频在线观看| 国产一区二区丝袜| 91综合久久| 久久出品必属精品| 亚洲自拍另类综合| 国产综合在线播放| 国模叶桐国产精品一区| 天堂网av成人| 热久久精品免费视频| 国产精品美女久久久久高潮| 国产孕妇孕交大片孕| 成人97在线观看视频| 亚洲一区二区三区免费| 国产在线视频在线| 91免费在线视频观看| 伊人成年综合网| 久久艳片www.17c.com | 亚洲一区二区三区加勒比| 精品一区二区三区日韩| 欧美精品videos极品| 亚洲精品按摩视频| 成人看片毛片免费播放器| 妞干网这里只有精品| 99久久国产免费看| 国产又粗又猛又爽又| 久久亚洲精品国产亚洲老地址| 4438全国亚洲精品观看视频| 色综合av综合无码综合网站| 国产目拍亚洲精品99久久精品| 一区二区www| 久久久久久久久国产精品| 精品一区免费| 午夜视频在线网站| 亚洲444eee在线观看| 91在线视频| 国产精品对白一区二区三区| 日韩主播视频在线| 国产高清在线免费观看| 精品网站999www| 伊人久久一区| 一女被多男玩喷潮视频| 国产精品国产精品国产专区不片| 高h放荡受浪受bl| 国产精品久久综合av爱欲tv| 韩日视频一区| 在线观看免费黄色网址| 精品国产一区二区三区四区四| 搜成人激情视频| 成人一级生活片| 国产精品素人视频| 午夜成人免费影院| 91免费国产网站| 日韩av在线播放中文字幕| 日本一二三区不卡| 久久久999精品|