精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Ilya錯了,預訓練沒結束!LeCun等反擊,「小模型時代」讓奧特曼預言成真

人工智能 新聞
Ilya「預訓練結束了」言論一出,圈內嘩然。谷歌大佬Logan Klipatrick和LeCun站出來反對說:預訓練還沒結束!Scaling Law真的崩了嗎?Epoch AI發布報告稱,我們已經進入「小模型」周期,但下一代依然會更大。

最近,Ilya在NeurIPS 2024中宣布:預訓練結束了!瞬間一石激起千層浪。

在他看來,數據如同化石燃料般難以再生,因此訓練模型需要的海量數據即將枯竭。

圖片

作為前OpenAI首席科學家,Ilya的這番話,有可能影響之后數十年的AI發展方向。

不過,預訓練真的結束了嗎?

最近,幾位圈內大佬,就公開站出來質疑和反對Ilya了。

谷歌大佬Logan Kilpatrick是這樣內涵Ilya的:認為預訓練結束,恐怕是因為你缺乏想象力。

圖片

前Meta具身智能團隊的高級總監Dhruv Batra也站出來共同表示:Ilya錯了!

在他看來,人類的數據還沒有用完。

我們只是用完了人類書寫的文本而已,但我們擁有的視頻數量,依然遠超我們的處理能力,目前只是尚未解決視覺領域的預訓練問題罷了。

圖片

的確,要知道,網絡上的文本公共數據,畢竟只是冰山一角而已。

我們除了文本,還能對音頻、視頻、圖像進行預訓練,甚至可以把視覺、嗅覺、觸覺、平衡和傳感器這些人類進化出來的功能賦予機器。

而如果模型真的可以學習的話,那數據或許確實是無所不在。

圖片

圖片

圖片

有人則充分放分想象:如果預訓練能和生物相連,那它的確永遠不會結束。

圖片

Scaling Law和預訓練到底有沒有撞墻?

種種事件表明,我們已經站在了一個發展路線的分水嶺。

Ilya、LeCun甚至奧特曼,都已經感覺到:目前的發展路線不能再延續下去了,我們亟需探索新的出路。

早期,Ilya曾是暴力Scaling的早期倡導者之一,認為通過增加數據和算力來「scale up」,能顯著改善模型性能。

但現在,Ilya已經承認自己曾經的想法錯了,并透露SSI正在研究一種全新的替代方法,來擴展預訓練。

圖片

相較之下,外媒SemiAnalysis則在一篇關于o1的深度報道中指出——scale的維度遠不止預訓練,Scaling Law仍將繼續下去。

圖片

最近,Epoch AI研究員的一篇長文,更是直觀地展示了這個「矛盾」的現象。

圖片

從2017年Transformer架構誕生到GPT-4發布,SOTA模型的規模一直在變大,但增幅在變小。

  • 從GPT-1到GPT-3,用了2年時間,模型參數量從1.17億增加到1750億,增加了1000倍
  • 從GPT-3到GPT-4,用了2年9個月,模型參數量從1750億增加到1.8萬億,增加了10倍

而到了2023年,這一趨勢直接發生了逆轉。

據估計,當前SOTA模型的參數可能要比GPT-4的1.8萬億小一個數量級!

  • GPT-4o大約為2000億參數
  • Claude 3.5 Sonnet約為4000億參數

但有趣的是,下一代模型的規模,可能又會重新超過GPT-4。

圖片

當今SOTA模型最大只有約4000億參數

盡管許多實驗室沒有公開模型架構,Epoch AI的研究員依然從蛛絲馬跡中發現了線索。

首先是開源模型的證據。根據Artificial Analysis的模型質量指數,當前最佳的開源模型是Mistral Large 2和Llama 3.3,分別擁有1230億和700億參數。

這些稠密模型,架構與GPT-3相似,但參數更少。它們總體的基準表現超過了GPT-4和Claude 3 Opus,且由于參數更少,它們的推理成本和速度也更優。

對于閉源模型,盡管我們通常無法得知參數詳情,但可以根據推理速度和收費推測它們的大小。

僅考慮短上下文請求,OpenAI提供的2024年11月版本GPT-4o,每個用戶每秒100-150個輸出token,收費每百萬輸出token 10美元;而GPT-4 Turbo每秒最多大約55個輸出token,費用是每百萬輸出token 30美元。

顯然,GPT-4o比GPT-4 Turbo更便宜且更快,因此它的參數可能比GPT-4小得多。

另外,我們還可以使用推理經濟學的理論模型,來預測GPT-4在H200上進行推理的成本。

假設使用H200進行推理的機會成本為每小時3美元,下面的圖顯示了不同價格點下,GPT-4及其假設縮小版的生成速度。

圖片

總體來說,為了讓模型每秒生成100個以上的token并且能夠流暢服務,模型需要比GPT-4小得多。

根據上圖,假設OpenAI的價格加成大約是GPU成本的八分之一,GPT-4o的參數量可能在2000億左右,雖然這個估計可能有2倍的誤差。

有證據表明,Anthropic的Claude 3.5 Sonnet可能比GPT-4o更大。Sonnet每秒生成約60個token,每百萬輸出token收費15美元。這速度在優化設置下接近原版GPT-4的收支平衡點。

不過,考慮到Anthropic API可能加價不少,Sonnet參數規模仍顯著小于GPT-4,估計在4000億左右。

總體來看,當前前沿模型的參數大多在4000億左右,像Llama 3.1 405B和Claude 3.5 Sonnet可能是最大的。

雖然對于閉源模型的參數估計有很大的不確定性,但我們仍然可以推測,從GPT-4和Claude 3 Opus到如今最強的模型,規模縮小的幅度可能接近一個數量級。

為什么會這樣?

針對這一現象,Epoch AI認為有四個主要原因:

1. AI需求爆發,模型不得不瘦身

自ChatGPT和GPT-4發布以來,AI產品需求激增,服務商面臨的推理請求大大超出預期。

此前,從2020年到2023年3月,模型訓練的目標是最小化訓練計算量,即在固定的能力水平下,花費盡可能少的計算資源完成訓練。Kaplan和Chinchilla的Scaling Law建議,隨著訓練計算量的增加,模型規模也應擴大。

隨著推理成本占據支出的大頭,傳統法則的適用性受到了挑戰。相比scaling模型規模,在更多訓練數據(token)上訓練較小的模型反而更劃算,因為較小的模型在推理階段的計算需求較低,能夠以更低的成本服務用戶。

比如,從Llama 2 70B到Llama 3 70B,雖然模型參數規模沒有顯著增加,但模型的性能卻顯著提升。

這是因為通過過度訓練(在更多數據上訓練較小的模型),可以讓模型在保持小規模的同時,表現得更強大。

2. 蒸餾,讓小模型更能打

實驗室還采用了「蒸餾」方法,從而讓更小的模型表現得更強大。

蒸餾指的是讓小模型模仿已經訓練好的大模型的性能。

蒸餾方法有很多種,其中一種簡單的方法是使用大模型生成高質量的合成數據集來訓練小模型,而更復雜的方法則需要訪問大模型的內部信息(如隱藏狀態和logprobs)。

Epoch AI認為,GPT-4o和Claude 3.5 Sonnet很可能是從更大的模型蒸餾得到的。

3. Scaling Law的轉變

Kaplan Scaling Law(2020)建議,模型的參數量與訓練用的token數量(即數據量)應保持較高的比例。簡單來說,當你增加訓練數據時,應該相應增加模型的規模(參數量)

而Chinchilla Scaling Law(2022)則偏向于更多訓練數據和更少的參數。模型不必越來越大,關鍵在于訓練數據的規模和多樣性。

這個轉變導致了訓練方式的改變:模型變得更小,但訓練數據更多。

從Kaplan到Chinchilla的轉變,并非因為推理需求的增加,而是我們對如何有效scaling預訓練的理解發生了變化。

4. 推理更快,模型更小

隨著推理方法的改進,模型生成token的效率和低延遲變得更加重要。

過去,判斷一個模型「足夠快」的標準是看它的生成速度是否接近人類的閱讀速度。

然而,當模型在生成每個輸出token時需要先推理出多個token時(比如每個輸出token對應10個推理token),提升生成效率就變得更關鍵。

這推動了實驗室,像OpenAI,專注于優化推理過程,使得模型在處理復雜推理任務時能夠更高效運行,也因此促使它們縮小模型的規模。

5. 用AI喂AI,成本更低

越來越多的實驗室開始采用合成數據作為訓練數據來源,這也是促使模型變小的原因之一。

合成數據為訓練計算scaling提供了一種新的途徑,超越了傳統的增加模型參數量和訓練數據集大小的方法(即,超越預訓練計算scaling)。

我們可以生成將來用于訓練的token,而不是從互聯網上抓取它們,就像AlphaGo通過自我對弈生成訓練數據一樣。

這樣,我們可以保持Chinchilla Scaling Law下計算最優的token與參數比例,但通過生成數據時為每個token投入更多計算,從而增加訓練計算量而不增加模型大小。

奧特曼:參數規模競賽即將終結?

2023年4月,OpenAI發布了當時最強的,同時也是第一款未公開參量的模型GPT-4。

之后不久,CEO奧特曼曾預言了模型參數競賽的終結:圍繞模型參數量的競賽,就像歷史上對更高處理器主頻的追求,是一個死胡同。

圖片

那么,前沿模型的規模會不會越變越小呢?

簡短的答案是——可能不會。但也很難說是否應該期待它們在短期內變得比GPT-4更大。

從Kaplan到Chinchilla的轉變是一次性的,因此我們沒有理由期待它繼續讓模型變小。

GPT-4發布后的推理需求增長也可能快于未來推理支出的增長速度。且合成數據和scaling計算并非每個實驗室都在采納——即使有高質量的訓練數據,對于非常小的模型而言,能夠取得的成就可能非常有限。

此外,硬件的進步可能會促使更大的模型變得更優,因為在相同預算下,大模型通常表現更好。

較小的模型在推理時可能表現更差,尤其在長上下文和復雜任務上。

未來的模型(如GPT-5或Claude 4)可能會恢復或稍微超過GPT-4的規模,之后是否繼續縮小規模難以預料。

理論上,當前硬件足以支持比GPT-4大50倍、約100萬億參數的模型,可能以每百萬輸出token 3000美元、每秒10-20個token的速度提供服務。

但正如Karpathy所說,相比于如今這種只能根據prompt去解決博士級別問題的AI,一個能夠真正作為「實習生」入職的AI更為實用。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-11-03 17:29:54

LeCun世界模型多模態

2024-12-16 07:10:00

OpenAIAI人工智能

2024-12-16 08:20:00

AI工具

2024-09-29 13:40:00

2023-06-26 07:10:51

2024-12-16 07:15:00

2025-10-10 07:48:12

大模型預訓練初始化

2024-12-24 14:30:00

模型AI訓練

2024-11-12 13:07:44

2022-05-30 15:44:33

模型訓練GAN

2022-08-25 10:31:57

模型人工智能

2025-07-07 01:20:00

AIAgent形態

2025-06-13 09:29:51

2025-10-11 09:23:28

RLPT強化學習預訓練數據

2025-09-28 09:09:00

2024-11-04 00:24:56

2022-06-25 21:38:36

AI模型

2022-01-21 15:33:56

架構模型AI

2025-08-24 09:24:07

2024-05-29 13:11:00

點贊
收藏

51CTO技術棧公眾號

欧美成人精品在线| 91精品91久久久中77777| 国产精品国产三级欧美二区| 亚洲天堂日韩av| 精品国产中文字幕第一页| 欧美色成人综合| 青青草国产免费| 国产69精品久久app免费版| 国产一区二区三区不卡在线观看| 97精品国产91久久久久久| 国产视频不卡在线| 国产精品超碰| 777午夜精品免费视频| 一女被多男玩喷潮视频| 成人三级网址| 欧美极品aⅴ影院| 99re视频在线播放| 国产成人精品一区二区色戒| 狠狠爱综合网| 久久久成人精品| 人妻少妇精品视频一区二区三区| 精品网站999| 欧美性色黄大片| 免费一级特黄特色毛片久久看| 免费在线观看av| 国产亚洲美州欧州综合国| 91视频网页| 一级特黄aaa大片| 丝瓜av网站精品一区二区| 久久久久久成人精品| 肉色超薄丝袜脚交69xx图片| 在线视频亚洲专区| 亚洲精品一区二区在线观看| 最新国产黄色网址| 全球最大av网站久久| 都市激情亚洲色图| 福利视频一二区| 1stkiss在线漫画| 亚洲欧美福利一区二区| 亚洲综合网中心| av网站在线免费观看| 久久久久久久综合狠狠综合| 狠狠色狠狠色综合人人| 黄色www视频| 国产99一区视频免费| 国产一区二区视频在线观看| 久久这里只有精品9| 日韩国产精品大片| 国产精品女人久久久久久| 日日夜夜狠狠操| 日韩国产一区二| 国产精品日本精品| 一级黄色a视频| 九九**精品视频免费播放| 国产精品视频区1| 亚洲天堂网视频| 另类小说视频一区二区| 国产区精品视频| 国产精品久久久久久久久毛片| 久久99久久久久| 亚洲aⅴ男人的天堂在线观看 | 在线综合视频| 欧美一级高清免费| 好吊色在线视频| 蜜臀av一区二区在线观看| 国产区精品视频| 精品久久久久久亚洲综合网站| 国产一区二区三区美女| 国产不卡一区二区在线观看| 欧美在线 | 亚洲| 2019国产精品| 亚洲精品9999| www.久久久久.com| 午夜av电影一区| av天堂永久资源网| 国产精品一区二区免费福利视频 | 欧美性在线观看| 人妻中文字幕一区二区三区| 激情综合五月天| 97国产超碰| 欧美在线观看在线观看| 中文天堂在线一区| 国产黄色激情视频| 亚洲色图官网| 欧美区在线观看| 亚洲欧洲国产视频| 嫩草影视亚洲| 久久久精品美女| xxxx.国产| 久久99精品网久久| 国产欧美日韩综合精品二区| 欧美精品九九久久| 开心激情五月网| 精品电影一区| 国产精品免费观看在线| 性一交一乱一精一晶| www欧美成人18+| 丰满女人性猛交| 日韩理论视频| 欧美一区二区黄| 尤物视频最新网址| 国产精品www.| 国产精品视频26uuu| 亚洲男女视频在线观看| 亚洲国产精品v| 真人抽搐一进一出视频| 四虎国产精品免费久久| 日韩国产在线看| www欧美com| 首页国产欧美日韩丝袜| 国产成人免费电影| 免费网站看v片在线a| 日韩欧美在线第一页| 欧美视频亚洲图片| 国产欧美日韩视频在线| 国内成人精品一区| 国产伦理吴梦梦伦理| 久久精品人人爽人人爽| 小泽玛利亚av在线| 日韩欧美三区| 亚洲最新av网址| 久久青青草视频| 国产一区二区三区黄视频 | 在线一区二区三区四区| 不许穿内裤随时挨c调教h苏绵| 日韩av专区| 国产精品成av人在线视午夜片| 日日夜夜精品免费| 亚洲综合一区二区三区| 亚洲自拍第三页| 四虎8848精品成人免费网站| 国产91在线播放精品91| 亚洲欧美综合在线观看| 亚洲一区二区三区影院| 青青草原播放器| 天天综合一区| 国产在线观看不卡| 色大18成网站www在线观看| 色诱视频网站一区| 亚洲熟妇无码av| 亚洲影视在线| 欧美一区二区三区四区夜夜大片 | 黑人巨大精品欧美一区二区免费| 动漫美女无遮挡免费| 狠狠综合久久| 国产欧美亚洲日本| 毛片电影在线| 亚洲精品国产精品久久清纯直播| 国产主播在线播放| 国产成a人无v码亚洲福利| 精品人妻大屁股白浆无码| 欧美黄视频在线观看| 欧美高清不卡在线| 色网站免费观看| 欧美日韩中文字幕日韩欧美| 中文字幕xxx| 日本亚洲最大的色成网站www| 欧美一区二区三区四区在线观看地址| 韩日成人影院| 中文字幕不卡在线视频极品| 国产一区二区在线播放视频| 亚洲青青青在线视频| 免费在线观看日韩av| 在线综合亚洲| 日韩黄色影视| 国产高清精品二区| 欧美精品国产精品日韩精品| 人妻中文字幕一区| 欧美性极品少妇精品网站| 摸摸摸bbb毛毛毛片| 狠狠色2019综合网| 中国丰满熟妇xxxx性| 亚洲区小说区| 91精品国产综合久久香蕉922| 宅男网站在线免费观看| 亚洲精品97久久| 国产乱码在线观看| 一区二区在线观看免费视频播放 | 国产女人18毛片水真多成人如厕 | 91网站免费观看| 老妇女50岁三级| 91原创在线视频| 亚洲精品午夜在线观看| 国产综合婷婷| 日韩一区不卡| 91午夜精品| 国产成人在线精品| 91精品久久久| 亚洲三级免费看| av中文字幕观看| 日韩欧美aaa| 婷婷色中文字幕| 久久久综合视频| a级大片免费看| 久久高清免费观看| 亚洲国产精品女人| 日韩一级电影| 91在线观看免费观看| 在线天堂资源| 色综合久久88| av大片在线观看| 亚洲丁香婷深爱综合| 97超碰人人草| 色狠狠综合天天综合综合| 丁香花五月激情| 欧美国产97人人爽人人喊| 制服丝袜第一页在线观看| 蜜臀精品久久久久久蜜臀| 各处沟厕大尺度偷拍女厕嘘嘘| 亚洲欧美综合久久久| 蜜桃导航-精品导航| 亚洲免费一区三区| 国产精品啪视频| 涩涩涩视频在线观看| 欧美另类暴力丝袜| 人人干在线视频| 亚洲色图偷窥自拍| 午夜小视频在线播放| 日韩一区二区三区免费看 | 亚洲最大成人| 久久久亚洲成人| 在线中文字幕视频观看| www亚洲精品| av影片免费在线观看| 亚洲人午夜精品| 色视频在线观看免费| 精品久久国产字幕高潮| aaa国产视频| 欧美精品日韩精品| 一道本无吗一区| 欧美亚洲综合色| 日韩黄色片网站| 色素色在线综合| 美女又爽又黄免费视频| 欧美日韩免费网站| 青青国产在线观看| 五月综合激情婷婷六月色窝| 天天操天天射天天爽| 亚洲一区影音先锋| 久久艹精品视频| 亚洲高清中文字幕| 日韩精品一卡二卡| 同产精品九九九| 亚洲 欧美 日韩 综合| 欧美日韩在线另类| 伊人手机在线视频| 一本色道久久综合亚洲aⅴ蜜桃| 亚洲精品国产精品乱码| 五月天亚洲精品| 亚洲午夜18毛片在线看| 色域天天综合网| 中文字幕一区2区3区| 欧美日韩视频不卡| 99在线观看精品视频| 欧美va亚洲va在线观看蝴蝶网| 丰满少妇在线观看bd| 亚洲高清久久网| 欧美一区二区三区少妇| 一区二区福利视频| 男人的天堂在线视频免费观看 | 亚洲国产精品悠悠久久琪琪| 四季av日韩精品一区| 精品中文字幕久久久久久| 精华区一区二区三区| 中文字幕无线精品亚洲乱码一区| 日本中文字幕在线看| 欧美日本中文字幕| 中文在线中文资源| 国产精品一区二区在线| 黄色欧美视频| 成人一区二区在线| 校花撩起jk露出白色内裤国产精品 | 六月婷婷在线视频| 美女黄色成人网| 日韩va在线观看| 成人黄色大片在线观看| 久久久久久久久久久国产精品| 中文字幕av在线一区二区三区| 91高清免费看| 日韩欧美精品网站| 国产精品国产精品国产专区| 亚洲第一区第二区| 高清日韩av电影| 欧美激情精品久久久久久| 亚洲人成在线网站| 亚洲一区二区三区视频| 色综合久久中文| 国产麻豆电影在线观看| 国产一区二区高清| 中国黄色片一级| 972aa.com艺术欧美| 天堂а√在线中文在线鲁大师| 亚洲成av人片www| 岳乳丰满一区二区三区| 亚洲精品理论电影| 久久77777| 日本精品视频网站| 伊人www22综合色| 水蜜桃亚洲精品| 在线一区免费观看| 特黄特黄一级片| 国产精品丝袜久久久久久app| 激情五月婷婷小说| 欧美色图一区二区三区| 无码精品一区二区三区在线| yw.139尤物在线精品视频| 新版的欧美在线视频| 亚洲一区二区三| 日韩欧美三级| 日韩一级免费在线观看| 成人午夜电影久久影院| 麻豆网址在线观看| 91黄色免费版| 日色在线视频| 欧美激情视频网站| 日本一区二区三区中文字幕| 免费av在线一区二区| 亚洲视频观看| 黑人巨大猛交丰满少妇| 国产精品久99| 毛片在线免费播放| 亚洲精品在线视频| 日本在线啊啊| 国产女主播一区二区| 国产精品分类| 免费观看一区二区三区| 最新欧美精品一区二区三区| 亚洲无码精品在线播放| 亚洲三级免费看| 亚洲综合在线电影| 欧美精品七区| 国产精品老牛| 久久精品国产亚洲av麻豆| 五月开心婷婷久久| 欧美一级一区二区三区| 国内精品久久久久影院优| 亚洲第一二区| 日韩成人三级视频| 国产高清在线观看免费不卡| 精品一区在线观看视频| 91精品国产91综合久久蜜臀| 免费在线看黄| 91青草视频久久| 欧美在线二区| 日本人dh亚洲人ⅹxx| 亚洲激情六月丁香| 成 人 免费 黄 色| 欧美精品18videos性欧| 成人高潮视频| 日韩av在线第一页| 91美女视频网站| 亚洲中文字幕无码爆乳av| 国产亚洲精品高潮| 国产精品久久久久久久久久齐齐| 亚洲午夜精品久久久久久浪潮| 蜜臀av一区二区在线观看| 亚洲一二三四五六区| 91精品国产综合久久香蕉的特点 | 第一福利在线| 国产啪精品视频| 国精品一区二区三区| www.超碰97| 欧美性极品少妇| 麻豆网站在线看| 国产精品一区二区不卡视频| 一区二区毛片| 亚洲色图欧美色| 日韩美女天天操| 在线女人免费视频| 亚洲视频小说| 成人一区二区三区中文字幕| 久久青青草视频| 久久精品国产96久久久香蕉| av日韩在线播放| 日本中文字幕片| 亚洲三级免费电影| 深爱五月激情五月| 国产精品免费一区二区三区都可以 | 91精品国产综合久久久蜜臀九色| 最近2019中文字幕第三页视频| 国产aa精品| 国产高清精品在线观看| 国产精品视频yy9299一区| 亚洲av无码国产综合专区| 国产91精品久| 午夜久久99| 色一情一交一乱一区二区三区| 欧美一区二区三区精品| 在线天堂新版最新版在线8| 黄色一级片网址| 久久精品这里都是精品| 国产ts人妖调教重口男| 欧美中文字幕视频| 影视亚洲一区二区三区| 国产交换配乱淫视频免费| 日韩一区二区免费在线观看| 久久野战av| 日韩人妻无码精品久久久不卡| 国产精品久久久久7777按摩| 五月激情婷婷综合|