精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

終極「揭秘」:GPT-4模型架構、訓練成本、數據集信息都被扒出來了

人工智能 新聞
他們從許多來源收集了大量有關 GPT-4 的信息,包括模型架構、訓練基礎設施、推理基礎設施、參數量、訓練數據集組成、token 量、層數、并行策略、多模態視覺適應、不同工程權衡背后的思維過程、獨特的實現技術以及如何減輕與巨型模型推理有關的瓶頸等。

一直以來,大家都對 GPT-4 的模型架構、基礎設施、訓練數據集、成本等信息非常好奇。

奈何 OpenAI 嘴太嚴,很長時間以來,大家也都只是猜測這些數據。

不久之前,喬治?霍茲(George Hotz)在接受一家名為 Latent Space 的 AI 技術播客采訪時透露出一個小道消息,稱 GPT-4 是由 8 個混合專家模型組成的集成系統,每個專家模型都有 2200 億個參數(比 GPT-3 的 1750 億參數量略多一些),并且這些模型經過了針對不同數據和任務分布的訓練。

雖然此消息無法驗證,但其流傳度非常高,也被部分業內人士認為非常合理。

最近,更多的消息似乎被泄露了出來。

今日,SemiAnalysis 發布了一篇付費訂閱的內容,「揭秘」了有關 GPT-4 的更多信息。

圖片圖片

文章稱,他們從許多來源收集了大量有關 GPT-4 的信息,包括模型架構、訓練基礎設施、推理基礎設施、參數量、訓練數據集組成、token 量、層數、并行策略、多模態視覺適應、不同工程權衡背后的思維過程、獨特的實現技術以及如何減輕與巨型模型推理有關的瓶頸等。

作者表示,GPT-4 最有趣的方面是理解 OpenAI 為什么做出某些架構決策。

此外,文章還介紹了 A100 上 GPT-4 的訓練和推理成本,以及如何拓展到下一代模型架構 H100 。

我們根據 Deep Trading(一家算法交易公司)創始人 Yam Peleg 的推文(目前已刪除),整理了以下關于 GPT-4 的數據信息。感興趣的讀者可以細致研究下。

圖片圖片

不過請注意,這并非官方確認的數據,大家自行判斷其準確性。

圖片圖片

1、參數量:GPT-4 的大小是 GPT-3 的 10 倍以上。文章認為它 120 層網絡中總共有 1.8 萬億個參數。

2、確實是混合專家模型。OpenAI 能夠通過使用混合專家(MoE)模型來保持合理成本。他們在模型中使用了 16 個專家模型,每個專家模型大約有 111B 個參數。這些專家模型中的 2 個被路由到每個前向傳遞。

3、MoE 路由:盡管文獻中對于選擇將每個 token 路由到哪個專家模型的高級路由算法進行了大量討論,但據稱 OpenAI 在當前的 GPT-4 模型中采用了相當簡單的路由方式。該模型大約使用了 550 億個共享參數來進行注意力計算。

圖片圖片

4、推理:每次前向傳遞的推理(生成 1 個 token)僅利用約 2800 億個參數和約 560 TFLOP 的計算量。相比之下,純密集模型每次前向傳遞需要大約 1.8 萬億個參數和約 3700 TFLOP 的計算量。

5、數據集:GPT-4 的訓練數據集包含約 13 萬億個 token。這些 token 是重復計算之后的結果,多個 epoch 中的 token 都計算在內。

Epoch 數量:針對基于文本的數據進行了 2 個 epoch 的訓練,而針對基于代碼的數據進行了 4 個 epoch 的訓練。此外,還有來自 ScaleAI 和內部的數百萬行的指令微調數據。

6、GPT-4 32K:在預訓練階段,GPT-4 使用了 8k 的上下文長度(seqlen)。而 32k 序列長度版本的 GPT-4 是在預訓練后對 8k 版本進行微調而得到的。

圖片圖片

7、Batch Size:在計算集群上,幾天時間里,batch size 逐漸增加,最后,OpenAI 使用 batch size 達到了 6000 萬!當然,由于不是每個專家模型都能看到所有 token,因此這僅僅是每個專家模型處理 750 萬個 token 的 batch size。

真實的 batch size:將這個數字除以序列長度(seq len)即可得到真實的 batch size。請不要再使用這種誤導性的數字了。

8、并行策略:為了在所有 A100 GPU 上進行并行計算,他們采用了 8 路張量并行,因為這是 NVLink 的極限。除此之外,他們還采用了 15 路流水線并行。(很可能使用了 ZeRo Stage 1,也可能使用了塊級的 FSDP)。

9、訓練成本:OpenAI 在 GPT-4 的訓練中使用了大約 2.15e25 的 FLOPS,使用了約 25,000 個 A100 GPU,訓練了 90 到 100 天,利用率(MFU)約為 32% 至 36%。這種極低的利用率部分是由于大量的故障導致需要重新啟動檢查點。

如果他們在云端的每個 A100 GPU 的成本大約為每小時 1 美元,那么僅此次訓練的成本將達到約 6300 萬美元。(而如今,如果使用約 8192 個 H100 GPU 進行預訓練,用時將降到 55 天左右,成本為 2150 萬美元,每個 H100 GPU 的計費標準為每小時 2 美元。)

10、使用專家混合模型時的 tradeoff:在使用專家混合模型時存在多方面 tradeoff。

例如,在推理過程中處理 MoE 非常困難,因為并非模型的每個部分都在每個 token 生成時被利用。這意味著在某些部分被使用時,其他部分可能處于閑置狀態。在為用戶提供服務時,這會嚴重影響資源利用率。研究人員已經證明使用 64 到 128 個專家比使用 16 個專家能夠實現更好的損失(loss),但這僅僅是研究的結果。

選擇較少的專家模型有多個原因。OpenAI 選擇 16 個專家模型的一大原因是:在許多任務中,更多的專家模型很難泛化,也可能更難收斂。

由于進行了如此大規模的訓練,OpenAI 選擇在專家模型數量上更加保守。

圖片圖片

11、推理成本:GPT-4 的推理成本是 1750 億參數的 Davinci 模型的 3 倍。這主要是因為 GPT-4 需要更大規模的集群,并且達到的利用率要低得多。

據估計,在用 128 個 A100 GPU 進行推理的情況下,8k 版本 GPT-4 推理的成本為每 1,000 個 token 0.0049 美分。如果使用 128 個 H100 GPU 進行推理,同樣的 8k 版本 GPT-4 推理成本為每 1,000 個 token 0.0021 美分。值得注意的是,這些估計假設了高利用率和保持較高的 batch size。

12、Multi-Query Attention:OpenAI 和其他機構一樣,也在使用 Multi-Query Attention(MQA)。由于使用 MQA 只需要一個注意力頭(head),并且可以顯著減少用于 KV 緩存的內存容量。即便如此,32k 序列長度的 GPT-4 也絕對無法在 40GB 的 A100 GPU 上運行,而 8k 序列長度的模型則受到了最大 batch size 的限制。

圖片圖片

13、連續 batching:OpenAI 實現了可變 batch size 和連續 batching。這樣做是為了允許一定程度的最大延遲,并優化推理成本。

14、視覺多模態:它是一個獨立于文本編碼器的視覺編碼器,二者之間存在交叉注意力。該架構類似于 Flamingo。這在 GPT-4 的 1.8 萬億個參數之上增加了更多參數。在純文本的預訓練之后,它又經過了另外約 2 萬億個 token 的微調。

對于視覺模型,OpenAI 本來希望從零開始訓練,但由于其尚未成熟,所以他們決定先從文本開始訓練來降低風險。

這種視覺能力的主要目的之一是使自主智能體能夠閱讀網頁并轉錄圖像和視頻中的內容。

他們訓練的一部分數據是聯合數據(包括渲染的 LaTeX / 文本)、網頁的截屏、YouTube 視頻(采樣幀),并使用 Whisper 對其進行運行以獲取轉錄文本。

圖片圖片

15、推測式解碼(Speculative Decoding):OpenAI 可能在 GPT-4 的推理過程中使用了推測式解碼技術(不確定是否 100%)。這種方法是使用一個更小更快的模型提前解碼多個 token,并將它們作為單個 batch 輸入到一個大型的預測模型(oracle model)中。

如果小型模型對其預測是正確的,大型模型將會同意,我們可以在單個 batch 中解碼多個 token。

但是,如果大型模型拒絕了草稿模型預測的 token,那么 batch 中剩余的部分將被丟棄,然后我們將繼續使用大型模型進行解碼。

有些陰謀論指出,新的 GPT-4 質量已經下降,這可能只是因為他們讓推測式解碼模型(speculative decoding model)將概率較低的序列傳遞給預測模型,從而導致了這種誤解。

圖片圖片

16、推理架構:推理運行在由 128 個 GPU 組成的集群上。在不同地點的多個數據中心存在多個這樣的集群。推理過程采用 8 路張量并行(tensor parallelism)和 16 路流水線并行(pipeline parallelism)。每個由 8 個 GPU 組成的節點僅具有約 1300 億個參數。

該模型有 120 層,因此適合于 15 個不同的節點。可能第一個節點的層數較少,因為它還需要計算嵌入。

根據這些數字,如果 OpenAI 試圖按照 chinchilla 的最佳指標進行訓練,他們應該使用的 token 數量是現在的兩倍。這表明他們在獲取高質量數據方面遇到了困難。

最后想說的是,這應該是迄今為止關于 GPT-4 最為詳細的數據揭秘。目前還不能求證是否真實,但也值得大家研究下。正如原文作者所說,「有趣的方面是理解 OpenAI 為什么做出某些架構決策。

關于 GPT-4 的這些架構信息,你怎么看?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-16 12:15:42

AI模型

2025-01-02 13:15:00

2023-11-06 09:26:00

模型測評

2023-03-16 19:17:57

2023-05-19 13:01:10

ChatGPT模型

2023-03-28 08:23:38

2023-06-08 11:27:10

模型AI

2023-10-18 12:50:12

數據模型

2024-07-22 09:01:20

2023-06-19 08:19:50

2024-01-29 00:05:00

OpenAI嵌入機器學習

2023-02-20 13:50:39

AI 領域建模大數據

2023-12-11 19:08:59

AI模型

2023-09-06 16:44:03

2025-04-16 09:35:03

2023-03-30 11:08:49

AI模型訓練

2023-07-13 12:54:42

GPT-4OpenAI

2023-12-26 08:17:23

微軟GPT-4

2023-08-11 13:15:35

ChatGPTMBTIGPT-4

2024-01-16 12:31:13

OpenAIGLM-4大模型
點贊
收藏

51CTO技術棧公眾號

俄罗斯一级**毛片在线播放 | 青青视频一区二区| 亚洲电影在线免费观看| 韩国成人av| 成人免费一区二区三区| 最新国产精品| 亚洲аv电影天堂网| 黄色高清无遮挡| 国产理论在线观看| 久久综合久久综合九色| 91香蕉电影院| 亚洲欧美在线人成swag| 夜色77av精品影院| 欧美日韩国产一区| 日韩人妻无码精品久久久不卡| 黄色在线观看网| 国产精品综合av一区二区国产馆| 91sa在线看| 中日韩一级黄色片| 欧美人与牛zoz0性行为| 精品粉嫩aⅴ一区二区三区四区| 麻豆一区二区三区视频| 超免费在线视频| 国产又粗又猛又黄视频| 精品69视频一区二区三区| 亚洲一区二区三区小说| 亚洲欧美国产不卡| 免费国产在线观看| 国产99精品在线观看| 国产免费成人av| 在线观看日本网站| 99日韩精品| 欧美极品少妇xxxxⅹ裸体艺术| 你懂得视频在线观看| 五月国产精品| 亚洲爱爱爱爱爱| 性折磨bdsm欧美激情另类| 福利一区和二区| 91黄色免费版| 哪个网站能看毛片| 电影在线观看一区| 亚洲一区免费观看| 麻豆传媒网站在线观看| 看黄网站在线观看| 亚洲欧洲精品一区二区精品久久久 | 久久久久天天天天| 黄色av小说在线观看| 国产成人精品一区二| 亚洲一区中文字幕在线观看| 91精品国产乱码久久| 久久精品国产亚洲a| 国产精品美女在线观看| 久久这里只有精品9| 日本亚洲视频在线| 国产精品免费网站| 最近中文字幕在线免费观看| 蜜臀av性久久久久av蜜臀妖精| 久久男人av资源网站| 成人免费性视频| 黄色国产网站在线播放| 国产精品乱人伦一区二区| 日韩电影大全在线观看| 欧美一区免费看| 石原莉奈在线亚洲二区| 国产激情999| 国产精品久久国产精品| 午夜精品久久久久久久91蜜桃| 国产成人av电影| 国产精品久久久久久久小唯西川| 神马久久久久久久久久| 久久人人超碰精品| 一区二区视频免费观看| 中文字幕精品影院| 亚洲欧美一区二区三区在线| 国产综合精品在线| 日韩欧美伦理| 欧美精品免费看| 日韩高清精品免费观看| 毛片一区二区| 亚洲精品视频一区| 伊人狠狠色丁香综合尤物| 黄色网页在线播放| 午夜精品视频在线观看| 久久久久久久久久福利| av在线成人| 亚洲国产精品女人久久久| 亚洲av无码一区二区二三区| 久久精品国产大片免费观看| 国外成人在线视频| 麻豆视频在线播放| 成人免费视频在线观看| 欧美在线观看视频免费| 末成年女av片一区二区下载| 精品视频1区2区| 粗大的内捧猛烈进出视频| 群体交乱之放荡娇妻一区二区| 在线精品视频视频中文字幕| 国产精品久久久久久久美男 | 一本一道波多野毛片中文在线| 亚洲最大成人综合| 人人爽人人av| 加勒比色老久久爱综合网| 中文字幕亚洲色图| www.国产色| 少妇熟女一区二区| 性生活免费在线观看| 亚洲精品伦理| 亚洲国产私拍精品国模在线观看| 白白色免费视频| 欧美日韩18| 国产精品欧美亚洲777777 | 日本久久一区二区| 特种兵之深入敌后| 日韩欧美中字| 欧美在线观看网址综合| 精品人妻久久久久一区二区三区 | 天堂av一区二区| caoporn91| 日韩国产高清在线| 精品久久久久久一区| 国产在线观看a| 欧美中文字幕亚洲一区二区va在线| 国产艳妇疯狂做爰视频 | 色老头一区二区三区| 日本一级黄色大片| 粉嫩av一区二区三区在线播放 | 成人av免费在线看| 欧美天天影院| 欧美色爱综合网| 成人免费毛片糖心| 国产情侣一区| 国产视频一区二区不卡| 色女人在线视频| 欧美一区二区三区视频免费| 女人裸体性做爰全过| 日韩不卡一区二区| 日韩免费一区二区三区| 另类专区亚洲| 亚洲三级黄色在线观看| 日本免费在线观看视频| 91在线国产观看| 国产黄页在线观看| 狠狠久久伊人| 91国产视频在线播放| 国产 日韩 欧美 综合| 亚洲综合色婷婷| 久久久久久久穴| 亚洲福利免费| 久久综合中文色婷婷| 自由日本语热亚洲人| 亚洲精品美女在线观看播放| 久久久久久久黄色片| 26uuu成人网一区二区三区| 国产免费一区二区三区视频| 一区二区三区日本久久久| 日韩免费在线看| 成人在线免费视频| 欧美日韩一区视频| 午夜精品福利在线视频| 国产白丝网站精品污在线入口| 大胆欧美熟妇xx| 久久久久观看| 国产精品成人av性教育| 91欧美在线视频| 欧美一区二区黄色| 日韩精品一卡二卡| 久久久久99精品国产片| 孩娇小videos精品| 午夜日韩视频| 精品日韩电影| 97成人超碰| 欧美精品制服第一页| 欧美一级在线免费观看| 欧美性猛交xxxxx免费看| 国产高清一区二区三区四区| 国产一区二区三区香蕉| 真人抽搐一进一出视频| 国产探花一区在线观看| 亚洲aa中文字幕| av毛片午夜不卡高**水| 国产偷亚洲偷欧美偷精品| 亚洲中文无码av在线| 亚洲欧美日韩电影| 欧美在线一级片| 日本伊人色综合网| www.欧美黄色| 欧美色图激情小说| 91观看网站| 日韩a**中文字幕| 免费不卡欧美自拍视频| 毛片在线免费| 欧美一级在线观看| 天堂а√在线中文在线新版| 亚洲欧美视频在线观看视频| 中文乱码人妻一区二区三区视频| 久久成人久久鬼色| 精品少妇在线视频| 国产精品久久久久久久久妇女| 国外成人在线视频网站| 欧美v亚洲v综合v国产v仙踪林| 97在线看免费观看视频在线观看| 在线观看黄av| 日韩精品中文字幕视频在线| 99国产在线播放| 91福利精品第一导航| 久久久www成人免费毛片| 久久久精品2019中文字幕之3| 人妻巨大乳一二三区| 欧美a级一区二区| 欧美色图另类小说| 欧美久久视频| 中文字幕在线亚洲精品| 国产探花一区| 久久国产主播精品| 91精品国产自产精品男人的天堂 | 欧美黄色片视频| 欧美成年黄网站色视频| 国产亚洲精品高潮| 青梅竹马是消防员在线| 欧美精品一区二区三区蜜臀| 国产v片在线观看| 欧美老女人第四色| 国产一级片免费视频| 五月综合激情日本mⅴ| 日韩va亚洲va欧美va清高| 中文字幕精品一区二区精品绿巨人| 风间由美一二三区av片| 成人污污视频在线观看| 日本黄色www| 狠狠色综合播放一区二区| 国产又黄又猛又粗| 日本人妖一区二区| 一本久道中文无码字幕av| 国产一区二区你懂的| 日本xxxxxxxxxx75| 精品成人在线| 岛国大片在线播放| 亚洲小说欧美另类婷婷| 成人午夜免费在线视频| 国产精品v一区二区三区| 黄色成人在线免费观看| 欧美国内亚洲| 免费一级淫片aaa片毛片a级| 欧美激情五月| av在线com| 亚洲黄网站黄| 国产精品专区在线| 国产精品亚洲产品| 国产亚洲天堂网| 天堂在线一区二区| 手机在线看福利| 免费在线观看日韩欧美| 小明看看成人免费视频| 久久99精品国产麻豆婷婷| 中国黄色片一级| 国产麻豆精品久久一二三| 亚洲国产欧美91| 成人国产电影网| 日韩片在线观看| 久久久精品黄色| 国产探花在线视频| 亚洲精品水蜜桃| www在线视频| xxxx性欧美| www免费视频观看在线| 久久国产精品99国产精| 欧美草逼视频| 午夜精品久久久久久久99黑人| 成人免费无遮挡| 国产精品一区二区三区成人| 99精品美女视频在线观看热舞| 国产aⅴ精品一区二区三区黄| 狠狠久久伊人| 亚洲图片小说在线| 无需播放器亚洲| 精品精品国产毛片在线看| 91av在线视频观看| 亚洲少妇视频| 国产精品第8页| 先锋影音网一区二区| 99re国产| 国产欧美日韩视频在线| 自拍偷拍视频在线| 在线观看日韩av电影| 国产精品99久久免费黑人人妻| 美女免费视频一区| 美女又黄又免费的视频| 久久亚洲捆绑美女| 国产精品视频一区二区在线观看| 亚洲一区国产视频| 亚洲天堂五月天| 欧美r级电影在线观看| 男人天堂资源在线| 欧美成人三级视频网站| 不卡福利视频| 91精品国产一区二区三区动漫| 九一成人免费视频| 4444在线观看| 日本特黄久久久高潮| 欧美肉大捧一进一出免费视频| 国产精品网曝门| 日本一区二区免费在线观看| 欧美日韩一二三| 亚洲av成人精品一区二区三区在线播放 | 男女激情免费视频| 久久精品免费观看| 国内精品久久99人妻无码| 亚洲丝袜自拍清纯另类| 亚洲欧美一二三区| 精品国产百合女同互慰| 1769在线观看| 日韩av免费在线观看| 亚洲精品在线a| 亚洲日本欧美在线| 久久精品女人| 久久人人爽人人人人片| 亚洲精品自拍动漫在线| 亚洲无码精品国产| 亚洲欧洲美洲在线综合| 1区2区3区在线| 北条麻妃高清一区| 欧美精品一线| 香蕉网在线视频| 亚洲日本丝袜连裤袜办公室| 中文字幕男人天堂| 亚洲视频在线观看网站| 国产在线观看www| 国产伦精品一区二区三区在线 | 欧美大片va欧美在线播放| 亚洲精品成人一区| 伊人色综合影院| 热久久免费视频| 成年人在线免费看片| 色美美综合视频| 免费在线黄色影片| 欧洲美女7788成人免费视频| 欧美理论电影在线精品| 国产av天堂无码一区二区三区| 成人性视频免费网站| 久久国产在线视频| 欧美电视剧在线看免费| av中文字幕在线观看| 3d精品h动漫啪啪一区二区| 天天超碰亚洲| 久草福利在线观看| 亚洲伊人色欲综合网| 黑人精品一区二区| 亚州欧美日韩中文视频| 蜜桃一区二区三区| 日韩精品无码一区二区三区免费| 国产日韩成人精品| 中文字幕 国产| 久久精品色欧美aⅴ一区二区| 国产精品va视频| www.九色.com| 91丨porny丨国产入口| 好看的av在线| 一区二区三区国产视频| 日本久久二区| 中文字幕色呦呦| 9l国产精品久久久久麻豆| 久久99精品波多结衣一区| 亚洲欧美激情一区| 成人在线视频免费| 日本福利视频网站| 91网上在线视频| 在线免费看91| 欧美黄色www| 九九久久婷婷| 色婷婷综合在线观看| 亚洲高清一区二区三区| 酒色婷婷桃色成人免费av网| 91精品久久久久久综合乱菊 | 精品国产a一区二区三区v免费| 国产 porn| 亚洲精品国产一区二区三区四区在线 | 周于希免费高清在线观看| 日本一区二区三不卡| 国产一区二区免费在线| 亚洲国产综合久久| 在线观看亚洲区| 亚洲日本va| 成年人在线观看视频免费| 亚洲青青青在线视频| 亚洲av成人无码久久精品老人 | 国产精品欧美激情在线播放| 中文字幕亚洲精品乱码| 成人h动漫精品一区| 欧美精品一级二级三级| 成年男女免费视频网站不卡| 日本一区二区三区免费观看| 国产精品1区2区3区| 无码人妻丰满熟妇精品区| 蜜臀久久99精品久久久无需会员| 日本韩国欧美超级黄在线观看| 天天综合成人网| 色综合久久88色综合天天6| 色呦呦网站在线观看| 亚洲韩国在线| 91蝌蚪porny九色|