精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT

原創 精選
人工智能
據卡神的在Github上的介紹,這套框架運行上,你只需要8個H100節點,關鍵在于,它的依懶性極低,安裝非常簡單。就連卡神自己都忍不住稱“這是我寫過的最瘋狂、最放飛自我的項目之一!”

編輯 | 云昭

復刻 ChatGPT 有多難?

商業層面看,很難。但對于眾多的開發者、甚至實驗室的研究生而言,從今天起,可能就要有標準答案了。

100美元,就能得到一個陪“幼兒園朋友”聊天,能寫詩、講故事,回答“天空為什么是藍的”簡單問題的模型。

300美元,就能讓你得到一個可以超過GPT-2的模型:翻譯、完形填空、閱讀理解都可以處理。

800美元,理解和推理能力就可以做到GPT-3 Small的水準;

1000美元左右,這個模型就已經可以解決簡單的數學和代碼問題以及多項選擇題了。(接近GPT4水平)

就在今天,知名大神Karpathy在X上宣布自己的新作:NanoChat!

圖片圖片

Karpathy:自己寫的最瘋狂項目之一

顧名思義,這個新項目炸裂之處,就在于他是一個類似 ChatGPT 的 LLM 的全棧實現。

圖像圖像

據卡神的在Github上的介紹,這套框架運行上,你只需要8個H100節點,關鍵在于,它的依懶性極低,安裝非常簡單。就連卡神自己都忍不住稱“這是我寫過的最瘋狂、最放飛自我的項目之一!”

與我之前類似的代碼庫 nanoGPT(僅涵蓋預訓練)不同,nanochat 是一個極簡的、從零開始的全棧訓練/推理流程,它基于一個單一且依賴性極低的代碼庫,是一個簡單的 ChatGPT 克隆版本。

你只需啟動一個云 GPU 設備,運行一個腳本,只需 4 小時,就可以在類似 ChatGPT 的 Web UI 中與你的 LLM 進行交流。

為什么說瘋狂呢?不僅僅是因為這個“100美元就可以買到一個最好的LLM模型”這個想法瘋狂,更關鍵的是,這個想法在實驗過程中得到了驗證。

訓練不到4個小時,8304行代碼,只有44個文件,卻擊敗了上億參數規模的GPT-2,甚至在部分評估集上以微弱優勢超過了GPT-4(預訓練分詞器的評估實驗)。

圖片圖片


比如,在訓練分詞器方面,卡神實現了約 4.8 的壓縮比(這意味著平均 4.8 個原文字符變成 1 個 token)。此外,還卡神將這個分詞器與 GPT-2 和 GPT-4 分詞器進行比較。與 GPT-2(擁有 50257 個 token)相比,NanoChat的分詞器在文本壓縮方面全面優于 GPT-2,而后者則在數學部分略勝一籌:

圖片圖片

與GPT-4的分詞器相比,NanoChat也有驚喜!

盡管我們在 fineweb 上的詞匯量較小,但我們實際上還是以一點點優勢擊敗了 GPT-4,因為那是我們實際訓練的數據集,所以我們的標記器非常匹配該文檔分布(例如,我們可能在壓縮英語方面具有優勢)。

圖片圖片

Github地址:https://github.com/karpathy/nanochat

討論地址:https://github.com/karpathy/nanochat/discussions/1

價值太高!連OpenAI背后訓練GPT的動作都曝出來了

大家之所以對于NanoChat項目呼聲如此之高。

除了上面提到的成本便宜,還有一點就是極大地降低了大家認知ChatGPT底層原理的門檻。

根據卡神在項目自述文件的描述,整個項目的訓練過程、使用到的技術都和OpenAI訓練ChatGPT的方法基本相同。

那么,這8304行代碼究竟是如何來復刻ChatGPT的?

  • 預訓練階段,使用全新的Rust實現訓練分詞器;
    卡神特別提到,在FineWeb上對TransformerLLM進行預訓練,評估多個指標下的CORE分數;
  • 中期訓練階段,卡神在來自SmolTalk的用戶-助手對話、多項選擇題、工具使用數據上進行中期訓練;
  • 接下來是SFT階段,在世界知識多項選擇題(ARC-E/C、MMLU)、數學(GSM8K)、代碼(HumanEval)上評估聊天模型
  • 然后是訓練的最后一個階段,使用「GRPO」在GSM8K上對模型進行強化學習微調(RL)
  • 推理方面,卡神選擇在帶有KV緩存的引擎中實現高效推理,只需要簡單的prefill/decode,tool-use(在輕量級沙箱中的Python解釋器),通過CLI或類ChatGPT的網頁界面與其交互。
  • 撰寫一份單一的Markdown成績單,總結并將整個過程游戲化。

最后一個酷似ChatGPT的Mini高級應用就躍然眼前了!

圖片圖片

為什么可以訓練如此之快?AI老鳥總結卡神的Trick

當然,成本能夠如此之低,自然還是卡神的智慧。在上面各個環節都設計得非常巧妙。

比如你去從文件結構去看,會發現比較有意思的是:有 data loader、data set engine,還有個叫 GPT pi 的東西,看起來挺有趣。還有 muon optimizer,這里還有 distributed muon,細心地網友稱:這估計是給 H100 GPU 用的。

另外,參數部分也挺吸引人。序列長度是 24,層數 12,768 維度,看起來是個中小型模型。因為我自己也在搭模型,所以看到這些配置挺有參考價值。

網友注意到一個trick的細節。他爆料到,一般來說,Karpathy 總喜歡讓數字“好看”——比如用 2 的平方倍數。

但其實這次,上面這些參數都不是嚴格的 2 的平方,但可能能被分解成一些平方的倍數。比如上面的這三個參數:24、12、768,都不是。所以他猜測卡神肯定是發現最后這幾個數字更合適。

“我本來預期 hidden size 會是 148,不知道他為什么選了 768。”

還有,正則方面,卡神沒有采用 Pytorch自帶的 RoPE(旋轉位置編碼),而是采用了自己寫的版本。

實現特別簡潔,簡直是我見過最優雅的代碼。他的思路是把向量一分為二,然后用旋轉矩陣分別處理,再拼接回來。雖然我還沒完全吃透旋轉矩陣的部分,但能看出這是個非常輕量、教學導向的實現。

這還沒完,在 自回歸注意力(causal self-attention) 模塊里,卡神把 query、key、value 的線性層分開實現。其實也可以優化成一次線性變換,然后再分割結果張量,這樣可以減少內存讀寫。

激活函數方面,他使用了一個叫 ReLU2(ReLUSquared) 的激活函數,據說在一些實驗中收斂更快。

卡神還提到了預計算 旋轉嵌入(rotary embeddings) 的技巧:提前把 cos 和 sin 值算好放在 GPU 內存里,因為它們不依賴訓練參數。

在優化器部分,他把參數拆成兩組:embedding 和 LM head 用 AdamW,矩陣參數用 Muon Optimizer。這個優化器是最近新出的,據說在特征學習(feature learning)上表現不錯。

當然,也有一些業界所公認的Trick,比如大框架還是經典的 Transformer 結構:自注意力 + MLP + 殘差。

再比如采用 KV cache,來加速推理。代碼里根據 cache 是否存在分支執行不同邏輯,這點和大多數 LLM 實現類似。

還有,MLP 部分,卡神沒用 Mixture of Experts,理由很合理:MoE 更適合推理階段,而不是研究階段。MLP 更易于理解和調試。

下一步:發展成一個研究工具或基準

卡神在X上表示,項目還沒完工,自己的目標是將完整的“強基線”堆棧整合到一個內聚、精簡、可讀、可修改且最大程度可分叉的倉庫中。

而NanoChat 將成為 LLM101n(仍在開發中)的頂點項目。

我認為它也有潛力發展成為一個研究工具或基準,類似于之前的 nanoGPT。它遠未完成、調整或優化(實際上我認為可能還有不少唾手可得的成果),但我認為它的整體框架已經足夠完善,可以上傳到 GitHub 上,以便所有部分都能得到改進。

寫在最后

當然,這套復刻框架,肯定不能真正意義上直接幫各位得到一個ChatGPT 1:1的復刻版。

因為局限就擺在那里。性能上,如果想要運行流暢度,就可能需要自己上手微調。那這就需要用戶得有點技術背景才能玩轉它。

比如,如果你的 顯存(VRAM) 比較小,就得調整超參數。這對新手來說可能是個門檻。

但小編看來,更多的意義,還是在于,讓“高在天上”的 LLM產品,變得更加評價、可及。

也就是說,卡神的這個項目繼續讓 AI 開發更大眾化了,讓更多人,尤其是算力不夠的學校、學生們能參與、實驗動手了起來。

而這則會進一步帶動AI應用的繁榮。

想一想,如果連大學學生、業余開發者都能低成本訓練模型,也許能催生很多有創意的應用。

因為這個項目是開源的,所有人按照自己需求進行調整、修改,得到自己想要的結果。

使用 nanochat,你幾乎可以調任何東西。無論是換 tokenizer、改訓練數據、調整超參數,還是優化算法,都可以自由嘗試——有很多潛在思路可以探索。

如果你希望訓練更大的模型,也很容易做到。

代碼庫的設計是完全可擴展的:你只需要通過參數 --depth 來改變模型層數,其他相關參數都會自動按比例調整。

這意味著它的“復雜度”只靠這一個滑桿就能控制。

正如一位網友所說,看起來,NanoChat雖然只是小步前進,但它可能引發大波浪。

項目提供了詳細的指導文檔,它還支持把文件打包成可查詢的數據塊,很友好。這一點我挺欣賞——能看出作者是站在用戶角度思考的。沒錯。

現在,大家都能理解Karpathy為什么會被稱之為“卡神”了吧!太牛了!

圖片圖片

寫完這篇稿子一看,哇塞,這個項目已經狂飆到了8.2K星!

參考鏈接:

https://www.youtube.com/watch?v=EFpDHdsITrg&t=419s

https://x.com/karpathy/status/1977755427569111362

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-05-09 08:18:51

2024-02-04 13:33:23

模型訓練

2025-11-10 09:09:00

2025-10-17 01:22:00

KarpathyChatGPTAI

2025-01-10 12:56:50

2023-04-15 20:29:19

ChatGPT人工智能

2013-04-11 09:43:15

Android創建項目Android開發

2024-02-19 08:56:00

AI模型

2025-03-24 12:42:52

2025-10-21 12:35:18

2022-12-12 13:10:25

2019-11-27 19:29:17

QQ微信移動應用

2024-02-22 11:56:36

ChatGPT調試OpenAI

2025-11-06 08:59:00

2016-11-10 10:07:28

新項目前端流程

2024-02-22 09:51:56

代碼AI

2024-02-22 07:29:31

OpenAIKarpathy分詞器

2025-04-02 03:55:00

MCPAI智能體

2024-08-27 00:00:03

2025-05-13 12:47:16

點贊
收藏

51CTO技術棧公眾號

国产黄色片av| 亚洲欧美日韩成人| 久久国产色av| 亚洲精品中文字幕无码蜜桃| av av片在线看| 亚洲成人直播| 亚洲一区二区偷拍精品| 国产女同一区二区| 亚洲AV无码片久久精品| av福利在线导航| 国产精品va| 在线不卡中文字幕| 亚洲国产婷婷香蕉久久久久久99| 男人的天堂一区二区| 4438全国亚洲精品观看视频| 亚洲欧美国产三级| 91精品啪在线观看麻豆免费| 美女av免费看| 久久亚洲人体| 国产精品青草综合久久久久99| 欧美一二三视频| 一起草在线视频| 国产剧情av在线播放| 成人久久18免费网站麻豆| 久久99国产精品自在自在app| 欧美一级小视频| 毛片在线视频| 国产精品亚洲专一区二区三区| www亚洲欧美| 日本女人黄色片| 色呦呦在线视频| 成人一道本在线| 国产女人18毛片水18精品| 日本网站在线播放| 伊人久久大香线| 日韩免费高清视频| 亚洲 欧美 日韩 国产综合 在线| 少妇av一区二区| 国产麻豆综合| 国产亚洲福利一区| 亚欧激情乱码久久久久久久久| 成人免费在线电影| 激情欧美一区二区| 久久伊人精品视频| 久久久久国产免费| 涩涩av在线| 欧美国产乱子伦 | 欧美日韩在线免费视频| 欧美精品一区三区在线观看| 波多野结衣视频观看| 日韩在线观看| 精品成人在线观看| 北条麻妃69av| 日韩黄色影院| 成人福利电影精品一区二区在线观看| 国产91av在线| 免费看日韩毛片| 亚洲人人精品| 中文字幕日韩综合av| 夜夜爽久久精品91| 91嫩草国产线观看亚洲一区二区 | 国产小视频在线观看免费| 高清精品视频| 日本韩国一区二区三区视频| 亚洲视频导航| 天堂网在线中文| eeuss影院一区二区三区| 国产精品 欧美在线| 亚洲成人生活片| 一区二区三区日本久久久| 3d成人h动漫网站入口| 日本a视频在线观看| 天堂аⅴ在线地址8| 国产精品三级视频| 中文字幕一区二区中文字幕| 无码精品人妻一区二区| 精品一区二区日韩| 日本亚洲欧美三级| 免费在线一级片| 日本一本不卡| 精品福利一区二区三区| 欧美日韩人妻精品一区在线| 伦一区二区三区中文字幕v亚洲| 欧美三级视频在线| www.五月天色| 日本黄色一区| 精品日韩中文字幕| 成人在线免费高清视频| 在线视频自拍| 久久这里都是精品| 国产精品区一区二区三含羞草| 中文在线字幕免费观| 模特精品在线| 欧美激情在线狂野欧美精品| 五月天色婷婷丁香| 欧美亚洲激情| 久久国产精品亚洲| 男人日女人网站| 伊人久久综合| 国产精品青青在线观看爽香蕉| 国产一区二区99| 欧美精品激情| 日韩一区二区在线视频| 精品无码免费视频| 日韩精品欧美成人高清一区二区| 亚洲91av视频| 国产在线一二区| 欧美三级不卡| 欧美一级高清免费| 国产视频在线观看视频| 久久se精品一区精品二区| 国产成人精品一区二区三区福利| 99热这里只有精品在线| 久久婷婷一区二区三区| 大地资源网在线观看免费官网| 日韩三级影院| 狠狠躁夜夜躁人人躁婷婷91| 国产精品久久久久久久99| 一道本一区二区三区| 欧美激情一级欧美精品| 一本大道伊人av久久综合| 寂寞少妇一区二区三区| 欧美人与性禽动交精品| 欧美14一18处毛片| 亚洲成人你懂的| 欧美亚洲国产成人| 久久久久毛片免费观看| 欧美变态tickling挠脚心| 无码人妻一区二区三区免费n鬼沢| 亚洲一区二区三区在线免费| 在线亚洲男人天堂| www.毛片.com| 99在线精品观看| 日韩成人手机在线| 亚洲私拍视频| 欧美综合色免费| 日本超碰在线观看| 欧美精品系列| 成人97在线观看视频| 国产情侣免费视频| 国产精品资源在线看| 亚洲国产精品视频一区| 亚洲黄色中文字幕| 亚洲激情视频网站| 欧美熟妇激情一区二区三区| 国产精品国内免费一区二区三区| 欧美成人四级hd版| 一区二区三区精彩视频| 成人免费高清在线| 污污污污污污www网站免费| 国产精品一区二区精品| 亚洲精品狠狠操| 精品在线视频免费| 成人免费高清视频在线观看| 亚洲国产精品无码观看久久| 伊人久久高清| 欧美大胆一级视频| 少妇久久久久久被弄高潮| 国产精品久久久亚洲一区| 国产精品自拍首页| 91黄页在线观看| 亚洲精品电影网在线观看| 日本系列第一页| 捆绑紧缚一区二区三区视频| 国产麻豆日韩| a天堂资源在线| 亚洲精品美女久久久| 黄色免费一级视频| 久久99精品久久只有精品| 伊人婷婷久久| 一区二区三区在线免费看 | 免费男女羞羞的视频网站在线观看| 91麻豆精品国产91久久久久| 亚洲天堂黄色片| 成人久久久精品乱码一区二区三区| 日韩精品―中文字幕| 亚洲精品国产嫩草在线观看| 中文字幕在线看视频国产欧美在线看完整| 在线视频播放大全| 亚洲精品国产无套在线观| 男人操女人逼免费视频| 丝袜av一区| 欧美激情精品久久久久久大尺度 | 九九热精彩视频| 成人91在线观看| 爱情岛论坛亚洲首页入口章节| 影音先锋欧美激情| 欧美在线观看视频| 日本综合在线| 亚洲成人免费网站| 日韩欧美中文字幕视频| 99久久精品国产观看| www.日本在线视频| 亚洲男人都懂第一日本| 成人写真福利网| 在线观看精品一区二区三区| 日韩欧美亚洲国产另类 | 亚洲国产美女 | 欧美激情综合色综合啪啪| 久久伊人资源站| 青青草原国产在线| 国产亚洲精品成人av久久ww| 性中国古装videossex| 国产精品久久久久影院亚瑟| 国产综合内射日韩久| 午夜在线精品| 女人一区二区三区| 免费看日产一区二区三区| 青青草精品毛片| 日韩亚洲视频在线观看| 精品美女久久久久久免费| 日本三级日本三级日本三级极| 国产精品激情电影| 亚洲免费久久| 你微笑时很美电视剧整集高清不卡| 97婷婷大伊香蕉精品视频| 婷婷五月在线视频| 精品无码久久久久久国产| 国内自拍视频在线播放| 久久亚洲影视婷婷| 女王人厕视频2ⅴk| 青青青伊人色综合久久| 一本色道久久综合亚洲二区三区| 国产乱人伦丫前精品视频| 成人精品一区二区三区电影黑人| 一区二区三区短视频| 亚洲欧美综合精品久久成人| 波多野结衣mp4| 精品久久久中文| 国产精品.www| 亚洲午夜羞羞片| 亚洲色婷婷一区二区三区| 国产精品久久99| 国产伦精品一区二区三区妓女下载| 国产一区欧美| 色哟哟免费网站| 亚洲国产精品久久久天堂| 99国产在线视频| 亚洲精品永久免费视频| 久久久中精品2020中文| 精品亚洲综合| 在线不卡一区二区| 在线免费观看日韩视频| 欧美日韩一区二区三区视频| 波多野结衣爱爱| 欧美性极品少妇| 欧美黑人一级片| 亚洲精品美腿丝袜| 欧美成人精品激情在线视频| 亚洲免费在线视频一区 二区| 视频国产一区二区| 成人免费在线播放视频| 五月开心播播网| 成人精品免费看| 国产十八熟妇av成人一区| 成人的网站免费观看| 小毛片在线观看| 99久精品国产| 亚洲精品国产熟女久久久| 国产呦精品一区二区三区网站| 欧美日韩成人免费视频| 亚洲青涩在线| 一本大道熟女人妻中文字幕在线| 国产亚洲激情| 99精品视频播放| 蜜桃视频在线观看一区| 欧美不卡在线播放| 亚洲欧美日韩精品一区二区| 可以免费在线看黄的网站| 国产精品第十页| 国内精品在线观看视频| 久久久蜜桃一区二区人| 国产精品一区二区羞羞答答| 亚洲国产高清一区| 亚洲乱码中文字幕久久孕妇黑人| 91精品久久久久久久蜜月| 欧美性受黑人性爽| 精品国产乱码久久久久久1区2匹| 亚洲一区二区在线免费观看| 91高清一区| 分分操这里只有精品| 爽爽淫人综合网网站| 国产欧美日韩小视频| 在线综合视频| 日本a在线免费观看| 久久久久久夜| 久久发布国产伦子伦精品| 99re热视频精品| 五月天色婷婷丁香| 精品久久久久久久久中文字幕| 中文字幕精品一区二| 日韩欧美国产麻豆| 黄色国产在线| 欧美另类暴力丝袜| 国产成人精品一区二三区在线观看 | 一区二区三区视频在线播放| 国色天香一区二区| 欧美黑人又粗又大又爽免费| 国产精品123| 久久精品国产露脸对白| 99国产精品一区| fc2ppv在线播放| 欧美日韩中文字幕在线| 久久国产视频播放| 制服丝袜亚洲精品中文字幕| 日韩三级电影网| 欧美日韩国产成人高清视频| 欧洲一级精品| 国产一区二区三区高清| 秋霞蜜臀av久久电影网免费| 国产精品一区二区a| 日韩电影免费网站| 国产综合av在线| 国产精品18久久久久久久久久久久 | 国内自拍欧美激情| 97久久中文字幕| 日韩一区国产在线观看| jlzzjlzz亚洲女人| 妺妺窝人体色777777| 国产在线精品免费| 亚洲图片另类小说| 欧美日韩国产麻豆| 高h调教冰块play男男双性文| 欧美精品一区二区三区在线播放| 91福利在线视频| 日韩免费av一区二区| 牛牛精品成人免费视频| 国产亚洲精品久久久久久久| 久久超碰97中文字幕| 美女100%露胸无遮挡| 综合婷婷亚洲小说| 无码人妻精品一区二区蜜桃色欲| 欧美亚洲国产一区在线观看网站| 五月婷婷六月丁香综合| 久久久爽爽爽美女图片| 青草伊人久久| 久久久免费看| 日韩在线欧美| 99免费视频观看| 国产人伦精品一区二区| 中国毛片直接看| 午夜精品影院在线观看| 欧美特级黄色片| 亚洲人在线观看| 日韩三级影视| 亚洲一区二区在线播放| 婷婷成人在线| 日本www在线播放| 久久蜜桃香蕉精品一区二区三区| 国产精品乱子伦| 亚洲人成网站免费播放| 不卡福利视频| 日本一区二区三区www| 欧美99久久| 波多野结衣作品集| 国产欧美日韩中文久久| 国产乡下妇女三片| 日韩亚洲国产中文字幕| 国产电影一区| 800av在线免费观看| 粉嫩av一区二区三区在线播放 | 一区在线观看免费| 国产成人精品无码高潮| 欧美成人午夜激情视频| 成功精品影院| 中文字幕av日韩精品| 紧缚捆绑精品一区二区| 欧美国产日韩综合| 亚洲精品乱码久久久久久按摩观| 日韩伦理三区| 亚洲精品乱码视频| 国产麻豆91精品| 日韩和一区二区| 一本色道久久综合亚洲精品小说 | 亚洲第一伊人| 中文字幕丰满孑伦无码专区| 亚洲激情自拍视频| 欧美熟女一区二区| 欧美精品日韩三级| 99精品国产一区二区三区2021| 日韩精品一区二区三区久久| 国产精品天美传媒| 精品人妻一区二区三区含羞草| 日韩在线高清视频| 北条麻妃一区二区三区在线| 免费在线观看毛片网站| 亚洲伦理在线精品| 欧美男男同志| 51ⅴ精品国产91久久久久久| 欧美日韩在线观看视频小说| 亚洲精品鲁一鲁一区二区三区| 日韩欧美中文字幕在线播放| 欧美日韩欧美| 精品欧美日韩| 99香蕉国产精品偷在线观看| 久久久久久成人网| 亚洲精品在线三区| 影音成人av| 日本www在线播放| 亚洲精品国产一区二区精华液|