精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT 原創

發布于 2025-10-15 07:00
瀏覽
0收藏

編輯 | 云昭

復刻 ChatGPT 有多難?

商業層面看,很難。但對于眾多的開發者、甚至實驗室的研究生而言,從今天起,可能就要有標準答案了。

100美元,就能得到一個陪“幼兒園朋友”聊天,能寫詩、講故事,回答“天空為什么是藍的”簡單問題的模型。

300美元,就能讓你得到一個可以超過GPT-2的模型:翻譯、完形填空、閱讀理解都可以處理。

800美元,理解和推理能力就可以做到GPT-3 Small的水準;

1000美元左右,這個模型就已經可以解決簡單的數學和代碼問題以及多項選擇題了。(接近GPT4水平)

就在今天,知名大神Karpathy在X上宣布自己的新作:NanoChat!

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

Karpathy:自己寫的最瘋狂項目之一

顧名思義,這個新項目炸裂之處,就在于他是一個類似 ChatGPT 的 LLM 的全棧實現。

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖像

據卡神的在Github上的介紹,這套框架運行上,你只需要8個H100節點,關鍵在于,它的依懶性極低,安裝非常簡單。就連卡神自己都忍不住稱“這是我寫過的最瘋狂、最放飛自我的項目之一!”

與我之前類似的代碼庫 nanoGPT(僅涵蓋預訓練)不同,nanochat 是一個極簡的、從零開始的全棧訓練/推理流程,它基于一個單一且依賴性極低的代碼庫,是一個簡單的 ChatGPT 克隆版本。

你只需啟動一個云 GPU 設備,運行一個腳本,只需 4 小時,就可以在類似 ChatGPT 的 Web UI 中與你的 LLM 進行交流。

為什么說瘋狂呢?不僅僅是因為這個“100美元就可以買到一個最好的LLM模型”這個想法瘋狂,更關鍵的是,這個想法在實驗過程中得到了驗證。

訓練不到4個小時,8304行代碼,只有44個文件,卻擊敗了上億參數規模的GPT-2,甚至在部分評估集上以微弱優勢超過了GPT-4(預訓練分詞器的評估實驗)。

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片


比如,在訓練分詞器方面,卡神實現了約 4.8 的壓縮比(這意味著平均 4.8 個原文字符變成 1 個 token)。此外,還卡神將這個分詞器與 GPT-2 和 GPT-4 分詞器進行比較。與 GPT-2(擁有 50257 個 token)相比,NanoChat的分詞器在文本壓縮方面全面優于 GPT-2,而后者則在數學部分略勝一籌:

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

與GPT-4的分詞器相比,NanoChat也有驚喜!

盡管我們在 fineweb 上的詞匯量較小,但我們實際上還是以一點點優勢擊敗了 GPT-4,因為那是我們實際訓練的數據集,所以我們的標記器非常匹配該文檔分布(例如,我們可能在壓縮英語方面具有優勢)。

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

Github地址:??https://github.com/karpathy/nanochat??

討論地址:??https://github.com/karpathy/nanochat/discussions/1??

價值太高!連OpenAI背后訓練GPT的動作的曝出來了

大家之所以對于NanoChat項目呼聲如此之高。

除了上面提到的成本便宜,還有一點就是極大地降低了大家認知ChatGPT底層原理的門檻。

根據卡神在項目自述文件的描述,整個項目的訓練過程、使用到的技術都和OpenAI訓練ChatGPT的方法基本相同。

那么,這8304行代碼究竟是如何來復刻ChatGPT的?

  • 預訓練階段,使用全新的Rust實現訓練分詞器;
    卡神特別提到,在FineWeb上對TransformerLLM進行預訓練,評估多個指標下的CORE分數;
  • 中期訓練階段,卡神在來自SmolTalk的用戶-助手對話、多項選擇題、工具使用數據上進行中期訓練;
  • 接下來是SFT階段,在世界知識多項選擇題(ARC-E/C、MMLU)、數學(GSM8K)、代碼(HumanEval)上評估聊天模型
  • 然后是訓練的最后一個階段,使用「GRPO」在GSM8K上對模型進行強化學習微調(RL)
  • 推理方面,卡神選擇在帶有KV緩存的引擎中實現高效推理,只需要簡單的prefill/decode,tool-use(在輕量級沙箱中的Python解釋器),通過CLI或類ChatGPT的網頁界面與其交互。
  • 撰寫一份單一的Markdown成績單,總結并將整個過程游戲化。

最后一個酷似ChatGPT的Mini高級應用就躍然眼前了!

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片


為什么可以訓練如此之快?AI老鳥總結卡神的Trick

當然,成本能夠如此之低,自然還是卡神的智慧。在上面各個環節都設計得非常巧妙。

比如你去從文件結構去看,會發現比較有意思的是:有 data loader、data set engine,還有個叫 GPT pi 的東西,看起來挺有趣。還有 muon optimizer,這里還有 distributed muon,細心地網友稱:這估計是給 H100 GPU 用的。

另外,參數部分也挺吸引人。序列長度是 24,層數 12,768 維度,看起來是個中小型模型。因為我自己也在搭模型,所以看到這些配置挺有參考價值。

網友注意到一個trick的細節。他爆料到,一般來說,Karpathy 總喜歡讓數字“好看”——比如用 2 的平方倍數。

但其實這次,上面這些參數都不是嚴格的 2 的平方,但可能能被分解成一些平方的倍數。比如上面的這三個參數:24、12、768,都不是。所以他猜測卡神肯定是發現最后這幾個數字更合適。

“我本來預期 hidden size 會是 148,不知道他為什么選了 768。”

還有,正則方面,卡神沒有采用 Pytorch自帶的 RoPE(旋轉位置編碼),而是采用了自己寫的版本。

實現特別簡潔,簡直是我見過最優雅的代碼。他的思路是把向量一分為二,然后用旋轉矩陣分別處理,再拼接回來。雖然我還沒完全吃透旋轉矩陣的部分,但能看出這是個非常輕量、教學導向的實現。

這還沒完,在 自回歸注意力(causal self-attention) 模塊里,卡神把 query、key、value 的線性層分開實現。其實也可以優化成一次線性變換,然后再分割結果張量,這樣可以減少內存讀寫。

激活函數方面,他使用了一個叫 ReLU2(ReLUSquared) 的激活函數,據說在一些實驗中收斂更快。

卡神還提到了預計算 旋轉嵌入(rotary embeddings) 的技巧:提前把 cos 和 sin 值算好放在 GPU 內存里,因為它們不依賴訓練參數。

在優化器部分,他把參數拆成兩組:embedding 和 LM head 用 AdamW,矩陣參數用 Muon Optimizer。這個優化器是最近新出的,據說在特征學習(feature learning)上表現不錯。

當然,也有一些業界所公認的Trick,比如大框架還是經典的 Transformer 結構:自注意力 + MLP + 殘差。

再比如采用 KV cache,來加速推理。代碼里根據 cache 是否存在分支執行不同邏輯,這點和大多數 LLM 實現類似。

還有,MLP 部分,卡神沒用 Mixture of Experts,理由很合理:MoE 更適合推理階段,而不是研究階段。MLP 更易于理解和調試。

下一步:發展成一個研究工具或基準

卡神在X上表示,項目還沒完工,自己的目標是將完整的“強基線”堆棧整合到一個內聚、精簡、可讀、可修改且最大程度可分叉的倉庫中。

而NanoChat 將成為 LLM101n(仍在開發中)的頂點項目。

我認為它也有潛力發展成為一個研究工具或基準,類似于之前的 nanoGPT。它遠未完成、調整或優化(實際上我認為可能還有不少唾手可得的成果),但我認為它的整體框架已經足夠完善,可以上傳到 GitHub 上,以便所有部分都能得到改進。

寫在最后

當然,這套復刻框架,肯定不能真正意義上直接幫各位得到一個ChatGPT 1:1的復刻版。

因為局限就擺在那里。性能上,如果想要運行流暢度,就可能需要自己上手微調。那這就需要用戶得有點技術背景才能玩轉它。

比如,如果你的 顯存(VRAM) 比較小,就得調整超參數。這對新手來說可能是個門檻。

但小編看來,更多的意義,還是在于,讓“高在天上”的 LLM產品,變得更加評價、可及。

也就是說,卡神的這個項目繼續讓 AI 開發更大眾化了,讓更多人,尤其是算力不夠的學校、學生們能參與、實驗動手了起來。

而這則會進一步帶動AI應用的繁榮。

想一想,如果連大學學生、業余開發者都能低成本訓練模型,也許能催生很多有創意的應用。

因為這個項目是開源的,所有人按照自己需求進行調整、修改,得到自己想要的結果。

使用 nanochat,你幾乎可以調任何東西。無論是換 tokenizer、改訓練數據、調整超參數,還是優化算法,都可以自由嘗試——有很多潛在思路可以探索。

如果你希望訓練更大的模型,也很容易做到。

代碼庫的設計是完全可擴展的:你只需要通過參數 --depth 來改變模型層數,其他相關參數都會自動按比例調整。

這意味著它的“復雜度”只靠這一個滑桿就能控制。

正如一位網友所說,看起來,NanoChat雖然只是小步前進,但它可能引發大波浪。

項目提供了詳細的指導文檔,它還支持把文件打包成可查詢的數據塊,很友好。這一點我挺欣賞——能看出作者是站在用戶角度思考的。沒錯。

現在,大家都能理解Karpathy為什么會被稱之為“卡神”了吧!太牛了!

卡神新項目刷屏!AI老鳥深度解析Karpathy的開發Trick,網友:700塊復刻ChatGPT!終于能親自研究ChatGPT-AI.x社區圖片

寫完這篇稿子一看,哇塞,這個項目已經狂飆到了8.2K星!

參考鏈接:

??https://www.youtube.com/watch?v=EFpDHdsITrg&t=419s??

??https://x.com/karpathy/status/1977755427569111362??

本文轉載自??51CTO技術棧??,作者:云昭

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
视频二区在线| 51自拍视频在线观看| 色av男人的天堂免费在线 | 亚洲精品久久久久久久蜜桃臀| 精品国产免费无码久久久| 精品1区2区3区4区| 中文字幕欧美日韩精品 | 99久久综合国产精品| 国产福利精品视频| 欧美成人黄色网| 一本色道久久综合亚洲精品酒店 | 欧美黄色免费影院| 免费大片黄在线| 99r国产精品| 91精品久久久久久久久久久| 日本少妇性高潮| 久久精品播放| 亚洲欧洲偷拍精品| 又色又爽又黄18网站| 欧美日韩不卡| 偷拍一区二区三区| 四虎影院一区二区| 国产精品免费播放| www.66久久| 91香蕉亚洲精品| 亚洲欧美一二三区| 亚洲人成高清| www亚洲精品| 人妻aⅴ无码一区二区三区| 91精品国产乱码久久久竹菊| 精品视频免费在线| 成人精品小视频| av手机在线观看| 亚洲乱码国产乱码精品精98午夜 | 日本人妖在线| 高清不卡一区二区在线| 国产综合在线观看视频| 爱情岛论坛亚洲品质自拍视频网站| 99精品小视频| 亚洲美女www午夜| 国产伦精品一区二区三区妓女下载| 欧美私密网站| 一区二区三区四区不卡在线 | 一级二级三级欧美| 污视频在线免费观看| 国产大陆a不卡| 国产一区在线播放| 日本精品入口免费视频| 免费视频一区| 欧美亚洲一级片| 日韩免费av片| 99r精品视频| caoporn国产精品免费公开| 中文字幕在线日亚洲9| 午夜在线一区二区| 久久久久中文字幕| 国产极品在线播放| 亚洲精品九九| 国内精品久久久久久| 久久免费视频99| 国产精品激情电影| 久久久免费精品| 黄色激情视频在线观看| 亚洲区欧美区| **欧美日韩vr在线| 91国产丝袜播放在线| 亚洲理论在线| 日本久久中文字幕| 亚洲中文字幕无码爆乳av| 秋霞电影网一区二区| 国产精品久久不能| 国产精品无码天天爽视频| 国产在线精品免费av| 成人av播放| 五月婷婷狠狠干| 国产亚洲一区二区在线观看| 日韩欧美手机在线| 国产在线观看a| 一区二区三区四区乱视频| 免费高清一区二区三区| 一道本视频在线观看| 免费福利在线视频| 国产精品美女久久久久aⅴ| 爱爱爱视频网站| 羞羞网站在线免费观看| 午夜视频在线观看一区| 国产日韩成人内射视频| 亚洲伦理网站| 欧美精品一区二区高清在线观看| 蜜臀av一区二区三区有限公司| 欧洲激情综合| 欧美日本黄视频| 91精品福利在线一区二区三区| 成人h视频在线| 精品美女www爽爽爽视频| 色综合.com| 日韩一区二区不卡| 国产日韩av一区二区| 亚洲深夜福利网站| 久久黄色av网站| 中文字幕一区二区三区人妻在线视频| 欧美黑白配在线| 中文精品99久久国产香蕉| 欧美日韩一级大片| 久久xxxx| 91久久偷偷做嫩草影院| 国产黄色在线播放| 一区二区三区不卡在线观看| 热久久精品国产| 91久久精品无嫩草影院| 亚洲丝袜在线视频| 中文字幕一区二区三区手机版| 免费人成黄页网站在线一区二区| 国产精品国产亚洲精品看不卡15 | 欧美日韩精品电影| 亚洲 欧美 日韩在线| 99久久婷婷这里只有精品| 91国产美女视频| 国产精品高潮呻吟av| 久久亚洲精品小早川怜子| 午夜久久久久久久久久久| 新片速递亚洲合集欧美合集| 精品久久一二三区| 男人在线观看视频| 日韩高清一区二区| 精品欧美国产一区二区三区不卡| 高h视频在线观看| 欧美在线小视频| 欧美大片免费播放器| 夜间精品视频| 成人黄色免费在线观看| 蜜桃视频在线入口www| 亚洲成a人v欧美综合天堂| 亚洲免费成人在线视频| 久久日文中文字幕乱码| 国产ts一区二区| 四虎国产精品永远| 亚洲国产毛片aaaaa无费看| 91论坛在线播放| 国产一区二区三区视频在线观看 | 国产精品福利一区二区| 日日碰狠狠躁久久躁婷婷| 国产精品久av福利在线观看| 久久999免费视频| 这里只有精品999| 国产亚洲精品免费| 少妇性l交大片| 国产一区网站| 国产精品国产亚洲伊人久久| 飘雪影院手机免费高清版在线观看| 亚洲成人免费在线观看| 黄色激情在线观看| 亚洲毛片视频| 国产一区在线观| 国产激情在线播放| 亚洲激情电影中文字幕| 亚洲精品国产精品乱码| caoporm超碰国产精品| 激情伊人五月天| 亚洲国产网址| 日本精品视频网站| 黄色的视频在线免费观看| 在线看日本不卡| 貂蝉被到爽流白浆在线观看| 久久国产三级精品| a级黄色片网站| 一区二区三区国产好| 国内精品久久久久伊人av| 偷拍精品一区二区三区| 欧美视频中文字幕在线| 免费网站在线高清观看| 狠狠色丁香久久婷婷综合_中| av磁力番号网| 懂色av一区二区| 茄子视频成人在线| 丝袜美腿美女被狂躁在线观看| 欧美高清精品3d| 免费视频一二三区| 久久综合av免费| 邪恶网站在线观看| 午夜精品剧场| 久久综合九色欧美狠狠| 久久99久久久精品欧美| 欧美猛交ⅹxxx乱大交视频| 色窝窝无码一区二区三区| 欧美色xxxx| 三级黄色在线观看| 99视频在线观看一区三区| 午夜欧美福利视频| 欧美黄色精品| 奇米视频888战线精品播放| 亚洲男女网站| 91产国在线观看动作片喷水| 91涩漫在线观看| 精品国产乱码久久久久久久| 国产黄网在线观看| 一区二区在线免费观看| 国产ts在线播放| 国产一区二区久久| 久久久久狠狠高潮亚洲精品| 欧美在线免费一级片| 久久精品国产一区二区三区日韩 | 国产精品亚发布| 污污的网站在线看| 女人天堂在线| 国产大陆a不卡| 亚洲国产精品久久久久爰色欲| 欧美大黑bbbbbbbbb在线| 国产精品久久亚洲7777| 51一区二区三区| 国内精品免费午夜毛片| 日韩精品成人av| 亚洲毛片一区二区| 99国产精品99| 在线看不卡av| 日韩毛片一区二区三区| 伊人色综合久久天天| 中文字幕第69页| 2021国产精品久久精品| 国产精品日日摸夜夜爽| 精品在线一区二区三区| 可以免费在线看黄的网站| 1024精品一区二区三区| 看全色黄大色大片| 日韩欧美视频| 欧美日韩一区二区三区在线视频 | 亚洲av毛片成人精品| 日韩一区二区三区电影在线观看| 欧美三级网站在线观看| 欧美日韩激情小视频| 精品少妇一二三区| 亚洲柠檬福利资源导航| 一级黄色片日本| 中文字幕国产一区| 在线视频第一页| 久久久久久日产精品| 香蕉视频免费网站| 国产精品中文字幕日韩精品 | 人人妻人人澡人人爽人人精品 | 国产专区精品| 国产精品无av码在线观看| a国产在线视频| 九色精品美女在线| 伊人春色在线观看| 日日噜噜噜夜夜爽亚洲精品 | 成人av第一页| 牛夜精品久久久久久久| 国产精品亚洲综合久久| www.av片| 国产精品v一区二区三区| 中文字幕日韩精品一区二区| 国内精品久久久久久99蜜桃| 成人精品高清在线| 日本欧美一级片| 羞羞影院体验区| 亚洲综合色自拍一区| 久久久久人妻一区精品色| 国产欧美日韩在线| 国产又粗又猛又爽又黄av| eeuss鲁片一区二区三区在线观看| 精品无码av一区二区三区不卡| 精品一区二区三区在线播放| 日韩av自拍偷拍| 久久99久久久久久久久久久| 国产九九在线观看| 首页综合国产亚洲丝袜| 亚洲乱码中文字幕久久孕妇黑人| 国产日韩亚洲| 欧美牲交a欧美牲交aⅴ免费真| 日韩精品欧美成人高清一区二区| 欧美两根一起进3p做受视频| 久久字幕精品一区| www.色就是色.com| 午夜视频一区| 91成人免费在线观看| 四虎精品永久免费| 国产日韩亚洲欧美| 日本黄色片一级片| 猛男gaygay欧美视频| 国产亚洲欧美一级| 中国美女黄色一级片| 亚洲欧洲av色图| 欧美大片xxxx| 午夜精品久久一牛影视| 国产专区第一页| 在线观看91视频| www.好吊色| 亚洲精品v天堂中文字幕| 深夜福利在线看| 最新国产精品亚洲| 欧美v亚洲v| 日本视频久久久| 日韩精品一区二区三区中文在线| 国产亚洲精品美女久久久m| 欧美猛男男男激情videos| av电影一区二区三区| 日韩视频一区| 538在线视频观看| 精品亚洲国产成人av制服丝袜| 久久精品无码一区二区三区毛片| 成人性视频免费网站| 亚洲天堂美女视频| 中文字幕在线不卡一区| 国产真实乱人偷精品视频| 91黄色在线观看| 免费av一级片| 色哟哟入口国产精品| 超碰在线最新网址| 国产不卡精品视男人的天堂| 波多野结衣欧美| 手机成人在线| 你懂的一区二区| 日本激情综合网| www..com久久爱| 国产传媒视频在线| 欧美日韩国产在线看| 97超碰人人草| 亚洲黄页网在线观看| 丝袜综合欧美| 国产精品视频地址| 盗摄牛牛av影视一区二区| 中文字幕黄色大片| 日日夜夜精品免费视频| 午夜福利123| 国产精品系列在线| 中文字幕视频网| 欧美一区二区福利视频| 日本不卡视频| 国产成人亚洲综合青青| 7777精品| 热这里只有精品| 日本亚洲最大的色成网站www| 久久无码人妻精品一区二区三区| 亚洲三级电影全部在线观看高清| 色老头在线视频| 亚洲欧美国产另类| 超碰在线网站| 亚洲在线观看视频| 中文一区一区三区免费在线观看| 五月婷婷之综合激情| 久久伊99综合婷婷久久伊| 欧美一级视频免费观看| 精品国产一区二区精华| 国产三区在线观看| 91久久久久久久久| 99九九热只有国产精品| 波多野结衣天堂| 欧美高清一级片在线观看| 国产伦精品一区二区三区视频我| 亚洲国产欧美自拍| 碰碰在线视频| 国产精品一 二 三| 一区二区不卡| 免费在线观看日韩av| 一区二区三区 在线观看视频 | 一区二区三区视频播放| 亚洲小视频在线播放| 国产一区欧美二区| 欧美日韩在线视频免费| 日韩午夜av电影| 黄网页在线观看| 91精品网站| 国产一区日韩欧美| 成人性生活免费看| 欧洲激情视频| 久久精品国产精品亚洲| 欧美一区=区三区| 亚洲精美视频| 精品一区二区三区的国产在线播放 | 成人国产一区二区| 影音先锋日韩资源| 女尊高h男高潮呻吟| 色妞www精品视频| 国产二区在线播放| 亚洲影院色无极综合| 亚洲成色精品| 最近中文字幕无免费| 欧美性猛交xxxx乱大交3| 国内av一区二区三区| 亚洲永久免费观看| 亚洲精选久久| 在线观看福利片| 在线观看区一区二| 黄网站在线免费| 国产91精品入口17c| 久久久久久夜| 久久视频一区二区三区| 亚洲高清久久网| 全亚洲第一av番号网站| 中文字幕人成一区| 99久久精品国产麻豆演员表| 久久精品视频2| 中文字幕日韩高清| 91精品啪在线观看国产手机| jizzjizzxxxx| 亚洲精品国产一区二区精华液| 手机在线不卡av| 奇米成人av国产一区二区三区| 国产精品久久久久9999赢消| 日本50路肥熟bbw|