精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Karpathy離職OpenAI,首發2小時AI大課!從頭開始構建GPT分詞器

人工智能 新聞
果不其然,繼放出BPE的GitHub代碼后,Karpathy終于上線了「從頭構建GPT分詞器」的課程,引來大波網友關注。

離職OpenAI的技術大神karpathy,終于上線了2小時的AI大課。

——「讓我們構建GPT Tokenizer(分詞器)」。

圖片

其實,早在新課推出兩天前,karpathy在更新的GitHub項目中,就預告了這件事。

圖片

這個項目是minbpe——專為LLM分詞中常用的BPE(字節對編碼)算法創建最少、干凈以及教育性的代碼。

目前,GitHub已經狂攬6.1k星,442個fork。

圖片項目地址:https://github.com/karpathy/minbpe

網友:2小時課程含金量,相當于大學4年

不得不說,karpathy新課發布依然吸引了業內一大波學者的關注。

他總是可以把相當復雜的LLM概念,用非常好理解的方式講出來。

有網友直接取消了晚上的約會,去上課了。

圖片

與karpathy的約會之夜。

AI機器學習研究員Sebastian Raschka表示,「我喜歡從頭開始的實現,我真的很期待看到這個視頻」!

圖片

英偉達高級科學家Jim Fan表示,「Andrej的大腦是一個大模型,它能將復雜的事物標記化為簡單的token,讓我們小型思維語言模型可以理解。

圖片

還有UCSC的助理教授Xin Eric Wang表示,「就個人而言,我非常欣賞他多年前發表的關于RL的文章:http://karpathy.github.io/2016/05/31/rl/,這篇文章幫助我進入了RL領域」。

圖片

還有人直言這兩個小時課程的含金量,堪比4年制大學學位。

圖片

「Andrej是最好的AI老師」。

圖片

為什么是分詞器?

為什么要講分詞器?以及分詞器為什么這么重要?

正如karpathy所言,分詞器(Tokenizer)是大模型pipeline中一個完全獨立的階段。

它們有自己的訓練集、算法(字節對編碼BPE),并在訓練后實現兩個功能:從字符串編碼到token,以及從token解碼回字符串。

圖片

另外,大模型中許多怪異行為和問題,其實都可以追溯到分詞器。

就比如:

- 為什么LLM拼不出單詞?

- 為什么LLM無法完成超級簡單的字符串處理任務,比如反轉字符串?

- 為什么LLM不擅長非英語語言方面的任務?

- 為什么LLM不擅長簡單算術?

- 為什么GPT-2在用Python編碼時遇到了超出必要的麻煩?

- 為什么LLM在看到字符串<lendoftextl>時突然停止?

- 為什么大模型實際上并不是端到端的語言建模

......

圖片

視頻中,他將討論許多這樣的問題。討論為什么分詞器是錯誤的,以及為什么有人理想地找到一種方法來完全刪除這個階段。

兩小時大課走起

在本講座中,他將從頭開始構建OpenAI GPT系列中使用的Tokenizer。

根據YouTube課程章節介紹,一共有20多個part。

其中包括引言介紹、字節對編碼 (BPE) 算法演練、分詞器/LLM 圖:這是一個完全獨立的階段、minbpe練習時間!編寫自己的GPT-4分詞器等等。

從講解到習題演練貫穿了全部課程。

以下是從演講內容中總結的部分要點。

在視頻結尾,Karpathy重新回顧了LLM分詞器帶來的怪異問題。

首先,為什么LLM又時拼不正確詞,或者做不了其他與拼寫相關的任務?

從根本上說,這是因為我們看到這些字符被分割成了一個個token,其中有些token實際上相當長。

因此,我懷疑這個單個token中塞進了太多的字符,而且我懷疑該模型在與拼寫這個單個token相關的任務方面應該不是很擅長。

當然,我的提示是故意這樣做的,你可以看到默認風格將是一個單一的token,所以這就是模型所看到的。

事實上,分詞器不知道有多少個字母。

那么,為什么大模型在非英語任務中的表現更差?

這不僅是因為LLM在訓練模型參數時,看到的非英語數據較少,還因為分詞器沒有在非英語數據上得到充分的訓練。

就比如,這里「hello how are you」是5個token,而它的翻譯是15個token,相當與原始的3倍大。

「?????」在韓語中代表著「你好」,但最終只有3個token。

事實上,我對此感到有點驚訝,因為這是一個非常常見的短語,只是典型的問候語,如你好,最終是三個token。

而英語中的「你好」是一個單一的token。這是我認為LLM在非英語任務中表現差的原因之一便是分詞器。

另外,為什么LLM會在簡單的算術上栽跟頭,也是與數字的token有關。

比如一個類似于字符級別的算法來進行加法,我們先會把一加起來,然后把十加起來,再把百加起來。

你必須參考這些數字的特定部分,但這些數字的表示完全是任意的,主要是基于在分詞過程中發生的合并或不合并。

你可以看看,它是一個單一的token,還是2個token,即1-3、2-2、3-1的組合。

因此,所有不同的數字,都是不同的組合。

不幸的是,有時我們會看到所有四位數字的四個token,有時是三個,有時是兩個,有時是一個,而且是以任意的方式。

但這也并不理想。

所以這就是為什么我們會看到,比如說,當訓練Llama 2算法時,作者使用句子片段時,他們會確保把所有的數字都分割開來,作為Llama 2的一個例子,這部分是為了提高簡單算術的性能。

最后,為什么GPT-2在Python中的表現不佳,一部分是關于架構、數據集和模型強度方面的建模問題。

但也有部分原因是分詞器的問題,可以在Python的簡單示例中看到,分詞器處理空格的編碼效率非常糟糕。

每個空格都是一個單獨的token,這大大降低了模型可以處理交叉的上下文長度,所以這幾乎是GPT-2分詞的錯誤,后來在GPT-4中得到了修復。

圖片

課后習題

在課程下方,karpathy還給在線的網友們布置了課后習題。

快來打卡吧。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-02-26 00:40:00

AIGPT

2024-06-12 13:27:58

2024-02-22 07:29:31

OpenAIKarpathy分詞器

2024-03-01 13:49:00

數據訓練

2024-02-21 14:07:00

2013-01-08 11:02:26

IBMdW

2023-08-11 17:30:54

決策樹機器學習算法

2013-05-23 10:10:53

PHP5.5PHP編譯php

2022-11-14 10:49:33

Linux發行版

2024-09-26 16:51:23

2022-07-22 07:18:53

代碼DeepMind

2009-05-08 09:40:07

網易魔獸暴雪

2020-11-17 08:09:01

webpack配置項腳手架

2022-11-23 16:20:12

GPU編程流和事件開發

2021-06-04 22:43:32

Python本地搜索

2023-05-24 16:20:39

DevOpsCI/CD 管道軟件開發

2022-06-01 23:21:34

Python回歸樹數據

2025-01-13 08:00:00

2021-02-20 21:29:40

GitHub代碼開發者

2024-06-24 07:50:00

代碼機器學習
點贊
收藏

51CTO技術棧公眾號

黄色一级片一级片| 国产97色在线 | 日韩| 男人天堂av网| 欧美资源在线| 夜夜嗨av色综合久久久综合网 | 日韩亚洲欧美中文字幕| 奇米一区二区| 欧美性猛交xxxx乱大交蜜桃 | 美女又爽又黄免费| 亚洲校园激情春色| 中文字幕亚洲精品在线观看| 99免费在线视频观看| 日本三级小视频| 99久久综合| 亚洲精品美女在线观看| 亚洲娇小娇小娇小| 超免费在线视频| 中文字幕精品一区二区精品绿巨人| 91久久精品国产91久久性色tv | 九一在线免费观看| 成人av动漫| 91精品国产91久久综合桃花| 国产av无码专区亚洲精品| 黄色免费在线看| 久久精品欧美日韩| 国产精品免费区二区三区观看| 极品国产91在线网站| 欧美激情无毛| 久久精品2019中文字幕| 在哪里可以看毛片| 99久久人爽人人添人人澡| 欧美日本乱大交xxxxx| 青青草原av在线播放| free性欧美hd另类精品| 亚洲国产精品成人综合色在线婷婷| 97自拍视频| 国产精品爽爽久久| 日韩精品一级二级| 欧美高清自拍一区| 国产精品视频一区二区在线观看| 欧美精品国产白浆久久久久| 日韩精品自拍偷拍| 中文字幕 日韩 欧美| 亚洲成av在线| 疯狂做受xxxx欧美肥白少妇| 国产免费一区二区视频| www.在线视频| 中文字幕一区二区三区在线播放| 日本一区二区久久精品| 天堂av在线资源| 国产精品欧美一区二区三区不卡| 欧美色视频日本高清在线观看| 精品丰满人妻无套内射| 91福利国产在线观看菠萝蜜| 最新热久久免费视频| 色一情一乱一伦一区二区三欧美| 人成在线免费视频| 91麻豆.com| 久久国产精品免费一区| 无码国产精品高潮久久99| 不卡在线观看av| 国产免费一区| 天天操天天射天天舔| www.欧美.com| 久久99精品久久久久久久久久| 亚洲精品一区二区三区蜜桃| 国产成人啪免费观看软件| 91精品免费久久久久久久久| 97超碰人人草| 国产精品1区2区3区在线观看| 999国产在线| 国产 欧美 精品| 不卡大黄网站免费看| 狠狠色噜噜狠狠狠狠色吗综合| 天天干天天操av| 91老师片黄在线观看| 日本福利一区二区三区| 永久免费在线观看视频| 亚洲伦在线观看| 成人在线视频一区二区三区| 2021天堂中文幕一二区在线观| 午夜精品视频在线观看| 欧美牲交a欧美牲交aⅴ免费下载| 亚洲精品国产嫩草在线观看| 欧美精品高清视频| 免费观看污网站| 亚洲aa在线| 色噜噜国产精品视频一区二区| 伊人在线视频观看| 亚洲激情综合| 国产精品扒开腿做爽爽爽的视频| 亚洲无码精品在线播放| 国产精品亚洲成人| 久久久亚洲综合网站| 日韩美女网站| 亚洲成人你懂的| 午夜视频在线瓜伦| 日韩激情精品| 亚洲欧洲日本专区| 永久免费看黄网站| 久久免费高清| 97视频热人人精品| 国产中文在线观看| 亚洲男女一区二区三区| 北条麻妃69av| 日本成人精品| 亚洲网站视频福利| 久久综合成人网| 日本aⅴ亚洲精品中文乱码| 99电影网电视剧在线观看| 国产女主播在线写真| 亚洲精品美国一| 鲁一鲁一鲁一鲁一av| av毛片精品| 日韩视频免费在线观看| wwwxxx亚洲| 国产成人欧美日韩在线电影| 偷拍视频一区二区| 91九色在线播放| 欧美一区二区三区在线视频| 好吊视频在线观看| 好看的日韩av电影| 美日韩在线视频| www.com亚洲| 成人免费观看视频| 国产人妻互换一区二区| h1515四虎成人| 精品国产免费人成电影在线观看四季| 成人午夜免费影院| 久久婷婷麻豆| 女同一区二区| 春色校园综合激情亚洲| 日韩免费视频一区| 99成人在线观看| 免费人成网站在线观看欧美高清| 精品伦精品一区二区三区视频| a级网站在线播放| 欧美精品黑人性xxxx| 美女100%露胸无遮挡| 欧美一级二区| 欧美二级三级| 中文字幕乱码在线播放| 亚洲国产精品99久久| 久久艹精品视频| 国产一区在线观看麻豆| 一区二区国产日产| 欧美激情三区| 中日韩美女免费视频网站在线观看 | 欧美日韩在线看片| 一本色道久久综合狠狠躁的推荐| 男人的天堂免费| 久久中文字幕av一区二区不卡| 日韩av高清不卡| 九一国产在线| 午夜精品aaa| 女性生殖扒开酷刑vk| 欧美高清一区| 成人精品视频久久久久 | 一区二区亚洲欧洲国产日韩| 国产在线观看黄色| 99久久精品国产麻豆演员表| 女同性恋一区二区| 日本免费精品| 久久99精品久久久久久噜噜| 国产区精品在线| 成人免费在线观看入口| 一级黄色录像在线观看| 91精品啪在线观看国产81旧版| 国产精品一区二区性色av| 国产福利电影在线| 在线观看成人免费视频| 91l九色lporny| 在线亚洲成人| 九九99久久| 黄视频网站在线观看| 亚洲国产精品va在线| 一级片中文字幕| 99精品视频一区二区| 欧美一区二区三区爽大粗免费| 天天躁日日躁狠狠躁欧美巨大小说| 欧美亚洲成人网| 亚洲人午夜射精精品日韩| 欧美日韩精品在线观看| 日韩乱码人妻无码中文字幕久久| 久久美女性网| 吴梦梦av在线| 久久国产精品免费精品3p| 国产91精品久久久久久| 欧美黄色小说| 欧美人狂配大交3d怪物一区| 欧美精品乱码视频一二专区| 97精品超碰一区二区三区| 成人精品小视频| 欧美久久综合网| 成人久久久久久| 九色91在线| 亚洲精品国产成人| 亚洲国产成人无码av在线| 亚洲国产成人一区二区三区| 亚洲午夜精品一区| 亚洲激情二区| 日韩欧美在线一区二区| 国产精品视频首页| 国内精品小视频在线观看| 青青操视频在线| 欧美卡1卡2卡| 久久久蜜桃一区二区| 亚洲欧美一区二区在线观看| 亚洲av无码一区东京热久久| 日韩专区在线视频| www.18av.com| 色777狠狠狠综合伊人| 91文字幕巨乱亚洲香蕉| 深夜成人福利| 欧美国产第二页| 日本三级视频在线播放| 日韩激情第一页| 国产美女www爽爽爽视频| 激情懂色av一区av二区av| 白白色免费视频| 国产91富婆露脸刺激对白 | 久久成人av少妇免费| 99热自拍偷拍| 中文无码久久精品| 日本一区二区三区免费观看| 欧洲美女精品免费观看视频| 秋霞午夜一区二区| 欧美1234区| www.精品av.com| 国产在线中文字幕| 亚洲精品国产精品久久清纯直播 | 在线电影一区二区三区| 在线观看国产亚洲| 亚洲欧洲精品一区二区三区| 国产真实乱人偷精品人妻| 国产ts人妖一区二区| 在线观看免费成人av| 久久久久国产精品一区二区| 日韩中文在线字幕| 日韩精品欧美| 欧美日韩高清在线一区| 免费萌白酱国产一区二区三区| 国产主播喷水一区二区| 日韩毛片网站| 国产精品久久一区| 精品国产第一福利网站| 性欧美xxxx视频在线观看| 超碰在线caoporen| 中文字幕久热精品视频在线| 欧美女同网站| 亚洲免费电影一区| 天堂网2014av| 日韩电影中文字幕在线观看| 精品人妻一区二区三区三区四区| 欧美日韩在线观看一区二区 | 91精品人妻一区二区三区四区| 久久99国产精品免费网站| 中文字幕av专区| 免费的国产精品| 国产一级做a爰片久久| 日韩av一区二区三区四区| 久久综合色视频| 亚洲一区二区三区高清| 大肉大捧一进一出好爽视频| 在线亚洲一区| 欧美a在线视频| 日韩国产精品大片| 特级丰满少妇一级| 美女视频黄a大片欧美| 一路向西2在线观看| 国精产品一区一区三区mba视频| 国产成人美女视频| 国产米奇在线777精品观看| 国产传媒免费观看| 久久66热re国产| 91人人澡人人爽| 成人免费观看男女羞羞视频| www.超碰97| 99视频一区二区三区| 国产人妻一区二区| 中文字幕精品综合| 黄色录像免费观看| 亚洲一区在线电影| 黄色污污网站在线观看| 色999日韩国产欧美一区二区| 天堂av免费在线观看| 欧美日韩日本视频| 免费观看黄色一级视频| 亚洲第一综合天堂另类专 | 中国日韩欧美久久久久久久久| 老司机99精品99| 国语自产偷拍精品视频偷 | 欧美日韩xxxx| 偷拍盗摄高潮叫床对白清晰| 欧美视频成人| 欧美日韩中文在线视频| 狠狠久久亚洲欧美| 国产av一区二区三区传媒| 91麻豆国产自产在线观看| 一级黄色毛毛片| 亚洲视频 欧洲视频| 欧美三日本三级少妇99| 在线视频欧美精品| 国产人妖在线播放| 精品久久一二三区| 亚洲成人77777| 亚洲人成五月天| 粗大黑人巨茎大战欧美成人| 91av在线看| 欧美美女被草| 麻豆成人av| 国模吧视频一区| 91av俱乐部| 成人午夜又粗又硬又大| 日韩av片在线| 精品久久久久久国产91| 亚洲一区二区人妻| 欧美精品一区二区三区蜜臀 | 成人看片黄a免费看视频| 日韩久久在线| 亚洲精品男同| 佐山爱在线视频| 久久精品一区二区三区不卡 | 一区二区三区在线视频播放| 中文精品久久久久人妻不卡| 欧美精品一区二区久久久| 日本中文字幕在线视频| 欧美亚洲激情视频| 国产精品xxx在线观看| 中文字幕制服丝袜在线| 久久午夜激情| 男生和女生一起差差差视频| 国产精品国产成人国产三级| 特黄视频免费看| 亚洲精品一区二区三区精华液 | 另类小说一区二区三区| 亚洲国产精品成人综合久久久| 最近日韩中文字幕| 一级片在线观看免费| 精品夜色国产国偷在线| 性欧美videoshd高清| 国产欧美日韩中文| 精品国产一区二区三区成人影院 | 宅男噜噜噜66一区二区| 欧美性猛交乱大交| 1024成人网色www| 在线观看国产小视频| 亚洲国产精品99| 成人av福利| 国产欧美一区二区三区四区| av一区二区高清| 国产精品无码专区av在线播放 | 欧美无砖砖区免费| 天天干,天天操,天天射| 91精品国产91久久久久久最新| 136国产福利精品导航网址应用| 最新欧美日韩亚洲| 精品一区二区三区影院在线午夜| 中字幕一区二区三区乱码 | 97超碰人人模人人人爽人人爱| 日韩一区av在线| 91麻豆精品国产综合久久久| 亚洲一区二区三区在线观看视频| 美女在线视频一区| 欧美黑人猛猛猛| 日韩欧美自拍偷拍| 日韩另类在线| 麻豆亚洲一区| 肉肉av福利一精品导航| 性欧美一区二区| 欧美日韩精品一区二区三区蜜桃 | 亚洲精品网址在线观看| 日韩av中字| 日韩伦理一区二区三区av在线| 久久www成人_看片免费不卡| 制服丝袜第二页| 一本到不卡精品视频在线观看| 精品影院一区| 国产精品一区二区三区免费视频| 欧美va天堂在线| 日韩综合第一页| 欧美性猛交xxxx黑人| 岛国在线视频免费看| 国产精品专区一| 中文字幕一区二区三区欧美日韩| 中国极品少妇xxxx| 日本韩国一区二区三区视频| av网站无病毒在线| 国产精品v欧美精品v日韩| 国产欧美不卡| 一级特黄曰皮片视频| 欧美美女视频在线观看| 丰满的护士2在线观看高清| 久久精品国产美女| 日韩国产欧美在线视频| 久久婷婷国产麻豆91| 日韩精品在线第一页| 九七电影院97理论片久久tvb| 国产 欧美 日韩 一区| 久久久精品天堂|