精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Karpathy后悔了:2015年就看到了語言模型的潛力,卻搞了多年強化學習

人工智能 新聞
讓我們看看 Karpathy 那篇預言了如今大模型時代的文章,說了些什么。

「這是有史以來最大、最令人困惑的研究生涯錯誤,」Andrej Karpathy 感嘆道。

上個周末,OpenAI 創始成員、研究科學家、原特斯拉前 AI 高級總監、AI 領域的大神 Andrej Karpathy 一直在后悔。后悔自己沒有早點帶領 OpenAI 開創大模型時代。

圖片

是怎么一回事?看起來 Karpathy 認為當年早已認識到自回歸語言模型的強大潛力,但卻在很長一段時間里「誤入歧途」,隨大溜一起搞強化學習。

圖片

2013 年的 Atari RL 論文被認為是深度強化學習的開山之作:一個通用學習算法就發現了 Breakout 和許多其他游戲的最佳策略,看起來,在很多任務上我們只需要對其進行足夠的改進和擴展,就可以構建出強大的 AI 模型了。

圖片

我們也還記得,在 Karpathy 跳槽去到特斯拉一年后,2018 年 OpenAI 推出了 OpenAI Five,利用強化學習的方法在 Dota 2 游戲上開始與職業選手過招。

在 2019 年,OpenAI 的研究者還訓練神經網絡,利用一只類人機械手來玩魔方,表明強化學習工具不僅僅可以處理虛擬任務,而且還能夠解決需要高度靈活性的真實世界問題。

圖片

這個時候 OpenAI 在另一邊已經推出「迄今為止最大模型」GPT-2 了,強化學習的盛世,似乎很快就被后來興起的大語言模型(LLM)所覆蓋。

Karpathy 還提到:「Yann LeCun 當時就不太看好強化學習,他一遍又一遍地談論『蛋糕』,而強化學習(RL)只是蛋糕頂部最后一顆櫻桃,表征學習是蛋糕主體,監督學習是錦上添花。至少在今天看來,他在概念上是完全正確的(預訓練 = 蛋糕主體,監督微調(SFT)= 糖衣,RLHF = 櫻桃,即基本的 ChatGPT 訓練 pipeline)。這很有趣,因為今天他仍然不太看好 LLM。」

圖片

說了這么多,如今已是「事后諸葛亮」了,當初明明看好卻沒把握住,看起來比當初根本沒想過這回事還讓人懊惱。

讓我們看看 Karpathy 那篇預言了如今大模型時代的文章,說了些什么。

Andrej Karpathy 當初是怎么看好的

其實關于 RNN,Karpathy 早在 15 年就已經注意到了。為此他還專門寫了一篇名為《RNN 的不合理有效性》  文章。

文章深入探討了循環神經網絡(RNN)的潛力與實際應用。文中提到了幾個實驗示例,包括使用 RNN 來生成類似莎士比亞作品的文本,以及模擬編程代碼和數學公式的生成。 

Karpathy 用簡單易懂的語言介紹了 RNN。RNN 是一種能夠處理序列數據的神經網絡,它通過其循環連接能夠記住之前的信息,這對于時間序列數據或任何序列數據的處理尤為關鍵。 

Karpathy 描述了使用 RNN 進行圖像描述任務的初次嘗試,并分享了這一過程中的神奇體驗。他回憶稱,在使用 RNN 進行訓練后不久,即使是隨意選擇的超參數配置下,他的模型開始生成看起來非常不錯的圖像描述,這些描述接近于有意義。這種簡單模型與所獲得的結果質量之間的比例,有時會遠遠超出預期,這讓人感到驚訝。

當時的普遍看法認為 RNN 難以訓練,但 Karpathy 后來的經驗卻讓他得出了相反的結論。隨著時間的推移,Karpathy 頻繁地訓練 RNN,并多次見證了它們的強大和穩健,盡管如此,這些網絡產生的有趣輸出仍然讓他感到新奇和有趣。

關于如何利用 RNN 逐字符生成文本的介紹,引發了對「這怎么可能?」這一問題的思考。 

事實上,眾所周知,RNN 是圖靈完備的,因為它們可以模擬任意程序(具有適當的權重)。但與神經網絡的通用近似定理類似,你不應該對此進行過多的解讀。

如果訓練普通神經網絡是對函數的優化,那么訓練循環網絡就是對程序的優化。

接下來,Karpathy 在博客中講解了 RNN 的基本工作原理,并通過一個具體的字符級語言模型應用來說明其實際操作過程。 

具體而言,Karpathy 為 RNN 提供一大段文本,并要求它根據前面的字符序列對序列中下一個字符的概率分布進行建模。這樣,就可以一次一個字符地生成新文本。

假設詞匯表為 hello, 這段訓練數據可以被拆分為 4 個獨立的訓練樣本: 

  • 基于 h 預測 e 的概率應該較高。
  • 基于 he 預測 l 的概率應該較高。
  • 基于 hel 預測 l 的概率應該較高。
  • 基于 hell 預測 o 的概率應該較高。

每個字符會被編碼為一個向量,采用 1-of-k 編碼,即向量中只有一個位置為 1,其余位置為 0,然后使用 step 函數將它們逐個輸入到 RNN。接著會觀察到一個 4 維輸出向量序列(每個字符一維),并將其解釋為 RNN 當前分配給序列中下一個字符的置信度。

圖片

接下來可以看到 RNN 的訓練過程及其背后的邏輯:

在第一個 step 中,RNN 看到字符 h 后,預測下一個字符的概率分布如下:

  • h 的置信度為 1.0
  • e 的置信度為 2.2
  • l 的置信度為 - 3.0
  • o 的置信度為 4.1

但根據訓練數據 hello,正確的下一個字符應該是 e。因此,需要提高 e 的置信度(綠色表示),同時降低其他字符的置信度(紅色表示)。

在這過程中,每個 step 都有一個期望的目標字符。目標是讓網絡對正確字符的置信度更高,而對錯誤字符的置信度更低。因此需要反向傳播算法計算每個權重的梯度。

根據梯度調整 RNN 的權重(參數),讓正確字符的置信度提高(例如 e 的置信度從 2.2 提高到 2.3)。錯誤字符的置信度則會相應降低。

這一過程會重復多次,直到模型收斂。收斂后,RNN 的預測會與訓練數據更加一致,即每一步都能夠正確預測下一個字符。 

為了進一步說明,出于教學目的,Karpathy 還用 Python/numpy 編寫了一個最小的字符級 RNN 語言模型。代碼大約只有 100 行。感興趣的讀者可以參考:

  • 項目鏈接:https://gist.github.com/karpathy/d4dee566867f8291f086

更進一步的,Karpathy 在這篇博客中還列舉了 5 個其他示例展示。所有示例字符模型都是在 Github 上發布的代碼進行訓練的。

  • 項目鏈接:https://github.com/karpathy/char-rnn

我們以「莎士比亞」這個示例為例。

Karpathy 希望探索 RNN 是否能夠學習并生成具有更多結構和風格的文本內容。為此,他下載了莎士比亞的所有作品,并將它們合并成一個 4.4MB 的文件,用作訓練數據。

圖片

接著,Karpathy 使用了一個包含 3 層 RNN 的模型,每層有 512 個隱藏節點,訓練這個模型耗費了數小時。最后,模型生成了一些文本樣本,包括角色名字和內容對話,有時還能生成較長的獨白片段。

圖片

不過,從結果來看,盡管生成的文本看起來像莎士比亞的作品,但仍有一定的差異。Karpathy 認為這些生成結果表現出了模型的能力和局限性,同時也展現了 RNN 在字符級語言建模上的潛力。

Karpathy 還列舉了如何生成嬰兒名字這種有趣的示例,感興趣的讀者可以參考原博客了解更多內容。

隨后的故事我們都知道了,2017 年谷歌發布了 Transformer 論文,提出了自注意力機制。在這個基礎上,人們逐步探索出大模型的 Scaling Laws,將 AI 技術向通用化快速延伸,直到今天。

既然連 Andrej Karpathy 這樣的 AI 大佬也在研究方向上「走過彎路」,我們是不是也該回看一下過去?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-08-16 10:12:57

C編程風格

2020-09-20 17:50:38

編程語言PythonJava

2024-07-29 08:47:00

2017-06-14 18:04:10

2017-06-15 08:52:36

數據分析可視化軟件開發

2013-07-15 10:25:27

2023-04-06 16:29:18

模型AI

2025-07-14 09:26:45

2025-11-10 08:46:00

AI模型訓練

2025-09-05 09:04:00

2022-12-26 00:00:02

數據驅動業務

2024-12-09 08:45:00

模型AI

2024-08-09 14:51:00

2024-10-21 16:13:07

2024-03-07 09:40:37

2021-06-28 13:20:15

谷歌AI芯片

2024-01-26 08:31:49

2018-10-31 12:39:39

區塊鏈電子證據安全

2022-12-07 13:39:51

蘋果造車

2010-08-19 15:48:06

DB2 diag.lo
點贊
收藏

51CTO技術棧公眾號

激情一区二区三区| 九九热这里只有在线精品视| 日本久久久久久久久久久久| 18免费在线视频| 国产最新精品免费| 国内精品久久久久久| 久久午夜福利电影| 国产精品一区二区三区av| 亚洲大片免费看| 色阁综合av| 黄色美女一级片| 日本aⅴ亚洲精品中文乱码| 麻豆乱码国产一区二区三区| 亚洲一区二区在线免费| 欧美午夜三级| 欧美日韩国产专区| 日韩国产精品毛片| 三级av在线| 国产在线国偷精品免费看| 国内成人精品视频| 九九精品视频免费| 蜜臀91精品国产高清在线观看| 欧美电影影音先锋| 777久久久精品一区二区三区| 国产二区三区在线| 久久综合九色综合欧美98| 91欧美精品午夜性色福利在线 | 欧美大奶一区二区| 在线综合视频播放| 无码少妇一区二区三区芒果| 日韩伦理电影网站| 最新欧美精品一区二区三区| 欧美日产一区二区三区在线观看| 成人久久久精品国产乱码一区二区 | 中文字幕日韩欧美| 无码人妻aⅴ一区二区三区| www.久久99| 欧美视频自拍偷拍| 四虎永久在线精品无码视频| zzzwww在线看片免费| 日韩毛片视频在线看| 先锋影音欧美| 高清av在线| 久久嫩草精品久久久久| 九色视频成人porny| 精品人妻一区二区三区麻豆91| 久久99精品国产麻豆婷婷| 国产精品成人一区| 欧美精品一二三四区| 国产伦理一区| 欧美在线视频a| 97久久久久久久| 国产精品普通话对白| 午夜精品蜜臀一区二区三区免费| 久久婷婷国产麻豆91| 欧美一区91| 欧美精品在线第一页| a级片在线观看免费| 亚洲深深色噜噜狠狠爱网站| 久久在精品线影院精品国产| 欧美h片在线观看| 小小影院久久| 欧美大片在线看免费观看| 日韩a级片在线观看| 在线中文字幕第一区| 免费成人高清视频| 青青草原在线免费观看视频| 精品动漫av| 51精品在线观看| 中文字幕在线播| 青青草97国产精品免费观看 | 中日韩免视频上线全都免费| 精品无码久久久久久国产| 中文人妻一区二区三区| 精品国产乱码久久久| 伊人久久免费视频| 国产午夜精品理论片在线| 欧美va天堂在线| 国语自产精品视频在线看一大j8 | 久久综合九色欧美狠狠| 黄色小视频在线免费观看| 国产色爱av资源综合区| 香蕉精品视频在线| ririsao久久精品一区| 欧美午夜视频一区二区| 污污网站免费看| 日本亚洲视频| 国产婷婷成人久久av免费高清| 精品亚洲aⅴ无码一区二区三区| 欧美超碰在线| 高清欧美性猛交| 日韩电影在线观看一区二区| 韩国三级电影一区二区| 国产亚洲福利社区| av资源在线观看免费高清| 亚洲精品国产a| 欧美精品99久久| 中文字幕日本一区| 亚洲精品国产精品乱码不99按摩| 国产农村妇女精品一区| 欧美1区3d| 国产精品第10页| 午夜免费福利视频| 久久女同互慰一区二区三区| 加勒比海盗1在线观看免费国语版| 国内高清免费在线视频| 欧美在线色视频| 午夜性福利视频| 欧美日韩国产传媒| 久久久免费电影| 中文字幕一二区| 91色婷婷久久久久合中文| 一区二区三区av在线| 色呦呦网站在线观看| 欧美亚洲愉拍一区二区| 日韩www视频| 一本一本久久a久久综合精品| 欧洲亚洲免费视频| 成人午夜福利视频| 1区2区3区国产精品| 日本精品久久久久中文字幕| 一区三区自拍| 久久精品国产96久久久香蕉| 精品无码一区二区三区的天堂| 懂色av一区二区夜夜嗨| 性欧美18一19内谢| 精品日本视频| 日韩精品免费在线播放| 国产亚洲欧美精品久久久www| 免费视频一区二区| 欧美久久久久久| 2020国产在线| 日韩免费看网站| 日本黄色片免费观看| 蜜乳av一区二区| 日本一区二区三区四区高清视频| 爱啪视频在线观看视频免费| 日韩三级电影网址| 婷婷久久综合网| 九九九久久久精品| 亚洲午夜精品一区二区三区| 国产一区一一区高清不卡| 日韩精品视频在线观看网址| 日本熟妇一区二区| 成人激情免费网站| 欧美视频免费看欧美视频| 一区二区三区视频播放| 欧美日韩福利在线观看| 国产特黄一级片| ㊣最新国产の精品bt伙计久久| 蜜臀av免费观看| 欧美在线色图| 国产欧洲精品视频| 一级毛片视频在线| 欧美群妇大交群的观看方式| 中文字幕观看av| 国产在线精品一区二区| av动漫在线播放| 超碰地址久久| 91成人国产在线观看| 日本福利片高清在线观看| 日韩欧美999| 国产18无套直看片| 精品制服美女丁香| 欧美日韩中文字幕在线播放| 91精品尤物| 欧美一二三视频| 国产女主播在线写真| 欧美日韩一级视频| 人妻少妇精品一区二区三区| 成人一二三区视频| 国产在线观看福利| 成人3d动漫在线观看| 国产精品午夜视频| 午夜羞羞小视频在线观看| 欧美va亚洲va香蕉在线| 亚洲精品1区2区3区| 99久久婷婷国产综合精品电影 | 亚洲精品国产综合区久久久久久久| 国产午夜福利一区二区| 2021国产精品久久精品| 992kp快乐看片永久免费网址| 日韩理论片av| 99视频免费观看| 欧美日韩大片| 久久久精品欧美| 亚洲男人第一天堂| 色综合久久久久综合99| 国产美女福利视频| 成人在线综合网站| 欧美一级黄色影院| 亚洲色图欧美| 欧美亚洲爱爱另类综合| 91精品一久久香蕉国产线看观看| 久久久久久69| 国产69精品久久app免费版| 欧美一区二区在线播放| 草久视频在线观看| 亚洲视频网在线直播| 亚洲第一黄色网址| 久久国产精品99精品国产 | 色欲一区二区三区精品a片| 波多野结衣中文字幕一区| 国产野外作爱视频播放| 激情综合网址| 一区二区三区的久久的视频| 欧美1区2区3区4区| 成人激情春色网| 天堂8中文在线最新版在线| 久久精品亚洲94久久精品| 日韩欧美亚洲系列| 4hu四虎永久在线影院成人| 全部毛片永久免费看| 亚洲欧美日韩电影| 国产jk精品白丝av在线观看| 成人免费视频caoporn| 日韩一级理论片| 亚洲青涩在线| 国产在线拍揄自揄拍无码| 欧美日韩国产传媒| 久久婷婷人人澡人人喊人人爽| 国产精品毛片无码| 国产精品精品视频一区二区三区| 678在线观看视频| 精品国产一区二区三区在线观看| 九色视频成人自拍| 欧美精品一区二区不卡| 国产精品视频一区二区三区,| 91成人看片片| 亚洲图片在线视频| 亚洲va国产天堂va久久en| 9999热视频| 国产精品久久久久影院老司| 亚洲精品乱码久久久久久久久久久久 | 色琪琪久久se色| 欧美一区亚洲二区| 亚洲电影男人天堂| 国产在线欧美日韩| 国产精品极品| 成人动漫在线观看视频| 国产不卡精品在线| 成人久久久久久| 国产精品va视频| 成人羞羞国产免费| 久久久久久久性潮| 国产免费久久av| 福利精品一区| 91精品国产综合久久香蕉| 神马久久资源| 国产成人精品999| 欧洲一级精品| 日韩免费观看网站| 国产精品亚洲一区二区三区在线观看 | 日韩电影免费观| 国产69久久精品成人看| 日本在线啊啊| 国产不卡精品视男人的天堂 | 91手机视频在线观看| 999色成人| 91视频最新| 大陆精大陆国产国语精品| 国产区日韩欧美| 日本一道高清一区二区三区| 久久久av水蜜桃| 国产精品一线天粉嫩av| 日韩电影大全在线观看| 大色综合视频网站在线播放| 一本久道久久综合狠狠爱亚洲精品| 日韩免费av| 大桥未久一区二区三区| 亚洲无线一线二线三线区别av| 国产无限制自拍| 亚洲一区二区三区高清不卡| 成人性视频欧美一区二区三区| 日韩成人av影视| 超级砰砰砰97免费观看最新一期| 粉嫩aⅴ一区二区三区四区五区| 亚洲男人在线天堂| 久久久久久久电影| 日韩福利小视频| 亚洲一区二区三区四区在线 | 鲁鲁狠狠狠7777一区二区| 国产精品中文字幕亚洲欧美| 在线播放 亚洲| 亚洲国产专区| 日本人视频jizz页码69| 国产精品中文字幕日韩精品| 欧美成人三级伦在线观看| 亚洲国产成人午夜在线一区| 精品国产精品国产精品| 午夜精品久久久| 欧美 亚洲 另类 激情 另类| 日韩免费一区二区| 国产在线播放av| 欧美成人免费小视频| 美女高潮视频在线看| 国产日韩在线视频| 乱亲女h秽乱长久久久| 亚洲欧洲日韩精品| 在线免费高清一区二区三区| 看欧美ab黄色大片视频免费| 国产风韵犹存在线视精品| 黄色工厂在线观看| 亚洲蜜桃精久久久久久久| 久久久久亚洲av成人毛片韩| 日韩一区国产二区欧美三区| 欧美黄色小说| 九九久久综合网站| 粉嫩91精品久久久久久久99蜜桃| 国产精品一区二区三区在线观| 精品久久不卡| 日韩欧美不卡在线| 国产乱色国产精品免费视频| 婷婷色一区二区三区| 亚洲午夜久久久久久久久电影网 | 色偷偷av亚洲男人的天堂| xxx.xxx欧美| 91久久精品一区| 精品视频免费| 成人黄色av片| 国产精品456| 成人一级黄色大片| 欧美色图片你懂的| 五月天激情开心网| 欧美丰满老妇厨房牲生活| 婷婷精品久久久久久久久久不卡| 美女被啪啪一区二区| 欧美啪啪一区| 99中文字幕在线| 日韩毛片视频在线看| 中文字幕第315页| 亚洲性无码av在线| 在线观看特色大片免费视频| 国产一区二区无遮挡| 欧美激情1区2区| 伊人免费视频二| 亚洲色欲色欲www在线观看| 一二三区在线播放| 在线视频欧美日韩精品| 经典三级一区二区| 日本一区免费观看| 久久精品九九| 精品无码人妻一区| 色综合久久中文字幕| 天堂资源最新在线| 欧美亚洲第一页| 亚洲另类av| 成人在线观看黄| 久久精品亚洲国产奇米99| 综合网在线观看| 亚洲色图欧美制服丝袜另类第一页| 一个人看的www视频在线免费观看| 国产欧美精品一区二区三区| 激情丁香综合| 免费看毛片的网站| 欧美午夜精品久久久久久浪潮| 三级视频在线| 国产精品白嫩初高中害羞小美女| 精品国产一区探花在线观看| 在线观看av网页| 亚洲欧美综合色| 国产高潮流白浆喷水视频| 欧美激情久久久久| 巨人精品**| 日韩av一二三四| 国产亚洲一二三区| 亚洲一区二区色| 欧美www在线| 国产精品香蕉| 日本女优爱爱视频| 中文字幕在线播放不卡一区| 91影院在线播放| 欧美大片第1页| 天堂成人娱乐在线视频免费播放网站| 日韩精品视频一区二区在线观看| 久久久美女艺术照精彩视频福利播放| 青娱乐在线免费视频| 精品国产美女在线| 91精品尤物| 黄色一级二级三级| 亚洲乱码国产乱码精品精可以看| 亚洲h视频在线观看| 97在线视频精品| 日韩中文首页| 9.1在线观看免费| 色激情天天射综合网| 国产一二区在线| 久久精品国产一区二区三区不卡| 青青青伊人色综合久久| 丰满少妇被猛烈进入一区二区| 亚洲精品国产精品久久清纯直播| 91国内外精品自在线播放| 欧美少妇一区二区三区| 久久尤物电影视频在线观看| 中文字幕一区二区三区人妻四季 | 国产成人免费网站| 亚洲欧美一区二区三区在线观看| 久久精品久久久久电影| 综合综合综合综合综合网| 久久出品必属精品|