精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

強化學習之父給LLM判死刑!站隊LeCun:我們全搞錯了

人工智能 新聞
當全世界都在狂熱追逐大模型時,強化學習之父、圖靈獎得主Richard Sutton卻直言:大語言模型是「死胡同」。在他看來,真正的智能必須源于經驗學習,而不是模仿人類語言的「預測游戲」。這番話無異于當頭一棒,讓人重新思考:我們追逐的所謂智能,究竟是幻影,還是通向未來的歧路?

在日前參加的一個訪談中,強化學習之父、圖靈獎得主Richard Sutton語出驚人:大語言模型(LLM)是一個錯誤的起點,是一條死胡同。

在Sutton看來,真正的智能源自經驗學習,通過行動、觀察與反饋持續修正行為,實現目標;相比之下,大語言模型的預測能力更多是對人類行為的模仿,它沒有獨立的目標,也無法對外部世界的變化產生真正意義上的驚訝和調整。

他認為,想要真正可擴展的智能,必須從經驗學習出發,而不是把大語言模型當作起點。

這一犀利的觀點,在如今人人追捧的大模型浪潮中,無疑是一劑清醒劑,促使我們從對模型「能力」的狂歡中跳脫出來,重新審視「智能」的本質與基礎。

此次Sutton與國外科技博Dwarkesh Patel的對話非常精彩,充滿了觀點碰撞。訪談內容包括以下7個部分:

  • 大語言模型(LLMs)是死胡同嗎?
  • 人類會進行模仿學習嗎?
  • 經驗時代
  • 現有架構在分布外泛化能力差
  • AI領域的驚喜
  • 「苦澀的教訓」在AGI之后仍然適用嗎?
  • AI的接替

圖片

完整訪談詳見:https://www.dwarkesh.com/p/richard-sutton

學術頭條節選了該訪談的第一部分內容「Are LLMs a dead end?」,在不改變原文大意的前提下,做了一定的編輯。如下:

Dwarkesh Patel:Richard Sutton是強化學習的奠基人之一,也是許多主要技術的發明者,比如時序差分學習和策略梯度方法。憑借這些貢獻,他獲得了今年的圖靈獎——被譽為「計算機科學界的諾貝爾獎」。Richard,恭喜您。

Richard Sutton:謝謝你,Dwarkesh。

Dwarkesh Patel:我的第一個問題是:我和我的聽眾更多是從大語言模型(LLM)的角度來思考人工智能。那么,如果從強化學習(RL)的角度來理解AI,我們可能錯過了什么?

Richard Sutton:這確實是一個非常不同的視角。兩者很容易被割裂開來,失去相互對話的能力。大語言模型如今非常火,生成式AI整體也成了熱門話題。可我們的領域往往容易被潮流帶偏,從而忽視最根本的問題。而我認為,強化學習才是真正的基礎AI。

什么是智能?歸根到底,是對你所處世界的理解。強化學習關注的就是理解世界,而大語言模型更多是在模仿人類,按人類的指令去做。它們并不是在思考「應該做什么」。

Dwarkesh Patel:你可能會認為,要想模仿互聯網上數萬億的文本token,你必須先建立一個世界模型。事實上,這些模型似乎確實展現出了強大的世界建模能力。它們是我們在AI領域迄今為止創造的最好的世界模型,對吧?您認為還缺少什么?

Richard Sutton:我不同意你剛才說的大部分內容。模仿人類語言,并不等于在建立世界模型。那只是在模仿那些擁有世界模型的人類。我并不是想采取對抗的立場,但我想質疑「大語言模型具備世界模型」這個觀點。一個真正的世界模型,應該能預測未來會發生什么。大語言模型能預測某個人會說什么,但沒法預測世界上會發生什么。

借用Alan Turing的話來說,我們真正想要的,是一臺能從經驗中學習的機器。而「經驗」,就是你實際生活中遭遇的事情:你采取行動,觀察結果,并從中學習。而大語言模型學到的卻是另一種模式:給定一個情境,它們學習某個人會怎么做,并隱含地暗示你應該照著那個人的做法去做。

Dwarkesh Patel:不知道您是否認同,我想關鍵點或許在于,有人認為模仿學習能夠為模型提供一種先驗知識,讓它們在進入您所謂的「經驗時代」之前,就已經具備一種合理的解決問題的能力。這樣一來,它們就能在一些情況下給出正確答案,而后續的經驗學習也可以建立在這個基礎上。您認同這種看法嗎?

Richard Sutton:不。我理解這是從大語言模型出發的觀點,但我不認為這是一個好觀點。要成為某事的先驗,必須有一個真實的東西存在。先驗知識應該是實際知識的基礎。什么是實際知識?在大語言模型中,沒有對實際知識的定義。是什么讓一個動作成為一個好的動作?

真正重要的是持續學習。「持續」意味著你必須在與世界的正常交互中不斷學習。而在正常的互動過程中,必須有某種方式來判斷什么是對的。

在大語言模型的設置中,是否存在判斷正確表達的方式?當你發出某種表達時,無法獲得關于正確表達的反饋,因為根本不存在對正確表達的定義。它們是沒有目標的。所以一句話和另一句話沒有對錯之分。沒有什么正確之說。

它沒有ground truth。如果沒有ground truth,就不可能有先驗知識,因為先驗知識本應是關于真相(truth)是什么的提示或初始信念。世間本無絕對真理,亦無絕對正確的言論。在強化學習中,有正確的話語要說,有正確的動作要做,正確的事就是能夠獲得獎勵的事。

我們對正確的事是有定義的,因此可以預先掌握或通過他人獲取關于正確的事的知識。然后我們可以去驗證它,因為我們知道什么是真正正確的事。

舉一個簡單例子:當你嘗試建立世界模型時,你會預測會發生什么,然后觀察結果。這中間存在ground truth。但大語言模型沒有這種ground truth,它們沒法預測接下來真實會發生什么。

比如在一場對話中,大語言模型回復了某句話,它無法預測對方會如何回應,或者回應什么。

Dwarkesh Patel:我認為它們可以。你直接問它們,「你預計用戶可能會有什么回應?」它們會給出一個預測。

Richard Sutton:不,那只是對問題的回答,而不是有意義的預測。它們不會對結果感到驚訝。即便事實和它們所謂的「預測」不符,它們也不會因為發生了意料之外的事情而改變。要學習到這一點,它們必須做出調整。

Dwarkesh Patel:這種能力在某些上下文中確實存在。例如,觀察一個模型進行「思維鏈」(CoT)是很有趣的。假設它正在嘗試解決一個數學問題。它會說:「好吧,我首先要用這種方法來解決這個問題。」它會把這個寫出來,然后說:「哦等等,我剛剛意識到這在概念上是解決問題的錯誤方法。我要用另一種方法重新開始。」

這種靈活性在上下文中是存在的,對吧?您是否另有想法,還是您只是認為需要將這種能力擴展到更大范圍?

Richard Sutton:我只是說,他們根本無法對接下來會發生什么做出任何有意義的預測。他們不會對后續發展感到意外。即使發生變故,他們也不會根據事態發展做出任何調整。

Dwarkesh Patel:這不就是「下一個token預測」(next token prediction)嗎?預測接下來會是什么,然后根據意外情況進行更新?

Richard Sutton:不一樣。下一個token預測的只是它們接下來要說什么,是一種輸出動作,而不是對外部世界的預測。

關鍵還是在于,它們缺乏目標。對我來說,擁有目標是智能的本質。如果一個系統能實現目標,那它就是智能的。我贊同John McCarthy的定義:智能就是達成目標的計算能力。沒有目標,它就只是一個行為系統,沒有特別之處,算不上智能。你同意大語言模型沒有目標嗎?

Dwarkesh Patel:不,它們有目標。

Richard Sutton:目標是什么?

Dwarkesh Patel:下一個token預測。

Richard Sutton:那不是一個目標。它不能改變世界。預測Token,本身不會對token產生影響。

Dwarkesh Patel:是的,我同意。它不是一個關于外部世界的目標。

Richard Sutton:所以,那不是實質性的目標。你不能說,一個只是靜靜預測并因預測準確而滿足的系統,是有目標的。

Dwarkesh Patel:我更想問的是,為什么您認為在大語言模型之上做強化學習不是一個可行的方向?畢竟我們已經能賦予這些模型解決復雜數學問題的目標。

例如, 它們已經能在國際數學奧林匹克競賽(IMO)上拿到金牌,這意味著它們確實在追求「正確解題」這個目標。為什么不能把這種能力擴展到其他領域呢?

Richard Sutton:數學問題是不同的。構建物理世界的模型,與在數學中演繹推理、計算結果,完全是兩回事。經驗世界必須通過交互去學習,需要從結果中得到反饋。而數學更偏向計算,更像是標準的規劃,目標比較清晰:找到證明。某種意義上,它們被賦予了「找到證明」的目標。

Dwarkesh Patel:您在2019年寫了一篇題為《慘痛的教訓》(The Bitter Lesson)的文章,這也許是AI歷史上最具影響力的文章。如今,人們正把它作為擴大大語言模型規模的依據,因為在他們看來,這是我們目前唯一能找到的可擴展方案,就是用海量算力去探索世界。有趣的是,您卻認為大語言模型并沒有真正吸取「苦澀的教訓」。

Richard Sutton:大語言模型是否是「苦澀的教訓」的一個案例,這是一個有趣的問題。它們顯然是一種利用大規模計算的方法,這種計算可以隨著互聯網數據的極限擴展。但它們也是一種融入大量人類知識的方式。這確實是個值得探討的問題——既涉及社會學層面,也關乎產業未來。它們是否會觸及數據極限,最終被那些僅憑經驗而非人類知識就能獲取更多數據的新事物所取代?

在某些方面,這正是「苦澀的教訓」的典型案例。我們向大語言模型輸入的人類知識越多,它們的表現就越出色。這令人欣慰。然而,我期望會出現能夠從經驗中學習的系統。這種系統可以表現得更好,也更具可擴展性。那時,人類知識驅動的系統終將被純粹依靠經驗與計算訓練的系統所取代——這又將成為「苦澀的教訓」的另一例證。

Dwarkesh Patel:在我看來,這好像不是核心分歧。我認為那些人也認同,未來絕大多數的計算將來自從經驗中學習。他們只是認為,支撐這種學習的基礎架構——即為實現未來經驗學習或在職學習而注入計算能力的起點——將是大語言模型。我還是不明白,為什么這根本就是錯誤的起點,為什么我們需要一個全新的架構來開始進行經驗上的、持續的學習?為什么我們不能從大語言模型開始做這件事呢?

Richard Sutton:在每一個「苦澀的教訓」的案例中,你都可以先從人類知識入手,然后再去做那些可擴展的事情。理論上,這并不算錯誤。但實踐中,它幾乎總是行不通。因為人們會被困在人類知識驅動的方法中,很難跳出來。最終,這些方法總會被真正可擴展的途徑超越。

Dwarkesh Patel:那么,真正可擴展的方法是什么?

Richard Sutton:就是從經驗中學習。嘗試各種做法,觀察哪些有效。不需要有人告訴你。前提是,有一個目標,沒有目標,就沒有對錯或好壞之分,而大語言模型試圖在沒有目標或優劣判斷的情況下運作。這就是一個錯誤的起點。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-06-10 11:22:09

強化學習AI模型

2025-09-28 08:58:55

2023-03-27 17:45:16

研究AI

2024-09-29 13:40:00

2024-11-29 16:33:24

2025-05-28 02:25:00

2025-04-21 08:40:00

算力AI模型

2024-08-26 15:21:06

2025-10-11 04:00:00

2025-03-07 09:24:00

2025-06-05 06:36:17

2017-02-20 16:35:10

人工智能算法強化學習

2011-06-02 09:27:28

2023-03-09 08:00:00

強化學習機器學習圍棋

2020-08-10 06:36:21

強化學習代碼深度學習

2025-09-09 09:09:00

2025-09-11 06:57:11

2022-09-03 18:19:17

Github趨勢

2025-04-18 10:01:41

2025-03-25 09:12:00

LIMAI模型
點贊
收藏

51CTO技術棧公眾號

国产精品久久久久久久久男| 亚洲欧美一区二区精品久久久| 中文字幕第一页亚洲| 国产av一区二区三区| 亚洲精品护士| 在线视频中文亚洲| 老熟女高潮一区二区三区| 成人一区福利| 亚洲激情图片qvod| 任我爽在线视频精品一| 亚洲精品一区二区口爆| 日日夜夜免费精品| 高清视频欧美一级| av最新在线观看| 免费成人高清在线视频theav| 7777精品伊人久久久大香线蕉超级流畅 | 久久精品国产露脸对白| aa国产成人| 一区在线观看视频| 欧美日韩综合久久| 亚洲精品.www| 国产在线国偷精品产拍免费yy| 4438全国成人免费| 免费又黄又爽又色的视频| 欧美日韩精品一区二区视频| 亚洲第一页自拍| 亚洲无在线观看| 色综合天天色| 欧美日韩免费在线| 男的插女的下面视频| 国产精品剧情| 国产精品久久久久久久久晋中| 精品一区在线播放| 免费a视频在线观看| 国产一区不卡视频| 国产欧美一区二区三区久久| 99久久精品国产亚洲| 亚洲黄色成人| 久久久久久国产精品三级玉女聊斋 | 神马电影久久| 日韩电影大全免费观看2023年上| 99riav国产精品视频| 久久9999免费视频| 7878成人国产在线观看| 91av视频免费观看| 欧美天堂在线| 欧美日韩精品福利| 色片在线免费观看| 狠狠久久综合| 欧美日韩国产影片| 做a视频在线观看| 亚洲三级电影| 91精品国产aⅴ一区二区| 国产女同无遮挡互慰高潮91| 日韩午夜视频在线| 91精品综合久久久久久| 日韩欧美中文视频| 午夜视频一区二区在线观看| 精品欧美一区二区久久| 麻豆免费在线观看视频| 草草视频在线一区二区| 亚洲国产精品热久久| 丰满大乳奶做爰ⅹxx视频| 欧美激情网址| 国产一区二区三区在线观看视频| 国产在线免费av| 亚洲国产老妈| 午夜精品一区二区三区在线视| 中文字幕一区二区三区精品| 国产深夜精品| 国产精品久久久久久久久久小说| 97成人在线观看| 国产福利精品导航| 久久涩涩网站| 91在线导航| 亚洲丝袜美腿综合| av高清在线免费观看| 蜜臀国产一区| 69精品人人人人| 成年人小视频在线观看| 亚洲v天堂v手机在线| 中文字幕亚洲欧美日韩2019| 永久看片925tv| 国产亚洲高清视频| 国产在线播放91| 免费国产精品视频| 国产日产欧美一区二区三区| 波多野结衣与黑人| 裤袜国产欧美精品一区| 日韩一区二区电影在线| 人妻丰满熟妇av无码久久洗澡| 日韩电影在线视频| 国外成人性视频| 在线观看毛片网站| 99精品国产99久久久久久白柏| 婷婷久久青草热一区二区| 国内在线视频| 欧美日韩国产一级片| 中文乱码人妻一区二区三区视频| 日韩aaaa| 欧美一级bbbbb性bbbb喷潮片| 国产色在线视频| 久久婷婷色综合| www.在线观看av| 国产精品原创视频| 亚洲老司机av| 久久久久久久极品内射| 美女视频黄久久| 精品一区二区国产| 一区二区三区伦理| 欧美日韩国产区一| 美女洗澡无遮挡| 在线看片一区| 91在线免费观看网站| 国产系列在线观看| 亚洲成av人片www| 毛片毛片毛片毛| 精品一区二区三区在线| 91精品国产高清自在线 | 国产成人精品亚洲午夜麻豆| 欧美亚洲精品日韩| 高清精品在线| 精品国产伦一区二区三区观看方式| 91视频免费看片| 日韩专区欧美专区| 鲁丝片一区二区三区| 国产丝袜精品丝袜| 精品国产一区二区在线观看| 欧美丰满熟妇bbbbbb| 毛片av一区二区| 日本一区二区不卡高清更新| 性欧美freesex顶级少妇| 精品国产一区二区在线观看| 国产亚洲欧美精品久久久久久| 国产在线一区观看| 中文字幕综合在线观看| 日韩电影精品| 久久激情视频免费观看| 国产一区二区波多野结衣 | 一级做a爰片久久| 国产一区精品福利| 色阁综合伊人av| 怡红院成永久免费人全部视频| 国产三级一区二区| 久久精品影视大全| 日韩欧美在线中字| 国产免费一区二区三区香蕉精| www视频在线观看免费| 欧美日韩一区二区三区高清| 日本免费www| 精品一区二区在线观看| 在线天堂一区av电影| 精品一区二区三区亚洲| 欧美国产日本在线| 日本激情一区二区三区| 精品国产乱码久久久久久婷婷 | 久久激情电影| 成人两性免费视频| 亚洲奶水xxxx哺乳期| 精品国产sm最大网站| 在线观看中文字幕视频| 久久久.com| 91丝袜超薄交口足| 海角社区69精品视频| 精品无人区一区二区三区 | 欧美一级二级三级乱码| 久草网在线观看| eeuss国产一区二区三区 | 亚洲免费在线观看av| 久久久久国色av免费看影院| 三上悠亚在线一区二区| 在线观看国产精品入口| 国产精选在线观看91| 国产日韩另类视频一区| 日韩中文字幕视频在线观看| 国产成人精品亚洲精品色欲| 亚洲mv在线观看| 懂色av蜜桃av| 国产成人亚洲综合a∨猫咪| 六月丁香激情网| 久久精品不卡| 精品国产一区二区三区麻豆小说 | 极品蜜桃臀肥臀-x88av| 国产成人综合视频| 国产福利视频在线播放| 亚洲精品888| 久久久久综合一区二区三区| 啪啪av大全导航福利综合导航| 欧美精品久久久久| 在线免费观看的av网站| 精品国产在天天线2019| 一区二区三区精彩视频| 午夜久久电影网| 潘金莲一级黄色片| 91在线你懂得| 无套内谢丰满少妇中文字幕| 亚洲综合精品四区| 老司机av福利| 自拍欧美一区| 97se亚洲综合| jizz亚洲女人高潮大叫| 91精品国产电影| 欧美人体视频xxxxx| 有码中文亚洲精品| 日中文字幕在线| 日韩精品一区二| 真实的国产乱xxxx在线91| 婷婷综合另类小说色区| 强行糟蹋人妻hd中文| 中文字幕av免费专区久久| 中国极品少妇videossexhd| 极品销魂美女一区二区三区| 国产第一页视频| 亚洲第一毛片| 久久久久久久久网| 99久久夜色精品国产亚洲狼| 日韩成人av网站| 美女网站一区| 精品国产一区二区三区四区精华| 日韩一二三区在线观看| 国产成人免费91av在线| 高潮在线视频| 久久久久久免费精品| 91麻豆免费在线视频| www.99久久热国产日韩欧美.com| 国产精品视频一区二区久久| 亚洲欧美国产高清va在线播| 人妻丰满熟妇av无码区hd| 日韩亚洲欧美在线观看| 国产美女明星三级做爰| 777欧美精品| 国产aⅴ爽av久久久久成人| 欧美猛男男办公室激情| 亚洲专区在线播放| 欧美日韩免费视频| 一区二区久久精品66国产精品| 欧美日韩视频在线观看一区二区三区| 精品久久久久久久久久久国产字幕 | 国产又爽又黄ai换脸| 99九九热只有国产精品| 一区二区三区的久久的视频| 国产国产精品| 国产树林野战在线播放| 亚洲一区二区三区无吗| 三级在线免费观看| 午夜电影亚洲| aa视频在线播放| 国产日韩欧美三级| 欧美性猛交久久久乱大交小说| 日本不卡在线视频| 日本人69视频| 国内精品国产三级国产a久久| 欧美在线a视频| 懂色av噜噜一区二区三区av| 国产精品扒开腿做爽爽爽a片唱戏| 成人免费av在线| 99re久久精品国产| 欧美国产丝袜视频| 69精品无码成人久久久久久| 中文字幕一区在线观看| 一级黄色录像视频| 香蕉成人伊视频在线观看| jizz国产在线观看| 欧美日韩高清一区二区三区| 99在线无码精品入口| 亚洲高清不卡av| 男男激情在线| 久久精品这里热有精品| heyzo在线欧美播放| 国产ts一区二区| 9.1麻豆精品| 精品一区二区三区日本| 国内黄色精品| 欧美激情亚洲天堂| 久热精品在线| 无套白嫩进入乌克兰美女| 99精品国产视频| 神马久久精品综合| 欧美日韩国产一区二区| 一级二级三级视频| 亚洲福利视频免费观看| 色影视在线观看| 69久久夜色精品国产69乱青草| 91超碰碰碰碰久久久久久综合| 亚洲最大成人免费视频| 真实原创一区二区影院| 国产人妻人伦精品| 日韩中文字幕一区二区三区| 色诱av手机版| 国产精品―色哟哟| 成年人午夜视频| 在线不卡中文字幕| 欧美色视频免费| 久久99热精品这里久久精品| 亚洲精品国产嫩草在线观看| 国产精品一区二区三区精品| 国产剧情在线观看一区| 国产精品69久久久| 理论片日本一区| 中文字幕一区二区三区人妻| 亚洲另类中文字| 中国一级特黄视频| 精品视频久久久久久| 18在线观看的| 国产精品亚洲精品| 亚洲三级网址| 精品人妻大屁股白浆无码| 麻豆国产欧美日韩综合精品二区| 99久久人妻精品免费二区| 亚洲乱码国产乱码精品精98午夜 | 三级成人在线| 国模精品一区二区三区| 国产一区日韩一区| 国产精品久久久久久久99| 欧美国产综合色视频| 午夜影院免费在线观看| 亚洲电影在线看| 免费在线观看av电影| 92国产精品视频| 亚洲成av人电影| 三上悠亚av一区二区三区| 国产午夜精品久久| 51国产偷自视频区视频| 亚洲国产小视频在线观看| 里番在线播放| 亚洲自拍偷拍区| 亚洲欧洲日韩| 五月天婷婷影视| 成人欧美一区二区三区视频网页| 中文字幕一区二区三区四区视频| 国产亚洲欧洲高清一区| 日本综合字幕| 日本不卡在线观看| 日本特黄久久久高潮| 妺妺窝人体色WWW精品| 色视频成人在线观看免| 岛国最新视频免费在线观看| 国产精品国产自产拍高清av水多| 国产一区二区三区网| 欧美一级黄色影院| 欧美国产视频在线| 中文字幕在线观看国产| 中文字幕日本欧美| 亚洲成人高清| 影音先锋成人资源网站| 国产精品一卡二卡| 欧美色图亚洲天堂| 精品国产乱码久久久久久夜甘婷婷| 日本高清在线观看视频| 国产伦精品一区二区三区高清版 | 亚洲精品男同| 成人精品在线观看视频| 色一情一伦一子一伦一区| www.视频在线.com| 91午夜理伦私人影院| 欧美韩日精品| 特级西西人体4444xxxx| 色视频成人在线观看免| 国产在线激情视频| 成人在线资源网址| 亚洲免费影院| 日本视频在线免费| 欧美成人一区二区三区| 日韩欧美一中文字暮专区| 欧美重口乱码一区二区| 精品一区二区免费看| 久久久精品国产sm调教网站| 日韩电影中文字幕av| www.一区| 黄色成人在线看| 国产精品丝袜黑色高跟| 国产女人爽到高潮a毛片| 久久免费视频这里只有精品| 神马电影久久| 无码人妻一区二区三区免费n鬼沢| 欧美日韩国产精品一区| 免费a在线看| 精品蜜桃传媒| 久久成人免费网| 男人的天堂一区二区| 爽爽爽爽爽爽爽成人免费观看| 91精品尤物| 在线观看av日韩| 亚洲一二三四区| 91官网在线| 精品久久久久亚洲| 精品在线播放午夜| 亚洲欧美日韩激情| 欧美床上激情在线观看| 国产区精品区| 亚洲天堂av网站| 欧美日韩成人高清| 桃色av一区二区| 51xx午夜影福利| 欧美国产视频在线| 五月婷婷综合久久| 91视频免费在线观看| 青娱乐精品视频在线| 久久青青草视频| 久久男人av资源网站|