精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic聯創:Scaling Law沒崩,但推理成天價!有了TTT,2025年AI更加速

人工智能 新聞
Anthropic聯創發文表示,誰要是說Scaling Law撞墻了,那他絕對錯了!在25年,AI靠測試時計算還會繼續加速。不過,隨之而來的推理成本也是天價,o3的每個任務成本高達20美元,怎么辦?

Scaling Law要撞墻了?

Anthropic聯創Jack Clark反駁了這一說法:絕非如此!

在他看來,目前的AI發展還遠遠沒到極限,「所有告訴你AI進展正在放緩,或者Scaling Law正在撞墻的人,都是錯誤的。」

圖片

o3仍有很大的增長空間,但采用了不同的方法。

OpenAI的技術秘訣并不是讓模型變得更大,而是讓它們在運行時,使用強化學習和額外的計算能力。

這種「大聲思考」的能力,為Scaling開辟了全新的可能性。

而Jack Clark預計,這一趨勢在2025年還會加速,屆時,科技公司都會開始將大模型的傳統方法跟在訓練和推理時使用計算的新方法相結合。

這個論斷,跟OpenAI首次推出o系列模型時的說法完全吻合了。

在同一時間,MIT的研究者也發現,采用測試時訓練(TTT)技術,能顯著提高LLM進行邏輯推理和解決問題的能力。

圖片

論文地址:https://ekinakyurek.github.io/papers/ttt.pdf

Scaling Law撞墻,絕對錯了

在他的新聞通訊《Import AI》中,Clark對關于AI發展已到達瓶頸的觀點進行了反駁。

圖片

博文地址:https://jack-clark.net/

比如OpenAI的o3模型,就證明了AI極大的發展空間。

在現有強大基礎模型之上,采用一種新方法——讓大語言模型在推理時「邊思考邊執行」,即測試時計算(test-time compute)。這種方式能帶來巨大的回報。

因此Clark預計,下一個合理的發展方向將是同時擴展強化學習(RL)和底層基礎模型,這將帶來更為顯著的性能提升。

這意味著,隨著現有方法(大模型scaling)與新方法(強化學習驅動的測試時計算等)的結合,2025年的AI進展相對2024年會進一步加速。

OpenAI著名研究員Jason Wei也表示,更加關鍵的是,從o1到o3的進步也僅僅只用了3個月,這說明了在推動人工智能領域發展方面來講,強化學習驅動的推理擴展計算范式,會比預訓練基礎模型的傳統擴展范式快得多。

圖片

這并非空談,Clark列舉了不少o3的亮眼成績來證明他的觀點。

首先,o3有效突破了「GPQA」科學理解基準(88%),這彰顯了它在科學領域進行常識推理和解答的能力。

它在「ARC-AGI」這一任務上的表現優于亞馬遜眾包平臺(MTurk)雇傭的人類工作者。

甚至,o3在FrontierMath上達到了25%的成績——這是一個由菲爾茲獎得主設計的數學測試,就在幾個月前,SOTA的成績僅為2%。

并且,在Codeforces上,o3獲得了2727分,排名第175。這讓它成為這一極其困難基準上的最佳競技程序員之一。

模型成本將更難預測

Clark認為,大多數人還沒有意識到未來進展的速度將會有多快。

「我認為,基本上沒有人預見到——從現在開始,AI進展將會有多么急劇。」

同時,他也指出,算力成本是急速進展中的一個主要挑戰。

o3之所以如此優秀,其中的一個原因是,它在推理時的運行成本更高。

o3的最先進版本需要的算力比基礎版多170倍,而基礎版的算力需求已經超出了o1的需求,而o1本身所需的算力又超過了GPT-4。

圖片

o系列模型的性能與成本

Clark解釋說,這些基于推理擴展范式的新模型使得成本預測變得更加困難。

過去,模型的成本費用是很直觀的,主要取決于模型的大小和輸出長度。

但在o3這類模型中,由于其資源需求會根據具體任務的不同而變化,所以也更難直觀地給出模型執行任務時的花費。

o3推理成本達新高

除了FrontierMath和Codeforces上的成績,o3在GPT Diamond Benchmar上,對于博士級的科學問題也拿到了87.7%,遠高于各自領域博士專家70%的平均分。

圖片

ARC-AGI基準測試開發者、Keras之父Fran?ois Chollet,將o3的性能稱為「AI能力中令人驚訝且重要的階躍函數增長」

而這背后付出的代價,就是運行o3極高的成本。

之所以會造成如此高的成本,就是源于o3和其他模型處理問題方式的不同。

傳統的LLM主要依靠的是檢索存儲模式,但o3處理問題時,卻是靠實時創建新程序,來解決不熟悉的挑戰。

Chollet表示,o3系統的工作原理,似乎和谷歌DeepMind的AlphaZero國際象棋程序類似。后者會有條不紊地搜索可能的解決方案,直到找到正確方法。

圖片

這個過程也就解釋了,為什么o3需要如此多的算力——只為單個任務,模型就需要處理多達3300萬個token。

跟當前的AI系統相比,這種密集的token處理成本,簡直是天價!

高強度推理版本的每個任務,運行費用約為20美元。

也就是說,100個測試任務的成本為2012美元,全套400個公共任務的成本則達到了6677美元(按平均每個任務花費17美元計算)。

而對于低強度推理版本,OpenAI尚未透露確切的成本,但測試顯示,此模型可以處理33至1.11億個token,每個任務需要約1.3分鐘的計算時間。

圖片

o3在ARC-AGI基準測試中必須解決的視覺邏輯問題示例

等待Anthropic的下一步

所以,Anthropic下一步會給我們帶來什么呢?

目前,由于Anthropic尚未發布推理模型(reasoning model)或測試時模型(test-time model),來與OpenAI的o系列或Google的Gemini Flash Thinking競爭,Clark的這一番預測,不禁讓人好奇Anthropic的計劃。

他們之前宣布的Opus 3.5旗艦模型至今仍沒有確切消息。

開發周期長達一個月,過程充滿不確定性

在11月,Anthropic CEO Dario Amodei曾證實,公司正在開發Claude Opus的新版本。

起初,Opus 3.5定于今年發布,但后來Amodei再提到它時,只是說它會在「某個時刻」到來。

不過Amodei倒是透露,公司最近更新和發布的Haiku 3.5,性能已經跟原始的Opus 3相匹敵,同時運行速度還更快,成本也更低。

圖片

其實,這也不僅僅是Anthropic面臨的問題。

自GPT-4亮相以來,LLM的功能并沒有取得重大飛躍,這種停滯已經成為AI行業內一種普遍的廣泛趨勢。

更多時候,新發布的模型只是微小的進步,跟之前有一些細微的差別。

開發更先進的LLM,為何如此復雜

在Lex Fridman的播客訪問中,Amodei詳細講述了開發這些AI模型的復雜性。

圖片

他表示,僅訓練階段,就有可能會拖延數個月,還會需要大量的計算能力,用上數以萬計的專用芯片,如GPU或TPU。

預訓練過后,模型將經歷復雜的微調的過程,一個關鍵部分就是RLHF。

人類專家會煞費苦心地審查模型的輸出,根據不同標準對其進行評分,幫助模型學習和改進。

接下來,就是一系列內部測試和外部審計,來檢查模型的安全問題,通常是與美國和英國的AI安全組織合作。

總之,Amodei總結道:雖然AI的突破在圈外人士看來,像一個巨大的科學飛躍,但其實很多進步都可以歸結為枯燥和無聊的技術細節。

在此過程中,最困難的部分通常是軟件開發、讓模型運行得更快,而不是重大的概念進步。

而且,每個新版本模型的「智能」和「個性」,也都會發生不可預測的變化。在他看來,正確訓練模型與其說是一門科學,不如說是一門藝術。

即使真正發布的Opus 3.5的性能有了提升,卻也不足以證明其高昂的運營成本是合理的。

不過,雖然有人認為Anthropic沒有緊跟推理模型的步伐,已經足以反映LLM擴展的巨大挑戰;但不得不說,Opus 3.5也并非毫無意義。

顯然,它幫助訓練了全新的Sonnet 3.5,它已經成為了當今市場上最受歡迎的LLM。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-12-16 07:15:00

2024-11-11 14:00:00

AI模型

2024-09-20 16:20:00

2024-11-11 17:35:11

2025-04-11 09:15:00

語言模型AI數據

2025-08-04 01:55:00

2024-09-29 13:07:16

2024-11-27 13:40:00

模型訓練

2025-02-07 10:13:16

2025-03-17 09:25:00

AI模型谷歌

2025-07-10 11:23:24

AI工具產品

2025-05-30 01:30:00

Anthropic技巧AI

2024-08-06 14:07:40

2025-04-09 10:11:57

2024-11-14 18:40:57

2024-03-29 06:39:43

2025-01-06 12:59:52

2024-03-22 14:52:02

AI人工智能

2020-02-21 14:15:40

SimpleDateFJava多線程
點贊
收藏

51CTO技術棧公眾號

日韩片在线观看| 男女日批视频在线观看| 6—12呦国产精品| 一级毛片免费高清中文字幕久久网| 欧美一级日韩不卡播放免费| 久久69精品久久久久久久电影好| 国产精品91av| 国产伦精品一区二区三区视频金莲| 国产日韩亚洲欧美综合| 亚洲字幕一区二区| 人妻 日韩精品 中文字幕| 亚洲网站三级| 欧美日韩亚洲91| 亚洲bbw性色大片| 亚洲国产精彩视频| 91精品一区二区三区综合| 欧美r级电影在线观看| 黑森林福利视频导航| 高清全集视频免费在线| 久久久久综合网| 操人视频欧美| 中文字幕在线日本| 精品91在线| 久久久国产91| 色综合99久久久无码国产精品| 香蕉成人app| 欧美日韩一级大片网址| 久久久久久久久久久视频| 激情影院在线观看| 国产欧美日韩视频一区二区| 成人av资源网| 国产又粗又猛又爽又黄的| 国产亚洲毛片在线| 欧美激情亚洲国产| www.99re7| 日韩理论在线| 亚洲人成电影网站色xx| 无码人妻精品一区二区三区99不卡| 欧美成人一二区| 国产精品免费看片| 国产日产欧美精品| 国产在线观看黄色| 亚洲国产高清一区| 精品一区二区亚洲| 青青青国产在线视频| 国产二区视频在线观看| 99精品在线观看视频| 97人人模人人爽人人喊38tv| 一区二区久久精品66国产精品 | 亚洲最大色综合成人av| 一级黄色av片| 久久久天天操| 91av网站在线播放| 日本猛少妇色xxxxx免费网站| 亚洲精品粉嫩美女一区| 精品久久香蕉国产线看观看gif| 欧美高清视频一区二区三区在线观看| 蜜臀久久精品久久久久| 成人丝袜18视频在线观看| 亚洲综合色激情五月| 国产女人高潮时对白| 精品一区二区三区在线观看| 国产噜噜噜噜久久久久久久久| 欧美 亚洲 另类 激情 另类| 日韩福利视频导航| 国产日本欧美视频| 99热这里是精品| 国产aⅴ综合色| 国产精品区一区| 污污视频在线免费看| 96av麻豆蜜桃一区二区| 欧美日韩最好看的视频| av午夜在线| 国产成人精品影院| av成人午夜| 日韩一级在线播放| 91捆绑美女网站| 日韩一二三区不卡在线视频| 97视频精彩视频在线观看| 国产精品无码永久免费888| 制服诱惑一区| 黑人精品视频| 色综合天天综合网国产成人综合天| 一区高清视频| av片在线观看网站| 香蕉乱码成人久久天堂爱免费| 无码播放一区二区三区| 快播电影网址老女人久久| 欧美精品久久一区二区三区 | 成人午夜视频免费看| 久久riav二区三区| jizz亚洲| 亚洲一二三四在线| 伊人色综合久久天天五月婷| 国产日产一区二区| 精品成人国产在线观看男人呻吟| 国产精品wwwww| 国产精品视频首页| 亚洲女人天堂成人av在线| 国产黄色录像视频| 亚洲国内精品| 国产美女久久精品| 天天射,天天干| 国产精品欧美极品| 男人添女人下面高潮视频| 91精品影视| 精品国产凹凸成av人网站| 亚洲黄色网址大全| 在线精品一区二区| 91精品国产综合久久久久久久久| 欧美视频久久久| 国产精品久久久久久一区二区三区| 久久手机在线视频| 欧美一级做a| 日韩高清a**址| 久久久久亚洲av片无码| 天堂成人国产精品一区| av成人观看| 男人在线资源站| 色94色欧美sute亚洲线路二| 无码人妻一区二区三区精品视频| 久久裸体网站| 国产精品久久久久久久久久久新郎 | 精品亚洲成a人| 精品网站在线看| 婷婷色在线资源| 精品视频在线免费| 蜜桃av免费看| 国产无遮挡裸体免费久久| 正在播放欧美视频| 精品深夜av无码一区二区老年| 免费成人在线视频观看| 久热国产精品视频一区二区三区| 菠萝菠萝蜜在线视频免费观看| 91电影在线观看| 亚洲乱码国产乱码精品精大量| 国内在线观看一区二区三区| 91在线观看免费高清| 北条麻妃在线| 欧美午夜在线一二页| 午夜理伦三级做爰电影| 最新亚洲一区| 国产经品一区二区| 女同一区二区免费aⅴ| 欧美一区二区女人| 97在线观看免费高| 激情综合亚洲精品| eeuss中文| 国产精品**亚洲精品| 精品国产一区二区三区久久| 中文字幕日韩国产| 中文字幕第一区第二区| a在线观看免费视频| 欧美一级本道电影免费专区| 国产精品r级在线| 久久经典视频| 欧美亚洲一区二区在线| 久久精品三级视频| 麻豆精品新av中文字幕| 艳色歌舞团一区二区三区| 亚洲欧美在线人成swag| 久久成人精品一区二区三区| 99国产精品久久久久99打野战| 亚洲日本在线看| 黑人无套内谢中国美女| 精品9999| 欧美三级网色| 久久xxx视频| 美女av一区二区| 午夜精品小视频| 午夜久久久久久| 欧美熟妇一区二区| 青青草国产精品97视觉盛宴| 日韩亚洲一区在线播放| www久久久| 久久久综合免费视频| 日韩有码电影| 欧美日韩不卡一区二区| 欧美精品videos极品| 99久久99久久综合| 国产精品视频分类| 综合日韩在线| 久久久久久久久久码影片| 日韩不卡在线| 欧美另类xxx| 青青草在线视频免费观看| 欧美日韩精品欧美日韩精品| 强乱中文字幕av一区乱码| www.日本不卡| 激情黄色小视频| 国产精品毛片| 一本色道久久99精品综合| 9国产精品午夜| 国产精品草莓在线免费观看 | 欧美激情乱人伦| 国产在线中文字幕| 欧美一卡2卡三卡4卡5免费| 日韩精品在线免费视频| 国产精品成人免费精品自在线观看 | 欧美在线三区| 精品网站在线看| www.久久爱.com| 国产91色在线免费| 少妇av在线| 中文字幕在线看视频国产欧美在线看完整 | 国产精品丝袜久久久久久app| 日韩一级片一区二区| 一区二区三区视频免费观看| 久久精品这里热有精品| 少妇av在线播放| 制服丝袜激情欧洲亚洲| 国产寡妇亲子伦一区二区三区四区| 亚洲欧美日韩国产一区二区三区| 久久精品国产亚洲av久| 大尺度一区二区| 国产一区二区在线观看免费视频| 欧美中文日韩| 成人午夜精品久久久久久久蜜臀| 91偷拍一区二区三区精品| 欧美日韩日本网| 国内视频在线精品| 亚洲在线观看视频| 精品乱码一区二区三区四区| 日本国产欧美一区二区三区| 福利成人导航| 色综合男人天堂| 欧美猛烈性xbxbxbxb| 亚洲天堂av在线免费| 天天操天天插天天射| 精品久久一二三区| 国产强伦人妻毛片| 欧美浪妇xxxx高跟鞋交| 中文字幕在线日亚洲9| 欧美午夜久久久| 日本一级淫片色费放| 亚洲一区二区三区四区在线观看| 顶臀精品视频www| 亚洲婷婷综合久久一本伊一区| 秋霞网一区二区三区| 国产视频不卡一区| 少妇久久久久久久久久| 97久久超碰国产精品电影| 亚洲精品第二页| 成人av片在线观看| 一级特黄a大片免费| 成人免费视频一区| 国产视频精品视频| 99久久久久免费精品国产| 中文字幕在线视频播放| 成人av免费观看| 国产精品探花一区二区在线观看| 不卡高清视频专区| www.88av| 99免费精品在线| 精品少妇一区二区三区免费观| 久久久蜜桃精品| 欧美大波大乳巨大乳| 久久久久久久av麻豆果冻| 欧美多人猛交狂配| 欧美国产精品一区二区三区| 91香蕉视频网| 亚洲精品成人悠悠色影视| 亚洲精品午夜久久久久久久| 精品人伦一区二区三区蜜桃免费| 亚洲s码欧洲m码国产av| 欧美影院一区二区三区| 国产草草影院ccyycom| 欧美大胆人体bbbb| 污视频在线免费| 中文字幕精品久久久久| 欧美69xxx| 久久久久久国产精品三级玉女聊斋 | 免费观看欧美大片| 欧洲成人性视频| 国产亚洲精品精品国产亚洲综合| 国产精品亚发布| 日韩一区二区三区精品| 国产中文一区二区| 日产精品一区二区| 黄网站色视频免费观看| 国产美女诱惑一区二区| 国产九九在线视频| 激情婷婷欧美| 久久久久久久久久久久久久国产| 麻豆视频观看网址久久| 少妇伦子伦精品无吗| 久久精品视频网| 日韩成人毛片视频| 欧美性猛交xxxx免费看久久久| 亚洲视频久久久| 亚洲第一中文字幕在线观看| 国产福利电影在线| 欧美激情欧美激情在线五月| 主播大秀视频在线观看一区二区| 亚洲最大av网| 国产精品三级| www.夜夜爱| 免费精品视频在线| 小毛片在线观看| 1000精品久久久久久久久| 青青操免费在线视频| 7777精品伊人久久久大香线蕉经典版下载 | 亚洲黄色网址大全| 午夜欧美2019年伦理| 97caocao| 亚洲视频精品在线| 国产丝袜在线播放| 成人xxxx视频| 禁断一区二区三区在线| 国产欧美日韩小视频| 九九**精品视频免费播放| 亚洲狠狠婷婷综合久久久久图片| 国产精品国产三级国产普通话99| 全部毛片永久免费看| 欧美一级免费观看| 亚洲成人三级| 日韩av电影手机在线| 国产精品久av福利在线观看| 综合色婷婷一区二区亚洲欧美国产| 羞羞视频在线观看欧美| 日本在线不卡一区二区| 亚洲色图第一区| 中文字幕人妻色偷偷久久| 亚洲人成电影在线| 妞干网免费在线视频| 7777精品久久久大香线蕉小说| 成人a'v在线播放| 成人三级视频在线播放| 99精品视频一区二区| 久草视频精品在线| 日韩精品一区二区三区在线播放| 日韩免费啪啪| 国产精品自在线| 色婷婷热久久| 亚洲 激情 在线| 久久成人久久鬼色| 国产熟妇久久777777| 狠狠综合久久av一区二区小说 | 国产乡下妇女做爰视频| 欧美一级二级在线观看| 18+视频在线观看| 91免费精品视频| 一区二区三区午夜探花| 久国产精品视频| 亚洲日本在线看| 国产三级三级在线观看| 麻豆一区二区在线观看| 91丨精品丨国产| 日本三日本三级少妇三级66| 黑人巨大精品欧美黑白配亚洲 | 五月天精品一区二区三区| 亚洲国产精品国自产拍久久| 欧美精品国产精品日韩精品| 亚洲超碰在线观看| 成人午夜免费在线视频| 成人国产精品免费网站| 国内免费精品视频| 亚洲美女性视频| 国产一区一一区高清不卡| 亚洲激情电影在线| 国产美女久久久久| 青娱乐av在线| 日韩av中文字幕在线| 欧美美女日韩| 亚洲一卡二卡三卡| 国产一区日韩二区欧美三区| 精品一区在线视频| 日韩精品亚洲精品| 成人午夜毛片| 好色先生视频污| caoporm超碰国产精品| 无码人妻一区二区三区线| 精品国产自在精品国产浪潮| 91成人入口| 国产精品-区区久久久狼| 日本一区二区免费在线| 国产成人精品无码高潮| 91chinesevideo永久地址| 凹凸成人精品亚洲精品密奴| 天天色天天干天天色| 欧美日韩另类在线| 毛片在线看片| 国产一区二区三区四区五区在线| 日日夜夜精品视频免费 | 欧美日韩亚洲高清| www.中文字幕久久久| 97av自拍| 久久中文在线| 亚洲色婷婷一区二区三区| 日韩成人久久久| 996久久国产精品线观看| 国产伦精品一区二区三区四区视频_| 国产视频一区不卡| 亚洲黄色一级大片| 国产精品福利无圣光在线一区| 欧美在线黄色| 级毛片内射视频| 亚洲第一级黄色片| 日韩毛片免费看| 日韩精品一区二区三区久久|