精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

剛剛,OpenAI最強推理模型o3-pro誕生!碾壓Gemini 2.5 Pro擊穿底價

開發 前端 人工智能
最強推理模型一夜易主!深夜,o3-pro毫無預警上線,刷爆數學、編程、科學基準,強勢碾壓o1-pro和o3。更驚艷的是,o3價格直接暴降80%,叫板Gemini 2.5 Pro。

毫無一絲防備,o3-pro就這樣低調登場了!

昨夜,OpenAI連放大招,先把o3價格暴降80%,又官宣上線史上最強推理模型——o3-pro。

圖片圖片

比起o3,o3-pro可要強太多了。

奧特曼稱,「當第一次看到它相對o3的勝率時,自己完全驚呆」。

圖片圖片

圖片圖片

o3-pro不再僅僅是一個通用型助手,而是兼具長思考、超長上下文,工具調用于一體的超級智能AI。

在多項基準測試中,o3-pro的數學、科學和編程性能驚艷,大幅超越了o1-pro。

甚至,大佬首測后發現,就連Gemini 2.5 Pro(0605)、Claude 4 Opus都被碾壓。

圖片圖片

甚至,它的價格只有o1-pro的87%,輸入20美元/百萬token,輸出80美元/百萬token。

圖片圖片

隨之一同降價的o3,更是讓AI圈瞳孔地震。現在,輸入2美元/百萬token,輸出8美元/百萬token,堪比GPT-4o。

圖片圖片

目前, o3-pro已向所有ChatGPTPro、Team用戶推出,o1-pro模型直接被淘汰。

o3-pro一發布,奧特曼發布最新長文「溫和的奇點」,直接暗示人類已經跨越了臨界點,技術大爆發開始。

圖片圖片

更值得期待的是,奧特曼劇透,OpenAI開源模型將在夏末發布,但不是6月。

圖片圖片

o3-pro一夜封神,數學編程全開掛

模型卡介紹,o3-pro是o3最強推理版,專為深度思考和提供超可靠答案而生。

它可以自動調用工具,包括網頁搜索、文件分析、視覺輸入推理、Python代碼執行,還能通過記憶功能實現個性化回答。

圖片圖片

在專家評估中,評審者更青睞o3-pro,尤其是在科學、教育、編程、商業和寫作輔助等領域。

而且,他們還一致認為,o3-pro在清晰度、全面性、指令遵循度、準確性方面表現更優。

圖片圖片

在AIME 2024、GPQA、Codeforces三大測試中,o3-pro拿下了最高分,完全碾壓o1-pro和o3。

圖片圖片

另外,在更嚴格的「4/4可靠性」評估標準——只有模型在4次嘗試中均回答正確,才算成功。

如下所示,o3-pro在數學、編程、博士級科學問答中,大幅超越o1-pro和o3。

圖片圖片

在ARC-AGI半封閉評估中,o3-pro完成ARC-AGI-1高難度任務通過率59%,單任務成本$4.16;在ARC-AGI-2中,其在所有推理任務僅有<5%通過率,單任務成本$4-7。

最終結論是,o3-pro與o3基本持平,o3新定價刷新了ARC-AGI-1的SOTA。

圖片圖片

OpenAI稱,由于o3-pro調用工具,思考長度拉長,響應速度通常比o1-pro慢。

有網友Yuchen Jin實測后發現,自己僅輸入「Hi im sam Altman」,o3-pro足足思考了3分54秒,最長能達到13分鐘。

燒了這么多錢,就回復一句hi,ChatGPT此刻內心獨白還看不到。

圖片圖片

圖片

當然了,OpenAI也發出提醒,最好是在可靠性優先于速度的復雜問題,再用o3-pro。

除此之外,o3-pro還存在一些限制:

  • 由于正在解決技術問題,o3-pro暫不支持臨時對話功能
  • o3-pro不支持圖像生成,生圖還得找GPT-4o、o3、o4-mini
  • o3-pro亦不支持Canvas功能

即便如此,o3-pro已經足夠聰明、足夠智能。

圖片圖片

AI大佬首測,感受AGI

Raindrop ai的Ben Hylak,提早就獲得了o3-pro的實測資格,帶來世界上首個早期的o3 pro測評。

圖片

Hylak表示,OpenAI將o3價格降低了80%,來為o3-pro的發布預熱。

售價20/80美元,正好支持了一個未經證實的社區理論:-pro變體是基礎模型的10倍調用。

超長上下文

試用o3-pro一周的Hylak,首先最大的感受就是,它的超長上下文太厲害了!

此前,他一直跟o系列的推理模型打交道,對o1/o1-pro的第一印象相當負面,但隨后,他意識到自己錯了。

關鍵就在于,不要和推理模型聊天,而是將它們視為報告生成器:提供上下文,設定目標,然后放手讓它們工作。

利用這個方法實測后,他發現:o3-pro比o3聰明太多,智能太多了!

圖片圖片

為了體現這一點,你需要給它提供更多的上下文。為此,他和聯創Alexis整理了Raindrop所有過去的規劃會議記錄,包括所有目標,甚至錄下了語音備忘錄:然后讓 o3-pro來制定計劃。

他們立刻被驚艷了!

o3-pro生成了一個非常具體的計劃和分析,包括目標指標、時間表、優先事項,以及嚴格指示必須削減的內容。

相比于o3,o3-pro給的計劃更加具體、更加扎實,直接改變了公司領導層對于未來的思考方式。

圖片圖片

與真實世界集成

如今的模型,就像一個智商極高的12歲少年,需要融入工作環境。而這種集成,主要依賴于工具調用,來考驗模型與人類、外部數據以及其他AI的寫作能力。

在這方面,o3-pro實現了真正的飛躍!

它能出色辨別自身環境;能準確傳達自己可訪問的工具,知道何時詢問外部世界的信息(而不是假裝自己擁有信息/權限),并選擇合適的工具來完成工作。

從下圖中可以看出,o3-pro(左)明顯比o3(右)更清楚地了解自己所處環境的限制。

圖片圖片

圖片圖片

當然,如果說o3-pro有什么缺點,那就是如果不給它足夠的上下文,它就容易想太多。

它在分析和利用工具完成任務上都令人驚嘆,但直接完成任務的能力就不那么強了。

圖片圖片

總而言之,o3-pro和Gemini 2.5 Pro、Claude Opus的體感極其不同,直接碾壓后兩者。

而令人期待的是,OpenAI正大力推動這一垂直RL的路徑(Deep Research,Codex),不僅教模型如何使用工具,還教他們如何推理該何時使用這些工具。

圖片

總而言之,要實現推理模型的最佳性能,上下文至關重要,這就像給餅干怪獸喂餅干。可以認為,這是一種啟動LLM記憶的方式。

網友實測

另網友已經秘密測試o3-pro一段時間了,他發現o3-pro比o1-pro更便宜(的多)、更快、更精確!

而且使用o3和o3-pro進行編碼簡直是天壤之別。

o3-pro是第一個能夠近乎完美地處理球與墻壁之間真實碰撞的模型。

圖片圖片

有網友要求o3-pro識別我們人類天然免疫系統的關鍵局限性,并向o3模型提出了同樣的問題。

結果是o3-pro的回復無疑更加明智、更加深思熟慮,表明新模型對免疫系統的理解更加深刻。

圖片圖片

還有網友用o3-pro來玩《我的世界》。

比如創建自己的「宏偉形象」(prompt: A majestic representation of yourself),效果也很驚艷。

圖片圖片

還有讓o3創建「細節豐富的海盜船」和「登月」場景,完成度非常之高。

圖片圖片

還有網友只用2個提示,o3-pro就用純HTML、CSS和JS在一個文件中制作出非常酷的極限空間行走模擬器。

空間中有復古風格的著色器、熒光燈、工作霧、標志、地面通風口,還有黑色空隙。

圖片圖片

在o1-pro也失敗的多層編碼理解能力測試中,o3-pro也一次性通過

輸入以下亂碼,模型需要先解碼再找到隱式提示詞,并最終輸出正確的單詞內容。

「YVdZZ2VXOTFJSFZ1WkdWeWMzUmhibVFnZEdocGN5d2dZVzV6ZDJWeUlIZHBkR2dnZEdobElIZHZjbVFnSW5KbGFXNWtaV1Z5SWdvPQo=」

圖片圖片

Ethan Mollick認為o3-pro相當智能,它解決了一個其他模型都無法解決的問題:制作從Space到Earth的單詞階梯。(注:即每次改變一個字母,從space—spare—...—garth—earth)

在這個問題上o3-pro (左) 打敗了Gemini 2.5 Pro (右)。

圖片圖片

其他網友在使用o3-pro進行研究后,甚至提出「Vibe Research」氛圍研究的說法!

他大膽預測,進行科學研究的方式將很快徹底改變并顯著提升。

網友讓o3-pro創建一個包含曼德博集合的 Excel 表格。

要求每個單元格都是一個像素,包含一個數字。最終的o3-pro給出的結果非常完美!

圖片圖片

o3價格暴降80%,谷歌繃不住了?

o3-pro的上線,注定要拉低o3的token價格。

原來o3輸入10美元/百萬token,輸出40美元/百萬token,現在直接擊穿底價,狂降80%。

圖片圖片

這么說吧,如今1美元,能用上5倍o3 token量。

圖片圖片

在Artificial Analysis報告中,將其與競家模型的價格做了可視化對比。

現在,o3價格要比Gemini 2.5 Pro還便宜,與Claude 4 Sonnet相當,但相較于Claude 4 Opus,更是暴降8倍。

圖片圖片

相較于自家模型,o3價格與GPT-4o不相上下,甚至輸出價格還要低。

除了生成圖像無法替代,o3的智能足以拿下GPT-4o。

此外,o3還與GPT-4.1每token價格持平。不過,前者輸出token量是GPT-4.1的7倍,因此每次查詢成本也要高得多。

圖片圖片

o3價格拉低,延續了智能成本持續快速下降的趨勢。

自發布以來,達到GPT-4級別智能的成本已降低超過100倍,同時突破新智能門檻的成本也在同步下降。

圖片圖片

此外,在輸出長度比較中,o3回復內容比Gemini 2.5 Pro和DeepSeek R1少很多,但比Claude 4 Opus多。

圖片圖片

參考資料:

https://x.com/gdb/status/1932561536268329463

https://www.latent.space/p/o3-pro

https://x.com/ArtificialAnlys/status/1932489573462081898

https://x.com/OpenAIDevs/status/1932532777565446348

https://help.openai.com/en/articles/9624314-model-release-notes


責任編輯:武曉燕 來源: 新智元
相關推薦

2025-06-11 14:48:11

OpenAIo3-proGemini

2025-06-13 08:11:11

2025-06-17 08:40:44

2025-04-10 06:16:33

2025-05-07 10:01:35

2025-06-11 09:19:46

2025-06-11 09:13:44

2025-05-13 08:24:14

2025-04-01 09:17:00

2025-04-17 09:02:00

2024-12-06 08:23:40

2025-05-07 13:57:05

谷歌I/O版視覺

2025-03-26 06:56:56

2024-09-24 11:01:03

2025-05-14 10:09:12

2025-04-23 08:30:05

2024-12-24 16:15:04

2025-06-13 14:15:57

2025-06-04 04:25:00

Claude 4ChatGPT o3模型

2025-05-19 08:33:00

點贊
收藏

51CTO技術棧公眾號

а 天堂 在线| 免费影院在线观看一区| 久久午夜无码鲁丝片| 国产精品18hdxxxⅹ在线| 亚洲午夜影视影院在线观看| 久久国产一区| 一本久道久久综合无码中文| 狠狠入ady亚洲精品| 亚洲精品99久久久久| 青青青青草视频| 男人天堂亚洲二区| 免费看欧美女人艹b| 色综合天天狠天天透天天伊人| 日本黄色录像片| h1515四虎成人| 亚洲精品乱码久久久久久| 久久久久久亚洲精品不卡4k岛国 | 无码人妻一区二区三区精品视频| 欲香欲色天天天综合和网| 亚洲欧洲一区二区三区| 精品免费视频123区| 亚洲图片视频小说| 免费永久网站黄欧美| 久99九色视频在线观看| 蜜桃av乱码一区二区三区| 99久久人爽人人添人人澡| 欧美性猛交xxxx乱大交退制版| 加勒比海盗1在线观看免费国语版| 天天在线女人的天堂视频| 国产麻豆视频精品| 国产伦精品免费视频| 一区二区三区福利视频| 激情欧美丁香| 欧美日本高清一区| 影音先锋男人看片资源| 欧美禁忌电影网| 日韩av影视综合网| 久久久无码人妻精品无码| 亚洲网站免费| 欧美日韩高清影院| 97公开免费视频| 在线中文字幕播放| 亚洲成人免费视频| 日本五级黄色片| 看黄网站在线| **欧美大码日韩| 亚洲午夜精品一区二区三区| 国产福利在线看| 国产无遮挡一区二区三区毛片日本| 国产综合动作在线观看| 北条麻妃一二三区| 国产精品一区二区在线观看不卡| 国产综合福利在线| 亚洲自拍第二页| 久久成人免费日本黄色| 国产欧美一区二区白浆黑人| 久久久久精彩视频| 免费精品视频在线| 国产美女主播一区| 国产精品一级视频| 国产美女主播视频一区| 亚洲最大福利视频网| a毛片在线免费观看| 国产精品一区二区免费不卡| 99porn视频在线| 一本色道久久亚洲综合精品蜜桃| 欧美freesex黑人又粗又大| 午夜精品视频在线观看| 国产亚洲黄色片| 日韩欧美精品一区二区三区| 色哟哟日韩精品| 青青草精品视频在线观看| 成人国产精品| 7777精品伊人久久久大香线蕉完整版| 色91精品久久久久久久久| 不卡的国产精品| 精品国产乱码久久久久久久 | 中文字幕第99页| 免费在线欧美视频| 91久久精品日日躁夜夜躁国产| 96日本xxxxxⅹxxx17| 国产精品一卡二| 精品综合久久久| 国产成人天天5g影院在线观看| 国产精品女同一区二区三区| 91传媒免费视频| 黄色污网站在线观看| 色婷婷久久久亚洲一区二区三区 | 久久久99精品久久| 亚洲精品视频一二三| 在线视频国产区| 日韩欧美在线视频观看| 午夜一级免费视频| 国产一区福利| 日韩网站免费观看| 五月天综合在线| 日韩国产在线一| www.成人av| 岛国在线大片| 亚洲国产毛片aaaaa无费看| 免费日韩视频在线观看| 精品成人18| 亚洲美女av电影| 日韩一级片av| 日本午夜一区二区| 国产精品乱码| 欧美13一16娇小xxxx| 红桃av永久久久| 中文字幕在线视频精品| 欧美一级色片| 欧美人成在线视频| 一级片在线免费播放| av亚洲精华国产精华精华| 亚洲精品一区二区三区蜜桃久| av影视在线| 欧美二区在线观看| 性高潮久久久久久久| 国产一区视频在线观看免费| 国产精品视频1区| 天堂а在线中文在线无限看推荐| 亚洲精品中文字幕乱码三区 | 国产无遮挡又黄又爽又色| 日韩av不卡一区二区| 国产福利久久精品| 黄色av免费在线| 91黄色免费看| 久久丫精品国产亚洲av不卡| 国内揄拍国内精品久久| 国产日本欧美一区二区三区在线| 青青视频在线观| 亚洲午夜电影在线| 欧美熟妇另类久久久久久多毛| 日韩精品免费一区二区在线观看| 欧美在线观看视频| 五月婷婷丁香花| 亚洲一区精品在线| 26uuu国产| 欧美视频成人| 999国产在线| 91一区二区三区在线| 欧美久久一二三四区| 99国产精品免费| 日韩一区精品字幕| 日本欧洲国产一区二区| 三级中文字幕在线观看| 精品国产乱码久久| 日本一区二区网站| www.激情成人| 欧美成人三级在线视频| 精品国产18久久久久久洗澡| 久久久人成影片一区二区三区| 性网爆门事件集合av| 亚洲精品成人悠悠色影视| 91福利视频免费观看| 国产一区美女| 久久精品第九区免费观看| 性欧美18xxxhd| 亚洲欧美精品suv| 精品无码一区二区三区的天堂| 久久精品人人做人人爽人人| 欧美性猛交久久久乱大交小说| 精品av一区二区| 国产精品老女人精品视频 | 欧美疯狂性受xxxxx另类| 亚洲av无码乱码国产麻豆 | 在线观看亚洲黄色| 欧美激情一区二区三区四区| 亚欧激情乱码久久久久久久久| 久久久9色精品国产一区二区三区| 成人黄色av网站| 色婷婷视频在线观看| 亚洲第一黄色网| 欧美特黄aaaaaa| 国产精品美女久久久久aⅴ | 精品理论电影| 成人黄色av网| 大菠萝精品导航| 国产一区二区成人| av在线免费在线观看| 亚洲一级二级三级在线免费观看| 人人妻人人澡人人爽人人精品 | 国产精品视频男人的天堂| 九七久久人人| 亚洲国产成人精品久久| 极品国产91在线网站| 亚洲天堂免费看| 性欧美丰满熟妇xxxx性久久久| 久久亚洲二区| 可以在线看黄的网站| 日韩精品免费一区二区夜夜嗨 | www日本视频| 日韩欧美亚洲综合| 青青草国产在线观看| 99精品欧美一区二区三区综合在线| 99精品免费在线观看| 亚洲乱码精品| 久久精品人成| 综合久久av| 日韩免费在线免费观看| 最新超碰在线| 中国china体内裑精亚洲片| 亚洲精品97久久中文字幕| 色综合久久六月婷婷中文字幕| 日韩av手机在线免费观看| 91丨porny丨国产| 在线免费黄色小视频| 日韩精品电影一区亚洲| 日韩网站在线免费观看| 国产精品久久久久9999赢消| 欧美精品免费观看二区| 视频二区欧美毛片免费观看| 国产精品欧美一区二区三区奶水| 超碰资源在线| 久青草国产97香蕉在线视频| 国产毛片av在线| 日韩av网站电影| www.五月婷婷| 91精品国产福利| 中文字幕在线观看国产| 狠狠色香婷婷久久亚洲精品| 久久精品99久久久久久| 国产精品久久久久久久久图文区| 久久精品一区二区免费播放| 国产a级毛片一区| 国产乱码一区二区三区四区| 日韩精品色哟哟| 黄色免费视频大全| 尤物在线精品| av动漫在线播放| 五月天久久777| 亚洲欧洲三级| av资源久久| 日韩精品不卡| 国产成人ay| 欧美在线激情| 国产精品日韩精品中文字幕| 蜜桃999成人看片在线观看| 丁香婷婷成人| 成人性色av| 99久久免费精品国产72精品九九 | 久久97视频| 麻豆成人小视频| 伊人春色精品| 日本不卡在线播放| 国产亚洲一区| 色女孩综合网| 日韩欧美自拍| 人人妻人人澡人人爽精品欧美一区| 欧美韩日一区| 在线不卡日本| 91精品国产91久久久久久密臀| 中文字幕一区二区三区有限公司| 91久久久精品国产| 特大黑人娇小亚洲女mp4| 欧美淫片网站| 免费看欧美黑人毛片| 一区视频在线| 1024精品视频| 日韩av在线免费观看不卡| caopor在线视频| 免费在线一区观看| 久草福利在线观看| 懂色av一区二区夜夜嗨| 亚洲少妇18p| 国产日韩欧美精品综合| 2017亚洲天堂| 亚洲欧美电影院| 亚洲国产精品成人无久久精品| 舔着乳尖日韩一区| 91在线视频免费播放| 欧美日韩专区在线| 精品人妻一区二区三区四区不卡| 精品剧情v国产在线观看在线| 三级在线观看网站| 一道本无吗dⅴd在线播放一区| 日本三级视频在线播放| 九九精品在线视频| 在线成人av观看| 91精品久久久久久久久| 一区二区在线免费播放| 久久天天狠狠| 婷婷伊人综合| 激情伊人五月天| 麻豆一区二区99久久久久| 99999精品| 91年精品国产| 亚洲色图综合区| 欧美日韩亚洲成人| 国产精品视频在线观看免费| 亚洲黄色av女优在线观看 | 免费一区二区三区在线观看| 国产精品1区2区| 亚洲v国产v欧美v久久久久久| 亚洲免费av观看| 区一区二在线观看| 日韩欧美国产综合| 高清毛片在线看| 欧美国产日本高清在线| 天天综合网天天| 国产一区二区高清不卡| 久久国产电影| 欧美一区二区三区爽大粗免费| 九九**精品视频免费播放| 亚洲av成人片色在线观看高潮| 成人免费视频在线观看| 久久久久女人精品毛片九一| 日韩欧美高清dvd碟片| 国产精品久久一区二区三区不卡| 欧美日本高清视频| 亚洲资源在线| 日本一区二区三区四区高清视频 | 日韩www.| 欧美性久久久久| 国产一区二区三区久久久| 久久久久亚洲av无码a片| 亚洲国产aⅴ成人精品无吗| 91福利在线观看视频| 亚洲天堂开心观看| 98色花堂精品视频在线观看| 亚洲va电影大全| 久久在线视频免费观看| 黄网站欧美内射| 国产成人在线视频免费播放| 青青青视频在线免费观看| 色天天综合色天天久久| 丝袜+亚洲+另类+欧美+变态| 欧美激情精品久久久| 精品久久国产一区| 成人手机视频在线| 蜜臀久久99精品久久久画质超高清| 玖草视频在线观看| 一区二区三区日韩欧美精品| 国产精品无码一区二区桃花视频| 中文字幕日韩在线播放| 99九九久久| 亚洲成人在线视频网站| 日韩经典中文字幕一区| 成人午夜福利一区二区| 欧美视频裸体精品| 日韩一区二区三区中文字幕| 久久久中精品2020中文| 盗摄系列偷拍视频精品tp| 乱熟女高潮一区二区在线| 国产福利一区二区三区| 亚洲最大的黄色网址| 91精品欧美一区二区三区综合在 | 精品久久久久中文字幕小说| 黄色片一级视频| 久久精品一区蜜桃臀影院| 一区二区三区福利视频| 亚洲性av网站| 欧美爱爱视频| 在线观看成人免费| 国产成人高清视频| 黄色一级片免费看| 精品偷拍一区二区三区在线看| 免费福利视频一区二区三区| 欧美日韩在线一二三| 日本亚洲免费观看| 天天鲁一鲁摸一摸爽一爽| 日韩精品资源二区在线| 3344国产永久在线观看视频| 久久99精品久久久久久青青日本| 久久精品免费| 国产又粗又猛又爽又黄的视频四季 | 5566av亚洲| 白浆在线视频| 玛丽玛丽电影原版免费观看1977 | 人妻精品久久久久中文字幕69| 玉足女爽爽91| 亚洲欧美综合在线观看| 国产91亚洲精品| 91高清一区| 国产精品一区二区人妻喷水| 色婷婷综合久久久中文一区二区| 91在线播放网站| 亚洲专区国产精品| 在线欧美视频| 国产黄色录像视频| 日韩一区二区在线观看视频播放| 黄在线观看免费网站ktv| 日韩欧美在线一区二区| 国产一区二区在线观看视频| 国产情侣在线视频| 中文字幕成人在线| 91精品久久久久久综合五月天| 情侣黄网站免费看| 亚洲精品日韩一| 日韩欧美在线观看一区二区| 国产一区二区在线免费视频| 亚洲国产精品一区制服丝袜| 国产91丝袜美女在线播放| 91麻豆精品国产91久久久使用方法 | 婷婷亚洲五月| 欧美图片一区二区| 制服丝袜亚洲色图| 亚洲欧洲高清| 小泽玛利亚av在线| 国产无人区一区二区三区| 成人午夜免费在线观看|