精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini 原創

發布于 2025-6-11 12:36
瀏覽
0收藏

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

經歷了 5 月份的“買買買”的節奏之后,6月的 OpenAI 終于開始對谷歌的Gemini 2.5 Pro 發起了反擊。

今天凌晨,Sam Altman 動作非常密集。先是宣布 o3 價格“截肢”(價格直接降至 1/5 ),緊接著不到 2 小時后就發布了 o3-pro。

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

那么,o3-pro 究竟怎么樣?

現在 OpenAI 放出來的各種測評評分顯示:o3-pro 是目前認知能力、智商最高的 SOTA 模型,甚至超過了人類的平均水平。

一項 IQ 測試結果顯示,o3 的智商得分為 135,遠高于人類 90-110 的平均水平。 

其他高分產品包括 Anthropic 的 Claude-4 Sonnet(127 分)和 Google 的 Gemini 2.0 Flash(126 分)。

還有一位此前已經“秘密測試”的大牛,進行了經典的“六角彈珠跳”測試,而且難度也升級了幾倍。最后呈現的結果非常驚艷、絲滑。

比 o1-pro 便宜得多、更快、更精確(而且使用 o3 和 o3-pro 進行編碼簡直是天壤之別)  即將進行一些很酷的測試,首先是(當然)更堅固的六角彈跳球  o3-pro 是第一個能夠近乎完美地處理球與墻壁之間真實碰撞的模型。

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區

當然,沒有完美的模型。更好的智慧往往也伴隨著更慢的思考。已經有手快的網友對 o3-pro 的速度表示汗顏。

在 X 上,Hyerbolic Labs 聯合創始人兼首席技術官 Yuchen Jin發布了他使用 o3-pro 的幾張截圖,結果就簡單一句“Hi,I'm Sam Altman”,結果就浪費了他 3 分鐘和價值 80 美元的token。

只能說,推理王者,恐怖如斯,氪金更如斯,這跟進了大觀園的劉姥姥吃鴿子蛋一樣,一不留神,一兩銀子一個的鴿子蛋就掉地上了。

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

但,提前對 o3-pro 進行“秘密測試”不止上面那位,接下來才是重頭戲。

Altman 在接下來的推文中引用這樣一段用戶的評論——

“o3 給我們的計劃是可行的、合理的;但 o3 Pro 給我們的計劃是具體的、根深蒂固的,它實際上改變了我們對未來的看法。”

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

這句評論深得 Altman 的贊同。而這篇文章就出自一位大神,Raindrop.ai 聯合創始人 Ben Hylak,博文的名字:《God is hungry for Context: First thoughts on o3 pro》。

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

這篇博文篇幅不長,但非常具有啟發性,甚至可以說是:細思極恐。

比如 Hylak 指出:這不是大模型在「回答問題」,這是它在「接管問題」。

再比如:我們遇到的瓶頸不再是模型太笨,而是它們太聰明,卻還不能真正“落地”。

與 Claude、Gemini相比,它的認知水平像是換了一個維度(降維打擊)!

Hylak 還給出了創作者一個實用的建議:多喂給 o3-pro 上下文!

o3 Pro 不適合做「碎片問題」處理器,而是做「背景清晰的執行者」。

想讓它出彩?你需要給它足夠多的背景信息、清晰目標、甚至系統級提示(system prompt),然后看它如何把碎片拼成答案。

好話不多說,這就幫大家奉上這篇干貨。建議大家收藏細讀。

o3-pro 版本的威力

正如「泄露」的一樣,OpenAI 今天將 o3 的價格大砍 80%(從每百萬 token $10/$40 降到 $2/$8,和 GPT-4.1 持平!),為 o3-pro 的發布鋪平了道路(定價為 $20/$80)。這個定價也支持了社區的一種未經證實的猜測:-pro 版本相當于「10 倍調用基礎模型 + 多數表決」的組合,在 OpenAI 的論文和我們 Chai 節目中都有提及。

根據 OpenAI 提供的數據,o3-pro 在人類測試者中的勝率為 64%,在 4 項穩定性測試中也略優于 o3。但正如 Sam Altman 所說,當你「以不同方式」使用它時,才能真正看到它的能力擴展。

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

我在過去一周里拿到了 o3 pro 的早期訪問權限,以下是我的一些初步看法:

上帝渴望上下文

我們正處在「任務特化模型」的時代。一方面,是像 GPT-3.5 Sonnet、GPT-4o 這樣的“普通”模型——我們像朋友一樣和它們聊天,它們幫我們寫東西、回答日常問題;另一方面,是那些龐大、緩慢、昂貴、智商拉滿的推理模型,我們會在需要深度分析、解決復雜問題、探索智力邊界時調用它們(它們擅長批判性思維)。

關注我 X(推特)的人知道,我與 o 系列推理模型的關系是一段旅程。o1/o1-pro 初體驗其實挺差的,但看著大家都在贊美它,我硬著頭皮堅持用了一陣,才意識到——原來是我用錯了方式。

我寫了篇總結,被 @sama ratio(按)了,還被 @gdb 轉推。

關鍵在于: 不要「聊天」,而要把它當作「報告生成器」來用。給它足夠多的上下文、設定清晰目標,然后放手讓它去跑。

而這正是我現在使用 o3 的方式。

注:這里的“報告生成器”,其實是我們在 AINews、Deep Research、Brightwave 中最常見的 LLM 用法。

o3 pro 更聰明,真的更聰明——但你得喂它很多上下文

問題也正出在這里:它確實更聰明,但你必須給它大量上下文才能看到。我幾乎要把上下文喂到斷供。

沒有那種“問它一個問題就被震撼到”的瞬間。

但我換了種方式。

我和我的聯合創始人 Alexis 把我們所有的公司會議記錄、目標設定歷史,甚至語音備忘錄統統整理出來,打包喂給 o3-pro,然后讓它制定一個規劃方案。

結果令人震撼:它給出的計劃不僅具體、合理,而且包含了關鍵指標、時間線、優先級排序、哪些事情該砍,全部都有——這正是我一直希望 LLM 能做出來的東西。

o3 給的是「合理」的建議,o3 pro 給的是「扎實具體,足以改變我們未來規劃思路」的方案。

這種能力,在評測表格上是體現不出來的。

融入真實世界,是下一個挑戰

使用 o3 pro 讓我意識到:模型的“單兵作戰”能力已經太強,我們幾乎要用光「標準測試題」了。

接下來的挑戰,不是它聰不聰明,而是它能不能真正融入世界。就像一個 IQ 超高的 12 歲少年要上大學:再聰明也沒用,如果沒法融入社會,還是無法工作。

目前這種「融入」主要靠工具調用:模型能不能和人協作、能不能接入外部數據、能不能與其他 AI 協同?

o3 pro 在這方面確實邁出了一大步。它明顯比 o3 更擅長感知自己的環境、準確知道自己有哪些工具、什么信息需要去問外部、該怎么選對工具來完成任務。

如下圖左側所示:o3 pro 對自己處境的理解,明顯比 o3 要準確得多。

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

不足之處

在早期使用中,我也注意到:

如果不給足夠上下文,它會有點“過度思考”。它在分析方面很強,使用工具執行任務也很棒,但“直接動手做”的能力反而不如 o3。

比如有些關于 ClickHouse SQL 的問題,反而是 o3 表現更好。

你的使用體驗可能會有所不同(YMMV)。

o3 pro一手真體驗!上下文喂到斷供!大神:o3 pro不會聊天,上帝渴望上下文,認知能力降維打擊Gemini-AI.x社區圖片

與其他模型相比

o3 pro 給人的感覺和 Claude Opus、Gemini 2.5 Pro 完全不同。

Claude Opus 讓人覺得「很大」,但我從沒真正感受到它的“大”體現在哪。而 o3 pro 的回答就是比別人好,它的認知水平像是換了一個維度。

OpenAI 現在顯然在深耕“垂直強化學習”(Vertical RL)這條路,比如 Deep Research、Codex——不僅是讓模型會用工具,而是要讓它學會「何時」用工具、為什么用工具。

結語:上下文仍是王道

推理模型的最佳提示方式,其實沒變。我之前寫的 o1 提示指南依然有效。

上下文就像是喂給餅干怪獸的餅干:這是種“人肉加持的記憶體系”,但它很有效,因為它是有目標的。

系統提示(System Prompt)現在也變得非常重要,模型已經非常可塑,提示詞、工具、記憶這些組成的“harness”(約束機制)決定了最終產品的好壞。

像 Cursor 之所以好用,就是 harness 設計得好。

作者最后還附加了一些其他雜項觀察,比如:

  • 系統提示對模型行為的塑造,遠比 o3 時代更強。
  • 與 Claude Opus、Gemini 相比,o3 pro 是「質的飛躍」。
  • OpenAI 真正在做的是:不是教模型“怎么做”,而是教它“什么時候做、是否該做”。

好了,文章到這里結束了。

多說一嘴,蘋果前不久還炮轟了各種推理大模型,說大模型壓根不會推理,所謂的深度推理不過是另一種形式的模式匹配而已。

大家如何看待此次 OpenAI 新推理模型的發布呢?有沒有一種“天塌了”的感覺,小編認為:或許,我們的確應該重新思考一個問題——

我們繼續讓大模型聊天、回答問題,已經不重要了!因為聰明不聰明已經不重要了!畢竟智商都超過了人類,剩下的應該問:

大模型「能不能融入現實」,真正成為生產力的人類參與者!

本文轉載自??51CTO技術棧??,作者:云昭

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
欧美二区乱c少妇| 久久久精品免费网站| 九九精品在线播放| 一级全黄裸体片| 岛国在线视频网站| 欧美国产丝袜视频| 亚洲综合视频1区| 在线观看 中文字幕| 精品国产乱码久久久| 制服丝袜激情欧洲亚洲| 韩日视频在线观看| 国模吧精品人体gogo| 国内精品免费在线观看| 97香蕉久久超级碰碰高清版| 日本猛少妇色xxxxx免费网站| 日韩精品视频中文字幕| 色综合久久综合| 宅男一区二区三区| 男人的天堂在线视频| 国产精品一区免费在线观看| 欧美一区深夜视频| 中文字幕另类日韩欧美亚洲嫩草| 国产一区二区三区不卡视频网站| 日韩一区二区不卡| 香港日本韩国三级网站| 美女搞黄视频在线观看| 亚洲女同女同女同女同女同69| 欧美精品久久久| 欧美自拍偷拍第一页| 久久99国产精品免费网站| 青草青草久热精品视频在线网站 | 一区二区精品视频在线观看| 国产亚洲毛片在线| 欧美激情亚洲国产| 永久免费看片直接| 日韩综合在线| 亚洲网在线观看| 中文精品在线观看| 麻豆视频一区| 欧美xxxxxxxxx| 欧美日韩理论片| 在线视频成人| 欧美日韩一区二区三区在线| 久久国产色av免费观看| 中文字幕在线视频久| 午夜欧美在线一二页| 黄色一级大片免费| 中文在线观看免费| 亚洲欧美二区三区| 国产成年人在线观看| 免费高清在线观看| 国产精品久久久一区麻豆最新章节| 日韩欧美精品在线不卡| 免费国产在线观看| 国产日产欧美一区二区三区| 欧美精品一区二区三区四区五区 | 色婷婷成人网| 欧美妇女性影城| 中文字幕1234区| 成人污污视频| 精品日产卡一卡二卡麻豆| 欧美国产日韩在线视频| 欧美日本三级| 精品久久久久一区| 午夜av免费看| 窝窝社区一区二区| 亚洲一区二区久久久| 日本综合在线观看| 日韩av自拍| 久久久国产精品视频| 亚洲色婷婷一区二区三区| 国产精品vip| 亚州av一区二区| 日韩一级片中文字幕| 热久久一区二区| 91久久精品美女高潮| xxxwww在线观看| 99精品欧美一区二区三区综合在线| 蜜桃欧美视频| 自拍视频在线免费观看| 亚洲精品日韩专区silk| 久久久亚洲精品无码| 99久久伊人| 精品国产亚洲一区二区三区在线观看| 亚洲成av人片在线观看无| 中文字幕亚洲影视| 啊v视频在线一区二区三区| 久久艹精品视频| 久久亚洲风情| 亚洲bt欧美bt日本bt| 天堂在线观看免费视频| 久久久www免费人成精品| 少妇熟女一区二区| 日本蜜桃在线观看视频| 精品视频全国免费看| 欧美老女人bb| 国产一区二区三区四区五区| 欧美成人精品一区| 日韩精品一区二区亚洲av| 精品在线一区二区| 精品一区二区不卡| 久热国产在线| 狠狠爱在线视频一区| 国产乱码一区二区三区四区| 日韩av不卡一区| 久久久999国产| 99久久精品国产亚洲| 久国产精品韩国三级视频| 久草热久草热线频97精品| 在线视频婷婷| 高潮白浆女日韩av免费看| 91热视频在线观看| 国产一区二区三区电影在线观看| 久久久久久久91| 亚洲一区二区三区网站| 99精品国产一区二区三区不卡| 一本一道久久久a久久久精品91| 青青草视频在线免费直播| 欧美午夜一区二区| 右手影院亚洲欧美| 欧美精品首页| 国产日韩欧美综合| 国产片在线观看| 精品国产福利视频| 欧美xxxx黑人| 亚洲精品一区二区妖精| 国产成人精品电影| 无码国产色欲xxxx视频| 一区二区三区免费看视频| www.cao超碰| 成人黄色av| 国产精品高潮视频| 暖暖视频在线免费观看| 精品成人av一区| 欧美久久久久久久久久久| 五月婷婷亚洲| 国产日韩中文字幕在线| 国产在线高清| 色乱码一区二区三区88| 人妻无码中文久久久久专区| 亚洲视频日本| 99久热re在线精品视频| 亚洲羞羞网站| 日韩视频一区二区三区在线播放 | 孩娇小videos精品| 欧美亚洲国产激情| 国产精品天天狠天天看| 超碰免费在线观看| 欧美午夜不卡视频| 亚洲一级黄色录像| 蜜臀av一区二区在线免费观看| 欧美婷婷久久| 日本成人片在线| 在线看国产精品| 在线免费观看av片| 亚洲欧美自拍偷拍| 精品国产午夜福利在线观看| 亚洲欧美一级二级三级| 99精品99久久久久久宅男| 草莓视频丝瓜在线观看丝瓜18| 日韩欧美国产精品一区| 精品无码人妻一区二区三区品| 成人黄色av电影| 国产精品999视频| 蜜桃一区二区三区| 国产精品视频yy9099| 精品国产99久久久久久| 欧美一级二级三级蜜桃| 国产无码精品在线播放| 91视频91自| 国产喷水theporn| 欧美一区91| 精品乱码一区| 素人一区二区三区| 九色精品美女在线| 婷婷av一区二区三区| 一本久久a久久精品亚洲| 日本在线观看网址| 丁香六月综合激情| av免费在线播放网站| 日韩在线视屏| 国产精品一区二区不卡视频| 成人线上视频| www.欧美精品一二三区| 亚洲国产精品成人久久蜜臀| 偷偷要91色婷婷| 99久久99久久精品免费看小说.| 国产一区二区三区免费在线观看 | 多野结衣av一区| 国产一区二区三区在线观看网站| 亚洲综合网av| 五月天视频一区| 国产不卡在线观看视频| 国产高清在线精品| 青青青在线视频免费观看| 欧美女人交a| 日韩欧美三级电影| 亚洲码欧美码一区二区三区| 国产成人精品视频| 色av手机在线| 中文字幕欧美亚洲| 神宫寺奈绪一区二区三区| 欧美日韩久久久久久| 日韩美女黄色片| 日韩毛片视频在线看| 搡老熟女老女人一区二区| 黑人精品欧美一区二区蜜桃| 色综合久久久久无码专区| 91精品国产乱码久久久久久| 久久久综合香蕉尹人综合网| 日韩精品一区二区三区中文在线 | 91麻豆成人精品国产| 亚洲va欧美va人人爽午夜| 国产日产在线观看| 91免费版在线看| 国产成人精品一区二区在线小狼 | 天天天综合网| 欧美日韩综合精品| 黄色美女久久久| 91亚洲精品丁香在线观看| 粉嫩91精品久久久久久久99蜜桃| 91精品国产91久久| 精精国产xxxx视频在线中文版| 中文字幕欧美国内| 免费在线毛片| 亚洲精品国产精品久久清纯直播| 精品国产亚洲AV| 欧美精品一二三| 又骚又黄的视频| 欧洲另类一二三四区| 在线天堂中文字幕| 精品人伦一区二区三区蜜桃免费| 看片网站在线观看| 亚洲精品国产视频| 日韩精品一区二区亚洲av性色| 日本一区二区三区四区在线视频| 蜜臀av一区二区三区有限公司| 大胆亚洲人体视频| av天堂一区二区| 成人午夜免费电影| 美女黄色一级视频| 成人福利电影精品一区二区在线观看| 青娱乐国产精品视频| 另类小说一区二区三区| 91福利国产成人精品播放| 免费在线观看成人| 波多野结衣xxxx| 久久精品国产亚洲高清剧情介绍 | 国产尤物在线视频| 欧美日韩加勒比精品一区| 香蕉视频一区二区| 亚洲成a人v欧美综合天堂下载| 精品99在线观看| 亚洲图片欧美色图| 日韩成人在线免费视频| 欧美日韩国产精品一区| 毛片视频网站在线观看| 欧美日韩亚洲天堂| 精品久久久久久久久久久久久久久久| 一本一本久久a久久精品综合麻豆| 粉嫩aⅴ一区二区三区| 日韩欧美成人免费视频| 无码人妻aⅴ一区二区三区有奶水| 91国偷自产一区二区开放时间| 中文亚洲av片在线观看| 在线不卡的av| 国产综合视频在线| 日韩精品在线电影| 91九色在线porn| 久久亚洲精品小早川怜子66| 成人午夜在线影视| 91福利视频网| 成人一区视频| 超碰97在线资源| 亚洲精品小区久久久久久| 亚洲欧美日韩国产yyy| 国产精品国内免费一区二区三区| 91国在线高清视频| 免费永久网站黄欧美| 亚洲这里只有精品| 国产99一区视频免费| 中文字幕在线观看网址| 中文字幕一区二区三区av| 国产在线视频第一页| 日本道精品一区二区三区 | 男人皇宫亚洲男人2020| 成人福利免费观看| 另类ts人妖一区二区三区| 日韩av不卡播放| 国产精品xvideos88| 毛片av免费在线观看| 国产一区二区精品久久91| 久久国产精品无码一级毛片 | 日韩精品一区二区在线播放| 欧美亚洲禁片免费| 狠狠人妻久久久久久综合麻豆| 亚洲男人天堂2023| 调教一区二区| 国产精品美女www| 99a精品视频在线观看| 日韩欧美视频一区二区| 欧美激情五月| 久热精品在线播放| 91视频精品在这里| 久久99久久久| 欧美老肥妇做.爰bbww| 欧美在线观看在线观看| 欧美精品做受xxx性少妇| 巨胸喷奶水www久久久免费动漫| 国产精品美女久久久久av福利| 日韩精品永久网址| 国产免费黄视频| 国产成人av一区二区三区在线 | 亚洲综合男人的天堂| 亚洲视频在线观看一区二区| 日韩精品中文字幕在线播放| 影音先锋中文在线视频| 国产日韩在线亚洲字幕中文| 国产精品美女久久久久久不卡| 欧美性潮喷xxxxx免费视频看| 久久99精品久久久久久国产越南 | 最新精品国偷自产在线| avav在线播放| 国产精品一区二区在线观看不卡| 人成免费在线视频| 欧美综合色免费| 毛片在线免费| 欧美在线亚洲一区| 青青一区二区| av免费观看大全| 丁香激情综合五月| 久久国产一级片| 欧美成人伊人久久综合网| av香蕉成人| 91探花福利精品国产自产在线| 久久精品国产www456c0m| 99免费视频观看| 国产农村妇女毛片精品久久麻豆 | 麻豆成人在线视频| 欧美电影免费提供在线观看| a级在线观看| av成人免费观看| 欧美精品97| jjzz黄色片| 亚洲成人av福利| 天天舔天天干天天操| 97成人在线视频| 欧美男人操女人视频| 亚洲熟妇无码另类久久久| 97久久精品人人做人人爽 | 亚洲人成高清| 少妇激情一区二区三区视频| 精品成人av一区| 黄网站在线观看| 国产精品欧美激情| 999精品视频| 久久久久久久久久久影视| 亚洲二区在线视频| 视频国产一区二区三区| 国产97人人超碰caoprom| 不卡一区2区| 日本网站在线看| 亚洲成av人片观看| 三级黄视频在线观看| 国产精品久久久久久影视| 天堂美国久久| 国产高潮视频在线观看| 色综合久久综合网欧美综合网| av一区在线观看| 超碰在线观看97| 亚洲欧美高清| 中文字幕求饶的少妇| 精品国产网站在线观看| 国模套图日韩精品一区二区| 亚洲欧洲一区二区| 国产成人丝袜美腿| 日韩精品在线免费视频| 中文字幕精品久久久久| 日韩成人视屏| 成人三级视频在线播放| 国产精品伦理一区二区| 亚洲精品成人电影| 日本sm极度另类视频| 色呦哟—国产精品| 伦理片一区二区| 欧美日韩综合不卡| 国产极品人妖在线观看| 欧美日韩一区二区视频在线| 狠狠网亚洲精品| 一区二区三区福利视频| yellow中文字幕久久| 美女扒开腿让男人桶爽久久动漫| 麻豆一区二区三区视频| 夜色激情一区二区| yourporn在线观看视频| 国产精品一区二区三区观看| 免费欧美在线视频| 亚洲另类欧美日韩| 久久综合久久88| 视频国产一区|