精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

剛剛,奧特曼發(fā)布GPT-5!人人免費用「博士級」智能,基準(zhǔn)圖錯誤遭全網(wǎng)吐槽

人工智能 新聞
奧特曼也是連發(fā)十幾條推特,介紹 GPT-5 的看點。因為信息點比較多,我們就以奧特曼的推特內(nèi)容為依據(jù)為大家一一介紹。

都看了嗎?

等了多年的 GPT-5,終于在這個凌晨發(fā)布了。

image.png

我們一臉的期待,直播中 OpenAI 幾位核心人員的緊張也肉眼可見。

直播過程中,奧特曼也是連發(fā)十幾條推特,介紹 GPT-5 的看點。

因為信息點比較多,我們就以奧特曼的推特內(nèi)容為依據(jù)為大家一一介紹。

首先,這是一個集成模型。也就是說,你用它的時候不需要在不同模型之間切換,它會自己決定何時需要深入思考。

image.png

盡管奧特曼強(qiáng)調(diào) benchmark 不重要,但他們還是曬出了不少跑分結(jié)果,比如在數(shù)學(xué)、編程、視覺感知和健康領(lǐng)域。具體跑分如下:

  • 數(shù)學(xué)領(lǐng)域:在 2025 年 AIME 測試中無工具輔助達(dá)到 94.6%
  • 實際編程應(yīng)用:SWE-bench Verified 達(dá)到 74.9%,Aider Polyglot 達(dá)到 88%
  • 多模態(tài)理解:MMMU 達(dá)到 84.2%
  • 健康領(lǐng)域:HealthBench Hard 達(dá)到 46.2%
  • 通過 GPT-5 pro 的擴(kuò)展推理能力,該模型還在 GPQA 測試中創(chuàng)造了新的 SOTA,在無工具輔助的情況下得分 88.4%。 

費用方面,GPT-5 分為免費版、Plus 和 Pro 計劃。根據(jù)奧特曼的說法,免費版也能用上「博士級別的智能」(GPT-5 普通版,但帶推理功能),Plus 用戶在使用頻率上限制更少,而 Pro 用戶可以用上 GPT-5 Pro。

面向開發(fā)者,GPT-5 的三個版本 API 價格如下:標(biāo)準(zhǔn)版 GPT-5 為每百萬輸入 Token 1.25 美元,每百萬輸出 Token 10 美元,GPT-5 mini 版 與 Nano 版會更便宜。

image.png

雖然直播長達(dá)一個多小時,但 OpenAI 大部分時間都在介紹 GPT-5 有多「好用」。

比如在教育方面,它可以在幾分鐘之內(nèi)生成數(shù)百行代碼,生成互動內(nèi)容來解釋復(fù)雜概念,比如伯努利效應(yīng)。

圖片

在寫作方面,GPT-5 的文筆比 GPT-4o 要好。

image.png

在編程方面,它可以用幾分鐘時間寫出一個法語學(xué)習(xí)網(wǎng)頁,幫你練發(fā)音,還能做題、玩游戲。

圖片

語音模式也得到了升級,語音語調(diào)更加自然,想聊多久聊多久,語速也能隨便調(diào),非常適合拿來學(xué)外語。

image.png

之前我們報道過的「AI 看病」功能,他們也做了專門的優(yōu)化,還請了一位癌癥患者現(xiàn)場分享自己的經(jīng)歷,以及 ChatGPT 在解釋病情方面給予她的幫助。奧特曼表示,GPT-5 是迄今為止最好的健康模型。

image.png

不過,現(xiàn)場也出了一些小 bug,比如做出的跑分圖竟然是錯的,奧特曼也承認(rèn)了錯誤:

image.png

這樣的錯誤還不止一個:

b98651c75b9660bc1a1bfe7445170eac.png

更尷尬的是,馬斯克也跑來拆臺,轉(zhuǎn)發(fā)了 GPT-5 在 ARC-AGI-2 上沒有打敗 Grok 4 的消息:

image.png

連關(guān)于減少幻覺方面的 demo,也被人挑出了毛病:

image.png

不過,有人說,這不是「幻覺」問題,而是數(shù)據(jù)來源就有問題。

image.png

總體來看,GPT-5 的表現(xiàn)在很多人看來沒有達(dá)到預(yù)期。

image.png

image.png

那么,GPT-5 的各方面表現(xiàn)到底怎么樣?我們來看一下技術(shù)博客中的詳細(xì)信息。

一體化智能系統(tǒng)

GPT?5 是一個包含三個模型的統(tǒng)一系統(tǒng):回答大部分常規(guī)問題的高效應(yīng)答模型、解答復(fù)雜難題的深度推理模型「GPT?5 Thinking 模式」,以及根據(jù)對話類型、問題復(fù)雜度、工具需求及用戶明確指令(例如輸入 "深入思考這個問題")自動分配最優(yōu)處理模型的實時 router。

該 router 系統(tǒng)通過用戶切換模型行為、回答偏好數(shù)據(jù)及準(zhǔn)確率反饋等實時信號持續(xù)優(yōu)化。當(dāng)使用量達(dá)限時,各模型的精簡版本將接管后續(xù)查詢。

OpenAI 計劃在近期將這些能力融合至單一終極模型。

GPT?5 不僅在基準(zhǔn)測試中表現(xiàn)優(yōu)于前代模型、響應(yīng)速度更快,更重要的是 —— 它能更有效地處理現(xiàn)實場景中的各類需求。

OpenAI 表示,GPT5 在三大關(guān)鍵領(lǐng)域取得重大突破:顯著降低幻覺生成、提升指令遵循精度、減少迎合性回答。同時,GPT?5 在 ChatGPT 最常用的三大功能場景(文本創(chuàng)作、編程開發(fā)、健康咨詢)中表現(xiàn)全面提升。

評估

接下來,就讓我們看下 GPT-5 在各項基準(zhǔn)上的成績。

據(jù)博客介紹,GPT?5 在各項能力上均實現(xiàn)顯著提升,尤其在數(shù)學(xué)、編程、視覺理解和健康領(lǐng)域表現(xiàn)突出。數(shù)學(xué)領(lǐng)域,無工具輔助下 GPT-5AIME 2025 測試達(dá) 94.6%;真實場景編程,GPT-5 得分分別為 SWE-bench Verified 74.9%/Aider Polyglot 88%,多模態(tài)理解上 MMMU 84.2%,及健康領(lǐng)域 HealthBench Hard 46.2%。搭載擴(kuò)展推理能力的 GPT?5 專業(yè)版更在 GPQA 基準(zhǔn)測試中以 88.4% 的成績(無工具輔助)創(chuàng)下新紀(jì)錄。

image.png

不應(yīng)將使用工具的 AIME 結(jié)果與不使用工具的模型的性能直接進(jìn)行比較;這是 GPT-5 如何有效利用可用工具的一個例子。

chart.png

chart (1).png

chart (2).png

chart (3).png

編碼基準(zhǔn)

image.png

指令遵循與智能工具調(diào)用能力:GPT?5 在指令遵循和智能工具調(diào)用基準(zhǔn)測試中表現(xiàn)顯著提升。這類能力使其能夠可靠地執(zhí)行多步驟請求、跨工具協(xié)同操作,并適應(yīng)上下文變化。實際應(yīng)用中,這意味著 GPT?5 更擅長處理復(fù)雜且動態(tài)變化的任務(wù):它能更精準(zhǔn)地遵循用戶指令,并充分利用現(xiàn)有工具端到端地完成更多工作環(huán)節(jié)。

image.png

chart (5).png

這是一個 GPT-5 寫的小游戲 demo:

圖片

多模態(tài)基準(zhǔn)

該模型在多模態(tài)基準(zhǔn)測試中表現(xiàn)卓越,涵蓋視覺、視頻、空間及科學(xué)推理等多個領(lǐng)域。增強(qiáng)的多模態(tài)能力意味著 ChatGPT 能更精準(zhǔn)地解析圖像等非文本輸入 —— 無論是解讀圖表數(shù)據(jù)、總結(jié)演示文稿照片,還是回答基于示意圖的提問。

image.png

image.png

健康基準(zhǔn)

image.png

經(jīng)濟(jì)價值型任務(wù)表現(xiàn)

在 OpenAI 內(nèi)部一個評估基準(zhǔn)上,GPT5 同樣表現(xiàn)卓越,該測試專門評估模型在復(fù)雜、經(jīng)濟(jì)價值知識型工作上的表現(xiàn)。在啟用推理功能時,GPT?5 在大約半數(shù)案例中的表現(xiàn)達(dá)到或超越人類專家水平,同時在法律、物流、銷售、工程等 40 多個職業(yè)領(lǐng)域的綜合任務(wù)表現(xiàn)上全面優(yōu)于 o3 模型和 ChatGPT Agent。

chart (6).png

上述評估的方法論說明:GPT-4o 的測試結(jié)果基于截至 2025 年 8 月 ChatGPT 中的最新模型版本。所有模型均在 "高推理強(qiáng)度" 設(shè)置下進(jìn)行評估。需注意的是,ChatGPT 中的推理強(qiáng)度可調(diào)節(jié),而 "高" 強(qiáng)度代表用戶使用模型時可能體驗到的性能上限。

更快、更高效的 Thinking 模式

GPT?5 能以更少的思考時間創(chuàng)造更大價值。評估數(shù)據(jù)顯示,在視覺推理、智能體編程和研究生級科學(xué)問題解決等場景中,啟用思考功能的 GPT?5 性能表現(xiàn)優(yōu)于 OpenAI o3 模型,同時輸出 token 量減少 50-80%。

chart (7).png

chart (8).png

chart (9).png

這里,OpenAI 特意提到,GPT?5 是在微軟 Azure AI 超級計算機(jī)上訓(xùn)練的。

當(dāng)然,GPT-5 也第一時間就上線到了微軟的平臺。

image.png

為了應(yīng)對最具挑戰(zhàn)性、最復(fù)雜的任務(wù),OpenAI 還發(fā)布了 GPT-5 pro,以取代 OpenAI o3-pro。GPT-5 pro 是 GPT-5 的一個變體,它能夠長時間思考,使用可擴(kuò)展且高效的并行測試時間計算,從而提供最高質(zhì)量和最全面的答案。

GPT-5 pro 在多項極具挑戰(zhàn)性的智能基準(zhǔn)測試中取得了 GPT-5 系列中的最高性能,包括在包含極其困難的科學(xué)問題的 GPQA 上取得的領(lǐng)先性能。

此外,我們還是把 GPT-5 的模型系統(tǒng)卡放到最后,感興趣的讀者們可以自行研究。

image.png

  • 鏈接:https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb52f/gpt5-system-card-aug7.pdf

值得一提是這張圖,展示了今天發(fā)的 GPT-5 系列模型與前幾代 OpenAI 模型之間的關(guān)聯(lián):

image.png

最后,還是想問一句:GPT-5 符合你的預(yù)期嗎?是不是更期待 DeepSeek-R2 了?

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-08-08 06:39:22

2025-08-08 09:29:29

2025-08-20 09:02:00

2025-02-13 09:10:47

2024-01-22 13:57:00

模型訓(xùn)練

2025-08-18 09:57:30

2025-09-15 09:13:00

2025-02-13 08:38:42

2025-09-16 09:13:00

2025-08-08 07:39:52

2025-08-04 09:15:00

2023-12-19 19:50:49

GPT-5OpenIA風(fēng)險

2025-08-08 07:43:12

2024-03-21 06:56:03

2021-03-15 10:03:10

框架自動化開發(fā)

2025-08-11 09:22:00

2025-08-08 08:19:45

2025-08-11 08:42:00

GPT-5AI模型

2025-02-13 10:52:56

2024-01-09 12:53:16

模型訓(xùn)練
點贊
收藏

51CTO技術(shù)棧公眾號

精品久久中出| 久久久久久久久久久人体 | 亚洲av午夜精品一区二区三区| 成年人网站在线| 成人高清视频免费观看| 欧美在线视频网| 综合 欧美 亚洲日本| 久久免费精品| 欧美网站在线观看| 国产精品jizz在线观看老狼| 男人天堂手机在线观看| 久久成人免费| 欧美日本亚洲视频| 免费污网站在线观看| 久久在线观看| 一本到不卡精品视频在线观看| 亚洲无玛一区| 无码精品在线观看| 精品一区二区日韩| 日韩av免费在线看| 精品无码一区二区三区电影桃花| 亚洲素人在线| 日韩精品中文字幕在线一区| 人妻无码视频一区二区三区| 女子免费在线观看视频www| 国产视频一区在线播放| 国产成人成网站在线播放青青| 中文字幕+乱码+中文字幕明步| 国产综合精品一区| 啊v视频在线一区二区三区 | 国产精品国产馆在线真实露脸| 国产伦精品一区二区三区在线| 中文字幕码精品视频网站| 亚洲精品看片| 欧美男插女视频| 国产精品酒店视频| 九九热爱视频精品视频| 亚洲第一精品久久忘忧草社区| 三级性生活视频| 日韩精品影院| 欧美日韩精品在线播放| 国产爆乳无码一区二区麻豆 | 久久伊人精品一区二区三区| 亚洲一区二区自偷自拍| 日韩理论电影中文字幕| 欧美精品一区二区三区在线播放 | 成人久久精品| 欧美性三三影院| aⅴ在线免费观看| 玖玖在线播放| 亚洲高清免费在线| 成人av在线不卡| 精品自拍一区| 中文字幕一区二区三区精华液 | 精品资源在线看| av午夜一区麻豆| 国产乱码一区| 人妻一区二区三区四区| 国产成人精品亚洲777人妖| 91久久久久久久一区二区| 一区二区日韩视频| 久久99久久99| 91美女高潮出水| 国产精品无码久久av| 久久99在线观看| 亚洲a∨日韩av高清在线观看| 91成品人影院| 国产一二精品视频| 91精品国自产在线观看| 亚洲AV无码一区二区三区性| 粉嫩av亚洲一区二区图片| 电影午夜精品一区二区三区| 不卡视频在线播放| 成人精品gif动图一区| 国产在线观看一区| 四虎影院在线域名免费观看| 成人一区二区三区视频在线观看| 成人9ⅰ免费影视网站| 日批视频免费播放| 久久影视一区二区| 午夜精品福利一区二区| 国产超级va在线视频| 一区二区三区**美女毛片| 男女激情免费视频| 自拍偷拍欧美视频| 欧美日韩一区久久| 一级黄色大片免费看| 久久久亚洲欧洲日产| 亚洲美女激情视频| 国产天堂av在线| 在线视频观看日韩| 国产精品白嫩初高中害羞小美女 | 蜜桃视频在线观看一区二区| 91亚洲精品在线观看| 黄色一级大片在线免费看国产一| 91视视频在线观看入口直接观看www | av亚洲精华国产精华精华| 欧美性大战久久久久| 老司机免费在线视频| 精品国产福利在线| 国产91色在线观看| 国产精品一区二区三区美女| 中文亚洲视频在线| 国产一级一级片| 奇米888四色在线精品| 成人av资源| 番号集在线观看| 亚洲午夜久久久久久久久电影网| 少妇高清精品毛片在线视频| 秋霞影院一区| 国产一区二区三区网站| 久久久精品视频免费| 奇米色一区二区| 国产另类自拍| 精品欧美色视频网站在线观看| 天天综合日日夜夜精品| 蜜桃福利午夜精品一区| 国产99久久| 色综合天天综合网国产成人网| 波多野结衣电影在线播放| 成人综合在线观看| 色香蕉在线观看| 久久精品女人天堂av免费观看| 欧美一级在线观看| 国产99在线 | 亚洲| 国产日本精品| av免费精品一区二区三区| 99re在线视频| 在线中文字幕不卡| 在线观看av中文字幕| 欧美片第1页综合| 国产日韩欧美中文| 国产女主播在线写真| 婷婷夜色潮精品综合在线| 波多野结衣网页| 欧美电影免费播放| 国产精品吊钟奶在线| 香蕉视频黄色片| 亚洲亚洲人成综合网络| www.日本久久| 99久久婷婷| 国产精品亚洲аv天堂网| 精品视频二区| 色婷婷综合中文久久一本| 极品人妻一区二区三区| 99成人在线| 国产日韩精品一区观看| 丰满的护士2在线观看高清| 欧美成人精品1314www| 日韩va亚洲va欧美va清高| 麻豆成人综合网| 影音先锋欧美在线| 四虎永久精品在线| 日韩一级黄色av| 在线观看国产黄| 国产精品欧美一级免费| 蜜桃免费在线视频| 成人激情诱惑| 国产欧美一区二区三区视频| 2017亚洲天堂1024| 欧美精品久久99久久在免费线 | 国产探花一区二区| 国产精品成人播放| 成人在线免费观看| 欧美福利视频导航| 国产乱国产乱老熟300| 国产高清精品网站| 蜜臀av色欲a片无码精品一区| 国产精品sss在线观看av| 97视频com| 精品资源在线看| 欧美日产在线观看| 五月天婷婷色综合| 成人三级在线视频| 久草精品在线播放| 99re66热这里只有精品8| 91色精品视频在线| 成年网站在线视频网站| 亚洲乱码一区av黑人高潮| 国产91精品看黄网站在线观看| 亚洲国产高清在线观看视频| 欧美又黄又嫩大片a级| 国产精品a级| 久久99国产精品| 国产在视频一区二区三区吞精| 久久av.com| 欧美性受xxxx狂喷水| 色噜噜偷拍精品综合在线| 自拍偷拍你懂的| 国产激情一区二区三区桃花岛亚洲| 日韩 欧美 视频| 激情五月色综合国产精品| 亚洲一区二区三区视频播放| 高清在线视频不卡| 中文字幕亚洲欧美一区二区三区 | 亚洲欧美国产一区二区三区 | 日韩av中文在线观看| 欧美日韩一区二区三区电影| 欧美国产不卡| 国产日产欧美精品| 成年女人在线看片| 精品国产一区二区三区久久久狼| 丰满人妻一区二区三区无码av| 色欲综合视频天天天| 免费成年人视频在线观看| 91丨porny丨首页| 无码人妻一区二区三区在线视频| 久久亚洲色图| 女人色极品影院| 色综合天天爱| 久久riav| 亚洲码欧美码一区二区三区| 国产精品亚洲欧美导航| 成人一级福利| 久久伊人91精品综合网站| 黄色av网址在线免费观看| 欧美变态凌虐bdsm| 怡春院在线视频| 欧美日韩在线一区| 久久久久久久久久久久国产| 国产精品久久久久久久久图文区| 制服丝袜第二页| 高潮精品一区videoshd| 成人不卡免费视频| 蜜桃av噜噜一区二区三区小说| 老太脱裤让老头玩ⅹxxxx| 欧美一区高清| 在线观看精品视频| 欧美在线电影| 欧美午夜欧美| 色狼人综合干| 黑人中文字幕一区二区三区| 日韩在线亚洲| 91麻豆成人久久精品二区三区| 久久久久久久久久久人体| 成人在线播放视频| 亚洲免费视频一区二区| 人妻夜夜爽天天爽| 精品成人佐山爱一区二区| 99在线观看免费| 欧美日韩国产首页在线观看| 国产精品无码粉嫩小泬| 一本久久a久久精品亚洲| 亚洲欧美自拍视频| 欧美日韩精品国产| 久久久久99精品成人片三人毛片| 午夜在线电影亚洲一区| 国产精品a成v人在线播放| 亚洲一级不卡视频| 日本三级中文字幕| 精品久久久久国产| 日韩av黄色片| 欧美性猛交xxxx黑人| 久久青青草视频| 色偷偷一区二区三区| 中文字幕天堂在线| 欧美亚洲动漫另类| 亚洲影院一区二区三区| 欧美日韩极品在线观看一区| 亚洲午夜激情视频| 欧美一级国产精品| 国产xxxx孕妇| 精品对白一区国产伦| 香蕉视频911| 国产一区二区三区直播精品电影 | 99久久精品费精品国产一区二区| 国产二级一片内射视频播放| av电影一区二区| 欧美色图亚洲激情| 中文字幕精品一区| 中文字幕电影av| 亚洲成人免费影院| 无码人妻精品一区二区三区9厂 | 日韩有码一区| 日韩欧美视频第二区| 欧美疯狂party性派对| 亚洲精品天堂成人片av在线播放 | 亚洲国产高清在线观看视频| 国产传媒免费在线观看| 亚洲综合久久久| 五月天婷婷久久| 欧美日韩另类一区| 亚洲男女视频在线观看| 亚洲精品视频免费| 午夜免费视频在线国产| 欧美精品久久久久久久久久| 亚洲最新无码中文字幕久久| 成人在线一区二区| 久久成人福利| 亚洲国产午夜伦理片大全在线观看网站| 99久久九九| 精品欧美一区免费观看α√| 美国一区二区三区在线播放| 国产精品成人99一区无码| 日本一区二区高清| 国产精品成人久久| 欧美日韩在线不卡| 亚洲av电影一区| 日韩在线不卡视频| 极品视频在线| 成人免费视频a| 亚洲国产合集| 伊人网在线免费| 丝袜亚洲精品中文字幕一区| 中文字幕久久久久久久| 国产午夜精品一区二区三区嫩草 | 1pondo在线播放免费| 97热在线精品视频在线观看| 亚洲国产精选| 欧美一区二区三区成人久久片| 午夜精品亚洲| 99re精彩视频| 26uuu另类欧美| 青青草成人免费| 精品视频全国免费看| 亚洲av成人无码网天堂| 欧美国产日韩视频| 亚洲视频自拍| 日韩资源av在线| 妖精视频成人观看www| 成人在线短视频| 国产精品福利av| 无码人妻av一区二区三区波多野 | 亚洲成人免费在线| 99热这里只有精品在线观看| 色青青草原桃花久久综合| 一区二区三区电影大全| 精品视频第一区| 欧美福利电影在线观看| 日本一二区免费| 国产午夜精品久久久久久久| 成人午夜视频在线播放| 精品国产免费人成电影在线观看四季 | 日韩国产欧美区| 91jq激情在线观看| 成人av片网址| 亚洲欧美文学| 精品国产午夜福利在线观看| 中文字幕一区二区日韩精品绯色| 在线观看免费av片| 亚洲另类激情图| 亚洲色图官网| 欧美日韩在线不卡一区| 欧美一级一区| 亚洲AV无码国产成人久久| 欧美日韩一区二区精品| 日韩电影免费| 欧美做受高潮电影o| 一区二区三区四区在线看| 北条麻妃69av| 久久久噜噜噜久噜久久综合| youjizz在线视频| 亚洲欧美综合精品久久成人| 欧美专区福利免费| 亚洲欧洲另类精品久久综合| 久久精品国产77777蜜臀| 99热这里只有精品4| 在线播放国产精品二区一二区四区| 精品国产99久久久久久| 不卡视频一区二区三区| 在线播放一区| 在线 丝袜 欧美 日韩 制服| 一本到高清视频免费精品| www.成人.com| 96国产粉嫩美女| 亚洲福利一区| 亚洲图片综合网| 色婷婷久久99综合精品jk白丝| 成年人在线观看| 91久久国产综合久久91精品网站 | 欧美日韩xxx| 欧美韩一区二区| 国产无套粉嫩白浆内谢的出处| 国产精品私房写真福利视频| 国产视频www| 午夜精品视频在线| av影片在线一区| 亚洲免费在线播放视频| 亚洲va天堂va国产va久| 国产资源在线观看| 亚洲一区二区少妇| av成人黄色| 日本爱爱小视频| 精品国产一区二区三区av性色| 在线免费看h| 中文字幕精品一区日韩| 成人综合婷婷国产精品久久蜜臀 | 欧美丰满嫩嫩电影| 91超碰在线播放| 亚洲 国产 日韩 综合一区| 国产一区二区视频在线播放| 日操夜操天天操| 中文字幕欧美精品在线| 精品丝袜久久| 美女在线视频一区二区| 婷婷久久综合九色综合伊人色| 免费在线午夜视频| 久久综合中文色婷婷| 国产伦理精品不卡| 人人妻人人爽人人澡人人精品|