精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

陶哲軒回應OpenAI新模型IMO奪金!GPT-5測試版也曝光了

人工智能 新聞
IMO被公認為全球最頂尖的數學競賽,每年只有不到8%的參賽者能夠獲得金牌。而現在,一個AI模型做到了。

OpenAI最新模型曝光了,在2025年國際數學奧林匹克競賽(IMO)上達到了金牌水平!

IMO被公認為全球最頂尖的數學競賽,每年只有不到8%的參賽者能夠獲得金牌。而現在,一個AI模型做到了。

新模型最終成績:新模型在總共6道題中成功解決了5道,獲得35分(滿分42分),超過了今年的金牌線。

圖片

OpenAI員工Alexander Wei還透露,GPT-5即將發布,但IMO金牌模型是一個實驗性研究,在幾個月內都沒有計劃發布。

他特別強調,這次成功并非依靠針對特定任務的狹隘方法,而是在通用強化學習和測試時計算擴展方面取得了新突破。

圖片

與此同時,第三方機構的開源代碼中被發現GPT-5-reasoning-alpha-2025-07-13的字樣。

圖片

這段代碼被挖出來后很快就被刪除或隱藏,結合OpenAI在新模型發布前會找第三方機構進行安全測試的慣例——

種種跡象表明,GPT-5離我們不遠了。

35分斬獲金牌,解題過程完全模擬人類考試

具體來看OpenAI的實驗性新模型,這次評測可不是隨便做個題那么簡單。

OpenAI團隊讓模型在與人類選手完全相同的條件下參加考試:兩場各4.5小時的考試,不能使用任何工具或聯網,只能閱讀官方題目陳述,然后用自然語言寫出證明過程。

圖片

最終成績出來了:模型在6道題中成功解決了5道,獲得35分(滿分42分),穩穩超過了今年的金牌線。

今年IMO的金牌分數線正好是35分,這個成績放在人類選手中也是妥妥的金牌水平。今年約600名參賽者中,只有5人拿到了滿分。

更讓人印象深刻的是評分過程的嚴謹性。每道題的解答都由三位前IMO獎牌獲得者獨立評分,只有在三人達成一致意見后才確定最終分數。

這次突破的意義不止于成績,正如研究團隊所說,IMO問題需要的是一種全新水平的持續創造性思維。

從推理時間跨度來看,AI的進步速度簡直讓人瞠目結舌:從GSM8K(頂尖人類約需0.1分鐘)到MATH基準測試(約1分鐘),再到AIME(約10分鐘),現在終于攻克了IMO(約100分鐘)這個需要長時間深度思考的難題。

更重要的是,IMO的答案是難以驗證的多頁證明,這與之前那些有明確正確答案的數學題完全不同。OpenAI團隊表示,他們突破了傳統強化學習中依賴明確可驗證獎勵的范式,創造出了能夠像人類數學家一樣構建精巧論證的模型。

圖片

唯一沒能攻克的是第六題——這道被參賽者稱為“最終Boss”的組合數學難題:

有一個2025×2025的單位正方形網格。瑪蒂爾達希望在網格上放置一些矩形塊,這些塊的大小可能不同,使得每個塊的每一條邊都位于網格線上,并且每個單位正方形最多被一個塊覆蓋。求瑪蒂爾達需要放置的最小塊數,使得網格的每一行和每一列都恰好有一個單位正方形未被任何塊覆蓋。

圖片

去年IMO題目中,谷歌用Alphaproof和AlphaGeometry完成了四道題,未完成的兩道也屬于組合數學。

不過這一次,DeepMind研究員Archit Sharma在OpenAI宣布后回復:“恭喜!搶在我們前面宣布了——第6題是新的基準了嗎?”

但這條推文很快就被刪除了。

這個小插曲引發了網友們的各種猜測:莫非Google的模型也達到了類似水平。

圖片

如果感興趣的話,還可以進一步查看OpenAI公開的AI解題過程,鏈接在文末獲取。

圖片

引發圈內熱議,陶哲軒發表長評

OpenAI模型斬獲IMO金牌的消息一出,AI圈炸開了鍋。不過,在一片贊嘆聲中,也出現了一些不同的聲音。

其中最受關注的,當屬數學界頂尖學者陶哲軒的表態,他在社交媒體上針對此事發表了長篇評論。

陶哲軒指出,雖然多家AI公司都聲稱在IMO題目上取得了好成績,但由于缺乏統一的測試環境和標準,很難進行公平比較。

人們很容易將當前AI的能力視為一個單一的量化指標——要么能搞定某件事,要么就完全不行。但其實不是這樣,AI到底有多厲害,這得看給它多少資源、多少輔助手段以及不同的結果呈現方式,種種因素影響下,AI能力能差出好幾個量級。

圖片

他特別強調:“在沒有預先公布方法論的情況下,不會對任何自我報告的AI競賽表現發表評論。”

圖片

陶哲軒用生動的比喻列舉了多項AI可能采取的措施:

給學生幾天時間來完成每道題,而非用四個半小時解答三道題。(稍微延伸一下:給學生的時間仍只有四個半小時,但領隊將他們放入某種昂貴且耗能巨大的時間加速裝置,在這段時間里,學生們會經歷數月甚至數年的時光。)

考試開始前,領隊將題目改寫成學生更易理解的形式。

領隊讓學生可以無限制使用計算器、計算機代數軟件、形式化證明輔助工具、教科書,或者擁有上網搜索的權限

領隊讓6名學生組成的團隊共同攻關同一道題,就各自的部分進展和遇到的瓶頸進行交流。

領隊給學生提示可行的解題方向,若發現有學生在明知不太可能成功的方向上耗費過多時間,便會進行干預。

團隊的6名學生都提交了解答,但領隊只挑選出“最佳”解答提交給競賽,其余的則棄之不用。

若團隊中沒有任何一名學生得出令人滿意的解答,領隊就完全不提交任何解答,悄無聲息地退出競賽,且無人知曉他們曾參與過。

而這些措施均改變了競賽形式從而影響題目難度。

圖片

與此同時,數學競賽評測平臺MathArena發布了獨立評測結果。

在他們的測試中,即使是表現最好的Gemini 2.5 Pro也只獲得了13分(31%),遠低于銅牌線19分。

圖片

測試使用了best-of-32的選擇策略,即對于每個模型的解答,首先生成32份回應,隨后借助“大語言模型評審系統”對這些回應進行評估,兩兩比對選出更優答案。

每份最終的模型答案生成成本至少為3美元,其中Grok-4模型每份答案的成本超過20美元,但即便如此,仍然沒有任何模型能達到獲獎牌的水平。

MathArena團隊也同步更新了OpenAI宣布實驗模型拿到IMO金牌的消息:

無法驗證這些結果是如何實現,期待該模型的發布以及使用MathArena基準進行獨立評估。

圖片

雖然OpenAI模型拿金牌的方法論未公開,但也有不少網友表示,不看過程,結果同樣具有意義。

圖片

OpenAI團隊對自己的成果充滿信心。

參與此項目的研究員Alexander Wei回憶說:“2021年,我的博士導師讓我預測2025年7月AI在數學上的進展,我當時預測MATH基準測試能達到30%(還覺得其他人都太樂觀了)。結果現在我們拿到了IMO金牌。”

圖片

OpenAI新模型解題過程:
https://github.com/aw31/openai-imo-2025-proofs/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-21 11:48:54

OpenAIIMOLLM

2025-09-04 09:04:13

2024-12-09 09:35:00

AI數據訓練

2025-10-13 02:00:00

2025-08-13 09:10:40

2025-07-21 09:04:00

OpenAI谷歌模型

2025-07-24 16:30:48

陶哲軒金牌AI

2025-08-11 08:09:17

2024-07-29 13:28:52

2025-10-20 08:57:00

2023-10-04 08:07:06

CopilotGitHub

2024-08-08 13:40:00

2025-10-11 15:44:23

陶哲軒

2025-11-06 09:02:00

2023-06-19 09:57:23

GPT-4技術

2023-12-16 12:47:59

2025-09-09 09:01:00

2024-02-26 08:30:00

2025-11-06 08:59:00

2023-06-08 07:58:29

點贊
收藏

51CTO技術棧公眾號

亚洲视频久久| 日韩国产一二三区| 91香蕉视频污| 国产成人精品综合| 大吊一区二区三区| 精品一级视频| 婷婷国产在线综合| 四虎永久在线精品免费一区二区| 亚洲在线精品视频| 欧美暴力喷水在线| 日韩精品在线观看视频| aaaaaa亚洲| 成人福利片网站| 成人精品小蝌蚪| 国产成人综合精品在线| 欧美xxxooo| 风间由美一区二区av101| 日韩欧美高清在线视频| 一区二区三区久久网| 国产 日韩 欧美 精品| 三级成人在线视频| 九九热在线精品视频| 成人在线一级片| 国产中文欧美日韩在线| 欧美性感美女h网站在线观看免费| 亚州欧美一区三区三区在线| 免费观看国产精品| 激情偷乱视频一区二区三区| 51精品在线观看| 一级片一级片一级片| 一道本一区二区三区| 欧美一区二区三区男人的天堂| 欧美日韩二三区| 18+激情视频在线| 日本一区二区三级电影在线观看| 成人免费在线看片| 亚洲怡红院av| 日韩黄色小视频| 91av在线免费观看视频| 国产97免费视频| 日韩大片在线播放| 亚洲欧美国产制服动漫| 动漫美女无遮挡免费| 欧美一区=区三区| 色综合久久综合网欧美综合网| www.69av| 久操视频在线观看| 国产精品你懂的在线欣赏| 日韩欧美国产一区二区三区| 激情综合网俺也去| 黄色在线观看www| 综合久久给合久久狠狠狠97色| 日本精品一区二区三区不卡无字幕| 亚洲欧美另类综合| 国产精品一区二区无线| 成人福利视频网| 这里只有精品999| 久久久久99| 欧亚精品中文字幕| 天堂网av手机版| 日韩亚洲精品在线| 久久久天堂国产精品女人| 免费一级片在线观看| 中文字幕日韩欧美精品高清在线| 中文字幕亚洲色图| 国产免费嫩草影院| 日韩电影二区| 色婷婷av一区二区三区久久| 影音先锋男人看片资源| 日韩精品网站| www.色综合| 日本精品在线免费观看| 欧美精品入口| 久久全球大尺度高清视频| 日本天堂网在线观看| 亚洲福利国产| 2025国产精品视频| 欧美黄色一级大片| 蜜臀av一区二区在线观看| 国产一区私人高清影院| 99久久夜色精品国产亚洲| 国产盗摄女厕一区二区三区| 国产精品国色综合久久| 日本免费不卡视频| 久久久久久一级片| 在线观看日韩羞羞视频| 亚洲羞羞网站| 午夜视频在线观看一区二区| 凹凸国产熟女精品视频| 51一区二区三区| 91精品国产乱码| 少妇熟女视频一区二区三区 | 国产成人精彩在线视频九色| 极品国产91在线网站| 久久成人18免费观看| 国产66精品久久久久999小说| 四虎影院在线播放| ...av二区三区久久精品| 日韩精品在线中文字幕| 国产私拍福利精品视频二区| 欧美一区三区四区| 欧美bbbbb性bbbbb视频| 欧美激情777| 97免费视频在线播放| 男人天堂视频在线| 国产大片一区二区| 日本精品一区| 精品一性一色一乱农村| 色婷婷国产精品| 性生生活大片免费看视频| 国产乱人伦精品一区| 中文字幕欧美日韩| 日本亚洲色大成网站www久久| 日韩精品欧美精品| 粉嫩av四季av绯色av第一区| 第九色区av在线| 一级女性全黄久久生活片免费| 国产真实乱子伦| 欧美h版在线观看| 亚洲性线免费观看视频成熟| 久久久久成人网站| 蜜桃精品在线观看| 欧美日韩国产高清视频| 日本动漫同人动漫在线观看| 欧美影视一区在线| 中文字幕一区三区久久女搜查官| 99精品全国免费观看视频软件| 2023亚洲男人天堂| 欧美一区二区三区成人片在线| 国产精品理伦片| 国产高清精品在线观看| 日韩国产在线不卡视频| 丝袜情趣国产精品| 中文字幕日韩一级| 国产成人精品免费一区二区| 亚洲国产综合自拍| 成人性生活视频| 精品电影一区二区| 永久看片925tv| 久久国产剧场电影| 先锋在线资源一区二区三区| 涩涩涩在线视频| 精品国产91洋老外米糕| 成人在线观看免费完整| 久久99国产精品麻豆| 日韩欧美99| 亚洲永久av| 国产偷亚洲偷欧美偷精品| 国产无套在线观看| 国产成人av一区二区三区在线 | 韩国精品久久久999| 精品国自产拍在线观看| 亚洲人午夜精品天堂一二香蕉| 四季av一区二区| 国产精品中文字幕亚洲欧美| 欧美一区二区.| 午夜国产在线视频| 黄色一区二区三区| 亚洲调教欧美在线| 免费中文字幕日韩欧美| 欧美不卡1区2区3区| 大胆人体一区二区| 国产午夜精品免费一区二区三区| 69xxxx国产| 国产欧美中文在线| 孩娇小videos精品| 91精品国产麻豆国产在线观看| 成人妇女免费播放久久久| 欧美成人三区| 日韩一区二区在线观看视频播放| 91嫩草|国产丨精品入口| 国产精品一区二区在线观看不卡| 黄色一级大片免费| 久久91在线| 日本午夜在线亚洲.国产| 九色在线观看| 欧美日韩你懂得| 婷婷伊人五月天| 国产成人午夜视频| 免费极品av一视觉盛宴| 白嫩白嫩国产精品| 茄子视频成人在线| 自拍视频在线网| 91精品国产一区二区三区蜜臀| 国产成人无码aa精品一区| 成人免费黄色在线| 黑鬼大战白妞高潮喷白浆| 青青草国产免费一区二区下载| 国产免费亚洲高清| 亚洲wwwww| 国产丝袜一区视频在线观看| 中日韩在线观看视频| 亚洲美女精品一区| aa片在线观看视频在线播放| 日韩综合一区二区| 视色,视色影院,视色影库,视色网| 成人18夜夜网深夜福利网| 日韩美女中文字幕| a级毛片免费观看在线| 日韩av在线网| 国产又黄又粗又硬| 欧美日韩国产专区| 国产美女久久久久久| 91老司机福利 在线| 五月天激情播播| 国产日韩欧美一区在线| 偷拍盗摄高潮叫床对白清晰| 久久免费视频66| 91精品久久久久久久久久久| 都市激情国产精品| 久久香蕉国产线看观看网| 性xxxx视频| 日韩视频在线你懂得| 久久久久久亚洲av无码专区| 亚洲一区在线看| 内射毛片内射国产夫妻| 99热在这里有精品免费| 中文字幕资源在线观看| 国产日韩欧美| 欧美 亚洲 视频| 成人嫩草影院| 精品蜜桃一区二区三区| 国产在线一区不卡| 国产精品自拍偷拍视频| 中文字幕在线视频网站| 欧美大片免费观看| 欧美成年黄网站色视频| 亚洲女人天堂av| 男人天堂av网| 91精品麻豆日日躁夜夜躁| 乱子伦一区二区三区| 欧美日韩国产一区在线| 久久精品99国产精| 18欧美亚洲精品| 国产精品久久久久无码av色戒| 懂色av一区二区三区免费观看| 激情文学亚洲色图| 久久电影国产免费久久电影| 91在线视频观看免费| 久久婷婷丁香| 国产淫片免费看| 亚洲精品护士| 久操网在线观看| 欧美日本一区二区视频在线观看 | 日韩av免费网站| www成人免费观看| 欧美精品激情视频| 在线观看av免费| 久久国产精品久久久久| 五月天婷婷在线视频| 最近2019年中文视频免费在线观看| 天堂中文字幕在线| 日韩电影中文字幕在线观看| 亚洲a视频在线观看| 日韩一区二区三区在线| 91午夜交换视频| 欧美乱熟臀69xxxxxx| 亚洲在线免费观看视频| 51精品视频一区二区三区| 亚洲综合免费视频| 3d动漫精品啪啪| 国产视频一区二区三区四区五区| 欧美日本视频在线| 国产老妇伦国产熟女老妇视频| 91精品视频网| 国内精品偷拍视频| 精品国产乱码久久久久久老虎| 亚洲成人一二三区| 欧美精品一区二区不卡| 无码国产精品96久久久久| 亚洲剧情一区二区| 97在线观看免费观看高清| 精品国产欧美一区二区三区成人| 激情影院在线观看| 久久久久国色av免费观看性色| аⅴ资源天堂资源库在线| 欧洲亚洲妇女av| 国产精品久久久久久久久免费高清 | 国产无套粉嫩白浆内谢| 亚洲成年人网站在线观看| 日韩av大片在线观看| 欧洲精品中文字幕| 99精品在线视频观看| 欧美精品一区二区在线观看| 亚洲欧美综合一区二区| 一区二区欧美日韩视频| 国产原创视频在线观看| 久久男人资源视频| 日韩一区二区三区免费视频| 91色视频在线导航| 高清日韩中文字幕| 日韩国产欧美一区| 欧美成人一品| 日本精品www| 韩国成人福利片在线播放| 老司机午夜免费福利| 国产色产综合产在线视频| 亚洲最大的黄色网址| 疯狂欧美牲乱大交777| 国产精品福利电影| 亚洲精品国产精品国产自| 99中文字幕一区| 久久久噜噜噜久久| 国产精品久久久久久吹潮| 国产一区二区免费电影| 久久综合成人| av7777777| 国产一区三区三区| 精品成人av一区二区三区| 亚洲精品亚洲人成人网在线播放| www亚洲视频| 日韩亚洲电影在线| eeuss影院www在线观看| 性欧美xxxx视频在线观看| 国产毛片精品久久| 久久久久网址| 欧美久久一级| 国产又大又黄又猛| 91视频一区二区三区| 欧美成人精品欧美一| 欧美伊人久久久久久久久影院| 男人天堂av网| 另类专区欧美制服同性| av成人在线播放| 精品不卡一区二区三区| 欧美va天堂在线| 在线能看的av网站| 久久久精品国产99久久精品芒果| 久一视频在线观看| 69av一区二区三区| 98在线视频| 国产精品精品视频| 亚州精品视频| 男人添女荫道口图片| 国产一区二区调教| 激情无码人妻又粗又大| 色8久久人人97超碰香蕉987| 色欲av永久无码精品无码蜜桃| 欧美大尺度激情区在线播放| 24小时成人在线视频| 亚洲高清在线播放| 日本三级亚洲精品| 国产高清一区二区三区四区| 精品国产乱码久久久久久天美| 国产91免费看| 欧美精品video| 日韩高清一区| 激情六月天婷婷| 国产精品91一区二区| av激情在线观看| 91精品一区二区三区久久久久久| av在线播放免费| 国产精品久久久亚洲| 成人婷婷网色偷偷亚洲男人的天堂| 三级4级全黄60分钟| 国产喂奶挤奶一区二区三区| 亚洲婷婷综合网| 亚洲性av网站| 国产精品久久久久久妇女| 一区二区免费在线视频| 精品一区二区三区欧美| 国产美女久久久久久| 欧美一区二区三区人| 日本理论片午伦夜理片在线观看| 91丝袜脚交足在线播放| 国精品一区二区三区| 91视频在线免费| 欧美日韩国产精品| 欧美一区二区少妇| 国产精品久久久久久av福利| 日韩www.| 免费观看黄网站| 亚洲成精国产精品女| 天堂中文资源在线| 国产精品爱久久久久久久| 日韩精品久久| 色哟哟免费视频| 无吗不卡中文字幕| 国产乱子伦三级在线播放| 成人性教育视频在线观看| 自拍欧美日韩| 欧美xxxxx精品| 91九色02白丝porn| 超碰最新在线| 精品国产乱码久久久久久108| 美女精品在线| 91免费公开视频| 亚洲福利在线观看| 久久天堂av| 色一情一乱一乱一区91| 不卡区在线中文字幕| 午夜精品久久久久久久蜜桃| 久久综合伊人77777尤物| 欧美黑白配在线| 午夜在线观看av| 亚洲18女电影在线观看| jyzzz在线观看视频| 国产精品yjizz| 日韩经典中文字幕一区| 波多野结衣家庭教师|