精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-5通過“哥德爾測試”!獨創性解決博士生都得花幾天時間的開放數學問題

人工智能 新聞
GPT-5這次挑戰的并不是奧賽題,而是高等數學里的簡單猜想。

GPT-5,你這家伙!

究竟還有什么事是我不知道的?

在一篇最新論文中,研究人員讓它挑戰了5個尚未解決的優化猜想。

結果它居然解出了其中3個!

更令人吃驚的是,其中有一道題,它甚至給出了與研究者預期完全不同的、同樣有效的證明方案。

和國際數學奧林匹克(IMO)那些為“人類天才高中生”準備的題目不同,這次的測試題需要博士水平的研究者花上幾天才能完成。

在論文里,研究者們還特意“挑釁”陶哲軒對大語言模型數學能力的印象——

它可不是“笨蛋”研究生,而是能展現出獨創性的“聰明”博士生。

前微軟研究副總裁、現OpenAI科學家Sebastien Bubeck表示:

這意味著GPT-5能夠解決一些真正的開放性數學問題。

接下來,就讓我們看看,這位AI數學天才是怎么煉成的。

“哥德爾”測試

如上所述,GPT-5這次挑戰的并不是奧賽題,而是高等數學里的簡單猜想。

求解這類問題不僅需要算術能力,還需要相當強的數學背景和邏輯推理能力。

研究人員把他們的測試稱為:哥德爾測試

哥德爾測試里的問題需要人自己動腦、經過訓練才能解決,而且在現有文獻中找不到現成答案。

(注:這里哥德爾測試與哥德爾不完全性定理基本沒啥關系)

在這篇論文中,總共5個問題基本都來自組合數學(Combinatorial mathematics)的一個子領域——

子模最大化(submodular maximization)

什么是子模最大化呢?

簡單來說,子模函數的核心在于邊際收益遞減。

假設有一個函數 f(S),輸入是一個集合S,輸出是一個數值。

當集合越來越大時,增加一個新元素帶來的“增量收益”會越來越小。

而子模最大化,就是在給定的約束條件下,選擇一個集合,使得總收益 f(S)盡可能最大。

舉例來說,這就好像在社媒轉發視頻,第一個轉發的用戶往往能帶來很多觀看量(傳播給更多的人)。

但隨著轉發的人越來越多,每增加一個人的額外效果就越來越小(因為他的好友大部分已經看過了視頻)。

所以,關鍵是選出一批用戶(集合S),好讓總傳播量最大。

這就是子模最大化在實際問題中的優化目標,在測試中,GPT-5所應對的就是類似的優化問題。

GPT-5五中三

那么,GPT-5在這些猜想上的表現如何呢?

在五道測試題中,研究者給出最小化描述和參考文獻,沒有提供解題提示,讓模型自主生成解答,測試其數學推理能力。

總的結果如下:

  • 當問題有單一、直接的推理路徑時,GPT-5表現良好。在五道題中,前三道題的證明接近正確。
  • 對于第二題,GPT-5推導出的新近似證明既否定了原始猜想,又給出了有效解法
  • GPT-5對已知證明的改寫通常足夠,但略顯表面化:它傾向于跳過未變的步驟,并嚴格模仿原始結構,而非尋求更自然的替代方法,這類似人類的偷懶行為。
  • GPT-5在第四題和第五題上均未成功,這兩道題需要結合至少2個不同文獻里的洞見,這種綜合推理能力似乎是GPT-5的主要局限之一
  • 在第五題上,GPT-5識別出了研究團隊心中所想的算法,但未能正確分析。
  • 相比早期模型,GPT-5在基礎數學能力上顯示出明顯提升(至少在組合優化領域如此),并偶爾展現獨創性。
  • 提示詞對性能影響顯著。當被要求提供完整證明時,GPT-5更傾向于保留中間步驟而非跳過,從而生成更完整和自洽的解答。
  • 第四題和第五題的錯誤證明最初看似合理且令人信服,但仔細檢查后發現存在深層次缺陷。這凸顯了前沿模型在數學推理中的核心局限:輸出可能表面上正確,但本質上錯誤

第一題:最大化“單調 + 非單調”的子模函數

在第一個題目中,GPT-5 的任務是最大化一個由單調DR-子模函數和非單調DR-子模函數組成的目標函數,約束條件是一個下閉凸集合。

研究者希望它不僅給出解,還要提供可量化的性能保證,說明算法輸出離理論最優解有多近,并要求提供嚴格的數學證明。

為了完成這個任務,GPT-5只能依靠對問題的理解和參考文獻,自主生成解答,沒有任何額外提示。

具體的prompt如下:

對此,GPT-5每步沿最“貪心”的方向微調解,然后用函數的結構保證最終結果接近最優。

對于GPT-5的回答,研究人員表示雖然GPT-5沒有設計全新的方法,但它緊貼參考資料,給出了總體正確的證明。

第二題:子模函數最大化的雙重標準(bicriteria)算法

在這道題里:

  • GPT-5要最大化一個單調子模函數。
  • 同時要滿足一個約束條件(p-system)。

也就是說,GPT-5面對的任務是:在更復雜的組合約束下,找到既能最大化函數又盡量滿足約束的解。

研究人員給GPT-5的提示里附上了兩篇關于子模最大化的雙重標準算法和p-系統約束下非雙重標準子模優化的論文。

具體的prompt如下:

GPT-5解題過程如下:

在第二題中,GPT-5給出的答案比研究者最初猜想的更合理,因為隨著約束復雜度增加(p 值變大),問題確實會更難。

整體來說,GPT-5 的推導基本正確,但有兩個小問題:

  • 在某個關鍵不等式里,它多寫了一步,其實沒必要,這讓結果看起來有些復雜,但核心思路沒錯。
  • 當約束最簡單(p=1)時,GPT-5忘記了某個參數的精確值,只給出了一個上界。

換句話說,它沒完全注意到在特例下可以算出更準確的數字,但總體邏輯還是對的。

總的來說,GPT-5能理解問題、給出合理的推導,偶爾會有些“懶”或者忽略細節,但整體表現已經非常接近研究者預期。

第三題:在凸集合約束下最大化弱DR-子模函數

第三題要求:在凸集合約束下,最大化一個具有這種放寬性質的連續單調函數。

prompt如下:

研究人員猜想:用文獻中類似Frank-Wolfe的算法來求解這個問題,可以保證得到相應的近似解。

GPT-5解題過程如下:

總體來看,GPT-5 的回答基本正確,但有些小問題。

之后,研究團隊又讓GPT-5生成了一個新的證明版本。

在新版本的回答中,GPT-5的回答更詳細,幾乎是從頭再來。

總體來看,GPT-5回答正確性較高,但仍有小細節和可讀性問題。

第四題:在基數約束下最大化部分單調的弱子模函數

第四個猜想是將非單調弱子模函數、m-單調性的放寬結合起來,研究弱子模且m-單調的集合函數最大化問題。

prompt如下:

研究人員假設:可以利用函數的m-單調性,對論文證明中使用的變量的取值得到新的界。

這些新的界在m>0時應優于論文中給出的界,并將它們代入同一論文的定理中,從而可以得到改進后的結果。

GPT-5的解題過程如下:

在這道題中,GPT-5并沒有真正給出這個問題的結果,它只是把已知的東西復述了一遍。

后續,研究者又讓GPT-5重新回答,以得到一個更好結果。

不過,在后續的回答中,GPT-5的表現依舊差勁。

在這道題上,GPT-5翻車了。

第五題:在Matroid交約束下最大化單調弱子模函數

最后一個猜想是關于在兩個matroid約束下最大化單調弱子模函數的問題。

研究人員假設,該論文的算法和分析方法應該可以很容易地擴展到兩個matroid約束。

prompt如下:

GPT-5解題過程如下(部分):

在這道題上,GPT-5的回答在邏輯上和細節上都不可靠,輸出結果基本不可用。

最后,值得一提的是,在GPT-5剛發布時,它就被拿來測試過凸優化的問題并且成功。

那么,你看好GPT在數學上更進一步嗎?

責任編輯:張燕妮 來源: 量子位
點贊
收藏

51CTO技術棧公眾號

亚洲欧美激情视频在线观看一区二区三区| 国产视频一区三区| 日韩欧美第一区| 黄色一级视频片| 久久电影中文字幕| 丝袜诱惑亚洲看片| 欧美成人精品影院| 国产真实乱人偷精品人妻| 91麻豆精品国产综合久久久| 亚洲超丰满肉感bbw| 日韩欧美一区二区三区久久婷婷| 国产精品亚洲欧美在线播放| 中国女人久久久| 日韩亚洲欧美中文在线| 欧美色图亚洲激情| 免费观看性欧美大片无片| 欧美网站在线观看| 日本黄大片在线观看| www日韩tube| 99久久99久久免费精品蜜臀| 成人两性免费视频| 欧美一区免费看| 91久久午夜| 久久视频在线免费观看| 天天躁日日躁aaaa视频| 精品亚洲精品| 日韩精品中午字幕| 91高清国产视频| 3d欧美精品动漫xxxx无尽| 亚洲国产一区视频| 久久人妻无码一区二区| 1024国产在线| 国产人久久人人人人爽| 九九九热999| 黄色av网站免费在线观看| 激情亚洲综合在线| 国产欧美日韩丝袜精品一区| 一级黄色大片视频| 亚洲一区二区毛片| 97精品伊人久久久大香线蕉 | 久久精品电影一区二区| 无套内谢大学处破女www小说| 欧州一区二区三区| 欧美一区在线视频| 亚洲妇熟xx妇色黄蜜桃| 欧美一区=区三区| 91福利国产精品| 国产精品第12页| 成人在线爆射| 欧美视频第二页| 99sesese| 祥仔av免费一区二区三区四区| 欧洲在线/亚洲| 亚洲 欧美 另类人妖| 影音成人av| 欧美私模裸体表演在线观看| 亚洲综合婷婷久久| 91国产一区| 日韩一区二区三区免费看| 九九九久久久久久久| 视频欧美一区| 亚洲高清色综合| 青青草视频播放| 欧美禁忌电影| 在线观看中文字幕亚洲| sm捆绑调教视频| 欧美69wwwcom| 97av在线视频| 久久久久亚洲视频| 久久爱www久久做| 99久久99久久| 青青国产在线| 国产精品国产a| 国产精品av免费观看| www.8ⅹ8ⅹ羞羞漫画在线看| 欧美午夜视频一区二区| 尤蜜粉嫩av国产一区二区三区| 激情久久99| 精品国产一区二区三区四区四| v天堂中文在线| japanese国产精品| 久久成年人视频| 在线观看免费国产视频| 日韩成人一级大片| 91九色蝌蚪成人| 水莓100在线视频| 国产精品美女久久久久久久| 伊人网在线免费| www视频在线观看| 欧美三级中文字幕| 日韩成人av影院| 精品国产美女| 欧美黄色片在线观看| 一区二区三区在线观看av| 精品无人码麻豆乱码1区2区| 99国产在线观看| 国产精品99999| 亚洲一区二区三区视频在线播放 | 97在线观看免费高| 亚洲精品专区| 91精品中文在线| 暖暖视频在线免费观看| 亚洲麻豆国产自偷在线| 欧美污视频网站| 亚洲一区 二区| 中文字幕亚洲一区二区三区五十路| 欧美三级 欧美一级| 日韩avvvv在线播放| 国产精品日韩一区二区| 男人的天堂在线视频免费观看 | 国产精品国产| 日韩小视频在线观看| 美女又爽又黄免费视频| 国产精品亚洲午夜一区二区三区| 日本成人三级电影网站| 大桥未久在线播放| 欧美精选一区二区| 黑人巨大精品欧美| 激情婷婷亚洲| 亚洲一区二区三区视频| 日本中文字幕在线2020| 色香蕉成人二区免费| www.美色吧.com| 91精品国产视频| 国产精品美女久久久久av超清| 天天爽夜夜爽夜夜爽| 亚洲精品成人在线| 日本中文字幕观看| 日韩极品一区| 国产精品ⅴa在线观看h| 青青草观看免费视频在线| 亚洲福利国产精品| 亚洲美女高潮久久久| 国产精品99久久精品| 国产精品入口尤物| av在线播放av| 欧美性一二三区| 91精品久久久久久久久久久久| 久久国产高清| 欧美亚洲爱爱另类综合| 视频二区不卡| 日韩精品一二三四区| 欧美福利视频一区二区| 不卡一区中文字幕| 真人抽搐一进一出视频| 国产一区二区三区不卡av| 性欧美在线看片a免费观看| 天天躁日日躁狠狠躁喷水| 五月激情综合色| 亚洲熟女乱综合一区二区三区 | 中文字幕乱码亚洲精品一区| www.亚洲天堂网| 欧美男同视频网| 国产精品福利在线观看| 国产福利片在线| 精品视频在线免费| 北条麻妃在线观看视频| 韩国三级电影一区二区| 一二三在线视频| caoporn成人| 97免费在线视频| 青青草免费观看免费视频在线| 色天使色偷偷av一区二区| 性欧美13一14内谢| 免费人成黄页网站在线一区二区| 一区二区三区视频在线播放| 国产精品日韩精品在线播放 | 日韩av黄色片| 久久久精品欧美丰满| 性猛交ⅹ×××乱大交| 亚洲精品久久久| 国内精品视频在线播放| 伊人久久高清| 麻豆乱码国产一区二区三区| 国产香蕉在线观看| 色哟哟国产精品| 国产一区二区播放| 99久久精品国产一区二区三区| 黄色a级片免费| 91麻豆精品国产91久久久平台| 91在线观看欧美日韩| av免费不卡| 中文精品99久久国产香蕉| 国产精品无码AV| 精品人伦一区二区三区蜜桃网站| 久久久久久久久福利| 国产精品69毛片高清亚洲| 97国产在线播放| 日韩欧美高清| 精品国产乱码久久久久软件| 成人在线免费| 午夜精品一区二区三区在线 | 欧美精品videos性欧美| 国产日本在线观看| 精品国产一区久久| 在线观看视频中文字幕| 午夜精品爽啪视频| 天天做夜夜爱爱爱| 久久综合九色综合97婷婷女人| www.色欧美| 久久在线精品| 久久精品无码中文字幕| 久久国产精品亚洲人一区二区三区 | 日韩 欧美 自拍| 网曝91综合精品门事件在线| 成人在线小视频| 超碰一区二区| 久久青草福利网站| 麻豆av在线免费看| 亚洲色图美腿丝袜| 色婷婷视频在线| 欧美军同video69gay| 国产精品suv一区| 亚洲国产精品久久人人爱蜜臀| 你懂得在线观看| 久久久久99精品国产片| 亚洲美女在线播放| 国产福利精品一区| 亚洲36d大奶网| 蜜桃久久av| 成年女人18级毛片毛片免费| 亚洲一级毛片| 五月天亚洲综合小说网| 久久不见久久见免费视频7| 狠狠色噜噜狠狠色综合久| 日韩欧美久久| 亚洲r级在线观看| 亚洲一区导航| 成人福利在线视频| 日韩成人在线一区| 国产美女主播一区| 日韩三区在线| 国产精品久久久久久av| 粉嫩一区二区三区| 日韩免费观看网站| www.日韩| 国产91久久婷婷一区二区| 伊人网在线播放| 欧美一级成年大片在线观看| 69av成人| 96精品视频在线| 中文字幕人成乱码在线观看 | 成人av在线网站| av不卡中文字幕| 粉嫩av一区二区三区粉嫩| 欧美一级片在线免费观看| 国产成人日日夜夜| 91精品啪在线观看国产| 99久久婷婷国产精品综合| av2014天堂网| 久久久99久久| av免费播放网站| 综合中文字幕亚洲| 国产一级视频在线播放| 午夜不卡av在线| 国产精品一区无码| 在线亚洲高清视频| 一卡二卡三卡在线观看| 欧美一区二区不卡视频| 午夜精品无码一区二区三区| 亚洲激情第一页| 国产在线超碰| 久久久成人精品| 国产精品蜜臀| 欧洲亚洲在线视频| 日韩免费在线电影| 97久草视频| 九九热精品视频在线观看| 亚洲成人自拍视频| 午夜激情一区| 欧美性大战久久久久xxx| 日本不卡一二三区黄网| www.亚洲自拍| 99国产精品99久久久久久| 一级特黄曰皮片视频| 亚洲欧美日韩国产成人精品影院| 国产在线观看99| 色婷婷av久久久久久久| 国产成人精品一区二区无码呦 | 国产精品无码在线| 国产精品免费丝袜| 国产网站在线看| 欧美吞精做爰啪啪高潮| 精品人妻一区二区三区蜜桃| 亚洲欧美日韩直播| 菠萝蜜视频国产在线播放| 欧美综合激情网| 国产精品视频一区视频二区 | 影视亚洲一区二区三区| 五十路熟女丰满大屁股 | 妖精视频一区二区| 欧美激情一二三区| 精品少妇久久久| 精品视频一区 二区 三区| 亚洲精品97久久中文字幕| 国产一区二区三区视频免费| av不卡高清| 成人女保姆的销魂服务| 网友自拍一区| 免费的一级黄色片| 免费观看在线综合| 超碰97在线资源站| 一区二区三区精品| 亚洲天堂avav| 亚洲精品一区二区在线| 色呦呦网站在线观看| 国产精品视频999| 偷拍一区二区| 99在线免费视频观看| 国内外成人在线| 免费看的黄色网| 富二代精品短视频| 高清乱码毛片入口| 久久天天躁日日躁| 视频精品导航| 日本不卡一区二区三区视频| 亚洲国产导航| 久久久久久国产精品日本| 国产精品伦理一区二区| 草莓视频18免费观看| 精品国产91九色蝌蚪| 成人国产免费电影| 成人在线精品视频| 97精品国产一区二区三区| 黄色高清无遮挡| 91欧美一区二区| 日韩精品无码一区二区| 欧美不卡一区二区三区四区| 日本不卡在线| 国产在线日韩在线| 第一sis亚洲原创| 狠狠躁狠狠躁视频专区| 国产网站一区二区三区| 中文字幕在线欧美| 亚洲精品网站在线播放gif| sm久久捆绑调教精品一区| 国产精品美女诱惑| 亚洲二区视频| 在线精品一区二区三区| 午夜精品久久久久久久99樱桃| 涩涩视频免费看| 97视频免费看| 丝袜连裤袜欧美激情日韩| 国产96在线 | 亚洲| 波多野结衣亚洲一区| 日韩av男人天堂| 亚洲欧美在线磁力| 电影一区电影二区| 亚洲一区二区三区精品动漫| 日本不卡123| 国产三级aaa| 欧美一区二区三区视频免费| 国产高清一区二区三区视频| 91最新国产视频| 国产一区日韩一区| 日批在线观看视频| 欧美性猛交xxxx乱大交| 蜜桃视频在线免费| 国产在线视频2019最新视频| 中文字幕一区二区三三| 折磨小男生性器羞耻的故事| 福利二区91精品bt7086| 黄色片在线播放| 成人乱人伦精品视频在线观看| 中文字幕一区二区三区久久网站| 蜜桃色一区二区三区| 色悠悠久久综合| 免费在线视频欧美| 好吊色欧美一区二区三区视频| 亚洲欧美视频一区二区三区| 日本一二三不卡视频| 日韩一区二区麻豆国产| 9765激情中文在线| 日本不卡一区二区三区在线观看| 久久99最新地址| 国产污视频在线观看| 亚洲天堂av高清| 精品一区二区三区中文字幕| 日韩中字在线观看| 国产精品三级在线观看| 性猛交xxxx乱大交孕妇印度| 欧美影院在线播放| 午夜激情久久| 一级特黄a大片免费| 欧美日韩一本到| ririsao久久精品一区| 亚洲一区二区自拍偷拍| eeuss国产一区二区三区 | 蜜桃精品视频在线| 国产一级一片免费播放| 中文字幕无线精品亚洲乱码一区 | av五月天在线| 亚洲一区二区三区四区在线免费观看| 噜噜噜在线观看播放视频| aaa级精品久久久国产片| 日韩国产精品久久| 日韩三级视频在线播放| 久久视频免费观看| 国产一区二区三区四区五区| 精品国产乱码久久久久夜深人妻|