GPT-5 數(shù)學神話“塌房”:文獻檢索被當成原創(chuàng)突破。LeCun冷笑:被自家 GPT 傻子坑了吧
10月17日的晚上,AI世界一片喧囂。
OpenAI研究員、前斯坦福數(shù)學家Mark Sellke發(fā)推,宣布GPT-5“找到了十個此前未解的Erd?s問題的解”。他列出十個編號,像在展示一場數(shù)學奇跡的戰(zhàn)利品。

注:Erd?s 問題,是以匈牙利數(shù)學家 Paul Erd?s 命名的一系列數(shù)學難題,大概有1000多個問題。這些題目有的已經(jīng)被解決,有的仍無人能解,學界常用編號系統(tǒng)來追蹤每一題的狀態(tài)。
Sébastien Bubeck,OpenAI的理論研究副總裁(VP of Theoretical AI Research),轉發(fā)了這條推文。他還補上一句:“科學加速正式開始。”

Kevin Weil,OpenAI的首席產(chǎn)品官(Chief Product Officer),也跟進發(fā)帖。他說:“GPT-5解決了十個Erd?s難題,還在另外十一題上取得進展。”

這條消息在幾小時內(nèi)傳遍全網(wǎng)。OpenAI團隊的研究員、工程師、合作者接連轉發(fā),有人稱這代表“AI第一次獨立推動數(shù)學前沿”,有人說“GPT-5正式跨越人類智能的門檻”。
有媒體稱這是數(shù)學界的“地震”。甚至連外部學者也被感染,斯坦福的研究員Hieu Pham發(fā)帖:“我不再理解AI帶來的新成果了,這就是指數(shù)式增長。”

反轉來了。
神話沒有持續(xù)多久,開始坍塌了。
維護著名網(wǎng)站 Erd?s Problems Archive 的數(shù)學家 Thomas Bloom 指出:
“這些問題并不是‘未解’。其中大多數(shù)早已在學術文獻中有解,只是我的網(wǎng)站未及時更新。GPT-5找到的只是現(xiàn)有文獻中的結果,而不是新的數(shù)學發(fā)現(xiàn)。”
于是,社區(qū)開始翻查記錄,發(fā)現(xiàn)那些題目的確在過往文獻中有解,而GPT-5所做的,只是通過幾千次查詢,檢索到舊答案。
Bubeck的原帖下出現(xiàn)了Community Notes的標注:“GPT-5并未解決這些Erd?s問題。它只是找到已發(fā)表的解答。”

這條注釋像一個蓋章,蓋在OpenAI的臉上。Mark Sellke也轉發(fā)承認,“我們發(fā)現(xiàn)的解都存在于文獻中。”但為時已晚,公眾已經(jīng)被卷進誤導性的敘事里。

研究界的反應迅速而冷峻。DeepMind CEO Demis Hassabis評論:“這太尷尬了。”
于是,OpenAI從“數(shù)學奇跡”變成“科學笑話”。
10月18日凌晨,Sebastien Bubeck發(fā)布道歉。他說:“我刪除了那條推文,沒有想誤導任何人。”他解釋說,他們只是在文獻中找到了已知的解,并非原創(chuàng)成果。他說他仍感到興奮,因為“文獻檢索確實很難”。
這句解釋無濟于事。社交平臺的熱度轉向冷諷。

Yann LeCun在Bubeck的道歉帖下留言:“Hoisted by their own GPTards。”
對于這句話,GPT-5的解釋是:
- Hoisted by their own petard 是一句英語成語,意思是 “被自己設置的炸藥炸到自己” → 比喻 “自食其果”。
- GPTards 是他將 “GPT” 和 “retards(傻子、弱智)” 拼在一起的諷刺造詞,意指那些過度迷信或吹捧 GPT 的人。
OpenAI研究團隊開始刪除帖子。但媒體開始系統(tǒng)報道。The Decoder寫道:“OpenAI研究者宣布重大數(shù)學突破,結果證明什么也沒發(fā)生。”Futurism評論:“AI找到了舊論文,卻被吹成了解決世紀難題。”.......
風向徹底反轉。OpenAI 從“科學加速”變成“過度營銷”。GPT-5從“博士級智能”變成“文獻檢索助手”......
事實證明,科學沒有加速,幻覺加速了。
而在喧囂之外,可以想想之前數(shù)學家陶哲軒的提醒。
他認為 AI 在數(shù)學中的潛力,并非立刻攻克最難問題,而是幫助數(shù)學家加快繁瑣任務,如文獻檢索與結果驗證
陶哲軒指出,AI 能節(jié)省時間、擴大研究面,甚至可能讓數(shù)學研究“工業(yè)化”。但人類的判斷仍是核心,真正的創(chuàng)新與審查不能由機器取代。





































