GPT-5破解世紀難題，竟是上網抄來的！哈薩比斯：太尷尬了

2025-10-20 09:13:00

GPT-5一場鬧劇，讓OpenAI出大糗了！讓所有人都以為GPT-5破解了十道Erdos難題，沒想到竟是查文獻給出了答案。Hassabis點評，這太尷尬了。

OpenAI團隊狂吹了一波GPT-5，結果竟是鬧劇一場......

事情是這樣的。

幾天前，OpenAI科學家Sebastien Bubeck激動轉發，兩位研究員聯手GPT-5 Pro，僅用了一個周末，破解了10個「百年懸案」——

埃爾德什難題（Erdos problems）

緊接著，OpenAI科學副總裁Kevin Weil等人紛紛加入，大肆宣傳。

然而，真相很快浮出水面：

這十道難題，早就被學界解決，并非由GPT-5獨立解決，它只是通過檢索網絡文獻給出了答案。

消息一出，輿論嘩然。就連谷歌DeepMind CEO Demis Hassabis也忍不住評價，「這也太尬了」。

還有，圖靈獎得主LeCun閃現X上嘲諷，「簡直就是，搬起石頭（GPT）砸自己的腳」。

這場鬧劇，可以說OpenAI團隊的自導自演。

研究人員Mark Sellke和Mehtaab Sawhney發文很明確，并沒有說GPT-5破解了難題。

他們原帖是，通過GPT-5數千條查詢后，找到了十個被列為Erdos問題的解。

當時的結果是，問題223、339、494、515、621、822、883、903、1043、1079都得到了解決，同時在另外 11 個問題上也取得了部分進展。

另一方面，這十道難題早已有了答案，只不過網站管理者并未更新。

傳送門：https://www.erdosproblems.com/

英國皇家學會研究院Thomas Bloom，網站erdosproblems.com運營者，卻對此并不知情。

網站上，「開放」狀態僅代表他個人并不了解該問題的解法，而不是表示該問題在科學界尚未被解決。

總言之，兩個誤會，湊在了一起，讓人們產生了「幻覺」——GPT-5攻克了埃爾德什難題。

一方面，難題并非未解決，只是網站維護者不清楚；另一方面，GPT-5僅通過搜索文獻完成，并非自己解決。

Sebastien Bubeck尷尬回復道，GPT-5只是在文獻中找到了解決方案，僅此而已。

即便如此，已經非常高效了，因為我知道搜索文獻是有多么地困難。

評論區的大佬們，正坐在前排吃瓜。

通過這場爭論，開發者Matt Mazur認真地表示，所有人必須謹慎地對待任何關于AI發現新科學/數學成果的說法」。

Hyperbolic創始人Yuchen Jin稱，「關于AI發現科學/數學的新發現，需要更多的同行評審」。

不過也有人認為，這對GPT-5來說并不尷尬，畢竟它在文獻檢索方面表現還是很出色的。

幾天前，陶哲軒也曾發文表示，我越來越覺得，眼下AI要在數學領域真正發揮作用，關鍵可能不在用最牛的模型去攻克最難的題目——

當然偶爾會有這種案例，特別是當人們砸了大量算力和專家精力進去的時候。

但更靠譜的路線，反而是用中等水平的AI工具，去幫我們搞定那些研究里繞不開的瑣碎活、體力活。

無論何時，對AI原創發現保持審慎都是第一位的，但這并不妨礙AI輔助科研成為未來的必經之路。

責任編輯：張燕妮來源：新智元