OpenAI「解決」10道數學難題？哈薩比斯直呼「尷尬」，LeCun辛辣點評

2025-10-20 08:54:00

10 月 17 日，OpenAI 研究人員 Mark Sellke 轉發此貼更新，表示他和 Mehtaab 使用 GPT-5 模型進一步研究，通過數千次查詢，針對 erdosproblems.com 網站上列為「開放」的 Erd?s 問題進行了調查。

這個周末 AI 圈非常熱鬧，OpenAI 陷入輿論中心，Google、Meta 和 AI 圈多位大佬加入混戰。

一句話概括就是：OpenAI 研究員宣稱 GPT-5 「發現」了 10 個懸賞數學難題的解決方法，輿論誤以為是 GPT-5 給出了解題方法，結果被發現只是檢索到了早已存在的文獻，引發了學界大佬的群嘲和對于 AI 夸大宣傳的激烈討論。

故事要從幾條引爆社交平臺的推文說起。

10 月 12 日，Sebastien Bubeck 發推表示 GPT-5 文獻搜索方面超凡脫俗，發現了 Erd?s 問題 339 已被解決但在官方數據庫中狀態尚未修改。

他們聲稱「發現了」10 個問題的解決方案（問題編號：223、339、494、515、621、822、883（第 2/2 部分）、903、1043、1079）。同時他們在另外 11 個問題上也取得了部分進展。

OpenAI 首席產品官 Kevin Weil 轉發此貼。

這些問題源自數學家 Paul Erd?s 提出的未解決問題列表，該網站由數學家 Thomas Bloom 維護。

OpenAI 的副總裁 Sebastien Bubeck 轉發并宣稱「AI 加速科學已正式開始」，并順勢宣布 Mark Sellke 加入 OpenAI。

一時間，公眾和媒體普遍認為 GPT-5 在數學推理能力上取得了驚人突破，能夠獨立解決困擾人類數學家數十年的難題。

然而，這場狂歡僅僅持續了幾個小時，就迎來了反轉。

谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那條「AI 加速科學」的推文下回復：這很尷尬。

Hassabis 隨后引導公眾關注該數學難題網站維護者、數學家 Thomas Bloom 的澄清。

Thomas Bloom 表示：OpenAI 的表述為「戲劇性的誤解」。網站上將這些問題標記為「未解決」，僅僅代表他個人不知道相關解答已經發表，并不意味著數學界沒有人解決。

換言之，GPT-5 扮演了一個效率極高的學術搜索引擎，而非一個數學家。

Sebastien Bubeck 隨后刪除帖子并道歉，稱「我無意誤導任何人，我認為表述很清楚，對不起」。他強調，AI 在文獻搜索上的作用非常有價值，因為「搜索文獻有多難，我很清楚」，這能加速科學研究。

Kevin Weil 也刪帖并承認「我實際上誤解了我們的結果（尷尬）」。Mark Sellke 的更新也是轉發此貼。

對此，Lecun 也辛辣點評：（OpenAI）被自己吹捧 GPT 的言論坑慘了（Hoisted by their own GPTards），諷刺其作繭自縛。

注：源自莎士比亞戲劇《哈姆雷特》的著名短語 Hoist with his own petard（被自己的炸藥包給炸飛了），這里 petard（炸藥）改成了 GPTards（-tards 源自英文單詞 retard，意為笨蛋），指代那些盲目崇拜 ChatGPT / AI 的人。

搞笑的是，就在同一天，Lecun 在一篇指出最近的熱門論文《Definition of AGI》中存在虛假引用的帖子下面回復了相同的一句話。

Gary Marcus 也做出點評：任何期望當前范式接近AGI的人都是在癡心妄想。

網友也進行了激烈討論，有部分人認為 OpenAI 再一次炒作失敗。

不過也有人認為，這是一個有價值的事情。

陶哲軒的觀點與此類似，他在 Mastodon 上表示，AI 在數學中的即時潛力在于加速文獻搜索等瑣碎任務，而非解決最難的開放問題。他承認 AI 可能「工業化」數學，加速整體進展，但強調人類專家仍需審查、分類和整合 AI 結果。

還有人對「炒作」行為做出了更深層次的解讀。

無論如何，這件事再次警醒我們，在追求技術突破的道路上，AI 社區究竟該如何平衡嚴謹的科學精神與必要的公眾宣傳？

責任編輯：張燕妮來源：機器之心