OpenAI「解決」10道數學難題?哈薩比斯直呼「尷尬」,LeCun辛辣點評
這個周末 AI 圈非常熱鬧,OpenAI 陷入輿論中心,Google、Meta 和 AI 圈多位大佬加入混戰。
一句話概括就是:OpenAI 研究員宣稱 GPT-5 「發現」了 10 個懸賞數學難題的解決方法,輿論誤以為是 GPT-5 給出了解題方法,結果被發現只是檢索到了早已存在的文獻,引發了學界大佬的群嘲和對于 AI 夸大宣傳的激烈討論。

故事要從幾條引爆社交平臺的推文說起。
GPT-5 解決懸賞難題?
10 月 12 日,Sebastien Bubeck 發推表示 GPT-5 文獻搜索方面超凡脫俗,發現了 Erd?s 問題 339 已被解決但在官方數據庫中狀態尚未修改。

10 月 17 日,OpenAI 研究人員 Mark Sellke 轉發此貼更新,表示他和 Mehtaab 使用 GPT-5 模型進一步研究,通過數千次查詢,針對 erdosproblems.com 網站上列為「開放」的 Erd?s 問題進行了調查。

他們聲稱「發現了」10 個問題的解決方案(問題編號:223、339、494、515、621、822、883(第 2/2 部分)、903、1043、1079)。同時他們在另外 11 個問題上也取得了部分進展。
OpenAI 首席產品官 Kevin Weil 轉發此貼。

這些問題源自數學家 Paul Erd?s 提出的未解決問題列表,該網站由數學家 Thomas Bloom 維護。
OpenAI 的副總裁 Sebastien Bubeck 轉發并宣稱「AI 加速科學已正式開始」,并順勢宣布 Mark Sellke 加入 OpenAI。

一時間,公眾和媒體普遍認為 GPT-5 在數學推理能力上取得了驚人突破,能夠獨立解決困擾人類數學家數十年的難題。
反轉:「這很尷尬」
然而,這場狂歡僅僅持續了幾個小時,就迎來了反轉。
谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那條「AI 加速科學」的推文下回復:這很尷尬。

Hassabis 隨后引導公眾關注該數學難題網站維護者、數學家 Thomas Bloom 的澄清。
Thomas Bloom 表示:OpenAI 的表述為「戲劇性的誤解」。網站上將這些問題標記為「未解決」,僅僅代表他個人不知道相關解答已經發表,并不意味著數學界沒有人解決。

換言之,GPT-5 扮演了一個效率極高的學術搜索引擎,而非一個數學家。
Sebastien Bubeck 隨后刪除帖子并道歉,稱「我無意誤導任何人,我認為表述很清楚,對不起」。他強調,AI 在文獻搜索上的作用非常有價值,因為「搜索文獻有多難,我很清楚」,這能加速科學研究。

Kevin Weil 也刪帖并承認「我實際上誤解了我們的結果(尷尬)」。Mark Sellke 的更新也是轉發此貼。

Hoisted by their own GPTards
對此,Lecun 也辛辣點評:(OpenAI)被自己吹捧 GPT 的言論坑慘了(Hoisted by their own GPTards),諷刺其作繭自縛。
注:源自莎士比亞戲劇《哈姆雷特》的著名短語 Hoist with his own petard(被自己的炸藥包給炸飛了),這里 petard(炸藥)改成了 GPTards(-tards 源自英文單詞 retard,意為笨蛋),指代那些盲目崇拜 ChatGPT / AI 的人。

搞笑的是,就在同一天,Lecun 在一篇指出最近的熱門論文《Definition of AGI》中存在虛假引用的帖子下面回復了相同的一句話。

Gary Marcus 也做出點評:任何期望當前范式接近AGI的人都是在癡心妄想。

網友也進行了激烈討論,有部分人認為 OpenAI 再一次炒作失敗。

不過也有人認為,這是一個有價值的事情。

陶哲軒的觀點與此類似,他在 Mastodon 上表示,AI 在數學中的即時潛力在于加速文獻搜索等瑣碎任務,而非解決最難的開放問題。他承認 AI 可能「工業化」數學,加速整體進展,但強調人類專家仍需審查、分類和整合 AI 結果。

- 貼文地址:https://mathstodon.xyz/@tao/115385022005130505
還有人對「炒作」行為做出了更深層次的解讀。

無論如何,這件事再次警醒我們,在追求技術突破的道路上,AI 社區究竟該如何平衡嚴謹的科學精神與必要的公眾宣傳?



































