OpenAI 研究人員夸大 GPT-5 數學能力后刪帖,遭楊立昆等業(yè)界人士批評
10 月 19 日消息,近日,OpenAI 研究人員在社交媒體平臺 X 上宣稱取得了一項重大數學突破,但很快在學界批評聲中撤回了這一說法。批評者包括 DeepMind 首席執(zhí)行官德米斯?哈薩比斯(Demis Hassabis),他指出該團隊的溝通方式“過于草率”。

事件起源于 OpenAI 管理層成員凱文?韋爾(Kevin Weil)發(fā)布的一條現已刪除的推文。他在文中聲稱,GPT-5 已“找到了 10 個(!)此前未解的埃爾德什(Erd?s)問題的解決方案”,并在另外 11 個問題上取得了進展。他形容這些問題“數十年來一直懸而未決”。其他 OpenAI 研究人員也附和了這一說法。
這些措辭給人的印象是:GPT-5 獨立生成了數論領域若干難題的數學證明 —— 這將是一項潛在的重大科學突破,也標志著生成式人工智能有能力發(fā)現未知解,推動原創(chuàng)性研究,并開啟科技發(fā)展的新篇章。
然而,運營網站 erdosproblems.com 的數學家托馬斯?布魯姆(Thomas Bloom)立即提出異議。他稱這一說法是“嚴重的誤解”,并澄清道:其網站上的“開放問題”僅表示他自己尚不了解答案,并不意味著這些問題在學術界真正未被解決。事實上,GPT-5 只是檢索到了布魯姆此前未曾注意到的已有研究成果。

DeepMind CEO 德米斯?哈薩比斯將此次事件稱為“令人尷尬的”,Meta AI 負責人楊立昆(Yann LeCun)則諷刺 OpenAI“被自己的炒作所反噬”(hoisted by their own GPTards)。


IT之家注意到,相關原始推文隨后大多被刪除,研究人員也承認了錯誤。盡管如此,這一事件進一步加劇了外界對 OpenAI 作為一家機構正面臨巨大壓力且行事不夠嚴謹的看法。人們不禁質疑:在一個本就充滿炒作、涉及數十億美元利益的領域中,為何頂尖 AI 研究人員會未經核實便發(fā)布如此驚人的聲明?事實上,即便像 Bubeck 這樣了解 GPT-5 真實貢獻的研究者,仍使用了“找到解決方案”這種具有誤導性的模糊表述。
被忽視的真正重點在于:GPT-5 在此過程中展現的實際價值,是作為一種高效的研究工具,用于追蹤和整合相關的學術論文。這對于文獻分散或術語不統(tǒng)一的研究問題尤其有價值。
著名數學家陶哲軒(Terence Tao)認為,這才是人工智能在數學領域最直接的應用潛力所在 —— 并非攻克最難的開放性問題,而是加速諸如文獻檢索等繁瑣工作。他表示,雖然 AI 在個別復雜問題上已有“零星進展”,但目前最主要的作用仍是節(jié)省時間的輔助工具。他還指出,生成式 AI 有望幫助“工業(yè)化”數學研究進程,從而加快整個領域的進步步伐。不過,他也強調,人類專家在審查、分類以及安全地將 AI 生成結果融入正式研究方面,仍然發(fā)揮著不可替代的關鍵作用。



































