OpenAI重新啟用舊版模型 奧特曼坦承GPT-5上線過程"坎坷"

OpenAI聯合創始人兼CEO奧特曼公開承認,公司最新旗艦級大型語言模型GPT-5在發布時出現了重大問題。盡管該模型被宣傳為迄今為止功能最強大的一款,但發布過程并不順利。
奧特曼在Reddit的“問我任何問題”(AMA)板塊和X平臺上回答用戶提問時,承認了GPT-5發布過程中出現的一系列問題,包括模型切換故障、性能不佳以及用戶困惑等,這些問題促使OpenAI部分撤銷了一些平臺變更,并恢復了用戶對GPT-4o等早期模型的訪問權限。
“發布過程比我們預期的要坎坷一些,”奧特曼在Reddit上回復有關GPT-5重大發布的問題時寫道。
對于OpenAI在GPT-5直播中展示的錯誤模型性能圖表,奧特曼表示:“工作人員熬夜加班,非常疲憊,出現了人為失誤。直播前的最后幾個小時里,還有很多工作要做。”
雖然他指出隨附的博客文章和系統卡片內容準確無誤,但這些失誤讓本就受到早期用戶和開發者審視的發布過程更加混亂。
新自動模型路由器的故障
奧特曼表示,問題的一個關鍵原因在于OpenAI的新自動“路由器”,該系統負責將用戶提示分配給四種GPT-5變體之一——常規版、迷你版、納米版和專業版,并為需要更重推理的任務提供可選的“思考”模式。
在X平臺上,奧特曼透露,該系統的一個關鍵部分——自動切換器——“在一天中的大部分時間里都停止了工作”,導致GPT-5的表現“比預期的要笨拙得多”。
對此,OpenAI表示正在對模型決策邊界進行調整,并將提高模型響應特定查詢的透明度。
用戶界面更新也在進行中,以幫助用戶手動觸發思考模式。
此外,奧特曼證實,在收到大量關于GPT-5性能不穩定的投訴后,OpenAI將允許ChatGPT Plus用戶繼續使用GPT-4o(之前的默認模型),他在Reddit上表示,公司正在“嘗試收集更多關于權衡取舍的數據”,然后再決定提供舊模型多長時間。
然而,包括沃頓商學院教授伊桑·莫利克(Ethan Mollick)等OpenAI測試人員在內的許多用戶表示,他們對OpenAI單方面將他們的ChatGPT體驗升級到GPT-5并最初取消對舊模型的訪問權限感到困惑和沮喪。
實際性能不及預期
OpenAI的內部基準測試可能顯示GPT-5在大型語言模型中處于領先地位,但實際用戶卻有著不同的體驗。
自發布以來,用戶們紛紛貼出GPT-5在數學、邏輯和編碼任務中出現基礎錯誤的例子。
數據科學家科林·弗雷澤(Colin Fraser)發布了GPT-5錯誤解答8.888(8循環)是否等于9(顯然不等于)的截圖,而另一位用戶則展示了它搞砸簡單代數問題5.9 = x + 5.11的情況。
還有其他用戶報告稱,在解決數學應用題或使用GPT-5調試其展示圖表時遇到困難,無法得到準確答案。
開發者的反饋也不盡如人意,用戶發布的圖片顯示,與競爭對手AI實驗室Anthropic的新模型Claude Opus 4.1相比,GPT在“單次提示”完成某些編程任務(即僅憑一次提示就能很好地完成任務)方面的表現更差。
安全公司SPLX發現,除非加強其安全層,否則GPT-5仍然容易受到提示注入和混淆邏輯攻擊等嚴重漏洞的影響。
OpenAI備受關注
ChatGPT每周擁有7億用戶,OpenAI仍然是受眾最廣的生成式AI領域的最大參與者。
但這種規模也帶來了成長的煩惱,奧特曼在X平臺的帖子中指出,GPT-5發布后的24小時內,API流量翻了一番,導致平臺不穩定。
對此,OpenAI表示將加倍提高ChatGPT Plus用戶的速率限制,并在收集反饋的同時繼續調整基礎設施。
然而,早期的失誤,加上令人困惑的用戶體驗變更和高調發布中的錯誤,為競爭對手提供了迎頭趕上的機會。
OpenAI面臨著證明GPT-5不僅僅是一次增量更新,而是一次真正進步的壓力。從初步發布情況來看,許多用戶對此仍持懷疑態度。





































