OpenAI GPT-5.1震撼發布,有哪些重要更新值得關注?
2025年11月13日,OpenAI正式在API平臺發布GPT-5.1。
這是GPT-5系列的最新模型,在智能性和速度之間實現了完美平衡,專為廣泛的智能體和編碼任務而設計。
GPT-5.1最大的突破在于能夠根據任務復雜度動態調整思考時間,讓模型在處理簡單日常任務時顯著更快、更節省token,同時保持GPT-5.1的前沿智能水平。
自適應推理:智能與速度的完美平衡
GPT-5.1的核心創新在于其自適應推理能力。
對于簡單直接的任務,GPT-5.1會減少思考token的使用,從而實現更快的響應速度和更低的使用成本;而對于需要深度思考的復雜任務,GPT-5.1會保持持久性,探索多種選項并檢查自己的工作,以最大化可靠性。
實際測試數據令人印象深刻。
GPT-5.1 在完整動態評估套件中表現優于GPT-4.1和GPT-5,同時運行速度比GPT-5快2-3倍。
更重要的是,在工具密集型推理任務中,GPT-5.1在相似或更好的質量下,使用的token數量約為領先競爭對手的一半"。

具體來看,GPT-5.1在任務難度分布上的表現更加動態。
在ChatGPT任務的代表性分布中,GPT-5.1在簡單任務上明顯更快,即使在高推理強度下也是如此。
例如,當被問及"顯示列出全局安裝包的npm命令"時,GPT-5.1只需2秒就能回答,而GPT-5需要10秒。

全新"無推理"模式:極速響應新選擇
開發者現在可以通過將reasoning_effort設置為'none'來使用GPT-5.1的無推理模式。
這使得模型在延遲敏感的使用場景中表現得像非推理模型,同時保持GPT-5.1的高智能水平和強大的工具調用性能。
與GPT-5相比,無推理模式的GPT-5.1在并行工具調用(這本身就能提高端到端任務完成速度)、編碼任務、指令遵循和使用搜索工具方面表現更好,并且支持API平臺中的網絡搜索功能。
Sierra公司分享的數據顯示,GPT-5.1在"無推理"模式下的低延遲工具調用性能相比GPT-5最小推理模式提升了20%。
GPT-5.1默認設置為'none',這對于延遲敏感的工作負載來說是理想選擇。OpenAI建議開發者為更高復雜度的任務選擇'low'或'medium',當智能性和可靠性比速度更重要時選擇'high'。
擴展提示緩存:24小時持久化
擴展緩存功能通過允許提示在緩存中保持活躍狀態長達24小時,而不是目前支持的幾分鐘,從而提高了推理效率。
更長的保留窗口意味著更多的后續請求可以利用緩存的上下文,從而降低延遲、減少成本,并為長時間運行的交互(如多輪對話、編碼會話或知識檢索工作流)提供更流暢的性能。
提示緩存定價保持不變,緩存的輸入token比未緩存的token便宜90%,緩存寫入或存儲不收取額外費用。
要在GPT-5.1中使用擴展緩存,只需在Responses或Chat Completions API上添加參數"prompt_cache_retentinotallow='24h'"。
編碼能力全面提升:更智能、更可控
GPT-5.1在GPT-5的編碼能力基礎上進一步優化,具有更強的編碼可控性、更少的過度思考、更高的代碼質量、更好的面向用戶的更新消息(序言),以及更實用的前端設計——特別是在低推理強度下。
在簡單的編碼任務(如快速代碼編輯)上,GPT-5.1的更快速度使得來回迭代變得更加容易。
重要的是,GPT-5.1在簡單任務上的更快速度并不會降低在困難任務上的性能。在SWE-bench Verified基準測試中,GPT-5.1甚至比GPT-5工作更長時間,準確率達到76.3%。

OpenAI與多家編碼公司密切合作,獲得了早期反饋:
? Augment Code表示GPT-5.1"更加謹慎,浪費的動作更少,推理更高效,任務聚焦更好",他們看到了"更準確的更改、更流暢的拉取請求,以及跨多文件項目的更快迭代"。
? Cline分享說,在他們的評估中,"GPT-5.1在我們的差異編輯基準測試中達到了SOTA,提升了7%,在復雜編碼任務中表現出卓越的可靠性"。
? CodeRabbit稱GPT-5.1是其"PR審查的首選頂級模型"。
? Cognition表示GPT-5.1"在理解你的需求并與你合作完成任務方面明顯更好"。
? Factory說"GPT-5.1提供了明顯更快的響應,并根據任務調整其推理深度,減少了過度思考,改善了整體開發者體驗"。
? Warp正在將GPT-5.1設為新用戶的默認選項,稱其"建立在GPT-5系列引入的令人印象深刻的智能提升基礎上,同時是一個響應速度更快的模型"。
"GPT 5.1不僅僅是另一個LLM——它是真正的智能體,是我測試過的最自然自主的模型。它像你一樣寫作,像你一樣編碼,輕松遵循復雜指令,在前端任務中表現出色,完美融入你現有的代碼庫。你可以在Responses API中真正釋放其全部潛力,我們很高興在我們的IDE中提供它。"——Denis Shiryaev,JetBrains AI開發工具生態系統負責人
兩大新工具:apply_patch和shell
GPT-5.1引入了兩個新工具,幫助開發者在Responses API中充分利用模型:一個自由格式的apply_patch工具,使代碼編輯更加可靠,無需JSON轉義;以及一個shell工具,允許模型在本地機器上運行命令。
- apply_patch工具讓GPT-5.1使用結構化差異在代碼庫中創建、更新和刪除文件。模型不是僅僅建議編輯,而是發出補丁操作,應用程序應用這些操作并報告結果,從而實現迭代的、多步驟的代碼編輯工作流。
- shell工具允許模型通過受控的命令行界面與本地計算機交互。模型提出shell命令;開發者的集成執行這些命令并返回輸出。這創建了一個簡單的計劃-執行循環,讓模型檢查系統、運行實用程序并收集數據,直到能夠完成任務。
定價與可用性
GPT-5.1和gpt-5.1-chat-latest現已向API所有付費層級的開發者開放。定價和速率限制與GPT-5相同。
OpenAI還發布了API中的gpt-5.1-codex和gpt-5.1-codex-mini。雖然GPT-5.1在大多數編碼任務中表現出色,但gpt-5.1-codex模型針對Codex或類似Codex的框架中長時間運行的智能體編碼任務進行了優化。
開發者可以開始使用GPT-5.1開發者文檔和模型提示指南進行構建。OpenAI目前不計劃在API中棄用GPT-5,如果決定這樣做,將提前通知開發者。
未來展望
OpenAI致力于迭代部署最強大、最可靠的模型,用于真正的智能體和編碼工作——這些模型能夠高效思考、快速迭代并處理復雜任務,同時讓開發者保持流暢的工作狀態。
憑借自適應推理、更強的編碼性能、更清晰的面向用戶的更新以及apply_patch和shell等新工具,GPT-5.1旨在幫助開發者減少摩擦。OpenAI將繼續大力投資:在未來幾周和幾個月內,你可以期待更強大的智能體和編碼模型。
GPT-5.1的發布標志著AI開發工具進入了一個新階段,它不僅更智能,更重要的是更實用、更高效。對于開發者而言,這意味著更快的開發速度、更低的成本和更好的開發體驗。隨著AI代理工作流的日益普及,GPT-5.1將成為構建下一代智能應用的重要基石。































