編輯 | 聽雨
出品 | 51CTO技術棧(微信號:blog51cto)
這兩天真是大事不斷。
AI 編程工具 Cursor 背后的初創(chuàng)公司 Anysphere,在最新的 Cursor 2.0 更新中正式推出了首個自研大型語言模型 —— Composer。
Composer 是一款專為生產級環(huán)境設計的高性能編程模型,旨在讓 AI 能更快、更精準地執(zhí)行真實軟件開發(fā)任務。這意味著 Cursor 不再只是調用第三方模型(如 GPT 或 Claude),而是進入了自主構建核心模型的新階段。
值得注意的是,Composer 已在 Cursor 自家工程團隊的日常開發(fā)中投入使用,這表明它的穩(wěn)定性與成熟度已經達到了可生產的水準。

極速模型:30秒內完成大多數交互
Cursor 表示,Composer 在大多數任務中可在 30 秒內完成響應,同時在復雜代碼庫中仍保持高水平的邏輯推理與理解能力。
知名開發(fā)者、t3.gg的創(chuàng)始人兼CEO Theo在 X 上表示:Composer是我用過最瘋狂的模型之一!又快又聰明。
圖片
官方介紹Composer“比同類智能模型快 4 倍”,并專為 Agentic 工作流 而設計——也就是多個自主代理可協(xié)作完成編碼、規(guī)劃、測試與審查等任務。
Cursor 研究員 Sasha Rush 在 X上分享了 Composer 的基準性能圖表,展示了其在多個模型類別中的領先表現。
圖片
Cursor 為 Composer 構建了名為 Cursor Bench 的內部基準體系,數據來自真實開發(fā)者在平臺上的代理請求。
該測試不僅評估代碼正確性,還考察模型是否遵循項目的既有抽象層次、代碼風格與工程實踐。
結果顯示,Composer 達到了前沿級(frontier-level)編程智能,生成速度高達每秒 250 個 token ——這約是現有“快速推理模型”的兩倍,且比同類頂級模型快四倍。
官方將測試模型劃分為以下幾類:
- Best Open(如 Qwen Coder、GLM 4.6)
- Fast Frontier(如 Haiku 4.5、Gemini Flash 2.5)
- Frontier 7/2025(年中最佳模型)
- Best Frontier(GPT-5、Claude Sonnet 4.5)
Composer 在智能水平上接近中端 Frontier 模型,但在生成速度上居所有模型之首。
在此之前,Cursor 以其獨特的 “vibe coding” 模式受到歡迎 —— 用戶只需用自然語言描述功能,即便不是開發(fā)者,也能讓 AI 自動生成代碼。
舊版 Cursor 主要基于第三方模型,如 OpenAI、Anthropic、Google 和 xAI 等。而 Composer 的出現,標志著 Cursor 擁有了自有核心智能模型,但用戶仍可選擇這些外部模型進行對比使用。
模型架構:強化學習 + Mixture-of-Experts
Cursor 研究員 Sasha Rush 在 X 上透露,Composer 是一個基于強化學習(RL) 訓練的專家混合模型(MoE):
“我們使用強化學習訓練了一個大型 MoE 模型,使它能在真實編程任務中表現出色,同時保持極高速度。”
圖片
Image
Rush 進一步解釋說,Cursor 團隊在設計 Composer 時,與 Cursor 的開發(fā)環(huán)境同步共建,以確保模型能在生產級規(guī)模下高效運行:
“與其他機器學習系統(tǒng)不同,編程智能體幾乎不能抽象出實驗環(huán)境。我們讓模型與產品共同設計,使其能在必要規(guī)模下運行?!?/p>
Allen Institute for AI的機器學習研究員Nathan Lambert也對 Composer 模型強化學習(RL)訓練成果大加贊賞:
“我特別喜歡這種漂亮的強化學習訓練縮放曲線圖。相比推理階段的縮放曲線(inference-time scaling plots),這種圖往往被忽視了?!?/p>
圖片
真實任務驅動的訓練方式
Composer 并非在靜態(tài)數據集上訓練,而是在真實的工程場景中學習。訓練期間,模型運行在完整的代碼庫中,能使用一整套生產工具,包括:
- 文件編輯
- 語義搜索
- 終端命令
每次訓練迭代,模型都會解決一個具體任務 —— 可能是生成代碼修改、編寫方案、或給出精準解釋。
強化學習環(huán)節(jié)同時優(yōu)化正確性與效率:Composer 學會了如何合理使用工具、并行處理任務、減少冗余輸出。在訓練后期,模型甚至出現了“自發(fā)行為”,例如:
- 自動運行單元測試
- 修復語法/規(guī)范錯誤
- 進行多步代碼搜索
這種設計讓 Composer 能在與用戶相同的開發(fā)環(huán)境中運作,完全貼合真實編程場景,支持版本控制、依賴管理與迭代測試。
從原型 “Cheetah” 到正式版 Composer
Composer 的誕生基于早期內部原型 Cheetah,Cheetah 主要用于驗證低延遲推理的可行性。
Rush 在 X 上寫道:
“Cheetah 是該模型的 v0 版本,主要測試速度。Composer 的速度與之相同,但智能程度高出許多?!?/p>
圖片
Cursor(Anysphere) 的聯(lián)合創(chuàng)始人兼 CEO Aman Sanger也表示:Cheetah 是 Composer-1 的早期原型。
圖片
Cheetah 的成功讓 Cursor 意識到:“響應速度是開發(fā)者信任與使用體驗的關鍵。”
Composer 在保持速度的同時,顯著提升了推理能力與任務泛化水平。
一位早期測試者表示:
“它快到讓我可以一直保持在思考循環(huán)中工作。”
Composer 延續(xù)了這種實時交互的體驗,并拓展到多步驟編碼、重構與測試任務。
Cursor 2.0 集成:多代理協(xié)作與安全執(zhí)行
Composer 深度集成于 Cursor 2.0 的全新多智能體平臺中。用戶可最多同時運行 8 個代理,每個代理在獨立的工作區(qū)(通過 git worktree 或遠程機器)中執(zhí)行任務。開發(fā)者可以讓多個代理并行嘗試同一任務,并對比結果后擇優(yōu)采用。
圖片
Cursor內部開發(fā)者 Jason Ginsberg 在X上評價:在 Cursor 里運行一個網頁 Agent 的感覺,更像是在作畫而不是寫代碼。
圖片
此外,Cursor 2.0 還帶來了多項配套升級:
- 內嵌瀏覽器(正式版):代理可在 IDE 內直接運行與測試代碼,并將 DOM 信息傳遞給模型。
- 改進的代碼審查界面:可跨多文件查看模型修改,提升審閱效率。
- 安全沙盒終端(正式版):代理運行的 shell 命令在沙盒中隔離執(zhí)行,確保本地安全。
- 語音模式(Voice Mode):支持語音指令觸發(fā)與管理智能體。
訓練基礎設施:為強化學習而重構
為支持大規(guī)模 RL 訓練,Cursor 自研了強化學習訓練架構:
- 基于 PyTorch + Ray 的異步分布式系統(tǒng);
- 開發(fā)了專用 MXFP8 MoE 內核,結合專家并行與混合分片數據并行;
- 可在上千張 NVIDIA GPU 上低精度原生訓練;
- 避免了訓練后量化的復雜性,顯著提高推理效率。
訓練過程中,Composer 在云端運行 數十萬并行沙盒環(huán)境,每個都是獨立的開發(fā)工作區(qū)。為承載這些動態(tài)工作負載,Cursor 重寫了虛擬機調度器,使訓練環(huán)境與生產環(huán)境完全打通。
企業(yè)功能與訂閱體系
Cursor 針對企業(yè)用戶也提供了 Composer 的管理與安全功能:
- 管理員可集中控制終端沙盒策略、Git 訪問與網絡權限;
- 支持 Hooks 分發(fā)、團隊規(guī)則管理與操作審計日志;
- 提供團隊層級的使用監(jiān)控與性能分析。
價格層級:
- 個人用戶:從 免費版(Hobby) 到 Ultra($200/月);
- 團隊版起價 $40/人/月,企業(yè)用戶可定制合規(guī)與訪問方案。
模型來源的疑問
不過,開源工具Datasette的創(chuàng)建者、Django 框架聯(lián)合創(chuàng)始人Simon Willson 以及一些網友都注意到了一個細節(jié),那就是官方說明中并沒有解釋模型的來源:
他們是否從零開始訓練模型?還是基于某個現有的開源模型(例如 Qwen 或 GLM 系列)進行微調?
Sasha Rush 最近在 Hacker News 上回答了一些相關問題,但在談到模型基礎時態(tài)度仍然相當含糊。
當有人直接提問:“Composer 是否是在某個開源基礎模型上微調得到的?”Sasha 的回答是:
“我們的主要關注點在于 強化學習后的訓練(RL post-training)。我們認為這才是讓模型成為強大交互式代理的最佳途徑。”
另外,Sasha 還否認了一個流傳已久的傳聞:有用戶猜測早期的 Cursor 預覽模型 Cheetah 是基于 xAI 的 Grok 構建的。對此 Sasha 回應:
“那完全是假的(Straight up untrue)?!?/p>
Composer 在 AI 編程中的意義
與 GitHub Copilot 或 Replit Agent 不同,Composer 的核心創(chuàng)新在于:它并非一個“被動補全引擎”,而是一個能主動規(guī)劃、執(zhí)行與驗證代碼的高交互智能體。
這種讓模型在真實開發(fā)環(huán)境中訓練、運行、驗證的思路,是邁向自主軟件開發(fā)的關鍵一步。
Rush 總結道:
“要讓模型在現實中可靠運行,就必須讓它在真實環(huán)境中學習。它不僅要會寫代碼,更要學會在上下文中測試與改進。”
網友評價:響應速度快,性價比不俗
Composer-1 發(fā)布后,Reddit社區(qū)反響也是相當熱烈。很多網友一致認為它“速度極快、交互順滑”,并且在解決特定編程任務時非常智能。
圖片
有網友表示,自己卡了一周的問題,Composer幾分鐘內就解決了。
圖片
還有網友對比測試了對比測試了 Claude 4.5 Sonnet 和 Composer-1,結論是:
- Composer 比 Sonnet快了3分鐘完成任務
- 雖然 token 用量多了 20%,但價格便宜 73%
- 每 1K token 成本便宜約 4.5 倍
圖片
另外,已經有手快的網友整理了不同模型的API定價表,可以看出Composer的性價比還是很高的。
圖片
此外,也有一些開發(fā)者質疑多 Agent 并行開發(fā)的模式,認為實用性有限,容易浪費 Token等等。
圖片
Cursor 2.0 現已開放下載,你可以訪問 cursor.com 獲取最新版本。大家都快去體驗起來!
那么評論區(qū)的各位大佬:
你覺得Composer的表現如何呢?
有哪些你覺得好用的功能或設計?
參考鏈接:
https://cursor.com/cn/blog/2-0




































