一篇92頁大模型Vibe Coding技術全面綜述
今天分享中科院計算所&杜克大學等首篇Vide Coding技術最新全面綜述。

隨著 GPT-4/Claude-Sonnet-4 等模型出現,編碼智能體(Coding Agent)已能端到端完成提交、測試、修復。開發者只需用自然語言描述需求,“感覺”結果對就收貨,故稱 Vibe Coding——一種以“氛圍/結果”為導向的 AI 原生開發范式。

Vibe Coding全面技術分類
傳統開發 | Vibe Coding |
人寫每一行代碼 | 人只寫“提示”,AI 自動生成 |
逐行調試 | 只看運行結果(vibe) |
代碼評審看語法 | 代碼評審看行為 |
30余中大模型Coding Agents能力分析

16種商業AI輔助編程Agents

Vibe Coding 長什么樣?

圖2:人-項目-Agent 的動態閉環
論文將其形式化為受限馬爾可夫決策過程(CMDP):
- 狀態 S:項目快照(代碼+文檔+數據)
- 動作 A:人發指令 → Agent 產生代碼/命令
- 獎勵 R:人只看運行結果給 0/1 反饋
- 約束 C:項目規范、安全邊界、Token 上限
技術棧全景圖

圖1:支撐 Vibe Coding 的四大技術板塊
板塊 | 關鍵能力 | 代表工作 |
Code LLM | 代碼補全、理解、重構 | CodeLlama、DeepSeek-Coder、StarCoder2 |
Coding Agent | 計劃、記憶、工具調用 | OpenHands、MetaGPT、SWE-agent |
開發環境 | 沙箱執行、IDE 插件、分布式編排 | Docker+K8s、Cursor、AutoGen |
反饋機制 | 編譯/運行/人類/自反思 四級反饋 | RLCF、Reflexion、Self-Refine |
五類開發模式怎么選?

圖8 模式對比
圖8:五類 Vibe Coding 模式在“人控-約束-上下文”三維空間中的分布
模式 | 適用場景 | 人參與程度 | 質量保障手段 |
UAM 無約束自動化 | 原型、一次性腳本 | 極低 | 只看結果 |
ICCM 對話協作 | 業務功能迭代 | 高 | 人review每輪代碼 |
PDM 規劃驅動 | 復雜系統、架構先行 | 高 | 先寫設計文檔再編碼 |
TDM 測試驅動 | 核心算法、庫 | 中 | 人寫測試→AI過測 |
CEM 上下文增強 | 大倉維護、遺留代碼 | 中 | RAG 檢索現有代碼/規范 |
實踐中可組合:PDM+TDM 保證架構+質量;ICCM+CEM 維護百萬行老代碼。
五、數據&模型:從預訓練到后訓練

階段 | 關鍵技術 | 亮點數據 |
預訓練 | 持續預訓練(CPT)、FIM 目標 | Stack v2(67 TB,619 語言) |
指令微調 | OSS-Instruct、Evol-Instruct | OpenCodeInstruct 5 M 樣本 |
偏好對齊 | RLHF → DPO → GRPO | CodeUltraFeedback 10 k 四選一對比 |
后訓練趨勢:用可驗證獎勵替代人類偏好——代碼能跑通就是 1,跑不通就是 0,簡單直接。

六、Agent 核心能力拆解

圖5:Coding Agent 的認知-記憶-工具三大子系統
- 規劃與分解
- Chain-of-Thought、Tree-of-Thought、CodePlan(動態圖算法)
- 記憶機制
- 短期:對話歷史(滑動窗口)
- 長期:向量庫+代碼索引(MemoryBank、MemGPT)
- 工具執行
- 統一為“代碼即動作”——Python 解釋器一把梭
- MCP 協議讓 Agent 一鍵調用 Git/Linter/云 API
七、沙箱與云原生:讓 AI 安全地“放飛”

隔離手段 | 實現示例 |
容器級 | Docker+Kubernetes(25 000 vCPU 集群) |
系統調用過濾 | gVisor、NatiSand |
硬件級 | Intel PKRU、ARM TrustZone |
語言級 | WebAssembly 運行時 |
CI/CD 也升級為 Agent-as-a-Job:Agent 提交 PR → 自動跑單測/安全掃描 → 人類仲裁。
八、四級反饋回路:讓錯誤越早暴露越好

圖7:編譯、運行、人類、自反思四級反饋
- 編譯反饋:RLCF 把 gcc 報錯當獎勵信號,提升 45% 通過率
- 運行反饋:Test-Driven 生成多組單元測試,AI 自評
- 人類反饋:ClarifyGPT 主動提問消除需求歧義
- 自反思:Reflexion 用“語言強化學習”把失敗經驗轉成自然語言提示, HumanEval 提升 11%
Vide Coding價值
- 個人開發者
- 把 Vibe Coding 當“高級自動補全”→ 先 ICCM+CEM,逐步降低人工 review 粒度
- 寫好測試 = 給 AI 畫“靶子”
- 團隊/企業
- 用 TDM 寫核心庫,PDM 做架構,UAM 做 PoC
- 在 CI 里接入“AI 安全守門員”——靜態+動態+多 Agent 互審
- 研究者
- 弱監督、可驗證獎勵、多模態反饋仍是藍海
- 建立“代碼行為”級別的基準,而非單純 Pass@k
“Vibe Coding 不是讓程序員失業,而是讓程序員升級為系統指揮家。”準備好拿起指揮棒,和 AI 一起開演下一部軟件交響曲了嗎?
https://arxiv.org/abs/2510.12399v1
A Survey of Vibe Coding with Large Language Models
https://github.com/YuyaoGe/Awesome-Vibe-Coding本文轉載自??PaperAgent???,作者:????PaperAgent??

















