精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

分享一名海外獨立開發者的 AI 編程工作流 原創 精華

發布于 2025-11-19 17:30
瀏覽
0收藏

編者按: 當 AI 編程智能體宣稱能自動化一切時,我們是否在工具與概念的叢林中迷失了方向,反而忘記了如何最簡單、直接地解決問題?

本文的核心主張尖銳而明確:與其追逐繁雜的“智能體套件”、子智能體(Subagents)、RAG 等概念,不如回歸本質 —— 選擇一個強大且高效的模型,像與一位靠譜的工程師同事那樣,通過簡潔的對話和直覺性的協作來直接解決問題。作者直言不諱地批評了當前生態中許多“華而不實”的工具,認為它們不過是繞開模型本身低效的臨時補丁,并分享了他如何用多個終端窗口和經典工具(如 tmux)實現比許多專用工具更靈活、更可控的工作流。

本文系原作者觀點,Baihai IDP 僅進行編譯分享

作者 | Peter Steinberger

編譯 | 岳揚

分享一名海外獨立開發者的 AI 編程工作流-AI.x社區

最近我沒怎么在社交平臺上活躍,因為我正全身心投入到最新的項目中。如今,智能體工程(Agentic engineering)已經變得非常強大,幾乎能編寫出我需要的 100% 的代碼。然而,我卻看到很多人還在費力解決本不該存在的問題,搞出一堆繁復的表演,而不是專注把事搞定。

這篇文章的部分靈感來自最近在倫敦參加的“Claude Code Anonymous”活動[1]上的對話,另一部分則是因為距離我上次更新工作流已經整整一年(還是 AI 年[2]??)。是時候做個回顧了。

所有基礎理念依然適用,像上下文管理這類簡單內容本文不再贅述。想了解基礎內容,請閱讀我之前寫的《Optimal AI Workflow》[3]一文。

01 我的工作背景與技術棧

我是一名獨立開發者,當前開發的項目是一個約 30 萬行代碼的 TypeScript React 應用,外加一個 Chrome 擴展、一個 CLI 工具、一個基于 Tauri 的客戶端應用,以及一個使用 Expo 的移動應用。網站托管在 Vercel 上,每次 PR 后大約兩分鐘就能測試新版本,其他應用尚未實現自動化部署。

02 我所使用的技術工具和處理開發任務的總體思路

我已完全改用 codex cli 作為主力工具。通常我會在一個 3x3 的終端網格中同時運行 3 到 8 個實例,它們大多位于同一目錄[4],部分實驗性任務則會放在獨立文件夾中。我嘗試過 worktrees、PR 等方式,但總會回到當前這套配置,因為它能最快地把事情做完。

我的智能體(agents)會自行執行原子化的 Git commits[5]。為了保持相對干凈的 commit 歷史,我在 agent 配置文件[6]上反復迭代優化。這樣一來,Git 操作更精準,每個智能體只提交它實際修改過的文件。

是的,用 Claude 你可以設置 hooks(譯者注:可能是 git commit hook),而 codex 目前還不支持 hooks,但大模型極其聰明 —— 一旦它們下定決心,沒有任何 hook 能攔得住[7]。

過去我曾因此被嘲諷為垃圾代碼制造機[8],如今看到并行運行智能體的做法逐漸成為主流[9],深感欣慰。

03 模型選擇

我幾乎所有的開發工作都交由 gpt-5-codex 在“medium 配置”下完成。它在智能程度與速度之間取得了極佳的平衡,還能自動調節思考深度。我發覺過度糾結這些設置并無明顯的回報,而且不用操心“超深度思考”(ultrathink)的感覺真的很輕松。

3.1 爆炸半徑 ??

每次工作時,我都會考量“爆炸半徑” —— 這個詞不是我發明的,但我非常喜歡。當構思某個改動時,我基本能預判其耗時及波及的文件范圍。我可以向代碼庫投擲多枚“小手雷”,或是一發“胖子”配幾顆小炸彈。但如果你同時扔下多個大炸彈,就幾乎不可能做出隔離良好的提交,一旦出錯也更難回滾。

這同時也是我觀察智能體運行時的一個重要指標。如果某項任務耗時超出預期,我會直接按 Esc,然后問一句“當前狀態如何?”來獲取任務進度,再決定是幫模型調整方向、中止任務,還是繼續執行。別害怕在中途打斷模型 —— 文件修改是原子性的,它們非常擅長接續未完成的工作。

當我對改動的影響不確定時,會先讓模型“在修改前給我幾個選項”,以此評估影響范圍。

3.2 為何不用 Worktree?

我始終只運行一個開發服務器。在迭代項目時,我會通過實時操作界面,一次性測試多處改動。如果為每個功能變更都創建獨立的工作樹(worktree)或分支(branch),會嚴重拖慢我的測試流程。而同時啟動多個開發服務器又會帶來不必要的操作負擔。此外,我的項目受 Twitter OAuth 規則限制,只能注冊有限數量的回調域名,這從客觀上也不支持多環境并行的開發方式。

3.3 那 Claude Code 呢?

我曾經很喜歡 Claude Code,但如今實在受不了了(即便 codex 對其贊譽有加[10])。那種語言風格、那種斬釘截鐵的“絕對正確”[11]、那種測試明明失敗卻宣稱“100%滿足生產要求”的語氣——實在令人無法繼續。相比之下,codex 更像是那個內向但靠譜的工程師:默默推進,把事情做完。它在開始工作前會讀取更多文件,因此即使是簡短的提示詞,通常也能精準實現我想要的效果。

在我關注的信息流中,大家已普遍認為 codex 才是當前的首選[12-13]。

3.4 codex 的其他優勢

  • 約 23 萬的可用上下文(context),而 Claude 只有 15.6 萬。是的,如果你運氣好或愿意按 API 定價付費,Sonnet 確實有 100 萬上下文,但現實中 Claude 在耗盡上下文之前就已經開始胡言亂語了,所以這個超長上下文實際上并不可用。
  • 更高的 token 利用效率。我不知道 OpenAI 做了什么不同處理,但我的上下文空間在 codex 中消耗得明顯更慢。用 Claude 時我經??吹?“Compacting…” 提示,而在 Codex 中我極少觸及上下文上限。
  • 消息隊列(Message Queuing)。Codex 支持消息排隊[14]。Claude 以前也有這功能,但幾個月前改成了“消息會實時引導模型”的機制。如果我想引導 codex,只需按 Esc 再回車就能發送新消息。能同時選擇“排隊”或“即時干預”顯然更好。我經常一次性將多個相關功能任務放入隊列,它總能可靠地逐個完成。
  • 速度。OpenAI 用 Rust 重寫了 codex,效果立竿見影 —— 響應速度快得驚人。而用 Claude Code 時,我經常遇到數秒的卡頓,內存占用動輒飆到幾個 GB。還有終端顯示的閃爍問題,尤其是在用 Ghostty 時。Codex 完全沒有這些問題,感覺極其輕量、流暢。
  • 語言風格。這點對我的心理健康真的很重要[15]。我曾無數次對 Claude 大吼大叫,但很少對 codex 發火。哪怕 codex 模型能力稍弱,光憑這一點我也愿意用它。只要你兩個都用上幾周,就懂我在說什么。
  • 不會到處亂生成 markdown 文件[16]。懂的都懂(IYKYK)[17]。

3.5 為何不選用其他開發工具

在我看來,終端用戶和大模型公司之間其實沒有太多中間空間。我目前通過訂閱獲得的性價比遠高于其他方式。我現在有 4 個 OpenAI 訂閱和 1 個 Anthropic 訂閱,每月總花費大約 1000 美元,基本可以享受“無限 token”的使用體驗。如果改用 API 調用,成本大概會高出 10 倍。別太較真這個數字——我用過像 ccusage 這樣的 token 統計工具,數據多少有些不精確,但即便只是五倍,也已是相當劃算的交易了。

我很欣賞像 amp 或 Factory 這樣的工具,但我不認為它們能長期存活。無論是 codex 還是 Claude Code,每個版本都在變得更強,而且功能理念正在快速趨同。某些工具可能在待辦列表、引導控制或細微的開發者體驗(DX)上暫時領先,但我不覺得它們能真正超越大型 AI 公司。

amp 已經不再以 GPT-5 為核心驅動,轉而稱其為“Oracle”(神諭)[18]。而我直接使用 codex,本質上就是一直在和那個更聰明的模型——也就是“Oracle”——打交道。是的,有各種基準測試[19],但考慮到使用場景的巨大不同,我不太信任那些結果。實際體驗中,codex 給我的輸出遠優于 amp。不過我得承認,他們在會話共享方面確實做了些有趣的創新。

Factory?我還沒被說服。他們的演示視頻有點尷尬,雖然我在信息流里確實聽到一些正面評價 —— 盡管目前還不支持圖像(至少現在還不行),而且也有標志性的閃爍問題[20]。

Cursor……如果你還在親手寫代碼,那它的 Tab 補全模型確實是業界領先。我主要用 VS Code,但確實欣賞他們在瀏覽器自動化和計劃模式(plan mode)等方面的探索。我試過 GPT-5-Pro,但 Cursor 依然存在那些從五月起就讓我煩躁的 bug[21]。聽說他們正在修復,所以它還留在我的程序塢里。

像 Auggie 這樣的工具,只在我的信息流上曇花一現,之后就再沒人提過。歸根結底,它們底層無非是封裝了 GPT-5 和/或 Sonnet,完全可以被替代。RAG 對 Sonnet 或許有點用,但 GPT-5 本身在代碼檢索上已經強到根本不需要額外的向量索引。

目前最有希望的是 opencode 和 crush,尤其是搭配開源模型使用時。你當然也能通過它們使用 OpenAI 或 Anthropic 的訂閱(得益于一些巧妙的技術手段[22]),但這是否合規仍存疑,況且為何要為一個專為 Codex 或 Claude Code 優化的模型,配上一個能力較弱的“外殼”呢。

3.6 關于開源模型

基準測試只能說明一半的問題。在我看來,智能體工程(agentic engineering)大約在 Sonnet 4.0 發布的五月,才真正從“這玩意兒真爛”邁入“這還不錯”的階段;而隨著 gpt-5-codex 的出現,我們又迎來了一次更大的進步 —— 從“不錯”直接進入“這簡直太棒了”的境界。

3.7 計劃模式(Plan Mode)與方法

基準測試所忽略的,是模型與工具在接到指令后所采取的策略。codex 要謹慎得多 —— 它會在決定行動前讀取你代碼庫中更多的文件。當你提出一個荒謬請求時,它也更傾向于明確反對[23]。相比之下,Claude 或其他智能體會更急切地直接動手嘗試。雖然可以通過“計劃模式”(plan mode)和嚴謹的結構化文檔來緩解這個問題,但對我而言,這感覺像是在給一個有缺陷的系統打補丁。

如今我幾乎不再為 codex 使用大型的計劃文件。其實 codex 甚至沒有專門的計劃模式(plan mode) —— 但它對提示詞的理解和遵循能力實在太強,我只要寫一句“我們先討論一下”或“給我幾個選項”,它就會耐心等待我確認后再行動。完全不需要那些花里胡哨的東西,直接跟它對話就行。

3.8 但 Claude Code 現在有插件了

你聽見遠處那聲嘆息了嗎?那是我在嘆氣。這真是徹頭徹尾的胡扯。Anthropic 的這一舉動讓我對他們的產品方向感到非常失望。他們試圖用插件[24]來掩蓋模型本身的低效。當然,為特定任務維護優質文檔是個好主意 —— 我自己就在一個 docs 文件夾里存了大量有用的 Markdown 文檔。

3.9 但是!子智能體呢

但關于這場“子智能體”(subagents)的盛宴,我有些話不吐不快。今年五月時,這還叫“子任務”(subtasks),主要是當模型不需要完整上下文時,把任務拆出去單獨處理——比如并行執行,或避免把冗長的構建腳本塞進主上下文造成浪費。后來他們重新包裝并升級為“子智能體”,讓你可以帶著指令“優雅地”打包并分派任務。

但使用場景本質上沒變。別人用子智能體干的事,我通常用多個終端窗口就搞定了。 如果我想調研某個問題,可能會在一個終端窗格里操作,再把結果粘貼到另一個窗格。這種方式讓我對上下文工程擁有完全的控制權和可見性,而子智能體反而讓上下文變得難以查看、引導或控制。

還有 Anthropic 博客里推薦的那個子智能體 —— 你去看看他們那個所謂的“AI Engineer”智能體[25]。那簡直就是一鍋大雜燴:一邊吹集成了 GPT-4o 和 o1,一邊堆砌一堆自動生成的空洞詞匯,試圖顯得有邏輯。里面根本沒有能讓智能體真正變成更好“AI 工程師”的實質內容。

這到底有什么用?如果你希望獲得更好的輸出,光告訴模型“你是一位專精于生產級 LLM 應用的 AI 工程師”是沒用的。真正有用的是提供文檔、示例,以及明確的“該做什么/不該做什么”。 我敢打賭,你讓智能體去“搜索 AI 智能體構建的最佳實踐”并加載幾個網頁,效果都比那堆廢話強得多。你甚至可以說,這種胡扯本身就是一種上下文污染(context poison)[26]。

04 我的提示詞撰寫之道

以前用 Claude 時,我(當然不是手打,而是靠語音)會寫非常詳盡的提示詞,因為那個模型“給越多上下文,越懂我”。雖然所有模型多少都這樣,但我發現換用 codex 后,提示詞明顯變短了 —— 常常就一兩句話,外加一張圖。這個模型讀代碼庫的能力極強,就是能精準理解我的意圖。有時候我甚至又愿意打字了,因為 codex 根本不需要太多上下文就能明白。

添加圖片是個絕妙的技巧,能快速補充上下文。 模型非常擅長精準定位你截圖中的內容 —— 無論是字符串還是界面元素,它都能迅速匹配并跳轉到你提到的位置。我至少有一半的提示詞都包含截圖,雖然添加標注效果更佳但效率更低,而直接拖拽截圖到終端僅需兩秒。

帶語義糾錯的 Wispr Flow[27] 仍是當前最優方案。

05 Web 端智能體新體驗

最近我又重新嘗試了一些 Web 端智能體:Devin、Cursor 和 Codex。Google 的 Jules 界面美觀,但配置流程繁瑣,且 Gemini 2.5 現在已經算不上好模型了。不過一旦 Gemini 3 Pro 上線[28],情況或許會有所轉變。目前唯一留下來的只有 codex web。雖然它也存在配置復雜的問題,而且現在還有 Bug(終端目前就無法正確加載),但我靠一個舊版環境讓它跑起來了,代價是啟動速度更慢。

我把 codex web 當作臨時的問題追蹤器。在外突發靈感時,就用 iOS App 發一條一行字的提詞詞,回頭在 Mac 上再仔細處理。當然,我完全可以在手機上做更多事,比如審查、合并代碼,但我刻意保持克制。我的工作已經夠讓人上癮了,所以當我出門或和朋友聚會時,不想被進一步拉回工作狀態。說這話的人,可是曾花將近兩個月專門開發了一款便于使用手機編程的工具啊。

codex web 上的任務原本不計入使用額度,可惜這樣的好日子恐怕快到頭了。

06 The Agentic Journey

聊聊那些工具吧:Conductor[29]、Terragon[30]、Sculptor[31] 等數以千計的同類產品。有些是個人愛好項目,有些則被 VC 投來的錢淹得喘不過氣。我試過太多太多,沒一個能讓我長期用下去。在我看來,它們都是在繞開當前模型的低效,推行一種并不真正高效的工作流。而且大多數還藏起終端,不讓你看到模型的全部輸出。

絕大多數不過是 Anthropic SDK 的淺層封裝 + 工作樹管理,毫無技術護城河可言。我甚至懷疑:我們真的需要在手機上更方便地調用編程智能體嗎?這些工具的有限應用場景,現在 codex web 已經完全覆蓋了。

不過我確實觀察到一個普遍現象:幾乎每個工程師都會經歷一個“自己造工具”的階段 —— 主要是因為好玩,也因為現在做這件事確實太容易了。既然如此,還有什么比造一個“(我們以為)能讓造工具變得更簡單的工具”更自然呢?

07 但 Claude Code 能處理后臺任務!

確實如此。codex 目前缺少一些 Claude 有的小功能,其中最讓人頭疼的就是后臺任務管理。 雖然理論上應該有超時機制,但我確實多次遇到它卡在不會自動結束的 CLI 任務上,比如啟動開發服務器,或者死鎖的測試。

這曾是我一度切回 Claude 的原因之一。但鑒于那個模型在其他方面實在太不靠譜,我現在改用 tmux。tmux 是一個老牌工具,能在后臺持久化運行 CLI 會話,而且模型里早就內置了大量相關知識 —— 你只需要說一句“用 tmux 運行”,就能搞定,無需任何復雜的智能體配置流程。

08 那 MCPs 呢?

關于 MCP(Model Context Protocol),其他人已經寫了很多。在我看來,大多數 MCP 本質都只是市場部門用來打勾炫耀的工具。幾乎所有 MCP 其實都應該做成 CLI。這話出自一個自己寫過 5 個 MCP[32] 的人之口。

我可以直接按工具名字調用一個 CLI,根本不需要在 agent 配置文件里寫任何說明。模型第一次調用時可能會試一些亂七八糟的命令($randomcrap),CLI 會自動返回幫助菜單,上下文立刻就擁有了完整的使用信息 —— 從此一切順利。我不用為任何工具付出額外代價,而 MCP 卻是持續的成本,還會污染我的上下文。試試 GitHub 的 MCP,瞬間吃掉 23k tokens。好吧,他們后來優化了 —— 剛上線時可是接近 5 萬 tokens!換成 gh CLI 呢?功能基本一樣,模型本來就認識它,還完全不用交“上下文稅”。

我自己開源了一些 CLI 工具,比如 bslog[33] 和 inngest[34]。

我現在確實在用 chrome-devtools-mcp[35] 這個工具來做最終驗證[36],它已經取代了 Playwright,成為我進行網頁調試時的首選 MCP 工具。雖然我不常用它,但一旦需要,它就能幫我完成從“代碼修改”到“驗證結果”這個關鍵閉環,非常有用。我還專門設計了我的網站,讓模型能通過 curl 查詢任意接口(通過我生成的 API key)——這在幾乎所有場景下都比 MCP 更快、更省 token。所以就連這個 MCP,我也不是每天都需要。

09 但生成的代碼太糟糕了!

我約 20% 的時間[37]投入在重構上。當然,這些全由智能體完成,我絕不會手動浪費時間干這種事。當我不太需要高度專注或感到疲憊時,“重構日”就特別有用 —— 即使狀態一般,也能取得顯著進展。

典型的重構工作包括:用 jscpd 找重復代碼,用 knip[38] 清理死代碼,運行 eslint 的 react-compiler 和棄用插件(譯者注:一類 ESLint 插件,用于檢查代碼中是否使用了已過時的 API、方法或特性,并提示你改用現代、推薦的替代方案。),檢查是否有可合并的 API 路由,更新文檔,拆分過大的文件,為復雜邏輯補充測試和注釋,更新依賴項,升級工具鏈,調整目錄結構,找出并重寫慢測試,引入現代 React 模式(比如你可能根本不需要 useEffect)等等。總有做不完的事。

有人可能會說這些應該在每次提交時就做完。但我發現,先快速迭代、再集中維護和優化代碼庫——即階段性償還技術債務——這種方式不僅效率更高,而且整體上有趣得多。

10 你采用規范驅動開發(spec-driven development)嗎?

我去年六月還在用這種方式:先寫一份詳盡的規格文檔,然后讓模型去實現,理想情況下能連續跑上好幾個小時。但現在我覺得,這種“先設計后構建”的思路已經是過時的軟件開發范式了。

我現在的做法通常是:先直接和 codex 展開討論,貼一些網站鏈接、初步構想,讓它解讀現有代碼,然后我們一起把新功能逐步梳理出來。如果問題比較棘手,我會讓它把思路整理成一份規范文檔,然后交給 GPT-5-Pro(通過 ??chatgpt.com???)做評審,看看是否有更好的建議 —— 出乎意料的是,這經常能大幅優化我的方案!接著,我會把其中我覺得有用的部分粘回主上下文,用于更新實際文件。

現在我對不同任務消耗多少上下文已經有不錯的直覺,而 codex 的上下文容量也相當充足,所以很多時候我干脆直接開干。有些人很“虔誠”,總喜歡為每個新計劃新開一個上下文窗口 —— 我覺得這在 Sonnet 時代還有點用,但 GPT-5 處理長上下文的能力強得多,如果還這么做,每次都會白白多花 10 分鐘,因為模型得重新慢慢加載所有構建功能所需的文件。

更有趣的方式是做基于 UI 的開發。我經常從一個非常簡單的東西開始,故意把需求寫得極其模糊,然后一邊看模型編碼,一邊在瀏覽器里實時看到效果。接著我再排隊加入更多調整,逐步迭代這個功能。很多時候我自己也不確定最終該長什么樣,這種方式讓我能邊玩邊試,看著想法慢慢成形。有時 codex 甚至會做出一些我根本沒想到但很妙的設計。我從不重置進度,只是一步步迭代,把混沌慢慢塑造成我覺得對的形狀。

開發過程中,我也常會冒出一些關聯功能的新點子,順勢對其他部分也做些調整 —— 這部分工作我會放到另一個智能體里處理。通常我主攻一個核心功能,同時并行處理一些次要但相關的任務。

就在我寫這段文字時,我正在給 Chrome 擴展開發一個新的 Twitter 數據導入器,為此我正在重構 graphql 導入模塊。因為還不確定這個方案是否合理,我把這部分代碼放在一個單獨的文件夾里,這樣可以通過 PR 預覽來判斷思路是否成立。主倉庫則在做重構,讓我能專心寫這篇文章。

11 請分享您的斜杠命令!

我只有少數幾個斜杠命令,而且很少用:

  • /commit(自定義說明文本,用于協調多智能體在同一目錄協作時僅提交自身修改。這樣能保持提交信息干凈,也能防止 GPT 因看到其他改動而 panic,比如 linter 報錯時亂 revert(譯者注:Git 版本控制中的常用術語,撤銷某次或某幾次提交(commit)所引入的更改。))
  • /automerge(一次處理一個 PR:響應機器人評論、回復、等 CI 通過后自動 squash 合并(譯者注:Git 版本控制中的常用術語,將多個連續的提交記錄合并成一個單一的、干凈的提交。))
  • /massageprs(和 automerge 類似,但不用 squash,方便在有大量 PR 時并行處理)
  • /review(內置命令,偶爾用 —— 因為 GitHub 上已有 review bot,但有時還是有用)

即便如此,大多數時候我其實就直接打 “commit” 兩個字。除非我知道當前有太多臟文件,擔心智能體在沒有引導的情況下出錯。如果我確信簡單指令就夠了,就絕不會搞那些花哨的表演或浪費上下文。這種直覺是慢慢練出來的。到目前為止,我還沒見過其他真正有用的斜杠命令。

12 其他實用技巧

與其費盡心思寫出完美的提示詞去“激勵”智能體完成一個長期任務,不如用點偷懶的變通方法。 比如進行大型重構時,Codex 常會在中途暫停響應。這時候,只要提前排好幾條 “continue” 消息,你就可以走開,等回來時活兒就干完了。如果 codex 已經完成了任務,再收到更多消息,它也會愉快地忽略掉。

每次完成一個功能或 Bug 修復后,請讓模型在同一上下文中順手寫點測試用例。 這樣做不僅能產出質量高得多的測試用例,還常常能暴露代碼實現中的 bug。如果是純 UI 調整,可能測試意義不大。但對于其他情況,我強烈建議這么做。AI 寫測試用例總體上還是不太行,但已經比沒有強多了 —— 而且說實話,你自己每次改代碼都會寫測試用例嗎?

讓模型“保留你的原始意圖”,并“在復雜邏輯處添加代碼注釋”,這對您和后續模型理解代碼都大有裨益。

當遇到棘手難題時,在提示詞中加入一些觸發詞,比如 “take your time”(慢慢來)、“comprehensive”(全面一點)、“read all code that could be related”(讀所有可能相關的代碼)、“create possible hypothesis”(提出可能的假設) —— 這些都能讓 codex 解決最棘手的問題。

13 你的 Agents/Claude 配置文件是什么樣的?

我創建了一個名為 ??Agents.md??? 的主配置文件,然后為它創建了一個符號鏈接(譯者注:Linux 操作系統中一個特殊的文件,內容存儲指向目標文件或目錄的路徑字符串),這個鏈接的名字叫 ??claude.md??。我這么做是因為開發 Claude 的 Anthropic 公司沒有采用和其他工具(比如 Codex)統一的配置文件命名標準。我承認這很麻煩也不理想 —— 畢竟 GPT-5 和 Claude 偏好的提示詞風格差異很大[39]。如果你還沒看過它們各自的提示詞指南,建議現在就去讀一讀。

Claude 對那種 ?? 全大寫咆哮式命令 ??[40](比如“如果你執行 X 命令,后果將極其嚴重,100 只小貓會死掉!”)反應良好,但這會讓 GPT-5 直接崩潰(也確實該崩潰)。所以,請徹底放棄這種寫法,像正常人一樣用平實的語言就行。這也意味著這些配置文件很難被最優地共享。不過對我來說問題不大,因為我主要用 codex,即使偶爾讓 Claude 上場,我也接受這些指令對它來說可能強度不足。

我的 Agent 配置文件目前大約 800 行,感覺就像一堆“組織創傷”留下的疤痕組織。這不是我手寫的,而是 codex 自己生成的。每次出了狀況,我都會讓它在文件里加一條簡潔備注。我應該找個時間清理一下配置文件,但盡管文件很長,它卻運行得極其可靠 —— GPT-5 也確實幾乎總是遵守里面的規則。至少比 Claude 以前強太多了。(當然也得承認,Sonnet 4.5 在這方面確實有進步)

除了 Git 操作說明,文件里還包含產品說明書、我偏好的命名規范和 API 模式、關于 React Compiler 的注意事項等等 —— 很多內容甚至比模型的“世界知識”還新,因為我的技術棧相當激進。我預計隨著模型更新,這部分內容還能進一步精簡。例如,Sonnet 4.0 當年需要大量指導才能理解 Tailwind 4,而 Sonnet 4.5 和 GPT-5 已經內置了相關知識,所以我直接刪掉了所有冗余的相關說明。

文件里很大一塊內容專門描述我偏好的 React 模式、數據庫遷移管理策略、測試規范,以及如何使用和編寫 ast-grep 規則。(如果你還不知道 ast-grep,或者沒把它用作代碼庫的 linter,請立刻停下來,讓模型幫你把它設為 Git hook,用來攔截不符合規范的提交。)

我還嘗試過一種基于文本的“設計系統”,用來規定 UI 應該長什么樣 —— 不過這個實驗目前還沒下定論。

14 那么 GPT-5-Codex 是完美的嗎?

當然不是。有時候它會花半個小時重構代碼,然后突然 panic,把所有改動全 revert 掉 —— 這時候你得重新運行,并像哄小孩一樣安撫它:“你有足夠的時間,慢慢來?!?有時它會忘記自己其實能執行 bash 命令,需要你鼓勵一下。偶爾它還會用俄語或韓語回復。更離譜的是,有時候這個“怪物”一滑手,直接把內部思考過程原樣扔進了 bash 終端。但總體而言,這些情況相當罕見,而它在其他幾乎所有方面都強到離譜,讓我完全可以忽略這些小毛病。畢竟,人類也不是完美的。

我對 codex 最大的不滿是它會“丟失文本行” —— 快速向上滾動時,部分文本會莫名其妙消失。真心希望 OpenAI 把這個 Bug 放在修復清單的最頂端,因為這是目前唯一迫使我放慢操作速度的原因,就怕消息突然不見了。

15 結論

別在 RAG、子智能體(subagents)、Agents 2.0 或其他華而不實的花架子上浪費時間了。直接跟它對話,動手試,慢慢培養直覺。你和智能體合作得越多,結果就會越好。

Simon Willison 的文章[41]說得特別到位:管理智能體所需的許多技能,其實和管理工程師非常相似 —— 而這些能力,幾乎全都是資深軟件工程師的特質。

而且沒錯,寫出好軟件依然很難。我不再親手寫代碼,并不意味著我不再深入思考架構、系統設計、依賴關系、功能實現,或者如何讓用戶感到驚喜。使用 AI 只意味著:大家對你交付成果的期望值變高了。

PS: 本文 100% 原創手寫。我熱愛 AI,但也清楚有些事用老辦法反而更好。保留這些筆誤,保留我的聲音。????

PPS: 文章頭圖由 Thorsten Ball 提供[42],特此致謝。

END

本期互動內容 ??

?文中哪個觀點你極度認同?或者,哪個地方你持保留意見?

文中鏈接

[1]??https://x.com/christianklotz/status/1977866496001867925??

[2]??https://x.com/pmddomingos/status/1976399060052607469??

[3]??https://steipete.me/posts/2025/optimal-ai-development-workflow??

[4]??https://x.com/steipete/status/1977771686176174352??

[5]??https://x.com/steipete/status/1977498385172050258??

[6]??https://gist.github.com/steipete/d3b9db3fa8eb1d1a692b7656217d8655??

[7]??https://x.com/steipete/status/1977119589860601950??

[8]??https://x.com/weberwongwong/status/1975749583079694398??

[9]??https://x.com/steipete/status/1976353767705457005??

[10]??https://x.com/steipete/status/1977072732136521836??

[11]??https://x.com/vtahowe/status/1976709116425871772??

[12]??https://x.com/s_streichsbier/status/1974334735829905648??

[13]??https://x.com/kimmonismus/status/1976404152541680038??

[14]??https://x.com/steipete/status/1978099041884897517??

[15]??https://x.com/steipete/status/1975297275242160395??

[16]??https://x.com/steipete/status/1977466373363437914??

[17]??https://x.com/deepfates/status/1975604489634914326??

[18]??https://ampcode.com/news/gpt-5-oracle??

[19]??https://x.com/btibor91/status/1976299256383250780??

[20]??https://x.com/badlogicgames/status/1977103325192667323??

[21]??https://x.com/steipete/status/1976226900516209035??

[22]??https://x.com/steipete/status/1977286197375647870??

[23]??https://x.com/thsottiaux/status/1975565380388299112??

[24]??https://www.anthropic.com/news/claude-code-plugins??

[25]??https://github.com/wshobson/agents/blob/main/plugins/llm-application-dev/agents/ai-engineer.md??

[26]??https://x.com/IanIsSoAwesome/status/1976662563699245358??

[27]??https://wisprflow.ai/??

[28]??https://x.com/cannn064/status/1973415142302830878??

[29]??https://conductor.build/??

[30]??https://www.terragonlabs.com/??

[31]??https://x.com/steipete/status/1973132707707113691??

[32]??https://github.com/steipete/claude-code-mcp??

[33]??https://github.com/steipete/bslog??

[34]??https://github.com/steipete/inngest??

[35]??https://developer.chrome.com/blog/chrome-devtools-mcp??

[36]??https://x.com/steipete/status/1977762275302789197??

[37]??https://x.com/steipete/status/1976985959242907656??

[38]??https://knip.dev/??

[39]??https://cookbook.openai.com/examples/gpt-5/gpt-5_prompting_guide??

[40]??https://x.com/Altimor/status/1975752110164578576??

[41]??https://simonwillison.net/2025/Oct/7/vibe-engineering/??

[42]??https://x.com/thorstenball/status/1976224756669309195??

本文經原作者授權,由 Baihai IDP 編譯。如需轉載譯文,請聯系獲取授權。

原文鏈接:

??https://steipete.me/posts/just-talk-to-it??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
丝袜老师在线| 国产中文在线| 亚洲二区视频| 亚洲网址你懂得| 992kp免费看片| 国产h片在线观看| 国产精品欧美一级免费| 国产66精品久久久久999小说| 国产精品午夜影院| 国产精品91一区二区三区| 精品少妇一区二区三区视频免付费| 久草精品在线播放| 伊人福利在线| 国产午夜亚洲精品羞羞网站| www.久久艹| 一女二男一黄一片| 久久激情一区| 欧美激情一区二区三区在线视频观看| 亚洲第一综合网| 精品国产影院| 91精品国产91热久久久做人人| 欧美精品色婷婷五月综合| 日本aa在线| 国产精品久久久久影院色老大| 久久天天狠狠| 欧美一级淫片免费视频魅影视频| 久久成人免费电影| 国产精品电影在线观看| 中文字幕激情小说| 亚洲小说区图片区| 欧美日韩国产成人| 国产一二三四区| 久久亚洲国产| 中文字幕亚洲无线码a| 无码人妻精品一区二区三区温州 | 国产精品s色| 最近2019中文免费高清视频观看www99| 国产在线观看无码免费视频| youjizz亚洲| 日韩女优av电影在线观看| 小泽玛利亚视频在线观看| 二区三区不卡| 色综合一个色综合亚洲| 男人天堂1024| 在线观看特色大片免费视频| 精品国产91久久久久久| 97超碰在线人人| 人交獸av完整版在线观看| 亚洲女女做受ⅹxx高潮| 在线观看三级网站| caoporn97在线视频| 亚洲精品国产视频| 欧美交换配乱吟粗大25p| 最新黄网在线观看| 伊人色综合久久天天| 992tv快乐视频| 欧美人与牲禽动交com| 一区二区三区四区激情| 波多野结衣与黑人| 我要色综合中文字幕| 国产精品理伦片| 亚洲日本一区二区三区在线不卡| 成人在线观看免费| 国产精品免费视频观看| 一本一本久久a久久精品综合妖精| 999在线视频| **性色生活片久久毛片| 毛片在线视频观看| 99色在线观看| 色婷婷一区二区| 亚洲国产高清av| 成人精品在线| 亚洲风情亚aⅴ在线发布| 无码人妻aⅴ一区二区三区| 久9久9色综合| 久久精品国产久精国产思思| 久久老司机精品视频| 国产精品久久久亚洲一区| 国产精品999999| 国产乱码精品一区二三区蜜臂 | 国产主播欧美精品| 国产成人三级在线播放 | 久久av无码精品人妻系列试探| 精品在线观看入口| www日韩中文字幕在线看| 欧美激情精品久久| 免费看的黄色欧美网站| 国产区亚洲区欧美区| 欧美熟妇另类久久久久久不卡| 久久日一线二线三线suv| 国产精品亚洲天堂| 理论片午夜视频在线观看| 欧洲一区在线电影| 亚洲av午夜精品一区二区三区| 网红女主播少妇精品视频| 中文字幕国内精品| 国产网站在线看| 免费国产亚洲视频| 精品视频在线观看| 久操视频在线免费播放| 欧美午夜视频一区二区| 天天久久综合网| 自拍偷拍欧美一区| 欧美日韩国产成人在线| 色婷婷久久综合中文久久蜜桃av| 成人晚上爱看视频| 一本久久a久久精品vr综合| f2c人成在线观看免费视频| 欧美三级在线看| 中文成人无字幕乱码精品区| 99久久亚洲精品蜜臀| 日本不卡视频在线播放| 亚洲美女性生活| 中文字幕亚洲精品在线观看| 欧美aⅴ在线观看| 亚洲日本视频在线| 精品国产一区二区三区久久| 丁香六月婷婷综合| 成人少妇影院yyyy| 玖玖精品在线视频| 欧美videos粗暴| 国产一区二区三区高清在线观看| 可以免费在线观看的av| 国产91精品一区二区| 中文字幕久久综合| 手机看片久久| 亚洲色图35p| 日产欧产va高清| 狠狠色丁香婷婷综合久久片| 神马影院一区二区三区| 飘雪影院手机免费高清版在线观看| 中文字幕五月欧美| 亚洲va综合va国产va中文| 一本色道久久综合亚洲精品酒店| 午夜精品久久17c| 性猛交xxxx乱大交孕妇印度| 亚洲欧美国产高清| 激情五月婷婷基地| 日韩欧美二区| 国产热re99久久6国产精品| xxxxx日韩| 在线观看视频欧美| 一级片久久久久| 日本在线播放一区二区三区| 午夜老司机精品| 91另类视频| 日韩中文字幕在线看| 亚洲图片欧美在线| 亚洲视频网在线直播| 亚洲久久中文字幕| 亚洲精品va| 99re6在线| hd国产人妖ts另类视频| 亚洲国产91色在线| 成人毛片18女人毛片| www久久精品| 激情综合网俺也去| 久久免费精品视频在这里| 91免费观看网站| 午夜成年人在线免费视频| 日韩精品一区二区在线| 精品无码m3u8在线观看| 久久影院视频免费| 国产 porn| 一本一本久久a久久综合精品| 99电影在线观看| 白浆在线视频| 国产亚洲欧美另类中文| 国产尤物视频在线观看| 亚洲影院理伦片| 99re久久精品国产| 日韩av一级片| 男女爱爱视频网站| 婷婷综合成人| 国产综合色香蕉精品| 国产又色又爽又黄刺激在线视频| 日韩精品在线电影| 亚洲图片欧美在线| 亚洲va中文字幕| 欧美18—19性高清hd4k| 国产精品自拍在线| 国产午夜福利100集发布| 精品香蕉视频| 成人一区二区三区四区| 免费观看一级欧美片| 精品激情国产视频| 色av男人的天堂免费在线| 欧美色男人天堂| 国产极品美女高潮无套嗷嗷叫酒店 | 伊人开心综合网| 亚洲第一页av| 国产乱妇无码大片在线观看| 欧美韩国日本在线| 亚洲色图88| 蜜桃视频在线观看91| 国产精品免费精品自在线观看| 51久久精品夜色国产麻豆| 黄色免费在线观看| 亚洲欧美一区二区三区在线| 国产人妻精品一区二区三区| 欧美性极品xxxx娇小| 2021亚洲天堂| 中文字幕 久热精品 视频在线| 亚洲一级Av无码毛片久久精品| 久久99深爱久久99精品| 91传媒久久久| 国产一区日韩一区| 一级一片免费播放| 精品国产一区二区三区| 岛国视频一区免费观看| 91精品麻豆| 国产精品极品在线| 伊伊综合在线| 久久久久久久久久久人体| 免费成人黄色| 亚洲一级黄色片| 亚洲aⅴ在线观看| 精品国产青草久久久久福利| 日韩久久久久久久久久| 午夜免费久久看| 久久久无码一区二区三区| 亚洲人成精品久久久久| 在线观看免费黄色网址| 久久精品人人做人人综合| 亚洲色图欧美日韩| 高清不卡一二三区| 欧美精品色视频| 国内国产精品久久| 免费网站在线观看黄| 蜜桃久久精品一区二区| 日韩毛片在线免费看| 国产精品视区| 久久久久久久久久久视频| 在线成人av| 精品少妇在线视频| 激情丁香综合| 蜜臀av色欲a片无码精品一区| 国产精品扒开腿做爽爽爽软件| 超碰97在线看| 国产精品红桃| 日韩av在线播放不卡| 亚洲精选一区| 中国丰满人妻videoshd| 亚洲一区二区三区四区五区午夜 | 夜夜嗨av一区二区三区免费区| 婷婷亚洲一区二区三区| 日韩精品在线观看一区| 欧美黄色小说| 一本色道久久88亚洲综合88| 尤物视频在线免费观看| 色yeye香蕉凹凸一区二区av| 美女写真理伦片在线看| 超碰日本道色综合久久综合| 欧美r级在线| 欧美日韩高清区| 极品av在线| 人体精品一二三区| yy6080久久伦理一区二区| 国产精品丝袜白浆摸在线| 四虎地址8848精品| 亚洲综合日韩在线| 激情小说亚洲图片| 欧美一区三区二区在线观看| 欧美综合另类| 久久久久亚洲av无码专区喷水| 国产一区激情| 成人久久久久久久久| 蜜桃视频一区二区三区在线观看| 天天色天天干天天色| 97国产一区二区| 丰满的亚洲女人毛茸茸| 亚洲另类在线制服丝袜| 日日夜夜综合网| 欧美日韩亚洲国产综合| 国产成人av免费看| 亚洲精品丝袜日韩| 日本中文字幕伦在线观看| 欧美激情久久久| 韩漫成人漫画| 亚洲一区二区免费在线| 偷拍精品福利视频导航| 国产麻豆电影在线观看| 一区二区高清| 亚洲综合av在线播放| 成人国产精品免费| 精品人妻无码一区| 亚洲五码中文字幕| 中文字幕在线观看1| 日韩欧美激情一区| 国产免费av在线| 美女少妇精品视频| 欧美大片免费| 国产富婆一区二区三区| 日本一二区不卡| 成人在线观看你懂的| 美洲天堂一区二卡三卡四卡视频| 国产白袜脚足j棉袜在线观看| 中文成人综合网| 国产成人亚洲欧洲在线| 欧美精品自拍偷拍| 男女网站在线观看| 欧美精品久久久久久久| 日韩电影精品| 欧美大陆一区二区| 黄色免费成人| 污视频网址在线观看| 中文字幕中文字幕精品| xxxx欧美18另类的高清| 毛片av在线| 国产91露脸中文字幕在线| 日韩精品免费视频一区二区三区| 日韩精品在在线一区二区中文| 精品动漫一区| av在线免费观看不卡| 国产日本欧美一区二区| 青青国产在线观看| 欧美xxxxx牲另类人与| 日本不卡视频| 国产精品吴梦梦| 亚洲区小说区图片区qvod按摩| 国产精品视频一二三四区| 久久99久久99小草精品免视看| 国产jjizz一区二区三区视频| 午夜精品久久久久久久99水蜜桃| 成人av无码一区二区三区| 色天天综合狠狠色| 香蕉成人影院| 日韩激情视频| 麻豆亚洲精品| 伊人网伊人影院| 欧美日韩亚洲一区二区三区| 老熟妇高潮一区二区高清视频 | 九九色在线视频| 亚洲在线观看视频网站| 亚洲精品一区二区妖精| xxxx在线免费观看| 亚洲视频免费看| 国产精品探花视频| 久久人人爽人人爽爽久久| 中文幕av一区二区三区佐山爱| 在线不卡视频一区二区| 精品一区二区免费视频| 91n在线视频| 在线电影一区二区三区| 麻豆电影在线播放| 91影视免费在线观看| 你懂的国产精品| 欧美午夜精品一区二区| 亚洲在线视频网站| 天堂v在线观看| 97高清免费视频| 一道本一区二区三区| 日韩视频在线免费看| 国产人久久人人人人爽| 凹凸精品一区二区三区| 日韩中文在线观看| 国产高清亚洲| 久久这里只有精品23| 91蜜桃传媒精品久久久一区二区| 少妇高潮av久久久久久| 中文国产成人精品久久一| 日本欧美在线| 日韩一级性生活片| 国产色产综合色产在线视频| 97人妻精品一区二区三区| 欧美精品18videos性欧| 天堂成人娱乐在线视频免费播放网站 | 91麻豆精品久久毛片一级| 欧美一级视频精品观看| av老司机免费在线| 日本婷婷久久久久久久久一区二区| 毛片av中文字幕一区二区| 青娱乐av在线| 亚洲欧美国产精品| 日韩一级特黄| 成 年 人 黄 色 大 片大 全| 26uuuu精品一区二区| 国产伦理一区二区| 91国语精品自产拍在线观看性色| 精品视频日韩| 一级黄色大片免费看| 色欧美日韩亚洲| 成人av福利| 欧美色欧美亚洲另类七区| 加勒比av一区二区| 日本熟妇色xxxxx日本免费看| 永久555www成人免费| 日韩精品视频在线看| 久久精品99国产| 亚洲色图丝袜美腿| 欧美69xxxxx| 7777精品伊久久久大香线蕉语言| 亚洲专区欧美专区| 国产一区二区精彩视频| 日韩电影网在线| 久久国际精品| 精品久久久久久久无码| 亚洲成人一区二区在线观看| 亚洲搞黄视频| 欧美日韩国产三区|