AgentKit將如何改變企業(yè)級(jí)AI應(yīng)用的構(gòu)建方式?
自大型語(yǔ)言模型向開發(fā)者開放以來(lái),API(應(yīng)用程序編程接口)一直是連接AI能力與應(yīng)用場(chǎng)景的核心橋梁。開發(fā)者們已經(jīng)習(xí)慣于通過調(diào)用API來(lái)完成特定的任務(wù)。然而,隨著OpenAI在發(fā)布GPT-5時(shí)同步推出AgentKit等一系列開發(fā)者工具,一個(gè)清晰的信號(hào)正在浮現(xiàn):AI應(yīng)用開發(fā)的重心,正從“調(diào)用API”的模式,向“構(gòu)建和編排AI智能體(Agent)”的全新范式遷移。
這種轉(zhuǎn)變,不僅僅是工具的更新,更是一次開發(fā)理念的深刻變革。它預(yù)示著未來(lái)的AI應(yīng)用,將不再是一個(gè)由開發(fā)者編寫大量“膠水代碼”來(lái)被動(dòng)串聯(lián)起多個(gè)API的程序,而可能是一個(gè)具備自主規(guī)劃和執(zhí)行能力的智能系統(tǒng)。作為深耕開發(fā)者生態(tài)的云服務(wù)商,我們認(rèn)為,理解這一范式轉(zhuǎn)變,對(duì)于每一位開發(fā)者規(guī)劃未來(lái)的技術(shù)路線都至關(guān)重要。
傳統(tǒng)范式:開發(fā)者作為API的中心調(diào)度者
在探討新范式之前,我們有必要回顧一下傳統(tǒng)的、基于API的AI應(yīng)用開發(fā)模式。在這種模式下,開發(fā)者扮演著中心調(diào)度者的角色,AI是被動(dòng)執(zhí)行者。
以構(gòu)建一個(gè)自動(dòng)化的旅行規(guī)劃應(yīng)用為例。開發(fā)者的工作流通常涉及以下幾個(gè)繁瑣的步驟:首先,需要調(diào)用一個(gè)自然語(yǔ)言理解API,來(lái)解析用戶的模糊需求,如“下周末去一個(gè)溫暖的海邊城市,預(yù)算五千”。接著,根據(jù)解析出的意圖,開發(fā)者需要編寫邏輯代碼,去分別調(diào)用航班搜索API、酒店查詢API以及當(dāng)?shù)鼗顒?dòng)推薦API。在獲取到各個(gè)API返回的零散數(shù)據(jù)后,還需要編寫大量的代碼來(lái)進(jìn)行數(shù)據(jù)整合、篩選、排序,并最終生成一個(gè)完整的旅行方案呈現(xiàn)給用戶。
在這個(gè)過程中,AI模型提供的API,本質(zhì)上是一個(gè)個(gè)功能強(qiáng)大的“函數(shù)庫(kù)”。它們能出色地完成被指定的子任務(wù),但整個(gè)工作流的邏輯、狀態(tài)的管理、錯(cuò)誤的捕獲以及不同工具之間的協(xié)同,完全依賴于開發(fā)者編寫的指令性代碼。
新范式:開發(fā)者作為Agent的架構(gòu)師
GPT-5及其配套工具AgentKit的推出,旨在改變這種開發(fā)模式。新范式的核心理念,是將開發(fā)者從繁瑣的流程編排中解放出來(lái),使其角色從“中心調(diào)度者”轉(zhuǎn)變?yōu)椤癆gent架構(gòu)師”。開發(fā)者的角色,從一個(gè)微觀管理每個(gè)樂器何時(shí)演奏的指揮家,轉(zhuǎn)變?yōu)橐粋€(gè)為整個(gè)交響樂團(tuán)設(shè)定總譜和目標(biāo)的作曲家。
AI Agent,或稱智能體,可以被理解為一個(gè)具備自主性的程序。它能夠理解一個(gè)高層級(jí)的目標(biāo),然后自主地進(jìn)行任務(wù)分解、制定計(jì)劃、選擇并調(diào)用合適的工具,最終完成這個(gè)目標(biāo)。
AgentKit正是為此而生的工具包。它允許開發(fā)者“在幾分鐘內(nèi)設(shè)計(jì)和部署AI Agents”。回到之前的旅行規(guī)劃例子,使用AgentKit的開發(fā)模式將截然不同。開發(fā)者不再需要編寫詳細(xì)的步驟指令,而是進(jìn)行更高層次的設(shè)計(jì):
- 定義目標(biāo): 為Agent設(shè)定一個(gè)清晰的目標(biāo),即“為用戶規(guī)劃一次滿足其時(shí)間、預(yù)算和偏好的旅行”。
- 提供工具: 授予Agent訪問一系列工具的權(quán)限,包括航班API、酒店API、地圖API以及一個(gè)用于計(jì)算總預(yù)算的代碼執(zhí)行環(huán)境。
- 設(shè)定邊界: 規(guī)定Agent的行為準(zhǔn)則和約束條件,例如“總花費(fèi)不得超過預(yù)算的10%”、“優(yōu)先選擇直飛航班”等。
完成這些設(shè)計(jì)后,具體的執(zhí)行過程將由Agent自主完成。它會(huì)像一個(gè)人類助理一樣,自行決定先查機(jī)票還是先看酒店,如何在兩者之間進(jìn)行權(quán)衡,并在信息不足時(shí)主動(dòng)向用戶提問。開發(fā)者的工作,從編寫“如何做”的指令性代碼,變成了定義“做什么”和“用什么工具做”的設(shè)計(jì)性工作。
構(gòu)建雙向融合的AI生態(tài)
OpenAI的布局不止于讓開發(fā)者更方便地構(gòu)建Agent。隨同發(fā)布的ChatKit和Apps SDK,則展示了其構(gòu)建一個(gè)雙向融合AI生態(tài)的意圖,進(jìn)一步深化了新范式的內(nèi)涵。
- ChatKit:將AI能力引入你的應(yīng)用。 這是一個(gè)“入站”集成工具。它允許開發(fā)者將ChatGPT的聊天體驗(yàn),作為一個(gè)組件,輕松地嵌入到自己的應(yīng)用程序中。這意味著開發(fā)者無(wú)需從零構(gòu)建復(fù)雜的對(duì)話界面,就能讓自己的產(chǎn)品擁有頂級(jí)的對(duì)話能力,專注于自身的核心業(yè)務(wù)邏輯。
- Apps SDK:讓你的應(yīng)用成為AI的工具。 這是一個(gè)“出站”集成工具。它允許像Spotify、Zillow這樣的第三方應(yīng)用,將自己的核心功能作為“工具”,被集成到ChatGPT的生態(tài)系統(tǒng)中。用戶可以在與ChatGPT對(duì)話時(shí),直接調(diào)用這些應(yīng)用的功能來(lái)完成任務(wù),例如直接說“幫我創(chuàng)建一個(gè)包含最近喜歡的搖滾歌曲的Spotify播放列表”。
這兩套工具共同構(gòu)建了一個(gè)雙向流動(dòng)的平臺(tái):AI的能力可以輕松地流向第三方應(yīng)用,而第三方應(yīng)用的功能,也可以作為工具被AI所調(diào)用。這為開發(fā)者創(chuàng)造了前所未有的靈活性和創(chuàng)新空間。

為Agent驅(qū)動(dòng)的未來(lái)做好準(zhǔn)備
從API調(diào)用到Agent編排的范式轉(zhuǎn)變,是AI技術(shù)發(fā)展到一定階段的必然結(jié)果。它將AI應(yīng)用開發(fā)的抽象層次,又向上提升了一步。這對(duì)于開發(fā)者而言,既是機(jī)遇也是挑戰(zhàn)。
這意味著,未來(lái)開發(fā)者的核心競(jìng)爭(zhēng)力,將部分地從精通底層編碼和算法實(shí)現(xiàn),轉(zhuǎn)移到更高層次的系統(tǒng)設(shè)計(jì)能力、工具集構(gòu)建能力和Agent行為設(shè)計(jì)能力上。如何為Agent設(shè)計(jì)出既強(qiáng)大又安全可靠的工具集,如何定義清晰且無(wú)歧義的目標(biāo),以及如何設(shè)計(jì)優(yōu)雅的人機(jī)協(xié)作流程,將成為衡量一位優(yōu)秀AI應(yīng)用開發(fā)者的重要標(biāo)準(zhǔn)。
這場(chǎng)由Agent驅(qū)動(dòng)的開發(fā)范式變革已經(jīng)拉開序幕。對(duì)于每一位開發(fā)者來(lái)說,現(xiàn)在正是開始學(xué)習(xí)和理解這一新模式,并思考如何利用它來(lái)構(gòu)建下一代智能應(yīng)用的最佳時(shí)機(jī)。

















