OpenAI重磅發(fā)布AgentKit - AI代理開(kāi)發(fā)進(jìn)入全新時(shí)代
在AgentKit問(wèn)世之前,開(kāi)發(fā)AI代理意味著要在碎片化的工具之間艱難周旋——復(fù)雜的編排系統(tǒng)沒(méi)有版本控制、定制連接器開(kāi)發(fā)、手動(dòng)評(píng)估流程、提示調(diào)優(yōu),以及在正式發(fā)布前數(shù)周的前端開(kāi)發(fā)工作。如今,AgentKit讓開(kāi)發(fā)者能夠通過(guò)可視化界面設(shè)計(jì)工作流,并使用全新的構(gòu)建模塊更快速地嵌入代理用戶(hù)界面。
AgentKit核心組件全解析
Agent Builder:提供可視化畫(huà)布,用于創(chuàng)建和版本管理多代理工作流,支持拖拽式節(jié)點(diǎn)操作、工具連接和自定義防護(hù)欄配置。
Connector Registry:為管理員提供統(tǒng)一的數(shù)據(jù)和工具連接管理中心,覆蓋所有OpenAI產(chǎn)品線。
ChatKit:專(zhuān)為在產(chǎn)品中嵌入可定制的基于聊天的代理體驗(yàn)而設(shè)計(jì)的工具包。
此外,OpenAI還擴(kuò)展了評(píng)估能力,新增數(shù)據(jù)集、追蹤評(píng)分、自動(dòng)提示優(yōu)化和第三方模型支持等功能,全面提升代理性能測(cè)量和改進(jìn)能力。
Agent Builder:從復(fù)雜編排到可視化設(shè)計(jì)
隨著代理工作流變得愈發(fā)復(fù)雜,開(kāi)發(fā)者急需更清晰的可視化管理工具。Agent Builder正是為此而生,它提供了一個(gè)可視化畫(huà)布,支持通過(guò)拖拽節(jié)點(diǎn)組合邏輯、連接工具并配置自定義防護(hù)欄。該平臺(tái)支持預(yù)覽運(yùn)行、內(nèi)聯(lián)評(píng)估配置和完整版本控制,非常適合快速迭代開(kāi)發(fā)。
圖片
"Agent Builder徹底改變了我們的開(kāi)發(fā)流程。過(guò)去需要數(shù)月復(fù)雜編排、定制代碼和手動(dòng)優(yōu)化的工作,現(xiàn)在只需幾個(gè)小時(shí)就能完成。可視化畫(huà)布讓產(chǎn)品、法務(wù)和工程團(tuán)隊(duì)保持同步,迭代周期縮短了70%,代理上線時(shí)間從兩個(gè)季度縮短到兩個(gè)沖刺周期。" —— Ramp團(tuán)隊(duì)
日本領(lǐng)先的科技和互聯(lián)網(wǎng)服務(wù)公司LY Corporation同樣受益匪淺,他們使用Agent Builder在不到兩小時(shí)內(nèi)就構(gòu)建出了工作助手代理。
"Agent Builder讓我們以全新的方式編排代理,工程師和領(lǐng)域?qū)<夷軌蛟谕粋€(gè)界面中協(xié)作。我們構(gòu)建了第一個(gè)多代理工作流并在不到兩小時(shí)內(nèi)運(yùn)行起來(lái),極大地加速了代理創(chuàng)建和部署的時(shí)間。" —— LY Corporation
企業(yè)級(jí)數(shù)據(jù)管理:Connector Registry
OpenAI同時(shí)推出了面向企業(yè)的Connector Registry,用于跨多個(gè)工作空間和組織治理和維護(hù)數(shù)據(jù)。該注冊(cè)表將數(shù)據(jù)源整合到一個(gè)統(tǒng)一的管理面板中,覆蓋ChatGPT和API。注冊(cè)表包含所有預(yù)構(gòu)建連接器,如Dropbox、Google Drive、SharePoint和Microsoft Teams,以及第三方MCP連接器。
開(kāi)發(fā)者還可以在Agent Builder中啟用Guardrails——一個(gè)開(kāi)源的模塊化安全層,幫助保護(hù)代理免受意外或惡意行為的影響。Guardrails能夠屏蔽或標(biāo)記個(gè)人身份信息、檢測(cè)越獄攻擊并應(yīng)用其他安全防護(hù)措施,讓構(gòu)建和部署可靠、安全的代理變得更加容易。
ChatKit:簡(jiǎn)化代理聊天體驗(yàn)嵌入
為代理部署聊天用戶(hù)界面往往比預(yù)期更復(fù)雜——需要處理流式響應(yīng)、管理對(duì)話(huà)線程、顯示模型思考過(guò)程,以及設(shè)計(jì)引人入勝的聊天體驗(yàn)。ChatKit讓在產(chǎn)品中嵌入原生感的基于聊天的代理變得簡(jiǎn)單。它可以嵌入到應(yīng)用或網(wǎng)站中,并可定制以匹配您的主題或品牌。
"我們使用ChatKit為Canva開(kāi)發(fā)者社區(qū)構(gòu)建支持代理,節(jié)省了超過(guò)兩周的開(kāi)發(fā)時(shí)間,并在不到一小時(shí)內(nèi)完成集成。這個(gè)支持代理將徹底改變開(kāi)發(fā)者與我們文檔的互動(dòng)方式,將其轉(zhuǎn)變?yōu)閷?duì)話(huà)式體驗(yàn),讓在Canva上構(gòu)建應(yīng)用和集成變得更加容易。" —— Canva
ChatKit已經(jīng)支持從內(nèi)部知識(shí)助手、入職指南到客戶(hù)支持和研究代理等多種使用場(chǎng)景。HubSpot的客戶(hù)支持代理就是其中一個(gè)典型例子。
全新Evals能力:精準(zhǔn)測(cè)量代理性能
構(gòu)建可靠的生產(chǎn)級(jí)代理需要嚴(yán)格的性能評(píng)估。去年,OpenAI推出了Evals來(lái)幫助開(kāi)發(fā)者測(cè)試提示和測(cè)量模型行為。現(xiàn)在,他們新增了四項(xiàng)能力,讓構(gòu)建評(píng)估變得更加容易:
? 數(shù)據(jù)集 - 從零開(kāi)始快速構(gòu)建代理評(píng)估,并通過(guò)自動(dòng)評(píng)分器和人工注釋持續(xù)擴(kuò)展
? 追蹤評(píng)分 - 對(duì)代理工作流進(jìn)行端到端評(píng)估,并自動(dòng)化評(píng)分以精準(zhǔn)定位不足之處
? 自動(dòng)提示優(yōu)化 - 基于人工注釋和評(píng)分器輸出生成改進(jìn)的提示
? 第三方模型支持 - 在OpenAI Evals平臺(tái)內(nèi)評(píng)估其他提供商的模型
圖片
圖片
"評(píng)估平臺(tái)將我們多代理盡職調(diào)查框架的開(kāi)發(fā)時(shí)間縮短了超過(guò)50%,并將代理準(zhǔn)確性提升了30%。" —— Carlyle
強(qiáng)化微調(diào)推動(dòng)代理性能新突破
強(qiáng)化微調(diào)(RFT)讓開(kāi)發(fā)者能夠定制OpenAI的推理模型。該功能在OpenAI o4-mini上正式可用,在GPT-5上處于私人測(cè)試階段。OpenAI正與數(shù)十家客戶(hù)密切合作,在更廣泛發(fā)布前完善GPT-5的RFT功能。
今天,OpenAI在RFT測(cè)試版中引入了兩項(xiàng)旨在進(jìn)一步推動(dòng)代理性能的新功能:
? 自定義工具調(diào)用 - 訓(xùn)練模型在正確的時(shí)間調(diào)用正確的工具以獲得更好的推理能力
? 自定義評(píng)分器 - 為您的使用場(chǎng)景中最重要的方面設(shè)置自定義評(píng)估標(biāo)準(zhǔn)
定價(jià)與可用性
從今天開(kāi)始,ChatKit和新的Evals功能已向所有開(kāi)發(fā)者正式開(kāi)放。Agent Builder目前處于測(cè)試版階段,Connector Registry正在向部分擁有全局管理控制臺(tái)的API、ChatGPT Enterprise和Edu客戶(hù)開(kāi)始測(cè)試版推出。所有這些工具都包含在標(biāo)準(zhǔn)API模型定價(jià)中。
OpenAI計(jì)劃很快向ChatGPT添加獨(dú)立的Workflows API和代理部署選項(xiàng)。
行業(yè)影響與未來(lái)展望
AgentKit的發(fā)布標(biāo)志著AI代理開(kāi)發(fā)進(jìn)入了一個(gè)全新的時(shí)代。通過(guò)將復(fù)雜的技術(shù)門(mén)檻降低為可視化操作,OpenAI不僅讓更多企業(yè)能夠快速構(gòu)建和部署AI代理,也為整個(gè)行業(yè)樹(shù)立了新的標(biāo)準(zhǔn)。
從Klarna處理三分之二客服工單的支持代理,到Clay實(shí)現(xiàn)10倍增長(zhǎng)的銷(xiāo)售代理,再到Ramp從空白畫(huà)布到功能完整采購(gòu)代理的數(shù)小時(shí)構(gòu)建,這些成功案例充分證明了AgentKit在實(shí)際業(yè)務(wù)場(chǎng)景中的巨大價(jià)值。
隨著AI代理技術(shù)的不斷成熟和工具的持續(xù)完善,我們有理由相信,未來(lái)將有更多企業(yè)能夠通過(guò)AgentKit這樣的平臺(tái),快速實(shí)現(xiàn)AI代理的落地應(yīng)用,推動(dòng)業(yè)務(wù)的智能化轉(zhuǎn)型。
正如OpenAI所說(shuō):"我們迫不及待地想看到你們的創(chuàng)造。"


























