剛剛,奧特曼官宣ChatGPT「終極OS入口」!8分鐘速搭智能體,8億人狂歡
OpenAI 2025開發(fā)者日,奧特曼的精彩演講引爆全場!

現(xiàn)場,50分鐘發(fā)布會,奧特曼重磅官宣了四項重大更新:
- Apps SDK:與外部應用無縫集成,OpenAI最大野心——把ChatGPT打造成未來的操作系統(tǒng);
- AgentKit:無需編碼,拖放搭建智能體。人人都可快速開發(fā)智能體,還能評估智能體能力;
- Codex全面可用:不寫一行代碼,打造爆款APP;
- API更新:三大API更新,Sora 2 API同步上線。

最最重磅的,還是Apps SDK,所有人皆可在ChatGPT中構(gòu)建原生應用,其意義堪比2023年首發(fā)的GPTs。
這預示著,ChatGPT又將成為一個新時代的「APP Store」!

正如爆料所言,AgentBuilder讓智能體構(gòu)建變得像搭積木一樣簡單直觀?,F(xiàn)場,僅用8分鐘拖拽,便一鍵完成了完整Agent的搭建。

自從2023年11月首屆開發(fā)日以來,短短兩年,OpenAI開發(fā)者規(guī)模已經(jīng)從200萬增長到400萬,翻了1倍!
ChatGPT周活也從1億暴增超8億,翻了8倍!
現(xiàn)在,OpenAI API每分鐘都有近60億token產(chǎn)生,相比此前的3億token,翻了20倍!
這些里程碑的數(shù)字不僅代表增長,更意味著AI正在成為新的技術(shù)基礎(chǔ)設(shè)施。


OpenAI未來的野心,全部藏在了這場發(fā)布會的四大核心發(fā)布中。
ChatGPT,下一代「操作系統(tǒng)」
首先,奧特曼帶來首個重磅發(fā)布叫做——Apps SDK。
意味著你可以在ChatGPT直接調(diào)用其他APP。借助Apps SDK,ChatGPT可以集成各種應用。

這個功能完全反映了OpenAI的野心!
奧特曼想把ChatGPT打造成未來的操作系統(tǒng)。

現(xiàn)在我們的應用都是運行在MacOS、Windows、Linux等操作系統(tǒng)上。
未來,ChatGPT將成為更上級的「操作系統(tǒng)」,即使是專業(yè)APP,都可以直接「運行」在ChatGPT里。
ChatGPT的目標是成為「操作系統(tǒng)級」的入口,而不僅僅是一個「應用」!
OpenAI的應用CEO Fidji Simo盛贊這個功能將「無法想象」,非常期待開發(fā)者打造的應用。

奧特曼想把ChatGPT變成每個人的「默認界面」,就像曾經(jīng)Windows桌面是每個人的「默認界面」一樣。

目前公布支持的APP包括:Booking.com、Canva、coursera、Expedia、Figma、Spotify和Zillow。

OpenAI的軟件工程師Alexi現(xiàn)場展示了如何在ChatGPT直接調(diào)用這些外部應用。
比如只需要輸入「Coursera」,ChatGPT就能自動識別并調(diào)用Coursera的功能。

可以直接在ChatGPT中要求「Canva」制作海報,而不需要額外跳轉(zhuǎn)。

類似的,可以直接在ChatGPT中使用Zillow查詢周邊房價,并使用Zillow的UI來直接呈現(xiàn)。

奧特曼承諾,更多應用即將上線。

一鍵拖拽,8分鐘搭一個Agent
第二個全新的功能就是此前劇透的可視化智能體構(gòu)建平臺。

新功能名為AgentKit,是面向開發(fā)者和企業(yè)的一整套構(gòu)建、部署和優(yōu)化智能體的工具。
AgentKit包含三個工具:
- Agent Builder:可視化畫布
- Connector Registry:管理數(shù)據(jù)和工具如何連接
- ChatKit: 嵌入定制聊天界面的工具包

Agent Builder是一個全新的可視化拖拽平臺,AI智能體的構(gòu)建流程就像搭積木一樣簡單!

ChatKit可以生成各種各樣的聊天工具,提供獨一無二的Chat體驗。

此外,OpenAI這次還提供了評估智能體能力的Eval指標。

通過四個方面,數(shù)據(jù)集、跟蹤評分、自動化提示和第三方模型支持,來評估新建智能體的能力。

關(guān)于如何定義Agents,什么是智能體的定義,奧特曼在這次大會也給出了一個答案:
「能夠為你工作的系統(tǒng)」都可以稱為智能體,Agents!

奧特曼現(xiàn)場展示了Albertsons如何構(gòu)建智能體來分析銷量。

比如,可以直接讓ChatGPT出一個提高冰激淋銷量的方案。

OpenAI平臺體驗部門的Christina Huang現(xiàn)場直播展示了,如何只用8分鐘就構(gòu)建一個完整的智能體!

使用Agent Builder無需寫任何一行代碼,全程只需要拖拽和參數(shù)配置。

現(xiàn)在Agent Builder功能已經(jīng)在OpenAI Platform網(wǎng)站上線。

簡單體驗了下,構(gòu)建過程非常的絲滑。

進入開發(fā)者平臺,點擊左側(cè)的「Agent Builder」即可使用。

構(gòu)建后,點擊右上角Evaluate即可開始對新建智能體的評估。

不寫一行代碼,打造爆款APP
除了ChatGPT原生應用和智能體,AI在軟件開發(fā)上,已帶來顛覆性的變革。
誰曾想,如今,OpenAI內(nèi)部每周70%的PR都由Codex完成。

就比如,在Codex加持下,拖放搭建智能體工具從0開發(fā)僅用6周完成。

奧特曼稱,我們正進入一個全新時代,任何有想法的人,都能為自己、家人、社區(qū)構(gòu)建一款應用。
在此,他舉了幾個鮮活的、發(fā)生在每個人身邊的案例——

一位89歲退休日本老人,用ChatGPT自學編程為老年用戶開發(fā)了11款iPhone應用;西班牙的一位老人和流媒體成員,借助ChatGPT、Sora等,幫人們重拾記憶;
在ASU醫(yī)學院,基于ChatGPT搭建的虛擬患者應用,幫助學習模擬練習如何和患者溝通;還有在法國凡爾賽宮,官方基于Realtime API打造的一款APP,讓游客與藝術(shù)品和雕塑進行實時對話。

重點來了,今天起OpenAI Codex結(jié)束預覽,正式進入通用可用階段。
自今年初首次發(fā)布,到GPT-5 Codex的迭代后,Codex的每日消息量增長10倍,自發(fā)布處理了超40萬億token。

這一次,新增功能包括:Slack集成、Codex SDK、企業(yè)控制。
目前,思科在內(nèi)部部署Codex后,代碼審查速度提升50%,項目平均周期從數(shù)周縮短至數(shù)天。

現(xiàn)場,OpenAI開發(fā)者負責人Romain Huet帶來了「舞臺燈光控制器」的實時互動演示。
設(shè)計原型非常簡單,一個控制面板——左側(cè)是攝像頭畫面,右側(cè)排列操作按鈕。

全程無需手寫一行代碼,Codex快速生成一個功能齊全的界面。
「如何在Node.js中控制索尼FR7相機?」
面對C++ SDK的復雜性,Codex提出了更加優(yōu)雅的解決方案——基于VISC協(xié)議集成控制功能。

幾分鐘內(nèi),Codex不僅生成了Node服務(wù)器代碼,還解析了相機所需的UDP數(shù)據(jù)包,甚至發(fā)現(xiàn)了特定型號相機所需的特殊頭部信息。

僅僅用按鈕控制相機還不夠,下一步,讓Xbox無線手柄實現(xiàn)相機控制。
通過Codex IDE擴展發(fā)送指令,Codex便會迅速制定計劃、分析文件,自動識別Xbox的輸入邏輯,并將搖桿映射為控制的最佳方式。

運行服務(wù)器,現(xiàn)場攝像頭畫面屏幕閃現(xiàn),臺下所有人揮手打招呼。


更令人興奮的是,它還集成了語音交互功能。
通過Codex的Realtime API和智能體語音,可以將自然語言引入這款應用。
只需說一句,「將燈光聚焦到觀眾席」,Codex便通過MCP服務(wù)器控制會場燈光系統(tǒng),瞬間點亮觀眾席。

最后,Romain還用Codex SDK拍了一張全體照片,實現(xiàn)了一個「電影式結(jié)尾」——演職員表,將現(xiàn)場所有參會者的名字動態(tài)呈現(xiàn)。
這一切,全部通過語音指令完成。

Codex GA(General Availability)開放,標志著軟件工程未來全新可能。
奧特曼現(xiàn)場表示,「它將最復雜的編碼難題簡化為自然語言指令,唯一的限制就是你的想象力」。
三大API,Sora 2也上線了
最后,奧特曼帶來了三大API——GPT-5 Pro、gpt-realtime-mini、Sora 2。
開發(fā)者們可以搶先一步,享用最強GPT-5 Pro智能,其在指令遵循方面能力大幅提升,體驗更優(yōu)。


在處理那些高精度、深度推理復雜任務(wù),GPT-5 Pro更拿手,尤其是在金融、法律、醫(yī)療保健等眾多行業(yè)。
如今,OpenAI API即可支持GPT-5 Pro的調(diào)用。
它的訓練截止時間是2024年9月30日,400k上下文窗口,最大支持272k token輸出。
輸入價格:15美元/百萬token,輸出價格:120美元/百萬token。目前支持文本、圖像輸入,僅文本輸出。

最新的API定價,再次刷新了價格天花板。
GPT-5 Pro輸入價格是GPT-5 15倍,輸出價格是GPT-5 12倍。


同時,OpenAI還在API中發(fā)布了一款語音模型——gpt-realtime-mini。
這是兩個月前高級語音模型的縮小版,成本降低了70%,但語音質(zhì)量和性能保持不變。

奧特曼稱,「就我個人而言,我認為語音將成為人們與 AI 交互的主要方式之一。而這次發(fā)布正是邁向這一現(xiàn)實的一大步」。
值得一提的是,幾天前剛剛上線的Sora 2,預覽版的API也正式上線。
視頻長度、寬高比、分辨率,全程可控。

這意味著,任何一款APP直接可以用Sora API,生成出令人驚嘆的視頻。
可控性,是Sora 2最大的優(yōu)勢。比如,拍攝iPhone視圖,Sora即可擴展成一個全景電影寬鏡頭。
首次實現(xiàn)音畫同步,Sora 2直出背景、環(huán)境音效。
甚至,人們還可以將現(xiàn)實世界的片段融入Sora。比如,將自家狗照片上傳,就可以瞬間為它造出「賽博狗友」。

在電商廣告中,Sora 2還可以做概念開發(fā)。

一個用戶案例是,OpenAI聯(lián)手MATTEL,將創(chuàng)意師的產(chǎn)品創(chuàng)意瞬間變?yōu)楝F(xiàn)實。

演講的最后,奧特曼激動表示,「我們正見證一個前所未有的時代」。
曾幾何時,開發(fā)一款軟件需要數(shù)月,甚至數(shù)年的周期。
而今天,有了AI,一個想法可以在幾分鐘內(nèi)落地成型。
開發(fā)者不再需要一個龐大的團隊,只需一個好的創(chuàng)意,就能超越以往的速度,將靈感變?yōu)楝F(xiàn)實。
我們的愿景,是讓AI真正為每一個人所用。
而這個愿景,離不開你們每一個人的參與。

































