阿里AgentBay揭秘,Agent Infra才是真護(hù)城河!
過去半年,幾乎10個(gè)創(chuàng)業(yè)者有8個(gè)在做各種各樣的Agent,但是Agent Infra絕對(duì)是被大多數(shù)人忽視的一個(gè)板塊。
月初,給家人們以 AutoGLM2 切入,深挖了 Agent Infra 的核心要素,有朋友留言說智譜的AutoGLM2背后是阿里云無影AgentBay。
阿里云? 無影? 這2個(gè)詞組合起來確實(shí)非常陌生。但是,今天在云棲大會(huì)上,刷到了,阿里云無影宣布Agent基礎(chǔ)設(shè)施AgentBay迎來重大升級(jí),并首次展示全新的個(gè)人計(jì)算產(chǎn)品——無影Agentic Computer。
無影AgentBay擁有了完善的任務(wù)執(zhí)行沙箱、智能運(yùn)維、持久化記憶等能力,可動(dòng)態(tài)調(diào)用云上算力、存儲(chǔ)及工具鏈資源。
深度挖掘了一下,原來國產(chǎn) Agent Infra 還有這么多黑科技?今天給家人們進(jìn)一步分享一下。
為什么需要Agent Infra?
要回答這個(gè)問題很簡(jiǎn)單。
我們現(xiàn)有的整個(gè)互聯(lián)網(wǎng)世界,從操作系統(tǒng)到網(wǎng)頁,都有一個(gè)巨大的前提:
默認(rèn)屏幕前一定坐著一個(gè)聰明的人。
比如說,如果一個(gè)API返回,{"error":"check your config"}。
這對(duì)人來說可能夠用,對(duì)Agent來說,這行字和亂碼沒太大區(qū)別。
瀏覽網(wǎng)頁的時(shí)候,可能有個(gè)按鈕,人一眼能看到,但它在代碼里可能沒有任何ID。
Agent只能靠視覺模型,去猜它大概在哪個(gè)坐標(biāo)。
我們?yōu)槿祟愒O(shè)計(jì)的這一套規(guī)則,必然會(huì)成為Agent的最大枷鎖。
云電腦不是終點(diǎn),只是起點(diǎn)
要打破這個(gè)困局,很多人的第一反應(yīng)是給Agent一個(gè)云電腦,讓它在云端隔離運(yùn)行。

Manus發(fā)布半年過去了,我發(fā)現(xiàn),Agent Infra廠商已經(jīng)進(jìn)入了下一個(gè)level。

因?yàn)楫?dāng)模型真的在一個(gè)云上跑之后,他所有的思考過程,執(zhí)行結(jié)果,工具調(diào)用情況,全都是可以跟實(shí)際的成功率掛鉤的。
這意味著,可能天然的一個(gè)強(qiáng)化學(xué)習(xí)環(huán)境就出來了。
我查了下,以無影云為例,就有一個(gè) Self-Evolving Engine(自進(jìn)化引擎)的東西。可實(shí)現(xiàn)LLM行為優(yōu)化、提示詞優(yōu)化和MCP工具優(yōu)化,也就是說,企業(yè)根本不需要關(guān)心,Agent Infra就幫你做好了這種系統(tǒng)的進(jìn)化。

持久化記憶 ≠ 存?zhèn)€Cookie
Infra的進(jìn)化,還體現(xiàn)在記憶上。
我們?nèi)死斫獾挠洃洠赡苤皇怯涀〉卿浢艽a。但AI需要的記憶,是記住整個(gè)交互宇宙。 比如:
上一次任務(wù)失敗,是因?yàn)槲⒉┌寻l(fā)布按鈕的文案從發(fā)布改成了發(fā)送。
那么下一次,Agent就應(yīng)該直接定位新文案,而不是再次失敗。
上一次成功繞過滑塊驗(yàn)證碼,是因?yàn)樗R(shí)別出缺口在坐標(biāo)(233, 455)。那么這次的滑動(dòng)軌跡就應(yīng)該被存成一個(gè)可復(fù)用的函數(shù)。

AgentBay 把這類記憶做成一種可掛載的環(huán)境快照。不僅包括Cookie、本地配置,還包括上一次成功的DOM路徑、API調(diào)用序列,甚至包括自進(jìn)化引擎生成的最優(yōu)提示詞和工具權(quán)重。
下一次任務(wù)啟動(dòng),Agent的狀態(tài)不再是重新登錄,而是精準(zhǔn)地回到上次離開的那一秒。
當(dāng)Agent比一杯奶茶還便宜
最后,我們來聊聊成本。
一年前,AutoGLM在本地手機(jī)跑一次任務(wù),成本差不多要5塊錢。
這還沒算上隨時(shí)可能彈出的廣告、系統(tǒng)更新、應(yīng)用版本帶來的失敗風(fēng)險(xiǎn)。
現(xiàn)在,在AgentBay上跑一次呢?云手機(jī)、模型調(diào)用、加上自進(jìn)化采樣的完整任務(wù),單次成本是0.2美元,大約1.5元人民幣。

關(guān)鍵點(diǎn)不在于便宜,而在于可預(yù)測(cè)。
一個(gè)永遠(yuǎn)滿血、永遠(yuǎn)標(biāo)準(zhǔn)化的環(huán)境,才讓Agent的規(guī)模化應(yīng)用成為可能。
當(dāng)成本低于一杯蜜雪冰城時(shí),Agent就正式從極客的玩具,變成了人人可用的基礎(chǔ)設(shè)施。
最后
一個(gè)比較深刻的工程哲學(xué)可以分享給大家,當(dāng)模型能力有上限時(shí),與其死磕模型,不如優(yōu)化環(huán)境。
考慮,各種應(yīng)用版本,操作過程中的各種意外,不如全面擁抱Agent Infra,當(dāng)所有的配置都是統(tǒng)一、固定的。帶來的結(jié)果大概率就是任務(wù)成功率飆升~
本文轉(zhuǎn)載自????探索AGI????,作者:獼猴桃

















