谷歌搶跑L3級(jí)AI,Gemini連續(xù)工作40分鐘,Agent自動(dòng)生成評(píng)審百條創(chuàng)意
OpenAI定義的L3 AI,要被谷歌搶先一步了。
最新內(nèi)測(cè)顯示:Gemini可連續(xù)運(yùn)行40分鐘處理同一任務(wù)。。
在這段時(shí)間里,Gemini能根據(jù)用戶輸入,自動(dòng)生成100+條創(chuàng)意,并由一組Agent對(duì)這些創(chuàng)意進(jìn)行打分,排名,產(chǎn)出結(jié)構(gòu)化的評(píng)審報(bào)告。
如此一來(lái),用戶不必再面對(duì)AI的草稿式輸出,只需像篩選成熟方案一樣,從智能體打磨后的結(jié)果中直接挑選即可,大幅減少了與單個(gè)Agent來(lái)回磨合的時(shí)間。
換句話說(shuō),你只需負(fù)責(zé)決策拍板,探索和迭代的過(guò)程,全由Agent代勞。

據(jù)悉,這種“先由點(diǎn)子生成器想方案,再由評(píng)審團(tuán)進(jìn)行競(jìng)賽式打分”的多智能體系統(tǒng),在面向用戶的產(chǎn)品中還是首次亮相。
果然,巴菲特的眼光絕對(duì)不會(huì)錯(cuò)——谷歌還是那個(gè)谷歌。

多智能體競(jìng)賽系統(tǒng)
如何讓智能體不再只是“回答問(wèn)題”,而是把大伙的輸入“當(dāng)個(gè)事辦”?
谷歌的做法是把多智能體工作流、長(zhǎng)時(shí)思考、對(duì)抗式生成三件事直接縫在一起。
本質(zhì)上,這是在用“時(shí)間”換“質(zhì)量”。
一句提示會(huì)在多智能體系統(tǒng)內(nèi)部經(jīng)歷一個(gè)長(zhǎng)達(dá)40多分鐘的、完整的生成—競(jìng)爭(zhēng)—篩選流程,而不是一次性吐出答案。
具體來(lái)看,Gemini for Enterprise的多智能體系統(tǒng)會(huì)首先接收主題與評(píng)估標(biāo)準(zhǔn),大規(guī)模生成初始創(chuàng)意(100+)。
隨后,多個(gè)Agent以競(jìng)賽方式對(duì)這些創(chuàng)意進(jìn)行評(píng)分,排序。
由此,呈現(xiàn)給用戶的不是一條回答,而是一套經(jīng)過(guò)完整流程沉淀出來(lái)的結(jié)果:
約100個(gè)創(chuàng)意,按標(biāo)準(zhǔn)排序,并附帶概述、細(xì)節(jié)、評(píng)論、完整評(píng)審記錄,以及獨(dú)立生成的“比賽表現(xiàn)報(bào)告”。

在當(dāng)前預(yù)覽版中,谷歌推出了兩個(gè)基于此競(jìng)賽系統(tǒng)的應(yīng)用場(chǎng)景:
- 創(chuàng)意生成:用戶提供主題后,系統(tǒng)啟動(dòng)多智能體競(jìng)賽流程,生成并排序與主題相關(guān)的創(chuàng)意。
- 合作科研:用戶指定研究主題并提供數(shù)據(jù),由智能體通過(guò)相同機(jī)制生成和評(píng)估創(chuàng)意,更側(cè)重科研類任務(wù)。

事實(shí)上,谷歌早在今年2月就發(fā)布過(guò)科研輔助類的Agent,但與這次內(nèi)測(cè)的能力相比,功能規(guī)模和表現(xiàn)都不是一個(gè)量級(jí)。

一方面,單次推理的可持續(xù)時(shí)長(zhǎng)直接被拉高到40分鐘。
另一方面,系統(tǒng)在推理期間能夠結(jié)合對(duì)抗式生成,產(chǎn)出結(jié)構(gòu)化、有洞見(jiàn)的內(nèi)容。
這不僅讓Agent得以承擔(dān)更復(fù)雜的任務(wù),也提升了人機(jī)協(xié)作效率。
此外,為了方便系統(tǒng)確認(rèn)需求和節(jié)省算力,系統(tǒng)在正式運(yùn)轉(zhuǎn)前會(huì)先給出一份“計(jì)劃評(píng)估項(xiàng)目和創(chuàng)意維度”的概要,只有用戶確認(rèn)后才開(kāi)始執(zhí)行任務(wù)。

除了競(jìng)賽系統(tǒng),谷歌還在測(cè)試一個(gè)新的“文檔對(duì)話智能體”。

它擁有獨(dú)立界面,允許用戶上傳最大30MB的PDF文件,并直接與文檔內(nèi)容進(jìn)行對(duì)話。
系統(tǒng)會(huì)把最多30MB的PDF內(nèi)容整合到模型上下文中,使用戶能夠從長(zhǎng)文檔中提取更高質(zhì)量的結(jié)論與信息。
盡管這些功能目前都集成在Gemini 企業(yè)版并仍在開(kāi)發(fā)中,但我們?nèi)钥梢詫⒐雀璧倪@次嘗試視作其向L3級(jí)人工智能產(chǎn)品邁進(jìn)的一次重要探索。
L3 AI,谷歌先行一步
去年,OpenAI提出了五級(jí)AI分類體系,用以追蹤通用人工智能(AGI)的發(fā)展。
按這一體系,去年位于L1(會(huì)話型AI)向L2(推理型AI)發(fā)展的階段。
而今年,隨著Agent技術(shù)的快速發(fā)展,L3 級(jí)代理型AI開(kāi)始走上舞臺(tái)。
L3的核心在于“代理能力”,即AI可以在用戶授權(quán)下自主執(zhí)行任務(wù),并在多天內(nèi)持續(xù)運(yùn)行、適應(yīng)環(huán)境變化。
可以說(shuō),L3的關(guān)鍵在于長(zhǎng)時(shí)間自主運(yùn)行。
這也是Gemini能夠連續(xù)40分鐘進(jìn)行多智能體對(duì)抗式生成的意義所在:
通過(guò)長(zhǎng)時(shí)運(yùn)行、多Agent協(xié)作和企業(yè)級(jí)算力支撐,它將“在單一任務(wù)上持續(xù)工作數(shù)十分鐘并迭代優(yōu)化”的能力落地為可用產(chǎn)品,向L3的定義靠近了一步。
有網(wǎng)友甚至推測(cè),照這個(gè)發(fā)展速度,明年可能就會(huì)出現(xiàn)能夠連續(xù)工作3小時(shí)的Agent。

而另一位網(wǎng)友則回應(yīng)到:Anthropic給的時(shí)間線是2026年連續(xù)工作8小時(shí)。
到時(shí),人類所做的將僅是設(shè)計(jì)好問(wèn)題和評(píng)估標(biāo)準(zhǔn),其余任務(wù)都可以交給Agent 自主完成。

而隨著合作科研的進(jìn)一步開(kāi)發(fā),Gemini沒(méi)準(zhǔn)也能夠一夠L4(創(chuàng)新者)的門檻。

讓我們拭目以待。




























