谷歌DeepMind核心大佬被曝離職創業,瞄準AI智能體!曾是Gemini關鍵負責人
谷歌又被曝出有核心員工離職了!
這次跑路的竟是DeepMind的核心技術大佬,Gemini項目的四位主要開發者之一,Ioannis Antonoglou。

上圖左半部分列出了Gemini項目的36位領導者,自去年九月以來,包括Ioannis Antonoglou在內,已有四位主要成員離開。

Ioannis Antonoglou
在OpenAI以及背后微軟的擠壓之下,谷歌的日子貌似不太好過。
去年裁員12000多人,光遣散費就花了幾十億美元,劈柴還宣布今年要持續裁員一整年,而一邊的OpenAI也在花心思挖角谷歌的高級人才。
另一方面,AI行業的大佬們在大模型帶來的變革中發現了新的風口,——比如AI智能體(Agent)。

越來越多的初創公司試圖在這個領域嶄露頭角,Antonoglou這次離職的目標就是創辦自己的人工智能公司,并瞄準Agent這個市場。
Antonoglou目前的兩位合伙人,Sherjil Ozair和Misha Laskin,也是之前一起參與Gemini項目的同事。據一位知情人士透露,他們已經開始為自己的初創企業籌集資金。

——谷歌的科技帝國開枝散葉......也未嘗不是一件好事?
當然,如果這家新公司決定涉足智能體領域,也將面臨眾多競爭對手。
近期的初創公司,包括獲得General Catalyst支持的Adept(已籌集4.3億美元)和獲得Nvidia支持的Imbue(已籌集超過2億美元),都在從事智能體的研發。
其他的初創公司還包括HyperWrite和Lindy,而大公司沒準也會來插一腳。

Antonoglou于2012年加入DeepMind。
2013年,Antonoglou作為七位作者之一,發表了一篇關于深度強化學習的論文,能夠在無需人類干預的情況下學習,并掌握Atari視頻游戲。

這篇工作在NIPS 2013的Deep Learning Workshop中展示,而這一突破也引起了谷歌和Facebook領導層的注意,他們認識到這可以用于增強自己的廣告業務。
2014年,谷歌以超過5億美元的價格收購了只有約有75名員工的DeepMind。之后Antonoglou參與開發了擊敗圍棋頂尖人類選手的 AI。
有趣的是,OpenAI的團隊也受此影響,采用類似技術開發了一個能玩Dota 2的AI系統。
還有上面提到的Antonoglou的合伙人Sherjil Ozair也是業內的大佬。


Ozair去年夏天離開DeepMind加入Tesla,他之前也同Antonoglou 合作發表過一些文章,比如下面這篇來自PMLR'2021。

而他更加有名的一篇工作是我們大部人都非常熟悉的「GAN」(生成對抗網絡)。

這篇開創性的工作為后續生成式AI模型的發展奠定了基礎。
「開枝散葉」
除了上面介紹的大佬,在過去兩年里,DeepMind和Google Brain的一些員工紛紛離職,開創了自己的新公司。
包括開發開源AI模型的Mistral AI,以及同樣致力于生成式AI模型的Sakana AI和Reka AI。
最近,又有三位在谷歌負責圖像和音樂方向的AI研究人員離職,據知情人士透露,他們成立了自己的AI初創公司Uncharted Labs。

這也揭示了谷歌內部可能存在的結構性問題,推出的AI產品錯失良機,而頂尖的研究人員則決定抓住外部機遇,抓住風險投資者對AI領域新公司的熱情。
文件顯示,這三位創始人已經籌集了850萬美元,最近幾個月,他們還會見了包括Andreessen Horowitz在內的潛在投資者。
三人團隊的總裁是David Ding,他此前是Google DeepMind的技術負責人。

而另外兩位Charlie Nash和Yaroslav Ganin,是Ding之前在DeepMind的團隊成員。Ding和Ganin在谷歌工作了五年以上。
Ding之前的團隊還有一名成員Conor Durkan也在去年離職了。
在DeepMind,這四個人參與了一個項目,使AI能夠根據用戶的簡單描述創造出原創的圖像和音樂。
去年11月,DeepMind公開了音樂生成模型Lyria,能夠從頭開始創作歌曲,包括利用Charlie Puth和John Legend等藝術家的人聲。

這幾個人還參與了Imagen 2的開發,作為Midjourney和DALL·E 3(OpenAI )的競品。
面對這不容樂觀的水土流失,谷歌被逼無奈,只好咬牙提高頂尖AI研究人才的待遇,使用特別的股獎勵措施。
然而,對于那些致力于生成式AI的初創公司來說,輕松獲得風險投資的吸引力極大。
根據PitchBook和National Venture Capital Association的數據顯示,2023年在美國,超過三分之一的風險投資涌向了AI領域。
AI 智能體未達預期
AI智能體的概念隨著生成式AI大模型的發展而開始流行,Agent可以自動幫助人類處理線上購物、訂票、會議等。
比如AutoGPT和BabyAGI,承諾能做到從預訂機票到回復短信等一切自動化操作。然而,它們很快就暴露出了技術上的限制。

包括OpenAI推出的相關產品,目前也沒有什么實質性的進展。
現有的Agent執行任務的能力參差不齊,還容易重復相同的行為模式,研究人員正也嘗試新的方法解決這些問題,比如開發更適合智能體任務的專用軟件,而不是依賴現成的模型。
HyperWrite的聯合創始人兼CEO Matt Shumer表示,AI智能體之所以未能如預期般發展,有幾個原因。
目前的智能體雖然能夠規劃并將目標分解成子任務(比如將競爭對手研究,分解為評估管理層、預測銷售額和成本計算),但是在執行這些子任務時往往遇到困難。
同自動駕駛一樣,智能體經常會被從未遇到過的「邊緣情況」所困擾,這種失敗可能會削弱消費者的信任。
另外,這個行業似乎面臨著與大型語言模型開發商同樣的問題:他們正試圖用風險資本解決一個長期的研究問題,而投資者卻希望盡早看到成品和投資回報。
解決方案
傳統的AI智能體通常由三部分構成:
一是像GPT-4這樣的大語言模型,負責規劃完成目標所需的任務;二是向量數據庫,幫助智能體記住以往的行動和目標相關的重要背景信息;三是LangChain等工具,負責將這些組件連接起來。

而HyperWrite正在嘗試一種截然不同的結構。根據請求的復雜程度,HyperWrite能將客戶的請求分配給不同的模型處理。
Shumer表示,GPT等傳統大語言模型僅能處理簡單的網絡搜索,而HyperWrite的定制模型則更擅長分析網頁內容并與之交互,如點擊不同的按鈕。HyperWrite目前已有數千名付費用戶。

與此類似,Imbue也在開發多種模型,包括大語言模型和多模態模型,以幫助AI智能體解決軟件編碼等問題。
為此,Imbue團隊特別標注訓練數據,使模型能夠理解博客文章或軟件代碼背后的邏輯。
Imbue的開發者會對模型訓練數據中的代碼行進行注釋,說明它們是如何為更大的軟件項目貢獻的。這樣一來,模型便能學會單行代碼如何協同工作,共同實現一個更廣泛的目標。
另一種智能體的發展方向是專注于特定的任務。
比如,Imbue使用了多個專門解決特定問題的智能體,從修正代碼格式錯誤到分析AI政策趨勢。這種專注于特定領域的方法減少了智能體遇到的問題邊緣情況。
Shumer認為,隨著時間的推移,通用型模型將最終超越專用于特定任務的模型,但CRV的Vivian Cheng認為,由于技術還處于初期階段,短期到中期內很難開發出一個可靠的通用型智能體。
——也許「通用」和「專用」會在未來的某個時間點相遇吧,讓我們拭目以待。




























