精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI像人一樣操控電腦:多模態AI Agents和屏幕交互新范式 原創

發布于 2024-11-20 10:11
瀏覽
0收藏

編者按: 未來我們與計算機的交互方式將發生怎樣的變革?當 AI 能像人類一樣自如地操控電腦和手機,我們的工作方式會有什么改變?

本文深入剖析了 Anthropic、微軟和蘋果三大科技巨頭在突破這一瓶頸上的最新進展。通過解讀他們各自獨特的技術路線 —— 從 Anthropic 采用像素計數方式實現精準導航,到微軟將界面解析為結構化數據,再到蘋果專注于移動端的多模態交互方案,文章為我們展現了 AI 驅動屏幕交互的未來圖景。

作者 | Tula Masterman

編譯 |?岳揚

01 引言:AI Agent 領域的持續變革

Anthropic、微軟和蘋果的最新動態正在重塑我們對 AI Agents 的認知。目前,“AI Agent” 這一概念已被廣泛提及 —— 幾乎每一項與人工智能相關的公告都會涉及 AI Agents,但其先進程度和實用性卻有著天壤之別。

在這個領域的一端,我們看到了一些能夠進行多輪規劃、工具操作和目標評估的先進 AI Agents。它們通過不斷迭代來完成特定任務,甚至能夠建立和利用“記憶(memories)”,從過往的錯誤中吸取教訓,以推動未來的成功。如何打造一個高效的 AI Agents,是當前人工智能研究的熱點之一。這涉及到探究成功 Agents 應該具備哪些特性(例如,AI Agents 的規劃方式、記憶運用、工具選擇以及任務跟蹤能力)以及如何構建一個高效的 AI Agents 團隊。

而在另一端,是一些執行的任務目的單一、幾乎無需推理的 AI Agents。這些 AI Agents 往往更側重于特定的工作流程(例如,專門負責生成文檔摘要并保存結果的 Agent)。由于這些 Agents 的應用場景較為明確,因此它們通常更容易實現,不需要過多的規劃和跨工具協調,也無需處理復雜的決策問題。

隨著 Anthropic、微軟和蘋果的最新動態不斷發布,我們目睹了基于文本的 AI Agents 向多模態轉變。這一變化意味著我們可以通過書面或口頭指令來指導 AI Agents,使其能夠流暢地在手機或電腦上執行任務。這一技術有很大的潛力可以提升跨設備使用的便利性,然而,與此同時,這種技術也伴隨著重大的風險。Anthropic 關于 computer use 技術的相關公告強調了 AI 不受限制訪問用戶屏幕的潛在風險,并提出了一系列降低風險措施,例如在專用的虛擬機或容器中運行 Claude,將互聯網訪問限制在允許的域名列表中,進行人工干預檢查,并避免讓模型接觸敏感數據。他們還強調,通過 API 提交的內容不會被用于模型訓練。

02 Anthropic、微軟和蘋果最新公告亮點

2.1 Anthropic推出Claude 3.5 Sonnet:賦予人工智能使用計算機的能力

  • 概述:Computer Use 的目標是讓 AI 能夠像人類一樣操作計算機。在理想狀態下,Claude 能夠實現文檔的打開與編輯、點擊頁面的各個區域、內容的滾動閱讀,以及命令行代碼的運行和執行等多種操作。目前,Claude 已能按照人類指令在屏幕上移動光標、點擊指定區域,并在虛擬鍵盤上輸入文字。在 OSWorld 基準測試[1]中,Claude取得了 14.9% 的成績,雖然超過了同基準測試中的其他 AI 模型,但與人類 70–75% 的平均得分相比,仍有不小的差距。

  • 工作原理:Claude 通過查看用戶上傳的屏幕截圖,并計算像素位置來確定光標移動的位置,從而完成指定任務。研究人員提到,為了安全起見,在訓練過程中并未給予 Claude 互聯網訪問權限,但 Claude 能夠將從使用計算器和文本編輯器等簡單任務的訓練中學習到的知識,應用到更為復雜的任務上。在任務執行失敗時,它還會進行重試。Computer Use 功能包含了三個由 Anthropic 定義的工具:computer、text editor 和 bash。其中,computer 工具用于屏幕上的導航,text editor 用于文本文件的查看、創建和編輯,而 bash 則用于執行 bash shell 命令。

  • 面臨的挑戰:盡管 Claude 的能力表現良好,但還有很長的路要走。目前,它在頁面滾動、整體穩定性方面存在問題,且對提示詞注入攻擊較為敏感。

  • 使用指南:公眾可通過 Anthropic API 體驗公共測試版。Computer Use 功能可以與常規工具結合使用。

2.2 微軟的OmniParser & GPT-4V:讓AI能夠理解和操作屏幕

  • 概述:OmniParser 用于解析用戶界面截圖,并將其轉換成結構化的數據輸出。這些輸出可以被傳遞給 GPT-4V 這樣的模型,以便根據檢測到的屏幕元素生成相應的操作動作。在包括專為 Windows 系統設計的 Windows Agent Arena[2] 在內的多種基準測試中,OmniParser 與 GPT-4V 的組合得分約為20%。這些測試任務旨在評估 AI Agents 在規劃、理解屏幕內容和使用工具方面的能力。
  • 工作原理:OmniParser 通過整合多個經過微調的模型來解析屏幕內容。它采用了微調后的可交互圖標/區域檢測模型(YOLOv8[3])、圖標描述模型(BLIP-2[4] 或 Florence2[5])以及 OCR 模塊。這些模型被用于識別圖標和文本,并在生成內容描述后,將輸出數據發送給 GPT-4V,由 GPT-4V 決定如何利用這些信息與屏幕交互。
  • 面臨的挑戰:目前,當 OmniParser 檢測到重復的圖標或文本并將其傳遞給 GPT-4V 時,GPT-4V 經常無法正確點擊目標圖標。此外,OmniParser 的準確性受 OCR 輸出影響,如果邊界框定位不準確,整個系統可能無法正確點擊鏈接區域。還有,對于某些圖標的理解也存在挑戰,因為同一個圖標有時會被用來表示不同的含義(例如,三個點可能代表加載中,也可能代表菜單選項)。
  • 使用指南:OmniParser 可在 GitHub[6] 和 HuggingFace[7] 上獲取。您需要安裝必要的依賴項,并從 HuggingFace 加載模型。之后,您可以嘗試運行 demo notebooks,了解 OmniParser 如何分析圖像。

2.3 蘋果的Ferret-UI:將多模態智能引入移動端

  • 概述:蘋果的 Ferret(任意時間、任意地點、任意粒度下引用和定位任何事物)技術早在 2023 年便已問世。近期,蘋果推出了 Ferret-UI,這是一款 MLLM(多模態大語言模型),能夠在移動設備端用戶界面上執行“引用、定位和推理”任務。這些任務包括小部件的分類和圖標的識別(引用任務),以及尋找特定圖標或文本(定位任務)。Ferret-UI 能夠理解用戶界面并根據指令進行交互。
  • 工作原理:Ferret-UI 在 Ferret 的基礎上進行了優化,通過訓練來適應不同分辨率的圖像,從而更好地掌握移動端用戶界面的細節。每張圖像都被分割成兩張子圖像,并生成各自的特征。大語言模型(LLM)結合全圖像、兩張子圖像、區域特征和文本嵌入信息來生成響應。
  • 面臨的挑戰:Ferret-UI 的相關論文指出,模型在某些情況下會預測目標附近的文本,而不是目標文本,或者當屏幕上出現拼寫錯誤的單詞時,會預測出正確的單詞,而不是屏幕上顯示的錯誤單詞,有時還會錯誤地識別用戶界面的屬性。
  • 使用指南:蘋果在 GitHub[8] 上公開了 Ferret-UI 的數據和代碼,僅供研究目的使用。蘋果發布了兩個 Ferret-UI 模型版本,一個基于 Gemma-2b,另一個基于 Llama-3–8B。這些模型遵循 Gemma 和 Llama 的許可協議,而數據集則允許非商業用途。

2.4 總結:AI 驅動屏幕導航的三種策略

總的來說,這些系統分別展示了構建多模態 AI Agents 的不同路徑,它們能夠代表我們與電腦或手機進行交互。

Anthropic 推出的 Claude 3.5 Sonnet 著眼于一般的計算機交互,通過像素計數來實現屏幕上的精準導航。微軟的 OmniParser 則專注于解決將用戶界面拆分為結構化輸出的難題,隨后這些信息會被傳遞至 GPT-4V 等模型以決定下一步操作。而蘋果的 Ferret-UI 則是針對移動端用戶界面設計的,它能識別圖標、文字和小部件,并能執行與用戶界面相關的開放式指令。

這三種系統的工作流程一般包括兩個主要階段:一是解析視覺信息,二是思考如何與之交互。精確解析屏幕內容對于規劃交互方式以及確保系統穩定執行任務至關重要。

03 結語:打造更智能、更安全的AI Agents

依我之見,這些進步最激動人心的地方在于多模態功能與推理框架正逐步融合。雖然這些工具展現出巨大的潛力,但與人類的表現相比仍有較大差距。此外,在部署能夠訪問屏幕的 AI Agents 系統時,還必須正視和解決一系列 AI 安全方面的問題。

智能體系統的一大優勢在于它們能夠通過將任務細分為多個部分,從而克服單個模型在認知方面的局限性。這些系統的構建方式多種多樣。有時候,用戶面前看似單一的智能體,實際上可能是由多個子智能體組成的團隊 —— 每個子智能體擁有不同的職責,比如規劃(planning)、屏幕交互(screen interaction)或記憶存儲管理(memory management)。比如,負責推理的智能體可能會與專門處理屏幕數據的智能體協作,同時另一個智能體則負責整理記憶存儲,以提高未來的表現。

另外,這些功能也可以集成在一個全能的智能體中。在這種情況下,智能體可能包含多個內部規劃模塊 —— 一個專注于屏幕操作的規劃,另一個則負責整個任務的管理。盡管構建智能體的最佳方案尚待探索,但我們的目標始終不變:那就是創造出能夠在不同模態下長期穩定工作,并能無間適應用戶需求的智能體。

Thanks for reading!
Hope you have enjoyed and learned new things from this blog!

END

本期互動內容 ??

?如果讓 AI 來操作你的設備,你最擔心什么問題?安全、隱私還是其他?

??文中鏈接??

[1]https://os-world.github.io/

[2]https://microsoft.github.io/WindowsAgentArena/

[3]https://yolov8.com/

[4]https://arxiv.org/abs/2301.12597

[5]https://arxiv.org/abs/2311.06242

[6]https://github.com/microsoft/OmniParser/

[7]https://huggingface.co/microsoft/OmniParser

[8]https://github.com/apple/ml-ferret/tree/main/ferretui

原文鏈接:

https://towardsdatascience.com/computer-use-and-ai-agents-a-new-paradigm-for-screen-interaction-b2dcbea0df5b

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-11-20 10:22:06修改
收藏
回復
舉報
回復
相關推薦
亚洲国产精品精华液ab| 成人中文在线| 亚洲国产日韩精品| 亚洲在线免费观看| 三级影片在线看| 亚洲综合色婷婷在线观看| 亚洲国产成人91porn| 国产精品亚洲激情| 国产精品白丝喷水在线观看| 国产精品毛片aⅴ一区二区三区| 成人免费小视频| 99久久伊人精品影院| 国产suv精品一区二区68| 午夜久久av| 色综合一区二区三区| 亚洲国产一区二区精品视频| 国产三级自拍视频| 日韩视频久久| 亚洲精品中文字| 天天干天天玩天天操| 国产蜜臀av在线播放| 久久久不卡影院| 91在线国产电影| 久久午夜无码鲁丝片午夜精品| 欧美深夜视频| 欧美精品777| 成人免费在线小视频| 在线观看免费高清完整| 成人avav在线| 国产日韩欧美中文在线播放| 免费一级特黄特色大片| 日韩国产一区二区三区| 亚洲成人xxx| 色婷婷综合网站| av免费不卡国产观看| 欧美国产精品一区二区三区| 99久久国产免费免费| 久久久久久av无码免费看大片| 99精品美女| 日韩电影免费观看中文字幕| www,av在线| 性欧美hd调教| 精品久久久久久久中文字幕 | 亚洲精品视频在线播放| 欧美丝袜在线观看| 偷拍精品精品一区二区三区| 亚洲在线中文字幕| 一区二区免费电影| 日本一区二区三区在线观看视频| 国产精品主播直播| 国产精品羞羞答答| 欧美亚韩一区二区三区| 女人香蕉久久**毛片精品| 中文字幕不卡av| 爱爱的免费视频| 第四色在线一区二区| 日韩欧美一区二区久久婷婷| 国产一级做a爰片久久| 蜜桃视频www网站在线观看| 国产精品免费视频网站| 奇米视频888战线精品播放| 黄色一级大片在线免费看国产一 | 国产视频一区二区视频| av日韩中文| 精品福利一区二区| 欧洲美女和动交zoz0z| 91caoporm在线视频| 国产亚洲欧美激情| 青青草国产精品| 国产人成在线观看| 欧美国产日韩一二三区| 欧美一区二区三区电影在线观看 | 亚洲国产精品一区二区三区| 中国特级黄色片| 日韩精品一级| 日韩免费福利电影在线观看| 97人人模人人爽人人澡| 精品一区二区三区中文字幕在线| 777a∨成人精品桃花网| 亚洲自拍第三页| 日本精品在线观看| 精品国产一区二区精华| 水蜜桃av无码| 婷婷亚洲成人| 亚洲小视频在线| 免费看污片的网站| 成人vr资源| 久久久999国产精品| 男女羞羞免费视频| 亚洲激情亚洲| 欧美一级淫片播放口| 99re国产在线| 免费观看在线综合| 亚洲最大的网站| 亚洲成人77777| 99国产精品久久久| 久久精品国产一区二区三区日韩| 视频三区在线观看| 国产精品久久久久一区| 色爽爽爽爽爽爽爽爽| 牛牛精品在线| 日韩欧美aⅴ综合网站发布| 日本成人中文字幕在线| 亚洲伦理久久| 亚洲精品美女在线| 大胸美女被爆操| 欧美久久成人| 日韩美女视频中文字幕| 国产精品高潮呻吟AV无码| 国产不卡视频一区| 欧美精品一区二区三区在线四季| 日本中文字幕在线视频| 亚洲va在线va天堂| 免费看污黄网站| 亚洲一区二区三区免费| 亚洲偷熟乱区亚洲香蕉av| 日本一级二级视频| 亚洲欧美日韩国产一区| 国产人妖伪娘一区91| 亚洲AV无码精品色毛片浪潮| 久久久精品综合| 欧美大黑帍在线播放| 国产精品99精品一区二区三区∴| 欧美精品丝袜中出| 欧美 日本 国产| 欧美一区二区| 国产精品欧美一区二区| 亚洲AV无码精品国产| 国产精品网友自拍| 国产精品999视频| 亚洲综合视频| 亚洲日本aⅴ片在线观看香蕉| 国产盗摄x88av| 日本午夜精品一区二区三区电影| 国产精品精品软件视频| 男人天堂网在线观看| 亚洲伊人伊色伊影伊综合网| 午夜精品中文字幕| 欧美男同视频网| 97高清免费视频| av网站免费大全| 中文字幕不卡三区| www.夜夜爱| 99综合久久| 日韩中文字幕在线免费观看| 久久久久久久久久成人| 99久久综合精品| 男人添女荫道口喷水视频| 香蕉成人在线| 亚洲人成77777在线观看网| 日韩经典在线观看| 福利一区二区在线| 国产成人在线小视频| 精品欧美日韩精品| 亚洲天堂视频在线观看| 91香蕉在线视频| 丰满岳乱妇一区二区三区| 波多野结衣三级在线| 成人午夜一级| 色播久久人人爽人人爽人人片视av| 国产美女激情视频| 91网站在线播放| 精品人妻少妇一区二区| 精品按摩偷拍| 91成人免费观看网站| 欧美自拍偷拍一区二区| 亚洲香蕉伊在人在线观| 人妻精油按摩bd高清中文字幕| 久久综合国产| 国产在线一区二区三区| 人人干在线视频| 欧美喷潮久久久xxxxx| sm捆绑调教视频| 男女精品视频| 日韩影院一区| 精品久久在线| 中文字幕精品网| 国产一区二区在线视频观看| 亚洲欧洲日韩一区二区三区| 天堂中文视频在线| 99精品视频在线| 亚洲精品日韩av| 黄色的视频在线观看| 日韩高清欧美高清| 中文字幕 人妻熟女| 国产精品免费视频观看| 亚洲AV无码久久精品国产一区| 欧美黄色一区二区| 精品1区2区| 主播大秀视频在线观看一区二区| 亚洲欧洲国产精品| 在线观看免费观看在线| 亚洲免费观看在线视频| 亚洲精品无码一区二区| 亚洲欧美久久| 在线码字幕一区| 精品国产午夜肉伦伦影院| 日本不卡高字幕在线2019| 日本在线看片免费人成视1000| 欧美一区二区三区电影| 国产精品成人国产乱| 久久日一线二线三线suv| 可以看污的网站| 亚洲第一伊人| 日韩在线电影一区| 欧州一区二区三区| 青青久久av北条麻妃黑人| av在线收看| 欧美xxxxx牲另类人与| 黑人精品无码一区二区三区AV| 国产欧美精品一区二区色综合 | 777亚洲妇女| 国产午夜激情视频| 国产欧美日韩中文久久| 国产又粗又长又爽又黄的视频| 在线精品亚洲| 亚洲欧洲精品在线观看| 国产66精品| 国产一区私人高清影院| 伊人网在线播放| 久久天天躁狠狠躁夜夜躁| 天天干天天干天天干| 91久久精品一区二区三区| 日韩黄色免费观看| 亚洲国产精品传媒在线观看| 日本性生活一级片| 久久99蜜桃精品| 日本精品一区在线观看| 91亚洲国产高清| 亚洲成人午夜在线| 国产伦精品一区二区三区千人斩| 好看的日韩精品| caoporn成人| 国产66精品久久久久999小说| 国产精久久久| 91热福利电影| 国产精一区二区| 91久久精品国产| 国产精品一区二区三区www| 国产精品色午夜在线观看| 向日葵视频成人app网址| 7777免费精品视频| 国产激情视频在线看| 久久久爽爽爽美女图片| 成人在线高清免费| 午夜精品三级视频福利| 都市激情国产精品| 国产91精品久久久久| 在线黄色的网站| 日韩女优人人人人射在线视频| 自拍偷拍欧美视频| 国产精品久久视频| 欧美91在线|欧美| 91牛牛免费视频| 哺乳挤奶一区二区三区免费看| 成人动漫在线观看视频| 久久国产精品色av免费看| 精品一区在线播放| 亚洲男人都懂第一日本| 茄子视频成人在线观看| 久久精品高清| 国产成人生活片| 一本色道久久综合一区| 男人操女人免费软件| 日韩精品视频网| 久久精品视频在线观看免费| 国产高清成人在线| 人妻av一区二区| 久久精品一区二区三区av| 亚洲一级理论片| 亚洲黄一区二区三区| 97人人澡人人爽人人模亚洲| 黑人精品xxx一区一二区| 无码任你躁久久久久久久| 欧美女孩性生活视频| 亚洲欧美高清视频| 亚洲视频视频在线| 国产黄a三级三级三级av在线看| 欧美激情伊人电影| 一呦二呦三呦精品国产| 亚洲一区二区久久久久久久| 精品国产午夜肉伦伦影院| 日本不卡高清视频一区| 亚洲澳门在线| a√天堂在线观看| 麻豆成人久久精品二区三区红| 色婷婷狠狠18禁久久| 久久久精品国产免费观看同学| 亚洲伦理一区二区三区| 精品久久久久久久大神国产| 无码人妻精品一区二| 欧美成人a在线| 男女视频在线观看免费| 久久中文字幕国产| 香蕉久久免费电影| 国产精品v欧美精品∨日韩| 欧美亚洲精品在线| 久久这里只有精品23| 久久99日本精品| 中文字幕一区二区久久人妻网站 | 国产精品theporn动漫| 在线观看日韩毛片| 欧美在线 | 亚洲| 麻豆国产va免费精品高清在线| 天堂在线中文网官网| 亚洲a区在线视频| 精品国产一区二区三区噜噜噜| 大片在线观看网站免费收看| 日韩经典一区二区| 性欧美18—19sex性高清| 自拍av一区二区三区| 精品视频一二三区| 亚洲第一网站免费视频| 国产黄色在线观看| 国产精品美女视频网站| 午夜精品福利影院| 日韩亚洲欧美视频| 国产一区二区三区免费看| 日韩不卡av在线| 日韩欧美a级成人黄色| 人成网站在线观看| 欧美国产在线视频| 国产精品亚洲欧美一级在线| 性欧美大战久久久久久久免费观看| 国产欧美短视频| 9.1在线观看免费| 一区二区三区av电影| 国产精品色综合| 中文字幕日韩专区| 丝袜美腿诱惑一区二区三区| 久久国产精品免费一区| 亚洲精品四区| 性活交片大全免费看| 亚洲一区二区三区四区不卡 | 日韩精品免费综合视频在线播放| 污视频网站免费在线观看| 亚洲va男人天堂| 仙踪林久久久久久久999| 久热精品在线观看视频| 日本一区二区三区免费乱视频| 伊人久久久久久久久久久久| 亚洲男人天堂久| 全亚洲第一av番号网站| 日本不卡一区二区三区视频| 久久久久欧美精品| 国产人妻一区二区| 在线日韩国产精品| 最新电影电视剧在线观看免费观看| 国产精品久久久久久久久免费| 国产亚洲精品美女久久久久久久久久| 日本三级免费网站| 久久精品夜色噜噜亚洲a∨| 福利网址在线观看| 中日韩美女免费视频网站在线观看 | 成人免费视频网址| 要久久爱电视剧全集完整观看| 国产精品宾馆在线精品酒店| 97se亚洲国产综合自在线不卡| 毛片视频网站在线观看| 日韩电影免费观看在线观看| 欧洲av不卡| 2025韩国大尺度电影| 国产suv一区二区三区88区| 国产性xxxx高清| 国产亚洲日本欧美韩国| 亚洲国产伊人| 欧美黄网在线观看| 成人av综合在线| 日韩黄色片网站| 欧美xxxx18性欧美| 国语一区二区三区| 无码人妻丰满熟妇区毛片| 国产欧美日韩另类一区| 国产精品女同一区二区| 欧美激情视频免费观看| 伊人久久大香线蕉综合网站| 欧美自拍小视频| 1024亚洲合集| 亚洲人午夜射精精品日韩| 国产精品久久视频| 欧美成人一品| 爱爱免费小视频| 欧美一区日韩一区| 92国产精品| 精品一区二区三区毛片| 91免费看片在线观看| 91theporn国产在线观看| 国产69精品99久久久久久宅男| 国产探花一区| 成年人看片网站| 在线免费观看不卡av| 色女人在线视频| 日韩黄色影视| 不卡的av在线| 97超碰中文字幕| 日韩女在线观看| 亚洲激情专区| 91高清免费看| 一区二区日韩精品| 风间由美性色一区二区三区四区 |