精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Manus 爆火,再次證明 Computer Use Agent 的潛力

人工智能
今天我更想聊聊它背后的技術(shù):Computer use,這個概念最早由 Anthropic 在 24年11月提出,雖然國內(nèi)討論的聲浪并不大,但這種通過 LLM 自行操作計(jì)算機(jī)系統(tǒng),進(jìn)而實(shí)現(xiàn)更通用 Agent 能力的技術(shù),卻又非常大的想象空間,國外有不少廠商陸續(xù)跟進(jìn),做出了許多優(yōu)秀作品。

2025年3月4號晚,Monica.im 發(fā)布了一款通用型 AI Agent 產(chǎn)品: Manus(https://manus.im/),從官網(wǎng)透露出的視頻來看,這是一款基于 Computer Use 實(shí)現(xiàn)的 AI Agent,特點(diǎn)在于能夠自主操作計(jì)算機(jī)完成更復(fù)雜的任務(wù),例如做 PPT,分析股票市場變化,整理數(shù)據(jù)等。

本文無意探討 Manus 的具體能力,畢竟咱也沒試用過,沒資格評價。今天我更想聊聊它背后的技術(shù):Computer use,這個概念最早由 Anthropic 在 24年11月提出,雖然國內(nèi)討論的聲浪并不大,但這種通過 LLM 自行操作計(jì)算機(jī)系統(tǒng),進(jìn)而實(shí)現(xiàn)更通用 Agent 能力的技術(shù),卻又非常大的想象空間,國外有不少廠商陸續(xù)跟進(jìn),做出了許多優(yōu)秀作品。

我認(rèn)為,Computer Use 將會成為未來 AI Agent 的一種重要設(shè)計(jì)模式,因此有必要更深入理解這一概念以及背后的執(zhí)行原理。

Computer Use 是什么

24年11月,Anthropic官宣了Claude 3.5的同時,也低調(diào)官宣了一個Beta版本的能力 Computer Use,目前處于公開測試階段,這項(xiàng)功能允許 Claude 像人類一樣使用計(jì)算機(jī),具體表現(xiàn)為:用戶可以指導(dǎo) Claude 像人類一樣使用計(jì)算機(jī) —— 通過查看屏幕、移動光標(biāo)、單擊按鈕和輸入文本,來完成各類任務(wù)。

https://www.anthropic.com/news/3-5-models-and-computer-use

這項(xiàng)技術(shù)旨在教會Claude通用的計(jì)算機(jī)操作技能,包括理解用戶界面內(nèi)容和執(zhí)行界面交互,而無需為每種軟件單獨(dú)開發(fā)代理程序,這使得 Claude 模型得以實(shí)現(xiàn):

  • 跨平臺界面解析:基于計(jì)算機(jī)視覺實(shí)時識別GUI元素(按鈕/輸入框/菜單欄等),準(zhǔn)確率達(dá)92%

參考:https://www.mittrchina.com/news/detail/13924?locale=zh_CN

  • 擬人化操作鏈:構(gòu)建「屏幕感知→光標(biāo)定位→點(diǎn)擊/輸入→結(jié)果驗(yàn)證」的完整動作流:
  • 自適應(yīng)學(xué)習(xí)框架:通過強(qiáng)化學(xué)習(xí)動態(tài)優(yōu)化操作路徑,處理非結(jié)構(gòu)化界面時響應(yīng)速度提升40%
  • 雙向反饋機(jī)制:在執(zhí)行過程中實(shí)時捕獲屏幕變化,動態(tài)調(diào)整操作策略
  • 等等

特別適合替代人類完成一些常規(guī)計(jì)算機(jī)操作任務(wù),如端到端測試(E2E)、自動化重復(fù)流程處理,以及將簡單指令轉(zhuǎn)化為復(fù)雜計(jì)算機(jī)指令等。

Computer Use 解決了什么問題

Computer Use 技術(shù)極具想象空間,設(shè)想一套 Agent 軟件就能將自然語言精確轉(zhuǎn)換為復(fù)雜的系統(tǒng)操作指令,未來工作中可能不再需要耗費(fèi)精力學(xué)習(xí)各類專業(yè)軟件(如 excel、word等)的繁瑣操作邏輯,只需以自然語言方式發(fā)出指令即可完成各種常見工作任務(wù),AI 輻射范圍將會進(jìn)一步涵蓋所有依賴計(jì)算機(jī)的工種。

也因此,多家團(tuán)隊(duì)正在積極探索推動這一技術(shù)落地應(yīng)用:

  • OpenAI 發(fā)布 Operator,可根據(jù)用戶指令操縱瀏覽器:
  • Xlang Lab 發(fā)起的 Computer Agent Arena;
  • 開源 Agent browser-use,可根據(jù)用戶指令操作瀏覽器;
  • 以及最近剛發(fā)布的國產(chǎn)通用 Agent :Manus
  • 等等

甚至可以說,Computer Use 的設(shè)計(jì)算是對當(dāng)前 AI 系統(tǒng)工具使用范式做了一次根本性重構(gòu),過去實(shí)現(xiàn) LLM 與外部通訊手段多是集中在:function call、MCP 等技術(shù),而這類技術(shù)都需要 case by case 地針對各類具體場景設(shè)計(jì)實(shí)現(xiàn),而 computer use 則可以直接讀取、操作電腦,就像一個極高性能又通用的人類一樣,能夠理解各種復(fù)雜計(jì)算機(jī)界面并完成任務(wù),進(jìn)而降低 agent 的開發(fā)成本(理論上)。

方案1:使用 VLM 模型

Computer Use Agent 重點(diǎn)在于理解計(jì)算機(jī)界面,因此通常強(qiáng)依賴于 VLM(Vision-Language Model)模型作為核心決策單元,通過多模態(tài)交互實(shí)現(xiàn)自動化的計(jì)算機(jī)操作。流程上整體遵循感知-決策-執(zhí)行的控制范式:

大致包含三個步驟:

  • 感知:采用動態(tài)屏幕捕捉技術(shù)獲取RGB像素流,通過GPU加速實(shí)現(xiàn)≤100ms的實(shí)時幀捕獲,同步記錄界面元數(shù)據(jù)(窗口層級/控件屬性/焦點(diǎn)等);
  • 決策:使用 VLM(Vision-Language Model) 實(shí)現(xiàn)界面元素檢測(Faster R-CNN)+語義分割(Mask R-CNN),理解屏幕截圖和用戶輸入,從而制定相應(yīng)的行為策略,例如鼠標(biāo)移動到哪里,點(diǎn)擊哪里;在哪里輸入文本等等;
  • 執(zhí)行:最后,通過系統(tǒng)級輸入驅(qū)動來執(zhí)行相應(yīng)的操作指令;

持續(xù)執(zhí)行上述循環(huán),直到大語言模型(LLM)判斷任務(wù)完成、達(dá)到預(yù)設(shè)的最大操作次數(shù),或超出上下文限制為止。

這種模式的優(yōu)點(diǎn)是清晰簡潔,容易理解上手。但是:對VLM本身的能力要求非常高,需要能夠可靠地識別用戶界面中的可交互圖標(biāo),以及理解屏幕截圖中各種元素的語義,并準(zhǔn)確地將預(yù)期作與屏幕上的相應(yīng)區(qū)域相關(guān)聯(lián)想要實(shí)現(xiàn)精確點(diǎn)擊和移動,難度很大。

方案2:基于VLM與OCR融合的增強(qiáng)型 CUA

在上述 VLM 技術(shù)的基礎(chǔ)上,我們還可以疊加 OCR 技術(shù)實(shí)現(xiàn)更精確的內(nèi)容理解與定位操作,實(shí)現(xiàn)流程:

  • 截圖
  • 基于視覺語言大模型(Vision-Language Model, VLM)+ OCR 實(shí)現(xiàn)多模態(tài)推理
[{{ "reasoning": "cognitive process here", "action_type": "click", "target_text": "target element"}}]
  1. 結(jié)合OCR文本定位與視覺特征,進(jìn)行坐標(biāo)映射計(jì)算
  • 輸入屏幕快照與用戶指令,生成操作指令集
  • 當(dāng)指令類型為指針交互時,模型輸出結(jié)構(gòu)化定位請求:
  • 通過系統(tǒng)級輸入驅(qū)動執(zhí)行操作指令

直至LLM認(rèn)為任務(wù)完成,或者達(dá)到設(shè)定的最大行為次數(shù),或者超出上下文上限。

這個過程中,VLM作為系統(tǒng)的認(rèn)知中樞,負(fù)責(zé)跨模態(tài)信息融合相關(guān)的工作,包括視覺-語言對齊、指令上下文建模與推理、隱含需求推理等;而 OCR 主要負(fù)責(zé)解析界面文本信息的原子化解析,解決字形干擾、多語言支持、藝術(shù)字體解析等問題,進(jìn)一步提升結(jié)果的準(zhǔn)確度。

方案3:使用 MicroSoft Omniparser V2 實(shí)現(xiàn) CUA

2025年2月,Microsoft研究院發(fā)布Omniparser V2范式轉(zhuǎn)換技術(shù),可將任意大型語言模型(LLM)轉(zhuǎn)化為能直接操作計(jì)算機(jī)的智能代理。它通過實(shí)時解析屏幕界面元素(如按鈕、圖標(biāo)),將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),使AI能理解用戶指令并執(zhí)行點(diǎn)擊、輸入等操作,無需針對特定界面微調(diào)。該技術(shù)顯著提升了處理效率(延遲降低60%)和精準(zhǔn)度(在復(fù)雜界面測試中達(dá)先進(jìn)水平),成為實(shí)現(xiàn)跨平臺、跨應(yīng)用的智能自動化操作的核心工具。

本質(zhì)上,OmniParser 與上面提到的 VLM 與 ocr 等技術(shù)相似,只是實(shí)現(xiàn)精度、準(zhǔn)確度更高一些,整體邏輯:

  • 執(zhí)行動態(tài)屏幕狀態(tài)捕獲(ScreenState Capture)
  • 通過OmniParser V2進(jìn)行多模態(tài)界面解析,輸出符合W3C ARIA標(biāo)準(zhǔn)的可交互元素元數(shù)據(jù):

  • 構(gòu)建VLM推理上下文
  • 調(diào)用系統(tǒng)級輸入模擬引擎執(zhí)行操作

總結(jié)

或許在未來,Computer Use 這種"所見即所控"的模式將徹底重構(gòu)人機(jī)協(xié)作邊界,并且很可能催生新的操作系統(tǒng)范式——AI將作為原生交互層直接駕馭數(shù)字世界。

不過就當(dāng)下而言,各家產(chǎn)品都存在比較嚴(yán)重的性能問題,交互效率并不高,可以保持觀望吧。對程序員群體而言,也應(yīng)該理解 CUA 未來可能會成為一種主流 Agent 架構(gòu),值得提前投入精力學(xué)習(xí)。

責(zé)任編輯:姜華 來源: Tecvan
相關(guān)推薦

2025-03-24 12:50:49

2025-03-07 09:59:44

ManusAI科技圈

2025-01-23 00:00:01

2025-07-02 08:46:00

AgentAI技術(shù)

2025-07-08 09:45:57

2025-05-22 07:40:32

2025-01-26 10:25:53

2025-03-10 00:00:00

2025-03-07 08:28:56

2025-02-12 10:06:25

2023-04-21 10:33:42

2025-07-22 11:56:26

2022-08-02 20:21:00

SaaS驅(qū)動PLG

2014-11-05 11:05:15

Ruby

2024-07-08 09:49:54

2024-02-22 10:17:39

AI模型

2015-10-20 15:00:51

七牛云

2023-02-09 12:31:20

2024-10-29 15:29:06

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

777久久久精品一区二区三区| 91chinesevideo永久地址| 日本在线观看免费视频| 九七电影韩国女主播在线观看| 狠狠色狠狠色综合| 欧美激情一区二区久久久| 婷婷五月精品中文字幕| 日韩欧美精品电影| 亚洲综合久久久| 欧美xxxx黑人又粗又长精品| 91精品国产乱码久久久久| 亚洲日本免费| 日韩一区二区三区国产| 久久性爱视频网站| 国产精品99久久久久久董美香 | 亚洲女优在线观看| 91久久极品少妇xxxxⅹ软件| 男人av资源站| 亚洲盗摄视频| 精品日韩在线观看| 亚洲黄色小视频在线观看| 女人黄色免费在线观看| 国产精品视频观看| 鲁丝片一区二区三区| 国产成人精品一区二区无码呦| 视频一区中文字幕国产| 欧美国产第一页| 懂色av粉嫩av蜜臀av一区二区三区| 日韩欧美美女在线观看| 日韩一级免费观看| 青青草久久伊人| 3d性欧美动漫精品xxxx软件| 午夜亚洲福利老司机| 美国av在线播放| 在线观看麻豆蜜桃| 久久久综合网站| 国产伦精品一区二区三区照片| 97在线公开视频| 日本不卡123| 日本午夜在线亚洲.国产| 国产午夜精品无码一区二区| 欧美视频导航| 欧美肥婆姓交大片| 日韩一级片av| 亚洲成av人片一区二区密柚| 日韩中文字幕网址| 亚洲一级理论片| 日韩欧美精品| 中国日韩欧美久久久久久久久| 亚洲色成人网站www永久四虎 | 久久久99爱| 成人免费公开视频| 成人亚洲一区二区一| 国产精品传媒毛片三区| 亚洲精品国产精| www.在线欧美| 久久国产日韩欧美| 青青久在线视频免费观看| 91偷拍与自偷拍精品| 欧美日韩大片一区二区三区| 免费福利在线观看| 亚洲国产精品高清| 亚洲国产欧美不卡在线观看 | 男女高潮又爽又黄又无遮挡| 嗯啊主人调教在线播放视频 | 超碰精品在线| 精品成a人在线观看| 黄色污在线观看| 日韩福利视频一区| 亚洲欧美中文日韩在线v日本| 成人国产精品久久久网站| 不卡中文字幕| 久久综合88中文色鬼| 精国产品一区二区三区a片| 欧美视频不卡| 青青久久av北条麻妃海外网| 中文字幕制服诱惑| 国产一区二区三区免费| 国产精品一区二区三区不卡| 青青草手机在线| 亚洲性色av| 国产亚洲福利| 国产精品极品美女在线观看免费| 中文在线免费看视频| 精品一区二区三区的国产在线播放| 亚洲a中文字幕| 日韩一级在线播放| 久久免费国产精品| 中文字幕中文字幕99| 超碰中文在线| 欧美一a一片一级一片| 日本高清免费在线视频| 国产精品一线| 亚洲一区第一页| 亚洲xxxx3d动漫| 国产伦理一区| 91精品免费看| 色哟哟国产精品色哟哟| 国产精品天干天干在观线| 可以免费看的黄色网址| 亚洲黄色中文字幕| 91精品婷婷国产综合久久性色| 久久国产劲爆∧v内射| 欧美中文字幕一区二区| 久久免费视频这里只有精品| 中文字幕理论片| 成人免费视频caoporn| 相泽南亚洲一区二区在线播放| 女囚岛在线观看| 欧美丝袜丝交足nylons图片| 国产精品久久AV无码| 色狮一区二区三区四区视频| 欧美亚洲成人精品| 99久久夜色精品国产亚洲| 久久精品视频在线看| 真人做人试看60分钟免费| 韩国精品主播一区二区在线观看| 欧美成人r级一区二区三区| 亚洲午夜久久久久久久国产| 亚洲日产国产精品| 亚洲一区二区三区毛片| a视频网址在线观看| 高跟丝袜一区二区三区| 波多野结衣电影免费观看| 欧洲杯什么时候开赛| 欧美亚洲国产成人精品| 亚洲国产成人在线观看| 亚洲欧洲另类国产综合| 在线观看av日韩| 日韩美女毛片| 97av在线影院| 欧美熟妇交换久久久久久分类| 亚洲日本在线视频观看| 国产一伦一伦一伦| 神马影视一区二区| 91成品人片a无限观看| 色香蕉在线视频| 亚洲图片有声小说| 亚洲综合中文网| 欧美福利专区| 亚洲永久在线观看| 国产超级va在线视频| 欧美嫩在线观看| 91导航在线观看| 蜜臀va亚洲va欧美va天堂| 亚洲成人a**址| 51一区二区三区| 在线亚洲欧美视频| 国产女主播喷水视频在线观看| 久久久噜噜噜久久中文字幕色伊伊| 男人添女人下部高潮视频在观看| 福利在线一区| 2019中文字幕在线免费观看| 亚洲人成色777777老人头| 亚洲国产精品久久久久婷婷884| 久久久久亚洲av无码网站| 国产精品a级| 国产精品国模大尺度私拍| 国产桃色电影在线播放| 亚洲国产精品久久久久秋霞不卡| 精品久久免费视频| 91视视频在线直接观看在线看网页在线看| 无码专区aaaaaa免费视频| 乱亲女h秽乱长久久久| 欧美亚洲视频在线观看| 久久精品国产亚洲a∨麻豆| 欧美午夜宅男影院| 小向美奈子av| 国产成人免费av在线| 国产91xxx| 免费黄色成人| 国产区亚洲区欧美区| 在线h片观看| 亚洲国产欧美精品| 无码一区二区三区| 亚洲日本欧美天堂| 性活交片大全免费看| 国产精品日本| 亚洲伊人婷婷| 第四色中文综合网| 国产成人精品国内自产拍免费看| 日韩大片在线永久免费观看网站| 日韩一级完整毛片| 久久免费激情视频| 国产精品初高中害羞小美女文| 欧美体内she精高潮| 国产一区二区你懂的| 亚洲不卡一卡2卡三卡4卡5卡精品| 精品女同一区二区三区在线观看| 久久中文久久字幕| 日韩porn| 日韩天堂在线观看| 亚洲精品中文字幕乱码三区91| 国产精品成人免费精品自在线观看| 师生出轨h灌满了1v1| 免费在线播放第一区高清av| 樱花影视一区二区| 日韩精品久久一区二区三区| 国产午夜久久av| 欧美一级片一区| 最新av在线播放| 亚洲欧美色婷婷| www.四虎在线观看| 色琪琪一区二区三区亚洲区| 欧美成人精品欧美一级私黄| 久久精品在这里| 欧美一级大片免费看| 日本女人一区二区三区| 可以看毛片的网址| 日韩一区电影| 蜜桃久久精品乱码一区二区| 日韩激情精品| 国产区亚洲区欧美区| 韩日成人影院| 欧美精品www| 欧美18hd| 永久免费毛片在线播放不卡| 亚洲欧美丝袜中文综合| 日韩一区二区影院| 一级二级三级视频| 欧洲国产伦久久久久久久| 久久精品国产亚洲AV无码男同| 亚洲视频在线一区观看| 成人无码av片在线观看| 91色porny| 日韩av手机在线播放| 国产丶欧美丶日本不卡视频| 中文字幕有码av| 色呦呦在线观看视频| 久久99精品久久久久婷婷| 黄黄视频在线观看| 欧美oldwomenvideos| 日日噜噜噜噜夜夜爽亚洲精品| 欧美色图婷婷| 国产精品日韩欧美一区二区| 中文字幕一区二区三区四区久久 | 久久夜色精品国产噜噜亚洲av| 亚洲在线成人精品| 一区二区在线观看免费视频| 1区2区3区欧美| fc2ppv在线播放| 中文字幕在线一区免费| 日韩av片在线| 国产丝袜在线精品| 亚洲一区视频在线播放| 久久视频一区二区| 亚洲精品中文字幕在线播放| 成人av高清在线| 成年女人免费视频| 丁香一区二区三区| 国产精品入口麻豆| 成人sese在线| www.免费av| 久久久久久亚洲综合影院红桃| 国产亚洲无码精品| 国产亚洲va综合人人澡精品| 一级片视频免费看| 国产精品久久三区| 亚洲精品卡一卡二| 亚洲综合男人的天堂| 国产乡下妇女做爰| 精品久久中文字幕| 精品成人无码久久久久久| 欧美亚洲禁片免费| 11024精品一区二区三区日韩| 4438x成人网最大色成网站| 国产欧美熟妇另类久久久| 日韩欧美三级在线| 日本激情一区二区| 亚洲人成在线电影| 调教视频免费在线观看| www.欧美精品一二三区| 在线xxxx| 日本久久久久久久久久久| 亚洲精品一区三区三区在线观看| 成人做爰www免费看视频网站| 亚洲超碰在线观看| 久久精品国产一区二区三区日韩| 欧美激情在线免费| 亚洲一一在线| 激情综合自拍| 26uuu久久噜噜噜噜| 成人免费一级片| 欧美久久久影院| 丰满大乳国产精品| 亚洲新声在线观看| 亚洲综合伊人久久大杳蕉| 91福利视频在线观看| 九七影院97影院理论片久久| 国产精品xxxx| 日本a级不卡| 精品久久久久久无码中文野结衣| 久久国产主播| 性生活一级大片| 久久在线免费观看| 亚洲色图综合区| 日本精品视频一区二区三区| www.国产欧美| 色yeye香蕉凹凸一区二区av| 怡红院红怡院欧美aⅴ怡春院| 日本一区二区不卡| 麻豆一区在线| 天堂精品一区二区三区| 在线不卡视频| 中文字幕久久av| 26uuu精品一区二区在线观看| 紧身裙女教师波多野结衣| 色综合色综合色综合色综合色综合| 国产精品无码一区二区桃花视频| 亚洲精选在线观看| 美女网站视频在线| 国产综合福利在线| 国产欧美日韩精品一区二区三区| www.xxx麻豆| 国产一区91精品张津瑜| 欧洲美一区二区三区亚洲| 亚洲一区二区三区自拍| 国产又粗又黄视频| 亚洲性猛交xxxxwww| 白浆视频在线观看| 91九色对白| 91日韩欧美| 中文字幕无码不卡免费视频| av一区二区三区在线| 国产一二三区精品| 欧美老女人在线| 国产精品秘入口| 国产成人极品视频| 欧美综合精品| www..com日韩| 国产91精品精华液一区二区三区 | 日韩大片在线观看| 国产成人a亚洲精v品无码| 成人一区二区三区视频| 欧美日韩免费做爰视频| 91超碰这里只有精品国产| av在线二区| 国产精品成人v| 欧美少妇性xxxx| 黄色免费网址大全| 久久精品在线观看| 波多野结衣激情视频| 亚洲欧美日韩天堂| 成人影院av| 欧美一区二区三区在线免费观看| 国产亚洲精品v| 日本少妇色视频| 一本一道综合狠狠老| 欧美视频综合| 国产精品久久一| 久久伦理在线| 亚洲av无日韩毛片久久| 亚洲青青青在线视频| 99久久亚洲精品日本无码| 欧美成人免费va影院高清| 国产一区二区三区黄网站| 国产精品视频网站在线观看| 福利一区二区在线观看| 日韩黄色a级片| 国产视频在线一区二区| 国产一区二区主播在线| 亚洲国产日韩欧美| 国产一区二区导航在线播放| 欧美人妻精品一区二区免费看| 欧美r级在线观看| av中文字幕在线观看第一页| 精品国产乱码久久久久久丨区2区| 免费日韩av片| 午夜激情福利电影| 精品欧美久久久| 天堂√中文最新版在线| 亚洲a∨一区二区三区| 国内精品在线播放| 久久亚洲精品大全| 亚洲精选一区二区| 久久精品嫩草影院| 性高湖久久久久久久久aaaaa| 91在线观看高清| 精品国产青草久久久久96| 欧美精品一区在线播放| 特黄特色欧美大片| 成人性生交免费看| 亚洲成a人片综合在线| 国产中文字幕在线看| 91久久久久久久久久久| 99精品欧美| 美国精品一区二区| 亚洲精品第一国产综合精品| 美女色狠狠久久| 男人添女荫道口喷水视频| 久久久久久久免费视频了| a级片免费视频| 欧美综合一区第一页| 无码一区二区三区视频| 免费无码一区二区三区| 911精品国产一区二区在线| 182在线视频观看| 一区二区三区四区五区精品| av电影在线观看完整版一区二区| 一个人看的www日本高清视频|