精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

6.4萬star的開源智能體框架全面重構!OpenHands重大升級,叫板OpenAI和谷歌

人工智能 新聞
這些元素使得 OpenHands Software Agent SDK 能夠為原型設計、解鎖新型自定義應用以及大規模可靠部署智能體提供一個實用的基礎。

剛剛,OpenHands 開發團隊發布了一篇新論文,正式宣布廣受歡迎的軟件開發智能體框架 OpenHands (GitHub star 已超 6.4 萬)中的智能體組件完成了架構重構,即 OpenHands Software Agent SDK。

這一輪重新設計改進巨大,也讓 OpenHands 從 V0 進化到了 V1。包括:

  • 靈活性方面,他們設計了一個簡潔的接口,在默認情況下僅需幾行代碼即可實現智能體,但又易于擴展為具有自定義工具、內存管理等功能的、功能齊全的復雜智能體。
  • 在安全性和可靠性方面,它提供了無縫的本地到遠程執行可移植性、集成的 REST/WebSocket 服務。
  • 為了與人類用戶交互,它可以直接連接到各種界面,如可視化工作區(VS Code、VNC、瀏覽器)、命令行界面和 API。
  • 與現有的 OpenAI、Claude 和 Google 的 SDK 相比,OpenHands 獨特地集成了原生沙盒化執行、生命周期控制、模型無關 (model-agnostic) 的多 LLM 路由以及內置的安全分析。

該團隊表示:「這些元素使得 OpenHands Software Agent SDK 能夠為原型設計、解鎖新型自定義應用以及大規模可靠部署智能體提供一個實用的基礎。」

  • 論文標題:The OpenHands Software Agent SDK: A Composable and Extensible Foundation for Production Agents 
  • Software Agent SDK: https://github.com/OpenHands/software-agent-sdk 
  • 基準:https://github.com/OpenHands/benchmarks

OpenHands V1 的四項設計原則

OpenHands 團隊表示,OpenHands V0 最初設計為單體架構,即將智能體邏輯、評估和應用組合在同一個代碼庫中;這樣做目的是為了實現快速原型設計和迭代,但這種設計在項目的發展中暴露出了許多短板,包括沙盒僵化、可變配置龐雜,以及研究與生產之間過度耦合。因此,全面的重構勢在必行。

汲取了這些教訓,OpenHands V1 引入了一個基于四項設計原則的新架構,這些原則直接解決了 V0 的局限性。具體來說,這些原則包括:

1、沙盒化應該是可選的,而非普遍適用的

V1 默認設置是在單個進程中統一智能體和工具的執行,這與 MCP 的假設一致。當需要隔離時,同一個棧可以被透明地容器化。沙盒化變成了可選的,從而在不犧牲安全性的前提下保持了靈活性。

2、默認無狀態,狀態的真值來源單一

V1 將所有智能體及其組件(工具、LLM 等)視作在構建時即被驗證的、不可變的且可序列化的 Pydantic 模型。唯一可變的實體是會話狀態,它是一個單一的、明確定義的真值來源(source of truth),用于跟蹤正在進行的執行。這種設計將變化隔離在一個地方,實現了確定性重放、強一致性和穩定的長期恢復。

3、保持嚴格的相關項分離

V1 將智能體核心隔離成了「軟件工程 SDK」。應用通過 SDK API 進行集成,使得研究可以獨立于應用進行演進。

4、一切都應是可組合且可安全擴展的

V1 將可組合性作為兩個層面上的首要設計目標。

在部署層面,其四個模塊化包(SDK, Tools、Workspace 和 Agent Server)可以靈活組合,以支持本地、托管或容器化執行。

在能力層面,該 SDK 會暴露一個類型化的組件模型(工具、LLM、上下文等),讓開發人員可以聲明式地擴展或重新配置智能體,而無需觸及核心。

OpenHands V1:一個完整的軟件智能體生態系統

OpenHands V1 便是基于這些原則而生的,這是一個完整的軟件智能體生態系統,包括 CLI 和 GUI 應用。它們構建在一個共享的基礎上:OpenHands Software Agent SDK (圖 1b)。

下圖展示了一個極簡示例:

該 SDK 定義了一個具有確定性重放 (deterministic replay) 功能的事件溯源 (event-sourced) 狀態模型、一個用于智能體的不可變配置,以及一個集成了 MCP 的類型化工具系統。

其工作區抽象使得同一個智能體能夠在本地運行以進行原型設計,或者在安全、容器化的環境中遠程運行,而只需最少的代碼更改。

與之前僅提供庫的 SDK 不同,OpenHands 包含一個用于遠程執行的內置 REST/WebSocket 服務器,以及一套用于人工審查和控制的交互式工作區界面 —— 一個基于瀏覽器的 VSCode IDE、VNC 桌面和持久化的 Chromium 瀏覽器。

該團隊還系統地比較了其 SDK 與 OpenAI Agents SDK、Claude Agent SDK 和 Google ADK 的 31 個特性,發現盡管有 15 個特性與它們中的至少一個共享,但 OpenHands 的 SDK 獨特地結合了 16 個額外特性,包括原生遠程執行、帶沙盒功能的生產服務器,以及跨越 100+ 供應商的模型無關的多 LLM 路由。

該 SDK 還增加了一個用于智能體操作的安全分析器、靈活的生命周期控制(暫停 / 恢復、子智能體委托、歷史恢復等),以及用于保障生產可靠性的內置 QA (質量保證) 插樁(單元測試、基于 LLM 的集成測試和評估基準)。

OpenHands Software Agent SDK 已在 MIT 許可下完全開源。

可靠性與評估

該團隊通過兩個互補的過程評估了 OpenHands Agent SDK 的可靠性和性能:持續測試和基準評估。

持續測試流程結合了程序化測試和基于 LLM 的測試,并在每個拉取請求 (pull request) 上自動運行,且每天運行一次。它檢查的是 SDK 在多種語言模型下是否表現一致,及早發現推理、工具使用和狀態管理方面的回歸問題。這些自動化測試每次完整運行的成本僅為 0.5–3 美元,并能在 5 分鐘內完成。

而基準評估則是在標準化的智能體任務上衡量 SDK 的整體能力,從而幫助了解模型質量和系統性能。

持續質量保證

該 SDK 采用了三層測試策略來平衡覆蓋范圍、成本和深度:

  • 程序化測試:在每次提交 (commit) 時運行。這些測試模擬 llm 調用,并在幾秒鐘內驗證核心邏輯、數據流和 API 協定。模擬可以實現更快的反饋,確保在進行任何外部 API 調用之前捕獲到大多數回歸問題。
  • 基于 LLM 的測試:包括集成測試和示例測試 (見下文)。每天執行,并可按需為拉取請求執行。這些測試使用真實模型 (Claude Sonnet 4.5, GPT-5 Mini, DeepSeek Chat) 來驗證推理、工具調用和環境穩定性。每次運行成本為 0.5–3 美元,并在 5 分鐘內完成。
  • 基準評估:按需進行的高成本評估(每次運行 100–1000 美元,耗時數小時),用于衡量學術數據集上的綜合智能體能力。

集成測試覆蓋多種基于場景的工作流(例如,文件操作、命令執行、git 操作和瀏覽),而示例測試(example tests)則會定期運行所有 SDK 示例(自定義工具、MCP 集成、持久化、異步執行、路由等),以確保端到端的可靠性。該測試套件會隨著新智能體行為和故障模式的發現而不斷擴展,從而提高覆蓋范圍和回歸敏感性。

該團隊還針對這些基于 LLM 的測試的按需執行進一步優化了 CI/CD 成本:集成測試針對高風險變更,示例測試覆蓋面向用戶的模塊,而每日運行則跟蹤整個代碼庫更新中的回歸問題。

基準測試

該 SDK 為評估智能體能力的各種學術基準提供了內置支持。

如表 2 所示,該 SDK 在軟件工程和通用智能體基準測試中表現得很有競爭力。

在衡量智能體在軟件工程任務中能力的 SWE-Bench Verified 上,該 SDK 使用 Claude Sonnet 4.5 配合擴展思維實現了 72% 的解決率;在衡量智能體通用計算機任務解決能力的 GAIA 上,SDK 使用 Claude Sonnet 4.5 實現了 67.9% 的準確率,展現了有效的多步推理和工具使用能力。

此外,強大的開源編碼模型 Qwen3 Coder 480B 實現了 41.21% 的分數。這些結果略優于 OpenHands-Versa 的結果,表明該 SDK 的架構并未犧牲智能體能力,并實現了與研究專精系統相媲美的性能。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-15 17:28:05

2025-04-09 11:01:19

2024-10-12 12:30:18

2015-07-15 14:27:04

Eddystone通信蘋果

2025-06-20 14:38:43

OpenAI客服智能體人工智能

2024-10-22 20:00:00

2025-07-28 01:33:00

2025-03-12 11:34:35

2021-01-24 11:59:48

開源技術 工具

2023-04-25 11:31:33

智能AI

2025-08-12 08:58:03

2021-04-14 15:15:46

開源技術 工具

2025-01-09 09:00:00

訓練數據AI

2011-03-08 09:26:10

Chrome OS

2025-02-24 09:20:00

Pinia3.0Vue開發

2024-04-01 11:26:10

Nuejs前端

2023-02-08 11:05:38

2020-11-05 14:12:16

Vue開源項目js框架

2023-05-12 12:43:49

開源人工智能

2025-05-15 03:25:00

點贊
收藏

51CTO技術棧公眾號

日韩精品一区二区在线播放 | 高清毛片在线观看| 波多野结衣91| 国产精品久久久久久搜索| 二区三区四区视频| 澳门精品久久国产| 在线观看免费亚洲| 久久这里只有精品8| 色久视频在线播放| 国产自产v一区二区三区c| 2019中文在线观看| 欧美在线视频第一页| 校花撩起jk露出白色内裤国产精品| 在线观看一区日韩| 欧洲精品在线播放| av中文字幕一区二区三区| 成人亚洲精品久久久久软件| 欧美整片在线观看| 在线免费日韩av| 激情五月综合网| 精品福利一二区| 在线观看岛国av| japanese23hdxxxx日韩| 婷婷中文字幕综合| 精品一区二区三区毛片| 高清美女视频一区| 99精品在线观看视频| 91在线精品播放| 波多野结衣高清视频| 99精品视频免费全部在线| 久久成人免费视频| 中国女人特级毛片| 神马午夜久久| 亚洲第一区在线| 久久久久亚洲av无码专区首jn| 欧美va在线| 欧美性猛交xxxx乱大交3| 夜夜添无码一区二区三区| 菠萝菠萝蜜在线视频免费观看 | 自拍偷拍第9页| 国产精选一区| 亚洲欧美综合精品久久成人| 制服丝袜在线第一页| 麻豆久久一区| 91精品欧美福利在线观看| 一区二区成人网| 欧美精品日日操| 91久久免费观看| 日本在线视频www| 国产精品迅雷| 一本一道久久a久久精品| 熟女少妇在线视频播放| 欧美激情护士| 欧美性jizz18性欧美| 干日本少妇首页| 川上优av中文字幕一区二区| 亚洲成av人片| 欧美 日韩 国产 高清| 欧美13videosex性极品| 欧美日韩国产一区中文午夜| 精品欧美一区免费观看α√| 中文字幕在线视频久| 欧美性生活大片免费观看网址| 人妻精品无码一区二区三区| 美女91在线看| 色婷婷亚洲综合| 国产超碰在线播放| 色999久久久精品人人澡69| 欧美色窝79yyyycom| 午夜剧场在线免费观看| 久久免费福利| 精品国产凹凸成av人导航| www.17c.com喷水少妇| 色狠狠久久av综合| 国产亚洲欧美日韩美女| 永久av免费网站| 欧美一区二区三区久久精品茉莉花| 欧美黑人性视频| 国产免费观看av| 日韩av网站在线观看| 成人在线观看视频网站| 国产综合在线播放| 国产网红主播福利一区二区| 亚洲日本精品一区| 神马午夜伦理不卡| 欧美特黄级在线| 中文字幕在线综合| 99国产精品免费网站| 精品偷拍一区二区三区在线看| 国产高清一区二区三区四区| 91影院成人| 高清一区二区三区日本久| 久草国产精品视频| 美女尤物国产一区| 国产精品久久亚洲7777| 国产精品毛片一区二区三区四区| 亚洲天堂成人在线观看| www.在线观看av| 色综合天天色| 亚洲成人精品在线| 免费黄在线观看| 国内精品福利| 国产精品视频99| 免费a级片在线观看| 中文字幕不卡在线播放| 欧美视频在线第一页| 日本不卡1234视频| 制服.丝袜.亚洲.中文.综合| 免费a级黄色片| 欧美激情四色| 国产精品69av| 秋霞欧美在线观看| 中文字幕日韩av资源站| 欧美日韩激情视频在线观看| 精品国产一区二区三区2021| 国产亚洲精品久久| 日韩精品在线免费看| 久久99这里只有精品| 蜜桃av色综合| 欧美14一18处毛片| 欧美男男青年gay1069videost | 男人天堂999| 日本久久伊人| 日韩一区av在线| 伦av综合一区| 99视频在线观看一区三区| 91麻豆天美传媒在线| 91久久久久久白丝白浆欲热蜜臀| 日韩精品高清在线| 久久精品www人人爽人人| 六月丁香婷婷久久| 日韩欧美国产二区| 日本免费久久| 亚洲免费伊人电影在线观看av| 久久久久久久99| 成人永久看片免费视频天堂| 国产精品一二三在线观看| 国产在视频一区二区三区吞精| 亚洲欧美日韩第一区| 久久草视频在线| 成人小视频在线观看| 国产精品三级一区二区| 久久av偷拍| 超碰日本道色综合久久综合| 国产一区二区三区四区视频 | 亚洲高清乱码| 欧美亚洲大片| 国产亚洲欧美aaaa| 黄色大全在线观看| 欧美极品美女视频| 在线观看av日韩| 欧美日韩伦理| 国产精品久久久久久久av电影| 激情小说 在线视频| 色综合视频在线观看| 欧美激情aaa| 视频一区视频二区中文字幕| 日韩一区国产在线观看| av免费在线一区| 色伦专区97中文字幕| 国产精品探花视频| 亚洲精选视频免费看| 无码人妻久久一区二区三区蜜桃| 午夜亚洲福利| 狠狠色综合欧美激情| 涩涩视频在线免费看| 亚洲毛茸茸少妇高潮呻吟| 草莓视频18免费观看| 中文字幕乱码久久午夜不卡 | 91porny在线| 久久久久九九视频| 色播五月综合网| 女生裸体视频一区二区三区| caoporn国产精品免费公开| 999av小视频在线| 日韩成人性视频| 亚洲高清视频免费观看| 中文字幕在线一区| 免费看91视频| 久久精品盗摄| 91xxx视频| 卡通动漫精品一区二区三区| 日本欧美爱爱爱| 青青影院在线观看| 精品久久久久久久久久久久包黑料 | 久久网站免费视频| 色综合久久网| 国产超碰91| gogo亚洲高清大胆美女人体| 久久久精品一区二区| 天天综合网天天综合| 国产欧美三级电影| 精品久久久久久久久久久久| 最近中文字幕在线mv视频在线 | 欧美一级视频一区二区| 日本中文字幕在线播放| 精品国产一区二区三区不卡| 亚洲精品中文字幕乱码三区91| 国产精品的网站| 欧美精品欧美极品欧美激情| 久久se精品一区二区| 国产日韩一区二区在线| 一区二区三区午夜视频| 美国av一区二区三区| 日本久久伊人| 国产精品自产拍在线观看| 99热99re6国产在线播放| 日韩综合视频在线观看| 天堂中文资源在线| 欧美一区二区三级| 成人毛片一区二区三区| 亚洲永久精品大片| 极品尤物一区二区| 久久亚洲一区二区三区明星换脸| 中文字幕在线视频一区二区| 奇米影视在线99精品| 国产欧美日韩小视频| 婷婷亚洲综合| 日本一区高清不卡| 欧美理伦片在线播放| 91大片在线观看| 欧美成人毛片| 国产精品99久久99久久久二8| 国产高清在线a视频大全| 日韩在线免费高清视频| 黄视频在线观看免费| 亚洲福利视频免费观看| 国产sm主人调教女m视频| 欧美日韩三级一区| 国产精品熟女视频| 狠狠色狠狠色综合日日五| 国产在线一二区| 一区二区在线观看视频在线观看| 影音先锋男人资源在线观看| 国产欧美一区二区精品秋霞影院| 黄色网址在线视频| 国产91精品入口| 在线观看免费看片| 国产精品综合一区二区三区| 亚洲免费999| 美女在线视频一区| 中文字幕在线观看日| 久久综合综合久久综合| av网站在线不卡| 青青草成人在线观看| 五月天激情视频在线观看| 日韩二区三区四区| 88av.com| 奇米精品一区二区三区在线观看| 免费日韩视频在线观看| 久久国产福利| 成人精品视频一区二区| 石原莉奈在线亚洲三区| 国产精品人人爽人人爽| 蜜臀久久久久久久| 久久久久久久久久毛片| 激情六月婷婷综合| 天堂在线精品视频| 国产69精品久久久久777| 午夜影院福利社| 91视频你懂的| 国产肥白大熟妇bbbb视频| 久久蜜桃香蕉精品一区二区三区| 实拍女处破www免费看| 国产三级精品三级在线专区| 国精产品一区一区| 亚洲丝袜美腿综合| 久久久全国免费视频| 性感美女久久精品| 潘金莲一级淫片aaaaaa播放| 欧美在线观看视频一区二区 | 成人在线观看小视频| 亚洲人成网站在线| 日韩精品――中文字幕| 在线精品亚洲一区二区不卡| 国产乱淫a∨片免费视频| 日韩欧美aaaaaa| 五月天婷婷在线观看| 亚洲一二三在线| caoporn免费在线视频| 久久久视频在线| 欧美aa视频| 亚洲综合中文字幕68页| 日本午夜精品| 亚洲午夜精品福利| 黄色成人在线网址| 午夜dv内射一区二区| 国内精品免费在线观看| 久久久久久久无码| 国产精品日韩成人| 国产一级生活片| 精品视频1区2区| 免费a视频在线观看| 一色桃子一区二区| 欧美一卡二卡| 国产精品扒开腿做爽爽爽男男| 日本成人精品| 日本一区免费观看| 欧美三区在线| 欧美三级理论片| av福利精品导航| 可以免费看av的网址| 欧美性xxxxxxx| 国产绳艺sm调教室论坛| 亚洲欧美另类国产| 青春草免费在线视频| 国产精品福利网站| 国产精品流白浆在线观看| 亚洲欧洲一区二区| 亚洲综合另类| 国产人妻精品午夜福利免费| 国产精品久久毛片av大全日韩| 日本少妇激情舌吻| 欧美一区二区三区免费大片 | 中文字幕av资源| 日韩精品欧美激情| 色女人在线视频| 国产一区香蕉久久| 久久99性xxx老妇胖精品| 丁香婷婷综合激情| 国内精品伊人久久久久av影院 | 精品日韩久久久| 99re在线视频这里只有精品| avove在线播放| 欧美日韩国产在线观看| 巨骚激情综合| 91av视频在线观看| 在线综合色站| 97精品国产97久久久久久粉红| 美腿丝袜在线亚洲一区| 在线看片中文字幕| 在线视频你懂得一区| 天天av综合网| 91超碰中文字幕久久精品| 成人动态视频| 99久久免费观看| 国产美女精品在线| 日韩欧美123区| 91精品国产综合久久精品| 日本中文字幕伦在线观看| 国产精品va在线| 欧美理论在线播放| 少妇性l交大片| 国产欧美一区二区三区鸳鸯浴 | 制服.丝袜.亚洲.中文.综合| 天堂中文а√在线| 国产乱肥老妇国产一区二| 欧美日韩一二三四| 亚洲国产高清av| 国产精品久久久久影院亚瑟| 一级片aaaa| 久久精品国产一区二区电影| 日韩亚洲国产免费| 永久免费在线看片视频| 国产伦精品一区二区三区免费| 翔田千里88av中文字幕| 日韩精品一区二区在线观看| 黄页网站大全在线免费观看| 国产精品三区www17con| 国产手机视频一区二区| 90岁老太婆乱淫| 欧美日韩一区二区在线观看视频| 久草中文在线| 91精品婷婷国产综合久久蝌蚪| 伊人精品成人久久综合软件| 久久人妻一区二区| 色综合久久综合网97色综合| 成人免费黄色网页| 国产在线观看精品一区二区三区| 68国产成人综合久久精品| 在线观看免费看片| 欧美视频一区二区三区…| 国产小视频在线| 成人黄色av播放免费| 国产精品av一区二区| 亚洲色图14p| 欧洲精品在线观看| 69xxx在线| 久久久久网址| 欧美aaa在线| 久久综合色综合| 一区二区国产精品视频| 久久99成人| 欧美 日韩精品| 中文字幕视频一区| 三级网站在线看| 国产精品∨欧美精品v日韩精品| 香港欧美日韩三级黄色一级电影网站| 中文字幕一区二区三区人妻在线视频| 欧美日韩精品国产| 日韩成人影视| 麻豆精品传媒视频| 国产在线精品国自产拍免费| 偷偷操不一样的久久| 日韩中文字幕在线精品| 欧美aaaaa级| 搡的我好爽在线观看免费视频| 欧美日韩在线观看视频| www在线免费观看视频| 免费国产一区二区|