精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MetaGPT開源自動生成智能體工作流,4.55%成本超GPT-4o

開源 人工智能
MetaGPT 開源了 AFLOW,它使用 MCTS 進行 Agentic Workflow 的自動搜索,可以完全自動地構建與優化 Agentic Workflow 問題,讓我們不再需要手寫代碼、調試提示詞。

AFLOW 作者團隊來自于 MetaGPT 開源社區。AFLOW 論文共同第一作者為香港科技大學(廣州)的博士生張佳釔和 DeepWisdom 研究員向勁宇,共同通訊作者為 DeepWisdom 創始人兼 CEO 吳承霖(MetaGPT 代碼作者、論文通訊作者)和香港科技大學(廣州)的助理教授駱昱宇。作者還包括中國人民大學的于兆洋、滕楓蔚和程信,南京大學 LAMDA 實驗室博士生陳雄輝,復旦大學的陳家祺和鄭炳南,阿卜杜拉國王科技大學的博士生諸葛鳴晨(MetaGPT 論文共同一作),DeepWisdom 研究員洪思睿(MetaGPT 論文共同一作)和王金淋,蒙特利爾大學與 MILA 實驗室的助理教授劉邦。

對于 LLM 從業者來說,讓 LLM 落地應用并發揮作用需要手動構建并反復調試 Agentic Workflow,這無疑是個繁瑣過程,一遍遍修改相似的代碼,調試 prompt,手動執行測試并觀察效果,并且換個 LLM 可能就會失效,有高昂的人力成本。許多公司甚至專職招聘 Prompt Engineer 來完成這一工作。

現在,Agentic Workflow 也有自己的自動優化工具了。

MetaGPT 開源了 AFLOW,它使用 MCTS 進行 Agentic Workflow 的自動搜索,可以完全自動地構建與優化 Agentic Workflow 問題,讓我們不再需要手寫代碼、調試提示詞。

圖片

AFLOW 通過蒙特卡洛樹搜索優化工作流,極低成本實現 GPT-4o 級能力

這是對提示詞自動優化的進一步探索,通過蒙特卡洛樹搜索,完全接管了 Agentic Workflow 的生成與優化過程,表現遠超其他工作流自動優化工作,甚至超越了對比的所有手工工作流基線。

圖片

  • 論文標題:AFlow: Automating Agentic Workflow Generation
  • 論文地址:https://arxiv.org/abs/2410.10762
  • 項目地址:https://github.com/geekan/MetaGPT/tree/main/examples/aflow

什么是自動工作流優化問題?

現有的 Agentic Workflow 自動生成工作難以生成有效的工作流,它們往往需要人工介入初始設置,且無法全面捕捉到完成任務所需的工作流多樣性。為了克服這些挑戰,研究人員提出了 AFLOW 框架。利用蒙特卡洛樹搜索(MCTS)技術來系統地探索和優化 LLM 的工作流。AFLOW 通過將工作流定義為代碼可表示的節點和邊,從而有效地捕捉 LLMs 調用之間的復雜交互。通過引入操作符的概念,AFLOW 進一步簡化了搜索空間,提高了搜索效率。在多個基準數據集上的實驗結果表明,AFLOW 能夠自動發現和優化工作流,顯著提高了任務執行的性能,同時減少了對人工干預的依賴。

圖片

AFLOW 的動態演示。通過不斷迭代的選擇、擴展、評估和反向傳播實現工作流的自動化生成和優化

AFLOW 首先將工作流優化問題重新構建為一個搜索問題,其中工作流被表示為代碼化的節點序列,每個節點代表 LLM 的一個具體操作,節點之間的邊定義了操作的邏輯、依賴關系和執行流程。這種表示方法將工作流轉化為一個可以搜索和優化的圖結構。具體來說,工作流 W 被定義為一個 LLM 調用節點序列圖片,其中每個節點圖片包含模型 M,提示 P,溫度,輸出格式 F(如 xml、json、markdown、raw)四個參數。節點通過邊連接,邊可以由各種結構表示,如圖,神經網絡,代碼。

自動化工作流優化的目標是在給定任務 T 和評估函數 G 的情況下,發現一個工作流 W ,使得 G(W,T) 最大化。這可以被表述為一個搜索過程,其中算法 A 探索搜索空間 S 來確定最優的工作流配置。搜索空間 S 包括所有可能的節點參數和邊結構的配置。

圖片

Node、Operator 和 Edge 示例。此處展示 Node 的可選參數、Operator 常見結構和 Edge 的常見表示

AFLOW 如何自動優化工作流?

AFLOW 利用蒙特卡洛樹搜索(MCTS)來自動化地生成和優化 Agentic Workflow。在 AFLOW 框架中,Operator 扮演著至關重要的角色,它們是預定義的、可重用的節點組合,代表常見的智能體操作(比如審查,投票,生成)。這些 Operator 作為構建工作流的基礎構件,被集成到搜索空間中,確保探索過程可以利用已知的有效智能體操作模式。引入 Operator 能夠顯著提升 AFLOW 框架的搜索效率和工作流的優化效果,減少在龐大搜索空間中的盲目探索。

AFLOW 的目標是在給定任務和評估函數的情況下,發現一個能夠最大化任務性能的工作流。AFLOW 算法開始于初始化模板工作流,這個模板提供了一個基本的工作流框架,包括 LLM 節點的調用和 Operator 的使用。然后,算法通過 MCTS 的四個主要步驟進行迭代:選擇(Selection)、擴展(Expansion)、評估(Evaluation)和反向傳播(Backpropagation)。

圖片

AFLOW 整體框架:通過設置一個由僅具有靈活 prompt 參數的節點、給定的運算符集和表示邊的代碼組成的搜索空間,AFLOW 在此空間內執行基于 MCTS 的搜索。通過為工作流優化而設計的 MCTS 變體,AFLOW 迭代執行軟混合概率選擇、基于 LLM 的擴展、執行評估和經驗反向傳播的循環,直到達到最大迭代次數或滿足收斂標準

選擇階段 AFLOW 使用軟混合概率選擇機制來選擇一個節點進行擴展。這種機制結合了均勻概率分布和基于分數的加權概率分布,以平衡探索和利用,避免陷入局部最優解。選擇過程中,AFLOW 會考慮候選節點的得分和探索的需要,從而選擇一個既有可能帶來性能提升又具有探索價值的節點。

擴展階段 AFLOW 使用 LLM 作為優化器來生成新的工作流。優化器利用選定工作流的經驗來生成新的提示或通過修改代碼來改變節點連接,從而產生新的工作流變體。這些新的工作流變體是通過對現有工作流的微小調整來實現的,例如添加、修改或刪除節點和邊。

評估階段 AFLOW 直接執行生成的工作流以獲得反饋。由于推理任務具有明確的評估函數,AFLOW 可以通過在驗證集上多次運行工作流來計算平均分和標準差,從而獲得更準確的優化器反饋。

反向傳播階段 工作流的性能信息被反向傳播到 MCTS 的樹結構中,用于更新節點的得分,并指導未來的搜索迭代。這些信息包括工作流的執行結果和相對于其父工作流的優化成功與否。通過這種方式,AFLOW 能夠從每次迭代中學習,并逐漸改進工作流的性能。

為了避免在優化達到極限后繼續執行的不必要成本,當連續幾輪中分數優先的前 k 個工作流沒有改進時,AFLOW 將停止上述迭代過程。

AFLOW 帶來的 Agentic Workflow 變革

顯著的性能優勢 AFLOW 選取了六個文本推理的任務,覆蓋了代碼(HumanEval, MBPP),數學(GSM8K, MATH),知識問答(HotpotQA, DROP)三個場景。相比現有手動方法平均提升 5.7%,較其他自動化方法更是提升了 19.5%。在所有六個任務中,AFLOW 展現出全面的領先優勢,證明了其在不同任務類型上的穩定性和適應性。

圖片

與其他方法的性能比較。為了評估該方法的性能,我們在不同的數據集中采用了各種指標:Math 和 GSM8K 的求解率、HotpotQA 和 DROP 的 F1 分數以及 HumanEval 和 MBPP 的 pass@1。我們的 AFLOW(以黃色突出顯示)在所有六個基準測試中始終優于所有自動工作流程優化和手動設計的方法

顯著成本降低 AFLOW 為 Agent 領域帶來的最大變革在于其顯著的成本降低。較小尺寸的模型通過 AFLOW 找出的工作流,僅需 GPT-4o 推理成本的 4.55% 就能實現同等性能。這一突破意味著企業可以用更小的模型實現大模型的效果,為 AI 應用的規模化部署提供了經濟可行的解決方案。

圖片

成本(Cost)指執行分割后 HumanEval 測試集的總費用。AFLOW(模型)指 AFLOW 使用該模型執行工作流,獲得反饋。圖例中的顏色代表在測試數據集中執行工作流所使用的不同 LLM

自動化的效率提升 AFLOW 徹底改變了傳統的人工調試模式。通過自動化的工作流生成與優化機制,顯著減少了人工參與的需求。開發者不再需要花費大量時間進行反復調試和優化,系統能夠自動發現最優的工作流組合,大幅縮短了開發周期。

廣泛的適用性 實驗結果表明,AFLOW 展現出優秀的遷移能力。它不僅支持多種主流 LLM 模型,還能適應不同類型的任務需求。在問答、代碼生成、數學問題求解等多個領域的測試中,AFLOW 都表現出色,證明了其作為通用優化框架的價值。此外,用戶可以通過簡單的提供數據集與 Evaluation Function 來將 AFLOW 使用在自己的任務上。

展望

AFLOW 提出了一種有效生成 Agentic Workflow 的方法,并全面展示了其在降低人力與推理成本上的驚人能力。這一研究成果有望加速 Agent 在各個領域落地的速度,將 Agentic Workflow 的構建過程從專家手工構建轉變為小白自動構建。

使用

目前,作者已在 GitHub 上開源了完整代碼。用戶可通過自定義 Benchmark 與數據集,快速為個性化任務搜索最佳性能或性能成本平衡的工作流方案,幫助個人和企業節省大量時間。

圖片

AFLOW 的 Github 指南??梢詤⒄辗植街改吓渲煤瓦\行 AFLOW,高效生成和優化工作流

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-26 09:05:00

2025-06-06 14:17:11

模型訓練AI

2025-11-04 08:42:27

2025-04-15 08:01:12

2024-12-04 15:57:56

2025-04-08 02:26:00

2024-08-14 14:30:00

AI訓練

2024-05-17 09:35:55

GPT-4o模型OpenAI

2025-07-23 09:32:02

2025-08-07 14:05:40

OpenAI大模型開源

2024-06-27 12:45:30

2025-07-07 09:05:00

AI數據模型

2024-05-21 12:23:17

2024-06-05 08:29:35

2025-07-07 08:49:00

2024-11-22 14:10:00

AI智能體

2025-02-17 12:24:43

2024-09-06 13:00:29

2025-03-31 08:50:00

AI生成模型

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI
點贊
收藏

51CTO技術棧公眾號

国产精品久久久精品四季影院| 一本久道高清无码视频| 国产九色91回来了| 婷婷综合亚洲| 精品999在线播放| 国产裸体舞一区二区三区| 91在线视频| 国产91精品精华液一区二区三区| 日韩av手机在线观看| 国产大屁股喷水视频在线观看| 91成人福利| 欧洲亚洲国产日韩| 无码人妻精品一区二区蜜桃网站| 三级理论午夜在线观看| 韩国成人福利片在线播放| 午夜精品免费视频| www.99re6| 妖精一区二区三区精品视频 | 国模套图日韩精品一区二区| 国产精品免费视频观看| 国产精品一级久久久| 糖心vlog精品一区二区| 中文在线一区| 九九九久久久久久| 天堂久久精品忘忧草| 视频二区欧美| 欧美日韩高清影院| 99久久久无码国产精品6| av官网在线播放| 国产欧美一区二区精品忘忧草| 国产高清一区视频| 一区二区久久精品66国产精品| 国产一区白浆| 欧美激情2020午夜免费观看| 香蕉久久久久久久| 亚洲成aⅴ人片久久青草影院| 91精品国产入口| 亚洲激情在线观看视频| 日韩精品美女| 亚洲成av人在线观看| 成年人三级视频| 国产高清一级毛片在线不卡| ww亚洲ww在线观看国产| 国产自产精品| 丰满人妻一区二区三区四区53| 久久国产精品72免费观看| 国产91免费看片| 日韩不卡视频在线| 99视频在线精品国自产拍免费观看| 欧美区二区三区| avtt天堂在线| 在线中文一区| 欧美精品在线播放| 四虎永久免费在线| 偷偷www综合久久久久久久| 一区二区亚洲精品国产| 国产男女猛烈无遮挡a片漫画| 国产精品毛片av| 精品国产乱子伦一区| 免费看91视频| 国产精品chinese在线观看| 日韩久久久久久| 国产精品91av| 极品一区美女高清| 精品视频在线播放色网色视频| 丰满岳乱妇一区二区| 久9re热视频这里只有精品| 337p日本欧洲亚洲大胆色噜噜| 国产免费a级片| 日韩av资源网| 亚洲美腿欧美激情另类| www.狠狠爱| 青草国产精品| 中文字幕日韩欧美| 日韩三级久久久| 这里只有精品在线| 性色av一区二区咪爱| 国产三级av片| 蜜臀av一区二区三区| 91色精品视频在线| 亚洲a视频在线| 91丨九色丨国产丨porny| 欧美韩国日本精品一区二区三区| 男人天堂资源在线| 中文字幕亚洲综合久久菠萝蜜| 日韩最新中文字幕| 久久男人天堂| 在线视频国产一区| 亚洲妇熟xx妇色黄蜜桃| 极品束缚调教一区二区网站| 亚洲一级免费视频| 国产精品丝袜一区二区| 一本色道久久综合亚洲精品不卡 | 一区二区免费在线观看| 怡红院在线观看| 欧美日韩美女视频| 色婷婷一区二区三区av免费看| 精品国产麻豆| 国产婷婷成人久久av免费高清| 日韩欧美视频免费观看| 国内揄拍国内精品久久| 日韩免费观看网站| www.国产麻豆| 国产亚洲欧美日韩日本| 久久亚洲a v| 日韩欧美精品一区二区综合视频| 日韩欧美中文字幕公布| 亚洲久久久久久久| 欧美日韩一区二区国产| 日本久久久a级免费| 国产情侣在线播放| 国产亚洲成av人在线观看导航| 激情视频小说图片| 欧美日韩精品免费观看视欧美高清免费大片 | 亚洲欧美在线磁力| 五月天激情丁香| 丝袜国产日韩另类美女| 91精品久久久久久蜜桃| 国产精品ⅴa有声小说| 午夜精品福利视频网站| 亚洲一区日韩精品| 亚洲老女人视频免费| 欧美激情中文字幕乱码免费| 91女人18毛片水多国产| 久久久www成人免费无遮挡大片| 久久久久久久久久久综合| 日本黄色成人| 中文字幕在线视频日韩| 中文字幕激情小说| 成人av资源网站| 色一情一乱一乱一区91| 国产精品久久久久77777丨| 日韩大陆欧美高清视频区| 九九视频在线观看| 韩国成人福利片在线播放| 色一情一区二区三区四区| 国内激情视频在线观看| 精品三级在线看| 精品无码久久久久成人漫画 | 国产美女视频免费看| 视频一区在线观看| 欧美一级大片视频| 五月婷婷在线观看视频| 午夜精品爽啪视频| 无码人妻一区二区三区在线| 欧美视频日韩| 成人精品一二区| 最新av在线播放| 91麻豆精品久久久久蜜臀| 日本二区三区视频| 另类专区欧美蜜桃臀第一页| 亚洲欧洲一区二区| 国产亚洲精彩久久| 日韩在线观看高清| 国产又黄又爽视频| 亚洲私人影院在线观看| 男人午夜视频在线观看| 亚洲最新av| 999日本视频| 18网站在线观看| 日韩欧美激情一区| 国产一级特黄aaa大片| av在线不卡观看免费观看| 国产精品免费入口| 国产成人1区| 国产精品久久久久久亚洲影视 | 久久久久久久综合| 国产精品乱码久久久久| 日本不卡二三区| 成人网中文字幕| 深夜国产在线播放| 亚洲国产天堂久久综合网| 欧美三级日本三级| 99久久久无码国产精品| av片中文字幕| 久久在线视频免费观看| 91天堂在线观看| f2c人成在线观看免费视频| 日韩精品在线免费观看| 中文字幕一区二区三区波野结 | 亚洲欧美日韩一区二区三区在线| 天天射天天干天天| 最新国产精品久久精品| 中文字幕永久免费| 麻豆精品网站| 永久久久久久| 日本精品影院| 国产日韩综合一区二区性色av| 一区二区三区伦理| 精品无码久久久久久国产| 中文字幕第一页在线播放| 亚洲综合偷拍欧美一区色| 97伦伦午夜电影理伦片| 精品在线你懂的| 国产黄色片免费在线观看| 国产在视频线精品视频www666| 亚洲free嫩bbb| 伊人久久视频| 欧美成年人视频网站| 四虎精品在永久在线观看| 欧美精品日韩一区| 欧美另类一区二区| 中文字幕亚洲欧美在线不卡| 国产艳俗歌舞表演hd| 国产一区激情在线| 免费日韩中文字幕| 欧美日韩三级电影在线| 日韩在线观看电影完整版高清免费| 日本成人精品| 国产精品丝袜高跟| 婷婷电影在线观看| 欧美黑人极品猛少妇色xxxxx | 九九九久久久久久| www在线播放| 亚洲国产成人av在线| 国产一区二区三区在线观看 | 久久久av一区| 国产在线视频福利| 精品福利二区三区| 99精品人妻无码专区在线视频区| 日本高清免费不卡视频| 日本最新中文字幕| 亚洲九九爱视频| 少妇视频一区二区| 中文字幕精品在线不卡| 国产精品三级在线观看无码| 国产69精品久久99不卡| 视频免费1区二区三区| 日韩一区精品视频| 天天摸天天碰天天添| 99在线热播精品免费99热| 草草草视频在线观看| 91亚洲国产成人久久精品| 青青草国产精品| 亚洲人成伊人成综合图片| 狠狠色狠狠色综合人人| 国产精品巨作av| 成人资源av| 亚洲精品在线a| www.久久久| 亚洲1区在线| 91免费版网站在线观看| 欧美国产亚洲精品| 成人在线一区二区| 白嫩亚洲一区二区三区| 国产综合久久久久| 香蕉成人在线| 91麻豆桃色免费看| 成人免费观看49www在线观看| 国产精品一区二区久久精品| 韩国理伦片久久电影网| 国产精品偷伦免费视频观看的| 精品亚洲美女网站| 国产精品99久久久久久人| 性欧美gay| 国产精品久久色| 亚洲欧洲一二区| 91在线视频精品| 免费看日产一区二区三区| 91成人理论电影| 成人爽a毛片免费啪啪红桃视频| 国产免费一区| 亚州av一区| 三区精品视频观看| 亚洲91精品| 免费在线黄网站| 国产亚洲毛片| 一本岛在线视频| 国内精品国产三级国产a久久| 日本黄色www| 成人av免费在线播放| 人妻精品久久久久中文字幕| 国产亚洲精品中文字幕| 一级免费黄色录像| 亚洲高清免费一级二级三级| 五月婷婷亚洲综合| 欧美日韩精品欧美日韩精品一 | 国产亚洲精品久久久久动| 日本不卡三区| 欧美激情亚洲另类| 超碰一区二区| 91情侣偷在线精品国产| eeuss国产一区二区三区四区| 欧美激情国产日韩| 久久久久免费av| 欧洲黄色一级视频| 久久精品国产**网站演员| 日本成人在线免费| 国产偷v国产偷v亚洲高清| 性欧美videos| 欧美性xxxx在线播放| 国产精品九九九九| 亚洲黄色片网站| 日本在线观看视频| 97视频在线观看免费| 成人免费视频观看| 狠狠色综合欧美激情| 久久亚洲专区| 男人的天堂99| 国产高清亚洲一区| 久久久久无码精品国产sm果冻| 亚洲黄一区二区三区| 日韩黄色片网站| 欧美mv日韩mv国产网站app| 国产youjizz在线| 欧美精品xxx| 人人精品久久| 日本高清久久一区二区三区| 欧美天天在线| 污污的视频免费观看| 久久综合久久鬼色中文字| 青娱乐国产在线视频| 欧美亚洲日本一区| 天堂网2014av| 美女少妇精品视频| 欧美日韩五区| 久久久久久九九九九| 欧美在线网址| 污污动漫在线观看| 久久久久久久久蜜桃| 久久久久久激情| 91精品午夜视频| 91精品国产综合久久久久久豆腐| 欧美性视频网站| 国内自拍欧美| 青青青在线观看视频| 久久国产麻豆精品| 国产又粗又猛又爽又黄av| 午夜国产精品影院在线观看| 亚洲精品视频91| 欧美成人网在线| 国产一区2区在线观看| 亚洲成人网上| 青青草国产精品97视觉盛宴| 国产精品扒开腿做爽爽爽a片唱戏 亚洲av成人精品一区二区三区 | 成人三级黄色免费网站| 欧美有码在线观看视频| 国内精品麻豆美女在线播放视频 | 国产精品伊人日日| 欧美成人一区二免费视频软件| 国产美女视频免费看| 成人免费在线播放视频| 91精品国产乱码久久久| 中文字幕一区二区精品| 国产一区二区主播在线| 欧美另类网站| 天堂影院一区二区| 婷婷色一区二区三区| 色激情天天射综合网| 国产女主播在线直播| 国产精品久久久久久久久久99| 精品freesex老太交| 黄色免费网址大全| 中文一区二区完整视频在线观看| 无码人妻一区二区三区线| 国产亚洲精品91在线| yy6080久久伦理一区二区| 亚洲视频电影| 国模娜娜一区二区三区| 免看一级a毛片一片成人不卡| 日韩欧美国产一区在线观看| 国产羞羞视频在线播放| 精品福利影视| 葵司免费一区二区三区四区五区| 女人十八毛片嫩草av| 欧美日韩成人综合在线一区二区| 美女黄视频在线观看| 91视频免费在线| 欧美激情四色| 亚洲观看黄色网| 色94色欧美sute亚洲13| 一级毛片视频在线观看| 91免费精品国偷自产在线| 欧美日韩视频| 人妻熟女aⅴ一区二区三区汇编| 日本高清免费不卡视频| 国产精品va在线观看视色| 国产91视觉| 三级亚洲高清视频| 免费精品在线视频| 亚洲第一视频网| 成人不卡视频| 亚洲啊啊啊啊啊| 2020国产精品自拍| 国产又粗又猛视频| 久久久久久久久久久国产| 精品国产精品| 黑人性生活视频| 91福利在线播放| 男女在线视频| 日本精品一区二区三区视频 | 在线免费观看日韩av| 欧美日韩国产一级二级| 99爱在线视频| 亚洲综合欧美日韩| 成人午夜在线视频| 中国女人一级一次看片| 亚州欧美日韩中文视频| 97精品国产一区二区三区| 亚洲精品中文字幕在线播放|