精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何改進Agents的推理與規(guī)劃?

發(fā)布于 2024-7-26 11:45
瀏覽
0收藏

如果你詢問任何正在使用大型語言模型(LLM)構建智能代理的開發(fā)者,他們很可能會告訴你,智能代理在規(guī)劃和推理方面的不足是影響其可靠性的一個主要問題。

  • 智能代理的規(guī)劃究竟是什么?
  • 目前人們是如何克服這一缺陷的?
  • 我們對智能代理未來規(guī)劃和推理的發(fā)展趨勢有何預測?

接下來的文章將一一解答這些問題。

編輯注:本文經(jīng)翻譯并二次整理自planning-for-agents一文。

規(guī)劃和推理的真正含義是什么?

智能代理的規(guī)劃和推理,指的是它如何思考并決定采取哪些行動,這既包括短期行動也包括長期行動。LLM需要評估所有可用信息,然后決定需要采取哪些步驟,以及當前應該首先執(zhí)行哪一步。

大多數(shù)情況下,開發(fā)者會使用函數(shù)調(diào)用技術來讓LLM選擇要執(zhí)行的行動。這項技術最初由OpenAI在2023年6月引入,隨后在2023年末至2024年初被其他公司采納。通過函數(shù)調(diào)用,開發(fā)者可以為不同的函數(shù)提供JSON格式的模式,并讓LLM生成符合這些模式的對象。

函數(shù)調(diào)用主要用于讓智能代理選擇立即要執(zhí)行的行動。然而,要成功完成一個復雜的任務,通常需要按照順序執(zhí)行一系列行動。對于LLM來說,進行長期規(guī)劃和推理是一項更具挑戰(zhàn)性的任務,原因有二:首先,LLM需要考慮一個長期目標,然后迅速回到需要立即執(zhí)行的短期行動;其次,隨著智能代理執(zhí)行的行動越來越多,這些行動的結果會反饋給LLM,導致上下文窗口擴大,可能會使LLM分心,影響其性能。

和LLM世界中的大多數(shù)事物一樣,很難準確衡量當前模型在規(guī)劃和推理方面的表現(xiàn)。有一些合理的基準測試,比如Berkeley Function Calling Leaderboard,用于評估函數(shù)調(diào)用的能力。我們也進行了一些研究,以評估多步驟應用的效果。但最好的方法是為你的特定問題構建一個評估集,并嘗試自己進行評估。

??根據(jù)經(jīng)驗,我們可以得出一個普遍的結論:規(guī)劃和推理目前還沒有達到現(xiàn)實世界任務所需的水平。

如何改進智能代理的規(guī)劃能力?

改進智能代理規(guī)劃能力的一個簡單方法是確保LLM擁有進行合理規(guī)劃和推理所需的所有必要信息。雖然這聽起來很基礎,但實際上,傳入LLM的提示往往沒有包含足夠的信息。增加一個檢索步驟或澄清提示指令,可以輕松地實現(xiàn)改進。這就是為什么實際查看數(shù)據(jù)并了解LLM實際看到的內(nèi)容至關重要。

接下來,我建議你嘗試改變你的應用程序的認知架構。這里所說的“認知架構”,指的是你的應用程序用于推理的數(shù)據(jù)工程邏輯。你可以考慮兩種類型的認知架構來提高推理能力:通用認知架構和特定領域認知架構。

通用認知架構與特定領域認知架構

通用認知架構試圖以一種通用的方式實現(xiàn)更好的推理,可以應用于任何任務。例如,“計劃和解決”架構,這篇論文提出了一種先制定計劃,然后執(zhí)行計劃中每個步驟的架構。另一個例子是Reflexion架構,這篇論文探討了在智能代理完成任務后增加一個明確的“反思”步驟,以評估任務是否完成得當。

盡管這些想法顯示出了一定的改進,但它們通常對于生產(chǎn)環(huán)境中的智能代理來說過于通用。相反,我們看到智能代理通常采用特定領域的認識架構。這通常體現(xiàn)在特定領域的分類/路由步驟、特定領域的驗證步驟等方面。一些關于規(guī)劃和反思的通用思想可以在這里應用,但它們通常是以特定領域的方式應用的。

以AlphaCodium論文為例,它通過使用所謂的“流程工程”(談論認知架構的另一種方式),實現(xiàn)了最先進的性能。下面是一個他們使用的流程圖。

如何改進Agents的推理與規(guī)劃?-AI.x社區(qū)AlphaCodium流程圖

這個流程非常特定于他們試圖解決的問題。他們告訴智能代理按步驟做什么 - 想出測試,然后想出解決方案,然后迭代更多的測試等。這種認知架構高度特定于領域 - 它不會幫助您寫文章,例如。

為什么特定領域認知架構如此有幫助?

我傾向于從兩個角度來看待這個問題。

首先:你可以將這視為向智能代理傳達它應該做什么的另一種方法。你可以通過提示指令或在代碼中硬編碼特定的轉換來傳達指令。任何一個都是有效的!代碼是極好的傳達你想要發(fā)生的事情的方式。

其次:這本質上是從我們作為工程師的角度,將規(guī)劃責任從LLM中移除。我們基本上是在說:“不用擔心規(guī)劃,LLM,我會為你做的!”當然,我們并沒有從LLM中移除所有的規(guī)劃,因為我們?nèi)匀灰笏谀承┣闆r下進行一些規(guī)劃。

例如,讓我們回顧一下上面的AlphaCodium示例。流程中的步驟基本上是我們?yōu)長LM做的規(guī)劃!我們告訴它首先編寫測試,然后編寫代碼,然后運行測試等。這可能是作者認為編寫軟件的好計劃。如果他們正在計劃如何解決一個問題,這就是他們會怎么做的。而不是在提示中告訴LLM - 它可能會忽略它,不理解它,沒有所有細節(jié) - 他們通過構建特定領域的認識架構來告訴系統(tǒng)要做什么。

??我們看到的幾乎所有高級“智能代理”實際上都有一個非常特定領域和自定義的認知架構。

我們正在使用LangGraph使構建這些自定義認知架構變得更容易。LangGraph的一個主要關注點是可控性。我們設計LangGraph非常低級和高度可控 - 這是因為我們看到這種可控性是100%需要創(chuàng)建可靠的自定義認知架構。

規(guī)劃和推理的未來會是什么樣子?

LLM領域一直在迅速變化和發(fā)展,我們在構建應用程序時,尤其是構建工具時,應該牢記這一點。

我目前的立場是,通用推理將越來越多地被吸收到模型層中。模型將變得越來越智能,無論是通過規(guī)模還是研究突破 - 似乎很愚蠢去反對這一點。模型也會變得更快,更便宜,所以將大量上下文傳遞給它們將變得越來越可行。

然而,我相信無論模型變得多么強大,你總是需要以某種形式向智能代理傳達它應該做什么。因此,我相信提示和自定義架構將一直存在。對于簡單任務,提示可能就足夠了。對于更復雜的任務,您可能希望將它應該如何行為的邏輯放在代碼中。代碼優(yōu)先方法可能更快,更可靠,更易于調(diào)試,并且通常更容易/更符合邏輯地表達。

我最近在播客上與Sequoia的Sonya和Pat討論了這個話題。他們畫了一個很好的圖表,展示了提示、認知架構和模型的角色/重要性可能如何隨時間演變。

如何改進Agents的推理與規(guī)劃?-AI.x社區(qū)圖片

所以,盡管LLM的規(guī)劃和推理肯定會變得更好,我們也堅信,如果您正在構建特定任務的智能代理,那么您將需要構建一個自定義認知架構。

本文轉載自 ??AI小智??,作者: AI小智

收藏
回復
舉報
回復
相關推薦
日本aⅴ亚洲精品中文乱码| 亚洲视频自拍| 欧美国产综合一区二区| 成人性生交xxxxx网站| 久久久综合久久久| 深爱激情综合| 欧美成人官网二区| 波多野结衣天堂| 国产黄色大片在线观看| 久久久久88色偷偷免费| 91手机在线播放| 国内自拍视频在线播放| 欧美在线网站| 中文字幕日韩视频| 无码人妻aⅴ一区二区三区| 91麻豆精品| 色激情天天射综合网| 日韩视频一二三| 中文字幕在线观看日本| 97精品电影院| 国产精品露出视频| 一区二区三区日| 国产日韩欧美一区在线 | 午夜在线激情影院| 国产日韩视频一区二区三区| 精品伊人久久大线蕉色首页| 国产男男gay网站| 琪琪一区二区三区| 欧美亚洲国产视频| 国产午夜免费视频| 欧美成人首页| 久久这里有精品视频| 美女100%露胸无遮挡| 色吊丝一区二区| 精品国产3级a| 成人做爰69片免费| 久久久精品区| 欧美一区在线视频| 亚洲一区二区三区观看| av老司机在线观看| 国产精品久久久久久久久免费相片| 久久久久久久久久码影片| 亚洲av无码国产精品永久一区 | 亚洲国产精品狼友在线观看| 白嫩亚洲一区二区三区| 777午夜精品免费视频| 色综合色综合色综合色综合| av成人亚洲| 欧美私模裸体表演在线观看| 国产精品亚洲二区在线观看| 欧美少妇网站| 色噜噜久久综合| 粗暴91大变态调教| 亚洲爱爱视频| 欧美人妇做爰xxxⅹ性高电影| 亚洲欧美国产中文| 96sao精品免费视频观看| 欧美夫妻性生活| 三级av免费看| 婷婷视频一区二区三区| 亚洲成**性毛茸茸| 亚洲精品在线视频免费观看| 五月天亚洲一区| 亚洲色图五月天| 懂色av粉嫩av浪潮av| 999国产精品视频| 久久天天躁日日躁| 免费人成视频在线| 国产欧美日韩一区二区三区在线| 538国产精品一区二区免费视频 | 精品久久精品久久| 日本在线一二三| 中文字幕欧美日韩一区| 浴室偷拍美女洗澡456在线| 污污片在线免费视频| 亚洲曰韩产成在线| 欧美亚洲另类色图| 欧美一区二区三区婷婷| 精品精品欲导航| 成人免费看aa片| 久久性感美女视频| 久久久久久国产精品| 91精品国产综合久久久蜜臀九色| 日韩影院精彩在线| 99国产超薄肉色丝袜交足的后果| 日本福利在线观看| 中文字幕佐山爱一区二区免费| 91大学生片黄在线观看| 自拍视频在线看| 欧美军同video69gay| 国产高清成人久久| 日韩大片在线观看| 久久免费视频这里只有精品| 国偷自拍第113页| 久久精品国产精品亚洲综合| 国产欧美欧洲| 在线免费观看黄| 精品欧美aⅴ在线网站| 在线观看国产中文字幕| 久久精品福利| 久久成人av网站| 日本视频免费观看| 成人一区二区三区| 一区二区三区国| 亚洲啊v在线| 91精品国产色综合久久不卡电影| 国产精品无码一区二区三区| 欧美在线网站| 91精品久久久久久久| 天堂影院在线| 一级日本不卡的影视| 午夜欧美福利视频| 校花撩起jk露出白色内裤国产精品 | 一本精品一区二区三区| 国产精品久久久久秋霞鲁丝 | 中文字幕日韩视频| 毛片视频网站在线观看| 国产aⅴ综合色| 樱花www成人免费视频| 国产高清不卡| 亚洲精品一区二区三区香蕉| 在线免费看av网站| 免费成人在线影院| 日韩精品久久久| 成人性生活视频| 亚洲高清久久网| 欧美精品一区二区成人| 精品一区二区三区免费观看| 亚洲 国产 欧美一区| 韩国美女久久| 亚洲欧美国产日韩中文字幕| 五月婷婷激情网| 国产99精品国产| 97久久国产亚洲精品超碰热 | 久久久久久草| 超碰97免费在线| 日韩精品在线看片z| 视频这里只有精品| 黄网站免费久久| 中文字幕中文字幕一区三区| 粉嫩91精品久久久久久久99蜜桃 | 成年女人在线看片| 精品对白一区国产伦| 国产亚洲精品码| 成人午夜精品在线| 精品视频在线观看一区| 福利片在线一区二区| 97激碰免费视频| 少妇av一区二区| 精品久久久久久久久久久久久久 | 亚洲综合成人在线| 美女伦理水蜜桃4| 中文高清一区| 免费试看一区| 成人国产精品一区二区免费麻豆| 一级做a爰片久久毛片美女图片| 男操女视频网站| 国产精品丝袜久久久久久app| 污污动漫在线观看| 一本一道久久综合狠狠老| 97超碰资源| 欧美另类老肥妇| 亚洲视频欧美视频| 伊人精品在线视频| 亚洲精品第一国产综合野| 国产高潮失禁喷水爽到抽搐| 9久re热视频在线精品| 日韩精品欧美专区| 国产视频一区二| 97色在线观看免费视频| 成人亚洲综合天堂| 欧美一级午夜免费电影| 国产一级二级三级视频| 91麻豆免费观看| 五月激情五月婷婷| 韩国亚洲精品| 欧美一区二区影视| avtt久久| 欧美性一区二区三区| 在线免费观看黄色av| 亚洲成人激情视频| 精品久久久久久久久久久久久久久久| ㊣最新国产の精品bt伙计久久| 一级黄色电影片| 懂色av一区二区| 久久综合久久综合久久| 无码aⅴ精品一区二区三区浪潮| 美女毛片一区二区三区四区| 国产欧美日韩中文字幕| 里番在线播放| 亚洲一二三在线| www.av毛片| 日韩欧美精品一区| 国产精华一区二区三区| 国产一区二区三区影视| 欧美日韩国产成人在线| 精品影院一区| 欧美α欧美αv大片| 最新黄色网址在线观看| 亚洲国产日日夜夜| 日本一级片免费| 久久免费看少妇高潮| 性生交大片免费看l| 日韩av一区二区三区四区| 91黄色在线看| 91精品国产福利在线观看麻豆| 久久伦理网站| jizz性欧美23| 91视频免费在线| av一区在线| 91av国产在线| 秋霞在线午夜| 欧美精品性视频| 无遮挡的视频在线观看| 亚洲免费视频网站| 日本高清视频免费观看| 日韩一级高清毛片| 国产又粗又猛又黄| 欧美在线一二三| 国产免费观看av| 亚洲大片一区二区三区| 久久精品国产69国产精品亚洲| av直播在线观看| 国产精品资源在线观看| 久久久精品麻豆| 亚洲免费婷婷| 极品粉嫩国产18尤物| 久久激情五月激情| 国产精品1024| 成人在线激情网| 亚洲精品社区| 国产青草视频在线观看| 99精品视频在线观看播放| 日韩欧美激情一区二区| 奇米色欧美一区二区三区| 久久久久久亚洲精品不卡4k岛国| 成人偷拍自拍| 国产91社区| 国产精品白丝av嫩草影院| 99久久精品免费看国产一区二区三区| 国产精品免费精品自在线观看| 国产日韩中文在线| 日韩一区中文| 91精品视频在线| 欧美日韩国产一区二区在线观看| 91成人伦理在线电影| 99re6热只有精品免费观看| 99久久综合狠狠综合久久止| 66精品视频在线观看| www国产亚洲精品| 国产精品18hdxxxⅹ在线| 精品999在线观看| 亚洲精品无吗| 日韩精品欧美一区二区三区| 91麻豆国产自产在线观看亚洲| 一区二区精品在线观看| 中文字幕一区二区三三| 成人性生活视频免费看| 亚洲一区中文| 中文字幕永久视频| 韩国av一区二区三区四区| 午夜诱惑痒痒网| 丁香亚洲综合激情啪啪综合| 青青草视频成人| 国产免费久久精品| 波多野结衣爱爱视频| 亚洲国产毛片aaaaa无费看 | 九九精品久久久| 国产原创一区二区三区| 日韩少妇一区二区| 久久久久亚洲蜜桃| 人人澡人人澡人人看| 亚洲国产精品人人做人人爽| 欧美性猛交bbbbb精品| 欧美精品日韩精品| 丰满少妇被猛烈进入| 国产视频精品一区二区三区| av电影在线网| 欧美激情视频网站| 日日夜夜天天综合| 91九色偷拍| 免费看av成人| 糖心vlog在线免费观看| 亚洲欧美清纯在线制服| 欧美成人乱码一二三四区免费| 成人国产精品免费观看动漫| 无码人妻精品一区二区中文| 亚洲女女做受ⅹxx高潮| 日韩视频在线观看一区| 91麻豆精品91久久久久同性| 神马久久久久| 欧美高跟鞋交xxxxxhd| 激情亚洲影院在线观看| 99久久一区三区四区免费| 精品中文字幕一区二区三区av| 天天在线免费视频| 日韩av电影一区| 少妇被狂c下部羞羞漫画| 国产精品高潮久久久久无| www.com国产| 精品美女在线播放| 黄色小网站在线观看| 国产97在线|亚洲| 成人av综合网| 最新av网址在线观看| 日本欧美一区二区| 无码精品一区二区三区在线播放| 亚洲日本乱码在线观看| 亚洲午夜无码久久久久| 亚洲精品国产成人| 成人免费看片| 国产精品三级美女白浆呻吟| 天堂综合网久久| 97干在线视频| 国产凹凸在线观看一区二区| 永久免费未视频| 欧美性生活久久| 可以直接在线观看的av| 久久久亚洲天堂| 亚洲三区欧美一区国产二区| 一区二区视频国产| 免费看日韩精品| 中文字幕第20页| 色素色在线综合| 日韩精品一二| 日本国产精品视频| 日韩三级av| 每日在线更新av| 91小视频在线观看| 亚洲午夜18毛片在线看| 亚洲国产小视频在线观看| 国产精品69xx| eeuss一区二区三区| 亚洲天堂免费| 国产又黄又嫩又滑又白| 亚洲另类在线视频| 国产极品久久久| 欧美精品情趣视频| 97一区二区国产好的精华液| 国产玉足脚交久久欧美| 成人高清视频免费观看| 日韩成年人视频| 精品亚洲精品福利线在观看| 波多野结衣久久精品| 欧美一级二级三级| 日韩国产欧美在线观看| 亚洲欧美va天堂人熟伦| 欧美日高清视频| 巨大荫蒂视频欧美另类大| 亚洲精品日韩激情在线电影| 欧美视频在线观看| 亚洲麻豆一区二区三区| 欧美午夜无遮挡| 国产网站在线播放| 91精品久久久久久久久久久久久| 91偷拍一区二区三区精品| 亚洲女人在线观看| 亚洲成人免费av| 免费国产在线视频| 国产精品毛片a∨一区二区三区|国| 日韩久久电影| 丰满人妻一区二区三区大胸| 午夜久久电影网| 国产黄在线看| 91网站在线免费观看| 伊人久久大香线蕉综合热线 | 涩涩视频免费看| 日本一区二区在线免费播放| 成人久久综合| 无码国产精品久久一区免费| 疯狂做受xxxx欧美肥白少妇 | 欧美国产日韩在线| 老司机精品视频在线播放| 国产精品天天av精麻传媒| ㊣最新国产の精品bt伙计久久| 免费看av毛片| 国产精品18久久久久久首页狼| 亚洲在线久久| 玖草视频在线观看| 欧美精品久久99| 123区在线| 亚洲一区二区三区精品动漫| 国产98色在线|日韩| 欧美超碰在线观看| 欧美日韩福利视频| 精品久久久久久久久久久aⅴ| 精品国产aⅴ一区二区三区东京热| 色综合久久综合网97色综合| 菠萝菠萝蜜在线视频免费观看| 久久精品成人一区二区三区蜜臀| 蜜臀av国产精品久久久久| 国产网址在线观看| 中文字幕久热精品在线视频| 国产精品美女在线观看直播| 一级在线免费视频| 亚洲成人动漫一区| 久久综合网导航| 日韩国产在线一区| www.av亚洲| 国产91视频在线|