精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ACL 2025 | 大模型亂試錯(cuò)、盲調(diào)用?KnowSelf讓智能體有「知識(shí)邊界感知」能力

人工智能 新聞
本文提出的 KnowSelf 方法為智能體規(guī)劃提供了新思路,初步探索了智能體知識(shí)邊界感知這一問(wèn)題。

在 AI 領(lǐng)域,大模型智能體的發(fā)展日新月異。我們今天要介紹的這篇 ACL 2025 論文——《Agentic Knowledgeable Self-awareness》,聚焦于如何提升智能體的「知識(shí)邊界感知」能力,使其在復(fù)雜任務(wù)規(guī)劃中更加得心應(yīng)手,為智能體的可靠應(yīng)用提供了新思路。

圖片

30 秒速讀版本

KnowSelf 聚焦于大模型智能體在決策過(guò)程中所面臨的「知識(shí)邊界感知」問(wèn)題。受人類(lèi)決策機(jī)制啟發(fā),本文指出智能體應(yīng)具備三類(lèi)行為模式的自主決策能力:快速反應(yīng)(快思考)、深度推理(慢思考),以及主動(dòng)調(diào)用外部工具(本文以外部知識(shí)增強(qiáng)為例)。

KnowSelf 通過(guò)學(xué)習(xí)自身的知識(shí)邊界,使智能體能在不同情境下自主判斷是否具備足夠知識(shí)進(jìn)行生成和推理,以減少無(wú)效試錯(cuò)與知識(shí)濫用。實(shí)驗(yàn)表明,KnowSelf 可提升智能體的知識(shí)調(diào)用準(zhǔn)確率、任務(wù)規(guī)劃效率和跨任務(wù)泛化能力。

研究背景:智能體規(guī)劃的困境

大模型智能體在諸多領(lǐng)域展現(xiàn)出巨大潛力,但現(xiàn)有智能體規(guī)劃方法存在弊端。傳統(tǒng)方法多采用「盲目灌輸」模式,將標(biāo)準(zhǔn)軌跡、外部反饋和領(lǐng)域知識(shí)無(wú)差別地注入智能體模型,完全忽視了人類(lèi)決策過(guò)程中至關(guān)重要的「自我認(rèn)知」原則。

這種「無(wú)腦式」灌輸導(dǎo)致智能體在面對(duì)意外信號(hào)時(shí)極易崩潰,陷入模式崩塌困境,且過(guò)度試錯(cuò)與盲目知識(shí)融合在實(shí)際場(chǎng)景中往往不可行,還會(huì)大幅推高模型推理成本。

人類(lèi)在決策時(shí),會(huì)根據(jù)面臨的情境動(dòng)態(tài)評(píng)估自身狀態(tài),靈活調(diào)整策略。比如,當(dāng)我們遇到簡(jiǎn)單問(wèn)題時(shí),能迅速做出判斷并行動(dòng);遇到棘手問(wèn)題,會(huì)放慢思考節(jié)奏,深入分析;而面對(duì)超出自身能力范圍的問(wèn)題,會(huì)主動(dòng)尋求外部知識(shí)或幫助。

然而,當(dāng)前大模型智能體普遍缺乏這種「知識(shí)邊界感知」能力,導(dǎo)致規(guī)劃行為低效且脆弱。

核心方法:KnowSelf 框架

為破解這一難題,論文提出了智能體「知識(shí)邊界感知」的思路,并基于此設(shè)計(jì)了數(shù)據(jù)驅(qū)動(dòng) KnowSelf 方法,讓大模型智能體能夠自主調(diào)節(jié)知識(shí)的運(yùn)用。

圖片

  • 知識(shí)系統(tǒng)構(gòu)建

對(duì)于外部工具(知識(shí)),并采用了一種簡(jiǎn)單高效知識(shí)收集方法,以極低成本完成知識(shí)庫(kù)的離線構(gòu)建。該知識(shí)系統(tǒng)由知識(shí)庫(kù)和知識(shí)選擇模塊組成,其中知識(shí)庫(kù)包含一系列知識(shí)條目,知識(shí)選擇模塊能依據(jù)智能體歷史軌跡從知識(shí)庫(kù)中精準(zhǔn)挑選所需知識(shí)。這種設(shè)計(jì)兼顧了知識(shí)系統(tǒng)的實(shí)用性和高效性。

  • 情境判斷標(biāo)準(zhǔn)

論文基于智能體的能力,將情境劃分為三類(lèi):快速思考(Fast Thinking)、慢速思考(Slow Thinking)和知識(shí)型思考(Knowledgeable Thinking)。并提出了啟發(fā)式情境判斷標(biāo)準(zhǔn),用于標(biāo)記智能體自我探索軌跡中的特殊標(biāo)記,從而針對(duì)智能體的能力構(gòu)建出訓(xùn)練數(shù)據(jù),為后續(xù)訓(xùn)練奠定基礎(chǔ)。

a.快思考:智能體無(wú)需多慮,能直接給出正確行動(dòng)

b.慢思考:智能體雖能給出正確行動(dòng),但需經(jīng)過(guò)多步思考與反思

c.知識(shí)型思考:智能體自身無(wú)法提供正確行動(dòng),必須借助外部知識(shí)輔助思考

  • 自我認(rèn)知訓(xùn)練

KnowSelf 采用雙階段訓(xùn)練過(guò)程,先通過(guò)監(jiān)督式微調(diào)(SFT),讓智能體模型初步掌握自我認(rèn)知規(guī)劃模式;再引入 RPO 損失函數(shù),進(jìn)一步強(qiáng)化自我認(rèn)知能力。在這一體系下,智能體會(huì)生成特定特殊標(biāo)記,表明其對(duì)情境的判斷,在推理過(guò)程中實(shí)現(xiàn)知識(shí)查詢(xún)與反思的精準(zhǔn)調(diào)控。

實(shí)驗(yàn)成果

本文在兩個(gè)模擬大模型智能體規(guī)劃數(shù)據(jù)集 ALFWorld 和 WebShop 上,對(duì) KnowSelf 進(jìn)行了全面評(píng)估,涵蓋 Llama-8B 和 Gemma-2B 兩個(gè)不同規(guī)模的模型。實(shí)驗(yàn)結(jié)果顯示,KnowSelf 憑借極少的反思和知識(shí)使用,性能優(yōu)于多種基線方法。

圖片

圖片

與無(wú)知識(shí)基線方法對(duì)比,KnowSelf 在 Llama-8B 和 Gemma-2B 模型上均展現(xiàn)出卓越性能。與知識(shí)增強(qiáng)型基線方法相比,KnowSelf 僅用少量知識(shí),就超越了所有的 100% 知識(shí)增強(qiáng)基線方法,充分證明了并非知識(shí)越多越好,精準(zhǔn)的知識(shí)引入機(jī)制才是關(guān)鍵。

進(jìn)一步分析:深入探索智能體自我認(rèn)知

  • 智能體規(guī)劃模式過(guò)擬合

圖片

本文通過(guò)消融實(shí)驗(yàn),發(fā)現(xiàn)僅在標(biāo)準(zhǔn)軌跡上訓(xùn)練的模型更易陷入模式擬合,而引入反思和知識(shí)邊界感知后,智能體規(guī)劃能力提升。這表明,在許多情況下,智能體并非不能做出正確決策,而是受限于規(guī)劃模式。此外,過(guò)度引入知識(shí)可能會(huì)對(duì)性能產(chǎn)生負(fù)面影響,因此凸顯了精準(zhǔn)知識(shí)引入機(jī)制的重要性。

  • 智能體規(guī)劃泛化能力

圖片

在泛化能力測(cè)試中,KnowSelf 在 ALFWorld 的三項(xiàng)挑戰(zhàn)性任務(wù)上表現(xiàn)優(yōu)異,優(yōu)于基于提示的基線方法 Reflexion。這表明 KnowSelf 能有效打破傳統(tǒng)規(guī)劃軌跡訓(xùn)練的局限,使模型具備跨任務(wù)情境感知能力,在未見(jiàn)過(guò)的任務(wù)上能靈活運(yùn)用反思和知識(shí)引入策略。

  • 模型與數(shù)據(jù)規(guī)模影響

圖片

隨著模型規(guī)模擴(kuò)大和自我認(rèn)知訓(xùn)練數(shù)據(jù)量增加,KnowSelf 性能穩(wěn)步提升。當(dāng)自我認(rèn)知訓(xùn)練數(shù)據(jù)相對(duì)比例低于 40% 時(shí),模型性能可能出現(xiàn)波動(dòng)甚至下降,推測(cè)模型需達(dá)到一定自我認(rèn)知水平才能穩(wěn)定發(fā)揮效能。

  • 智能體自我認(rèn)知機(jī)制機(jī)理

圖片

本文在 Transformer 模型的各層計(jì)算不同情境標(biāo)記的平均概率,發(fā)現(xiàn) Reflection 標(biāo)記概率始終為零,Knowledge 標(biāo)記和 Action 標(biāo)記在模型最后幾層才出現(xiàn)。這表明智能體在內(nèi)部決策時(shí),僅在最后幾層隱藏層才決定是否調(diào)用外部知識(shí),且調(diào)用知識(shí)的決策可能更晚出現(xiàn),暗示智能體在 Token 空間內(nèi)通過(guò)隱式獎(jiǎng)勵(lì)引導(dǎo)進(jìn)行探索,最終做出決策。

結(jié)論與展望

本文提出的 KnowSelf 方法為智能體規(guī)劃提供了新思路,初步探索了智能體知識(shí)邊界感知這一問(wèn)題。在后 R1 時(shí)代,隨著 Search-R1、ReSearch、Deep Researcher 等工作的出現(xiàn),基于 RL 的智能體自主知識(shí)獲取工作展現(xiàn)了巨大的前景,KnowSelf 還只是在這個(gè)時(shí)代之前的初步產(chǎn)物,相信隨著技術(shù)的發(fā)展,基于 RL 的智能體自我認(rèn)知能迸發(fā)更大的活力。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-06-05 11:49:21

AI模型數(shù)據(jù)

2023-09-05 14:43:15

2025-11-06 01:20:00

2025-11-06 01:44:00

2025-03-03 11:16:18

2025-02-08 14:10:00

模型系統(tǒng)AI

2022-06-21 14:08:25

AIGitHub模仿人類(lèi)

2025-05-15 09:56:32

2024-09-04 13:40:00

2023-08-28 06:52:29

2025-10-29 02:11:00

2025-04-01 08:05:00

智能體人工智能MCP

2024-07-08 09:49:54

2025-04-02 08:40:00

人工智能大模型AI

2024-05-29 12:13:50

2025-02-24 14:30:00

模型生成訓(xùn)練

2023-11-03 07:25:56

語(yǔ)言模型知識(shí)圖譜
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美日韩免费一区二区三区视频| 激情综合色丁香一区二区| 精品亚洲夜色av98在线观看| 性欧美极品xxxx欧美一区二区| eeuss影院www在线播放| 九九国产精品视频| 97国产真实伦对白精彩视频8| 超碰97在线资源站| 久久国产三级| 精品福利在线看| 伊人久久大香线蕉成人综合网| 亚洲成人黄色片| 石原莉奈在线亚洲二区| 欧美插天视频在线播放| 91网站免费入口| 最新国产一区二区| 欧美性xxxxx极品少妇| 国产91沈先生在线播放| 99re在线视频| 91视视频在线直接观看在线看网页在线看| 国产精品揄拍一区二区| 日本免费观看视| 亚洲最新av| 在线看欧美日韩| 亚洲天堂网一区二区| 国产一区一区| 欧美日免费三级在线| 日本福利视频在线| 欧美v亚洲v| 1区2区3区欧美| 五月婷婷一区| 邻居大乳一区二区三区| 白白色 亚洲乱淫| 91中文精品字幕在线视频| 99re国产在线| 麻豆亚洲精品| 欧美一区二区三区免费观看| 国产一级做a爱免费视频| 日韩av有码| 亚洲人成电影网站色| 91丝袜在线观看| 97视频一区| 精品免费视频.| 在线成人精品视频| 精品一区二区三区四区五区| 欧美日韩一区国产| 亚洲77777| 精品乱码一区二区三区四区| 欧美熟乱第一页| 国产裸体免费无遮挡| 午夜日韩成人影院| 一本大道av伊人久久综合| 欧美色图色综合| 春色校园综合激情亚洲| 亚洲一卡二卡三卡四卡五卡| 亚洲色图都市激情| a天堂中文在线官网在线| 亚洲欧美偷拍卡通变态| 欧美日韩午夜爽爽| 日本乱理伦在线| 亚洲高清中文字幕| 国产中文字幕乱人伦在线观看| 欧美aaaxxxx做受视频| 亚洲精品免费播放| 无码人妻精品一区二区蜜桃网站| 欧美家庭影院| 亚洲高清不卡在线| 成人一级片网站| 婷婷午夜社区一区| 欧美日韩午夜精品| 亚洲色图欧美自拍| 高清日韩欧美| 日韩精品视频三区| 亚洲欧美va天堂人熟伦| 欧美电影一区| 欧美国产日韩精品| 特级西西444www大精品视频免费看| 一本色道88久久加勒比精品| 日本久久久久久久久| 国产99免费视频| 久久丁香综合五月国产三级网站| 成人精品视频在线| 亚洲精品网站在线| 久久久欧美精品sm网站| 亚洲欧洲精品在线 | 亚洲片av在线| 少妇太紧太爽又黄又硬又爽小说| 偷偷www综合久久久久久久| 欧美大片大片在线播放| 色一情一乱一伦| 麻豆91在线播放免费| 成人动漫视频在线观看免费| 日韩在线免费看| 中文字幕一区二区三区四区不卡 | 性欧美长视频| 91视频8mav| 你懂的在线播放| 洋洋成人永久网站入口| 激情婷婷综合网| 2023国产精华国产精品| 国产一区二区免费| 国产在线观看成人| 老司机精品视频导航| 精品国产乱码久久久久久丨区2区| shkd中文字幕久久在线观看| 亚洲一区精品在线| 国产喷水theporn| 狼人精品一区二区三区在线| www.xxxx精品| 男人天堂av在线播放| 国产二区国产一区在线观看| 日韩欧美激情一区二区| 国产精品186在线观看在线播放| 欧美午夜精品一区二区三区| 黄色性视频网站| 91精品国产自产在线观看永久∴ | gogo大胆日本视频一区| www.午夜色| 亚洲日本网址| 亚洲美女喷白浆| 国产精品50页| 国产精品99久久久久久有的能看| 日产精品久久久一区二区| 俄罗斯一级**毛片在线播放| 91精品国产色综合久久不卡电影 | 一本到三区不卡视频| 亚洲欧美日韩偷拍| 欧美 日韩 国产精品免费观看| 国产精品在线看| 国产九九在线| 欧美小视频在线| 国产网站无遮挡| 激情久久中文字幕| 99视频免费观看| 怡红院红怡院欧美aⅴ怡春院| 欧美日韩免费在线视频| 日本成人免费视频| 日韩精品久久理论片| 久久99精品久久久久久青青日本| 2021中文字幕在线| 精品国产三级电影在线观看| 精国产品一区二区三区a片| 久久精品国产一区二区| 亚洲一区二区免费视频软件合集| 日韩精品三区| 一区二区三区久久精品| 无码人妻精品一区二区三区蜜桃91| 99在线热播精品免费| 国产av人人夜夜澡人人爽麻豆| 9国产精品午夜| 欧美—级a级欧美特级ar全黄| 性欧美8khd高清极品| 伊人夜夜躁av伊人久久| 国产sm在线观看| 一区在线免费观看| 国产精品区一区二区三含羞草| 国产丝袜在线播放| 亚洲黄色免费三级| 日韩黄色在线播放| 欧美国产一区视频在线观看| 日韩中文字幕a| 欧美一区综合| 国产精品亚洲综合| 成人性生活视频| 色噜噜国产精品视频一区二区| 国产精品久久影视| 亚洲香肠在线观看| 人妻少妇一区二区| 麻豆成人久久精品二区三区红| 亚洲精品日韩在线观看| 精品一区二区三区中文字幕| 国产69精品久久久久9| 午夜影院在线视频| 在线观看中文字幕不卡| 成人信息集中地| 国产高清不卡二三区| 免费成人在线视频网站| 久久国产精品亚洲人一区二区三区| 国产色婷婷国产综合在线理论片a| 国产日产一区二区| 日韩av网址在线| 最近中文字幕在线观看| 亚洲精品午夜久久久| 亚洲欧美日本一区| 韩国成人在线视频| 精品久久久久久久久久中文字幕| 欧美午夜精彩| 国产91aaa| 色成人免费网站| 九九热r在线视频精品| 视频在线观看你懂的| 51久久夜色精品国产麻豆| 国产一级免费av| 国产精品色一区二区三区| 中文字幕18页| 日本不卡不码高清免费观看| 成人午夜免费在线视频| 欧美美女一区| 国产精品免费在线播放| 色噜噜成人av在线| 人人爽久久涩噜噜噜网站| 成人黄色网址| 中文字幕一精品亚洲无线一区 | 国产精品久久影视| 色综合网站在线| 国产一级性生活| 亚洲欧洲日韩女同| 国产小视频自拍| 成人av动漫在线| 国产精品久久久久久久av福利| 久久国产88| 青青草国产免费| 99视频精品视频高清免费| 欧美日韩一区二区三区在线观看免| 成人污版视频| 国产精品美女久久久久久免费 | 欧美亚一区二区| 天天操夜夜操视频| 亚洲午夜在线电影| 欧美三级免费看| 综合久久久久久久| 久久免费手机视频| 久久精品男人天堂av| 精品无码国产一区二区三区51安| 国产一区二区精品在线观看| 欧美三级午夜理伦三级富婆| 午夜影院日韩| 欧美视频在线观看网站| 亚洲国产高清视频| 成年人网站国产| 黄色欧美日韩| 日本人妻伦在线中文字幕| 91一区在线| 伊人精品久久久久7777| 欧美韩国日本在线观看| 婷婷四房综合激情五月| 日韩大片在线| 亚洲图片小说在线| 色综合五月天| 亚洲午夜精品国产| 日韩欧美二区| 伊甸园精品99久久久久久| 天天做天天爱天天爽综合网| 亚洲巨乳在线观看| 色一区二区三区四区| 伊人久久大香线蕉精品| 五月精品视频| 97在线免费视频观看| 国模吧视频一区| 999在线观看视频| 亚洲精品资源| 国产熟女高潮视频| 日韩激情av在线| 少妇网站在线观看| 久久99精品久久久久| 色网站在线视频| 国产精品一区二区男女羞羞无遮挡| 99中文字幕在线| 成人黄色777网| 久久久久国产精品区片区无码| 久久一夜天堂av一区二区三区| 蜜桃av免费看| 国产日本欧美一区二区| 国产午夜精品久久久久久久久| 国产精品高潮呻吟| 久久久久久免费观看| 精品久久中文字幕久久av| 日本免费在线观看视频| 精品视频1区2区| 精品国产乱码久久久久久蜜臀网站| 欧美成人综合网站| 亚洲欧美日韩综合在线| 在线观看亚洲视频| 啦啦啦中文在线观看日本| 777777777亚洲妇女| 日韩不卡在线| 亚洲a区在线视频| 欧美大片网址| 五月天综合网| 亚洲精品专区| 国产无色aaa| 99久久精品国产一区二区三区| 夜夜春很很躁夜夜躁| 亚洲日本在线观看| 伊人手机在线视频| 欧美精品在线一区二区| 日韩一级片免费看| 中日韩美女免费视频网址在线观看| 羞羞视频在线免费国产| 日本久久久久亚洲中字幕| 国产美女精品视频免费播放软件| 国产欧美日韩亚洲| 欧美成人激情| 97成人在线观看视频| 国产在线播放一区二区三区| 成年人在线观看av| 一区二区三区在线观看动漫| chinese国产精品| 精品国产一区二区三区四区四| av资源网在线观看| 欧美一区二区三区免费观看| 国产高清亚洲| 日韩一区二区三区高清| 伊人成人在线| 精品人妻一区二区三| 国产午夜精品久久久久久久 | 91国内在线| 国产福利精品视频| 蜜臀av一区| 国产一二三四区在线观看| 巨乳诱惑日韩免费av| 免费观看一区二区三区| 亚洲国产精品精华液ab| 91玉足脚交嫩脚丫在线播放| 日韩欧美第一区| 日本www在线观看视频| 欧美在线免费视频| 白白在线精品| 麻豆传媒网站在线观看| 另类综合日韩欧美亚洲| 欧美做受高潮6| 福利二区91精品bt7086| 成人毛片在线精品国产| 两个人的视频www国产精品| 国产成人午夜性a一级毛片| 欧美激情论坛| 亚洲综合丁香| 欧美无人区码suv| 亚洲v日本v欧美v久久精品| 99国产精品99| 久久这里只有精品视频首页| 四虎精品一区二区免费| 亚洲日本一区二区三区在线不卡| 日韩 欧美一区二区三区| 魔女鞋交玉足榨精调教| 懂色av一区二区三区| 深爱激情五月婷婷| 午夜欧美不卡精品aaaaa| 成人午夜三级| 热99这里只有精品| 99久久综合色| 久久黄色精品视频| 亚洲乱亚洲乱妇无码| 卡通欧美亚洲| 色一情一区二区三区四区 | 五月天综合网站| 热久久久久久久久| 亚洲桃色在线一区| www.com在线观看| 欧美裸体男粗大视频在线观看| 激情视频亚洲| 丰满的少妇愉情hd高清果冻传媒 | 91精品国产综合久久久蜜臀图片 | 亚洲人吸女人奶水| www.色日本| 性金发美女69hd大尺寸| 亚州av日韩av| 国产又猛又黄的视频| 亚洲国产精品黑人久久久| 911美女片黄在线观看游戏| 日韩在线不卡视频| 538任你躁精品视频网免费| 天天做天天躁天天躁| 99热精品国产| 波多野结衣网站| 日韩视频欧美视频| 色妞ww精品视频7777| 国产精品333| 中文字幕精品—区二区四季| 一级片aaaa| 韩国美女主播一区| 成人精品视频| 不许穿内裤随时挨c调教h苏绵 | 国产精品传媒入口麻豆| 国产白浆在线观看| 97视频国产在线| 精品日韩毛片| 人妻av一区二区三区| 色婷婷一区二区| av片在线观看网站| 久久久综合亚洲91久久98| 久久精品国产一区二区| 国产精彩视频在线| 一个色综合导航| 97青娱国产盛宴精品视频| 国产一级不卡毛片| 亚洲精品久久久蜜桃| 免费在线稳定资源站| 亚洲aⅴ男人的天堂在线观看 | 肉丝一区二区| 成人黄色在线播放| 欧美亚洲在线| 69xx绿帽三人行| 一区二区欧美久久| 99国产精品免费网站| 亚洲三级视频网站| 欧美日韩亚洲一区二区| 97caopron在线视频| 日本不卡高清视频一区| 国产成人在线影院|