精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

P-RAG: 漸進式檢索增強生成方法在具身日常任務規劃中的應用 精華

發布于 2024-9-20 11:45
瀏覽
0收藏

在人工智能領域,具身AI(Embodied AI)一直是一個備受關注的研究方向。它旨在賦予AI代理與物理世界交互的能力,讓AI不僅僅停留在虛擬的數字世界中,而是能夠在真實環境中感知、規劃和行動。近年來,隨著大語言模型(LLM)的蓬勃發展,如何將LLM的強大語言理解和生成能力與具身AI任務結合起來,成為了一個熱門的研究課題。

在這個背景下,來自中國科學技術大學等機構的研究人員提出了一種新穎的方法——漸進式檢索增強生成(Progressive Retrieval Augmented Generation, P-RAG),用于解決具身日常任務中的規劃問題。這項研究發表在ACM多媒體會議(MM '24)上,論文題為《P-RAG: Progressive Retrieval Augmented Generation For Planning on Embodied Everyday Task》。

背景與現狀

具身日常任務(Embodied Everyday Task)是具身AI領域的一個重要任務。在這類任務中,AI代理需要根據自然語言指令和視覺觀察來執行一系列動作。例如,我們可能會給機器人下達這樣的指令:"請把廚房打掃干凈"或"請給盆栽澆水"。這看似簡單的任務對AI來說卻充滿了挑戰:

  1. 自然語言指令往往缺乏明確的任務規劃。比如"打掃廚房",它包含了很多隱含的子任務,如清潔臺面、收拾餐具、擦拭電器等。
  2. AI需要對任務環境有充分的了解。不同的家庭環境可能有不同的布局和物品,AI需要適應這種差異。
  3. 動作空間可能是可變的,某些動作在特定情況下可能是無效或非法的。例如,我們可以用烹飪或加熱來處理某些食物,但對于盆栽或鞋子,這些動作就是非法的。
  4. 現實世界的一些限制條件容易被忽視。比如在某些模擬環境中,桌子可能比較小,無法放置過多物品。

傳統的基于學習的方法,如強化學習(RL),雖然可以通過迭代過程來增強模型在特定任務和環境中的能力,但往往缺乏理解語言指令的能力。而近期興起的基于大語言模型(LLM)的方法,雖然在理解語言指令方面表現出色,但又缺乏對特定任務和環境的知識。

問題與挑戰

現有的基于LLM的方法主要面臨以下挑戰:

P-RAG: 漸進式檢索增強生成方法在具身日常任務規劃中的應用-AI.x社區

  1. 缺乏任務特定知識: LLM擁有廣泛的通用知識,但對于特定任務環境的細節認知不足。
  2. 依賴標注數據: 一些方法需要使用少量樣本(few-shot)來增強LLM的性能,這些樣本通常需要人工標注,成本較高。
  3. 單次檢索的局限性: 傳統的檢索增強生成(RAG)方法通常只進行一次檢索來輔助生成,難以適應復雜的具身任務。
  4. 缺乏漸進式學習能力: 現有方法難以像人類一樣,通過不斷嘗試和積累經驗來逐步提升性能。

P-RAG: 漸進式檢索增強生成

為了解決上述問題,研究人員提出了P-RAG方法。P-RAG的核心思想是:通過漸進式的方式,不斷積累任務特定知識,并利用這些知識來輔助LLM進行更好的規劃。

方法概述

P-RAG的整體框架如圖1所示:

P-RAG: 漸進式檢索增強生成方法在具身日常任務規劃中的應用-AI.x社區

P-RAG框架圖

P-RAG主要包含以下幾個關鍵組件:

  1. 數據庫: 存儲歷史軌跡信息,包括目標指令、場景圖、軌跡歷史和任務完成狀態。
  2. 檢索模塊: 根據當前任務的目標指令和場景觀察,從數據庫中檢索相關的歷史信息。
  3. LLM代理: 接收檢索結果和當前環境信息,生成行動計劃。
  4. 交互環境: 模擬具身任務的環境,如MINI-BEHAVIOR或ALFRED。
  5. 漸進式更新機制: 在每輪交互后,更新數據庫,積累新的經驗。

工作流程

P-RAG: 漸進式檢索增強生成方法在具身日常任務規劃中的應用-AI.x社區

P-RAG的工作流程可以概括為以下步驟:

  1. 信息收集: 代理接收目標指令、環境觀察、動作空間和數據庫檢索結果。
  2. LLM規劃: 將收集到的信息輸入LLM,生成一系列高級動作。
  3. 動作執行: 將高級動作分解為低級動作,在環境中執行。
  4. 結果反饋: 環境返回新的觀察和獎勵信息。
  5. 數據庫更新: 將新的軌跡信息更新到數據庫中。
  6. 迭代優化: 重復上述步驟,不斷積累經驗,提升性能。

核心創新點

P-RAG: 漸進式檢索增強生成方法在具身日常任務規劃中的應用-AI.x社區


  1. 漸進式知識積累: P-RAG不依賴預先標注的數據,而是通過與環境的交互,逐步積累任務特定知識。這種方式更接近人類學習的過程,也更適合實際應用場景。
  2. 聯合檢索策略: P-RAG不僅檢索相似的任務,還考慮相似的場景。這種細粒度的檢索策略能提供更有價值的參考經驗。具體來說,P-RAG使用以下公式計算相似度:

s_n = sim(Q_goal, K_goal) + max(sim(Q_obs,n, K_obs,t))

其中,Q_goal和K_goal是目標指令的嵌入向量,Q_obs,n和K_obs,t是場景圖的嵌入向量。

  1. 迭代式更新: P-RAG引入了一種迭代方法,在每輪交互后更新數據庫。這使得模型能夠從失敗的嘗試中學習,不斷改進其性能。
  2. 靈活的LLM集成: P-RAG可以與不同的LLM(如GPT-3.5、GPT-4)集成,充分利用LLM的語言理解和生成能力。

實驗與結果

研究人員在兩個具有代表性的數據集上進行了大量實驗,以驗證P-RAG的有效性:

  1. ALFRED數據集: 一個基于視覺和語言的室內任務數據集。
  2. MINI-BEHAVIOR數據集: 一個抽象的網格環境,包含20個日常活動。

ALFRED數據集上的結果

表1展示了P-RAG與其他先進方法在ALFRED數據集上的性能比較:

模型

數據集

標注數據

Valid Unseen

Valid Seen

HiTUT

全量

?

10.23

18.41

HLSM

全量

?

18.28

29.63

LLM-Planer

部分

?

12.92

13.53

GPT-4

-

×

7.05

17.46

P-RAG (我們的方法)

部分

×

14.11

18.2

P-RAG (自迭代)

-

×

27.4

19.05

表1: ALFRED數據集上的性能比較 (成功率 %)

從表1中我們可以看出:

  1. P-RAG在不使用任何標注數據的情況下,就能達到或超過使用部分訓練數據的方法(如LLM-Planer)的性能。
  2. 通過自迭代(在測試集上進行漸進式更新),P-RAG的性能甚至超過了使用全量訓練數據的方法,特別是在Valid Unseen數據集上。
  3. P-RAG顯著優于單純使用GPT-4的基線方法,證明了檢索增強和漸進式學習的有效性。

MINI-BEHAVIOR數據集上的結果

表2展示了P-RAG在MINI-BEHAVIOR數據集上的表現:

模型

總成功率

任務成功率

SPL

GPT-4

15%

20%

13.8%

P-RAG-4

16.7%

25%

15%

GPT-3.5

7.5%

20%

7.5%

P-RAG-3.5

10%

20%

9.5%

表2: MINI-BEHAVIOR數據集上的性能比較

從表2中我們可以觀察到:

  1. 無論是基于GPT-4還是GPT-3.5,P-RAG都能顯著提升性能。
  2. P-RAG不僅提高了總成功率,還提升了任務成功率和SPL(成功加權路徑長度)指標。
  3. 即使在這種簡單的環境中,P-RAG也展現出了明顯的優勢,特別是考慮到MINI-BEHAVIOR對強化學習算法來說是一個具有挑戰性的環境。

案例分析

為了更直觀地理解P-RAG的工作原理,讓我們來看一個具體的案例。圖2展示了P-RAG和GPT-4基線在"給盆栽澆水"任務上的規劃軌跡對比:

P-RAG: 漸進式檢索增強生成方法在具身日常任務規劃中的應用-AI.x社區

規劃軌跡對比

圖2: P-RAG與GPT-4基線在"給盆栽澆水"任務上的規劃軌跡對比

在這個案例中:

  1. GPT-4基線方法簡單地按順序拿起三個盆栽并放入水槽,然后認為任務完成。但實際上,它并沒有成功完成任務。
  2. 相比之下,P-RAG利用全面的歷史軌跡信息來做決策。它不僅正確地將盆栽放入水槽,還記得要打開水龍頭,最終成功完成了任務。

這個案例很好地展示了P-RAG如何利用歷史經驗來做出更合理的決策,從而更好地完成復雜的具身任務。

方法分析與改進方向

P-RAG雖然取得了令人矚目的成果,但仍有一些值得進一步探索和改進的方向:

  1. 檢索效率優化: 隨著交互輪次的增加,數據庫中的歷史軌跡會不斷累積。如何在大規模數據中快速、準確地檢索相關信息,是一個值得研究的問題。可以考慮引入更高效的索引結構或近似最近鄰搜索算法。
  2. 知識蒸餾與壓縮: 目前P-RAG直接存儲原始的軌跡信息。未來可以探索如何從這些原始數據中提取關鍵知識,并以更緊湊的形式存儲,從而減少存儲開銷并提高檢索效率。
  3. 多模態信息融合: 當前的方法主要依賴文本形式的場景圖。未來可以考慮如何更好地利用視覺信息,perhaps通過引入視覺-語言預訓練模型來獲取更豐富的環境表征。
  4. 任務遷移與泛化: 雖然P-RAG在未見過的環境中表現良好,但如何將在一個任務域中學到的知識遷移到新的任務域,仍是一個開放的問題。研究跨任務、跨域的知識遷移將是很有價值的方向。
  5. 與強化學習的結合: P-RAG目前主要依賴LLM進行決策。探索如何將P-RAG與強化學習方法相結合,可能會帶來更好的性能和更強的適應性。
  6. 人機協作方面的應用: P-RAG的漸進式學習特性使其非常適合人機協作場景。研究如何讓人類用戶更自然地參與到知識積累和決策優化的過程中,將是一個很有前景的方向。
  7. 可解釋性增強: 雖然P-RAG通過檢索歷史軌跡提供了一定的可解釋性,但如何讓模型的決策過程更加透明和可理解,仍有改進空間。perhaps可以通過可視化檢索到的關鍵信息,或生成決策依據的自然語言解釋。

總結與展望

P-RAG為解決具身日常任務中的規劃問題提供了一種新穎而有效的方法。它巧妙地結合了大語言模型的強大語言能力和漸進式學習的靈活性,在不依賴大量標注數據的情況

本文轉載自 ??芝士AI吃魚??,作者: 愛滑冰的咸魚

已于2024-9-20 11:47:44修改
收藏
回復
舉報
回復
相關推薦
国产伦精一区二区三区| 国产精品日韩精品中文字幕| 亚洲一区二区在线免费看| 电影午夜精品一区二区三区| 超碰中文字幕在线| 成人6969www免费视频| 91麻豆精品国产91久久久资源速度 | 中文字幕免费观看视频| 欧美国产91| 国产亚洲欧美日韩美女| 一级黄色片在线免费观看| 激情视频网站在线播放色| 国产精品国产a级| 国产一级特黄a大片99| 中文字幕在线视频第一页| 狠狠噜噜久久| 日韩网站免费观看高清| 国产精品久久无码| 久久中文字幕一区二区| 色欧美日韩亚洲| 樱花www成人免费视频| 桃花色综合影院| 国产一区二区精品久久99| 国产精品h片在线播放| 久久免费视频精品| 国产精品久久久久久| 国产偷亚洲偷欧美偷精品| 国产人妻精品久久久久野外| 伊人久久高清| 欧美视频在线观看免费网址| 四虎4hu永久免费入口| 99re热久久这里只有精品34| 97久久人人超碰| 国产91视觉| 国内精品国产成人国产三级| 免费不卡在线视频| 2020欧美日韩在线视频| 国产无码精品在线观看| 欧美黄色免费| 欧美成人一区二区三区电影| 午夜三级在线观看| 久久精品国产大片免费观看| 亚洲一区av在线播放| 亚洲第九十七页| 老司机精品在线| 欧美videos大乳护士334| 亚洲视频在线不卡| 激情综合五月| 日韩一区二区免费电影| 国产高清av片| 视频精品一区二区三区| 欧美一级二级在线观看| 亚洲精品国产一区二区三区| 欧美日韩卡一| 91麻豆精品国产无毒不卡在线观看| 激情五月俺来也| 91天天综合| 欧美日韩在线一区二区| 少妇一级淫免费放| 日韩在线你懂得| 5月丁香婷婷综合| 极品粉嫩美女露脸啪啪| 高清在线一区二区| 日韩欧美一区二区免费| 国产精品久久久久野外| 91精品入口| 亚洲成av人片在线观看香蕉| 久久午夜夜伦鲁鲁片| 羞羞答答一区二区| 国产午夜精品视频免费不卡69堂| 国产免费一区二区三区网站免费| 欧美日韩水蜜桃| 丝袜美腿亚洲一区二区| 日韩精品一区二区亚洲av性色| 午夜免费一区| 久久久久久高潮国产精品视| 粉嫩aⅴ一区二区三区| 国产日韩亚洲| 国产精品亚洲第一区| 国产免费高清av| 成人在线视频一区| 蜜桃精品久久久久久久免费影院| 粉嫩av一区| 亚洲精品视频免费观看| 精品国产一二三四区| 日本欧美一区| 日韩一区二区三区免费观看| xxxxxx黄色| 成人羞羞视频播放网站| 欧美成年人网站| 黑人一级大毛片| 免费av成人在线| 91免费版黄色| 国产在线三区| 亚洲一区二区三区四区中文字幕| 激情五月开心婷婷| 国产精品视频一区二区三区综合 | 亚洲成av人片在线观看| 粗暴91大变态调教| 看亚洲a级一级毛片| 日韩毛片在线看| 顶臀精品视频www| 久久精品盗摄| 电影午夜精品一区二区三区| 国产福利电影在线| 亚洲成人av在线电影| 天天干天天玩天天操| 欧美电影免费网站| 美女精品视频一区| 超碰在线免费97| av在线不卡电影| 自拍偷拍99| 日韩成人动漫| 亚洲成年人在线| 国产精品99久久久久久成人| 久久午夜视频| 国产私拍一区| 神马午夜伦理不卡| 欧美日韩免费在线视频| 一起草在线视频| 午夜欧美精品久久久久久久| 国产精品久久久久久久久久尿| 亚洲黄色片视频| 中文字幕亚洲电影| 最近中文字幕一区二区| 亚洲激情播播| 97精品久久久中文字幕免费| 精品国产av一区二区| 国产精品每日更新在线播放网址 | 色就是色欧美| 忘忧草在线影院两性视频| 欧美成人三级在线| 免费在线观看a级片| 青青草原综合久久大伊人精品优势| 久久riav| 综合久久2023| 日韩精品中文字幕视频在线| 欧美日韩中文视频| 大桥未久av一区二区三区中文| 一区二区精品视频| 国产亚洲精彩久久| 中文精品99久久国产香蕉| 国产一级免费视频| 国产亚洲综合av| 无遮挡又爽又刺激的视频| 九一精品国产| 国产成人av在线| 国产精品天堂| 欧美色综合久久| 大吊一区二区三区| 久久99国产精品麻豆| 亚洲 国产 欧美一区| 欧美成人免费电影| 亚洲夜晚福利在线观看| 亚洲 小说区 图片区| 日本一二三不卡| 一起操在线视频| 中文字幕一区二区三区乱码图片 | 网站在线你懂的| 亚洲精品tv久久久久久久久久| 成人在线观看视频网站| 黄色一级大片在线免费看产| 欧美久久久影院| 欧美黑人猛猛猛| 福利电影一区二区| 日本免费不卡一区二区| 在线看成人短视频| 国产精品视频最多的网站| 青青影院在线观看| 日韩精品中文字幕一区| 日韩毛片在线播放| 久久综合狠狠综合久久综合88| 北条麻妃在线观看| 欧美顶级大胆免费视频| 3d精品h动漫啪啪一区二区| 波多野结衣在线观看| 日韩精品视频在线| 在线免费一区二区| 亚洲欧洲99久久| 久久久久久久无码| 蜜桃精品视频在线观看| 国产欧美自拍视频| 日韩av字幕| 国产美女久久精品| 9765激情中文在线| 在线播放日韩欧美| 狠狠人妻久久久久久综合麻豆| 欧美性猛交xxxx久久久| 男人晚上看的视频| 成人一区二区三区中文字幕| 国产精品一区二区免费在线观看| 欧美日韩在线网站| 国产精品.com| 国产精品亲子伦av一区二区三区| 欧美黑人极品猛少妇色xxxxx | 久久精品视频在线| 香蕉视频黄色片| 3d成人h动漫网站入口| a v视频在线观看| 亚洲欧美激情小说另类| 右手影院亚洲欧美| 国产成a人亚洲精品| 黄色三级视频片| 亚洲国产mv| 自拍偷拍视频在线| 国产日韩欧美一区二区三区| av成人观看| 四虎国产精品永久在线国在线 | 六月丁香婷婷综合| 亚洲精品五月天| 国产日韩精品中文字无码| 99精品国产91久久久久久| 欧美一级xxxx| 日本在线播放一区二区三区| 日本a视频在线观看| 中文字幕一区二区三区乱码图片| 视频在线观看成人| 免费成人蒂法| 国产精品xxx在线观看www| 97久久精品一区二区三区的观看方式| 日韩免费av在线| 韩国成人免费视频| 美女av一区二区三区| 欧洲美女少妇精品| 日韩在线欧美在线国产在线| 色就是色亚洲色图| 日韩国产欧美精品一区二区三区| 国产丝袜在线视频| 欧美日韩高清在线播放| 中文字幕人妻丝袜乱一区三区| 欧美日韩在线看| 国产 欧美 日韩 在线| 亚洲综合丁香婷婷六月香| 在线日韩国产网站| 国产精品成人免费在线| 精品日韩在线视频| 日本一区二区三区国色天香| aaaaa级少妇高潮大片免费看| www.欧美日韩国产在线| 日本一区二区免费视频| 成人小视频在线观看| 香蕉视频在线观看黄| 国产麻豆一精品一av一免费| 欧美精品 - 色网| 国产一区二区女| 色黄视频免费看| 国产ts人妖一区二区| 少妇伦子伦精品无吗| 成人久久18免费网站麻豆 | 国产女人18毛片水真多| 538在线一区二区精品国产| 国产毛片在线视频| 日韩视频免费直播| 亚洲第一天堂影院| 亚洲激情电影中文字幕| 欧美伦理影视网| 国产性猛交xxxx免费看久久| www.成人.com| 久久久久99精品久久久久| 91在线中字| 国内精品中文字幕| 国产精品一区二区av影院萌芽| 日本精品视频在线| 国产精品99| 91入口在线观看| 果冻天美麻豆一区二区国产| 久久艹中文字幕| 日韩欧美精品| 粉嫩av一区二区三区天美传媒| 亚洲精品女人| 欧美日韩大尺度| 国产精品综合二区| 狠狠人妻久久久久久综合蜜桃| 国产亚洲美州欧州综合国| 91n在线视频| 亚洲成人av在线电影| 成人毛片一区二区三区| 日韩一区二区电影网| 午夜影院免费视频| 色老头一区二区三区| 欧洲黄色一区| 国产精品女主播| 99久久婷婷国产综合精品青牛牛 | 亚洲v在线看| 免费看又黄又无码的网站| 日韩精品一二三四| 成人在线观看一区二区| 国产日韩欧美综合在线| 青青青在线视频| 欧洲av在线精品| 国产成人免费看一级大黄| 精品性高朝久久久久久久| 麻豆网站在线免费观看| 97精品国产aⅴ7777| 日韩午夜电影免费看| 国产偷国产偷亚洲高清97cao| 久久网站免费观看| 日韩免费一级视频| 国产精品白丝jk黑袜喷水| 免费看污片的网站| 夜夜精品视频一区二区| 中文字幕日韩国产| 亚洲精品短视频| 成人国产免费电影| 国产精品看片资源| 天海翼亚洲一区二区三区| 影音先锋成人资源网站| 久久一日本道色综合久久| 91成人在线观看喷潮蘑菇| 国产精品欧美久久久久无广告 | 日韩精品一区二区三区在线观看| 黄色电影免费在线看| 欧美激情免费观看| av在线精品| 一区不卡字幕| 日韩精品一卡二卡三卡四卡无卡| 在线黄色免费网站| 亚洲综合一区二区三区| 国产在成人精品线拍偷自揄拍| 亚洲欧美综合另类中字| √天堂8资源中文在线| 91老司机在线| 成人影视亚洲图片在线| 丝袜老师办公室里做好紧好爽| 国产成人免费视| 欧美亚洲日本在线| 欧美一区二视频| 美女国产在线| 成人h片在线播放免费网站| 精品视频亚洲| 999精品网站| 国产亚洲精品超碰| 中文精品久久久久人妻不卡| 日韩精品视频免费| 电影一区二区三| 精品视频第一区| 夜夜精品视频| 少妇一级淫免费观看| 午夜欧美2019年伦理 | 一区三区二区视频| 都市激情综合| 欧美综合激情| 蜜臀a∨国产成人精品| 超薄肉色丝袜一二三| 在线观看精品一区| 97视频精彩视频在线观看| 国产精品青青在线观看爽香蕉| 国产一区二区三区四区二区| 88av.com| 国产精品短视频| 国产高清视频免费| 欧美精品国产精品日韩精品| 粉嫩久久久久久久极品| 日韩欧美一区二| 久久先锋影音av鲁色资源| 黄色av一区二区| 日韩中文字幕网址| 嫩呦国产一区二区三区av| 国产精品无码免费专区午夜| 成人av网站免费| 国产精品久久久久久人| 中文字幕综合一区| 日韩高清在线观看一区二区| 免费高清一区二区三区| 91色.com| 国产精品久久久久久久成人午夜| 美女少妇精品视频| 欧美福利在线播放网址导航| 日韩久久一级片| 国产精品久久毛片av大全日韩| 精品人妻aV中文字幕乱码色欲| 久久久亚洲国产| 国产不卡av一区二区| 日本中文字幕影院| 午夜精品久久久久久| 国产精品视频二区三区| 亚洲在线免费看| 99精品国产福利在线观看免费 | 一区二区三区日韩| 午夜在线视频免费| 国产精品视频自在线| 在线观看亚洲| 欧美一区二区三区观看| 精品国产制服丝袜高跟| 唐人社导航福利精品| 日本一本草久p| 久久网站热最新地址| 91麻豆国产在线| 55夜色66夜色国产精品视频| 四虎国产精品免费观看| 欧美熟妇精品一区二区蜜桃视频| 在线视频亚洲一区| xxxx在线视频| 亚洲欧美日韩不卡一区二区三区| 大美女一区二区三区| 在线免费a视频| 2018国产精品视频| 一区二区三区四区日韩| 女女互磨互喷水高潮les呻吟| 日韩美女视频在线|