精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力

發布于 2024-12-17 12:15
瀏覽
0收藏

?大家好,我是HxShine。

今天分享一篇普林斯頓大學和Google Research, Brain Team合作的一篇文章,REAC T: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS[1]:在語言模型中協同Reasoning推理和Action行動。

其在大語言模型中將Thought推理過程和Action行動結合,一方面可以通過Action從外部獲取額外信息,另一方面可以通過Thought過程,細化任務,搜索有用信息,過濾無用信息,從而來提高大模型的表現。

一、概述

Title:REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS

論文地址:https://arxiv.org/abs/2210.03629

代碼:https://github.com/ysymyth/ReAct.git

其他:https://react-lm.github.io/

1.Motivation

大模型的的推理能力(例如思想鏈提示CoT)和Action規劃(例如Action計劃生成)主要作為單獨的領域來研究,沒有將他們結合起來。

2.Methods

本文提出ReAct,將想鏈提示CoT和Action計劃生成結合起來,相互補充增強,提升大模型解決問題的能力。其中CoT的Reasoning推理跟蹤有助于模型誘導、跟蹤和更新行動計劃以及處理異常。Action操作允許它與知識庫或環境等外部來源接口并收集其他信息。

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

總結:主要有Thought、Act、Obs幾個步驟,Thought引入思維過程思考下一步該干什么,Act執行相關動作,Obs是觀察每一步的結果。

3.Conclusion

  1. ReAct可以提高人類可解釋性和可信度,并取得了sota的成績。

更好的效果。通過對多跳問答、事實核查和交互式決策任務的多樣化實驗,ReAct通過可解釋的決策軌跡帶來更好的性能

可解釋性強。ReAct通過與簡單的維基百科API交互,生成類似人類的任務解決軌跡,比沒有推理軌跡的基線更容易解釋。

  1. 克服了CoT思想鏈推理中普遍存在的幻覺和錯誤傳播問題。
  2. 在AlfWorld和WebShop數據集上,ReAct比模仿和強化學習方法(IM-RL)的絕對成功率分別高34%和10%
  3. 其他結論:1)從更多高質量的人工注釋中學習進行微調可以進一步提高性能。2)擴大ReAct與多任務訓練的規模,并將其與強化學習等互補范例相結合,可以產生更強的Agent。

二、詳細內容

1.HotpotQA數據集介紹

概述:HotPotQA數據集的主要目標是測試模型進行多跳推理的能力,并回答需要從多個段落中匯總信息才能得出正確答案的復雜問題。該數據集專注于提供具有挑戰性的問題,要求深入理解上下文。

例子:

Context (multiple paragraphs):

Paragraph 1: The Eiffel Tower is a wrought-iron lattice tower located on the Champ de Mars in Paris, France. It was named after the engineer Gustave Eiffel, whose company designed and built the structure.
Paragraph 2: The tower is 324 meters tall, about the same height as an 81-story building. It was completed in 1889 and has become a global cultural icon of France.
Paragraph 3: Visitors can take elevators or climb the stairs to reach the tower's observation decks. The tower offers stunning panoramic views of Paris, making it one of the most popular tourist attractions in the world.

Question:

Question: When was the Eiffel Tower completed?

Answer:

Answer: The Eiffel Tower was completed in 1889.

特點:

  • 多跳推理:問題的設計方式使得它們的答案無法從單個段落中得出。相反,它們需要從上下文中的多個段落中匯總信息。
  • 多樣的段落:每個問題都附帶有多個文本段落,其中一些段落可能包含相關信息,而其他段落可能與回答問題無關。
  • 支持性事實:數據集還包括“支持性事實”,為模型提供有關回答問題的相關段落的提示。
  • 解釋:除了答案之外,數據集還包括“解釋”,強調了對回答問題至關重要的段落部分。這個特點使得該數據集在可解釋的人工智能研究中非常有用。

本文用到的例子:

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

說明:需要檢索多跳內容才能得出最終結論。

2.本文使用的不同的方法的說明

2.1 Act方法(沒有中間思維過程)

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

2.2 CoT方法(沒有Action接入外部知識)

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

2.3 ReAct方法(既有中間Thought過程,又有Action接入外部知識)

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

3.實驗結論

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

方法說明:

  • Standard(標準提示):刪除ReAct軌跡中的所有思想、行動、觀察等步驟。
  • CoT(思想鏈提示):刪除行動和觀察,保留思想,并作為僅用于推理的基線。
  • CoT-SC(self-consistency):利用自一致性[1]方法,在推理期間抽樣21個CoT軌跡,解碼溫度為0.7,并采用大多數投票得到答案。
  • Act:僅僅保留Agent提示(Act),它刪除了ReAct軌跡中的Thought思維過程,可以初步認為其類似于WebGPT。
  • ReAct:本文的Thought + Action結合的方法。
  • ReAct → CoT-SC:當ReAct未能在給定步驟內返回答案時,返回CoT-SC結果。
  • CoT-SC → ReAct:當n個CoT-SC樣本中的大多數答案少于n/2次(即內部知識可能無法自信地支持任務)時,返回ReAct結果。

ReAct vsCoT:這兩者是靈活性和事實性的權衡,CoT靈活性好,ReAct事實性更好。ReAct在Fever數據集優于CoT(60.9對56.3),在HotpotQA上略微落后于CoT(27.4對29.4)。分別從ReAct和CoT(因此共200個示例)中隨機抽樣了50個正確和錯誤答案的軌跡(由EM判斷)。一些關鍵觀察結果如下:

  • A)幻覺是CoT的一個嚴重問題。導致在成功模式下的假陽性率比ReAct(14%對6%)高得多,失敗的占比(56%)。相比之下,由于外部知識庫的訪問,ReActis的問題解決軌跡更加可靠。
  • B)ReAct靈活性比CoT差。雖然交錯推理、行動和觀察步驟提高了ReAct的基礎性和可信度,但這種結構性約束也降低了其制定推理步驟的靈活性。導致比CoT更高的推理錯誤率。我們注意到,ReAct特有的一種頻繁錯誤模式,即模型重復生成之前的想法和行動,我們將其歸類為“推理錯誤”的一部分,因為模型未能推理下一步采取什么行動。
  • C)對于ReAct來說,通過搜索成功檢索信息知識至關重要。非信息搜索占錯誤案例的23%,它使模型推理脫軌,并使其難以恢復和重新表述想法。這也許是事實性和靈活性之間的預期權衡,這激發了我們提出的結合兩種方法的策略。

結論:1)ReAct比Act提升大概在2個點左右,ReAct和CoT-SC(Self-Consistency)結合效果提升比較多,大概有8個點的提升。2)CoT靈活性好,ReAct事實性更好。

4.ReAct + FineTuning效果提升比較大

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

說明:1)左邊learning = prompt表示直接在In-context中引入樣本進行學習,對比standard、CoT、AcT、ReAct效果差異。2)右邊learning = finetune表示利用數據先fine-tuning模型,然后再對比standard、CoT、AcT、ReAct效果差異。

Fintune方法:使用ReAct生成的3000個正確答案軌跡(也適用于其他基線)來微調較小的語言模型(PaLM-8/62B),以根據輸入問題/索賠為條件解碼軌跡(所有想法、行動、觀察)詳情見附錄B.1。

結論1:模型參數量越小,未經過FineTuning方法的ReAct表現越差,隨著模型尺寸變大,ReAct效果越來越好。說明對于小模型,在prompt里面添加相關例子,模型可能不太能理解你的例子,這個和之前Google的文章提到的現象是一致的[3]。

結論2:同等模型大小下,ReAct + FineTuning效果比ReAct + prompt效果好非常多。例如同樣是62b的模型,Finetuning后指標是39+,Prompt形式的是15+,提升了塊1倍,說明利用FineTuning能極大的改善ReAct的效果。

5.其他實驗

ICLR 2023 | ReAct:首次結合Thought和Action提升大模型解決問題的能力-AI.x社區

數據集說明:兩個基于語言的交互式決策任務,ALFWorld和WebShop,這兩個任務都具有復雜的環境,要求算法能夠克服稀疏的獎勵和長期行動,要求高效的推理和行動。

結論1:ReAct方法比其他方法都很不少,AlfWorld數據集上,ReAct vs Act = 71:45,比其他方法也好不少。如果沒有任何Thought,Act就不能正確地將目標分解為更小的子目標,或者失去了對當前環境狀態的跟蹤。

結論2:Webshop數據集合上,ReAct vs IL+RL = 40:28.7,ReAct更有可能通過推理來識別與指令相關的產品和選項,來縮小噪聲觀察和行動之間的差距。但是還是和人類專家的指標差不少。

三、總結

  1. Act可以調用外部接口獲取更多信息,但是如果沒有Thought過程,一方面沒法將目標分解為更小的目標,失去了對當前環境的跟蹤。另一方面,ReAct可以通過推理來識別與指令相關的信息,過濾不相關的噪聲。
  2. ReAct vsCoT:這兩者是靈活性和事實性的權衡,CoT靈活性好,ReAct事實性更好。幻覺是CoT的一個嚴重問題,因幻覺帶來的錯誤推理占比比較高。Action和觀察步驟提高了ReAct的基礎性和可信度,但這種結構性約束也降低了其制定推理步驟的靈活性。
  3. 在模型尺寸比較小的時候,在prompt中使用ReAct效果提升不大,隨著模型增大,效果越來越好這個和[3]觀察到的現象一致,可能只有大模型才能理解你在In-context中舉的例子。
  4. 利用推理正確的數據,去構建中間過程的數據集,這個是一個比較好的降低標注成本方法[4],可以通過該方法低成本構建大量的finetuning數據集。同時本文觀察的在模型大小為60B左右時,Finetuning帶來的提升比prompt方法帶來的提升要高很多,說明ReAct結合finetuning可能是一種比較好的方式來提高效果。

四、References

[1] Wang X, Wei J, Schuurmans D, et al. Self-consistency improves chain of thought reasoning in language models[J]. arXiv preprint arXiv:2203.11171, 2022.

[2] Yao S, Zhao J, Yu D, et al. React: Synergizing reasoning and acting in language models[J]. arXiv preprint arXiv:2210.03629, 2022.

[3] Wei J, Wei J, Tay Y, et al. Larger language models do in-context learning differently[J]. arXiv preprint arXiv:2303.03846, 2023.

[4] Zelikman E, Wu Y, Mu J, et al. Star: Bootstrapping reasoning with reasoning[J]. Advances in Neural Information Processing Systems, 2022, 35: 15476-15488.

[5] state of gpt: https://karpathy.ai/stateofgpt.pdf

本文轉載自??NLP PaperWeekly??,作者:  HxShine ?


收藏
回復
舉報
回復
相關推薦
欧美日韩日本网| 91精品国产91久久久久久不卡| 四季av一区二区| porn视频在线观看| 国内精品伊人久久久久av一坑| 欧美激情精品久久久久久变态 | 成人免费看黄| 国产精品全国免费观看高清| 成人免费视频观看视频| 久久精品视频5| 97精品国产福利一区二区三区| 日韩女优电影在线观看| 成年人视频观看| 91在线视频免费看| av在线不卡电影| 国产一区视频在线| 国产精品suv一区二区三区| 日本一区二区免费高清| 亚洲福利视频专区| 亚洲精品永久视频| 黄色综合网址| 亚洲男人天堂一区| 日韩高清dvd| 乱色精品无码一区二区国产盗| 日本欧美大码aⅴ在线播放| 欧美激情区在线播放| 日韩av手机在线免费观看| 欧美中文一区| 欧美videofree性高清杂交| 网站一区二区三区| 在线女人免费视频| 亚洲国产日韩一区二区| 国产精品美女在线播放| gogogo高清在线观看免费完整版| 成人激情免费网站| 99在线观看| 国产激情久久久久久熟女老人av| 蜜臀av性久久久久av蜜臀妖精 | 日韩专区在线观看| caopeng视频| 日本亚洲不卡| 精品国产伦一区二区三区免费| 一二三av在线| 亚洲欧洲日韩精品在线| 欧美午夜精品一区二区三区| 91九色在线观看视频| 俺来也官网欧美久久精品| 自拍偷拍国产精品| 中文精品视频一区二区在线观看| 国产在线观看黄| 久久蜜臀精品av| 欧美精品欧美精品| 国产女主播在线写真| 久久久久久久久99精品| 日本一区免费在线观看| 国产视频二区在线观看| 国产精品污www在线观看| 亚洲国产精品日韩| 尤物视频在线免费观看| 日韩美女精品在线| 国产1区2区3区中文字幕| 色综合999| 亚洲福利视频三区| 国产原创中文在线观看 | 色综合久久影院| 国产精品国产三级国产三级人妇| 在线观看福利一区| 日本片在线看| 欧美性色xo影院| 久久久久国产精品熟女影院| 另类一区二区| 91精品国产全国免费观看| 在线免费黄色小视频| 成人福利免费在线观看| 亚洲精品中文字幕av| 美女被到爽高潮视频| 久久久成人免费视频| 久久高清免费| 久久影院资源网| 久一区二区三区| 国产一区二区高清| 国产精品极品美女粉嫩高清在线| 6—12呦国产精品| 国产a视频精品免费观看| 欧美日韩 国产精品| 欧美日韩第一页| 欧美日韩一二三四区| 免费成人小视频| 97在线电影| 欧美孕妇孕交| 日韩毛片一二三区| 欧美 丝袜 自拍 制服 另类| 国产一区二区三区朝在线观看| 在线成人小视频| 50一60岁老妇女毛片| 98精品久久久久久久| 久久久女人电视剧免费播放下载 | 欧美三级网页| 日韩免费在线看| 精品国产区一区二| 国产日韩欧美高清在线| 久久久久福利视频| 芒果视频成人app| 日韩欧美中文字幕一区| 亚洲 小说 欧美 激情 另类| 午夜国产欧美理论在线播放| 国产成人久久久精品一区| 亚洲卡一卡二卡三| 一色桃子久久精品亚洲| 国产主播在线看| 77成人影视| 综合av色偷偷网| 亚洲精品男人天堂| 国产盗摄女厕一区二区三区 | 久久久久9999| 欧美a级在线| 国产精品久久激情| 三级在线观看| 亚洲国产sm捆绑调教视频| 免费精品99久久国产综合精品应用| 台湾佬综合网| 久久久女女女女999久久| 国产免费黄色大片| 国产精品麻豆视频| 国产精品亚洲αv天堂无码| 成人爽a毛片| 欧美成人激情在线| 国产精品久久婷婷| 国产精品国产三级国产aⅴ原创| 农村妇女精品一二区| 极品束缚调教一区二区网站 | 日韩成人av电影| 亚洲精品99久久久久中文字幕| 欧美片一区二区| 国产揄拍国内精品对白| 日本电影亚洲天堂一区| 91精品免费| 麻豆传媒在线免费| 欧美另类高清zo欧美| wwwww黄色| 日韩国产欧美在线观看| 美媛馆国产精品一区二区| www成人免费观看| 欧美精品一区男女天堂| 久久久久无码国产精品不卡| 国产精品一二二区| 欧美一级中文字幕| 成人在线视频国产| 免费91在线视频| 国产熟女精品视频| 亚洲三级在线免费观看| 亚洲天堂网一区| 色999日韩| 91精品视频观看| www在线观看播放免费视频日本| 欧美人成免费网站| 中文字幕手机在线观看| 国产成a人亚洲精| 男人添女人荫蒂免费视频| 国产亚洲成av人片在线观黄桃| 久久99热精品这里久久精品| 国产成人手机在线| 天天色 色综合| 免费不卡亚洲欧美| 亚洲黄色网址大全| 亚洲女同在线| 欧美一级片免费观看| 91国拍精品国产粉嫩亚洲一区 | 麻豆传媒视频在线观看免费| 欧美精品少妇一区二区三区| 69av视频在线| 91小视频在线观看| 蜜臀视频一区二区三区| 999视频精品| 国产厕所精品在线观看| 深夜成人在线| 色偷偷88888欧美精品久久久| 国产成人精品亚洲精品色欲| 天天色天天操综合| 男女男精品视频网站| 国产a精品视频| 欧美综合在线观看视频| 国产精品久久久久9999赢消| 国产不卡一区二区在线观看| 欧美www.| 欧美激情在线一区| 国产永久免费高清在线观看视频| 欧美一级欧美三级| 麻豆精品久久久久久久99蜜桃| 国产精品久久三| 欧美大喷水吹潮合集在线观看| 日韩精品亚洲专区| 一本大道久久精品懂色aⅴ| 国产三级日本三级在线播放| 午夜日韩在线| 日韩欧美第二区在线观看| 日本一区影院| 国产精品精品一区二区三区午夜版 | 波多野结衣在线观看视频| 中文字幕色av一区二区三区| 中文字幕免费高清视频| 另类中文字幕网| 六月丁香激情网| 欧美一区二区| 亚洲春色在线| 蜜乳av综合| 国产高清自拍一区| 在线播放成人| 国产成人av网址| 爱啪啪综合导航| 亚洲第一av在线| 国产绿帽刺激高潮对白| 欧美性猛交xxxxxx富婆| 99免费在线观看| 亚洲精品国久久99热| 中文天堂资源在线| 2021久久国产精品不只是精品| 亚洲精品乱码久久久久久9色| 日本强好片久久久久久aaa| 大j8黑人w巨大888a片| 中国精品18videos性欧美| 艳色歌舞团一区二区三区| 精品国产乱码久久久| 久久久久高清| 青青久久av| 久久久久久久久四区三区| 一区二区三区四区高清视频| 成人精品久久久| 韩国精品视频在线观看| 日韩av日韩在线观看| 国产黄大片在线观看| 久久免费视频这里只有精品| 呦呦在线视频| 欧美精品做受xxx性少妇| 五月天婷婷在线视频| 中文字幕欧美日韩精品| 99久久99久久| 中文字幕影音在线| 欧美亚洲另类激情另类| 国产传媒在线观看| 午夜伦理精品一区| 国产精选在线| 91精品国产乱码久久久久久蜜臀| 国产伦理精品| 91精品国产99| 中文日产幕无线码一区二区| 91sa在线看| 久久毛片亚洲| 国产精品久久久久7777婷婷| 国产私拍福利精品视频二区| 国产精品激情自拍| 久久精品97| 成人黄色在线播放| 麻豆国产一区| 国产福利不卡| 免费观看久久av| 日本一区免费| 五月婷婷亚洲| 国产精品国产三级国产专区51| 精品国精品国产自在久国产应用 | 国产大学生av| 成人午夜伦理影院| 国产高清自拍视频| 国产亚洲va综合人人澡精品| 懂色av粉嫩av浪潮av| 亚洲欧美精品午睡沙发| 日韩精品视频免费看| 日韩欧美中文字幕在线观看 | 欧美一区二区三区公司| 亚洲国产精品久久久久爰性色| 亚洲的天堂在线中文字幕| 蜜芽tv福利在线视频| 伊人久久久久久久久久| 久操视频在线观看| 国内揄拍国内精品少妇国语| 亚洲少妇视频| 成人精品久久久| 欧美男人操女人视频| 色综合视频二区偷拍在线| 91成人影院| jizzjizz国产精品喷水| 久久国产福利国产秒拍| 亚洲美女精品视频| 国产亚洲精品免费| wwwav国产| 色婷婷综合中文久久一本| 国产毛片在线视频| 亚洲精品国产精品国自产观看浪潮| 国产一区电影| 欧美国产日韩一区| 国产电影一区二区三区爱妃记| 99高清视频有精品视频| 国际精品欧美精品| 国产九色porny| 久久成人18免费观看| 国产一卡二卡三卡四卡| 国产精品久久久久婷婷| 久久精品亚洲精品| 国产三级在线观看| 欧美精品第一页在线播放| 欧美国产日韩电影| 电影午夜精品一区二区三区| 欧美偷拍综合| 免费看又黄又无码的网站| 国内精品伊人久久久久av影院| 日韩网站在线播放| 亚洲一区二区av电影| 中文在线a天堂| 日韩电影中文字幕在线| 羞羞网站在线看| 国产日韩欧美在线看| 台湾色综合娱乐中文网| 男人天堂a在线| 国产中文字幕一区| 成人黄色免费网址| 午夜激情久久久| a网站在线观看| 自拍视频国产精品| 欧美成人精品三级网站| 精品一区二区三区国产| 激情一区二区| 永久av免费在线观看| 中文字幕一区二区不卡| 国产裸体美女永久免费无遮挡| 亚洲精品国偷自产在线99热| 亚洲91av| 99久久免费国| 一区二区在线影院| 亚洲欧美手机在线| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 色天下一区二区三区| 日本福利视频一区| 粉嫩久久99精品久久久久久夜| 日本福利片在线观看| 欧美日韩精品欧美日韩精品一综合| 免费在线看v| 国产激情视频一区| 欧美精品系列| 黄色一级二级三级| 欧美激情中文字幕| 亚洲精品一区二区二区| 中文字幕精品久久久久| 欧美日一区二区三区| 亚洲一卡二卡三卡| 精品在线亚洲视频| 日韩a级片在线观看| 欧美一区二区三区四区高清 | 日韩三级在线| 久久人人爽av| 亚洲欧美日韩久久精品| 国产视频一区二区三区四区五区| 久久伊人精品天天| 秋霞影院一区| 日韩一级性生活片| 91污片在线观看| 波多野结衣日韩| 色七七影院综合| 美女精品视频在线| 91精品国产91久久久久麻豆 主演| 成人免费视频app| 成人免费看片98欧美| 亚洲午夜精品久久久久久性色| 国产精品传媒麻豆hd| 亚洲欧洲日本国产| 国产一区二区三区观看| 97视频中文字幕| 丝袜诱惑一区二区| 日韩欧美精品一区二区三区经典| 蜜臀av一级做a爰片久久| 国产一二三区精品| 亚洲国产高清自拍| 亚洲一区二区三区四区| 免费观看中文字幕| www.亚洲色图| 中文字幕日韩三级| 久久99精品久久久久久青青91| 成人福利一区| 丝袜制服一区二区三区| 亚洲激情校园春色| 五月色婷婷综合| 国产精品爽爽ⅴa在线观看| 欧美成人tv| 91国模少妇一区二区三区| 91麻豆精品国产91久久久久久久久| xxxx在线视频| 日韩三级在线播放| 国产99久久久国产精品潘金网站| 国产www在线| 欧美精品在线免费| 加勒比久久综合| 精品无码av一区二区三区| 在线免费观看日本一区| 亚洲第一图区| 亚洲午夜精品久久久中文影院av | 欧美午夜激情影院| 欧美精品一区二区精品网| 国产一区高清| 99精品免费在线观看| 一区二区三区.www| www.亚洲资源|