精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Agent 應用于提示工程

原創 精選
人工智能
作為Agent 應用于提示工程的一種具體實現,ReAct 邁出通往通用人工智能和具象語言模型的一步。如果一個機器人有一種基于熟悉的特征對外部環境進行建模并使用該模型創建提示的方法,那么它至少可以嘗試在各種領域獨立行動,而不需要人工制作的示例。

如果Agent模仿了人類在現實世界中的操作方式,那么,能否應用于提示工程即Prompt Engingeering 呢?

從LLM到Prompt Engineering

大型語言模型(LLM)是一種基于Transformer的模型,已經在一個巨大的語料庫或文本數據集上進行了訓練,包括了互聯網上的大多數網頁。在訓練期間,需要花費大量的時間(和/或圖形處理器)、能量和水(用于冷卻) ,梯度下降法被用來優化模型的參數,以便它能夠很好地預測訓練數據。

圖片圖片

本質上,LLM 學習根據前面的詞序預測最可能的下一個詞。這可以用來執行推理即查找模型生成某些文本的可能性,或者用來生成文本,像 ChatGPT 這樣的 LLM 使用這些文本與人進行對話。一旦 LLM 完成了訓練,意味著它的參數被保存,不會向訓練數據或重新訓練的數據中添加輸入。值得注意的是,LLM 仍然會從訓練數據中學到偏見,而 ChatGPT 背后的 OpenAI 公司不得不增加安全措施,使用來自人類反饋的強化學習(RLHF)以防止該模型產生有問題的內容。此外,由于 LLM 默認情況下只是根據他們所看到的內容生成最有可能的下一個單詞,而沒有進行任何事實核查或推理,因此它們容易產生幻覺,或者編造事實,以及推理錯誤。

自從 ChatGPT 公開發布以來,LLM 風靡全球。這些模型的新興智能以及它們在我們生活中的各個方面的應用,使它們成為一種非常受歡迎的工具,每家公司都想從中分一杯羹。除了聊天機器人以及編碼和寫作助手,LLM 還被用來創建與包括互聯網在內的模擬環境交互的Agent。

如果嘗試過 ChatGPT,有時會發現它的回答很糟糕,但是如果重新措辭這個問題,可能會得到更好的結果。這就是提示工程的藝術,通過修改輸入使 LLM 以您希望的方式作出響應。提示語的背后只是嘗試通過提出一些事實來“喚醒LLM的記憶”,或者告訴它一個新的領域,然后從一個訓練好的 LLM 那里得到適當的響應。這就是所謂的上下文學習,一般主要有兩種類型: zero-shot和few-shot。zero-shot為 LLM 提供了一個提示,可以在問題/命令之前包含一些背景信息,以幫助 LLM 找到一個好的響應。few-shot給 LLM 提供了一些示例提示和可取的響應,然后提出一個新的提示,LLM 將以示例的格式響應這些提示。

提示工程可能是自然語言處理(NLP)的未來趨勢之一。這個領域正在從定制模型轉向定制提示,因為 LLM 比任何人在沒有大量時間和精力的情況下自己制作的語言模型要好得多。當 LLM 與正確的提示工程技術配對時,通常情況下,它可以完成專用模型所能完成的任何工作。

圖片圖片

從CoT到Agent

思維鏈推理(CoT)是一種流行的提示工程技術,旨在對抗推理錯誤。它包括給 LLM 提供一個或多個例子,說明如何通過語言推理解決問題,然后給它一個不同的問題,以這種方式解決。這可以幫助克服推理的錯誤,但它仍然受到幻覺的影響以及幻覺的“事實”可以通過推理傳播,導致模型得出錯誤的結論。

只提出一個問題的標準提示語被比作思維鏈(CoT)提示的輸入 ,需要多步推理才能解決問題。由于幻覺的問題,使用 CoT 提示的 LLM 有更令人信服的響應,但它仍然有可能是錯誤的。如果 LLM 要成為一個有用的工具,如果不能左右它胡編亂造,我們就永遠不能相信它們,最好還是自己做研究。而Agent似乎可以解決這個問題,允許 LLM 采取行動,比如搜索維基百科,以便從中找到事實和理由。

Agent 應用于提示工程示例——ReAct

與思維鏈推理一樣,ReAct 也是一種提示工程方法,它使用少量學習來教模型如何解決問題。CoT 被認為是模仿人類如何思考問題,ReAct 也包括了這個推理元素,但它更進一步,允許Agent操作文本,讓它與環境互動。人類使用語言推理來幫助我們制定策略并記住事情,但也可以采取行動來獲得更多的信息并實現目標。這就是 ReAct 的基礎。ReAct 提示包括行動的例子、通過行動獲得的觀察結果,以及人類在過程中各個步驟中轉錄的思想(推理策略)。LLM 學習模仿這種交叉思考和行動的方法,使其成為其環境中的Agent。

一定要記住,觀察結果不是由 LLM 生成的,而是由環境生成的,環境是一個單獨的模塊,LLM 只能通過特定的文本操作與之交互。因此,為了實現 ReAct,需要:

  1. 一種環境,它采取一個文本操作, 從一組可以根據環境的內部狀態改變的潛在操作中返回一個文本觀察。
  2. 一個輸出解析器框架,一旦Agent編寫了一個有效的操作,它就停止生成文本,在環境中執行該操作,并返回觀察結果, 一般是將其追加到目前生成的文本中,并用該結果提示 LLM。
  3. 人工產生的示例,混合了思想,行動和觀察,在環境中可以使用few-shot,例子的數量和細節取決于目標和開發者的設計,例如:

圖片

這里,思想、動作和觀察都被清楚地標記如上,而且動作使用了一種特殊的格式,查詢放在括號中,這樣Agent就可以學習以這種方式編寫任務,然后輸出解析器就可以輕松地提取查詢。

Yao 等人(2023)使用了 PalM-540B,用這個 LLM 在兩個知識密集型推理任務和兩個決策任務上測試了 基于ReAct 的提示工程效果。

知識密集型推理任務

在這個任務領域中使用的兩個域是 HotPotQA 和 FEVER,前者是使用 Wikipedia 段落進行多跳問答,后者是事實驗證。Agent可以使用以下操作與Wikipedia API 進行交互:

  • Search: 根據名稱或大多數相似結果列表查找頁面。
  • 查找: 在頁中查找字符串。
  • 以答案結束任務。

在 HotPotQA 和 FEVER 這兩個評估領域中, ReAct 與如下提示工程 技術進行了比較,結果是通過 FEVER 的準確性和 HotPotQA 中 EM 來評估的。

圖片圖片

其中:

  • 標準Prompt: 沒有思想,行動,或觀察。
  • CoT: 沒有及時的行動或觀察。
  • CoT-SC (自我一致性) : 從 LLM 中抽取一定數量的回答,并選擇大多數作為回答。
  • 動作: 沒有思維的prompt。
  • ReAct ->CoT-SC: 開始時是ReAct,然后轉換為 CoT-SC。
  • CoT-SC-> ReAct: 開始時是 CoT-SC,然后切換到 ReAct。

ReAct 在 HotPotQA 中表現不佳,但在 FEVER 中表現優于 CoT。ReAct 比 CoT 更不容易產生幻覺,但是有更高的推理錯誤率。盡管 ReAct 確實有這個缺點,但是 ReAct-> CoT-SC 和 CoT-SC-> ReAct 方法是其中最成功的。

決策任務

測試ReAct 的兩個決策任務是 ALFWorld 和 WebShop。

ALFWorld 是一個基于文本的游戲,具有真實的環境。它具有用于在模擬世界中移動和交互的文本操作,例如“打開抽屜1”給代理人的一個目標可能是在房子里找到一個特定的物體,因此常識推理有助于知道這樣一個物體通常在哪里被發現。衡量成功的標準是達到目標的試驗的百分比。

WebShop 是一個模擬在線購物網站,數據來自亞馬遜。這是一個具有挑戰性的領域,因為它有大量的行動導航網站和搜索產品。目標是找到一個符合用戶規范的項目。衡量成功的標準是所選項目與用戶心目中的隱藏項目有多接近。

從論文中的評估結果來看,ReAct 的表現明顯優于基線。

ReAct 雖然由于其推理錯誤而并不完善,但仍然是一個強有力的提示工程方法,它克服了思維鏈推理的事實幻覺問題,并且允許 LLM 成為一個可以與其環境相互作用的Agent。此外,它具有可解釋性,因為Agent在行動時輸出其思維過程。

小結

作為Agent 應用于提示工程的一種具體實現,ReAct 邁出通往通用人工智能和具象語言模型的一步。如果一個機器人有一種基于熟悉的特征對外部環境進行建模并使用該模型創建提示的方法,那么它至少可以嘗試在各種領域獨立行動,而不需要人工制作的示例。它還需要某種記憶,或者從它的經歷中學習的能力,具有常識性知識的機器人,只要能夠解決諸如推理錯誤和幻覺之類的問題,就可能對我們有很大的幫助。

BTW,擁有了大模型就可以擁有好的產品么? 產品經理的貢獻往往仍然是不可或缺的,以智能語音產品為例, 你可能需要這樣的一本案頭手冊(筆者的最新譯作),幫助自己更好的完成產品設計。

責任編輯:武曉燕 來源: 喔家ArchiSelf
相關推薦

2023-11-06 10:07:22

模型人工智能數字

2024-03-19 15:09:07

2009-06-10 15:57:49

AndroidMIPS架構

2011-05-10 09:20:30

2023-05-05 14:11:12

區塊鏈航空領域

2009-05-06 16:54:05

firefoxseo瀏覽器

2022-01-27 15:33:11

區塊鏈金融技術

2020-12-21 14:40:10

Java技術開發

2022-10-24 10:20:28

物聯網智能計量

2021-07-22 14:26:27

物聯網衛星技術IOT

2016-11-16 16:04:27

2023-06-26 17:37:54

人工智能AI

2023-09-18 18:49:45

2023-10-18 06:49:06

人工智能API安全

2009-12-29 18:17:32

Silverlight

2017-02-16 12:00:30

云平臺智慧城市云計算

2023-05-30 15:09:56

無人機無人駕駛飛行器

2009-12-16 14:45:35

Linux操作系統

2018-03-13 15:31:09

區塊鏈

2020-05-24 20:35:26

物聯網系統蜜蜂物聯網
點贊
收藏

51CTO技術棧公眾號

群体交乱之放荡娇妻一区二区| 乱人伦中文视频在线| 激情文学一区| 亚洲精品国偷自产在线99热| a级黄色一级片| 国产一区精品| 国产一区二区三区黄视频| 欧美激情伊人电影| 中文字幕在线观看免费高清| 国产精品中文| 日韩欧美精品网站| 天堂av一区二区| 超碰福利在线观看| 日韩二区三区在线观看| 欧美日本亚洲视频| 免费看污片的网站| 波多野结衣欧美| 欧美日韩一区在线| 97在线国产视频| 尤物视频在线免费观看| 99久久亚洲一区二区三区青草| 国产精品日韩精品| 激情五月色婷婷| 亚洲高清资源在线观看| 亚洲图片欧美午夜| 国内自拍偷拍视频| 欧美系列精品| 欧美性高跟鞋xxxxhd| 一区二区精品国产| 免费资源在线观看| 不卡的av电影在线观看| 91性高湖久久久久久久久_久久99| 亚洲免费黄色网址| 欧美日韩一卡| 久久亚洲精品小早川怜子66| 性欧美精品男男| 少妇高潮一区二区三区| 日韩欧美一区二区在线视频| www.超碰97.com| 51一区二区三区| 欧美日韩国产专区| www.在线观看av| a在线免费观看| 国产精品无码永久免费888| 久久久久se| 天天射天天操天天干| 国产在线精品视频| 成人网在线观看| 国产剧情精品在线| 国内国产精品久久| 91精品中国老女人| 97caocao| 国产一区二区三区不卡在线观看| 国产精品一区二区三区久久久| 欧美日韩综合一区二区三区| 久久伊人亚洲| 国产suv精品一区二区| 免费黄色网址在线| 欧美资源在线| 国产精品电影网| 免费黄色一级大片| 日韩国产成人精品| 国产欧美一区二区三区久久 | 色先锋aa成人| 日本精品久久久久中文字幕| 自拍偷自拍亚洲精品被多人伦好爽 | 精品欧美乱码久久久久久 | 99热自拍偷拍| 黄色综合网址| 91福利国产成人精品照片| 国产xxxxx视频| 精品国产黄a∨片高清在线| 欧美日韩亚洲综合在线| √天堂资源在线| 9l视频自拍九色9l视频成人| 日韩国产高清污视频在线观看| 人妻丰满熟妇av无码久久洗澡 | 97超碰在线人人| 三级在线观看视频| 欧美中文字幕一区| 国产精品久久久久久久99| 香蕉大人久久国产成人av| 亚洲大胆人体在线| 国产av自拍一区| 欧美高清在线| 久久久人成影片一区二区三区| 免费日韩一级片| 全国精品久久少妇| 97伦理在线四区| 男人天堂资源在线| 亚洲欧美日韩电影| 日本十八禁视频无遮挡| 成人视屏在线观看| 日韩三级视频在线观看| 人妻大战黑人白浆狂泄| 亚洲成人三区| 日韩美女写真福利在线观看| 国产精品久久777777换脸| 成人妖精视频yjsp地址| 日本一区视频在线观看免费| 91麻豆一二三四在线| 欧美午夜无遮挡| www.桃色.com| jlzzjlzz亚洲女人| 亚州av一区二区| 国产又粗又猛视频免费| 波多野结衣视频一区| 一区二区三区的久久的视频| 成人一级福利| 欧美一区二区大片| 国产美女免费网站| 伊人久久久大香线蕉综合直播| 国产精品视频一区国模私拍| 天天操天天干天天爽| 亚洲欧美日韩成人高清在线一区| 国产美女三级视频| 99这里只有精品视频| 久久九九热免费视频| 日本中文字幕第一页| 国产91丝袜在线观看| 亚洲一区在线免费| 成人在线视频播放| 日韩毛片中文字幕| 久久久久无码国产精品不卡| 精品无码三级在线观看视频| 日本高清不卡一区二区三| 福利影院在线看| 欧美成人一区二区三区在线观看| 黄色片网站在线播放| 久久国产福利| 韩日午夜在线资源一区二区| 中文字幕免费高清电视剧网站在线观看 | 日本一区免费视频| 国产亚洲精品网站| 久久久精品国产**网站| 欧美高跟鞋交xxxxxhd| 国产精品久久影视| 国产精品久久久久毛片软件| 无码无遮挡又大又爽又黄的视频| 91九色鹿精品国产综合久久香蕉| 久久久国产精品视频| 国产一区免费看| 久久久久99精品国产片| 欧美日本视频在线观看| 欧美三级午夜理伦三级小说| 久久久久亚洲精品成人网小说| 性色av蜜臀av| 艳妇臀荡乳欲伦亚洲一区| 中文字幕av一区二区三区人妻少妇| 不卡视频在线| 国产精品视频在线观看| 一级毛片视频在线| 欧美日韩成人一区| 亚洲熟女少妇一区二区| 美国毛片一区二区三区| 四虎影院一区二区三区 | 视频一区视频二区视频三区视频四区国产 | 国产精品福利影院| 婷婷免费在线观看| 婷婷亚洲五月色综合| 成人免费淫片aa视频免费| v片在线观看| 欧美成人免费网站| 精品深夜av无码一区二区老年| 国产成人精品影院| 黄色大片中文字幕| 小嫩嫩12欧美| 国产精品美女www| 成人在线网址| 亚洲精品一区二区三区香蕉| 亚洲伊人成人网| 久久精子c满五个校花| 国产一区二区在线免费播放| 99国产精品一区二区| 97久久夜色精品国产九色| 岛国av免费在线观看| 亚洲人成电影在线| 91麻豆成人精品国产| 亚洲在线免费播放| 亚洲欧美视频在线播放| 毛片av中文字幕一区二区| 中文字幕一区二区三区四区五区人 | 成年人看的免费视频| 韩国毛片一区二区三区| 韩国无码av片在线观看网站| 免费视频亚洲| 国产色综合天天综合网| 欧美女同一区| 日韩精品中文字幕视频在线| 中文字幕+乱码+中文乱码www | 免费视频爱爱太爽了| 色天天色综合| 91系列在线观看| 松下纱荣子在线观看| 俺去啦;欧美日韩| 人成网站在线观看| 欧洲精品视频在线观看| 欧美一区二区三区爽爽爽| 99在线视频精品| 日本人视频jizz页码69| 亚洲日本激情| 中文精品视频一区二区在线观看| 国产精品传媒| 国产精品视频xxxx| 美女高潮在线观看| 久久艳片www.17c.com| 精品99又大又爽又硬少妇毛片| 日韩一区二区在线看| 超碰在线观看91| 亚洲.国产.中文慕字在线| 精品国产大片大片大片| 91香蕉视频mp4| 一二三区视频在线观看| 美女视频黄频大全不卡视频在线播放| 黄色成人在线免费观看| 日本在线免费网| 日韩免费高清av| 一级爱爱免费视频| 欧美日韩在线一区| 久操视频免费在线观看| 国产精品成人一区二区艾草| 欧美熟妇一区二区| 成人免费观看视频| 中文字幕第66页| 麻豆91精品视频| 久久精品一区二| 中文日韩在线| 免费看欧美黑人毛片| 亚洲综合五月| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 久9久9色综合| 欧美日韩电影一区二区| 精品福利网址导航| 国产精品免费一区二区三区| 精品一区二区三区中文字幕| 国产精品中文在线| 91九色综合| 国产精品免费一区二区三区都可以| 在线观看爽视频| 91精品国产高清自在线| 91福利区在线观看| 久久久人成影片一区二区三区| 日韩另类在线| 久久91亚洲人成电影网站| av片哪里在线观看| 欧美成人一区在线| 污污视频在线| 久久久久国产视频| 国产精品偷拍| 久久免费视频在线| 国产在线观看www| 欧美做受高潮电影o| 中国色在线日|韩| 8090成年在线看片午夜| 中文字幕乱码在线播放| 日韩av片永久免费网站| 麻豆精品蜜桃| 国产日韩欧美影视| 亚洲精选av| 狠狠色综合欧美激情| 亚洲人成网站77777在线观看| 欧美日韩在线一二三| sdde在线播放一区二区| 亚洲午夜精品一区二区| 91精品一区国产高清在线gif| 国产精品久久成人免费观看| 欧美激情无毛| 国产网站免费在线观看| 日韩在线卡一卡二| 天天摸天天舔天天操| 国产福利一区在线观看| 你懂的在线观看网站| 久久久久国产精品麻豆ai换脸| 国产探花视频在线播放| 1024国产精品| 男人的天堂一区二区| 欧美日韩色一区| 亚洲va天堂va欧美ⅴa在线| 日韩成人在线免费观看| 第一福利在线| 欧美福利在线观看| 欧美日韩成人影院| 97视频资源在线观看| 色狼人综合干| 樱空桃在线播放| 99热免费精品在线观看| 色播五月综合网| 成人动漫一区二区三区| 亚洲毛片亚洲毛片亚洲毛片| 亚洲精品成人少妇| 国产尤物在线视频| 91精品国产91综合久久蜜臀| 欧美扣逼视频| 欧美高清在线视频观看不卡| 成人影院网站| 不卡一区二区三区视频| 不卡日本视频| 男人和女人啪啪网站| 经典一区二区三区| 亚洲国产欧美视频| 亚洲乱码国产乱码精品精98午夜 | 亚洲插插视频| 91麻豆国产语对白在线观看| 亚洲黄页网站| 日本wwwcom| 国产一区二区三区免费观看| 蜜臀久久99精品久久久久久| 亚洲一区二区五区| 一级淫片免费看| 亚洲欧洲偷拍精品| 丁香花在线影院| 成人亚洲激情网| 国内精品久久久久久99蜜桃| 国产欧美日韩小视频| 九一久久久久久| 国产又大又粗又爽的毛片| 五月天久久比比资源色| 亚洲成人77777| 久色乳综合思思在线视频| 国产一区二区三区影视| 国产一区免费在线观看| 欧美激情第10页| 国产乱码一区二区三区四区| 中文字幕乱码久久午夜不卡| 影音先锋在线国产| 亚洲成人1234| 国产美女一区视频| 国产成人精品自拍| 亚洲欧美一级二级三级| 国内av免费观看| 亚洲丝袜制服诱惑| 一级欧美一级日韩| 中文字幕亚洲一区| jvid一区二区三区| 日本欧洲国产一区二区| 狂野欧美性猛交xxxx巴西| 欧美做受喷浆在线观看| 亚洲妇熟xx妇色黄| 全国男人的天堂网| 91精品国产精品| 日本在线中文字幕一区| 久久亚洲中文字幕无码| 成人福利在线看| 看片网址国产福利av中文字幕| 欧美精品一区二区精品网| 欧美人与性动交α欧美精品济南到| 99porn视频在线| 欧美天堂亚洲电影院在线观看 | 国产精品拍天天在线| 中文字幕av第一页| 曰本色欧美视频在线| 国产福利91精品一区二区| 色综合电影网| 久久精品999| 国产美女福利视频| 日韩精品中文字幕在线一区| 免费网站在线观看人| 韩国一区二区三区美女美女秀| 午夜在线精品偷拍| 色欲AV无码精品一区二区久久| 欧美丝袜自拍制服另类| a√资源在线| 92看片淫黄大片欧美看国产片| 欧美xxx在线观看| 三级视频网站在线观看| 日韩欧美高清视频| 超碰免费在线| 91在线视频九色| 亚洲精华国产欧美| 一级片视频免费看| 在线成人免费观看| 日本天码aⅴ片在线电影网站| 国产一区二区自拍| 久久综合九色| 久久精品黄色片| 亚洲国产女人aaa毛片在线| 我爱我色成人网| 亚洲第一精品区| 99久久国产免费看| 中文字幕av在线免费观看| 九九热这里只有在线精品视| 欧美日韩看看2015永久免费| 一区二区三区入口| 伊人色综合久久天天人手人婷| 午夜成人免费影院| 国产精品影院在线观看| 1024日韩| 日本 欧美 国产| 亚洲精品久久久久久下一站| 99蜜月精品久久91| 黄色一级片黄色| 中文子幕无线码一区tr| 精品久久国产视频| 日韩av成人在线| 欧美区国产区| 我不卡一区二区| 亚洲国产一区二区三区在线观看| 久久69成人| 国产免费毛卡片| 亚洲美女淫视频|