精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RePrompt:提示詞自動化優化策略 精華

發布于 2024-6-21 15:50
瀏覽
0收藏

1. 為什么要提出 RePrompt?

大語言模型問世后,在多項任務上取得成功,并且通過LLM智能體的研發,拓展了大語言模型在自動駕駛、機器人控制等更廣泛領域的應用。

但是這些應用的成功,都得益于提示工程的作用。不同的提示詞可以顯著影響任務的成功率,所以有人提出了APE(自動提示工程),可以使得大語言模型自動撰寫提示詞,相比簡單提示詞,找到更快找到更好的提示詞。

但是APE在收斂到高質量提示詞需要時間和計算資源,且當前應用框架存在局限,難以超越精心編寫的提示。LLMs在理解不同提示對自身的影響上,并不比人類更勝一籌。無法學習新發現的范式,而人類在嘗試如GPT-4或LLAMA-2等流行模型時,能不斷獲得編寫優質提示的新思路。LLMs在面對潛在失敗時,往往無法識別正確解決方案,僅對提示進行微小調整,而未能實現真正的改進。

所以作者提出了一種新的自動提示詞優化方法:RePrompt,結合了CoT(思維鏈)和 ReAct的實踐,并利用這些結果的對話歷史更新提示詞,通過總結并逐句優化對話歷史。RePrompt聚焦于使用LLM進行特定推理任務的場景,比如旅行規劃、輔助編程等。

2. RePrompt的工作原理

RePrompt是一種基于交互式動作生成的提示優化工具,與傳統的機器學習訓練過程相似,但訓練對象是輸入模型的提示詞,而非模型參數本身。

本文致力于通過優化提示來完善LLM代理的規劃能力。我們著眼于任務已知的LLM代理問題,以OpenAI的多樣GPT模型為例。我們提出的RePrompt方法,是一種基于交互式動作生成的提示優化工具,

RePrompt訓練需要一個小規模的推理任務數據集,首先讓LLM使用當前的提示生成回答。這個過程可能包括與反饋提供者如ReAct或Reflexion的交互,但不對交互方式或反饋的準確性設限,也稱之為行為循環。

收集到一批聊天歷史后,將這些歷史數據輸入LLM模型中,以提煉出最關鍵的焦點。這些焦點可能是頻繁出現并導致長迭代的問題,或者是有助于生成更好回答的特定建議(比如ReAct里的thought)。

要求總結團隊對不同情景進行提煉,去除特定情景信息和建議,同時避免過度總結,以免需要額外推理能力或在LLM對任務不夠擅長時引入錯誤。

與先前的自動提示工程工作相比,如APE和ProTeGi,通過批量總結來防止提示優化過程過度擬合到單一異常數據點上。

利用總結的典型錯誤,使用另一個LLM來更新實際提示,并要求優化器LLM在提出潛在解決方案時遵循以下規則:

? 改進應集中于通用提示部分,而非隨著數據變化的情景特定提示。

? 改進應優先識別特定問題是否出現在給定情景中。例如,如果存在預算限制,而歷史記錄顯示這可能是導致解決方案失敗的主要問題,那么在提供解決方案時,應嘗試使用工具計算典型計劃的成本。如果違反了預算約束,應優先考慮預算約束;否則,應忽略這個問題。

根據上面提到的原則,RePrompt的具體實現步驟如下:

? 1.針對問題提出幾種可能的解決方案。

? 2.逐一分析這些方案,找出最符合規則的那一個。

? 3.挑選出最佳方案。與APE及后續一些研究不同,不要求LLM給出句子的具體數值評估

? 4.剖析原提示中的原始步驟,判斷所選方案是否應前置于當前步驟,或該方案是否為步驟的具體細節,需要用方案替換當前步驟的提示。如果屬于步驟,在此添加提示。

? 5.輸出融合了原始提示和更新提示的最終版本。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

上圖是RePrompt算法的偽代碼實現。

完成這些步驟后,將獲得一個經過更新的提示,并可以繼續迭代,類似于機器學習模型訓練的更多輪次,直至提示收斂。這個收斂后的提示詞有助于提升首輪生成結果的質量。

在測試階段,只需應用這個經過收斂的更新提示,并在新的測試集上進行測試。測試時,不必要求與生成響應完全相同的流程,例如,如果反饋生成成本高昂,可以完全從行為環節中移除。

請注意,在優化過程中,RePrompt僅調整分步指導環節,而非問題描述或格式要求的其他部分。這將導致算法最終可能形成兩種提示格式:

? 如果當前提示類似ReAct風格,已包含分步指導,例如ReAct中的思考步驟,用以囊括所有潛在分析,我們的提示將通過不斷添加提示來更新這一思考步驟。與動態引入提示的其他提示工程相比,RePrompt 成為一個提供更具體分析焦點的算法。

? 如果提示是分步的,如解決數學或邏輯問題,RePrompt 很可能向計劃生成的程序中增加更多步驟。這將為規劃過程提供更明確的嘗試和關注方向,引導LLM得出正確答案,并充當將高級任務細化的規劃者。

盡管ICL(語境學習)對推理效果影響很大,但是如果每一步都更新示例會存在一些困難,所以RePrompt沒有對提示詞中的示例進行修改。而且示例一般是對LLM的輸出格式、相關能力的指導,而不是如何給出具體的分步提示,所以作者也沒有發現不更新這些示例帶來的任何實際問題。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

上圖提示詞提取優化提示的損失值。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

上圖提示詞用于在優化后的提示中定位并修正占位符。

RePrompt:提示詞自動化優化策略-AI.x社區圖片

3. 局限性

RePrompt 并不一定每次都能成功創建更優質的提示。作者列舉了常見的幾類錯誤:

3.1 不完整的提示詞

RePrompt:提示詞自動化優化策略-AI.x社區圖片

RePrompt 有時會生成不完整的提示詞。如上圖所示,LLMs可能僅輸出一個需要用戶自行復制粘貼補全的提示模板。這種情況通常發生在初始提示較長時,推測LLMs傾向于盡可能簡短地響應,卻未能遵循生成完整提示的指令。為解決這一問題,引入了一個額外的LLM來協助填充模板,并在附錄中提供了該LLM的提示。這一額外步驟幫助我們在旅行規劃領域成功生成了完整的提示。我們沒有采用基于規則的自動修復工具,因為生成的提示模板可能包含多種符號,如 <> 或 {}。為了簡化工作流程,我們讓LLM自動識別并替換這些符號。

3.2 偶然的錯誤更改

在某些情況下,特定領域的輸出格式可能與常用格式相似,導致LLMs錯誤地更改提示的某些部分。例如,在PDDL領域,要求LLMs生成動作的前提條件,而非完整的PDDL文件。實驗中,即便提示明確指示LLMs不得更改任何內容,尤其是輸出格式,但更新后的提示有時會錯誤地改變輸出格式,如將"Preconditions"的大寫錯誤地更改為小寫的"precondition"。為糾正這一問題,依賴語法檢查器的反饋。盡管生成的結果可能存在錯誤,但它們應當在語法上正確且完整。如果語法分析器無法從LLMs的輸出中找到"Precondition"一詞,即表明使用的提示有誤,會重新運行REPROMPT來生成正確的提示。鑒于當前代碼的失敗率不到10%,這一臨時方案已足夠應對。

3.3 其他局限性

? 首先,優化提示的過程與微調類似,意味著提示詞的質量受限于訓練數據,可能會影響LLMs的泛化能力。換言之,如果訓練數據中出現的特異性僅存在于特定場景而不具備普遍性,優化后的提示可能反而不如原始版本高效。

? 其次,提示有效性依賴于LLM代理能夠使用的全面工具集。由于優化策略直接源自LLMs,而非通過搜索算法得出,REPROMPT可能會提議使用一些在實際環境中并不可用的統計工具??紤]將LLM自行編碼那些額外的、常用但當前不可用的工具,作為未來研究的方向。

? 再者,無法控制的反饋生成器有時可能產生無效甚至錯誤和誤導的反饋。鑒于REPROMPT基于反饋進行總結,如果反饋經常出現錯誤,REPROMPT會將這些錯誤納入提示中。由于本文未考慮從提示中移除無效步驟,這樣的錯誤將徒增使用的標記數量,卻無助于提升結果質量。未來的研究可以考慮引入基于搜索的機制來識別并修復這類錯誤,但這可能需要更多來自環境的真實反饋,并可能限制其在特定領域的應用。

? 最后,RePrompt 在提示階段就進行規劃,這可能不適用于需要完全不同處理流程的廣泛領域,例如解決數學問題的LLM代理。然而,對于特定任務,如利用LLM代理解決高中幾何問題,我們的方法能夠高效地學習規劃,實驗結果已經證明了這一點。

? 論文原文: https://arxiv.org/abs/2406.11132

RePrompt:提示詞自動化優化策略-AI.x社區

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2024-6-21 17:47:18修改
收藏
回復
舉報
回復
相關推薦
亚洲综合图片区| 国产成人免费视频一区| 中文字幕精品久久| 午夜不卡福利视频| 欧美激情成人动漫| 91片在线免费观看| 国产欧洲精品视频| 精国产品一区二区三区a片| 欧美成人基地| 欧美日韩一区二区三区四区| 9l视频自拍9l视频自拍| 少妇喷水在线观看| 欧美aⅴ一区二区三区视频| 久久综合国产精品台湾中文娱乐网| 日日碰狠狠添天天爽超碰97| eeuss影院www在线观看| 国产不卡在线视频| 国产成人涩涩涩视频在线观看| 亚洲一级理论片| 一区二区三区免费在线看| 色综合久久综合中文综合网| 成人在线免费观看网址| 青青视频在线观| 国产一区二区久久| 国产成人中文字幕| 国产污片在线观看| 91视频综合| 亚洲精品国产精品久久清纯直播| 黑森林精品导航| 丰满诱人av在线播放| 国产日韩欧美电影| 好吊妞www.84com只有这里才有精品 | 欧美巨大xxxx做受沙滩| 久久午夜国产精品| 99在线视频免费观看| 自拍偷拍福利视频| 亚洲影院在线| 久久国产精品影片| 欧美激情久久久久久久| 美日韩黄色大片| 欧美一区二区三区免费观看视频| 久艹在线免费观看| 国产福利在线播放麻豆| 欧美国产一区二区在线观看 | 高清久久一区| 日本福利一区二区| 黄色影院一级片| 999精品网| 一区二区高清在线| 国产av第一区| 浪潮av一区| 国产精品欧美一区二区三区| 欧美激情www| 污污的视频网站在线观看| 国产精品亚洲成人| 91手机在线播放| 国产精品毛片一区二区在线看舒淇| 天堂资源在线中文精品| 97色在线观看| 亚洲国产成人精品激情在线| aa级大片欧美三级| 91精品国产91久久久久久最新 | 不卡精品视频| 337p亚洲精品色噜噜| 国内国产精品天干天干| 免费一区二区三区四区| 欧美人与性动xxxx| 三级黄色在线观看| 欧美色图另类| 成年人国产精品| 国产精品 日韩| а√天堂资源在线| 国产黄色精品视频| 国产精品亚洲综合| 天堂网在线播放| 91亚洲资源网| 欧美日韩一区二| 成年在线电影| 国产精品第一页第二页第三页| 欧美久久久久久一卡四| 九色网友自拍视频手机在线| 久久精品亚洲麻豆av一区二区| 精品国产乱码久久久久| 五月激情婷婷网| 成人av网站免费观看| 精品乱码一区| 国产小视频免费在线观看| 国产午夜精品福利| 一区二区三区四区久久| 久久久久黄久久免费漫画| 亚洲福利一区二区| 欧美视频第一区| 丁香婷婷久久| 日韩精品在线一区| 亚洲永久无码7777kkk| 女优一区二区三区| 日韩视频免费在线观看| 豆国产97在线 | 亚洲| 亚洲综合不卡| 国产自产女人91一区在线观看| 国产又黄又粗又长| 成人免费看视频| 欧美日韩精品综合| av在线免费网址| 婷婷中文字幕综合| 狠狠躁狠狠躁视频专区| 亚洲网一区二区三区| 亚洲欧洲日本专区| 天天做夜夜爱爱爱| 国产农村妇女精品一区二区| 成人久久精品视频| 三级毛片在线免费看| 国产精品久久久久久户外露出 | 亚洲精品久久视频| 蜜桃av免费观看| 精品成人在线| 国产精品日韩电影| 姝姝窝人体www聚色窝| 中文欧美字幕免费| 日本中文字幕网址| 999色成人| 亚洲性生活视频| 久久亚洲AV无码| 蜜桃视频一区二区三区在线观看| av一区和二区| 69久久精品| 精品久久久久人成| 三级黄色片播放| 欧美日韩第一| 青草成人免费视频| 国产成人手机在线| 综合激情成人伊人| www.色就是色| 亚欧洲精品视频在线观看| 久久偷看各类女兵18女厕嘘嘘 | 色av一区二区| 成人做爰www看视频软件| 91综合久久| 国产精品99久久久久久久久| 天堂资源中文在线| 亚洲综合色丁香婷婷六月图片| 一区二区在线播放视频| 亚洲精品aaaaa| 性欧美在线看片a免费观看| 国产欧美熟妇另类久久久 | 国产精品久久一区| 蝌蚪视频在线播放| 精品免费在线观看| 久久久久亚洲无码| 极品尤物久久久av免费看| 999视频在线免费观看| 黄网站免费在线观看| 欧美卡1卡2卡| 精品在线观看一区| 久久精品国产在热久久| 亚洲综合第一| 成人午夜毛片| 一区二区三区在线播放欧美| 激情视频网站在线观看| 91香蕉视频mp4| 久久国产成人精品国产成人亚洲 | 鬼打鬼之黄金道士1992林正英| 日韩av中文| 欧美亚州韩日在线看免费版国语版| 欧美黑人欧美精品刺激| 日韩午夜av| 久久免费看av| 视频在线日韩| 色噜噜国产精品视频一区二区| av首页在线观看| 国产三级精品视频| 天堂在线资源视频| 欧美第十八页| 97碰碰视频| 久草在线中文最新视频| 亚洲毛片在线观看.| 国产成人无码av| 国产日韩欧美不卡| 国产女同无遮挡互慰高潮91| 欧美日韩网站| 久久久久久久久久码影片| 三上悠亚一区二区| 亚洲欧美制服第一页| 中国黄色一级视频| 亚洲欧美电影院| 日本护士做爰视频| 免费一级片91| 免费cad大片在线观看| 97久久精品| 国产成人综合亚洲| av小次郎在线| 国产丝袜精品视频| 国产精品-色哟哟| 亚洲国产三级在线| 亚洲AV无码成人精品区明星换面| 另类小说综合欧美亚洲| 免费网站永久免费观看| 国产成人黄色| 97久草视频| 欧美黄色三级| 欧美日韩福利在线观看| 国产在线视频福利| 日韩一级完整毛片| www毛片com| 亚洲精品日产精品乱码不卡| 欧美狂猛xxxxx乱大交3| 国产精品一区二区久久不卡| 红桃av在线播放| 亚洲精彩视频| 欧美日韩三区四区| 日韩精品一区二区三区中文字幕 | 91精品啪在线观看国产60岁| 免费日韩一级片| 中文字幕一区二区三区四区不卡| 久久久久亚洲av成人网人人软件| 视频在线观看一区| 日本wwwcom| 国产精品久久久久久久久久10秀| 国产欧美韩日| www.久久久久爱免| 国产精品九九久久久久久久| 国产丝袜在线观看视频| 中文字幕亚洲精品| 手机福利小视频在线播放| 欧美一区二区三区视频在线| 中文字幕一区二区人妻视频| 亚洲五月六月丁香激情| 欧美一级片在线视频| 国产婷婷精品av在线| 毛茸茸free性熟hd| 国产在线国偷精品免费看| 国产一线二线三线在线观看| 亚洲精品字幕| 17c丨国产丨精品视频| 欧美mv日韩| 日韩色妇久久av| 蜜臀av免费一区二区三区| 国产偷久久久精品专区| 日韩免费一级| 亚洲xxxxx| 日韩午夜电影免费看| 国产精品久久久久久久7电影| 国产深夜视频在线观看| 欧美成aaa人片免费看| 日本视频在线免费观看| 深夜福利一区二区| 国产黄色片在线播放| 亚洲欧美一区二区激情| 午夜激情在线视频| 日韩av在线直播| 天天干天天干天天干| 亚洲成人xxx| 少妇高潮久久久| 亚洲精品www| 日韩在线观看视频网站| 亚洲成人精品久久久| 刘亦菲久久免费一区二区| 欧美成人性战久久| 成人黄色在线观看视频| 欧美不卡视频一区| 亚洲av无码一区二区乱子伦| 日韩欧美成人一区| 成人午夜免费在线观看| 亚洲第一天堂av| 色天堂在线视频| 亚洲欧洲在线视频| 高清在线观看av| 久久精品91久久香蕉加勒比| 超碰porn在线| 欧美国产极速在线| 女人高潮被爽到呻吟在线观看| 97在线精品国自产拍中文| 九色porny自拍视频在线观看 | 日本午夜大片a在线观看| 欧洲亚洲免费在线| 久久久人成影片一区二区三区在哪下载| 欧美一区二区三区精品电影| 天天免费亚洲黑人免费| 国产精品一区二区三区久久久 | 久久在线视频| 蜜桃网站在线观看| 一本久道久久久| 国产又黄又猛视频| 蜜臂av日日欢夜夜爽一区| 国产精品久久久久久9999| 成人免费视频一区| 色无极影院亚洲| 亚洲欧美自拍偷拍色图| 国产在线观看成人| 欧美日韩中文字幕日韩欧美| 久久久999久久久| 在线成人小视频| 五月婷婷丁香六月| 中文字幕日韩电影| 污片在线免费观看| 热久久这里只有| 国产精品久久久久久久久久辛辛 | 国产亚洲精品美女| 69xxx在线| 欧美性视频网站| 亚洲视频自拍| 精品久久sese| 99热在线成人| 99热在线这里只有精品| 久久精品国产一区二区| 中文字幕一区二区人妻电影丶| 26uuu另类欧美亚洲曰本| 黄色av片三级三级三级免费看| 亚洲精品综合在线| 黄色一级视频免费看| 在线电影欧美成精品| 青青草在线视频免费观看| 久久精品亚洲94久久精品| 永久免费毛片在线播放| 亚洲一区二区自拍| 九九在线精品| 日本wwwcom| 久久99国产精品尤物| 99久久久久久久久久| 亚洲毛片av在线| 在线免费观看av网址| 精品毛片乱码1区2区3区| av在线播放av| 538国产精品视频一区二区| www久久久| 亚洲国产午夜伦理片大全在线观看网站 | 亚洲狼人精品一区二区三区| 免费看黄色一级大片| 99re这里都是精品| 538精品在线视频| 91精品办公室少妇高潮对白| 少妇av一区二区| 欧美精品在线观看| 成人午夜在线| 欧美精品二区三区四区免费看视频| 999成人精品视频线3| 农村妇女精品一二区| 99久久伊人精品| 免费看一级一片| 欧美一区二区视频在线观看 | 日韩欧美电影在线| 黄视频网站在线| 国产精品永久免费视频| 国产亚洲第一伦理第一区| 国产中文字幕视频在线观看| 成人激情综合网站| 免费在线一级片| 日韩一区二区精品| 国产在线激情视频| 91免费视频网站| 午夜精品视频一区二区三区在线看| 欧美视频免费播放| 91免费视频网址| 一级片视频在线观看| 亚洲精品视频在线观看视频| 男人av在线播放| 美女三级99| 亚洲专区免费| av网在线播放| 欧美亚洲一区二区在线| 国产黄色免费在线观看| 国产精品成人久久久久| heyzo久久| 亚洲精品综合在线观看| 亚洲欧美偷拍三级| 亚洲精品911| 性色av一区二区三区| 私拍精品福利视频在线一区| 国产l精品国产亚洲区久久| 久久新电视剧免费观看| 成人午夜精品视频| 中文欧美日本在线资源| 999色成人| 97中文字幕在线| 91在线视频网址| 亚洲成人第一网站| 最近2019中文字幕第三页视频| 国产综合色区在线观看| 亚洲草草视频| 国产91丝袜在线观看| av大片免费在线观看| 亚洲视频专区在线| av在线精品| 久久久性生活视频| 国产欧美一区二区精品忘忧草| 性色av一区二区三区四区| 久久精彩免费视频| 激情亚洲另类图片区小说区| 那种视频在线观看| 中文字幕中文乱码欧美一区二区| 国产免费福利视频| 性色av一区二区三区免费| 成人av资源电影网站| 国产男女无遮挡猛进猛出| 精品久久中文字幕久久av| 91精品大全| 国产精品麻豆免费版| 日韩成人一级大片| www青青草原| 亚洲免费视频网站|