精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

重要的事情說兩遍!Prompt「復(fù)讀機(jī)」,顯著提高LLM推理能力

人工智能
盡管大模型能力非凡,但干細(xì)活的時(shí)候還是比不上人類。為了提高LLM的理解和推理能力,Prompt「復(fù)讀機(jī)」誕生了。

眾所周知,人類的本質(zhì)是復(fù)讀機(jī)。

我們遵循復(fù)讀機(jī)的自我修養(yǎng):敲黑板,劃重點(diǎn),重要的事情說三遍。

but,事實(shí)上同樣的方法對(duì)付AI也有奇效!

有研究證明,在提問的時(shí)候故意重復(fù)一遍——也就是復(fù)制粘貼,即可顯著提高LLM的推理能力。

圖片圖片

論文地址:https://arxiv.org/pdf/2309.06275

看下面的例子:

圖片圖片

作者認(rèn)為,通常情況下,問題中的重點(diǎn)token(比如這里的tennis balls)無法看到位于它后面的token(上圖)。

相比之下,使用重讀(re-reading,RE2)的方法,允許「tennis balls」在第二遍中看到自己對(duì)應(yīng)的整個(gè)問題(How many tennis balls does he have now?),從而達(dá)到雙向理解的效果(下圖)。

圖片圖片

實(shí)驗(yàn)表明,在14個(gè)數(shù)據(jù)集上的112個(gè)實(shí)驗(yàn)中,RE2技術(shù)都能帶來一致的性能提升,無論是經(jīng)過指令調(diào)整的模型(如ChatGPT),還是未經(jīng)調(diào)整的模型(如Llama)。

實(shí)踐中,RE2作為獨(dú)立的技巧,可以與CoT(Let’s think step by step)以及自我一致性方法(self-consistency,SC)一起使用。

下表展示了混合應(yīng)用多種方法對(duì)模型效果的影響。盡管自我一致性聚合了多個(gè)答案,但重讀機(jī)制仍然有助于大多數(shù)場(chǎng)景的改進(jìn)。

圖片圖片

接下來,在GSM8K數(shù)據(jù)集上(使用ChatGPT)進(jìn)一步研究輸入問題復(fù)雜性對(duì)CoT和RE2提示的推理性能的影響。

這里通過計(jì)算真實(shí)解釋中存在的推理步驟來衡量問題的復(fù)雜性,結(jié)果如下圖所示。

圖片圖片

隨著問題復(fù)雜性的增加,所有提示的表現(xiàn)通常都會(huì)下降,但重讀的引入提高了LLM應(yīng)對(duì)各種復(fù)雜問題的表現(xiàn)。

此外,作者還計(jì)算了各代和輸入問題之間的覆蓋度,證明RE2增加了輸出解釋中的n-gram (n=1,2,3,4) 召回率。

重要的事情說2遍

現(xiàn)有的推理研究主要集中在設(shè)計(jì)多樣化引導(dǎo)提示,而對(duì)輸入階段的理解卻很少受到關(guān)注。

事實(shí)上,理解是解決問題的第一步,至關(guān)重要。

當(dāng)今大多數(shù)LLM都采用單向注意力的decoder-only架構(gòu) ,在對(duì)問題進(jìn)行編碼時(shí),單向注意力限制了token的可見性,這可能會(huì)損害對(duì)問題的全局理解。

怎么解決這個(gè)問題?作者受到人類習(xí)慣的啟發(fā),嘗試讓LLM把輸入再讀一遍。

與引導(dǎo)模型在輸出中推理的CoT不同,RE2通過兩次處理問題將焦點(diǎn)轉(zhuǎn)移到輸入,促進(jìn)了單向解碼器的雙向編碼,從而增強(qiáng)LLM理解過程。

圖片圖片

上圖為GSM8K數(shù)據(jù)集上測(cè)試的注意力分布圖,較暗的單元格表示較高的注意力。

上虛線三角形內(nèi)的區(qū)域表明,第二遍輸入中的每個(gè)token都明顯關(guān)注第一遍中的后續(xù)token,證明LLM的重讀有望實(shí)現(xiàn)對(duì)問題的雙向理解。

從另一個(gè)角度考慮,重讀使LLM能夠?yàn)檩斎刖幋a分配更多的計(jì)算資源,類似于水平增加神經(jīng)網(wǎng)絡(luò)的深度。因此,擁有RE2的LLM對(duì)問題有更深入的理解。

普通推理

利用帶有CoT提示的LLM來解決推理任務(wù),可以用公式表述為:

圖片圖片

其中,Cx表示提示輸入,來自帶有CoT提示指令的模板,z表示自然語(yǔ)言中的采樣基本原理。

因此, LLM可以將復(fù)雜的任務(wù)分解為更易于管理的推理步驟,將每個(gè)步驟視為整個(gè)解決方案鏈的組成部分。

RE2 推理

受到人類重讀策略的啟發(fā),將上面的方程改寫為:

圖片圖片

所以RE2在實(shí)際應(yīng)用中就是下面這種格式:

圖片圖片

其中{Input Query}是輸入查詢的占位符,左側(cè)部分可以包含其他引發(fā)思考的提示。

實(shí)驗(yàn)

由于RE2的簡(jiǎn)單性和對(duì)輸入階段的重視,它可以與各種LLM和算法無縫集成,包括few-shot、自我一致性、各種引發(fā)思考的提示策略等。

為了驗(yàn)證RE2的有效性和通用性,研究人員在14個(gè)數(shù)據(jù)集上進(jìn)行了112個(gè)實(shí)驗(yàn),涵蓋算術(shù)、常識(shí)和符號(hào)推理任務(wù)。

算術(shù)推理

實(shí)驗(yàn)考慮以下七個(gè)算術(shù)推理基準(zhǔn):

數(shù)學(xué)應(yīng)用題的GSM8K基準(zhǔn)、具有不同結(jié)構(gòu)的數(shù)學(xué)應(yīng)用問題的SVAMP數(shù)據(jù)集、不同數(shù)學(xué)應(yīng)用題的ASDiv數(shù)據(jù)集、代數(shù)應(yīng)用題的AQuA數(shù)據(jù)集、三到五年級(jí)學(xué)生的加法和減法數(shù)學(xué)應(yīng)用題、多步驟數(shù)學(xué)問題數(shù)據(jù)集,以及單次運(yùn)算的初等數(shù)學(xué)應(yīng)用題數(shù)據(jù)集。

圖片圖片

上表為算術(shù)推理基準(zhǔn)測(cè)試結(jié)果。*處表示不使用任何技巧,但效果優(yōu)于CoT提示的情況。

常識(shí)和符號(hào)推理

對(duì)于常識(shí)推理,實(shí)驗(yàn)采用StrategyQA、ARC和CSQA數(shù)據(jù)集。

StrategyQA數(shù)據(jù)集包含需要多步驟推理的問題;

ARC數(shù)據(jù)集(ARC-t)分為兩個(gè)集合:挑戰(zhàn)集(ARC-c)和簡(jiǎn)單集(ARC-e),前者包含基于檢索和單詞共現(xiàn)算法都錯(cuò)誤回答的問題;

CSQA數(shù)據(jù)集由需要各種常識(shí)知識(shí)的問題組成。

實(shí)驗(yàn)評(píng)估兩個(gè)符號(hào)推理任務(wù):日期理解和Coinflip。日期理解是 BigBench數(shù)據(jù)集的子集,Coinflip是一個(gè)問題數(shù)據(jù)集,根據(jù)問題中給出的步驟,判斷硬幣翻轉(zhuǎn)后是否仍然正面朝上。

圖片圖片

結(jié)果表明,除了普通ChatGPT上的某些場(chǎng)景之外,具有簡(jiǎn)單重讀策略的RE2,持續(xù)增強(qiáng)了LLM的推理性能。

RE2展示了跨各種LLM的多功能性(Text-Davinci-003、ChatGPT、LLaMA-2-13B和LLaMA-2-70B),涵蓋指令微調(diào) (IFT) 和非IFT模型。

作者還對(duì)RE2在零樣本和少樣本的任務(wù)設(shè)置、思維引發(fā)的提示方法以及自洽設(shè)置方面進(jìn)行了探索,突出了其通用性。

Prompting

實(shí)驗(yàn)嚴(yán)格評(píng)估RE2模型在兩種基線提示方法上的性能:Vanilla(不添加特技)和CoT(通過逐步的思維過程來指導(dǎo)模型)。

圖片圖片

針對(duì)不同的任務(wù),作者在提示中設(shè)計(jì)了答案格式指令,以規(guī)范最終答案的結(jié)構(gòu),便于精確提取答案。

圖片圖片

實(shí)驗(yàn)的解碼策略使用貪婪解碼,溫度設(shè)置為0,從而產(chǎn)生確定性輸出。

最后探索一下問題重讀次數(shù)對(duì)推理性能的影響:

圖片圖片

上圖展示了兩個(gè)不同的LLM的表現(xiàn)如何隨問題重讀次數(shù)的變化而變化。我們可以發(fā)現(xiàn)重讀2次使性能提高,之后隨著問題重讀次數(shù)增加,性能開始下降。

猜測(cè)原因有兩個(gè):i)過度重復(fù)問題可能會(huì)起到示范作用,鼓勵(lì)LLM重復(fù)問題而不是生成答案,ii)重復(fù)問題會(huì)顯著增加推理和預(yù)訓(xùn)練之間的不一致。

參考資料:https://arxiv.org/pdf/2309.06275


責(zé)任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2025-03-24 11:01:41

2017-12-26 14:17:24

潤(rùn)乾報(bào)表

2023-11-03 13:07:00

AI模型

2025-10-20 02:11:00

2011-11-01 09:31:16

寫代碼程序需要進(jìn)化

2014-06-20 09:35:09

產(chǎn)品經(jīng)理

2009-03-13 15:32:49

程序員論文架構(gòu)師

2024-07-05 15:06:00

2024-07-08 06:30:00

2023-02-09 15:48:15

模型研究

2025-03-07 09:34:14

2025-05-30 10:50:27

2024-12-23 07:20:00

LLM逆向思維語(yǔ)言模型

2025-04-24 10:26:40

2025-03-03 09:40:00

2025-10-10 02:00:00

2012-04-10 10:01:10

Ubuntu安裝事項(xiàng)

2025-05-08 02:02:02

2024-11-27 10:23:31

2025-01-14 13:52:56

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧洲精品二区| 精品无码久久久久久久| 鲁鲁在线中文| 久久亚洲精精品中文字幕早川悠里 | 欧美日韩国产精品激情在线播放| 香蕉视频免费在线看| 亚欧成人精品| 久久精品视频网站| 中文字幕人妻一区| 欧美成人免费电影| 国产精品乱人伦| av一区二区三区四区电影| 日本免费一二三区| 欧美午夜精品一区二区三区电影| 欧美一区二区视频网站| 欧美国产激情视频| 黄视频网站在线| 99久久99久久综合| 国产精品视频yy9099| 欧美成欧美va| 菠萝蜜一区二区| 日本中文字幕不卡| 日韩精品免费在线播放| 超碰超碰在线观看| 成年网站在线视频网站| 国产日产欧美精品一区二区三区| 2019中文字幕在线| 午夜三级在线观看| 久久久久观看| 91麻豆精品91久久久久久清纯| 久久视频这里有精品| 性开放的欧美大片| 国产精品一级片在线观看| 欧美一区二区三区免费视| 国产又黄又爽又无遮挡| 成人免费a**址| 亚洲国产精品va在线看黑人动漫| 男人添女人下面免费视频| 国产精品电影| 夜夜嗨av一区二区三区中文字幕 | 免费国产自久久久久三四区久久| 欧美日韩午夜| 日韩精品高清视频| 国产无遮挡猛进猛出免费软件 | 亚洲肉体裸体xxxx137| 欧美丰满嫩嫩电影| 黄色国产精品视频| 97天天综合网| 亚洲乱码日产精品bd| 日韩影视精品| 久蕉在线视频| 97精品国产97久久久久久久久久久久| 国产精品视频中文字幕91| 97人人澡人人爽人人模亚洲| 欧美另类女人| 伊人久久免费视频| 亚洲a v网站| 亚洲影院天堂中文av色| 亚洲国产成人精品电影| 国产成人精品综合久久久久99| 激情久久一区二区| 欧美性色黄大片手机版| 男人插女人下面免费视频| 在线观看欧美日韩电影| 精品动漫一区二区| 国产素人在线观看| 黄色在线网站噜噜噜| 亚洲一区二区精品视频| 久青草视频在线播放| 国产偷倩在线播放| 亚洲乱码中文字幕| 国产免费内射又粗又爽密桃视频| 在线网址91| 亚洲国产人成综合网站| 日本a视频在线观看| 6699嫩草久久久精品影院| 亚洲国产日产av| 国产精品又粗又长| 麻豆视频在线观看免费网站黄| 亚洲mv在线观看| 日韩在线一级片| 日韩大尺度黄色| 欧美日韩亚洲国产综合| 网站在线你懂的| 日本亚州欧洲精品不卡| 精品国产免费视频| 国产精品伦子伦| 免费av一区| 日韩中文有码在线视频| 黄色a级片在线观看| 午夜视频精品| 2019中文字幕在线观看| 亚洲性猛交富婆| 国产一区二区免费看| 成人精品一二区| 涩涩视频在线观看免费| 国产色综合一区| 在线免费一区| 国产精品探花在线| 在线观看精品一区| 青青草原播放器| 老汉色老汉首页av亚洲| 一本色道久久综合亚洲精品小说 | 亚洲国产欧美另类| 久久亚洲一级片| 亚洲最新免费视频| 性国产高清在线观看| 精品久久久久久久中文字幕 | 国产女人水真多18毛片18精品 | 久久精品欧美一区二区| 香蕉av777xxx色综合一区| 成人久久久久久| 天天综合天天综合| 国产精品人妖ts系列视频| 国产在线无码精品| 国产在线观看www| 欧美色老头old∨ideo| 尤物网站在线观看| 国产乱码精品一区二区三区四区| 久久精品男人天堂| 中文字幕亚洲乱码熟女1区2区| 国内精品第一页| 久久精彩视频| 综合久久2o19| 欧美色偷偷大香| 鲁大师私人影院在线观看| 日韩欧美一区二区三区在线视频 | 精品久久久久av影院| 亚洲精品乱码久久久久久久久久久久| 艳女tv在线观看国产一区| 韩国精品美女www爽爽爽视频| 中文字幕视频免费观看| 97久久精品人人做人人爽50路| 在线视频不卡一区二区| 亚洲第一会所| 亚洲激情第一页| 玖玖爱这里只有精品| 日本欧美加勒比视频| 国产无套精品一区二区| 91麻豆一二三四在线| 欧美亚洲高清一区| 瑟瑟视频在线观看| 欧美精品日韩| 成人久久18免费网站图片| 久草视频在线看| 精品久久久久久久久久| 中文字幕天堂av| 欧美日本三区| 99国产超薄肉色丝袜交足的后果| 秋霞午夜在线观看| 欧美三级韩国三级日本三斤| 黄色aaa视频| 国产精品亚洲综合色区韩国| 国产 高清 精品 在线 a| bestiality新另类大全| 91精品久久久久久久91蜜桃| 极品尤物一区二区| 久久久国产精品一区二区中文| 国内成+人亚洲| 国产乱码在线| 亚洲成人av在线播放| 久久精品免费在线| 成人性生交大片| 激情小视频网站| 成人国产精品一区二区网站| 俺也去精品视频在线观看| 日本中文字幕在线| 久久久国产午夜精品| 亚洲国产精品久久久久爰色欲| 香蕉视频一区二区三区| 国产成人一区三区| www.亚洲视频| 欧美精品久久久久久久多人混战| 神马午夜精品91| 国产精品一区二区久久不卡 | 精品福利在线观看| 国产肉体xxxx裸体784大胆| 在线综合欧美| 日本一区二区三区在线视频| 欧美影视资讯| 欧美午夜一区| 国产精品亚洲网站| 免费大片黄在线观看视频网站| 欧美高清视频一二三区| 97香蕉碰碰人妻国产欧美| 宅男噜噜噜66国产日韩在线观看| 日本高清不卡一区二区三| 99er精品视频| 57pao精品| 菠萝菠萝蜜在线观看| 亚洲国产精品字幕| 中文字幕一区二区人妻痴汉电车| 一区二区在线观看视频| 性欧美丰满熟妇xxxx性仙踪林| 久草精品在线观看| 欧美 丝袜 自拍 制服 另类| 日韩在线二区| 蜜桃av噜噜一区二区三| 欧美日韩午夜电影网| 日本精品视频在线| 成人影院在线观看| 亚洲天堂视频在线观看| 亚洲欧美激情另类| 欧美老女人第四色| 99热在线观看免费精品| 亚洲色图另类专区| 国产精品免费无码| 成人高清av在线| 国产高清999| 日日摸夜夜添夜夜添精品视频 | 亚洲七七久久综合桃花剧情介绍| 亚洲欧美三级伦理| 欧美一区,二区| 91精品免费观看| 中文字幕日日夜夜| 日本电影亚洲天堂一区| 91九色丨porny丨肉丝| 亚洲免费观看高清完整版在线| 自拍偷拍视频亚洲| 99久久精品情趣| 亚洲成人福利视频| 久久电影网站中文字幕| 久久精品影视大全| 老鸭窝毛片一区二区三区 | 男人最爱成人网| 国模吧一区二区| 污视频在线看网站| 久久成人18免费网站| 午夜视频在线免费观看| 亚洲性av在线| 男人的天堂在线| 日韩精品在线免费播放| 无套内谢的新婚少妇国语播放| 精品日韩一区二区三区免费视频| 99精品在线看| 欧美一级理论片| 国产偷拍一区二区| 91精品在线一区二区| 一区二区三区日| 欧美日韩免费观看一区三区| 欧美日韩a v| 欧美色综合网站| 一本色道久久综合精品婷婷| 欧美色图在线观看| 91女人18毛片水多国产| 欧美久久免费观看| 国产毛片在线视频| 日韩亚洲欧美高清| av男人天堂网| 精品国产一区二区三区久久久蜜月| 国内老熟妇对白hdxxxx| 日韩一级片在线播放| 精品人妻一区二区三区麻豆91 | 国产在线观看h| 国产欧美1区2区3区| www.99热| 中文字幕字幕中文在线中不卡视频| 亚洲一二三在线观看| 亚洲激情自拍视频| 好吊操这里只有精品| 色综合久久六月婷婷中文字幕| 无码人妻一区二区三区线| 欧美视频自拍偷拍| 国产精品久久久久久69| 日韩免费高清av| 天天爱天天干天天操| 亚洲偷熟乱区亚洲香蕉av| 免费高清完整在线观看| 久久久久久久久久久成人| 538在线视频| 国产精品第8页| 国产精品亚洲综合在线观看| 成人av免费在线看| 亚洲三级精品| 丰满女人性猛交| 亚洲美女啪啪| 国产精品人人妻人人爽人人牛| 麻豆视频一区二区| 国内精品免费视频| 国产午夜精品久久| 成人自拍小视频| 精品久久久久久亚洲国产300| 中国精品一区二区| 精品日韩成人av| 浮生影视网在线观看免费| 欧美成人亚洲成人| 韩国久久久久久| 91gao视频| 一道在线中文一区二区三区| 一级全黄肉体裸体全过程| 日韩视频免费| 182午夜视频| 久久久精品中文字幕麻豆发布| 九九这里只有精品视频| 欧美午夜激情在线| 国产超碰人人模人人爽人人添| 日韩电视剧在线观看免费网站| 免费在线毛片网站| 欧美在线亚洲在线| 日本99精品| 一区二区三区四区视频在线观看 | 性欧美videossex精品| 成人免费视频免费观看| 国产主播av在线| 精品久久久中文| a天堂在线观看视频| 亚洲一区二区精品| segui88久久综合9999| 成人性生交xxxxx网站| 久草精品在线| 老太脱裤让老头玩ⅹxxxx| 欧美亚韩一区| 国产伦理久久久| 日韩综合网站| 国产xxxxx在线观看| 国产精品一级片| 日本人亚洲人jjzzjjz| 亚洲成人7777| 国产免费无遮挡| 搡老女人一区二区三区视频tv| 色在线视频观看| 国产一区二区三区av在线| 91精品久久久久久久蜜月| 激情婷婷综合网| 91性感美女视频| 国产一级在线视频| 日韩丝袜情趣美女图片| 91露出在线| 国产精品久久久久91| 中国av一区| 色综合久久久久无码专区| 高潮精品一区videoshd| 日韩三级在线观看视频| 欧美片在线播放| 欧美日韩在线看片| 国产精品自拍偷拍视频| 欧美综合在线视频观看| 91色国产在线| 国产亚洲综合在线| 无码人妻av免费一区二区三区 | 狠狠色狠色综合曰曰| 后进极品白嫩翘臀在线视频| 欧美国产中文字幕| 亚洲性视频在线| 精品一二三四五区| 成人综合在线观看| 国产精品1000| 亚洲第一网中文字幕| 超碰91在线观看| 久热国产精品视频一区二区三区| 亚洲欧美网站| 亚洲一区视频在线播放| 在线免费视频一区二区| xxxxx日韩| 91在线观看免费网站| 欧美成熟视频| 亚洲欧美高清在线| 欧美日韩国产色| 蜜桃视频在线免费| 国产精品视频免费在线观看| 青青草国产免费一区二区下载 | 日本精品入口免费视频| 色偷偷亚洲男人天堂| 精品中文在线| 欧美国产日韩激情| 久久先锋影音av| 一级特黄aaa大片| 色综合久久88| 欧美aaaaa级| 亚洲第一狼人区| 一区二区三区精品| 性感美女视频一二三| 国产成+人+综合+亚洲欧洲| 99久久www免费| 亚洲天堂2024| 欧洲另类一二三四区| 黄网站在线免费看| 精品伊人久久大线蕉色首页| 免费在线看一区| 国产一级性生活| 亚洲香蕉成视频在线观看| 国产免费区一区二区三视频免费| 国产精品国产对白熟妇| 国产欧美视频一区二区三区| 国产不卡av在线播放| 秋霞午夜一区二区| 亚洲91久久| 久久久精品人妻无码专区| 欧美男男青年gay1069videost | 91精品蜜臀一区二区三区在线| 稀缺呦国内精品呦| 欧美三级一区二区| 97人人在线视频| 亚洲精品成人自拍| av在线播放成人| 99er热精品视频| 欧洲亚洲女同hd| 黄色av日韩| 日日操免费视频| 亚洲男人的天堂在线播放|