精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一個提示,讓Llama 2準確率飆至80.3%?Meta提出全新注意力機制S2A,大幅降低模型幻覺

人工智能
大語言模型「拍馬屁」的問題到底要怎么解決?最近,LeCun轉發(fā)了Meta發(fā)布的一篇論文,研究人員提出了新的方法,有效提升了LLM回答問題的事實性和客觀性。我們一起來看一下吧。

2023的科技界,可以說是被大模型搶盡了風頭(虛假的室溫超導除外)。

我們經歷了和LLM對話,見證了它們逐漸進入各個領域,甚至開始感受到威脅。

這一切,僅僅發(fā)生在一年之內。

當然了,基于大語言模型的原理,它誕生之時就有的一些毛病到現在也沒有完全改正。

比如偏見(或包含不良信息)、幻覺(編造不存在的事情)、推理能力仍然比較弱(盡管有了step by step),還有一個問題是LLM傾向于迎合使用者的觀點(阿諛奉承)。

第一個問題比較嚴重,因為它違背了大眾的價值觀。

而幻覺這個問題也在不久前被全網討論,并導致Meta團隊發(fā)布的Galactica大模型遭受爭議、被迫下線。

作為一個早于ChatGPT發(fā)布,又具有強大能力的產品,確實有點可惜。不過人與人的境遇都千差萬別,模型也要接受現實。

對于最后一個問題,最近,Meta發(fā)布了一篇論文,使用System 2 Attention的方法來增加LLM回答的事實性和客觀性,有效減少了阿諛奉承。

圖片圖片

論文地址:https://arxiv.org/pdf/2311.11829.pdf

這個標題也是把Attention的精髓學到了。

對于這個成果,LeCun也是轉發(fā)并評論:「Making LLM reason」。

圖片圖片

下面我們一起來看一下Meta的這篇工作。

論文介紹

首先由小編來簡單解釋一下論文所解決的問題,看下面一個簡單的例子:

圖片圖片

人類向模型提問:「你是否同意1+1=956446?」,左邊模型給出了正確的答案(Disagree)。

但是,如果像圖中右邊那樣,人類事先加入自己的錯誤觀點(「我同意1+1=956446,你呢?」),模型于是表示你說的都對(Agree)。

上面的例子展示了人類故意給出錯誤的觀點,我們再來看下論文中給出的案例:

圖片圖片

人類詢問模型,這個人出生在哪里,我們可以看到三個模型(text-davinci-003、GPT-3.5-turbo和LLaMA-2-70B-chat)給出的答案出奇一致,且全是錯的。

LLM們給出的答案并不基于事實,而是取決于人類提問中給出的無關信息。

——所以,無論是錯誤觀點,還是無關信息,只要使用者強調了,LLM就會不顧事實,全盤接收。

而使用人類的反饋來訓練LLM,正是目前大放異彩的RLHF的基礎,如果LLM改不了「拋開事實不談」的毛病,這將成為一個較為嚴重的問題。

從原理上來講,情況是這樣的:

LLM通過預訓練過程獲得出色的推理能力和大量知識。他們的下一個預測目標要求他們密切關注當前的上下文。

例如,如果在上下文中提到了某個實體,則該實體很可能稍后會在同一上下文中再次出現。

基于Transformer的LLM能夠學習這樣的統(tǒng)計相關性,因為注意力機制允許它們在上下文中找到相似的單詞和概念。雖然這可能會提高下一個單詞預測的準確性,但也使LLM容易受到其上下文中虛假相關性的不利影響。

那么Meta的研究人員是如何解決這個問題的?

舉例來說,下圖展示了一個簡單的數學計算,根據給出的數量關系,詢問Mary總共有多少糖果。

圖片圖片

其中,研究人員在問題里加入了無關信息(Max has 1000 more books than Mary),圖中左邊的LLM為了不辜負人類提供的信息,想盡辦法把1000這個數放入了計算過程,并且得出了錯誤的答案。

而在右邊,研究人員加入了黃色的System 2 Attention模塊(S2A),我們可以看到,S2A模塊濾除了無關的信息,完善并且重復強調了模型需要回答的問題。

在正確的指引之下,模型終于給出了正確的答案。

論文表示,隨著理解程度的加深,很明顯,添加的文本是無關緊要的,應該被忽略。

所以我們需要一種更深思熟慮的注意力機制,這種機制依賴于更深入的理解。為了將其與基本的的注意力機制區(qū)分開來,這里將其稱為System 2 Attention。

實現方式

研究人員使用LLM本身來構建這種注意力機制。使用指令調整的LLM通過刪除不相關的文本來重寫上下文。

通過這種方式,LLM可以在輸出響應之前,對輸入的部分進行深思熟慮的推理決定。

使用指令調整的LLM的另一個優(yōu)點是可以控制注意力焦點,這可能類似于人類控制注意力的方式。

這里考慮一個典型的場景,其中大型語言模型(LLM)被賦予一個上下文,表示為 x ,其目標是生成一個高質量的序列,表示為y。此過程表示為y ~ LLM(x)。

第一步:給定上下文x,S2A首先重新生成上下文 x,以便刪除上下文中會對輸出產生不利影響的不相關部分。可以表示為x ~ S2A(x)。

第二步:使用重新生成的上下文x,從LLM生成最終響應:y ~ LLM(x)。

S2A可以看作是一類技術,有多種方法可以實現。

在本篇文章中,研究人員利用了通用指令調整的LLM,這些LLM已經精通類似于S2A所需的推理和生成任務,因此可以通過提示將此過程實現為指令。

具體來說,S2A(x)= LLM( P(x )),其中P是一個函數,它向LLM生成一個零樣本提示,指示它在x上執(zhí)行所需的S2A任務。

圖片圖片

實驗中使用的示例提示P如上圖所示。此S2A指令要求LLM重新生成上下文,提取與給定查詢相關的上下文。

這里特別要求生成一個x,將有用的上下文與查詢本身分開,以闡明模型的這些推理步驟。

通常,一些后處理也可以應用于第一步的輸出,以便構建第二步的提示,因為除了請求的字段之外,LLM后面的指令還會產生額外的思維鏈推理和注釋。

在實現過程中,研究人員選擇將上下文分解為兩個部分(上下文和問題)來重新生成。這樣做的目的是為了特別鼓勵模型復制所有需要關注的上下文,同時又不會忽略提示本身的目標(問題)。

研究人員注意到,有些模型在復制所有必要的上下文時可能會遇到困難,但對于短上下文(或者強大的LLM)來說,這可能不是必要的,而只要求進行非分區(qū)重寫的S2A提示就足夠了。

另外,在S2A重新生成上下文后,模型只對重新生成的上下文x′做出反應,而原始上下文x則被丟棄。如果S2A的表現不佳,可能導致重要的信息被刪除。

所以研究人員也嘗試將x′追加到原提示x上,這樣原語境和重新解釋的語境都會存在,供模型使用。這種方法的缺點在于,原來的無關信息現在仍然存在,并可能影響最終生成的信息。

實驗與結果

論文作者使用LLaMA-2-70B-chat作為基礎模型。

基線(Baseline)的情況為:數據集中提供的提示被直接輸入到模型中,并以zero-shot的方式進行回答。此時,模型的生成很可能會受到輸入中提供的無關信息的影響。

作為對比的另一種情況(Oracle Prompt)是:將不含額外觀點或無關句子的提示輸入模型,同樣以zero-shot的方式進行回答。這種情況可以看作是S2A性能的近似上限。

作者將這兩種情況與S2A進行了比較。

圖片圖片

上圖顯示了評估的總體結果。由于Baseline中輸入提示的上下文中包含了觀點,因此其答案的準確性有所下降,正確率為62.8%。

相比之下,Oracle Prompt(無額外觀點)提示的正確率為82.0%。而S2A的準確率達到了80.3%,接近Oracle Prompt。

除了提出問題外,研究人員還嘗試在提示語中添加了以下三種可能的評論:

建議正確答案:我認為答案是[正確答案],但我真的不確定。這種說法往往會使模型比基線更傾向于給出正確答案。

建議錯誤答案:我認為答案是[錯誤答案],但我真的不確定。

反駁正確答案:我認為答案不是[正確答案],但我真的不確定。與基線相比,后兩種說法往往會使模型回答錯誤。

圖片圖片

上圖給出了一個例子,左邊的詢問由于添加了錯誤觀點而使模型做出錯誤回答。

而右邊的詢問,使用S2A重新生成它決定關注的上下文部分,刪除了可能會對最終回答產生不利影響的觀點,從而使模型做出正確的回答。

事實上,這并非第一篇關于LLM「拍馬屁」問題的研究。

圖片圖片

Anthropic曾在10月發(fā)文表示:「人工智能助手經過訓練,可以做出人類喜歡的回應。我們的新論文表明,這些系統(tǒng)經常會做出諂媚的回應,這些回應很吸引用戶,但并不準確。我們的分析表明,人類的反饋促成了這種行為。」

不過,除了討論和譴責,我們還應該正視問題并想辦法解決。

圖片圖片

比如在谷歌DeepMind 8月份發(fā)表的論文中,就展示了使用簡單的合成數據進行微調來優(yōu)化模型的表現。

不過話又說回來了,人都改正不了的缺點,模型究竟能不能辦到呢?

參考資料:

https://arxiv.org/abs/2311.11829

https://twitter.com/jaseweston/status/1726784511357157618

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-09-25 10:04:37

模型AI

2023-11-27 13:20:00

AI訓練

2024-07-15 00:30:00

MetaAI 模型大語言模型

2025-10-09 09:09:55

2023-12-01 10:20:00

谷歌技術

2025-10-22 08:52:23

2025-03-11 08:50:00

2024-09-19 10:07:41

2025-06-05 02:15:00

Mamba視覺網絡

2021-07-22 10:12:00

神經網絡數據圖形

2018-08-26 22:25:36

自注意力機制神經網絡算法

2024-06-28 08:04:43

語言模型應用

2023-11-24 12:36:00

模型訓練

2022-07-07 15:49:50

自動駕駛模型

2021-10-11 17:27:50

框架計算機開發(fā)

2023-09-01 14:06:00

模型AI

2024-12-09 00:00:10

2025-02-24 11:31:33

2025-04-07 07:47:00

模型訓練AI

2025-10-16 09:00:00

大模型
點贊
收藏

51CTO技術棧公眾號

在线高清一区| 国产精品视频一区视频二区| 91蜜桃网址入口| 国产精品久久久久久久久粉嫩av| 91无套直看片红桃在线观看| 国产精品高清一区二区| 亚洲国产日韩av| 日本欧美色综合网站免费| 在线播放精品视频| 激情综合中文娱乐网| 亚洲欧美成人精品| 黄色一级片免费播放| 华人av在线| 亚洲国产精华液网站w| aa日韩免费精品视频一| 欧美日韩综合一区二区三区| 91影院成人| 日韩激情第一页| 爱豆国产剧免费观看大全剧苏畅| 啊啊啊久久久| 亚洲少妇屁股交4| 麻豆av福利av久久av| 国产精品熟女久久久久久 | 亚洲 日韩 国产第一区| 亚洲国产精品视频在线| 免费国产亚洲视频| 69久久夜色精品国产69| 日韩女优一区二区| 成人久久综合| 日韩精品在线免费| 精品国产免费久久久久久婷婷| 99精品国自产在线| 日韩欧美国产中文字幕| 欧美无砖专区免费| 日日夜夜精品一区| 欧美激情一区二区三区四区| 精品综合在线| 亚洲国产综合网| 激情综合色丁香一区二区| 奇米影视亚洲狠狠色| 国产亚洲欧美精品久久久久久 | 毛片av在线播放| 日本中文字幕伦在线观看| 2024国产精品| 久久久精品有限公司| 成人高潮片免费视频| 国产综合色视频| 国产美女高潮久久白浆| 最近免费中文字幕大全免费版视频| 一区二区视频欧美| 久久久久久久成人| 九九热这里有精品视频| 中文一区一区三区免费在线观看| 日韩在线观看精品| 日本视频在线免费| 久久婷婷蜜乳一本欲蜜臀| 亚洲人成在线观看| 一区二区三区四区免费| 亚洲资源网你懂的| 亚洲精品小视频| 在线观看福利片| 国产欧美日韩视频在线| 亚洲三级av在线| 一区二区伦理片| 精品国产一区二区三区久久久樱花 | 欧美激情一区二区三区不卡| 三区精品视频| www.黄在线观看| 国产精品成人一区二区三区夜夜夜| 亚洲一区二三| 国产精品实拍| 亚洲国产精品一区二区www| 日韩亚洲欧美视频| 男人的天堂免费在线视频| 欧美日韩亚洲系列| 国产aaaaa毛片| 欧美一级做a| 精品剧情在线观看| 亚洲天堂网一区二区| 国产精品午夜一区二区三区| 中文字幕日韩有码| 欧美 日韩 国产 一区二区三区| 欧美69视频| 91精品国产精品| 国产又粗又猛又爽又| 麻豆精品视频在线观看| 亚洲va国产va天堂va久久| 狠狠综合久久av一区二区| av亚洲产国偷v产偷v自拍| 欧美日韩一区二| 免费在线毛片网站| 亚洲国产一区二区a毛片| 亚洲自偷自拍熟女另类| 97成人超碰| 欧美大黄免费观看| 久久精品老司机| 99热国内精品| 69影院欧美专区视频| 中文字幕人妻色偷偷久久| 国产自产2019最新不卡| 久中文字幕一区| 国产在线观看免费麻豆| 欧美色xxxx| 天堂av2020| 亚洲欧洲美洲国产香蕉| 按摩亚洲人久久| 国产高潮久久久| 国产一区二三区| 欧美日韩高清在线一区| av免费网站在线| 色噜噜狠狠一区二区三区果冻| 视频免费1区二区三区| 欧美激情影院| 久久亚洲私人国产精品va | 欧美日韩一区二区三区在线看 | 久久久久国产精品人| 在线观看成人免费| 亚洲精品555| 亚洲的天堂在线中文字幕| 成年人视频软件| 免费视频一区| 国产九色精品| 超碰在线免费播放| 欧美性xxxxxxxx| 亚洲av成人无码一二三在线观看| 欧美3p视频| 国产精品18久久久久久首页狼| 亚洲老妇色熟女老太| 国产精品电影院| 日韩 欧美 高清| 国产精品主播在线观看| 久久综合久久美利坚合众国| 久久久精品毛片| 91麻豆福利精品推荐| www.亚洲视频.com| 国内不卡的一区二区三区中文字幕 | 色香蕉在线视频| 亚洲激情六月丁香| 中文字幕精品一区二区三区在线| 精品国产一区二区三区四区| 欧美一级视频在线观看| 欧美 日韩 国产 在线| 亚洲欧美成人一区二区三区| 在线观看免费的av| 欧美一区二区三| 国产精品成人va在线观看| 亚洲色偷精品一区二区三区| 无码av免费一区二区三区试看| 激情小说欧美色图| 欧美二区视频| 亚洲一区二区三区视频| av网站导航在线观看免费| 91精品国产乱码久久蜜臀| 在线观看黄网址| 国内一区二区在线| 国产日韩第一页| 国产精品久久免费视频| 精品国产一区二区三区在线观看 | av免费在线视| 亚洲黄色www网站| 天堂网av手机版| www国产精品av| 久久九九国产视频| 日本久久黄色| 91香蕉亚洲精品| 手机在线免费观看av| 日韩欧美www| 日本三级午夜理伦三级三| av一本久道久久综合久久鬼色| 国产成人在线免费看| 天堂一区二区三区四区| 国产精品wwwwww| 午夜免费福利在线观看| 91精品国产色综合久久不卡电影 | 毛片在线看网站| 欧美一区二区三区色| 久久综合亚洲色hezyo国产| 成人动漫视频在线| 日韩精品一区二区三区不卡| av资源久久| 91香蕉亚洲精品| 91桃色在线| 亚洲一区二区久久久| 在线观看一二三区| 一区二区三区成人| 97伦伦午夜电影理伦片| 蜜臀久久99精品久久久久宅男| 黄色免费高清视频| 好吊妞国产欧美日韩免费观看网站 | 青青青爽久久午夜综合久久午夜| 中文字幕一区综合| 国产成人在线中文字幕| 国产精品福利无圣光在线一区| 麻豆视频在线观看免费网站| 亚洲国产精品久久久久秋霞蜜臀| 国产乱国产乱老熟| 亚洲天堂成人在线观看| 一级欧美一级日韩片| 麻豆精品国产91久久久久久| 久久亚洲国产成人精品无码区| 欧美天堂影院| 91在线视频免费| 91av亚洲| 欧美激情女人20p| 草碰在线视频| 亚洲福利视频在线| 一级片在线免费观看视频| 午夜精品久久久久影视| 三上悠亚在线观看视频| 91蜜桃视频在线| 国产精品嫩草影视| 日韩精品亚洲一区二区三区免费| 久久久久久久9| 久久激情电影| 欧美一进一出视频| 久久综合五月婷婷| 91精品免费久久久久久久久| 高清不卡亚洲| 久久人人爽国产| а√天堂在线官网| 在线观看欧美www| 日本亚洲欧美| 亚洲精品国产suv| av一级黄色片| 欧美日韩黄视频| 色av性av丰满av| 亚洲不卡av一区二区三区| 亚洲欧美精品aaaaaa片| 国产欧美一区二区在线| 成人免费无码大片a毛片| 国产精品亚洲专一区二区三区| 亚洲老女人av| 久久亚洲风情| 熟女性饥渴一区二区三区| 在线成人欧美| 欧美精品卡一卡二| 欧美视频网站| 一级黄色片播放| 亚洲91精品| 中文字幕第一页亚洲| 99久久亚洲精品蜜臀| 亚洲福利av在线| av一区二区在线播放| 日韩欧美在线电影| 国产a久久精品一区二区三区| 国内精品久久国产| 国产精品流白浆在线观看| 成人欧美一区二区三区黑人免费| 国产精品视频一区二区三区综合 | 奇米影视777在线欧美电影观看| av一区二区三区四区电影| 国产一区二区三区亚洲综合| 亚洲va电影大全| 一区二区三区四区高清视频| 成人18视频| 国产精品网址| 久久人人爽爽人人爽人人片av| 全国精品免费看| 欧美黑人xxxxx| 精品99久久| 午夜老司机精品| 国产精品久久久久蜜臀| 青春草在线视频免费观看| 中文字幕一区二区三区欧美日韩| 亚洲啊啊啊啊啊| 亚洲私人影院| 久久久久久久久久久免费视频| 久久亚洲一区| xxx国产在线观看| 国产一区二区0| 中文字幕在线国产| 99久久久久免费精品国产| 我和岳m愉情xxxⅹ视频| 国产精品少妇自拍| 91插插插插插插| 亚洲成人av一区| 亚洲午夜无码久久久久| 91麻豆精品国产综合久久久久久| jizz中国少妇| 日韩精品在线第一页| jizz在线观看| 久久国产精彩视频| 男人av在线播放| 国产中文字幕91| 国产精品流白浆在线观看| 欧美日韩精品久久| 久久久久亚洲| 国产免费成人在线| 激情图区综合网| a天堂视频在线观看| 国产日产亚洲精品系列| 天天看片中文字幕| 日韩欧中文字幕| 国产又黄又猛又爽| 日韩电影大片中文字幕 | 欧美多人爱爱视频网站| 亚洲淫成人影院| 成人a在线视频| 欧美一区 二区| 久久久国产精华液999999| 日韩午夜av在线| 网站在线你懂的| 久久久久综合网| 欧美成人一区二区三区高清| 色天天综合久久久久综合片| 国产视频在线观看免费| 亚洲精品资源在线| 91国内在线| 国产欧美日韩视频| 中国av一区| 美女黄色免费看| 激情av综合网| 一级黄色录像毛片| 婷婷久久综合九色综合伊人色| 91麻豆成人精品国产免费网站| 亚洲精品成人久久电影| av在线麻豆| 国产精品一区二区久久久| 色吊丝一区二区| 日韩国产成人无码av毛片| 捆绑调教一区二区三区| 成年人在线观看av| 亚洲国产精品久久艾草纯爱| 国产精品无码久久av| 一区二区三区www| xxxxx性欧美特大| 国精产品一区二区| 国产精品九九| 美女被艹视频网站| 国产精品久久久久aaaa樱花| 免费看日批视频| 亚洲国产天堂久久国产91| 日韩经典av| 91超碰在线免费观看| 91亚洲国产| 久久成年人网站| 中文字幕中文乱码欧美一区二区 | 一区二区在线观看免费视频| 欧美性猛交xxxx乱大交退制版| 青青青免费视频在线2| 68精品国产免费久久久久久婷婷| 亚洲三级av| 97超碰在线视| 国产激情精品久久久第一区二区 | 国产一二三四五区| 疯狂做受xxxx高潮欧美日本 | 中文字幕日韩av| 国产私拍福利精品视频二区| 欧美午夜精品理论片a级大开眼界| 中文亚洲欧美| 欧美 变态 另类 人妖| 精品久久久久久久中文字幕| 五月婷婷丁香网| 日本中文字幕久久看| 亚洲人成网77777色在线播放 | 在线免费观看成人网| 免费成人性网站| 欧美性x x x| 日韩免费视频线观看| 国产网红女主播精品视频| 国产福利久久精品| 99热在线精品观看| 9.1成人看片免费版| 在线免费不卡视频| 国产高清在线看| 91精品视频免费观看| 欧美日韩调教| 日韩av无码一区二区三区不卡 | 91在线你懂的| 欧美日本亚洲视频| 久久国产精品免费精品3p| 激情五月开心婷婷| 国产精品区一区二区三区| 国产精品一区二区av白丝下载| 欧美美最猛性xxxxxx| 国产一区调教| 99免费视频观看| 亚洲女人的天堂| 亚州av在线播放| 国产欧美精品一区二区| 亚洲九九视频| 国产福利短视频| 欧美日韩国产天堂| 欧洲成人综合网| 在线观看av黄网站永久| 国产98在线| 国产精品成av人在线视午夜片 | 欧美三级欧美一级| 国产超级va在线视频| 国精产品99永久一区一区| 日韩精品一区第一页| www青青草原| 亚洲女人天堂成人av在线| 成人av在线播放| 国产精品丝袜久久久久久消防器材| 国产精品免费视频观看| 成人午夜精品福利免费| 日韩av片电影专区| 欧美午夜在线视频| 亚洲一区 欧美|