精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT、Llama等大模型存在「逆轉詛咒」,這個bug該如何緩解?

人工智能 新聞
我們是否正在掉入中等智能陷阱?一個關于大語言模型 “逆轉詛咒” 的分析與緩解方法。

來自中國人民大學的研究者將 Llama 等因果語言模型所遭遇的 “逆轉詛咒” 歸咎于 next-token prediction + causal language model 的本質缺陷,并發現 GLM 采用的自回歸填空的訓練方法對這種 “逆轉詛咒” 顯示出更強的魯棒性。

通過將雙向注意力機制引入 Llama 模型進行微調,該研究實現了對 Llama 的 “逆轉詛咒” 的緩解。

該研究認為當前主流的這種大模型結構與訓練范式存在著很多潛在的缺陷,希望有更多的研究者能夠在模型結構或者預訓練范式上進行創新突破,以獲得更高的智能水平。

圖片

論文地址:https://arxiv.org/pdf/2311.07468.pdf

背景

Lukas Berglund等人發現 GPT 以及 Llama 模型存在一種 “逆轉詛咒”:當向 GPT-4 提問 “Who is Tom Cruise's mom?” GPT-4 可以給出正確的回答 “Mary Lee Pfeiffer”,而當向 GPT-4 提問 “Who is Mary Lee Pfeiffer's son?” GPT-4 表示自己并不知道這個人。也許 GPT-4 經過對齊之后,可能出于對人物隱私的保護,不愿意回答這種問題,但是經過測試,在一些不涉及隱私的知識問答上,也存在著這種 “逆轉詛咒”。

比如,GPT-4 能正確回答 “黃鶴一去不復返” 的下一句,但是對于 “白云千載空悠悠” 的上一句是什么,模型出現了嚴重的幻象。

圖片

圖一:詢問 GPT-4 “黃鶴一去不復返” 的下一句是什么,模型正確回答

圖片

圖二:詢問 GPT-4 “白云千載空悠悠” 的上一句是什么,模型出錯

逆轉詛咒因何而來?

Berglund 等人的研究只在 Llama 和 GPT 上做了測試,這兩種模型的共同特點是:(1)利用無監督的 next-token prediction 任務進行訓練,(2)在 decoder-only 的模型中,采用單向的因果注意力機制(causal attention)。

該研究的觀點是,逆轉詛咒是由這些模型的訓練目標導致的,并且可能是 Llama,GPT 這類模型特有的問題。

圖片

圖三:采用 Next-token prediction(NTP)訓練一個因果語言模型的示意

這兩點的結合就導致了一個問題,如果一條訓練數據中含有兩個實體 A 和 B,并且 A 出現在 B 的前面,那么這類模型只能優化正向預測的條件概率 p (B|A),對于反向的條件概率 p (A|B) 的值是沒有任何保證的。一旦訓練集不夠大,不能夠將 A 與 B 可能的排列充分覆蓋,那么自然就會出現 “逆轉詛咒” 現象。

當然,也有很多生成式語言模型并沒有采取以上的訓練范式,比如清華提出的 GLM,訓練方法如下圖所示:

圖片

圖四:一個簡化版的 GLM 訓練示意

GLM 采用了自回歸填空(Autoregressive Blank Infilling,ABI)的訓練目標:隨機從輸入中選取一段內容進行 mask,并且自回歸地預測這段內容。雖然待預測的 token 依然采用單向注意力對 “上文” 產生依賴,但是此時 “上文” 中包括了這個 token 在原始輸入里之前和之后的全部內容,因此,ABI 隱式地將輸入中的反向依賴關系考慮到了。

該研究進行了一個實驗發現 GLM 一定程度上確實可以免疫 “逆轉詛咒”:

  • 該研究采用 Berglund et al. 提出的 “人名 - 描述問答” 數據集,該數據集使用 GPT-4 編造了若干人名和對應的描述,人名和描述都是獨一無二的。數據示例如下圖所示:

圖片

訓練集分為兩部分,一部分是人名在前(NameToDescription), 另一部分是描述在前(DescriptionToName),兩部分不存在重疊的人名或者描述。測試數據的 prompt 對訓練數據的 prompt 進行了改寫。

  • 該數據集有四個測試子任務:
  1. NameToDescription (N2D): 通過 prompt 模型訓練集 “NameToDescription” 部分涉及到的人名,讓模型回答相應的描述
  2. DescriptionToName (D2N): 通過 prompt 模型訓練集 “DescriptionToName” 部分涉及到的描述,讓模型回答相應的人名
  3. DescrptionToName-reverse (D2N-reverse): 通過 prompt 模型訓練集 “DescriptionToName” 部分涉及到的人名,讓模型回答相應的描述
  4. NameToDescription-reverse (N2D-reverse): 通過 prompt 模型訓練集 “NameToDescription” 部分涉及到的描述,讓模型回答相應的人名
  • 該研究在此數據集上對 Llama 和 GLM 按照各自的預訓練目標(Llama 用 NTP 目標,GLM 用 ABI 目標),進行微調。微調后,通過測試模型回答逆轉任務的準確率,可以定性地評估模型在真實場景下遭受 “逆轉詛咒” 的嚴重性。由于所有人名和數據都是編造的,因此這些任務基本不會被模型已有的知識干擾。

圖片實驗結果表明,通過 NTP 微調的 Llama 模型,基本沒有正確回答逆轉任務的能力(NameToDescription-reverse 任務準確率為 0),而通過 ABI 微調的 GLM 模型,在 NameToDescrption 逆轉任務上的準確率非常高。

為了對比,該研究還使用 NTP 的方式微調了 GLM,發現 GLM 在 N2D-reverse 任務上的準確率也掉到了 0。

也許由于 D2N-reverse(利用逆轉知識,給定人名生成描述)比 N2D-reverse(利用逆轉知識,給定描述生成人名)要困難許多,GLM- ABI 相對于 GLM-NTP 只有微弱的提升。

不過這并不影響該研究得出主要結論:訓練目標是導致 “逆轉詛咒” 的原因之一?!澳孓D詛咒” 在以 next-token prediction 方式預訓練的因果語言模型中尤其嚴重。

如何緩解逆轉詛咒

由于 “逆轉詛咒” 是 Llama,GPT 等模型的訓練階段導致的內在問題,在有限的資源下,我們能做的就是想辦法在新數據上微調模型,并盡可能地避免模型在新知識上 “逆轉詛咒” 的發生,以更充分地利用訓練數據。

受到 GLM 訓練方法的啟發,該研究提出了一種訓練方法 “雙向因果語言模型優化” (Bidirectional Causal language model Optimization),在基本不引入新的 gap 的情況下,讓 Llama 也能采用雙向注意力機制進行訓練,簡單來說,有以下幾個重點:

1. 消除 OOD 的位置信息。Llama 采用的 RoPE 編碼在 attention 計算的時候為 query 和 key 添加位置信息,計算方法如下所示:

圖片

圖片

其中圖片分別是當前層 m 和 n 位置的輸入,圖片是 RoPE 使用的旋轉矩陣,定義為:

圖片

如果直接將 Llama 的因果注意力掩碼去掉,會引入 out-of-distribution 的位置信息。原因是,在預訓練的過程中,在 m 位置的 query 只需與在 n 位置的 key 進行內積(圖片),上式內積計算中的 query-key 的相對距離 (n-m) 始終是非正的;而直接去掉注意力掩碼,在 m 位置的 query 就會與在 n>m 位置的 key 做內積,導致 n-m 變成一個正值,引入了模型沒見過的位置信息。

該研究提出的解決方法非常簡單,規定:

圖片

圖片 時,無需對內積計算做任何修改;當 n > m,通過引入一個新的旋轉矩陣圖片來計算。圖片是將旋轉矩陣中所有的 sin 項都取相反數得到的。這樣,就有圖片。那么當 n > m 時則有:

圖片

該研究將 attention score 的計算分為兩部分,按以上操作分別計算上三角和下三角,并最終進行拼接,這樣就很高效地實現了本文規定的注意力計算方法,整體操作如下子圖 (a) 所示:

圖片

2. 采用 mask denosing 的方式訓練

由于雙向注意力機制的引入,繼續使用 NTP 任務訓練會存在信息泄漏,導致訓練失敗,因此該研究使用恢復 mask token 的方式對模型進行優化。

該研究嘗試過遵循 BERT,在輸出端的第 i 位置去還原第 i 位置輸入的 mask token,由于這種預測方式與模型在測試階段使用的自回歸預測相差較大,并沒有取得效果。

最終,出于不引入新的 gap 的思想,該研究采用了自回歸式的 mask denoising,如上圖(a)所示:該研究在輸出端的第 i 個位置去還原第 i+1 位置輸入的 mask token。

此外,由于因果語言模型的預訓練詞表是沒有 [mask] 這個 token 的,如果在微調階段新加一個 token 的話,模型還得去學習這個無意義 token 的表示,因此該研究只是輸入一個占位 token,并在 attention 計算中忽略掉占位 token。

該研究在微調 Llama 時,每一步以均等的概率,隨機選擇 BICO 與普通的 NTP 作為訓練目標。在同樣微調十個 epoch 的情況下,在上述人名描述數據集上,與正常 NTP 微調的表現對比如下:

圖片

可以看到該研究的方法對于逆轉詛咒有一定的緩解。與 GLM-ABI 一樣,本文方法在 D2N-reverse 上取得的提升非常小。研究者推測這一現象的原因:盡管數據集中的人名及其對應描述由 GPT 編造以減少預訓練數據對測試的干擾,但由于預訓練模型具備一定程度的常識理解能力,比如認知到人名與描述之間通常存在一對多的關聯。在給定一個人名的情況下,可能對應多種不同的描述。因此,當模型在處理既需要利用反向知識,又要生成長描述的任務時,似乎顯得有些困惑。

此外,本文重點關注的是 base 模型的逆轉詛咒現象。如何在更復雜的場景下評估模型的逆轉回答能力,以及 RLHF 是否對于逆轉詛咒存在影響,仍需未來的工作進一步探究。

一些思考

當前大多數開源大語言模型遵循著 causal language model + next-token prediction 的范式。在這一范式中,可能隱藏著更多類似 “逆轉詛咒” 的內在問題。盡管目前這些問題可以通過擴大模型規模或增加數據量來暫時掩蓋,但它們并沒有真正消失,并且持續存在。當我們在模型規模擴大和數據量增加的道路上達到極限時,這個 “目前足夠好用” 的范式能否真正超越人類智能,該研究認為這非常困難。

該研究希望更多的大模型廠商以及有條件的研究者能夠深入挖掘當前主流大語言模型的內在缺陷,并在訓練范式上進行創新。正如該研究在正文的最后所寫,“Training future models strictly by the book may lead us to fall into a “middle-intelligence trap.”” (循規蹈矩地訓練未來的模型可能會引導我們掉入中等智能陷阱)

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-09 13:22:00

AI訓練

2023-09-23 12:34:11

AI模型

2024-01-12 10:29:26

2023-09-23 12:50:39

AI訓練

2023-10-23 12:28:04

數據AI

2023-09-11 15:57:16

人工智能模型GPT-4

2023-07-22 13:09:51

模型開源

2023-10-16 13:28:00

數據AI

2023-06-05 12:32:48

模型論文

2023-10-11 13:09:52

訓練模型

2023-12-11 12:46:42

GPT-4LLaMA2模型

2024-04-19 09:17:33

AI模型

2024-01-04 16:41:29

大型語言模型自然語言處理

2024-04-19 14:52:13

MetaGPT-4模型

2025-04-14 00:22:00

2025-02-12 13:42:25

2024-01-02 12:50:12

數據模型

2023-06-08 08:09:43

2023-10-17 12:34:04

點贊
收藏

51CTO技術棧公眾號

亚洲免费视频中文字幕| 亚洲伊人观看| 精品sm在线观看| 国产 福利 在线| 尤物网在线观看| a在线欧美一区| 成人午夜黄色影院| 国产又大又黄又粗| 91久久电影| 亚洲精品视频在线观看视频| 亚洲a级黄色片| 欧美aa在线观看| 亚洲三级电影网站| 免费精品视频一区二区三区| 国产露脸国语对白在线| 免费亚洲婷婷| 欧美日韩爱爱视频| 亚洲天堂精品一区| 米奇777超碰欧美日韩亚洲| 欧美一区二区三区视频在线观看| 四虎永久在线精品无码视频| 美洲精品一卡2卡三卡4卡四卡| 久久先锋影音av鲁色资源| 亚洲综合一区二区不卡| 免费污污视频在线观看| 黄色av日韩| 久久av在线看| 林心如三级全黄裸体| 亚洲资源网站| 日韩电影中文 亚洲精品乱码| 成人在线短视频| 成人免费在线观看视频| 日韩欧亚中文在线| 成人中文字幕在线播放| 黄色影院在线看| 亚洲丝袜美腿综合| 亚洲在线欧美| www 日韩| 日本一区二区视频在线| 免费国产一区二区| 可以免费看污视频的网站在线| 不卡视频一二三四| 国产欧美日韩一区| 日本wwwxxxx| 国产91精品精华液一区二区三区| 成人信息集中地欧美| 一级淫片免费看| 麻豆精品视频在线| 国产在线视频一区| 一区二区三区精彩视频| 久久福利视频一区二区| 成人黄色在线播放| 国产精品一区二区黑人巨大| 久久精品国产99国产| 91精品国产自产在线老师啪| 国产又粗又大又爽| 国产精品一二三区| 99r国产精品视频| 亚洲国产精品一| 成人福利在线看| 精品免费视频123区| 神马亚洲视频| 国产欧美综合在线| 自拍偷拍亚洲色图欧美| а√天堂官网中文在线| 一区二区成人在线观看| 欧美激情视频免费看| 国产在线天堂www网在线观看| 精品久久久免费| 久久国产乱子伦免费精品| 日日夜夜天天综合| 欧美日本在线视频| 中文字幕 欧美 日韩| 国产精品黄网站| 亚洲黄色免费三级| 女人十八毛片嫩草av| 91成人免费| 午夜精品福利在线观看| www.日韩一区| 国产一区二区福利视频| 精品国产电影| 在线观看av黄网站永久| 亚洲自拍偷拍网站| 一级特黄性色生活片| 麻豆国产一区二区三区四区| 亚洲国产一区二区三区四区| 中文字幕人妻一区二区三区在线视频| 天天综合国产| 日本精品一区二区三区在线播放视频| 中文天堂在线播放| bt7086福利一区国产| 亚洲一区二区三区涩| 美女91在线| 欧美亚洲丝袜传媒另类| 三上悠亚 电影| 国产伦精品一区二区三区千人斩| 日韩中文字幕在线播放| www.国产成人| 激情久久五月天| 国产精品一区二| 91ph在线| 欧美性xxxxhd| 韩国黄色一级片| 日本在线电影一区二区三区| 欧美日本高清视频| 中文字幕av网站| 成人av第一页| 熟女视频一区二区三区| 国产精品迅雷| 精品国产乱码久久久久久1区2区| 美国黑人一级大黄| 一区二区福利| 99热在线播放| 婷婷五月在线视频| 欧美在线免费观看亚洲| 国产人妻黑人一区二区三区| 久久久久久美女精品| 日韩美女毛茸茸| 人妻无码一区二区三区久久99| 国产精品久久久久久亚洲伦| 欧美色图另类小说| 国产精品tv| 欧美俄罗斯乱妇| 91丨九色丨丰满| 中文字幕av不卡| 麻豆av免费在线| 特黄特色欧美大片| 久久久天堂国产精品女人| 国产成a人亚洲精v品无码| 国产精品亲子乱子伦xxxx裸| 草草草在线视频| 亚洲+变态+欧美+另类+精品| 欧美国产精品va在线观看| 国产精品乱码一区二区| 国产精品久久久一本精品 | 91久久亚洲| 成人高清在线观看| 成人福利影视| 欧美精品一区二区三区久久久| 久久r这里只有精品| 狠狠网亚洲精品| 在线综合视频网站| 91精品国产一区二区在线观看| 色噜噜狠狠狠综合曰曰曰88av| 中文字幕免费高清网站| 国产日本欧洲亚洲| 免费涩涩18网站入口| 日韩av久操| 国产欧美久久一区二区| 日韩毛片久久久| 欧美高清视频在线高清观看mv色露露十八 | 日韩毛片一区二区三区| 久久综合五月天婷婷伊人| 亚洲熟妇无码一区二区三区导航| 老牛精品亚洲成av人片| 69**夜色精品国产69乱| 精品三级久久久久久久电影聊斋| 色综合色狠狠天天综合色| 永久免费av无码网站性色av| 免费观看日韩av| 天天干天天操天天干天天操| 欧美经典一区| 91国产视频在线| 免费在线超碰| 欧美女孩性生活视频| 成人性生活毛片| 成人亚洲一区二区一| 国产一区二区网| 精品国产123区| 成人av资源在线播放| 色www永久免费视频首页在线| 精品国产3级a| 91视频在线视频| 日韩理论片一区二区| 中文字幕在线观看91| 美女精品在线观看| 欧洲美女和动交zoz0z| 国产精品久久久久av蜜臀| 日韩av成人在线| 浪潮av一区| 亚洲国产婷婷香蕉久久久久久| 波多野结衣爱爱| 亚洲精品乱码久久久久久日本蜜臀| 在线播放第一页| 日韩av网站免费在线| 麻豆一区二区三区在线观看| 欧美亚洲tv| 国产日韩欧美夫妻视频在线观看| 男女羞羞视频在线观看| 亚洲美女激情视频| www.97超碰| 日本精品视频一区二区三区| 麻豆天美蜜桃91| 91丨porny丨国产| 特级黄色片视频| 美女国产精品| 大伊香蕉精品视频在线| jvid福利在线一区二区| 国产不卡一区二区在线观看| 午夜av成人| 97av在线影院| 99福利在线| 中文字幕亚洲情99在线| 欧性猛交ⅹxxx乱大交| 欧美日韩成人高清| 黑人一级大毛片| 一区二区三区在线免费视频| 亚洲最大成人综合网| 99精品视频在线播放观看| 国内自拍第二页| 天使萌一区二区三区免费观看| 日韩欧美视频免费在线观看| 日韩一区自拍| 日本精品一区| 免费精品国产的网站免费观看| 粉嫩高清一区二区三区精品视频| а√天堂资源国产精品| 91成人性视频| 99re6在线精品视频免费播放| 久久精品视频va| 在线视频婷婷| 国产亚洲精品一区二区| 天堂影院在线| 亚洲国产91精品在线观看| 午夜免费福利视频| 91精品国模一区二区三区| 怡红院男人的天堂| 欧美在线免费播放| 97人妻一区二区精品视频| 欧美日韩免费观看中文| 久久久久亚洲天堂| 亚洲曰韩产成在线| 免费毛片在线播放免费| 亚洲美腿欧美偷拍| 婷婷久久综合网| 亚洲另类在线一区| 黄色一级视频免费| 一区二区三区欧美亚洲| 欧美黄色免费观看| 一区二区三区欧美| 久久久久人妻一区精品色欧美| 亚洲综合自拍偷拍| 伊人365影院| 午夜日韩在线电影| 久青草视频在线观看| 亚洲一区二区三区激情| 国产亚洲成人av| 亚洲成人av免费| 日韩av在线天堂| 欧美午夜电影在线| 亚洲熟妇无码乱子av电影| 色婷婷久久久综合中文字幕| 在线免费观看国产精品| 欧美手机在线视频| 97视频免费在线| 日韩一级欧美一级| 欧美一区二区三区成人片在线| 亚洲国产精品成人va在线观看| 天堂网av2014| 永久免费精品影视网站| 日本三级在线视频| 色与欲影视天天看综合网| av电影免费在线看| 日本久久91av| www.欧美| 精品无人区一区二区三区 | 色国产综合视频| 日韩免费高清一区二区| 亚洲欧美综合自拍| a级片在线免费观看| 亚洲第一网站免费视频| 日色在线视频| 中文字幕亚洲欧美日韩2019| 国产原创视频在线观看| 久久久久久97| 成人小电影网站| 国产在线视频一区| 中文无码日韩欧| 亚洲天堂av电影| 丰满熟妇人妻中文字幕| 亚洲偷熟乱区亚洲香蕉av| 91视频在线观看| 欧美激情一区二区三区高清视频| xx欧美视频| 亚洲一区二区三区久久| 亚洲69av| 国产青草视频在线观看| 首页综合国产亚洲丝袜| 亚洲一区二区三区四区五区xx| 国产一区二区调教| 亚洲综合色一区| 亚洲精品成人悠悠色影视| 青青青国产在线| 日韩欧美在线观看一区二区三区| 亚洲色图21p| www.亚洲男人天堂| caoporn-草棚在线视频最| 国产精品三级网站| 欧美日日夜夜| 超薄肉色丝袜足j调教99| 久久精品一区二区国产| 亚洲 自拍 另类 欧美 丝袜| 久久久久一区二区三区四区| 少妇被躁爽到高潮无码文| 色av一区二区| 欧美亚洲精品在线观看| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 91女神在线观看| 91丨国产丨九色丨pron| 国产亚洲精品成人| 91精品国产乱码久久蜜臀| 国产一级片在线播放| 性色av一区二区三区| 久久一级大片| 影音先锋欧美资源| 日韩国产一区二| 久久久久久久久免费看无码| 亚洲精品免费在线播放| 怡红院男人天堂| 国产午夜精品免费一区二区三区| h片在线观看| 亚洲自拍欧美另类| 99久久99热这里只有精品| 香蕉视频网站入口| 久久久久9999亚洲精品| 日本高清www免费视频| 日韩欧美国产综合| av软件在线观看| 亚洲bt欧美bt日本bt| 免费在线毛片网站| 亚洲日本黄色| 91午夜在线播放| 久久网站免费观看| 黄色一级一级片| 久久这里只有精品6| 91av在线免费视频| 亚洲黄页视频免费观看| 国产自产自拍视频在线观看| 国产高清自拍一区| 99综合在线| 国产精品300页| 亚洲福利一区二区| 久久国产精品亚洲va麻豆| 亚州精品国产精品乱码不99按摩| 日韩在线免费av| 日韩成人精品一区二区三区| 四虎永久国产精品| 美日韩一区二区| 日韩在线视频免费看| 欧美一区欧美二区| 丝袜国产在线| 国产欧美日韩综合精品二区| 夜夜嗨网站十八久久| 菠萝菠萝蜜网站| 91久久精品一区二区二区| 国产特黄级aaaaa片免| 1024精品合集| 午夜老司机福利| 7777精品视频| 红桃成人av在线播放| 国产3p在线播放| 亚洲综合视频网| 欧美午夜黄色| 国产精品久久色| 欧美影视一区| 日本黄色免费观看| 在线一区二区视频| а√天堂8资源在线官网| 国产精品一区二区av| 日韩精品三区四区| 夫妻性生活毛片| 亚洲第一免费网站| 免费亚洲电影| 99re8这里只有精品| 99久久婷婷国产综合精品| 少妇无套内谢久久久久| 不卡av在线播放| 色爱av综合网| 拔插拔插华人永久免费| 亚洲国产视频一区| 福利视频在线看| 成人自拍爱视频| 日韩国产欧美一区二区三区| 日本一级二级视频| 日韩精品极品视频| 2019中文亚洲字幕| 国产午夜伦鲁鲁| 亚洲欧洲美洲综合色网| 五月天婷婷激情网| 成人免费视频网址| 久久成人在线| 国产麻豆视频在线观看| 亚洲精品久久久久久久久久久久久| 影音成人av| 成年人午夜视频在线观看| 国产精品国产三级国产aⅴ原创| 天堂在线中文资源| 亚洲最大福利网| 日产国产高清一区二区三区| 国产一级视频在线播放|