精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2024 | 自我糾錯如何使OpenAI o1推理能力大大加強?北大、MIT團隊給出理論解釋

人工智能 新聞
北大王奕森團隊與MIT合作,從理論上分析了大語言模型自我糾錯能力背后的工作機理。

自我糾錯(Self Correction)能力,傳統上被視為人類特有的特征,正越來越多地在人工智能領域,尤其是大型語言模型(LLMs)中得到廣泛應用,最近爆火的OpenAI o1模型[1]和Reflection 70B模型[2]都采取了自我糾正的方法。

傳統的大語言模型,因為在輸出答案的時候是逐個Token輸出,當輸出長度較長時,中間某些Token出錯是必然發生。但即使LLM后來知道前面輸出的Token錯了,它也得用更多錯誤來“圓謊”,因為沒有機制讓它去修正前面的錯誤。

而OpenAI o1在“慢思考”也就是生成Hidden COT的過程中,通過分析OpenAI官網給出的Hidden COT例子可以發現,在解決字謎問題的思考過程中,o1首先發現了每兩個連續的明文字母會映射到一個秘文字母,于是便嘗試使用奇數字母來構建明文,但是經過驗證發現并不合理(Not directly);接著又重新修正答案最終成功解出字謎。

圖片

圖1 OpenAI o1 官網示例(部分Hidden CoT)

Reflection 70B的關鍵技術也包括錯誤識別錯誤糾正。他們用到了一種名為 Reflection-Tuning(反思微調) 的技術,使得模型能夠在最終確定回復之前,先檢測自身推理的錯誤并糾正。在實際的執行過程中,這會用到一種名為思考標簽(thinking tag)的機制。模型會在這個標簽內部進行反思,直到它得到正確答案或認為自己得到了正確答案。

頻頻應用于大語言模型的自我糾錯技術為何有效?為什么糾錯過程可以讓模型把原本答錯的問題重新答對?

為了探究這一問題,北大王奕森團隊與MIT合作,從理論上分析了大語言模型自我糾錯能力背后的工作機理。

圖片

  • 論文題目:A Theoretical Understanding of Self-Correction through In-context Alignment
  • 論文地址:https://openreview.net/pdf?id=OtvNLTWYww
  • 代碼地址:https://github.com/yifeiwang77/Self-Correction

作者團隊將自我糾錯的過程抽象為對齊任務,從上下文學習(In-context learning)的角度對自我糾錯進行了理論分析。值得一提的是,他們并沒有使用線性注意力機制下的線性回歸任務進行理論分析,而是使用真實世界LLM在用的softmax多頭注意力機制的transformer結構,并利用Bradley-Terry 模型和 Plackett-Luce 模型(LLM對齊的實際選擇,用于RLHF和DPO)設計對齊任務進行研究。受理論啟發,他們提出了一種簡單的自我糾錯策略--上下文檢查(Check as Context),并通過實驗,在消除大語言模型中存在的潛在偏見以及防御越獄攻擊中效果顯著。

理論分析:自我糾錯實際上是一種上下文對齊?

不同于類似監督學習的標準上下文示例(請求,回答),自我糾錯示例可以形成一個三元組形式(請求,回答,獎勵),這類似于通過獎勵指示好壞樣本的 LLM 對齊。因此,作者團隊提出將自我糾錯形式化為一種“上下文對齊”(In-context Alignment),即通過提供一系列自我糾錯步驟的上下文,優化LLM的最終輸出,以獲得更高的獎勵。

對齊的過程通常包括:對于問題,收集個不同的模型回答,然后由人類或評估模型(在本文中,評估模型即該 LLM 本身)對這  個回答給出排序偏好。接著,使用一般的對齊模型(如Bradley-Terry (BT,n=2) or Plackett-Luce (PL loss, general n))進行建模:

其中為獎勵模型。

針對transformer模型,作者采用了帶有softmax多頭注意力機制的transformer結構,其前向傳播更新可以分為兩部分

  • 多頭注意力(MHSA)層:
  • FFN層:

獎勵函數  被設置為負均方誤差(MSE)損失,即:

在該設置下,參數的梯度下降可等價于對數據的更新:

圖片

作者證明了多層transformer(包含3-head softmax attention和relu激活函數的FFN)可以利用自我糾錯樣本生成更優獎勵的回答。具體而言,作者證明了存在模型權重,使得transformer可以通過在前向傳播的過程中執行對其內部獎勵模型參數的梯度下降,來生成更符合對齊目標的更優回答。

圖片

這是首次在理論上表明 LLM 可以在上下文中實現對齊的分析。該理論適用于多種自我糾錯方法,因為評估可以來自人類、外部驗證者或 LLM 本身。

圖片圖2 關于上下文對齊的驗證實驗,分別涉及TF和GD的比較(a)、不同獎勵噪聲p的影響(b)、模型深度的影響(c)、以及不同注意力機制的效果(d)、(e)、(f)。

作者也通過設置驗證實驗來檢驗其理論導出的種種結論,以及各個 transformer 結構模塊對 LLM 執行上下文對齊能力的影響,作者發現了很多有趣的結論:

  • 通過觀察比較LLM在執行上下文對齊時前向傳播的損失與梯度下降的損失曲線,LLM執行上下文對齊時的前傳行為與梯度下降損失曲線幾乎相同。(圖2(a))
  • 評價的質量直接影響自我糾錯的質量(圖2(b))。
  • 對多樣本的排序需要更深的模型層數,在達到一定深度后(15層),增加更多的層數并不能帶來更高的收益。(圖2(c))
  • Softmax注意力機制對從評價中分析回答優劣排序至關重要,而linear注意力則做不到這一點。具體來說,softmax 注意力機制可以有效地選取最優回答  并為各樣本生成加權平均所需的權重。(圖2(d))
  • 多頭注意力機制對token角色的區分很重要。具體而言,多頭注意力機制可以將生成的回答與正樣本拉近,與負樣本拉遠。實驗表明,3個attention head是上下文對齊任務中最優選擇。(圖2(e))
  • FFN對于token角色的轉變很重要。在經過一個MHSA層后,FFN可以將上一輪的正樣本屏蔽掉,從而使次優樣本變成下一輪迭代的最優樣本。(圖2(f))

自我糾錯策略:上下文檢查

作者使用上下文檢查(Check as Context,CaC)作為LLM完成自我糾錯的方法,在兩個現實世界的對齊任務中探索了自我糾錯:緩解社會偏見和防范越獄攻擊。

圖片

圖3 BBQ數據集上使用CaC的示例。

具體而言,首先對模型請求問題獲得回答初始回答,然后對該回答進行評估,得到獎勵。之后將初始回答,評估送入上下文,并重新請求問題,得到改正后的回答。此過程可多次重復以迭代改進回答,最終以最后一輪的模型回答作為模型的最終輸出。

消除LLM社會偏見

本文使用 BBQ(Bias Benchmark for QA)數據集,在 vicuna-7B 和 Llama2-7b-chat 模型上測試了 CaC 方法的效果。此外,還在 BBQ 上研究了模型大小、評估質量和糾錯輪數對糾錯效果的影響。主要結論如下:

  • 多數情況下,自我糾錯后的正確率高于原正確率(圖4)
  • 正確率提升與自我評估的準確率高度相關(圖4(c): ),甚至呈線性關系(圖5(a))。
  • 采用不同的評價方式效果依次提升:僅使用對/錯評價 < 自然語言評價 < 包含 CoT 的對/錯評價。這是因為 CoT 不僅能提高評價準確性,還能為模型提供額外的自然語言信息。(圖5(b))
  • 更大的模型有更好的糾錯能力(圖5(c)(d))
  • 當評價的正確率足夠高時,更多的糾錯輪數可以帶來更好的糾錯效果。(圖5(e))

圖片

圖4 CaC對于不同種類的偏見的修正

圖片

圖5 BBQ上關于模型大小、評估質量以及糾錯輪數的消融實驗

同時,在防御越獄攻擊的實驗中,CaC也是所有測試的防御手段中最低的。

更多文章細節,請參考原文:https://openreview.net/pdf?id=OtvNLTWYww

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-09-24 11:01:03

2024-11-29 13:57:38

2024-11-07 15:40:00

2024-09-18 10:37:00

強化學習AI模型

2024-12-09 11:06:31

2009-07-15 15:47:45

綜合布線驗收規范

2024-11-25 15:50:00

模型訓練

2024-10-10 13:01:43

2024-09-13 06:32:25

2025-01-23 10:45:52

2025-01-23 14:53:15

2024-11-07 22:59:36

2024-11-11 11:05:00

大語言模型系統

2025-03-10 08:10:00

AI研究安全

2025-11-10 08:51:00

LLMOpenAI模型

2025-04-18 09:13:00

2024-11-12 12:53:46

2024-10-05 00:00:00

2024-09-19 18:03:31

2025-01-20 13:08:25

點贊
收藏

51CTO技術棧公眾號

91视频国产一区| 亚洲一二在线观看| 国产二级片在线观看| 日韩电影在线观看完整版| 日韩在线卡一卡二| 另类美女黄大片| 国产一级伦理片| 成人性片免费| 亚洲午夜av在线| 日韩av高清| 亚洲精品久久久狠狠狠爱 | 在线观看国产精品日韩av| 成人综合久久网| 成人性生交大片免费看网站| 久久久国产精华| 99国产超薄肉色丝袜交足的后果| 中文字幕国产在线观看| 欧美一区亚洲| 国产午夜精品一区二区三区 | www.黄色网址.com| 日韩私人影院| 国产·精品毛片| 国产精品成人av性教育| 久久久夜色精品| 成人av动漫在线观看| 亚洲第一视频网| 国产又粗又长又爽又黄的视频| 亚洲福利影院| 亚洲一区二区成人在线观看| 亚洲一区二区三区色| 亚洲色图 校园春色| 国产一区二区成人久久免费影院| 国产精国产精品| 亚洲伊人成人网| 午夜精品婷婷| 久久在精品线影院精品国产| 99久久人妻无码精品系列| 麻豆精品少妇| 亚洲精品一区二区三区蜜桃下载 | 国产无遮挡又黄又爽在线观看| 久久久综合色| 这里只有精品丝袜| 久久久久亚洲av成人无码电影 | 欧美精品欧美精品系列c| www.蜜臀av.com| 国产在线观看一区二区| 国产精品自产拍在线观看| 色av性av丰满av| 国产日韩欧美一区在线| 久久久人成影片一区二区三区| 日韩成人毛片视频| 91成人免费| 欧美成人激情视频免费观看| 麻豆网址在线观看| 色综合天天爱| 精品国产一区二区三区久久狼黑人| 精品无人区无码乱码毛片国产| 日韩美女国产精品| 亚洲美女久久久| 强伦人妻一区二区三区| 羞羞色国产精品网站| 日韩激情av在线免费观看| 你懂的在线观看网站| 风间由美性色一区二区三区四区| 欧美大胆人体bbbb| 国产精品成人无码专区| 亚洲裸色大胆大尺寸艺术写真| 日韩www在线| 3d动漫精品啪啪一区二区下载 | 日韩精品免费一线在线观看| 中文字幕精品视频在线| 丝袜美腿综合| 有码中文亚洲精品| 在线免费看av网站| 欧美激情91| 午夜精品久久久久久久99黑人| 日韩欧美亚洲一区二区三区| 国产精品久久久久久模特| 日本亚洲精品在线观看| 欧美人一级淫片a免费播放| 琪琪一区二区三区| 91精品入口蜜桃| 色wwwwww| 中文幕一区二区三区久久蜜桃| 亚洲啪啪av| caopo在线| 高跟丝袜欧美一区| 欧美成人黄色网址| 亚洲精品国产九九九| 日韩成人激情在线| 日韩精品电影一区二区三区| 欧美一区久久| 日韩av片免费在线观看| 中文字幕在线一| 国产成人超碰人人澡人人澡| 久久影院理伦片| 婷婷免费在线视频| 午夜精品视频一区| 伊人影院综合在线| 国产精品香蕉| 色av中文字幕一区| 国产 欧美 日韩 在线| 免费av网站大全久久| 成人精品一二区| 国产免费av高清在线| 一区二区视频在线看| 欧美 日韩 国产 激情| 免费观看性欧美大片无片| 亚洲免费视频在线观看| www.99re7| 免费成人av资源网| 久久另类ts人妖一区二区| 麻豆传媒在线完整视频| 欧美性xxxx| 亚洲一区和二区| 日韩欧美一区二区三区在线视频| 91精品国产91久久久久久| 一级片免费观看视频| 99精品久久久久久| 欧美日韩dvd| 国产精品传媒麻豆hd| 亚洲国产美女精品久久久久∴| 精品国产国产综合精品| 老色鬼久久亚洲一区二区| 成人区精品一区二区| 五月天婷婷在线视频| 色悠悠久久综合| 97精品人人妻人人| 欧美.日韩.国产.一区.二区| 国产精品久久久久久久天堂| 香港三日本三级少妇66| 欧美日韩国产三级| 手机av在线网| 久久精品丝袜高跟鞋| 亚洲国产精品久久久久久| 国产精品二三区| 成人国产亚洲欧美成人综合网| av成人天堂| 欧美巨大xxxx| 免费在线成人激情电影| 青春草在线免费视频| 日本1级在线| av网站免费大全| 婷婷激情五月综合| 国产极品美女在线| 波多野结衣一本| 91国内在线播放| 免费在线观看的毛片| 国产一区二区四区| 中文字幕制服丝袜在线| 欧美精品七区| 国产伦精品一区二区三区高清版| 国产精国产精品| 456亚洲影院| 久久久久久国产精品三级玉女聊斋| 在线a欧美视频| 亚洲免费视频网站| 亚洲美女激情视频| 亚洲伦理中文字幕| 日韩高清av一区二区三区| 69久久夜色精品国产69蝌蚪网| 欧美在线观看一区二区| 欧美亚洲图片小说| 欧美性猛交xxxxxx富婆| 日本韩国欧美在线| 欧美午夜精品久久久久久超碰| 色综合久久久久久久久久久| 一本大道久久a久久精品综合| 色综合天天综合网天天狠天天| 亚洲综合无码一区二区| 夜夜嗨av一区二区三区中文字幕| 亚洲狼人国产精品| 夜夜精品浪潮av一区二区三区| 一区二区三区精品在线| 五月激情综合网| 欧美日韩中文字幕在线视频| 日本电影亚洲天堂一区| 欧美日韩免费视频| 亚洲成人av中文字幕| 亚洲精品国产欧美| 中文字幕欧美日韩va免费视频| 久久综合久久八八| 午夜精品在线视频| 成人国产精品免费视频| 国产伦理久久久| 亚洲国产精品一区二区第四页av | 3d成人h动漫网站入口| 日韩精品一区二区三区视频播放| 日韩经典一区二区三区| 久久精品国产亚洲精品2020| 欧美贵妇videos办公室| 日本久久久久久久| 成人欧美一区二区三区视频| 图片区小说区区亚洲五月| 日本阿v视频在线观看| 午夜激情在线观看视频| 中文字幕影片免费在线观看| 久久人妻无码aⅴ毛片a片app| 亚洲av中文无码乱人伦在线视色| 国产高清在线免费| 日本免费中文字幕在线| 伊人久久av| 第四色在线一区二区| 欧美精品成人| 国产成人99久久亚洲综合精品| 国产女主播一区| 91高清视频在线| 亚洲一级一级97网| 国产精品激情av在线播放| 欧美三级华人主播| 成人中文字幕av| 性少妇xx生活| 国产精品视频无码| 性欧美videos高清hd4k| 凹凸av导航大全精品| 激情综合视频| 99久久er热在这里只有精品66| 婷婷成人综合网| 亚洲最新av在线| 91精品在线观看视频| 黄色网在线视频| 强迫凌虐淫辱の牝奴在线观看| 欧美三日本三级少妇99| 国产黄色免费在线观看| 亚洲伦理久久| 99精品久久久| 久久久精品综合| 欧美日韩你懂的| 97免费在线视频| 一区二区三区精品国产| 国产大尺度视频| 又骚又黄的视频| 高清电影在线免费观看| 国产成人影院| 国产不卡在线播放| 欧美主播一区二区三区美女| 欧美激情欧美激情在线五月| 日韩妆和欧美的一区二区| 欧洲美女亚洲激情| 加勒比在线一区| 国产欧洲在线| 一级欧洲+日本+国产 | 日韩av免费网址| 男人资源在线播放| 久久不见久久见中文字幕免费| 国产成人8x视频一区二区| 欧美天天综合网| 欧美中文字幕在线视频| 国产xxxx振车| 可以直接看的黄色网址| www在线免费观看| 精品一区二区三| 久久综合五月天婷婷伊人| 精品久久久久久久久久久久久久久久久 | 亚洲一区精品视频| 妺妺窝人体色WWW精品| 六十路在线观看| 亚洲大片精品免费| 91女人视频在线观看| 日韩精品免费观看| 欧洲亚洲一区二区三区四区五区| 亚洲色图14p| 日本中文字幕电影在线观看| 蜜桃精品wwwmitaows| 国产视频在线观看一区二区三区| 亚洲视频axxx| 亚洲人成网站在线播放2019| 国产免费美女视频| www在线免费观看视频| 欧美黄在线观看| 日韩欧美在线中文字幕| 日本午夜人人精品| 色片在线免费观看| 国产成人精品一区二区无码呦| 国产精品115| 久久久久久9999| 久久亚洲国产精品| 国产精品97在线| av手机免费看| 曰本一区二区三区视频| 亚洲欧美日韩综合aⅴ视频| 久久久久久中文字幕| 久久久国产欧美| 婷婷五月综合久久中文字幕| 日韩精品dvd| 欧美日韩亚洲一区二区| 国产欧美一区二区| 国产全是老熟女太爽了| 羞羞污视频在线观看| 免费成人美女在线观看.| 亚洲福利视频二区| 亚洲第一综合网站| 中国精品一区二区| 亚洲警察之高压线| 同产精品九九九| www 成人av com| 欧美一区免费观看| 欧美在线se| 国产精品久线在线观看| 欧美最猛黑人xxxx黑人猛叫黄| 丰满少妇xbxb毛片日本| 伊人电影在线观看| 黄色精品一二区| 精品国模在线视频| 亚洲 欧美 日韩系列| 黄色片在线播放| 久久五月激情| 中文字幕亚洲在线| 日本中文字幕精品—区二区| 国产三级视频在线| 麻豆精品蜜桃视频网站| 日韩在线观看免费av| www.午夜av| 丝袜在线观看| 成人动漫精品一区二区| 97精品国产97久久久久久春色| 99热超碰在线| 亚洲精品粉嫩美女一区| 国产精品视频yy9299一区| 91在线网站视频| 亚洲 欧美 视频| 欧美日韩国产一区二区三区不卡 | 成人高清免费观看mv| 国产一区二区视频在线播放| 国产69精品久久久| www中文在线| 麻豆成人入口| 欧美色综合久久| 欧美这里只有精品| 黄色软件在线观看| 成人午夜短视频| 国产精品va在线| 精品少妇久久久| 欧美精品一区二区久久| 精品欧美一区二区三区精品久久| 密臀av一区二区三区| 欧美xxxx做受欧美88bbw| 国产日韩欧美麻豆| 国外成人在线视频网站| 国产精品人妻一区二区三区| 亚洲欧美日韩国产综合精品二区| 久久精品国产视频| a资源在线观看| 婷婷成人在线| 精品国产一区久久| 一级黄色免费毛片| 国产精品高清一区二区| 欧美综合在线视频| 性生交免费视频| 电影网一区二区| 欧美性20hd另类| 黄色片一级视频| 欧美极度另类| 欧美综合色免费| 色播五月激情五月| 成人久久网站| 欧美顶级少妇做爰| 欧美体内she精高潮| 国产精品3区| 日韩午夜av电影| 欧美日韩人妻精品一区在线| 影音先锋欧美激情| 亚洲国产黄色片| 自拍偷拍中文字幕| 不卡日本视频| 久久69精品久久久久久国产越南| 久久久久久久蜜桃| 亚洲专区一区二区三区| 国产精品久久久久久久久久小说| 日批视频免费观看| 国产精品一级二级三级| 精品久久精品久久| 99精品老司机免费视频| 一区二区高清视频在线观看| 黄色免费视频大全| 欧美91在线|欧美| 精品99一区二区三区| 欧美福利第一页| 国产精品xvideos88| 日本午夜人人精品| av免费在线不卡| 欧美激情一区二区三区蜜桃视频| 只有这里有精品| www.一区| 亚洲精品一区二区三区不| 天天做夜夜爱爱爱| 亚洲一区欧美激情| 国产精品二区在线观看| 欧美成人hd| 欧美性猛交xxxxxx富婆| 成人做爰www看视频软件| 香蕉综合视频| 国产日韩亚洲欧美| 黄色av网站在线免费观看| 欧美日韩国产色| 又黄又色的网站| 欧美女激情福利| 91久久嫩草影院一区二区| 在线观看黄av| 欧美午夜片在线看|