精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制

發布于 2024-6-28 10:56
瀏覽
0收藏

本文作者李宏康,美國倫斯勒理工大學電氣、計算機與系統工程系在讀博士生,本科畢業于中國科學技術大學。研究方向包括深度學習理論,大語言模型理論,統計機器學習等等。目前已在 ICLR/ICML/Neurips 等 AI 頂會發表多篇論文。


上下文學習 (in-context learning, 簡寫為 ICL) 已經在很多 LLM 有關的應用中展現了強大的能力,但是對其理論的分析仍然比較有限。人們依然試圖理解為什么基于 Transformer 架構的 LLM 可以展現出 ICL 的能力。


近期,一個來自美國倫斯勒理工大學和 IBM 研究院的團隊從優化和泛化理論的角度分析了帶有非線性注意力模塊 (attention) 和多層感知機 (MLP) 的 Transformer 的 ICL 能力。他們特別從理論端證明了單層 Transformer 首先在 attention 層根據 query 選擇一些上下文示例,然后在 MLP 層根據標簽嵌入進行預測的 ICL 機制。該文章已收錄在 ICML 2024。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


  • 論文題目:How Do Nonlinear Transformers Learn and Generalize in In-Context Learning?
  • 論文地址:https://arxiv.org/pdf/2402.15607


背景介紹


上下文學習 in context learning (ICL)


上下文學習 (ICL) 是一種新的學習范式,在大語言模型 (LLM) 中非常流行。它具體是指在測試查詢 (testing query)

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

前添加 N 個測試樣本 testing examples (上下文),即測試輸入

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

和測試輸出

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

的組合,從而構成一個 testing prompt:

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

,作為模型的輸入以引導模型作出正確的推斷。這種方式不同于經典的對預訓練模型進行微調的方式,它不需要改變模型的權重,從而更加的高效。


ICL 理論工作的進展


近期的很多理論工作都是基于 [1] 所提出的研究框架,即人們可以直接使用 prompt 的格式來對 Transformer 進行訓練 (這一步也可以理解為在模擬一種簡化的 LLM 預訓練模式),從而使得模型具有 ICL 能力。已有的理論工作聚焦于模型的表達能力 (expressive power) 的角度 [2]。他們發現,人們能夠找到一個有著 “完美” 的參數的 Transformer 可以通過前向運算執行 ICL,甚至隱含地執行梯度下降等經典機器學習算法。但是這些工作無法回答為什么 Transformer 可以被訓練成這樣 “完美” 的,具有 ICL 能力的參數。因此,還有一些工作試圖從 Transformer 的訓練或泛化的角度理解 ICL 機制 [3,4]。不過,受制于分析 Transformer 結構的復雜性,這些工作目前止步于研究線性回歸任務,而所考慮的模型通常會略去 Transformer 中的非線形部分。


本文從優化和泛化理論的角度分析了帶有非線性 attention 和 MLP 的 Transformer 的 ICL 能力和機制:


  • 基于一個簡化的分類模型,本文具體量化了數據的特征如何影響了一層單頭 Transformer 的域內 (in-domain) 和域外 (out-of-domain, OOD) 的 ICL 泛化能力。
  • 本文進一步闡釋了 ICL 是如何通過被訓練的 Transformer 來實現了。
  • 基于被訓練的 Transformer 的特點,本文還分析了在 ICL 推斷的時候使用基于幅值的模型剪枝 (magnitude-based pruning) 的可行性。


理論部分


問題描述


本文考慮一個二分類問題,即將

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

通過一個任務

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

映射到

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

。為了解決這樣的一個問題,本文構建了 prompt 來進行學習。這里的 prompt 被表示為:


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


訓練網絡為一個單層單頭 Transformer:


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


預訓練過程是求解一個對所有訓練任務的經驗風險最小化 (empirical risk minimization)。損失函數使用的是適合二分類問題的 Hinge loss,訓練算法是隨機梯度下降。


本文定義了兩種 ICL 泛化的情況。一個是 in-domain 的,即泛化的時候測試數據的分布和訓練數據一樣,注意這個情況里面測試任務不必和訓練任務一樣,即這里已經考慮了對未見任務 (unseen task) 的泛化。另一個是 out-of-domain 的,即測試、訓練數據分布不一樣。


本文還涉及了在 ICL 推斷的時候進行 magnitude-based pruning 的分析,這里的剪枝方式是指對于訓練得到的中的各個神經元,根據其幅值大小,進行從小到大的刪除。


對數據和任務的構建


這一部分請參考原文的 Section 3.2,這里只做一個概述。本文的理論分析是基于最近比較火熱的 feature learning 路線,即通常將數據假設為可分(通常是正交)的 pattern,從而推導出基于不同 pattern 的梯度變化。本文首先定義了一組 in-domain-relevant (IDR) pattern 用于決定 in-domain 任務的分類,和一組與任務無關的 in-domain-irrelevant (IDI) pattern,這些 pattern 之間互相正交。IDR pattern 有

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

個,IDI pattern 有

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

個。一個

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

被表示為一個 IDR pattern 和一個 IDI pattern 的和。一個 in-domain 任務就被定義為基于某兩個 IDR pattern 的分類問題。


類似地,本文通過定義 out-of-domain-relevant (ODR) pattern 和 out-of-domain-irrelevant (ODI) pattern,可以刻畫 OOD 泛化時候的數據和任務。


本文對 prompt 的表示可以用下圖的例子來闡述,其中

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

是 IDR pattern,

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

是 IDI pattern。這里在做的任務是基于 x 中的

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

做分類,如果是

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

那么其標簽為 + 1,對應于 +q,如果是

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

那么其標簽為 - 1,對應于 -q。α,α' 分別被定義為訓練和測試 prompt 中跟 query 的 IDR/ODR pattern 一樣的上下文示例。下圖中的例子里面,

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


理論結果


首先,對于 in-domain 的情況,本文先給了一個 condition 3.2 來規定訓練任務需要滿足的條件,即訓練任務需要覆蓋所有的 IDR pattern 和標簽。然后 in-domain 的結果如下:


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


這里表明:1,訓練任務的數量只需要在全部任務中占比達到滿足 condition 3.2 的小比例,我們就可以對 unseen task 實現很好的泛化;2,跟當前任務相關的 IDR pattern 在 prompt 中的比例越高,就可以以更少的訓練數據,訓練迭代次數,以及更短的 training/testing prompt 實現理想的泛化。


接下來是 out-of-domain 泛化的結果。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


這里說明,如果 ODR pattern 是 IDR pattern 的線性組合且系數和大于 1,那么此時 OOD ICL 泛化可以達到理想的效果。這個結果給出了在 ICL 的框架下,好的 OOD 泛化所需要的訓練和測試數據之間的內在聯系。該定理也通過 GPT-2 的實驗得到了驗證。如下圖所示,當 (12) 中的系數和

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

大于 1 的時候,OOD 分類可以達到理想的結果。與此同時,當

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

,即 prompt 中和分類任務相關的 ODR/IDR pattern 比例越高的時候,所需要的 context 長度越小。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


然后,本文給出了帶有 magnitude-based pruning 的 ICL 泛化結果。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


這個結果表明,首先,訓練得到的

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

中有一部分(常數比例)神經元的幅值很小,而剩下的相對比較大(公式 14)。當我們只枝剪小神經元的時候,對泛化結果基本沒有影響,而當枝剪比例增加到要剪大神經元的時候,泛化誤差會隨之顯著變大(公式 15,16)。以下實驗驗證了定理 3.7。下圖 A 中淺藍色的豎線表示訓練得到的

ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區

呈現出了公式 14 的結果。而對小神經元進行枝剪不會使泛化變差,這個結果符合理論。圖 B 反映出當 prompt 中和任務相關的上下文越多的時候,我們可以允許更大的枝剪比例以達到相同的泛化性能。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


ICL 機制


通過對預訓練過程的刻畫,本文得到了單層單頭非線性 Transformer 做 ICL 的內在機制,這一部分在原文的 Section 4。該過程可以用下圖表示。


ICML 2024 | 揭示非線形Transformer在上下文學習中學習和泛化的機制-AI.x社區


簡而言之,attention 層會選擇和 query 的 ODR/IDR pattern 一樣的上下文,賦予它們幾乎全部 attention 權重,然后 MLP 層會重點根據 attention 層輸出中的標簽嵌入來作出最后的分類。


總結


本文講解了在 ICL 當中,非線性 Transformer 的訓練機制,以及對于新任務和分布偏移數據的泛化能力。理論結果對于設計 prompt 選擇算法和 LLM 剪枝算法有一定實際意義。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/SJQiIp1W5kwWSVJaOXA9yA??

標簽
已于2024-6-28 10:57:20修改
收藏
回復
舉報
回復
相關推薦
欧美日韩一级大片| 99热这里只有精品在线播放| 亚洲大尺度网站| 一区二区三区高清视频在线观看| 亚洲电影免费观看高清完整版在线| 国产精品久久久久久久乖乖| 欧美日韩伦理片| 蜜臀av性久久久久蜜臀aⅴ四虎| 久久九九有精品国产23| 久久久久亚洲av成人网人人软件| 激情黄产视频在线免费观看| 中文字幕欧美区| 91精品久久久久久蜜桃| 中文字幕亚洲精品一区| 国产精品毛片一区二区在线看| 日韩久久精品一区| 亚欧在线免费观看| 黄污视频在线观看| 亚洲国产高清在线| 激情视频在线观看一区二区三区| 在线不卡免费视频| 国产精品美女久久久| 久久久av电影| 蜜乳av中文字幕| 国产区精品视频在线观看豆花| 欧美视频你懂的| 天天夜碰日日摸日日澡性色av| 自拍视频在线| 久久午夜老司机| 成人av影视在线| 在线免费观看视频网站| 国产精品一区毛片| 久久久久久久爱| 91嫩草丨国产丨精品| 精品中文一区| 日韩成人在线电影网| 在线观看一区二区三区视频| 精品亚洲a∨| 91国产丝袜在线播放| 免费看国产一级片| 国产福利在线免费观看| 亚洲六月丁香色婷婷综合久久| 日韩欧美一区二区三区四区| 神马精品久久| k8久久久一区二区三区| 97久草视频| 成人1区2区3区| 黄色资源网久久资源365| 国产精品视频色| 欧美一级黄视频| 快she精品国产999| 国产69精品久久久| www.av视频在线观看| 欧美先锋影音| 久久男人av资源网站| 草视频在线观看| 欧美不卡高清| 欧美福利视频在线| 国产真实乱偷精品视频| 伊人久久综合| 91高清视频免费观看| 91浏览器在线观看| 欧美一级一区| 国产精品96久久久久久又黄又硬| 中文字幕xxxx| 免费视频一区二区| 91久久精品视频| 99久久婷婷国产一区二区三区| 国产在线精品一区二区三区不卡 | 99免费精品视频| 精品久久久久亚洲| 九色国产在线观看| 中文字幕乱码久久午夜不卡| 一区二区冒白浆视频| 黄网站视频在线观看| 亚洲精品免费视频| 成年人网站免费视频| 欧美男女交配| 欧美日本在线一区| 亚洲av无一区二区三区久久| 第一区第二区在线| 亚洲欧洲黄色网| 自拍偷拍第9页| 欧美三级特黄| 欧美亚洲国产视频| 中文字幕一二区| 国产精品18久久久久久vr| 国产精品二区二区三区| 三级在线播放| 综合久久综合久久| 青青草视频在线免费播放| 欧产日产国产精品视频| 欧美视频你懂的| 国产69视频在线观看| 亚州精品视频| 久久这里有精品视频| 国产精品99re| 麻豆国产91在线播放| 俄罗斯精品一区二区三区| 你懂的在线视频| 亚洲欧洲制服丝袜| 日本www在线播放| 四虎永久精品在线| 日韩精品视频中文在线观看 | 一区二区三区在线视频观看| 波多野结衣家庭教师在线播放| 国产精品蜜月aⅴ在线| 欧美va亚洲va在线观看蝴蝶网| 欧美激情aaa| 欧美精品三区| 国产精品专区一| 熟妇人妻系列aⅴ无码专区友真希| 欧美激情一区二区三区蜜桃视频| 国产成人生活片| 九七电影院97理论片久久tvb| 亚洲精品一区二区三区四区高清| 91免费在线看片| 国产日本精品| aa日韩免费精品视频一| 超碰97在线免费观看| 亚洲高清不卡在线观看| 182午夜视频| 国产亚洲欧美日韩在线观看一区二区| 九九热r在线视频精品| 中国一级特黄视频| 久久综合九色欧美综合狠狠 | 欧美国产二区| 国产一线二线在线观看| 在线成人av网站| 青青青视频在线播放| 手机精品视频在线观看| 国产一区二区久久久| 超碰公开在线| 欧美年轻男男videosbes| 日韩av在线看免费观看| 99亚洲一区二区| 古典武侠综合av第一页| 伊人在我在线看导航| 欧美二区三区91| 日韩欧美视频免费观看| 奇米一区二区三区| 日韩啊v在线| 成人福利av| 亚洲男人天堂2024| 一级片中文字幕| 91丝袜呻吟高潮美腿白嫩在线观看| 99热这里只有精品免费| 国产成年精品| 欧美老女人性生活| 亚洲高清视频在线播放| 夜夜亚洲天天久久| 在线观看一区二区三区四区| 欧美日韩第一区| 99在线首页视频| 男插女视频久久久| 亚洲第一色在线| 中文字幕亚洲精品一区| 91在线一区二区| 日韩毛片在线免费看| 精品成av人一区二区三区| 国产精品1区2区在线观看| 国产香蕉视频在线看| 欧洲精品中文字幕| 天天做夜夜爱爱爱| 国产麻豆一精品一av一免费| 黄色一级片av| 精品视频在线你懂得| 欧洲亚洲在线视频| 91福利在线视频| 日韩免费一区二区三区在线播放| 精品处破女学生| 972aa.com艺术欧美| 亚洲 欧美 日韩系列| 999精品一区| 成人在线资源网址| 乡村艳史在线观看| 视频直播国产精品| 国产日韩免费视频| 午夜精品在线视频一区| 欧美多人猛交狂配| 国产又黄又大久久| 欧美二区在线视频| 欧美日韩黑人| 99re在线视频观看| 国产精品粉嫩| 久久色在线播放| 天堂av电影在线观看| 欧美日韩亚洲综合一区二区三区| 欧美黑吊大战白妞| 久久久夜色精品亚洲| 在线视频日韩欧美| 亚洲一区二区成人| 亚洲免费av网| 午夜欧洲一区| 亚洲曰本av电影| 欧美电影免费观看网站| 久久综合网hezyo| 精品美女视频在线观看免费软件| 欧美精品自拍偷拍动漫精品| 国产又大又黑又粗免费视频| 国产精品免费视频一区| 国产免费一区二区三区最新6| 日本不卡视频在线| 久久综合久久网| 99久久.com| 欧美一区二区三区在线播放| 亚洲午夜精品| 国产精品亚洲网站| 青青青免费在线视频| 伦理中文字幕亚洲| 国产高清一级毛片在线不卡| 精品国产一区二区亚洲人成毛片| 免费在线观看av的网站| 精品久久久久久亚洲精品| 精品无码久久久久成人漫画| 久久精品视频一区| 中文字幕免费在线播放| 国产一区日韩二区欧美三区| 亚洲五月天综合| 欧美三级网页| 在线播放 亚洲| 欧美一区电影| 日本精品一区二区三区视频| 加勒比视频一区| 粉嫩av免费一区二区三区| 黄色精品视频网站| 国产999视频| 欧美另类老肥妇| 国语对白做受69| 三级网站视频在在线播放| 久久影视电视剧免费网站| аⅴ资源新版在线天堂| 亚洲色图美腿丝袜| 水莓100在线视频| 日韩精品免费观看| 午夜视频在线免费播放| 日韩成人在线视频观看| 国产1区在线观看| 亚洲第一页自拍| 欧美一区二区三区激情| 精品国产乱码久久久久久牛牛| 国内精品国产成人国产三级| 欧美一区二区三区小说| 国产视频www| 91精品国产免费| 99热这里只有精品9| 日韩一区二区视频| 国产高清第一页| 精品国产三级a在线观看| 亚洲免费不卡视频| 亚洲精品在线观看视频| 好吊色一区二区三区| 亚洲成人黄色在线观看| 天天操天天插天天射| 亚洲精品aⅴ中文字幕乱码| 少妇喷水在线观看| 精品亚洲一区二区三区在线观看| 日本福利在线观看| 中文字幕亚洲一区二区三区| 日本在线免费播放| 久久成人av网站| 九色91在线| 青草成人免费视频| 免费高清视频在线一区| 国产中文字幕亚洲| 免费观看亚洲视频大全| 国产精品精品软件视频| 久久精品66| 日本一区二区三区视频免费看| 日韩av片子| 奇米777四色影视在线看| 中文亚洲欧美| 午夜宅男在线视频| 国产福利一区在线观看| 在线看黄色的网站| 国产欧美综合在线观看第十页| 欧美日韩国产一二三区| 一区二区国产视频| www.国产毛片| 91精品国产综合久久福利| 欧美一级片免费| 国产一区二区三区在线看 | 亚洲精品国产一区二区精华液| 国产一级片免费观看| 色综合网色综合| 99久久久国产精品无码网爆| 亚洲国产精品久久精品怡红院| 国产高清免费av在线| 久久国产精品久久久久久久久久 | 欧美成人午夜| 国产91在线视频观看| 狠狠色狠狠色综合系列| 亚洲第一页av| 亚洲人成7777| 波多野结衣视频网址| 日韩三级精品电影久久久| 免费人成在线观看网站| 久久在线视频在线| 欧美精品资源| 国产精品久久久久久久久久久久午夜片| 怕怕欧美视频免费大全| wwwwww欧美| 秋霞成人午夜伦在线观看| 中文字幕99页| 亚洲欧美国产高清| 中文字幕一区二区人妻视频| 精品久久一区二区| 午夜激情视频在线观看| 欧美一级视频免费在线观看| 日本在线成人| 青青草成人网| 99热在线精品观看| 日本黄色www| 最新热久久免费视频| 日本熟女毛茸茸| 亚洲电影av在线| 天堂亚洲精品| 国产专区精品视频| 国产亚洲精品美女久久久久久久久久| 成人免费在线网| 国产成人日日夜夜| 在线观看美女av| 欧美色视频在线| 国产youjizz在线| 日av在线播放中文不卡| 国产精品国产| 久久男人资源站| 国产精品一区二区久激情瑜伽| 制服丨自拍丨欧美丨动漫丨| 欧美中文字幕一区二区三区| 天堂a√中文在线| 欧美在线一级视频| 欧美日韩看看2015永久免费| 97碰在线视频| 国产经典欧美精品| 欧美久久久久久久久久久久| 欧美福利视频导航| 免费看a在线观看| 国产综合久久久久久| 第一社区sis001原创亚洲| 日韩福利视频在线| 国产午夜久久久久| 久久久精品毛片| 亚洲一区二区精品| 在线看欧美视频| 亚洲国产精品一区在线观看不卡 | 91久久精品美女| 在线成人激情| 在线成人精品视频| 亚洲一区二区三区在线看| 懂色av成人一区二区三区| 欧美激情在线观看视频| 美国一区二区| 国产精品-区区久久久狼 | 天堂资源在线亚洲资源| 日韩电影网1区2区| 欧美aaa级片| 91麻豆精品国产91久久久久久久久| 黄色网页在线免费观看| 96精品久久久久中文字幕| 综合激情网站| 国产成人av片| 欧美日韩国产色视频| 国产在线三区| 国产色婷婷国产综合在线理论片a| 99久久99久久精品国产片果冰| 91丝袜超薄交口足| 午夜欧美在线一二页| 男女污污视频在线观看| 国产精品永久免费视频| 中文字幕日韩欧美精品高清在线| 日本少妇xxxx软件| 欧美视频一区二区三区…| 成人欧美亚洲| 亚洲自拍偷拍区| 一区二区三区福利| 男人天堂资源网| 精品少妇一区二区三区| 中文字幕影音在线| 综合视频在线观看| 不卡影院免费观看| 姑娘第5集在线观看免费好剧| 久久天天躁狠狠躁夜夜av| 国产乱人伦精品一区| 啊啊啊国产视频| 亚洲永久免费av| 都市激情一区| 国产精品v欧美精品v日韩| 日韩黄色一级片| 久草免费在线观看视频| 在线观看视频99| 中文字幕一区日韩精品| 男人女人黄一级| 亚洲永久免费av| 日韩精品成人av| 精品一区二区三区自拍图片区| 蜜臀av性久久久久蜜臀aⅴ| 亚洲国产精一区二区三区性色| 一本色道久久综合狠狠躁篇的优点| 亚洲一区电影|