精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Transformer架構(gòu)的情境學(xué)習(xí)泛化能力

發(fā)布于 2025-3-24 00:32
瀏覽
0收藏

背景

大型語(yǔ)言模型(LLMs)如GPT-4和LLaMA-3憑借Transformer架構(gòu)的強(qiáng)大情境學(xué)習(xí)(In-Context Learning, ICL)能力,能夠從有限的示例中快速學(xué)習(xí)并適應(yīng)新任務(wù)。然而,ICL的泛化邊界和脆弱性一直缺乏系統(tǒng)性的理解,這限制了其在實(shí)際應(yīng)用中的潛力發(fā)揮。清華大學(xué)的研究團(tuán)隊(duì)通過定義一個(gè)以任務(wù)為中心的框架,從三個(gè)維度系統(tǒng)地研究了Transformer架構(gòu)在ICL下的泛化能力,并提出了優(yōu)化訓(xùn)練數(shù)據(jù)設(shè)計(jì)的重要指導(dǎo)原則。

研究框架:三維泛化能力分析

研究團(tuán)隊(duì)提出了一個(gè)任務(wù)中心框架,將ICL的泛化能力分為三個(gè)維度:

  1. 跨問題泛化(Inter-problem Generalization)模型能否將在一類問題上學(xué)到的知識(shí)遷移到全新的問題類型上。
  2. 問題內(nèi)泛化(Intra-problem Generalization)模型在接觸了問題類型的部分實(shí)例后,能否泛化到同類問題的其他實(shí)例。
  3. 任務(wù)內(nèi)泛化(Intra-task Generalization)模型在特定任務(wù)上學(xué)習(xí)后,能否在相似測(cè)試樣本上表現(xiàn)良好。

Transformer架構(gòu)的情境學(xué)習(xí)泛化能力-AI.x社區(qū)

這一框架使研究者能夠系統(tǒng)地評(píng)估Transformer模型在不同泛化場(chǎng)景下的表現(xiàn),從而揭示ICL能力的本質(zhì)和局限。

函數(shù)擬合實(shí)驗(yàn):泛化能力的基礎(chǔ)驗(yàn)證

研究首先通過函數(shù)擬合任務(wù)建立了一個(gè)可控的實(shí)驗(yàn)環(huán)境。研究者將基礎(chǔ)函數(shù)(如正弦、余弦函數(shù))定義為基本問題,將這些函數(shù)的組合(加法、乘法、復(fù)合)定義為復(fù)合問題,通過比較不同訓(xùn)練策略下模型的表現(xiàn)來評(píng)估其泛化能力。

實(shí)驗(yàn)設(shè)計(jì)

研究采用了兩種主要模型配置:

  • Baseline模型僅在基礎(chǔ)函數(shù)上訓(xùn)練
  • ComFuncLearner模型在基礎(chǔ)函數(shù)和部分組合函數(shù)上訓(xùn)練

通過比較這兩種模型在未見過的函數(shù)組合上的表現(xiàn),研究者能夠評(píng)估模型的跨問題和問題內(nèi)泛化能力。

關(guān)鍵發(fā)現(xiàn)

  1. 凸組合泛化:當(dāng)測(cè)試模型對(duì)基礎(chǔ)函數(shù)的凸組合進(jìn)行擬合時(shí),ComFuncLearner模型表現(xiàn)顯著優(yōu)于Baseline模型,即使ComFuncLearner只在訓(xùn)練中接觸過一種特定的凸組合。這表明Transformer模型具有強(qiáng)大的問題內(nèi)泛化能力。
  2. 乘積組合泛化:在函數(shù)乘積組合的測(cè)試中,隨著ComFuncLearner在訓(xùn)練中接觸的組合模式數(shù)量增加,其在未見過的乘積組合上的表現(xiàn)持續(xù)提升,進(jìn)一步證實(shí)了問題內(nèi)泛化能力的存在。
  3. 復(fù)合函數(shù)泛化:在更復(fù)雜的函數(shù)復(fù)合測(cè)試中,模型表現(xiàn)出類似的泛化模式,但由于復(fù)合操作的復(fù)雜性,泛化難度明顯增加。
  4. 預(yù)訓(xùn)練模型的影響:研究還發(fā)現(xiàn),即使是經(jīng)過大規(guī)模預(yù)訓(xùn)練的LLaMA-3模型,在沒有接觸過特定組合形式的情況下,也難以實(shí)現(xiàn)跨問題泛化,但在問題內(nèi)和任務(wù)內(nèi)泛化方面表現(xiàn)出色。

這些實(shí)驗(yàn)結(jié)果一致表明,Transformer模型在ICL范式下缺乏跨問題泛化能力,但具有出色的問題內(nèi)和任務(wù)內(nèi)泛化能力。

實(shí)際應(yīng)用場(chǎng)景驗(yàn)證

為了驗(yàn)證函數(shù)擬合實(shí)驗(yàn)的發(fā)現(xiàn)在實(shí)際應(yīng)用中的有效性,研究團(tuán)隊(duì)進(jìn)一步在工具調(diào)用和翻譯任務(wù)上進(jìn)行了實(shí)驗(yàn)。

工具調(diào)用實(shí)驗(yàn)

研究者將單API調(diào)用定義為基本問題,多API調(diào)用定義為復(fù)合問題,在LLaMA-2模型上進(jìn)行了實(shí)驗(yàn)。結(jié)果顯示:

  1. 在ComFuncLearner模型(訓(xùn)練包含多API調(diào)用示例)上應(yīng)用ICL,顯著提升了模型在多API任務(wù)上的表現(xiàn)。
  2. 有趣的是,ComFuncLearner模型在簡(jiǎn)單的單API任務(wù)上的表現(xiàn)也優(yōu)于Baseline模型,表明訓(xùn)練數(shù)據(jù)的多樣性不僅提升了復(fù)雜任務(wù)的表現(xiàn),還能提高簡(jiǎn)單任務(wù)的上限。

翻譯任務(wù)實(shí)驗(yàn)

研究者使用Qwen2-1.5B架構(gòu)的模型,在英語(yǔ)和德語(yǔ)翻譯任務(wù)上進(jìn)行了實(shí)驗(yàn),將單語(yǔ)言到單語(yǔ)言翻譯定義為基本問題,混合語(yǔ)言輸入的翻譯定義為復(fù)合問題。結(jié)果表明:

  1. 在復(fù)雜的混合語(yǔ)言輸入任務(wù)上,ComFuncLearner模型明顯優(yōu)于Baseline模型,且ICL帶來的提升更為顯著。
  2. 在簡(jiǎn)單的單語(yǔ)言翻譯任務(wù)上,針對(duì)特定任務(wù)微調(diào)的Baseline模型表現(xiàn)最佳,表明ICL的問題內(nèi)和跨問題泛化能力仍低于任務(wù)內(nèi)泛化能力。
  3. 當(dāng)將測(cè)試集分為簡(jiǎn)單和困難樣本時(shí),發(fā)現(xiàn)在復(fù)雜樣本上,ComFuncLearner模型通過ICL獲得的提升更為顯著,而Baseline模型的提升有限。

這些實(shí)際應(yīng)用實(shí)驗(yàn)進(jìn)一步證實(shí),當(dāng)模型在訓(xùn)練階段接觸更廣泛的問題類型時(shí),能顯著提高其通過ICL實(shí)現(xiàn)的泛化能力上限,尤其是在復(fù)雜任務(wù)上。

分布偏移下的泛化能力

研究還探討了當(dāng)ICL示例與測(cè)試樣本之間存在分布偏移時(shí),模型的泛化能力如何受影響。實(shí)驗(yàn)考察了三種關(guān)鍵場(chǎng)景:

  1. 標(biāo)簽噪聲:在ICL示例中引入標(biāo)簽噪聲,發(fā)現(xiàn)即使只有少量噪聲樣本(如39個(gè)示例中的10個(gè)),也會(huì)顯著影響模型的泛化能力。
  2. 輸入偏差:當(dāng)ICL示例包含測(cè)試范圍之外的輸入時(shí),模型在測(cè)試樣本上的表現(xiàn)顯著下降,即使這些額外樣本的輸出仍遵循真實(shí)函數(shù)。
  3. 輸入和輸出偏差:當(dāng)ICL示例同時(shí)包含范圍外的輸入和偏移的輸出時(shí),模型的泛化能力進(jìn)一步惡化。

這些發(fā)現(xiàn)表明,ICL對(duì)示例分布的偏移非常敏感,這在實(shí)際應(yīng)用中需要特別注意。

研究結(jié)論與指導(dǎo)原則

通過這一系列實(shí)驗(yàn),研究團(tuán)隊(duì)得出了幾個(gè)關(guān)鍵結(jié)論:

  1. Transformer模型在ICL中缺乏跨問題泛化能力,但在問題內(nèi)和任務(wù)內(nèi)泛化方面表現(xiàn)出色。
  2. 即使經(jīng)過大規(guī)模預(yù)訓(xùn)練的模型,如果沒有在微調(diào)階段接觸特定的問題組合形式,也難以通過ICL實(shí)現(xiàn)跨問題泛化。
  3. 在訓(xùn)練數(shù)據(jù)中包含更多樣化的任務(wù)類型,不僅能提高模型在未見任務(wù)上的ICL泛化能力,還能提升其在已知簡(jiǎn)單任務(wù)上的表現(xiàn)。
  4. 訓(xùn)練數(shù)據(jù)中任務(wù)多樣性的增加,能顯著放大ICL在復(fù)雜任務(wù)上帶來的改進(jìn)效果。

這些發(fā)現(xiàn)為大型語(yǔ)言模型的訓(xùn)練數(shù)據(jù)設(shè)計(jì)提供了重要指導(dǎo):應(yīng)當(dāng)最大化覆蓋任務(wù)的多樣性,并在可能的情況下結(jié)合不同任務(wù),而不是僅關(guān)注特定的目標(biāo)任務(wù)。這種策略不僅能提高模型的跨問題泛化能力,還能增強(qiáng)其在原本簡(jiǎn)單任務(wù)上的表現(xiàn)。

研究意義與未來方向

這項(xiàng)研究系統(tǒng)地揭示了Transformer架構(gòu)在ICL下的泛化邊界,為理解大型語(yǔ)言模型的能力與局限提供了重要見解。研究結(jié)果表明,雖然當(dāng)前模型在跨問題泛化方面存在局限,但通過優(yōu)化訓(xùn)練數(shù)據(jù)的多樣性,可以顯著提升其泛化能力。

未來研究可以進(jìn)一步探索:

  1. 如何設(shè)計(jì)更有效的訓(xùn)練數(shù)據(jù)組合,最大化模型的泛化能力
  2. 改進(jìn)模型架構(gòu),增強(qiáng)其跨問題泛化能力
  3. 開發(fā)更魯棒的ICL方法,減少對(duì)示例分布偏移的敏感性

這項(xiàng)研究不僅深化了我們對(duì)Transformer架構(gòu)和ICL機(jī)制的理解,也為大型語(yǔ)言模型的實(shí)際應(yīng)用提供了寶貴的指導(dǎo)原則,有助于釋放這些模型的全部潛力。

論文:???https://arxiv.org/abs/2503.15579???

代碼:????https://github.com/UbeCc/Generalization-of-Transformers???

 

本文轉(zhuǎn)載自??頓數(shù)AI??,作者:蔥蔥

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
亚洲成人精品女人久久久| 免费无码一区二区三区| 激情视频在线观看| 国产一区二区三区久久久| 久久久免费av| 国产美女免费无遮挡| 久久精品黄色| 亚洲国产视频在线| 日韩精品久久久毛片一区二区| 一级片一区二区三区| 欧美成人69av| 亚洲欧美一区二区三区久久| 九九九九九伊人| 免费h视频在线观看| 国产精品美女久久久久久2018| 成人免费视频网站| japanese国产在线观看| 国产精品sm| 伊人伊人伊人久久| 精品一区二区三区四区五区六区| 九九热这里有精品| 黑人巨大精品欧美一区免费视频 | 日本香蕉视频在线观看| 日本私人网站在线观看| 国产精品一区二区黑丝| 国产成人自拍视频在线观看| 亚洲国产美女视频| 俺要去色综合狠狠| 亚洲第一网站男人都懂| 婷婷激情小说网| 精品3atv在线视频| 午夜精品福利一区二区三区av | 中文字幕人妻一区| 欧美激情啪啪| 91极品视觉盛宴| 无码中文字幕色专区| 国产超级va在线视频| 中文字幕免费一区| 日本不卡一区二区三区在线观看| 精品人妻一区二区三区换脸明星| 麻豆久久久久久| 国产福利精品av综合导导航| 日韩人妻无码一区二区三区99| 亚洲色图二区| www亚洲欧美| 手机看片日韩av| 精品在线观看入口| 日韩大陆欧美高清视频区| 久久久久亚洲av无码网站| 亚洲青青久久| 欧美精品久久久久久久多人混战| 色一情一乱一伦一区二区三区日本| 精精国产xxxx视频在线播放| 亚洲专区一二三| 日韩精品综合在线| 欧美人与动牲性行为| 樱桃视频在线观看一区| 免费在线看黄色片| 国产盗摄一区二区| 性做久久久久久久久| 97超碰国产精品| 123区在线| 五月天丁香久久| 欧美视频在线播放一区| 一本大道色婷婷在线| 岛国av一区二区在线在线观看| 99视频在线免费播放| 色偷偷色偷偷色偷偷在线视频| 伦av综合一区| 久久人人超碰| 青青精品视频播放| 精品人妻一区二区三区潮喷在线| 丝袜a∨在线一区二区三区不卡| 日av在线播放中文不卡| 亚洲精品中文字幕乱码三区91| 米奇777在线欧美播放| 国产成人激情小视频| 中国a一片一级一片| 久久国产精品72免费观看| 成人精品在线视频| 国产亚洲黄色片| 毛片网站在线看| 五月天亚洲婷婷| 大肉大捧一进一出好爽动态图| 嫩草伊人久久精品少妇av杨幂| 欧美日韩一区成人| 中文字幕人妻无码系列第三区| www.成人网| 亚洲精品成人久久| 成人一级片免费看| 欧美精品一卡| 热99精品里视频精品| 在线观看国产成人| 大桥未久av一区二区三区中文| 精品免费日产一区一区三区免费| 国产一区二区影视| 亚洲欧美另类久久久精品2019| 人妻夜夜添夜夜无码av| 激情开心成人网| 欧美一激情一区二区三区| 亚洲精品女人久久久| 久久国产综合| 91精品国产高清久久久久久91| 亚洲一级视频在线观看| 国产成人综合在线播放| 欧美精品成人一区二区在线观看| 麻豆视频在线免费观看| 狠狠躁18三区二区一区| 图片区乱熟图片区亚洲| 女人av一区| 欧美激情欧美激情在线五月| 无码无套少妇毛多18pxxxx| 国产精品亚洲第一| 日韩高清av| 51精品在线| 538在线一区二区精品国产| 久久久午夜精品福利内容| 欧美高清视频在线观看mv| 88国产精品欧美一区二区三区| 在线观看亚洲一区二区| 91原创在线视频| 国产成人三级视频| 成人午夜sm精品久久久久久久| 亚洲精品一区二区三区四区高清| 中文字幕美女视频| 久久精品官网| 精品日韩电影| 国产精品—色呦呦| 91精品国产欧美一区二区成人| 精品无码国产污污污免费网站| 亚洲小说欧美另类社区| 成人在线中文字幕| 97超碰国产一区二区三区| 色综合天天综合在线视频| 四虎国产精品永久免费观看视频| 欧美一级精品片在线看| 国产99久久精品一区二区| 欧美一区,二区| 亚洲一区在线播放| 无人码人妻一区二区三区免费| 久久精品国产68国产精品亚洲| 国产成人jvid在线播放| 三区在线观看| 狠狠色香婷婷久久亚洲精品| 免费a v网站| 99精品国产一区二区青青牛奶 | 成人国产视频在线观看| 国产精品无码电影在线观看| 麻豆精品国产| 欧美精品免费看| 国产夫妻在线观看| 亚洲精品国产成人久久av盗摄| 久久久久久久久久一区| 97精品97| 成人精品在线观看| 91蜜桃在线视频| 日韩区在线观看| 玖玖爱免费视频| 国产v综合v亚洲欧| 成年人看的毛片| 日韩欧美国产大片| 日本亚洲精品在线观看| 黄色国产在线| 欧美三级电影网站| 羞羞在线观看视频| 国产一区二区三区免费看| 国产91在线亚洲| 牛牛视频精品一区二区不卡| 欧美中文字幕视频| 91大神xh98hx在线播放| 538在线一区二区精品国产| 欧美黄色一级网站| av资源网一区| 国产精品人人妻人人爽人人牛| 成人av二区| 亚洲综合自拍一区| cao在线视频| 亚洲女人天堂成人av在线| 怡红院男人天堂| 亚洲美女视频在线观看| 91av在线免费| 久久精品国产久精国产| 一级性生活视频| 欧美一级一片| 国产九九精品视频| 日韩影视在线| 亚洲视频在线观看免费| 国产毛片毛片毛片毛片| 亚洲aⅴ怡春院| 久久精品—区二区三区舞蹈| 韩日精品视频一区| av女优在线播放| 欧美色女视频| 国产成人免费观看| 欧美va在线观看| 九九热最新视频//这里只有精品| 人人九九精品| 日韩区在线观看| 久久久久久亚洲av无码专区| 亚洲天堂a在线| 欧美丰满少妇人妻精品| 国产一区二区不卡| www.日本xxxx| 欧美国产91| 亚洲巨乳在线观看| 久久综合五月婷婷| 亚洲影院色无极综合| 九九热线视频只有这里最精品| 美女精品久久久| 精品av中文字幕在线毛片| 日韩视频一区二区三区在线播放| 无码人妻久久一区二区三区不卡| 亚洲综合久久久久| 国产又粗又长又黄的视频| 99精品欧美一区二区三区综合在线| 日韩欧美国产片| 噜噜爱69成人精品| 欧美又粗又长又爽做受| 97色伦图片97综合影院| 免费99视频| 国产ts一区| 91免费精品国偷自产在线| 成人免费毛片嘿嘿连载视频…| 久久免费视频观看| av片在线观看免费| 日韩中文av在线| 国产九九在线| 亚洲精品自拍视频| 日本免费一区视频| 欧美成人免费网站| 国产色综合视频| 欧美人伦禁忌dvd放荡欲情| 亚洲精品男人的天堂| 午夜精品免费在线| 久久成人在线观看| 尤物av一区二区| 亚洲一二三在线观看| 国产精品入口麻豆原神| 非洲一级黄色片| 国产性色一区二区| 天堂久久精品忘忧草| 久久亚洲精品小早川怜子| 变态另类丨国产精品| av在线不卡免费看| 亚洲久久久久久| 白白色亚洲国产精品| 91九色蝌蚪porny| 成人免费高清在线观看| 国产午夜在线一区二区三区| 成人激情文学综合网| 日本三级日本三级日本三级极| 国产99久久久久| 国产大学生视频| 成人av电影在线观看| 少妇被狂c下部羞羞漫画| 波多野结衣视频一区| 国产成人精品无码片区在线| 成人性生交大片免费看中文网站| 丰满人妻一区二区三区免费视频棣| 国产精品66部| 青青草视频网站| 99久久精品国产导航| 色呦呦一区二区| 国产亚洲欧洲一区高清在线观看| 美国黑人一级大黄| 最新久久zyz资源站| 九九热最新地址| 亚洲综合在线免费观看| 波多野结衣国产| 在线观看区一区二| 亚洲专区在线播放| 日韩欧美aaaaaa| 天天干在线观看| 国产亚洲欧美视频| 成人在线免费看黄| 午夜精品在线观看| av一区在线| 亚洲一区二区三| 久久男人av| 午夜一区二区三区| 一区二区不卡| 国产欧美在线一区| 久久99久久精品欧美| 日本精品一二三区| 欧美极品xxx| 青娱乐91视频| 色综合久久中文综合久久97| 怡红院成永久免费人全部视频| 日韩视频在线一区二区| 色就是色亚洲色图| 久久激情视频久久| 嗯啊主人调教在线播放视频| 日本久久久久久久久| 国产精品久一| 久久精品第九区免费观看| 欧美日韩在线观看视频小说| 久久香蕉视频网站| 久久免费国产| 丰满人妻一区二区三区大胸| 久久久99精品免费观看不卡| 精品丰满少妇一区二区三区| 一区二区三区欧美久久| 亚洲大尺度在线观看| 精品乱人伦一区二区三区| 日韩欧美电影在线观看| 久久国产精品网站| 欧美三区四区| 国产精品免费一区二区三区四区 | 亚洲片国产一区一级在线观看| 成年人黄视频在线观看| 国产激情久久久久| 精品国产一区二区三区成人影院 | 无码精品一区二区三区在线播放 | 国产一级一片免费播放放a| 欧美伊人久久久久久久久影院 | 91久久国产视频| 91精品国产欧美日韩| 成人三级黄色免费网站| 8090成年在线看片午夜| 丁香5月婷婷久久| 中文字幕免费高| 麻豆精品视频在线观看免费| 好吊日免费视频| 亚洲午夜在线视频| 国产精品自产拍| 日韩中文字幕网| 欧洲成人一区| 免费一区二区三区在在线视频| 韩国欧美一区| 能看毛片的网站| 亚洲色图.com| 国产又粗又长视频| 色诱女教师一区二区三区| free欧美| 欧美不卡三区| 亚洲欧美日韩一区在线观看| 欧美大喷水吹潮合集在线观看| 一区二区三区资源| 国产不卡精品视频| 欧美伦理91i| 欧美国产中文高清| 超碰10000| 国产老妇另类xxxxx| 手机在线免费看毛片| 制服丝袜亚洲精品中文字幕| 日本不卡视频| 成人免费网站在线看| 99久久99久久精品国产片果冰| 日本人69视频| 自拍视频在线观看一区二区| 在线视频 中文字幕| 色老头一区二区三区| 日韩精品一级毛片在线播放| 一区二区三区免费看| 久久国产成人午夜av影院| 少妇高潮在线观看| 3751色影院一区二区三区| 91cn在线观看| 国产91社区| 亚洲一区欧美一区| 国产日韩精品suv| 久久影视电视剧免费网站| 在线播放成人| 国产91porn| 国产成人综合视频| 国产精品1000| 亚洲欧美视频在线| 精品国产美女a久久9999| 欧美日韩在线免费观看视频| 国产高清精品网站| 日韩精品一区二区三区国语自制| 日韩毛片中文字幕| 日韩欧美一区二区三区在线观看 | 天天操天天干天天插| 国产成人av网| 亚洲一本二本| 久久久久亚洲AV成人无码国产| 色综合视频在线观看| av在线之家电影网站| 亚洲xxx自由成熟| 99热免费精品在线观看| 国产激情av在线| 精品黑人一区二区三区久久| 成人影院网站| 四虎永久免费网站| 97久久精品人人澡人人爽| 国产精品xxxxxx| 九九精品视频在线观看| 亚洲瘦老头同性70tv| 亚洲综合123| 欧美午夜片在线免费观看| 免费网站免费进入在线| 国产精品久久久久免费| 日本欧美在线看| 久久久久无码精品国产| 中文字幕亚洲一区二区三区| 亚洲一区 二区| 国产三级国产精品国产专区50| 亚洲午夜一区二区| 亚洲视频tv|