精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta發布首個「非參數化」掩碼語言模型NPM:吊打500倍參數量的GPT-3

人工智能 深度學習
Meta發布首個非參數化掩碼語言模型NPM:那年雙手插兜,不知道什么叫做out of vocabulary。

雖然大型語言模型在NLP領域展現出的強大性能十分驚人,但其帶來的負面代價也很嚴重,比如訓練過于昂貴,難以更新等。,而且很難處理長尾知識。 

并且語言模型通常采用在預測層采用一個包含有限詞匯量的softmax層,基本上不會輸出少見的單詞或短語,極大限制了模型的表達能力。

為了解決模型的長尾問題,最近來自華盛頓大學、Meta AI和艾倫人工智能研究所的學者聯合提出了首個「非參數化掩碼語言模型」(NonParametric Masked language model, NPM),通過參考語料庫中每個短語的非參數化分布來代替softmax輸出。

圖片

論文鏈接:https://arxiv.org/abs/2212.01349

代碼鏈接:https://github.com/facebookresearch/NPM

NPM可以通過對比目標(contrastive objective)和批內近似于檢索完整語料庫的方式進行有效訓練。

研究人員對9個封閉式任務和7個開放式任務進行了zero-shot評估,包括強調需要預測新事實或罕見短語的時空轉換和詞級翻譯任務。

結果發現,無論是否采用檢索和生成的方法,NPM都明顯優于較大的參數模型,比如參數量高500倍的GPT-3和37倍的OPT 13B性能還強不少,并且NPM在處理罕見模式(詞義或事實)和預測罕見或幾乎未見過的詞(如非拉丁文字)方面尤其出色。

首個非參數化語言模型

雖然結合現有的一些檢索和生成(retrieve-and-generate)的相關工作可以緩解該問題,但這些模型的最終預測部分仍然需要一個softmax層來預測token,沒有從根本上解決長尾問題。

NPM由一個編碼器和一個參考語料庫組成,編碼器將文本映射成一個固定大小的向量,然后NPM從中檢索出一個短語并填入[MASK]。

圖片

可以看到,NPM選擇在短語上得到的非參數化分布,而沒有使用一個固定的輸出詞匯softmax作為輸出。

但訓練非參數化模型也帶來了兩個關鍵的問題:

1. 在訓練過程中檢索完整的語料庫是非常耗時耗力的,研究人員通過使用完整語料庫檢索的批內近似值來解決;

2. 在沒有解碼器的情況下學習預測任意長度的短語是很困難的,研究人員通過擴展span masking和短語級別的對比目標來解決。

總之,NPM完全刪除了輸出詞匯的softmax,通過預測任意數量的n-gram,實現了有效的無界輸出空間。

由此產生的模型可以預測「極其罕見」甚至是「完全未見過」的單詞(如韓語單詞),并可以有效地支撐無限的詞匯量,而現有的模型都無法做到這一點。

NPM方法

NPM的關鍵思想是使用編碼器將語料庫中的所有短語映射到一個密集的向量空間中。在推理時,當給定一個帶有[MASK]的查詢后,使用編碼器從語料庫中找到最近的短語并填入[MASK]。

純編碼器(Encoder-only)模型是一個很有競爭力的表示模型,但現有的純編碼模型無法進行token數量未知的預測,使得它們的使用情況在沒有微調的情況下受到限制。

NPM通過檢索一個短語來填補[MASK]中的任意數量的token,從而解決了這個問題。

推理

編碼器將參考語料庫C中的每個不同的短語都映射到一個密集的向量空間中。

在測試時,編碼器將被masked的查詢映射到相同的向量空間中,并從C中檢索出短語來填充[MASK]。

在這里,C不一定要和訓練語料庫一樣,在測試時可以被替換或擴展,而不需要重新訓練編碼器。

在實踐中,語料庫中存在大量的短語,對所有的短語進行索引是很昂貴的。

比如我們考慮最多有 l 個token的短語(l≈20),就需要索引 l×|C| 數量的向量,這可能會很耗時。

圖片

研究人員對C中每個不同的token進行索引,從而將索引的大小從l×|C|減少到 |C|,然后在測試時,通過對開頭和結尾分別進行k近鄰搜索,對所有短語的非參數分布進行近似。

比如由4個BPE token組成的短語Thessaloniki用c1和c4的連接來表示,分別對應于該短語的開始(The)和結束(iki)。

然后用同一向量空間中的兩個向量q_start和q_end來表示一個查詢,然后用每個向量來檢索似是而非的短語的開始和結束,然后再進行聚合。

這樣做的前提是開始和結尾的表示足夠好,即q起點足夠接近c1,q終點足夠接近c4,而這一點在訓練過程中已經得到確保了。

訓練

NPM是在無標簽的文本數據上訓練的,以確保編碼器將文本映射到一個良好的密集向量空間。

訓練NPM主要有兩個難題:1)完整的語料庫檢索會使訓練非常耗時;2)用任意長度的短語而不非token來填充[MASK]。

1. 掩碼Masking

片段掩碼(span masking)就是對長度從幾何分布中取樣的連續token進行mask。

研究人員對此進行擴展:

1)如果某些片段在batch中的其他序列中共同出現,再對其進行屏蔽,以保證在訓練期間該批次內的正例(in-batch positives)。

圖片

比如,屏蔽的片段2010、the Seattle Seahawks和to the都在另一個序列中共同出現。

但對于「game ,」這個bigram來說就無法一起被mask,雖然它們也都出現在兩個序列中,但它們并沒有在一起共現。

2)不是用[MASK]來替換片段中的每個token,而是用兩個特殊的token [MASKs][MASKe]來替換整個片段。

比如上面的例子中,不論被mask的片段長度如何,都被替換成[MASKs][MASKe],從而可以獲得每個片段的起點和終點向量,更方便推理。

2. 訓練目標

圖片

假設被mask的片段是the Seattle Seahawks,在測試時,模型應該從參考語料庫的其他序列中檢索出the Seattle Seahawks這一短語。

而在推理階段,模型從[MASKs]和[MASKe]中獲得向量,并利用它們分別從語料庫中檢索出短語的開始和結束。

因此,訓練的目標應該鼓勵[MASKs]的向量更接近于the Seattle Seahawks中的the,而與其他token相距較遠,并且不應該是任意一個短語中的the,比如become the first中。

通過將完整的語料庫近似為batch中的其他序列來訓練模型來做到這一點,具體來說,訓練模型從同一batch的其他序列中檢索出the Seattle Seahawks這一片段的起點和終點。

需要注意的是,該mask策略確保每個被遮蔽的跨度在一個batch中都有一個共同出現的片段。

實驗部分

從結果上看,NPM在zero-shot設置下比其他基線模型的性能都要強。

圖片

在參數化模型中,RoBERTa取得了最好的性能,出人意料地超過了包括GPT-3等在內的模型,可能是因為純編碼器模型的雙向性起到了至關重要的作用,這也表明,因果語言模型可能不是一個合適的分類選擇。

kNN-LM方法在參數模型中加入了非參數成分,其性能優于其他所有基線。盡管如此,僅僅依靠檢索(kNN)在GPT-2中的表現很差,這表明僅在推理時使用kNN是有限的。

NPM SINGLE和NPM的表現都明顯優于所有基線,在所有數據集上都取得了一致的優越性能。這表明,即使對于不明確需要外部知識的任務,非參數模型也非常有競爭力。

定性分析時采用RoBERTa和NPM在情感分析任務時的預測結果。第一個例子用便宜表示不貴,第二個例子用便宜表示質量很差。

圖片

RoBERTa對這兩個例子的預測都是正向的,而NPM通過檢索在與輸入相同的語境中使用cheap的語境,做出了正確的預測。

還可以發現,NPM輸出的表征能帶來更好的詞義消歧。例如,RoBERTa在cheap(廉價)和cheap(質量很差)之間分配了一個很高的相似性分數。

另一方面,NPM成功地在cheap和cheap之間分配了一個低的相似性分數,也表明該非參數訓練與對比性目標是有效的,可以更好地提高表征學習,而kNN推理這類沒有訓練的算法是完全做不到的。

參考資料:https://arxiv.org/abs/2212.01349

責任編輯:武曉燕 來源: 新智元
相關推薦

2021-07-13 17:38:49

算法語言模型GPT-4

2021-08-12 16:27:04

模型人工智能深度學習

2022-08-18 15:13:37

模型參數

2022-03-24 10:35:38

人工智能模型代碼

2023-02-25 21:45:55

模型AI

2021-12-10 15:46:18

谷歌模型人工智能

2022-01-05 10:33:56

開發者技能DeepMind

2021-09-30 11:20:01

AI 數據人工智能

2022-05-05 08:25:22

模型OpenAI代碼

2022-03-14 09:33:56

神經網絡模型人工智能

2022-05-05 09:00:00

AI模型數據

2021-03-23 15:21:00

人工智能機器學習技術

2024-04-19 10:32:08

2022-05-07 13:04:34

Meta語言模型開源

2025-03-03 08:00:00

OpenAI模型AI

2024-05-20 08:50:00

模型神經網絡

2021-09-08 17:23:33

谷歌模型開發

2023-02-25 16:14:36

AIMeta語言模型

2023-09-11 13:28:00

AI模型

2023-01-06 15:07:03

點贊
收藏

51CTO技術棧公眾號

国产免费无遮挡吸奶头视频| 亚洲一区三区电影在线观看| 免费观看成人毛片| 国产真实有声精品录音| 欧美日本乱大交xxxxx| 日本黄网站色大片免费观看| 日韩国产福利| 国内精品不卡在线| 欧美诱惑福利视频| 日本欧美一区二区三区不卡视频| 国产精品免费福利| 亚洲图色在线| 亚洲第一精品网站| 日韩va欧美va亚洲va久久| 久久九九免费视频| 欧美狂猛xxxxx乱大交3| 日本一区二区三区播放| 色综合久久66| 亚洲国产精品无码av| 日本综合在线| 国产农村妇女精品| 国产精品久久久久av福利动漫| 波多野结衣一二区| 国产一级一区二区| 欧美国产日韩二区| 日本裸体美女视频| 成人影视亚洲图片在线| 亚洲精品v天堂中文字幕| 中文字幕12页| 国产91亚洲精品久久久| 精品久久久香蕉免费精品视频| 看全色黄大色大片| 在线观看免费黄视频| 91丨porny丨最新| 豆国产97在线| av片免费播放| 激情国产一区二区| 国产精品中文在线| 91porny九色| 性色一区二区三区| 91av网站在线播放| 国产乡下妇女做爰| 黄色欧美成人| 久久99亚洲热视| 波多野结衣爱爱视频| 一区二区不卡| 美日韩精品免费视频| 男人的午夜天堂| 婷婷久久综合| 日韩在线观看免费高清| 黄色国产在线播放| 久久人体视频| 精品国产欧美一区二区三区成人| 中文字幕在线观看二区| 成人综合专区| 日韩最新av在线| 中文国语毛片高清视频| 亚洲精品国产成人影院| 久久久精品在线观看| 艳妇荡乳欲伦69影片| 91精品福利| 欧美黑人xxxⅹ高潮交| 久久午夜无码鲁丝片| 亚洲一本视频| 欧美亚洲视频一区二区| 69成人免费视频| 视频精品一区二区| 国产欧美va欧美va香蕉在线| 国产尤物视频在线观看| 国产一区二区成人久久免费影院| 1卡2卡3卡精品视频| 欧美一区二区三区黄片| 97精品超碰一区二区三区| 欧美视频小说| 免费在线观看av网站| 尤物在线观看一区| 国产精品333| 8av国产精品爽爽ⅴa在线观看| 欧美日韩黄视频| 中文字幕第三区| 天堂av一区二区三区在线播放| 国产一区二区激情| 日本青青草视频| 国产欧美不卡| 国产裸体写真av一区二区| 国产av无码专区亚洲av麻豆| 97se狠狠狠综合亚洲狠狠| 日本一区二区三区精品视频| 岛国成人毛片| 黑人巨大精品欧美一区二区三区 | 亚洲天天影视| 一区二区三区在线看| 波多野结衣乳巨码无在线| 超薄肉色丝袜脚交一区二区| 欧美一区二区日韩| 国产精品无码午夜福利| 亚洲国产精品综合久久久| 97在线看福利| 国产又粗又猛又色又| 本田岬高潮一区二区三区| 日韩精品欧美在线| aa国产成人| 欧美日韩一区二区不卡| 国产麻豆xxxvideo实拍| 99精品国产一区二区三区| 性欧美xxxx视频在线观看| 一区二区小视频| proumb性欧美在线观看| 国内外成人激情免费视频| 亚洲人体影院| 精品国产一区二区三区久久影院| 久久久久亚洲av成人无码电影| 欧美一区亚洲| 国产精品视频区| 四虎影视在线观看2413| 一区二区三区色| 邪恶网站在线观看| 九九亚洲精品| 97成人超碰免| 亚洲男人天堂久久| 综合久久给合久久狠狠狠97色| 国产精品宾馆在线精品酒店| 日韩黄色av| 色妞一区二区三区| 波多野结衣二区三区| 99视频精品全部免费在线| 2021狠狠干| 欧美午夜三级| 中文字幕一区二区三区电影| 一区二区三区在线观看av| 成人午夜免费电影| 亚洲国产一二三精品无码| 免费成人毛片| 中文字幕日本精品| 亚洲精品一区二三区| 久久久精品tv| www日韩视频| 欧美激情在线免费| 国产精品999999| 免费黄色片在线观看| 欧美性开放视频| 三级黄色片网站| 亚洲精品免费观看| 久久av一区二区三区漫画| 国产精品蜜芽在线观看| 亚洲国产精品久久久久久| 久久久久黄色片| 懂色av一区二区三区蜜臀| 污污污污污污www网站免费| 日韩高清在线观看一区二区| 久久的精品视频| 国产成人精品一区二三区四区五区 | 97久久夜色精品国产九色| 国产激情在线观看| 日韩午夜电影av| 精品爆乳一区二区三区无码av| 国产激情偷乱视频一区二区三区| 免费在线精品视频| 三级欧美日韩| 国内精品一区二区三区| 天天爽夜夜爽夜夜爽| 色综合天天综合网天天看片| 无码一区二区三区在线| 蜜臀久久99精品久久久久宅男 | 久久久久亚洲av无码专区桃色| 在线一区欧美| 日本一区二区免费看| 国产成人免费精品| 欧美精品在线观看| 少妇av在线播放| 色欧美片视频在线观看在线视频| 日韩免费成人av| 国产美女久久久久| 国自产拍偷拍精品啪啪一区二区| 一区二区三区四区在线看| 国产精品在线看| 欧美理论片在线播放| 日韩经典一区二区三区| 超碰在线97观看| 亚洲美女免费在线| 性色av蜜臀av色欲av| 麻豆国产精品777777在线| 欧美一级中文字幕| 亚洲另类春色校园小说| 成人免费视频网址| 国产蜜臀一区二区打屁股调教| 精品一区二区三区三区| 亚洲视频在线观看一区二区| 一区二区免费在线| 男人天堂av电影| 国产在线不卡视频| 国产免费一区二区三区视频| 欧美激情国产在线| 精品一区国产| 亚洲精品乱码日韩| 91精品国产精品| 91最新在线| 亚洲第一天堂av| 国产一区二区三区视频免费观看| 亚洲v精品v日韩v欧美v专区| 性爱在线免费视频| 99国产一区二区三精品乱码| 午夜啪啪小视频| 天堂一区二区在线| 日韩精品一区二区免费| 成人3d精品动漫精品一二三| 国产视频一区二区三区四区| 午夜精品久久久久久毛片| 欧美在线一级视频| 免费在线看电影| 久久精品一本久久99精品| 日本一级在线观看| 精品国产a毛片| 国产情侣自拍小视频| 欧美视频精品在线观看| 丰满少妇xoxoxo视频| 亚洲va欧美va人人爽午夜| 顶级黑人搡bbw搡bbbb搡| 中文字幕久久午夜不卡| 国产美女精品久久| 99久久免费视频.com| 欧美性受xxxx黒人xyx性爽| 视频在线观看国产精品| 逼特逼视频在线| 极品av少妇一区二区| 国产精品视频一二三四区| 国产精品99久久精品| 亚洲精品影院| 精品久久久亚洲| 久久久水蜜桃| 日韩精品福利一区二区三区| 国产一区二区不卡视频| 波多野结衣在线一区二区| 91传媒在线免费观看| 精品国产第一国产综合精品| 91九色单男在线观看| 日日夜夜亚洲| 国产专区欧美专区| 日本午夜精品久久久久| 成人天堂噜噜噜| 国产免费av国片精品草莓男男| 国产日韩欧美在线播放| 激情久久一区二区| 国产精品爽爽ⅴa在线观看| 成人国产网站| 国产拍精品一二三| 国产精品国产三级在线观看| 成人国产精品免费视频| 亚洲欧美在线综合| 91色精品视频在线| 亚洲福利合集| 激情五月综合色婷婷一区二区 | 国产精品一区二区久久不卡| 免费欧美一级片| 福利一区福利二区| 最近中文字幕无免费| 91麻豆精品视频| 午夜精产品一区二区在线观看的| 日本一区二区视频在线| 亚洲人与黑人屁股眼交| 亚洲综合久久久| 国内精品福利视频| 欧美三级中文字| 国产视频手机在线| 精品国产电影一区二区| 久久久久久久久亚洲精品| 国产亚洲一区二区在线| 免费av网站在线观看| 九九热精品在线| 忘忧草在线日韩www影院| 国产精品福利片| 国产日本亚洲| 精品国产综合| 日韩中文在线电影| 人人妻人人澡人人爽欧美一区 | 一区二区在线观看免费视频播放| 精品无码人妻一区二区三| 欧美日韩国产精品| 老熟妇一区二区三区啪啪| 欧美一级在线免费| 天堂a√中文在线| 日韩亚洲第一页| av影院在线| 国产欧美精品日韩| 99久久婷婷国产综合精品青牛牛 | 99久久综合| 欧美人成在线观看| 日本女人一区二区三区| 亚洲熟妇一区二区| 国产日产欧美精品一区二区三区| www.xxxx日本| 欧美性极品xxxx娇小| 国产xxxx孕妇| 亚洲一二在线观看| 亚洲无线看天堂av| 国产精品美女www| 国产精品一线| 椎名由奈jux491在线播放 | 国内自拍第二页| 久久综合九色综合欧美就去吻| 欧美一区免费观看| 色偷偷一区二区三区| www.精品久久| 日韩在线中文字幕| 中国字幕a在线看韩国电影| 91免费的视频在线播放| 国产欧美日韩影院| 国产 日韩 欧美在线| 激情av综合网| 国产又粗又猛又爽又黄av| 香蕉影视欧美成人| jizz中国少妇| 日韩午夜在线视频| av成人在线播放| 国产一区在线免费观看| 欧美亚洲不卡| 成人在线短视频| 国产精品免费视频一区| 欧美超碰在线观看| 亚洲精品国产拍免费91在线| 中文av资源在线| 91久久精品国产91久久性色| 日韩精品电影| 黄色av免费在线播放| 2021中文字幕一区亚洲| 国产精品白浆一区二小说| 欧美一区二区三区人| 日本美女在线中文版| 国产精品视频区| 国产最新精品| 黄色a级片免费| 2023国产精品自拍| 中文字幕国产在线观看| 亚洲精品天天看| 性欧美xxx69hd高清| 精品一区国产| 久久福利精品| 亚洲精品成人无码| 欧美在线视频日韩| 成人综合影院| 国产精品天天狠天天看| 精品国产一区二区三区香蕉沈先生| 成人在线免费观看av| 99re成人精品视频| 中文字幕黄色片| 在线视频欧美日韩| 亚洲tv在线| 激情五月五月婷婷| 成人网页在线观看| 男人的天堂一区二区| 亚洲国产精品成人精品| 中文字幕一区久| 日韩精品电影网站| 精品一区二区在线看| 欧美第一页在线观看| 欧美成人女星排名| 草草视频在线| 欧美日韩国产综合视频在线| 三级影片在线观看欧美日韩一区二区| 91精品人妻一区二区三区| 欧美天天综合网| 曰本三级在线| 精品亚洲一区二区三区四区五区高| 欧美综合国产| 亚洲aaa视频| 欧美成人三级在线| 我爱我色成人网| 国产精品99久久久久久大便| 国产mv日韩mv欧美| 久久久久亚洲av成人毛片韩| 色偷偷偷综合中文字幕;dd| 国产精品成人3p一区二区三区| 久久人人爽人人爽人人av| 久久综合五月天婷婷伊人| 中文字幕精品一区二区精| 色综合91久久精品中文字幕| 日韩人体视频| 不卡的在线视频| 精品毛片三在线观看| 成年人在线免费观看| 99精品国产高清一区二区| 国产日本精品| 午夜爽爽爽男女免费观看| 日韩av在线网址| 免费成人黄色网| 国产九九九九九| 国产精品欧美久久久久无广告| 亚洲欧美强伦一区二区| 国产精品高潮呻吟久久av无限| 91精品久久久久久久蜜月| 人妻丰满熟妇aⅴ无码| 欧美高清hd18日本| 香蕉伊大人中文在线观看| 日本在线视频www色| 国产亚洲成aⅴ人片在线观看| 午夜精品久久久久久久99老熟妇| 欧洲一区二区视频| 欧美私人啪啪vps| 正在播放国产对白害羞| 亚洲精品久久久久久下一站 |