精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

陳丹琦組掩蔽語言模型研究:15%掩蔽率不是最佳,40%站得住腳嗎?

人工智能 新聞
自BERT以來,大多數人堅持的模型訓練15% mask rate慣例被打破了?

前段時間,斯隆基金會公布了2022 年度斯隆研究獎的獲獎者,陳丹琦、方飛、顧全全、李博等多位研究者獲得了計算機科學領域的獎項。

在獲獎后不久,陳丹琦所在的團隊就公布了一項新研究。但和陳丹琦之前廣受贊譽的各項工作不同,這一新作受到了諸多質疑。

這個工作是關于掩蔽語言建模( masked language modeling,MLM)的。掩蔽語言模型通常使用15%的掩蔽率,因為大家發現,更高的掩蔽率將不能提供足夠的上下文來學習良好的表示,而更低的掩蔽率將大幅提高訓練成本。但陳丹琦等人卻發現,如果將掩蔽率提高到40%,性能可以超過15%的基線;如果提高到80%,大部分性能仍能得以保留,這是在下游任務上進行微調測得的結果。

由于和不少人自身實驗的結果并不符合,而且沒有開源代碼,所以這一研究在推特、知乎等平臺上引起了很大的爭議。

有人認為,這就是一個調參的結果,沒有理論依據,「黑盒的層面很多」,能不能復現也不好說。但也有人認為,如果嚴格按照論文的設置,論文的結果能夠復現,就相當于「有人事先把最優參數調出來了」,這也沒什么不好。而且,這篇論文還能「啟發大家重新反思MLM的使用」,所以算得上是一個有價值的工作。

知乎鏈接:https://www.zhihu.com/question/517319014?utm_source

接下來,我們就一起來看下這項工作。

這篇文章寫了什么

幾個月前,何愷明的Masked Autoencoders成為了計算機視覺的熱門,其遮蔽80%還能腦補原圖的重建能力驚為天人。何愷明等人在其論文中展望了預訓練大模型在CV領域的前景,而在NLP領域里,人們訓練算法通常使用的遮蔽比例是15%。在陳丹琦的新研究中,這一數字被顯著提高了。

論文鏈接:https://arxiv.org/abs/2202.08005

預訓練語言模型已經改變了自然語言處理領域的格局。大型語言模型經過巨量文本數據的訓練,可獲得豐富多樣的語言表示能力。與總是預測序列中下一個token的自回歸模型相比,像 BERT 這樣的掩蔽語言模型(MLM)會根據上下文預測輸入token的掩蔽子集,由于具有雙向性質,此方法效果通常更佳。

此種方法是把模型限制為只掩蔽一小部分token內容開始進行學習的,通常為每序列15%。15%的數字反映這樣一個假設——若掩蔽太多文本,則模型無法很好地學習表示,這一思路被BERT之后的研究普遍采用。同時,僅對 15% 的序列進行預測已被視為對 MLM 進行有效預訓練的限制。

在普林斯頓大學陳丹琦等人的研究中,作者發現了與此前結論完全不同的情況:在有效的預訓練方案下,他們可以掩蔽 40-50% 的輸入文本,并獲得比默認的 15% 更好的下游性能。

下表展示了掩蔽 80%、40%和15% 的情況下,預訓練模型的下游性能。在掩蔽率為80%的條件下,大多數上下文內容已變得不可見,但相比15%掩蔽,模型仍能學習到接近的預訓練表示效果。這挑戰了人們關于掩蔽率的直覺,并提出了模型如何從高掩蔽率中受益的問題。

表1:不同掩蔽率下的掩蔽示例、驗證困惑度和下游任務性能。在這里,所有模型都是有效預訓練條件下訓練的大模型。

沿著這一方向,作者建議將掩蔽率分解為兩個因素:損壞率(corruption rate,有多少上下文被掩蔽)和預測率(prediction rate,模型預測的token有多少)。在 MLM 中,損壞率和預測率都與掩蔽率相同。然而,這兩個因素具有相反的效果:雖然較高的預測率會產生更多的訓練信號并有利于優化,但較高的損壞率會使學習問題在較少上下文的情況下更具挑戰性。

為獨立研究這兩個因素,作者設計了消融實驗來分離損壞和預測。實驗證明,模型可受益于更高的預測率,更高的損壞率則不然。更高的預測率所帶來的好處能否掩蓋更高的損壞率所帶來的負面影響,決定了模型能否在更高的掩蔽率下表現得更好。研究者還發現,擁有處理更高損壞率的更大的模型表現出了更高的最佳掩蔽率。

受這一結果啟發,作者在復雜情況下考慮了更高的掩蔽率,例如span掩蔽和 PMI 掩蔽。當以 15% 的掩蔽率進行評估時,這些方法被證明優于簡單的均勻掩蔽(uniform masking),但均勻掩蔽在其各自的最佳掩蔽率下與復雜的掩蔽基線相比具有競爭力。本文作者表示,他們提出的新的預測率-損壞率框架也為 BERT 基于原始或隨機token(80-10-10 策略)的預測實踐提供了新的思路——如果沒有它,模型通常會表現得更好。

作者在討論中表示,在 MLM 中采用更高的掩蔽率會帶來更好的性能,尤其是在資源有限的環境中。從輸入中移除掩蔽token,或解耦損壞率和預測率,有望進一步加速預訓練。

具體來說,這項研究的貢獻包括:

  • 研究證明,訓練具有較高掩蔽率的掩蔽語言模型是可以成功的。例如,具有高效預訓練方法的大模型在掩蔽率為40%的情況下比15%的情況下表現更好;
  • 研究者建議將掩蔽率分解為損壞率和預測率,這兩個相反的要素分別影響任務難度和訓練信號,研究者使用該框架表明,較大的模型有更高的最優掩蔽率,并且只使用[ MASK ]token掩蔽優于80-10-10策略;
  • 研究證明,在高掩蔽率下,與span掩蔽和PMI掩蔽等更高級的掩蔽方案相比,均勻掩蔽更具競爭力。

掩蔽語言模型通常使用15%的掩蔽率,研究者一般認為更高的掩蔽率會導致用來學習良好表征的上下文不足,而更低的掩蔽率則會導致訓練成本太高。

在這項研究中,研究者發現高達40%的掩蔽率可以超過15%的baseline,即使是80%的掩蔽率也可以保持大部分性能,這可以通過對下游任務進行微調來衡量。

實驗結果

在消融實驗中研究者發現,增加掩蔽率有兩方面影響:1、更高比例的輸入token被損壞,減少了上下文的大小并創建了一個更困難的任務;2、模型會執行更多的預測,這有利于訓練。研究者觀察到,較大的模型特別適合更高的掩蔽率,因為大模型本身具備更高的能力來執行困難任務。進一步地,研究者將該發現與復雜的掩蔽方案結合起來,比如span掩蔽和PMI掩蔽,以及BERT的80-10-10策略,并發現使用[MASK]替代的簡單均勻掩蔽在更高的掩蔽率下具備競爭力。

圖1:掩蔽率對具有高效預訓練方案的大模型的影響。研究者發現,在大多數任務中,更高的掩蔽率比15%的掩蔽率表現更好,40%是最佳的掩蔽率。

表2:大模型、高效預訓練方法的條件下,15% 或40% 掩蔽率在 GLUE 基準上的測試結果對比。

圖2:在掩蔽率為15%和40%的情況下,使用高效的預訓練方法訓練的大模型的下游任務性能。

表3:損壞率 vs. 預測率。以40%的掩蔽作為基線,分離m_corr和m_pred,并分別對它們進行操作。趨勢是明確的:更高的預測率是有益的,但更高的損壞率是有害的。

圖3:掩蔽率對不同大小的模型的影響。可以發現,較大的模型擁有較大的最佳掩蔽率。

未來展望

研究者進一步討論了其他語言模型中的掩蔽率問題,除MLM之外,還有其他被廣泛用于NLP任務的預訓練方案,包括自回歸語言模型(Radford et al., 2018; Brown et al., 2020) 和sequence-to-sequence語言模型(Raffel et al., 2020; Lewis et al., 2020)。類似地,sequence-to-sequence語言模型以一定的掩蔽率損壞文本,并用自回歸的方式預測掩蔽文本。T5(Raffel et al., 2020)也采用了15%的掩蔽率。研究者準備擴大研究,比如研究文本到文本模型,并探討掩蔽率和不同類型解碼器之間的相互作用。
更多內容請參考原論文。


責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2022-02-17 14:52:10

模型AI谷歌

2025-08-29 14:06:40

2022-07-26 09:56:48

模型AI

2024-12-12 16:43:44

2023-10-12 12:13:16

AI訓練

2023-08-20 22:51:06

2023-08-17 15:04:01

2025-01-08 13:05:56

2025-06-25 09:15:38

AI模型LLM

2025-02-13 12:23:28

2024-05-27 08:40:00

2024-10-08 14:48:24

2025-09-28 15:35:32

AI模型強化學習

2021-05-07 09:34:20

量子芯片計算機

2023-10-25 09:19:00

AI訓練

2025-01-16 09:00:00

2021-05-20 17:04:23

AI

2024-07-18 12:58:03

2023-07-11 10:14:52

2025-01-07 12:55:00

訓練數據模型
點贊
收藏

51CTO技術棧公眾號

国产成人精品久久| 五月婷婷激情视频| 一级黄色免费看| 视频二区欧美| 亚洲国产精品第一区二区| 在线免费观看视频一区| 99精品在线直播| 97在线观看免费视频| 羞羞视频在线观看不卡| 偷拍自拍亚洲色图| 一区二区三区在线观看网站| 国产成人+综合亚洲+天堂| 国产激情av在线| 成人性生交大片免费网站| 国产精品中文字幕一区二区三区| 亚洲男人天堂网站| 国产极品在线视频| 亚洲国产精品二区| 雨宫琴音一区二区三区| 在线精品国精品国产尤物884a| 中文字幕人成一区| 91精品国产乱码久久| 合欧美一区二区三区| 日韩三级视频在线看| 超碰在线免费观看97| jizz国产在线| 免费av一区二区三区四区| 日韩欧美在线视频日韩欧美在线视频 | 日本一区二区三区免费乱视频| 国产一级揄自揄精品视频| 99热久久这里只有精品| 国产美女主播在线观看| 日韩欧美一区免费| 欧美在线视频不卡| 一卡二卡三卡视频| а√天堂资源地址在线下载| 免费成人在线视频观看| 国产亚洲精品综合一区91| 色综合久久久无码中文字幕波多| 经典三级在线| 日韩国产高清在线| 国产一区二区三区视频免费| 91九色蝌蚪porny| 国产精品偷拍| 成av人片一区二区| 日韩av三级在线观看| 国产成人无码一区二区在线观看| 大桥未久在线视频| 在线观看国产免费视频| 91成人福利视频| 国产精品视频首页| 洋洋av久久久久久久一区| 99视频在线| 在线观看中文字幕网站| 999视频精品| 91精品综合久久久久久| 日本天堂免费a| 秋霞av鲁丝片一区二区| 国产欧美一级| 在线观看欧美www| 一级黄色大片儿| 国产99re66在线视频| 国产精品国产精品国产专区不蜜| 国产综合在线观看视频| 欧美日韩黄色网| 激情小说一区| 日韩欧美极品在线观看| 草草久久久无码国产专区| 欧美在线一卡| 麻豆国产欧美一区二区三区| 欧美激情视频播放| 精品人妻互换一区二区三区| 国产一区二区三区四区五区3d| 亚洲精品中文在线观看| 精品国产一区二区三区免费 | 中文字幕色av一区二区三区| 91久久大香伊蕉在人线| 日韩少妇高潮抽搐| 9999热视频在线观看| 中文字幕人妻熟女人妻a片| 一区二区三区动漫| 日韩在线观看免费全| 黄色a级在线观看| 秋霞a级毛片在线看| 粉嫩av亚洲一区二区图片| 欧美中文字幕精品| 校园春色 亚洲| 欧美日韩久久| 日韩在线视频网| 少妇被狂c下部羞羞漫画| 激情久久一区二区| 91精品久久久久久蜜臀| 无码人妻一区二区三区一| 美女视频免费精品| 中文字幕欧美日韩va免费视频| 久久久久亚洲av成人网人人软件| 免费成人动漫| 欧美挠脚心视频网站| 99福利在线观看| 麻豆av在线播放| 亚洲国产福利视频| 开心九九激情九九欧美日韩精美视频电影| 国产欧美在线看| 精品国产伦一区二区三区| 久久国产一二区| 久久久久久久久久久成人| 女人十八毛片嫩草av| 91av精品| 久久精品美女视频网站| 怡红院一区二区三区| 91九色精品国产一区二区| 中文字幕日韩有码| 国产精品亚洲自拍| 成人在线看片| 亚洲午夜精品久久久| 国产精品99久久久久久久女警| 国产精品小说在线| 亚洲第一天堂网| 国产婷婷色一区二区三区在线| 精品在线视频一区二区| 永久av在线| 国产精品情趣视频| 视频一区二区三区免费观看| 日韩av资源| 亚洲欧美日韩国产一区二区三区 | 青青草成人在线| 国产精品欧美激情在线| 日韩和的一区二区| 3d动漫精品啪啪一区二区三区免费 | 国产精品外国| 成人免费视频网站入口| av女优在线| 亚洲国产精品激情在线观看| 日韩一区不卡| 日韩av中文| 精品二区三区线观看| 国产精品久久中文字幕| 国产一区二区三区免费观看在线| 亚洲视频精品在线| 免费看污片的网站| 欧美调教在线| 亚洲性无码av在线| 亚洲男人的天堂在线视频| 男女av一区三区二区色多| 99re热精品| 尤物网址在线观看| 欧美影院精品一区| 中文字幕日韩久久| 欧美在线观看视频一区| 北条麻妃久久精品| 中文字幕无码乱码人妻日韩精品| 另类小说综合欧美亚洲| 免费国产一区二区| 在线观看精品一区二区三区| 色网站国产精品| 久热精品在线播放| av日韩一区| 亚洲二区在线播放视频| 国产又粗又猛又爽视频| 午夜影院日韩| 91网站免费看| 蜜桃视频在线免费| 亚洲三级理论片| 日韩精品―中文字幕| 99re6热只有精品免费观看| 亚洲欧美精品一区| 国产精品人人人人| 国产精一区二区三区| 国产日韩视频在线播放| 精品一区二区三区视频在线播放| 亚洲国产精久久久久久久| 精品国产欧美日韩不卡在线观看| 午夜一区二区三区不卡视频| 亚洲国产欧美一区二区三区丁香婷| 国产主播一区二区三区四区| 国产区在线视频| 洋洋成人永久网站入口| 中国免费黄色片| 国产一区二区精品| 日本黑人久久| 人人澡人人添人人爽一区二区| 欧美一三区三区四区免费在线看| 国产亚洲色婷婷久久99精品91| 国产欧美日韩一级| 日韩国产伦理| 国产精品视频一区视频二区| 欧美激情精品久久久久久免费印度| 丰满岳乱妇国产精品一区| 欧美国产日韩精品免费观看| 欧美伦理片在线观看| 奇米影视777在线欧美电影观看| 日本精品免费一区二区三区| 日本在线免费看| 国产精品1区2区| 精品久久久久久久久久国产| 成年人在线观看视频免费| а√天堂资源国产精品| 亚洲国产91精品在线观看| 久久久久久少妇| 亚洲天堂免费看| 欧美精品欧美极品欧美激情| 蜜桃久久久久久| 久久男人资源站| 色综合一区二区日本韩国亚洲| 亚洲第一视频在线观看| 男人午夜免费视频| 亚洲人精品一区| 3d动漫精品啪啪一区二区下载| 一区在线视频观看| 成人区精品一区二区| 色戒汤唯在线观看| 亚洲精品一区二三区不卡| 久久精品无码人妻| 国产精品一区免费在线观看| 中文字幕无码精品亚洲35| 色综合视频一区二区三区日韩 | 午夜精品久久99蜜桃的功能介绍| 国产成+人+综合+亚洲欧洲| 成人日日夜夜| 亚洲欧洲日韩国产| 亚洲精品一区二区三区区别| 欧美在线观看视频一区二区| 五月天综合在线| a美女胸又www黄视频久久| 一区二区不卡视频| 久久精品嫩草影院| 97超碰国产精品女人人人爽| 日本美女一级片| 欧美日韩国产一级二级| 国产人与禽zoz0性伦| 六月丁香婷婷久久| 日本久久久精品视频| 欧美精品自拍| 日韩精品一区二区三区在线观看| 欧美一区二区三区喷汁尤物| 黄色短视频在线观看| 国产自产视频一区二区三区| 中文字幕久精品免| www黄色在线观看| 日韩中文首页| 91视频婷婷| 电影一区中文字幕| 国产欧美精品一区二区| 欧美日韩精品一区二区三区视频| 日韩电影中文字幕| 日本熟女毛茸茸| 亚洲成人第一页| 精品一区二区三区四| 99久久伊人久久99| 国产av一区二区三区传媒| 国产一区在线不卡| 51自拍视频在线观看| 国产精品porn| 性生活免费观看视频| 亚洲精品不卡在线观看| 欧美亚洲成人免费| www.成人.com| 日韩一区二区三区视频在线| 在线视频 91| 欧美日韩国产精品成人| 国产又大又黑又粗| 欧美一区二区美女| 亚洲第一天堂网| 亚洲精品久久久久久久久久久久久| 亚洲综合一二三| 午夜精品一区二区三区电影天堂| 人妻一区二区视频| 国产亚洲短视频| 国产中文字幕久久| 中文字幕久久精品一区二区| 欧美—级在线免费片| 亚洲精品女人久久久| 久久免费视频一区| 久久精品一区二| 亚洲草久电影| 日本老太婆做爰视频| 宅男在线一区| 亚洲wwwav| 日韩欧美一区二区三区在线观看| 欧美成人免费在线视频| 肉丝一区二区| 亚洲偷欧美偷国内偷| 色综合久久久久综合一本到桃花网| 色婷婷av一区二区三区在线观看| av在线播放观看| 久久久久女教师免费一区| 加勒比一区二区三区在线| 中文字幕国内精品| 超碰电影在线播放| 国内精品久久久久久久久| 范冰冰一级做a爰片久久毛片| 国产精品96久久久久久又黄又硬| 深夜福利亚洲| 狠狠色综合一区二区| 教室别恋欧美无删减版| 久久精品日产第一区二区三区乱码| 国内精品视频| 精品国产乱码久久久久久88av | 国产在线观看91| 一本色道久久88综合亚洲精品ⅰ | 精品日产一区2区三区黄免费 | 午夜精品福利一区二区三区蜜桃| 欧美日韩在线一区二区三区| √资源天堂中文在线| 欧美影院一区二区| 人人妻人人澡人人爽久久av| 在线a欧美视频| 不卡av免费观看| 国产精品久久av| 国产不卡网站| 91亚洲永久免费精品| 亚洲亚洲免费| 日本香蕉视频在线观看| 日本午夜精品一区二区三区电影| 免费高清在线观看免费| 精品一区二区三区在线播放视频| 亚州精品一二三区| 99久久久久久| 国产麻豆a毛片| 中文成人av在线| 久久精品女人毛片国产| 欧美日韩国产高清一区二区三区 | 日韩国产在线播放| 黄色视屏免费在线观看| 国产999精品久久久| 成人资源在线| 欧美做受777cos| 久久精品999| 日韩不卡av在线| 欧美性xxxx在线播放| 国产综合无码一区二区色蜜蜜| 神马久久久久久| 日韩精品三区| 蜜桃狠狠色伊人亚洲综合网站| 欧美激情第二页| 欧美国产日韩另类| 国产成人aaaa| 日本一级片免费| 欧美日韩三级一区| 国产精品久久久久久久久久久久久久久久 | 欧美理论电影在线观看| 丝袜美女在线观看| 国产精品免费看久久久香蕉| 小说区图片区亚洲| 日本一区免费看| 国产一区二区三区成人欧美日韩在线观看| 亚洲少妇一区二区三区| 一区二区激情视频| 国产精品久久久久久免费免熟| 一区二区三区亚洲| 国产亚洲人成a在线v网站| 日本一区视频在线观看免费| 每日更新成人在线视频| 午夜理伦三级做爰电影| 色婷婷亚洲婷婷| 欧美偷拍视频| 日本亚洲欧洲色| 九九久久婷婷| 无码人妻精品一区二区三区66| 老司机免费视频一区二区三区| 日韩福利在线视频| 欧美色国产精品| 免费a级在线播放| 成人激情视频在线播放| 白白在线精品| 久久国产精品网| 日韩精品一级中文字幕精品视频免费观看 | 国产主播一区二区三区四区| 免费中文字幕日韩欧美| 免费看91的网站| 欧美日韩一卡二卡三卡| 国产精品实拍| 国产精品视频一区二区三区经| 亚洲精品合集| 中文字幕乱码人妻综合二区三区| 国产视频一区在线观看| 成人午夜精品视频| 精品久久国产老人久久综合| 国产高清视频在线播放| 国产精品久久久久久久午夜| 希岛爱理一区二区三区| 美女日批在线观看| 午夜国产精品影院在线观看| 黄色国产在线| 91精品在线影院| 亚洲成人直播| 国产美女免费无遮挡| 91麻豆精品国产91久久久使用方法 | 91在线国产福利| 国产成人久久久久| 精品噜噜噜噜久久久久久久久试看| 亚洲性色av| 福利视频一区二区三区| 午夜亚洲视频| 色欲一区二区三区精品a片| 日韩成人在线观看| 日本黄色成人| 色欲av无码一区二区人妻| 最新成人av在线| 国产资源在线观看|