精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華大學、DeepMind等指出現有小樣本學習方法并不穩定有效,提出評價框架

人工智能 新聞
以 GPT-3 為代表的預訓練語言模型的發展,引發對小樣本自然語言理解任務的極大關注。各種方法不斷發展并展現出日漸強大的小樣本自然語言理解性能。然而,來自清華大學、DeepMind 等團隊的研究者近期的一項研究指出:相同基準再評估結果表明,現有小樣本學習方法并不足夠穩定有效,小樣本自然語言理解發展尚面臨巨大挑戰!

評價準則的差異極大阻礙了已有小樣本學習方法基于統一的標準公平比較,也無法客觀評價該領域的真實進展。近期,來自清華大學、DeepMind 等團隊研究者在論文《FewNLU: Benchmarking State-of-the-Art Methods for Few-Shot Natural Language Understanding》中指出:現有小樣本學習方法并不穩定有效,且目前已有工作不存在單一的小樣本學習方法能夠在大多數 NLU 任務上取得優勢性能。小樣本自然語言理解領域發展依然面臨著嚴峻的挑戰!該工作被 ACL2022 主會接收。

  • 論文地址:https://arxiv.org/abs/2109.12742
  • 項目地址:https://github.com/THUDM/FewNLU
  • Leaderboard 地址:https://fewnlu.github.io/ 

本文貢獻如下:

(1) 該研究提出了一個新的小樣本自然語言理解評價框架 FewNLU,并且從三個關鍵方面(即測試集小樣本學習性能、測試集和驗證集相關性、以及穩定性) 量化評估該評價準則的優勢。 (2) 研究者對該領域相關工作進行重新評估,結果表明:已有工作未準確估計現有小樣本學習方法的絕對性能和相對差距;目前尚不存在單一在大多數 NLU 任務取得優勢性能的方法;不同方法的增益是優勢互補的,最佳組合模型的性能接近于全監督 NLU 系統等關鍵結論。(3) 此外本文提出 FewNLU,并構建了 Leaderboard,希望幫助促進小樣本自然語言理解領域未來研究工作的發展。

小樣本自然語言理解評價框架

模型選擇對小樣本學習是必要的嗎?

初步實驗結果表明 (如表格 1 所示),就如已有大多數工作那樣基于一組(根據既往實驗經驗) 預先固定的超參數的實驗設置,并不是最佳選擇。實驗條件的細微變化或者擾動都會帶來性能的急劇波動。基于小的驗證集在不同實驗中分別進行模型選擇是不可或缺的。

小樣本自然語言理解評價框架

基于上述結論,本文為小樣本自然語言理解提出一種更穩健且有效的評價框架,如算法 1 所示。

該評價框架中有兩個關鍵設計選擇,分別是如何構建數據拆分以及確定關鍵搜索超參數。

如何構建數據拆分?

本文首先提出數據拆分構建的三個關鍵指標: (1) 最終測試集小樣本學習性能、 (2) 測試集和驗證集關于一個超參數空間分布的相關性、以及 (3) 關于實驗執行次數的穩定性。

基于此,本文對多種不同的數據拆分策略進行了量化實驗和討論,包括 (1) K 折交叉驗證 (K-Fold CV)[2], (2) 最短描述距離(MDL)[2],(3) Bagging [9], (4) 隨機采樣策略 (5) 模型指導的拆分策略 (6) 以及本文提出的多次數據劃分(Multi-Splits)。

實驗結果如表格 2、3 和圖 1 所示。表格 2、3 的實驗結果表明:從小樣本性能和相關性看,多次數據劃分 (Multi-Splits) 是比其他幾個基準方案更好的數據拆分策略。 

此外,由圖 1 可知,Multi-Splits 的優勢還源于增大執行次數 K 的取值并不會對訓練集和驗證集的數據量產生影響,相反會進一步增加該結果的置信度,故實驗過程中總可以選擇盡可能增大 K 的取值。然而對于 CV 和 MDL,較大的 K 值會導致失敗(Failure Mode),較小的 K 值導致高隨機性不穩定的結果;同時在實踐中很難先驗地知道應該如何取值。故 Multi-Splits 是更具實際使用意義的數據拆分策略。

小樣本學習方法重新評價

基于統一的評價框架下,本文對目前已有最先進的小樣本學習方法進行重新評價。本文還嘗試探索了多種不同小樣本學習方法和技術組合可以實現的最佳性能(如表格 5 中的 "Our Best" 所示)。重新評價實驗結果如表格所示。

重新評估結果可揭示如下關鍵結論:

  • 結論 1: 小樣本學習方法的絕對性能和相對性能差異,在先前文獻中未被準確估計。此外小樣本方法(例如 ADAPET)在像 DeBERTa 這樣的大型模型上的優勢會顯著降低。半監督小樣本方法(例如 iPET 和 Noisy Student)增益在較大的模型也可以保持一致性。
  • 結論 2: 不同小樣本學習方法的增益在很大程度上是互補的。通過將目前各種先進方法加以組合,它們可以在很大程度上實現優于任意單一方法的小樣本學習性能。目前最佳組合方法的小樣本學習性能,接近 RoBERTa 上實現的全監督性能;然而和目前 DeBERTa 上實現的最優全監督性能相比,它仍然存在較大的差異性。
  • 結論 3: 目前已有相關工作中不存在單一的小樣本學習方法能夠在大多數 NLU 任務上取得主導性優勢性能。這為未來進一步開發出具有跨任務一致性和魯棒性的小樣本學習方法提出新的挑戰。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-04-19 11:12:46

區塊鏈貨幣加密貨幣

2025-10-20 08:50:00

2025-01-06 12:46:16

模型數據訓練

2025-02-10 08:40:00

訓練數據模型

2010-09-15 13:27:33

無線信號不穩定

2021-10-11 17:27:50

框架計算機開發

2011-06-29 14:39:29

網站排名

2011-04-01 15:02:43

路由器鏈路

2010-09-14 13:17:11

無線網絡不穩定

2021-02-09 08:31:38

線下環境 stable

2022-11-11 15:16:36

機器學習開源

2023-05-04 07:39:33

2021-11-15 10:00:22

模型人工智能NLP

2013-09-27 17:29:16

清華大學IT運維RIIL

2021-07-08 15:39:50

機器學習人工智能計算

2011-10-26 10:57:56

EqualLogic戴爾存儲

2010-04-06 10:42:59

無線網絡不穩定

2009-12-25 09:39:08

ADSL MODEM

2010-04-15 15:54:24

無線信號不穩定

2011-10-25 09:47:59

服務器
點贊
收藏

51CTO技術棧公眾號

国产写真视频在线观看| 日本一本在线观看| jizz性欧美23| 五月天欧美精品| 国产欧美日韩伦理| 欧美精品韩国精品| 欧美大黑bbbbbbbbb在线| 欧美一区二区三区爱爱| 久激情内射婷内射蜜桃| 日本wwwwwww| 欧美人动性xxxxz0oz| 99久久久精品| 国产欧美一区二区白浆黑人| 欧美极品视频在线观看| 久久99蜜桃| 亚洲天堂免费在线观看视频| 国产精品日韩欧美一区二区三区| 无码一区二区三区在线| 亚洲国产91视频| 91蝌蚪porny| 91九色蝌蚪国产| 圆产精品久久久久久久久久久| 欧美日韩激情| 亚洲精品在线网站| 三级在线视频观看| 97在线视频免费观看完整版| 国产激情一区二区三区| 午夜欧美不卡精品aaaaa| 亚洲精品视频网址| 秋霞综合在线视频| 91精品国产91热久久久做人人| 日本福利视频在线| 羞羞的视频在线看| 欧美国产日本视频| 精品一区在线播放| 免费在线一区二区三区| 国产区精品区| 亚洲国产一区二区三区四区| 成人性生交视频免费观看| 日本黄色片在线观看| 波多野结衣亚洲一区| 亚洲free性xxxx护士hd| 中文字幕日本人妻久久久免费 | 日本三级小视频| 欧美色综合网| 日韩欧美一级片| 日本888xxxx| 97成人资源| 五月天视频一区| 日韩欧美国产综合在线| 福利成人导航| 91一区二区三区在线观看| 亚洲一区美女视频在线观看免费| 中文在线字幕免费观| 免费国产自线拍一欧美视频| 欧美激情手机在线视频 | 天天做天天爱天天综合网2021| 亚洲女人天堂av| 久久中文字幕人妻| 亚洲免费专区| 欧美日韩情趣电影| 欧美性视频在线播放| 国产偷拍一区二区| 蜜桃av一区二区三区电影| 亚洲欧美国产精品久久久久久久| 69久久精品无码一区二区| 欧美综合影院| 欧美色图12p| 欧美日韩成人免费视频| 丁香影院在线| 亚洲一区二区三区在线播放| 日日噜噜夜夜狠狠久久丁香五月| 午夜不卡视频| 欧美国产综合色视频| 欧洲精品一区色| 狠狠综合久久av一区二区| 国产福利精品导航| 99免费在线观看视频| 国产视频一二三四区| 蜜桃av一区二区三区电影| 国产精品久久久久久久久久久新郎 | 亚洲人成电影在线播放| 亚洲一区二区三区蜜桃| 亚洲视频分类| 亚洲视频专区在线| 五月天综合视频| 精品国产不卡| 亚洲欧美中文字幕| 麻豆精品免费视频| 精品久久久久久久久久久下田| 亚洲天堂色网站| 日本人亚洲人jjzzjjz| 欧美jizz19性欧美| 在线观看日韩av| 亚洲熟女少妇一区二区| 91精品国产麻豆国产在线观看| www.日韩.com| 国产亚洲小视频| 日韩系列在线| 亚洲老头同性xxxxx| 国产激情在线免费观看| 成人av动漫在线观看| 久久精品视频99| 久久久综合久久| 一区二区三区国产盗摄| 久久视频免费在线播放| 国产色无码精品视频国产| 亚洲国产精品成人| 性欧美办公室18xxxxhd| 免费黄色片视频| 久久电影网电视剧免费观看| 91久久伊人青青碰碰婷婷| 农村少妇久久久久久久| 久久―日本道色综合久久| 日韩欧美亚洲日产国| 高h视频在线观看| 天天色综合成人网| 欧美视频在线播放一区| 国产激情综合| 日韩精品亚洲视频| 青娱乐国产精品视频| 色在线视频观看| 欧美伊人久久大香线蕉综合69| 图片区乱熟图片区亚洲| 视频福利一区| 日韩在线观看精品| 国产视频91在线| 精品亚洲欧美一区| 久久综合给合久久狠狠色| 最新97超碰在线| 91亚洲男人天堂| 色中色综合成人| 丝袜老师在线| 欧美一级高清片| 伊人影院综合网| 亚洲美女毛片| 91色p视频在线| 男人的天堂在线视频| 中文字幕av一区二区三区免费看| 精品久久一二三| 国产精品亚洲欧美日韩一区在线| 日韩电视剧免费观看网站| 日本黄色片免费观看| 鲁大师成人一区二区三区| 成人免费看片网址| 日日夜夜精品一区| 91福利国产精品| 日本黄色www| 久久中文视频| 国产成人精品av| av网站在线免费看| 成人欧美一区二区三区小说| 国产精品xxx在线观看www| 91最新在线| 欧美午夜电影在线| 一级黄色片毛片| 永久91嫩草亚洲精品人人| 国产精品自产拍高潮在线观看| 五月天激情开心网| 亚洲一区二三区| 天堂在线精品视频| 五月综合激情| 国产成人拍精品视频午夜网站 | japanese色国产在线看视频| 欧美一区二区视频在线观看2020 | 超碰国产精品一区二页| 亚洲性av在线| 91在线视频免费播放| 99精品视频一区二区三区| 免费高清一区二区三区| 操欧美女人视频| 久久久久久噜噜噜久久久精品| 国产免费一区二区三区最新不卡 | 暖暖在线中文免费日本| 日韩小视频在线观看专区| 午夜激情视频在线播放| 美女视频一区二区三区| 亚洲一区二区三区乱码| 国产麻豆一区| 欧美日韩精品欧美日韩精品 | 精品国产3级a| 日产精品久久久久| 99免费精品视频| 黄色动漫在线免费看| 亚洲大片精品免费| 国产成人在线精品| 五月婷婷在线观看| 欧美一区二区成人6969| 久久免费在线观看视频| av爱爱亚洲一区| 人妻有码中文字幕| 色综合久久网| 久久影院模特热| 精品人妻伦一二三区久久| 亚洲午夜电影在线观看| 性活交片大全免费看| 国产欧美一级| 日韩一二三区不卡在线视频| 青青青免费在线视频| 在线精品高清中文字幕| 国产熟女一区二区三区五月婷| 欧美日韩另类视频| 天天舔天天操天天干| 国产一区二区三区免费播放| 日韩欧美精品免费| 最新精品国偷自产在线| 国产欧美最新羞羞视频在线观看| 2024最新电影在线免费观看| 亚洲电影免费观看高清完整版在线观看 | 免费一级淫片aaa片毛片a级| 欧美三级自拍| 国产精品入口尤物| 污污片在线免费视频| 亚洲欧美中文另类| h狠狠躁死你h高h| 欧美性猛交xxxx久久久| 国产一区二区播放| 97精品超碰一区二区三区| 日本激情视频在线播放| 国模大胆一区二区三区| 亚洲va久久久噜噜噜久久狠狠| 精品一级视频| 欧美—级高清免费播放| 国产黄色片在线观看| 亚洲精品久久久久久国产精华液| 日韩女优在线视频| 日韩av中文在线观看| 日韩久久久久久久久久久久| japanese国产精品| 国产精品久久久久久久久久久久冷 | 亚洲国产成人午夜在线一区| 91超薄肉色丝袜交足高跟凉鞋| 丝袜美腿一区二区三区| 国产日韩亚洲欧美在线| 欧美电影三区| 蜜桃91精品入口| 麻豆久久久久| 97视频免费在线观看| 日本最新在线视频| 亚洲欧美另类中文字幕| 性生活视频软件| 欧美日韩视频在线第一区 | 在线观看欧美视频| 国产一级在线| 精品一区二区三区四区在线| 国产极品999| 欧美日韩精品一区二区天天拍小说 | 99视频有精品| 青青草精品在线| 免费欧美在线视频| 无遮挡又爽又刺激的视频| 国一区二区在线观看| 在线观看免费黄色片| 不卡在线一区二区| 日本午夜精品一区二区三区| 婷婷五月色综合香五月| 国产91免费视频| 黑人久久a级毛片免费观看| 亚洲影院污污.| 日本午夜免费一区二区| 国产精品久久久久91| 欧美色999| 国产成人在线一区| 日韩欧美精品电影| 国产成人精品免费久久久久 | 亚洲欧美日韩久久| 美国一级片在线观看| 久久精品在线免费观看| 中文字幕av观看| 不卡的av在线播放| 中文字幕一区二区三区人妻| 99精品国产一区二区三区不卡| 中国黄色片视频| 国产suv精品一区二区6| 国产精品扒开腿做爽爽爽a片唱戏| 国产成人8x视频一区二区| 亚洲熟女乱综合一区二区| 国产精品18久久久久久久久久久久| 天堂网成人在线| 国产69精品久久久久777| 亚洲精品久久一区二区三区777 | 姬川优奈aav一区二区| 国产污视频在线看| 欧美日韩一区二区免费在线观看 | 伊人网视频在线| 欧美精品高清视频| av天堂一区二区三区| 亚洲国产成人久久综合| 九色视频在线播放| 尤物九九久久国产精品的分类| 瑟瑟视频在线| 欧美成人全部免费| av中文字幕电影在线看| 人人做人人澡人人爽欧美| www日韩tube| 日韩午夜在线视频| h片在线免费| 8050国产精品久久久久久| 精品免费av在线| 91热精品视频| 欧美久久精品| 欧美精品欧美精品| 欧美黄色免费| 欧美日韩性生活片| 免费看黄色91| aaa黄色大片| 国产精品视频第一区| 欧美爱爱小视频| 欧美午夜无遮挡| 亚洲产国偷v产偷v自拍涩爱| 国产网站欧美日韩免费精品在线观看 | 精品久久久久久亚洲精品| 亚洲欧美另类在线视频| 欧美男人的天堂一二区| 天堂v在线观看| 在线播放日韩精品| 免费网站在线观看人| 国产精品白嫩美女在线观看| 深夜福利亚洲| 欧美在线一二三区| 黄色综合网站| 在线观看免费视频高清游戏推荐| 成人网在线免费视频| 中文字幕有码在线播放| 亚洲国产cao| 一区两区小视频| 日韩国产高清视频在线| 巨大荫蒂视频欧美大片| 日韩av手机在线| 高潮久久久久久久久久久久久久| 亚洲国产一区二区三区在线播 | 久久国产福利国产秒拍| japan高清日本乱xxxxx| 国产精品福利一区二区| 欧美性猛交bbbbb精品| 欧美一区二区黄| 亚洲精品传媒| 国产91露脸中文字幕在线| 亚洲开心激情| 中文字幕在线中文字幕日亚韩一区| 亚洲三级av| 亚洲不卡1区| 日韩视频免费| 三级男人添奶爽爽爽视频| 一区二区视频在线| 国产精品久久久久毛片| 亚洲夜晚福利在线观看| 漫画在线观看av| 波多野结衣一区二区三区在线观看| 日韩综合精品| 亚洲精品视频导航| 久久久不卡网国产精品二区| 国产真人真事毛片| 日韩欧美亚洲国产另类| 浪潮av一区| 国产区精品在线观看| 国产欧美日韩精品高清二区综合区| 男女视频网站在线观看| 国产一区福利在线| 久久久久久久九九九九| 欧美一级夜夜爽| 免费黄色电影在线观看| 国产美女精品视频免费观看| 欧美精品一区二区久久| 蜜臀视频一区二区三区| 国产亚洲综合色| 伊人久久久久久久久久久久| 亚洲欧美制服丝袜| 经典三级一区二区| 日韩欧美一区二区三区四区五区| 久久99伊人| www.狠狠爱| 午夜精品视频一区| 水莓100国产免费av在线播放| 中文字幕av一区| 99久久久国产精品免费调教网站| 日韩欧美亚洲在线| 视频一区视频二区在线观看| 国产又黄又粗又猛又爽的| 欧美日本一区二区在线观看| 欧美三级理伦电影| 91丝袜美腿美女视频网站| 欧美国产三区| 制服丝袜第一页在线观看| 亚洲成人资源网| 3p视频在线观看| 成人网在线视频| 欧美网站在线| 青青草视频网站| 一本久久综合亚洲鲁鲁五月天| 精品电影在线| 国产中文日韩欧美| 欧美日韩国产成人精品| 国产精品久久AV无码| 色国产精品一区在线观看| 色综合久久影院| 国产伦精品一区二区三区四区视频| 日本伊人色综合网| 天天综合天天做| 日韩成人在线观看|