精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

動態基準測試Dynabench已發布,Facebook想用人類來「審問」人工智能

新聞 人工智能
Facebook已經建立并正在共享Dynabench,這是第一個用于人工智能領域的動態數據收集和基準測試平臺。

 Facebook已經建立并正在共享Dynabench,這是第一個用于人工智能領域的動態數據收集和基準測試平臺。它使用人類測試和模型一起循環迭代,目的是為了創造具有挑戰性的新數據并且更優化的人工智能模型。

[[345339]]

人工智能在過去十年左右的巨大成功通常歸功于大量的數據和計算能力,但是「基準測試」在推動進步方面也發揮著至關重要的作用。

為了提高SOTA結果,研究人員需要一種方法來比較他們的模型與同行開發的模型的效果差異。準確的比較是驗證新模型確實優于該領域現有模型的先決條件這個過程被稱為「基準測試」,即Benchmark。

研究人員可以利用人工智能進行對比測試,看看它到底有多先進。例如,ImageNet,一個由1400萬張圖像組成的公共數據集,為圖像識別設定了目標。MNIST 在自然語言處理方面對手寫數字識別和 GLUE (通用語言理解評估)做了同樣的工作,導致了諸如 GPT-3這樣的突破性語言模型的出現。

基準測試已經越來越快地達到飽和,尤其是在自然語言處理(NLP)領域。雖然研究團隊花了大約18年時間才在 MNIST 上取得了人類水平的表現,并在 ImageNet 上花了大約6年時間才超過人類,但在 GLUE 語言理解基準上只花了大約一年時間就超過了人類。

固定的目標很快就會被超越。ImageNet 在更新中,GLUE 也已經被 SuperGLUE 取代,后者是一系列更困難的語言任務。

盡管如此,研究人員遲早會報告說,他們的人工智能已經達到了超越人類的水平,在這個或那個挑戰中勝過人類。如果我們希望「基準」繼續推動算法和模型進步,這就是一個亟待解決的問題。

Dynabench:新的動態對抗性benchmark

Facebook 正在發布一種新的測試方法,讓人工智能與竭盡全力干擾它們的人類進行比較,希望輔助研究人員開發出更強大的NLP模型。這項測試基準名為「 Dynabench」,它將根據人們的選擇來進行變化,解決目前基準測試方法的不足,并促進更健壯的人工智能軟件的開發。

[[345340]]

Dynabench的解決方案是通過將人工測試帶入這個流程來部分地實現基準測試過程。這個想法就是基于人類可以更準確地評估一個模型的準確性,而不是一組預先包裝好的測試問題,可以為神經網絡提出更難,更有創造性的挑戰。

這是一個比當前靜態基準更好的模型測量指標,將更好地反映人工智能模型在最重要的情況下的表現: 當與人交流時,他們的行為和反應都是復雜的,不斷變化的方式,而這些方式無法在一組固定的數據點中反映出來。

「現有的Benchmarks可能非常具有誤導性」,Facebook 人工智能研究所的 Douwe Kiela 說,他領導了這個工具的開發團隊,「過分關注基準可能意味著忽視更廣泛的目標」,從而導致「the test become the task」

靜態基準測試-忽略了與人交互的體驗

靜態的基準測試迫使模型過多地關注一個特定的東西,而我們最終關心的不是某個特定的度量或任務,而是人工智能系統在與人交互時能做到多好。

人工智能的真正衡量標準不應該是準確度或困惑度,而應該是直接或者間接建立與人交流時的模型誤差率。

Kiela認為這是NLP目前面臨的一個特殊問題。GPT-3這樣的語言模型之所以具有智能性,是因為它非常擅長模仿語言,但是很難說這些系統到底能理解多少。

就像做智力測試一樣,可以給人們做智商測試,但是這并不能告訴你他們是否真的掌握了一個主題。為了做到這一點,你需要和他們進行交談,問問題。

就像一個學生只記住了一大堆事實,這種策略也許在筆試中可以取得優異的成績,但是在面試中提出的創造性和意料之外的問題,這種策略就不那么有效了。

Dynabench 做了類似的事情,「用人來審問人工智能」。

Facebook也已經發布了一個網頁,邀請感興趣的人去網站來測試背后它的模型。例如,你可以給語言模型一個 Wikipedia 頁面,然后問它問題,給它的答案打分。

在某些方面,這個想法類似于人們已經在使用GPT-3的方式,來測試它的極限。或者是聊天機器人評估 Loebner Prize的方式,又或者是類似圖靈測試的方式。

當人工智能完成一輪測試后,Dynabench 識別出那些愚弄模型的問題,并將它們編譯成一個新的測試集。

研究人員可以利用這個測試集來幫助他們建立更新、更復雜的模型。然后,一旦開發出一個模型,就可以回答第一個人工智能無法回答的問題,Dynabench不斷重復這個過程,并編譯另一個測試數據集與更難的問題。

目前 Dynabench 將專注于語言模型,因為它是人類最容易理解的AI模型之一。「每個人都會說一種語言」,Kiela說,「你不需要任何關于如何妨礙這些模型的真正知識。」

該方法也適用于其他類型的神經網絡,如語音或圖像識別系統。Kiela 說,你只需要找到一種方法,讓人們上傳自己的圖片,或者讓他們畫些東西來測試它。Facebook的長期的愿景是開放Dynabench,這樣任何人都可以開發自己的模型,收集自己的數據。

Facebook希望讓AI界相信,會有一種更好的方法來測試NLP模型,這會使得模型和算法能夠更快的進步,并且真正的提升與人類交互時的體驗和真正的理解交互內容。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-06-20 11:05:58

通用人工智能機器人

2021-03-19 10:22:03

人工智能

2021-03-31 12:23:27

智用研究院伙伴計劃

2022-07-25 14:10:07

人工智能金融語言

2022-07-04 23:29:56

人工智能語言模型數據

2022-02-15 13:14:37

人工智能神經網絡

2024-01-16 10:22:23

人工智能大型語言模GPT 4

2020-06-17 16:08:33

人工智能

2022-07-04 15:29:59

人工智能機器計算機

2020-03-25 09:53:33

人工智能AI技術

2018-07-02 10:48:20

2017-05-10 11:30:28

人工智能

2022-07-31 23:46:57

人工智能語言模型感知力

2021-07-28 13:29:44

人工智能指令技術

2021-02-25 10:23:01

人工智能科技機器學習

2024-03-14 08:00:00

人工智能生成式對抗網絡網絡釣魚

2021-04-16 11:28:26

人工智能人工智能工程AI

2024-03-20 06:50:08

2020-07-24 08:20:07

人工智能遠程辦公技術
點贊
收藏

51CTO技術棧公眾號

国内视频精品| 黄色免费在线看| 国产永久精品大片wwwapp| 一区二区三区在线观看国产| 国产精品久久精品国产| 黄色免费av网站| 日本久久精品| 激情成人在线视频| 久久精品二区| 在线视频 91| 欧美午夜影院| 一区二区欧美激情| 免费黄色a级片| 美女写真久久影院| 亚洲一区在线看| 丝袜足脚交91精品| 一区二区精品视频在线观看| 中文无码久久精品| 国产视频久久久久| 亚洲综合日韩欧美| 涩涩涩视频在线观看| 亚洲天堂中文字幕| 日本一区二区在线视频观看| aaa一区二区三区| 午夜在线观看视频| 国产中文字幕精品| 国产福利成人在线| 久久久精品国产sm调教网站| 精品一区av| 亚洲精品美女久久久久| 小泽玛利亚视频在线观看| av在线播放资源| 最新欧美精品一区二区三区| 欧美日韩一区二区视频在线观看 | 日本成人免费在线| 久草免费新视频| 日韩av资源网| 精品久久久久久久久久久久久久久 | 国产91精品不卡视频| a一级免费视频| 神马影视一区二区| 中文字幕电影一区| 国产亚洲欧美另类一区二区三区| 国产精品无码在线播放| 久久青草久久| 欧洲中文字幕国产精品| 99免费在线观看| 国产精品mm| 欧美乱妇40p| av激情在线观看| 亚洲婷婷伊人| 亚洲男人av电影| 熟女丰满老熟女熟妇| 久久香蕉精品香蕉| 亚洲精品98久久久久久中文字幕| 第一页在线视频| 亚洲2区在线| 欧美在线综合视频| 色多多视频在线播放| 亚洲天堂一区二区| 欧亚洲嫩模精品一区三区| 97av视频在线观看| 激情亚洲影院在线观看| 欧美日韩国产色| 91黄色免费版| 亚洲社区在线观看| 日本高清www| 久久综合亚洲| 日韩精品极品在线观看播放免费视频| 亚洲av熟女高潮一区二区| 丁香综合av| 日韩av中文字幕在线| 一级性生活大片| 成人写真视频| 亚洲视频专区在线| 激情高潮到大叫狂喷水| 亚洲精品一区二区在线看| 久久综合伊人77777蜜臀| 麻豆亚洲av熟女国产一区二| 亚洲国产精品第一区二区三区| 欧美高清第一页| 久久夜靖品2区| 国产精品试看| 国产精品网红直播| 精品人妻午夜一区二区三区四区| 成人精品国产免费网站| 国产欧美日韩视频一区二区三区| 日本福利午夜视频在线| 国产精品视频一二三区| 欧美一区二区三区在线播放| 99视频在线观看地址| 亚洲色图在线播放| 免费国产黄色网址| 精品福利在线| 日韩欧美www| 亚洲精品国产熟女久久久| 亚洲免费专区| 久久九九国产精品怡红院| 国产午夜福利精品| 免费高清成人在线| 成人精品一二区| 国产精品影院在线| 一区二区三区毛片| 一区二区在线播放视频| 精品欧美一区二区三区在线观看| 日韩一区二区三区在线视频| 亚洲精品成人无码熟妇在线| 中文字幕一区二区三区在线视频| 欧美一乱一性一交一视频| 在线亚洲国产精品网| 欧美xxxxx少妇| 国产精品巨作av| 中文字幕在线精品| 久久免费在线观看视频| 麻豆久久久久久| 久久精品国产综合精品| 国产二区三区在线| 一本一本大道香蕉久在线精品 | 久操免费在线视频| 日韩av午夜在线观看| 国产欧美韩日| av大全在线| 欧美日韩精品一二三区| 麻豆av免费观看| 亚洲人成在线影院| 成人观看高清在线观看免费| 日韩电影网址| 亚洲一级二级三级在线免费观看| 亚洲一级片网站| 色棕色天天综合网| 欧美激情精品久久久久久| 久久久久久av无码免费看大片| 成人福利视频在线看| 无颜之月在线看| 日日夜夜天天综合| 精品三级在线看| 国产www精品| 女女互磨互喷水高潮les呻吟| 狠狠入ady亚洲精品经典电影| 成人黄色av播放免费| 户外极限露出调教在线视频| 午夜成人免费电影| 黑森林精品导航| 羞羞答答一区二区| 欧美一区二区三区四区在线| 日本黄色不卡视频| 亚洲影院理伦片| 在线观看视频在线观看| 亚洲电影在线一区二区三区| 国产精品夜色7777狼人| av福利精品| 91国偷自产一区二区三区观看| 日韩片在线观看| 亚洲高清自拍| 精品国产乱码久久久久久丨区2区| 波多野结衣中文字幕久久| 欧美一级一区二区| 久久久久国产精品夜夜夜夜夜| 国v精品久久久网| 国产精品自拍合集| 林ゆな中文字幕一区二区| 97精品国产91久久久久久| 国产片高清在线观看| 国产亚洲一二三区| 日日干夜夜操s8| 中国成人一区| 亚洲图片你懂的| 日韩电影天堂视频一区二区| 蜜桃视频m3u8在线观看| 亚洲免费av电影| 69亚洲精品久久久蜜桃小说| 久久婷婷色综合| 亚洲这里只有精品| 91精品国产调教在线观看| 亚洲综合中文字幕在线观看| missav|免费高清av在线看| 日韩精品极品在线观看播放免费视频| 日批视频免费在线观看| 国产精品丝袜黑色高跟| 日本少妇一级片| 亚洲伊人网站| 亚洲日本精品一区| 99精品中文字幕在线不卡| 国产91|九色| 五月香视频在线观看| 欧美大片在线观看| 久久久精品视频网站| 亚洲欧美中日韩| 天天干天天综合| 激情国产一区| 亚洲精品乱码视频| jizz国产精品| 国产精品久久久久福利| 羞羞的视频在线观看| 亚洲精品二三区| 91丨九色丨丰满| 精品福利在线观看| 午夜精品福利在线视频| 不卡av在线免费观看| 杨幂毛片午夜性生毛片| 亚洲手机在线| 一区二区在线高清视频| 国产精品对白久久久久粗| 国产精品色婷婷视频| www欧美xxxx| 日韩在线欧美在线| 天天影院图片亚洲| 日韩一级黄色片| 久久综合亚洲精品| 亚洲AV无码一区二区三区少妇| 婷婷夜色潮精品综合在线| 永久免费看片直接| 久久久99免费| 少妇丰满尤物大尺度写真| 激情欧美丁香| 在线视频不卡国产| 一区二区美女| 国产专区一区二区| 蜜桃在线一区| 成人国产精品av| 在线一区视频观看| 日韩美女免费视频| cao在线视频| 九九热99久久久国产盗摄| jizz在线观看视频| 国产亚洲aⅴaaaaaa毛片| 人妻精品一区二区三区| 日韩一级片网址| 国产精品毛片一区视频播 | 51精品在线| 中文字幕亚洲字幕| 欧洲亚洲在线| 日韩精品视频在线观看网址| 国产乱淫av片免费| 欧美精品欧美精品系列| 99久久久无码国产精品免费蜜柚 | 国产乱码字幕精品高清av| 欧美男人的天堂| 免费福利视频一区| 国产在线观看精品| 在线看欧美视频| 国产精品久久久久久网站| 日本美女一区| 欧美精品中文字幕一区| 岛国中文字幕在线| 乱亲女秽乱长久久久| 国产中文字幕在线视频| 国产一区av在线| jyzzz在线观看视频| 日韩中文在线中文网三级| 1024国产在线| xvideos亚洲人网站| 日本中文字幕在线播放| 视频在线观看99| 国产精品扒开做爽爽爽的视频| 一区二区三区天堂av| 超碰国产在线| 精品久久人人做人人爽| 天堂av2024| 亚洲人成伊人成综合网久久久 | 中文字幕日韩免费视频| youjizz在线播放| 久久精品电影网| 99在线播放| 欧美国产高跟鞋裸体秀xxxhd| av网站在线免费| 欧美人在线观看| 97在线视频免费观看完整版| 欧洲亚洲女同hd| 天堂在线中文网官网| 久久久久久久久久国产| 手机在线理论片| 日韩av观看网址| 在线观看欧美| 国产精品一区免费观看| 卡一精品卡二卡三网站乱码| 日本高清视频一区二区三区| 欧美顶级大胆免费视频| 欧美日韩国产综合草草| 欧美熟妇激情一区二区三区| av电影在线观看完整版一区二区| 中文字幕1234区| a亚洲天堂av| 蜜桃av免费在线观看| 亚洲在线观看免费视频| 亚洲综合久久网| 91精品国产麻豆| 日本又骚又刺激的视频在线观看| 最近2019中文字幕一页二页| 视频在线观看入口黄最新永久免费国产| 性欧美xxxx| 色诱色偷偷久久综合| 国产伦理久久久| 色爱综合网欧美| 人人妻人人澡人人爽欧美一区双| 鲁大师影院一区二区三区| 亚洲综合伊人久久| 972aa.com艺术欧美| sm捆绑调教视频| 五月婷婷激情综合网| 91国内精品久久久| 5566中文字幕一区二区电影| 亚欧美在线观看| 国产传媒日韩欧美成人| 国产一二三四五区| 一区二区三区波多野结衣在线观看| 久久久久亚洲天堂| 欧美日本在线一区| 欧美18xxxxx| 久久人人爽人人| 久久精品97| 国产精品久久久对白| 97色伦图片97综合影院| 国产免费一区二区三区视频| 国产福利一区在线| 精品无码在线观看| 欧美日韩中文在线观看| japanese国产| 亚洲午夜精品久久久久久性色| 黄页网站在线| 96国产粉嫩美女| 久久要要av| 激情综合网俺也去| 久久夜色精品| 一本色道久久88综合日韩精品| 中文字幕在线日亚洲9| 精品国产福利视频| 国产普通话bbwbbwbbw| 中文字幕亚洲综合久久筱田步美| 色多多在线观看| 国产欧美综合精品一区二区| 久久资源中文字幕| 在线免费观看视频黄| av不卡免费电影| 日韩免费观看一区二区| 欧美mv日韩mv| 成年网站在线视频网站| 91老司机在线| 91一区二区| 亚洲一区二区福利视频| 中文字幕一区二区三区不卡在线| 最近中文字幕在线视频| 亚洲乱码国产乱码精品精| 女人让男人操自己视频在线观看| 99国产超薄肉色丝袜交足的后果| 亚洲精品小说| 国产大学生av| 亚洲成人激情自拍| 天天干天天色天天| 欧美亚洲午夜视频在线观看| 亚洲黄页在线观看| 成人黄色片视频| 久久免费视频色| 欧美 日韩 精品| 国产亚洲精品va在线观看| 成人综合网站| 资源网第一页久久久| 久久99国产精品麻豆| 国产精品三区在线观看| 日本道精品一区二区三区 | 亚洲国产精品成人| 亚洲色图欧美自拍| 一区二区在线看| 免费啪视频在线观看| 日本道不卡免费一区| 九一精品在线观看| 综合婷婷亚洲小说| 国产农村老头老太视频| 欧美激情第三页| 美女少妇全过程你懂的久久| 国产视频在线视频| 亚洲视频一二区| 亚洲精品国产手机| 68精品久久久久久欧美| 日韩精品免费一区二区三区竹菊| 欧美激情精品久久久久久小说| 欧美激情一区二区三区蜜桃视频| 91成品人影院| 97在线视频观看| 国内亚洲精品| 中文字幕人妻无码系列第三区| 亚洲丶国产丶欧美一区二区三区| 九九在线视频| 亚洲一区精品电影| 国产精品一区亚洲| www.99re6| 欧美狂野另类xxxxoooo| 国产精品—色呦呦| 欧美一区亚洲二区| 韩国女主播成人在线| 天堂网avav| 亚洲人成网在线播放| 亚洲日本一区二区三区在线| 黄色一级视频在线播放| 国产精品理论片| 婷婷丁香一区二区三区| 成人精品在线观看| 国产一区二区你懂的| 欧美国产日韩在线观看成人| 精品国产免费人成电影在线观看四季|