精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌等揭露「AI任務疑難」:存在局限的ImageNet等基準,就像無法代表「整個世界」的博物館

新聞 人工智能
近日,由加州大學伯克利分校、華盛頓大學和谷歌研究院合著的論文《AI and the Everything in the Whole Wide World Benchmark》指出ImageNet等基準定義的模糊任務在促進智能理解上的局限性,就像用有限的博物館來代表整個世界一樣。

 

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

在日常生活中,我們需要一些「標準」來衡量個人的行為。

而在科研工作中,研究人員也需要一些「基準」來評估模型的性能。

因此,不管是普遍的「標準」還是特定的「基準」,它們都有一定的參考意義。

然而,如果有一天我們發現這些「參照物」與實際生活漸行漸遠時,它們該往何處去?

近日,由加州大學伯克利分校、華盛頓大學和谷歌研究院合著的論文《AI and the Everything in the Whole Wide World Benchmark》指出ImageNet等基準定義的模糊任務在促進智能理解上的局限性,就像用有限的博物館來代表整個世界一樣。

論文地址:https://openreview.net/pdf?id=j6NxpQbREA1

在這篇論文中,研究人員闡述了機器學習(ML)對通用任務框架(CTF)的過度依賴,因為這個框架不恰當地演變成我們今天所理解的這些聲稱評估「通用能力」的基準。值得注意的是,研究團隊并不否認這些基準的實用性,而是希望指出將其作為框架存在的固有缺陷。

1. 展示「整個世界」的博物館 VS ImageNet

這篇論文最能引起共鳴的一點就是用故事書作為引子,且將情節貫穿全文,使得論文的研究內容更為直白易懂。

這本書就是1974年出版的《Grover and the Everything In the Whole Wide World Museum》,書中的主人公Grover參觀了一家聲稱展示「整個世界」的博物館。

該博物館的每個展廳都陳列著不同類別的東西,有些類別是隨意和主觀的,比如「你在墻上看到的東西( Things You Find On a Wall )」和「房間里能讓你撓癢癢的東西( The Things that Can Tickle You Room )」;有些類別則非常具體的,例如「胡蘿卜屋( The Carrot Room )」,而另一些則含糊不清,如「高大的廳堂( The Tall Hall )」。

當Grover認為自己已經參觀完博物館的一切時,他來到寫著「其他東西(Everything Else)」的大門前。打開門后,卻發現自己置身于外面的世界。

作為兒童故事,Grover的經歷是荒誕的。然而,在實際的研究中,例如人工智能尤其是ML領域,也存在類似的固有錯誤邏輯,其中許多流行的基準依賴于固有的錯誤假設。

這篇論文的研究人員認為,在諸如「視覺理解」或「語言理解」之類的模糊任務中,作為衡量一般能力進展的基準,與有限的博物館在代表「整個世界的一切」方面一樣無效,且這兩個謬論的原因是相似的,即本質上是基于特定的、有限的且局限于上下文的環境。

GLUE或ImageNet之類的基準測試常常被提議為驗證任何給定模型性能的基本通用任務的定義。其結果是,通過這些基準數據集證明合理的結論往往遠遠超越了它們最初設計的任務,甚至超出了最初的開發目標。

盡管作為邁向「通用目標」的標志,這些基準存在明顯的局限性。事實上,這些基準的開發、使用和采用表明了一個結構有效性的問題,其中涉及的基準——由于它們在特定數據、度量和實踐中的實例化——不可能捕獲任何具有代表性的關于它們的普遍適用性的結論。

論文的作者們認為測量通用能力的目標(即通用對象識別、通用語言理解或領域獨立推理等目標)不能充分體現在數據定義的基準中。研究人員注意到,當前的趨勢不恰當地擴展了CTF范式,以將其應用于與現實世界目標或背景不同的抽象表現任務。

從歷史上看,CTF的開發正是為了引入實用導向和嚴格范圍的人工智能任務,即自動語音識別(ASR)或機器翻譯(MT),其中所需的驗證是基準是否準確地反映了計算機在現實環境中所要求的實際任務。這一波定義不明確的「通用」目標則完全顛覆了其引入的意圖。

與其把Grover的經歷當成兒童故事來看,倒不如說這是一則深刻的寓言故事。當Grover打開「其他東西」的大門時,卻發現自己置身于博物館外的大千世界。故事的結尾或許已經預示了這個研究的結論,ImageNet之類的基準定義必然不能代表適應所有現實世界模糊任務的「通用目標」。

因此,這篇論文確實有許多值得討論和深思的地方。ImageNet存在不足,那其他基準定義就是完美無缺的嗎?除了ImageNet,目前在通用對象識別上還有更好的參照基準嗎?該如何看待以及解決基準定義越來越「不基準」這個問題?

外行看熱鬧,內行看門道,這么頭疼的問題就應該交給專業人士。

 

2. OpenReview官方怎么評

 

迎面向我們走來的是第一位評委,該評委發出了“反對CV和NLP的“通用”基準中令人信服的觀點!(A compelling argument against "general" monolithic benchmarks in vision and NLP)”的贊嘆,因為他覺得這篇論文史料詳實,觀點明確,分析到位,著實令人信服。

論文的研究人員先在文中鋪墊了大量的背景知識,向讀者展現了通用人工智能和基準測試的相關研究,并分析了ML的基準測試何時開始作為評估范圍狹窄的任務性能的標準化方法。最后,結論就水到渠成了:通用語言理解和通用對象識別的基準本質上是有缺陷的,因為它們應用于狹窄的范圍。

最后,這位評委真誠地希望計算機視覺和NLP社區能認真對待這篇論文,因為他認為該論文對在這兩個領域取得更有意義的進展做出了寶貴的貢獻,而不僅僅是追求最先進的技術。

但美中不足的是,既然發現了ImageNet基準存在局限性,那有什么辦法可以減少對這些通用標準的過度依賴?看來論文的研究人員也還沒找到這個問題的答案。

而第二位評委對這篇論文的評價是:通用人工智能基準的謬論(The Fallacy of Benchmarks for General Artificial Intelligence )。因為這篇論文的受眾主要是AI領域的研究人員,所以作者在前文回顧了通用AI的相關基準,一下拉近了與讀者的距離。此外,引用Grover的故事也使得該論文有趣易懂。

即使這篇論文的開頭存在表述問題,未能無縫銜接主題,但瑕不掩瑜,評委二號高度贊揚了這篇論文為ML領域的研究指明了方向。

接著,評委三號也帶著他的觀點款款走來:好論文!但改一下結構就更好了(Well argued paper, with some reorganization suggested)。這位評委指出,這篇論文最大的亮點是觀點獨特且論據充足。但也發出了和第一位評委相同的疑惑:所以,有什么解決方案可以減少對通用標準的過度依賴?

不同于前三位評委的「慷慨」,第四位評委只給出了5分的評價,認為這篇論文只是:當前基準測試的簡史(History of the benchmarks we use today)。從這個評語不難看出,這位評委覺得這篇論文列舉了很多基準測試且強調了它們的局限性,但作者團隊并沒有采取任何立場。

最后,評委五號不見其人,先聞其聲:很棒!但還有上升空間(Great, but improvements needed)。第五位評委認為這篇論文在梳理和總結相關工作的方面做得非常好,同時有大量的研究支撐文中的論點,希望這篇論文能引起相關領域研究人員的重視。

正因為對這篇論文寄予了極高的期望,因此評委只給出了6分的評價,同時羅列了非常詳細的修改建議,希望論文的作者能加以改進。

 

3. Reddit網友怎么說

 

看完五大評審的官方評論,總結起來基本就是:論文不錯,觀點新穎,論據充分,要是能提出解決方案就更好了。此外,有三位評委都不約而同地希望這篇論文能引起相關領域的重視。

Reddit上關于這篇文章的討論熱度也不小,我們來看看神通廣大的網友怎么說。

某位網友一針見血地指出,雖然ImageNet等基準測試像「有限的博物館」一樣存在不足,但卻是目前我們訓練模型最有力的工具。

確實,就像上述評委提到的,ImageNet是有局限性,但是否有更好的解決方案?因此,有熱心網友為論文的作者修改了摘要:沒有任何數據集能夠捕捉所有細節的全部復雜性,就像沒有博物館可以包含整個世界中所有的事物一樣。

一些網友則認為論文不錯,尤其是「芝麻街」故事情節的插入加深了他們對該論文的理解。

這些網友覺得,用「無法展示一切的博物館」類比「ImageNet在一些模糊任務上的局限性」非常恰當。

大概論文的作者們也沒想到,寫個文章還能為一本書代言,有網友調侃:宇宙萬物的答案就隱藏在這本「芝麻街」故事書中。

更多網友表示贊同論文作者的觀點,畢竟相比解決問題,發現問題太容易了。(狗頭)

所以,解決方案究竟在哪?

就算博物館「無法展示一切」,也沒有人能否定其價值。同理,ImageNet這類基準定義的存在意義也不容置喙。不斷發現問題并解決問題,歷史的車輪才會滾滾向前(狗頭)。

 

 

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2023-04-03 09:41:39

技術數字博物館

2021-08-26 16:34:45

智能博物館物聯網

2011-05-05 17:13:10

Google Art

2017-05-19 12:33:23

2013-10-22 09:10:30

微軟WindowsXP

2019-12-18 14:52:19

.com域名互聯網

2012-08-10 11:06:21

筆記本

2016-06-17 17:55:27

Google Home惡意軟件勒索軟件

2017-11-24 11:14:00

2010-08-13 16:49:20

網絡監控系統博物館D-Link

2012-11-28 10:45:39

投影機NEC

2011-11-10 16:12:31

掃描儀用戶體驗

2024-11-08 10:47:32

2024-01-26 10:19:00

AI模型

2012-07-24 10:02:38

2013-02-18 09:16:33

計算機博物館古董計算機

2019-12-26 15:43:45

區塊鏈技術智能
點贊
收藏

51CTO技術棧公眾號

99久久亚洲精品| 少妇淫片在线影院| 国产成人精品免费视频网站| 欧美第一淫aaasss性| 中文字幕在线视频播放| 老司机2019福利精品视频导航| 国产日韩精品一区| 97视频中文字幕| 精品免费囯产一区二区三区 | 超碰国产精品久久国产精品99| 国产真实的和子乱拍在线观看| 岳的好大精品一区二区三区| 6080yy午夜一二三区久久| 少妇高潮毛片色欲ava片| av在线播放网| 岛国一区二区在线观看| 国产精品日日摸夜夜添夜夜av| 久久久久亚洲av成人片| 欧美精品久久久久久 | 日韩av地址| 国产在线播精品第三| 国产91精品青草社区| 黄色录像一级片| 亚洲欧美tv| 亚洲第一区第一页| xxx中文字幕| 都市激情综合| 亚洲一区av在线| 一区二区在线观| 国产中文在线视频| kk眼镜猥琐国模调教系列一区二区| 国产精品入口免费视频一| 日韩免费一级片| 欧美日韩精选| 久久精品国产69国产精品亚洲| 一卡二卡三卡四卡| 久久97久久97精品免视看秋霞| 6080午夜不卡| 手机版av在线| 成人亚洲综合| 色婷婷亚洲一区二区三区| 福利视频一区二区三区四区| 哥也色在线视频| 国产精品成人免费在线| 日本在线免费观看一区| 国产在线你懂得| 99re6这里只有精品视频在线观看| 91九色在线观看| 国产av精国产传媒| 国产在线播精品第三| 91久久精品美女| 91精品国产色综合久久不8| 青娱乐精品视频在线| 国产成人久久久| 免费黄色小视频在线观看| 国产亚洲在线| 日本欧美在线视频| 波多野结衣一本一道| 久久中文在线| 国产精品18久久久久久麻辣| 色老头在线视频| 美日韩一区二区| 国产精品一区二区三| 中文字幕视频一区二区| 久热成人在线视频| 亚洲精品欧美日韩专区| 精品国产亚洲av麻豆| 国产精品99久久久久久久女警| 亚洲自拍偷拍一区| 亚洲精品国产精品国| 成熟亚洲日本毛茸茸凸凹| 成人在线免费观看一区| 少妇高潮久久久| 久久久综合激的五月天| 欧美中日韩免费视频| 91电影在线播放| 亚洲女子a中天字幕| 国产一级片91| 国产h片在线观看| 91久久香蕉国产日韩欧美9色| 黄色国产小视频| 国产在线不卡一区二区三区| 精品国一区二区三区| 大地资源二中文在线影视观看| 精品在线手机视频| www.99久久热国产日韩欧美.com| 美女福利视频在线观看| 国产日韩欧美在线播放不卡| 国产精品美女呻吟| www.色婷婷.com| 久久综合九色综合97_久久久| 日韩精品一线二线三线| 里番在线观看网站| 亚洲aⅴ怡春院| 日本老熟妇毛茸茸| 午夜免费欧美电影| 亚洲男人天堂手机在线| 欧美成人777| 亚洲欧美日本日韩| 国产欧美精品一区二区三区介绍| 亚洲va欧美va| 欧美激情一二三区| 欧美视频在线观看视频| 成人看片网站| 精品成人在线观看| 91视频免费看片| 激情欧美亚洲| 91久久夜色精品国产网站| 五十路在线视频| 亚洲日本一区二区| 久久精品.com| 99精品中文字幕在线不卡 | 尤物在线网址| 日本韩国精品在线| 影音先锋黄色资源| 亚洲电影在线一区二区三区| 日本久久中文字幕| 欧美一区,二区| 国产精品国产三级国产三级人妇| 无码专区aaaaaa免费视频| av国产精品| 亚洲天堂av高清| 国产一卡二卡在线播放| 久久精品72免费观看| 欧洲亚洲一区二区| 蜜桃麻豆影像在线观看| 日韩一区二区三| 亚洲伦理一区二区三区| 免费成人在线影院| 欧美日韩亚洲在线| 深夜av在线| 亚洲国产日韩欧美综合久久| 九九热精品免费视频| 久久99久久99| 亚洲精品自在在线观看| 激情开心成人网| 亚洲精品一区二区三区婷婷月| 精品无码久久久久| 国产精品一区二区91| 一区二区不卡在线视频 午夜欧美不卡'| 26uuu亚洲电影| 日韩电视剧在线观看免费网站| 国产这里有精品| 国产精品羞羞答答xxdd| 久久久成人精品一区二区三区| 国产精品99久久久久久董美香| 亚洲日韩第一页| 欧美一级特黄视频| 久久久www免费人成精品| 久久国产亚洲精品无码| 欧美电影完整版在线观看| 欧美大学生性色视频| 午夜精品无码一区二区三区| 悠悠色在线精品| 18禁一区二区三区| 亚洲午夜极品| 久久精品国产综合精品| 国产欧洲在线| 亚洲欧美制服另类日韩| 亚洲不卡在线视频| 国产亚洲自拍一区| 亚洲精品视频三区| 天天做综合网| av一区二区三区免费| 91福利在线尤物| 日韩精品在线观看一区二区| 天天干天天色综合| 国产精品欧美一区二区三区| 在线观看免费视频污| 国产精品hd| 精品一区二区三区免费毛片| 亚洲一二三四| 日韩在线观看你懂的| 国产高清不卡视频| 精品久久香蕉国产线看观看gif| 女人被狂躁c到高潮| 日本va欧美va瓶| 在线观看视频黄色| 女同一区二区三区| 国产精品jizz在线观看麻豆| 一区二区三区视频在线观看视频| 6080日韩午夜伦伦午夜伦| 四虎永久在线精品| 国产日韩欧美激情| 精品中文字幕在线观看| 欧美做受777cos| 美女国产精品久久久| 97视频在线观看视频免费视频 | 日本在线视频一区二区| 精品激情国产视频| 少妇精品高潮欲妇又嫩中文字幕| 狠狠色噜噜狠狠狠狠97| 成年人看的免费视频| 国产成人综合视频| 日韩无套无码精品| 欧美日韩三区| 台湾成人av| 国产主播性色av福利精品一区| 国产精品久久av| cao在线视频| 久久精品国产欧美亚洲人人爽| 亚洲欧美高清视频| 欧美午夜片在线看| 99热国产在线观看| 日韩理论片中文av| 久久中文字幕人妻| 国产福利一区在线| 国产免费视频传媒| 亚洲毛片播放| 日韩视频在线观看视频| 蜜乳av综合| 成人资源av| 色999韩欧美国产综合俺来也| 97超级碰在线看视频免费在线看| 国内精品久久久久国产| 亚洲欧美国产另类| 黄频网站在线观看| 欧美一区二区三区视频在线| 国产又粗又猛又黄视频| 亚洲h精品动漫在线观看| 亚洲一级生活片| 国产日韩成人精品| 99久久久久久久久久| 国产999精品久久久久久| 可以看污的网站| 日韩中文字幕区一区有砖一区 | 亚洲精品xxxx| 精品人妻一区二区三区麻豆91| 91福利精品第一导航| 天天操天天干视频| 亚洲一二三专区| 午夜写真片福利电影网| 中文字幕日本不卡| 日韩不卡av在线| 国产欧美日韩在线观看| 黄瓜视频污在线观看| 99v久久综合狠狠综合久久| 日本wwwxx| 国产精品18久久久久久vr| 在线一区二区不卡| 久久爱另类一区二区小说| 国产aaaaa毛片| 日韩av高清在线观看| 国内外免费激情视频| 性高湖久久久久久久久| 国产无套内射久久久国产| 国产一级久久| 国产超级av在线| 久久精品91| 日韩精品免费播放| 美女久久久精品| 777视频在线| 精品在线观看免费| 亚洲第一区第二区第三区| 九色|91porny| 国内精品国产三级国产aⅴ久| 国产精品亚洲第一区在线暖暖韩国| 国产xxxxhd| 成人手机在线视频| 亚洲黄色在线网站| 国产婷婷色一区二区三区| 超碰人人人人人人人| 日韩美女视频一区二区 | 51成人做爰www免费看网站| 日本高清久久| 国产日韩精品久久| 久操国产精品| 亚洲欧美久久234| 亚洲精品久久久| 男人插女人视频在线观看| 国产精品免费看| av在线无限看| 国产精品综合二区| 性囗交免费视频观看| 久久嫩草精品久久久久| 神马久久久久久久久久久| 成人欧美一区二区三区1314| 久久久久久久久久久网| 欧美性xxxx在线播放| 中文字幕欧美在线观看| 日韩欧美国产1| 青青色在线视频| 日韩在线中文字幕| 国产ktv在线视频| 国产精品网站视频| jazzjazz国产精品久久| 欧美一区二区三区电影在线观看| 欧美成人激情| 9久久9毛片又大又硬又粗| 日韩黄色免费网站| 肉丝美足丝袜一区二区三区四| 久久午夜羞羞影院免费观看| 天堂网av2018| 精品国产鲁一鲁一区二区张丽 | 久久99精品一区二区三区| 99re这里只有| 国产精品九色蝌蚪自拍| 天堂资源在线播放| 欧美日韩亚洲国产综合| 黄色片网站免费在线观看| 国产亚洲欧洲高清| 2018av在线| 91麻豆国产精品| 欧美人与物videos另类xxxxx| 黄色影视在线观看| 久久激情中文| 成年人小视频在线观看| 国产精品青草综合久久久久99| 久草国产精品视频| 91精品国产综合久久久久久| 青青青草原在线| 欧美激情va永久在线播放| 成人国产精品| 欧美日韩国产综合在线| 欧美精品九九| 亚洲天堂国产视频| 久久欧美一区二区| 日本熟妇乱子伦xxxx| 91精品国模一区二区三区| 国产中文在线| 欧洲成人在线视频| 亚洲午夜免费| 男人的天堂成人| 秋霞影院一区二区| 中文字幕在线看高清电影| 亚洲va中文字幕| 国产成人久久精品77777综合| www.日本久久久久com.| 99久久精品一区二区成人| 久久久久高清| 在线亚洲一区| 第四色在线视频| 亚洲国产日韩在线一区模特| 国产极品久久久| 久久精品国产欧美亚洲人人爽| 九七电影院97理论片久久tvb| 欧洲亚洲一区二区三区四区五区| 国产精品毛片在线| 国产精品伦子伦| 五月婷婷欧美视频| 天天操天天干天天爱| 欧美第一黄色网| 第四色中文综合网| 成年人看的毛片| 99久久99久久久精品齐齐| 日产电影一区二区三区| 精品99一区二区| 高潮在线视频| 久久波多野结衣| 亚洲综合国产| 成人片黄网站色大片免费毛片| 懂色av影视一区二区三区| 亚洲欧美日韩免费| 日韩av高清不卡| 欧美精选一区二区三区| www.激情小说.com| 国产精品成人网| 99国产精品欲| 欧美激情一区二区三级高清视频| 高清精品视频| 久久国产色av免费观看| 中文字幕av不卡| av片免费播放| 97国产成人精品视频| 伊人春色之综合网| 成人性生交免费看| 亚洲免费在线电影| 好吊视频一区二区三区| 91chinesevideo永久地址| 国产探花在线精品| 九九热99视频| 亚洲国产精品欧美一二99| 四虎影视2018在线播放alocalhost| 青青草国产精品一区二区| 日韩一级毛片| www.日本久久| 精品福利在线看| av男人的天堂在线| **亚洲第一综合导航网站| 黄色在线成人| 法国空姐电影在线观看| 欧美日本韩国一区| 好吊日av在线| 久久婷婷开心| 激情小说亚洲一区| 日韩毛片在线播放| 中文字幕在线观看亚洲| 欧美久久亚洲| 中文字幕乱码人妻综合二区三区| 国产精品久久久久天堂| 日本精品久久久久久| 国产91精品最新在线播放| 亚洲精品二区三区| 右手影院亚洲欧美| 日韩亚洲欧美综合| 天然素人一区二区视频| 成品人视频ww入口| 国产精品久久久久久久久免费丝袜| 亚洲国产精品无码久久| 国产精品福利无圣光在线一区|