精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI學會灌水和造假!Google新研究揭露了AI現實應用的陷阱

新聞 人工智能
Google AI發文探討不規范(Underspecification)是如何給機器學習帶來挑戰的。

 [[430918]]

今天,機器學習(ML)模型得到了大規模的使用,而且影響力也越來越大。然而,當它們被用于現實世界的領域時,往往表現出意想不到的行為。Google AI發文探討不規范(Underspecification)是如何給機器學習帶來挑戰的。

如今,機器學習(ML)模型得到了比以往任何時候都更廣泛的使用,并且它的影響力也變得越來越大。

[[430919]]

然而,把它們放在現實領域中使用時,問題可不小,甚至經常會出現一些意想不到的行為。

例如,當分析一個計算機視覺(CV)模型的bad case的時候,研究人員有時會發現模型確實掌握了大部分對特征的理解能力,但對一些人類根本不會注意的、不相關的特征表現出驚人的敏感性。

再比如,一個自然語言處理(NLP)模型,讓它學習文本吧,它也確實在學,只不過有時會依賴文本沒有直接指示的人口統計相關性作為依據,更麻煩的是,這種錯誤還不太好預測。

[[430920]]

其實,有些失敗的原因,是眾所周知的:例如,在不精確的數據上訓練了ML模型,或者訓練模型來解決結構上與應用領域不匹配的預測問題。

然而,即使處理了這些已知的問題,模型行為在部署中仍然是不一致的,甚至在訓練運行之間也是不同的。

影響ML模型信度的罪魁:不規范

谷歌團隊在「Journal of Machine Learning Research」上發表了一篇論文「不規范對現代機器學習的可信度提出了挑戰」。

https://arxiv.org/pdf/2011.03395.pdf

文章中,研究人員表明:在現代機器學習系統中,一個特別容易造成故障的問題是不規范。

而且,在各種各樣的實際機器學習(ML)系統中都經常會出現不規范,所以,谷歌對此提出了一些緩解策略。

什么是不規范?

不規范背后的意思是,雖然機器學習模型在保留的數據上進行過驗證,但這種驗證通常不足以保證模型在新環境中使用時,依然具有明確定義的行為。

ML系統之所以成功,很大程度上是因為它們在保留數據集上,對模型進行了驗證,靠這樣的方式來確保模型的高性能。

模型驗證流程

然而,對于固定的數據集和模型架構,通常有許多不同的方法,可以使訓練好的模型獲得高驗證性能。

但是在標準的預測任務中,編碼不同解決方案的模型通常被視為等價的,因為它們的持續預測性能大致相等。

但是,如果以超出標準預測性能的標準來衡量這些模型時,它們之間的區別就會變得很明顯,這就是要考驗這些模型對不相關的輸入擾動的公平性或魯棒性。

舉個例子,在標準驗證中表現同樣出色的模型中,一些模型可能在社會群體和人種之間表現出比其他模型更大的性能差異,或者更加依賴不相關的信息。

輕微擾動就可以讓深度學習網絡完全失靈

那么,當這些模型用于現實場景時,這些差異就會轉化為預測行為上的真正差異。

不規范會導致研究人員在構建ML模型時想到的需求和ML管道(即模型的設計和實現)實際執行的需求之間的差距。

一個重要后果就是,ML管道原則上可以返回一個滿足研究需求的模型,可是,這樣一來,在實踐中,這個模型也就只能滿足對保留數據的準確預測,而對超出這些數據分布的數據,它卻無能為力。

如何識別應用中的不規范?

這項工作研究了在現實應用中,使用機器學習模型時,不規范的具體含義。

谷歌給出的策略是使用幾乎相同的機器學習(ML)管道來構建模型集,只對其施加對非常小的改變,這種改變之小,即使是對他們同時進行標準驗證,性能也不會有實際影響。這種策略的重點是關注模型初始化訓練和確定數據排序的隨機種子。

ML Pipeline示意圖

如果這些小變化會對模型的重要屬性帶來實質性影響,那么,就說明ML管道沒有完全指出模型在真實世界會出現的行為。而研究人員在實驗的每個領域中,都發現了這些微小的變化會導致模型的行為在現實世界的使用中出現實質性變化。

計算機視覺中的不規范

舉一個例子,你可以想想計算機視覺中不規范與魯棒性的關系。

計算機視覺中的一個主要挑戰是,深度學習模型在人類認為沒什么挑戰性的分布變化下,經常會變得脆弱。

眾所周知,在ImageNet基準測試中,表現良好的圖像分類模型在ImageNet-C等基準測試中表現不佳,只不過是因為這些測試將常見的圖像損壞(如像素化或運動模糊)應用于標準ImageNet測試集。所以,在實驗中,標準管道沒有規定出模型對這些破壞的敏感度。

ImageNet-C數據集樣例

按照上面的策略,使用相同的管道和相同的數據生成50個ResNet-50圖像分類模型。這些模型之間的唯一區別是訓練中使用的隨機種子。

當在標準的ImageNet驗證集上進行評估時,這些模型實際上獲得了相同的性能。然而,當模型在ImageNet-C(即在損壞的數據上)中的不同測試集上進行評估時,模型的測試性能變化比在標準的ImageNet上驗證大幾個數量級。

就算是在大得多的數據集上進行預訓練的大規模模型,像在JFT-300M的3億圖像數據集上預先訓練的BiT-L模型,這種不規范持續存在。對于這些模型,在訓練的微調階段改變隨機種子會產生類似的變化。

左圖:在嚴重損壞的ImageNet-C數據上,相同的隨機初始化的ResNet-50模型之間的精度變化。線條表示集合中每個模型在使用未損壞測試數據和損壞數據(像素化、對比度、運動模糊和亮度改變)的分類任務中的性能。給定值是相對于總體平均值的精度偏差,用在「干凈的」ImageNet測試集上的精度標準偏差來衡量。黑色實線突出顯示了任意選擇的模型的性能,以顯示一個測試的性能如何不能很好地指示其他測試的性能。

右圖:標準ImageNet測試集中的示例圖像,其中包含ImageNet-C基準測試的損壞版本。

另外,在專門為醫學成像構建的專用計算機視覺模型中,這個問題也同樣存在。其中深度學習模型顯示出巨大的前景。

這里以兩個應用方向為例,一個是眼科方向,用于從視網膜眼底圖像檢測糖尿病視網膜病變,另一個是皮膚病方向,從皮膚的照片判斷患者的皮膚病情況。

研究人員對實際重要的維度上對這些pipeline生成的模型進行了壓力測試。

對于眼科方向,研究人員測試了以不同隨機種子訓練的模型,在訓練期間未遇見的新相機拍攝的圖像時的執行結果。

對于皮膚科方向,測試思路大致相似,但針對的是皮膚類型不同的患者。

左上:在來自不同相機類型的圖像上評估時,使用不同隨機種子訓練的糖尿病視網膜病變分類模型之間的AUC變化。左下:在不同的估計皮膚類型上評估時,使用不同隨機種子訓練的皮膚狀況分類模型之間的準確性差異(由皮膚科醫生訓練的外行根據回顧性照片進行近似,可能會出現標記錯誤)。右圖:來自原始測試集(左)和壓力測試集(右)的示例圖像。

結果顯示,標準驗證確實不足以完全體現訓練模型在這些任務上的性能。比如在眼科方向的測試中,訓練中使用的隨機種子導致模型在面對新相機拍出的圖片時,出現了比標準驗證集更大的變量波動。

這些結果再次表明,單獨的標準保持測試不足以確保醫療應用中模型的可靠性,需要對用于醫療領域模型的測試和驗證協議進行擴展。在醫學文獻中,這些驗證被稱為「外部驗證」。

除了醫學領域外,分類不規范導致的問題在其他應用領域也同樣存在。比如:

  • 在NLP任務中,分類不規范會影響由BERT模型衍生出的句子。

  • 在急性腎損傷預測任務重,分類不規范會導致對操作信號與生理信號的更多依賴。

  • 在多基因風險評分 (PRS)任務中,分類不規范會影響 PRS 模型的性能。

結論

解決不規范問題是頗具挑戰性的,它需要對超出標準預測性能的模型進行完整的規范和測試。要做到這一點,需要充分了解模型使用環境,了解如何收集訓練數據,而且在可用數據不足時,需要結合領域內的專業知識。

而上述幾點恰恰在當今的機器學習研究中經常被低估。長期以來,對于這些領域的投入是不足的。

要解決這個問題,首先需要為機器學習實用模型指定新的壓力測試協議,對現有的測試方式進行擴展。在將新的測試標準編入可衡量的指標之后,通過數據增強、預訓練和因果結構等算法策略,可能有助于改進這些模型的性能。

但同樣應該注意的是,理想的壓力測試和改進過程通常需要迭代,因為機器學習系統需求和使用它們的世界都在不斷變化。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-11-11 08:49:00

AI機器人訓練

2024-04-15 08:00:00

AI程序員

2025-06-10 00:00:00

AI紅利員工

2025-07-24 10:43:46

2018-04-04 16:37:55

2024-11-20 13:11:43

2025-07-23 07:57:53

2019-05-06 10:50:44

AI智能算法

2024-10-09 14:55:00

2025-11-10 08:59:00

AI模型ChatGPT

2025-02-12 10:05:00

AILLM訓練

2025-08-21 07:00:00

AI工具人工智能大模型

2023-12-11 21:43:47

2025-02-28 08:00:00

AI工廠數據中心GPU

2022-01-06 15:18:47

盜竊團伙攻擊勒索軟件

2019-08-08 10:36:55

AI 數據人工智能

2025-02-26 07:55:14

2018-06-20 12:53:21

戴爾

2009-05-30 09:33:10

Palm PreWebOS移動OS

2022-01-13 10:09:26

微軟MacOS系統漏洞
點贊
收藏

51CTO技術棧公眾號

天堂va欧美va亚洲va老司机| 国产综合动作在线观看| 神马久久精品综合| 91国内精品白嫩初高生| 一本一道久久a久久精品| 日韩不卡av| 国产免费高清av| 亚洲久色影视| 久久久精品欧美| 日批在线观看视频| 精品美女一区| 精品久久久久久久久久国产| 一区二区三区四区欧美| 欧美熟妇交换久久久久久分类| 视频一区二区欧美| 久久久久久久97| 国产一二三四视频| 欧美18免费视频| 6080国产精品一区二区| 欧美三级午夜理伦三级| 色呦呦在线免费观看| 国产午夜精品一区二区| 国产无套精品一区二区| 国产精品一区二区免费视频| 在线精品一区| 久久99热这里只有精品国产| 五月激情四射婷婷| 天堂俺去俺来也www久久婷婷| 欧美一区二区三区在线电影| 天天操天天摸天天爽| 日韩伦理电影网站| 综合久久给合久久狠狠狠97色| 久久国产精品99久久久久久丝袜| 99热这里只有精品3| 美腿丝袜亚洲三区| 国产精品99导航| 国产99久久久| 99精品国产一区二区青青牛奶| 久久国产精品久久精品| 欧美色图17p| 色小子综合网| 日韩中文字幕在线精品| 一级肉体全黄裸片| 久久不卡国产精品一区二区| 日韩av一区二区在线| 李丽珍裸体午夜理伦片| 永久免费精品视频| 日韩欧美在线网站| 中文字幕资源在线观看| 国产一区高清| 欧美日韩三级一区| 91热这里只有精品| 成人在线观看免费播放| 欧美视频一二三区| 精品999在线| 国产精品久久久久久妇女| 欧美亚洲国产一区在线观看网站| 搡女人真爽免费午夜网站| 玛雅亚洲电影| 精品视频在线视频| 午夜免费福利在线| 欧美黄色网络| 日韩欧美在线影院| 95视频在线观看| 亚洲精品进入| 国产亚洲一区精品| 中文国语毛片高清视频| 亚洲先锋影音| 久久久久久尹人网香蕉| 精品欧美一区二区三区免费观看 | 福利一区二区免费视频| 欧美日韩aaaaaa| 无套内谢丰满少妇中文字幕| 成人直播在线观看| 亚洲美女精品成人在线视频| 国产精品国产三级国产专业不| 日韩精品免费一区二区三区| 久久av中文字幕| 日韩 欧美 亚洲| 日韩极品在线观看| 91亚洲精品视频| 亚洲欧美日本在线观看| 欧美国产一区在线| 大桥未久一区二区| 久草在线资源福利站| 在线免费不卡视频| www.色.com| 五月激激激综合网色播| 日韩在线观看网址| 国产精品成人免费一区二区视频| 鲁大师成人一区二区三区| 国产精品欧美日韩| 亚洲乱熟女一区二区| 久久久久久99精品| 男插女免费视频| 欧洲亚洲两性| 日韩小视频在线观看专区| 亚洲男人在线天堂| 91精品蜜臀一区二区三区在线| 久久久久久高潮国产精品视| 亚洲无码精品国产| 成人avav影音| 日本美女爱爱视频| 91九色综合| 亚洲一区在线观| 91在线视频免费观看| 日韩第一页在线观看| 91av亚洲| 精品免费视频.| 又色又爽的视频| 免费视频一区| 国产乱码一区| www.久久久久.com| 欧美午夜精品免费| 女~淫辱の触手3d动漫| 一区二区三区中文| 国产精品免费久久久久久| 天天干天天爱天天操| 一区二区三区自拍| 狠狠干狠狠操视频| 精品国产一区二区三区| 97成人精品视频在线观看| 国产免费视频一区二区三区| 国产日韩欧美精品一区| 欧美三级一级片| 国产成人av毛片| 九九热这里只有精品免费看| 这里只有精品9| 国产婷婷色一区二区三区四区| 欧美人成在线观看| 999在线精品| 大量国产精品视频| 国产欧美第一页| 日韩一区在线看| 国产3p在线播放| 波多野结衣在线播放一区| 欧美中文字幕在线观看| 午夜在线视频观看| 亚洲第一福利视频在线| 日本天堂在线播放| 欧美精品午夜| 动漫精品视频| 51av在线| 日韩av在线电影网| 综合激情网五月| 久久久久久一二三区| 国产精品va无码一区二区| 日本午夜精品| 国产精品91久久久| 国产二区视频在线观看| 欧美性大战久久久久久久蜜臀| 我和岳m愉情xxxⅹ视频| 老**午夜毛片一区二区三区| 欧美在线激情| 久久精品超碰| 久久视频在线看| 亚洲精品一区二区三区新线路| 亚洲一区二区视频在线| 久久久久成人精品无码中文字幕| 一区二区黄色| 日本在线观看一区二区三区| 精品三级在线| 久久99热精品这里久久精品| 欧美特黄一级视频| 一本久道久久综合中文字幕| 国产免费无遮挡吸奶头视频| 久久99久国产精品黄毛片色诱| 制服国产精品| 97青娱国产盛宴精品视频| 5278欧美一区二区三区| av在线电影观看| 欧美一区二区私人影院日本| 国产精品第56页| 国产午夜精品一区二区三区四区| 亚洲欧洲日本精品| 欧美成人中文| 欧美一区1区三区3区公司| 福利一区二区免费视频| 久久久久久91| 国产综合在线观看| 欧美一卡二卡在线| 天天干天天干天天操| 国产精品国产三级国产有无不卡 | 亚洲无码精品国产| 亚洲一区二区三区精品在线| 自拍偷拍视频亚洲| 国产一区二区三区四区在线观看| 草草视频在线免费观看| 成人精品影院| 国产一区二区三区奇米久涩 | 国产精品久久久久久免费观看| 午夜伦理福利在线| 久久久999精品视频| 亚洲欧洲视频在线观看| 777a∨成人精品桃花网| 草久久免费视频| 中文字幕一区在线观看| 国产在线观看无码免费视频| 精品影视av免费| 国产精品免费观看久久| 欧美区日韩区| 亚洲.欧美.日本.国产综合在线| 一区二区免费| 国产欧美日韩中文字幕| 咪咪网在线视频| 久久亚洲精品网站| 国产鲁鲁视频在线观看免费| 欧美xxxxx牲另类人与| 97人妻精品视频一区| 精品福利在线看| 日本黄色小说视频| 国产精品电影一区二区三区| 国产精品1000部啪视频| 国产福利精品一区二区| 中文字幕 91| 久久免费高清| 欧美日韩一道本| 韩国亚洲精品| 粉嫩av一区二区三区天美传媒| 黑丝美女一区二区| 久久大片网站| 啪啪国产精品| 好吊色欧美一区二区三区视频| 日韩欧美久久| 91久久精品日日躁夜夜躁国产| 色香欲www7777综合网| 91精品国产91久久久| 动漫一区二区| 久久免费视频在线观看| 深夜国产在线播放| 久久亚洲国产精品| 男人天堂久久久| 少妇激情综合网| 在线视频91p| 日韩亚洲欧美中文高清在线| 91caoporn在线| 在线日韩中文字幕| 大乳在线免费观看| 国产午夜精品视频免费不卡69堂| 免费在线国产| 国产亚洲xxx| av片在线免费观看| 最近免费中文字幕视频2019| 在线免费看黄网站| 久久久黄色av| 羞羞电影在线观看www| 欧美高清性猛交| 少女频道在线观看免费播放电视剧| 久久999免费视频| 电影k8一区二区三区久久| 久久久久国产精品免费| 国产乱码午夜在线视频| 欧美一级bbbbb性bbbb喷潮片| 亚洲涩涩在线| 国产精品欧美日韩| 亚洲综合资源| 动漫美女被爆操久久久| 日韩av字幕| 日本不卡久久| 国产精品久久久久9999赢消| dy888午夜| 黄色亚洲在线| 四虎永久在线精品无码视频| 美美哒免费高清在线观看视频一区二区 | 又色又爽的视频| 亚洲精品乱码久久久久久黑人| 免费视频一二三区| 欧美日韩久久久久| 中文字幕男人天堂| 在线不卡一区二区| 刘亦菲毛片一区二区三区| 亚洲精品久久久久久久久久久| 蜜桃成人在线视频| 久久久精品免费| 美女av在线免费看| 国产精品永久免费| 日韩一区二区三区精品视频第3页 日韩一区二区三区精品 | 最新亚洲国产精品| 毛片在线网址| 国产精品成久久久久三级| 亚洲人成网站在线在线观看| 国产一级二级三级精品| 精品国产一区二区三区小蝌蚪| 正在播放一区| 性欧美xxxx大乳国产app| av亚洲天堂网| 91麻豆视频网站| √天堂中文官网8在线| 精品久久久久久中文字幕大豆网 | 亚洲国产欧美不卡在线观看 | heyzo久久| 久久亚洲a v| 日韩成人免费在线| 少妇熟女视频一区二区三区| 久久精品男人天堂av| 免费在线黄色片| 欧美亚日韩国产aⅴ精品中极品| 精品久久国产视频| 一本一道久久a久久精品逆3p | 久色视频在线| 久久99国产综合精品女同| 亚洲a∨精品一区二区三区导航| 高清一区二区三区视频| 日韩精品一区二区三区免费观影 | 亚洲精品中文字幕| 亚洲综合自拍一区| 成人免费电影网址| 免费国产a级片| 国产精品18久久久久久久久久久久| 一级性生活毛片| 红桃av永久久久| 亚洲成人黄色片| 色妞在线综合亚洲欧美| 在线视频cao| 国产精选一区二区| 亚洲精品国产成人影院| 日本中文字幕高清| 久久一区二区视频| 久久夜色精品亚洲| 欧美成人猛片aaaaaaa| 欧美猛烈性xbxbxbxb| 国产成人高潮免费观看精品| 亚州av一区| 国产特级黄色大片| 成人国产电影网| 国产一级视频在线播放| 日韩亚洲欧美高清| 大地资源网3页在线观看| 国产精品一区二区性色av| 欧美日本成人| 国产成人久久777777| 99精品热视频| 午夜影院在线看| 日韩久久精品成人| 超碰在线cao| 久久精品ww人人做人人爽| 亚洲每日在线| 双性尿奴穿贞c带憋尿| 午夜精品在线视频一区| 特黄视频在线观看| 18久久久久久| 丝袜美腿综合| 成人小视频在线看| 久久五月婷婷丁香社区| 青青青国产在线| 亚洲视频免费一区| 99久久婷婷国产综合精品首页| 日本不卡一区二区三区在线观看| 亚欧成人精品| 成年人在线免费看片| 欧美视频中文一区二区三区在线观看| 国产经典自拍视频在线观看| 国产精品久久久久久影视| 欧美疯狂party性派对| 手机av在线网站| 一区二区三区影院| 欧美 日韩 国产 在线| 欧美在线免费视频| gogogo高清在线观看一区二区| 182午夜在线观看| 一区二区三区在线影院| 蜜臀av中文字幕| 日本午夜精品理论片a级appf发布| 国产精品密蕾丝视频下载 | 福利一区和二区| 懂色av一区二区三区四区五区| 国产精品一区二区视频| 国产一级做a爱免费视频| 亚洲国产欧美自拍| 日韩精品专区| 中文字幕一区二区三区精彩视频| 国产精品99精品久久免费| 日本一区二区不卡在线| 亚洲人成电影在线观看天堂色| 日本中文字幕视频一区| 青草视频在线观看视频| 久久久精品天堂| www.黄色av| 热久久免费国产视频| 欧美成人精品一区二区三区在线看| 波多野结衣网页| 日韩欧美国产高清91| 精品国产99久久久久久| 国产在线一区二| 麻豆国产欧美日韩综合精品二区| 久久国产精品二区| 在线观看91久久久久久| 4438全国亚洲精品观看视频| 激情视频综合网| 亚洲在线免费播放| 国产69久久| 国产一区二区久久久| 久久精品国产999大香线蕉| av资源吧首页| 色偷偷88888欧美精品久久久| 精品国产导航| 欧美精品色视频| 91成人国产精品| 嗯啊主人调教在线播放视频 | 国产精品自拍首页|