精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

告別評(píng)估亂象!首個(gè)視覺(jué)解釋綜合性基準(zhǔn)發(fā)布,附人類真值 | KDD'25

人工智能 新聞
埃默里大學(xué)團(tuán)隊(duì)推出首個(gè)覆蓋8個(gè)真實(shí)任務(wù)、帶有人類解釋真值的視覺(jué)解釋基準(zhǔn)Saliency-Bench,統(tǒng)一評(píng)估流程與開(kāi)源工具讓顯著性方法可公平比較,獲KDD’25接收,為可解釋AI奠定透明、可靠的基石。

深度學(xué)習(xí)模型的「黑盒」問(wèn)題一直是AI發(fā)展的瓶頸,而基于顯著性圖的視覺(jué)解釋是打開(kāi)這個(gè)黑盒的關(guān)鍵鑰匙。

然而,由于缺乏帶注釋的數(shù)據(jù)集和標(biāo)準(zhǔn)化的評(píng)估方案,整個(gè)領(lǐng)域的發(fā)展受到了限制,「如何科學(xué)、統(tǒng)一地評(píng)估這些解釋的質(zhì)量?」成了一個(gè)亟待解決的問(wèn)題。

為此,埃默里大學(xué)的研究團(tuán)隊(duì)推出了一個(gè)旨在全面評(píng)估視覺(jué)解釋的開(kāi)創(chuàng)性基準(zhǔn)Saliency-Bench,該基準(zhǔn)不僅構(gòu)建和標(biāo)注了涵蓋場(chǎng)景分類、癌癥診斷、行為識(shí)別等8個(gè)不同任務(wù)的多樣化數(shù)據(jù)集,還提供了一套標(biāo)準(zhǔn)化的評(píng)估流程和開(kāi)源工具包,讓研究人員可以輕松復(fù)現(xiàn)、比較和迭代。

圖片

論文鏈接: https://arxiv.org/abs/2310.08537

項(xiàng)目主頁(yè): https://github.com/yifeizhangcs/XAIdataset.github.io

在多家主流模型和方法上的大量實(shí)驗(yàn)證明,Saliency-Bench為衡量XAI方法的忠實(shí)性和對(duì)齊性提供了堅(jiān)實(shí)的基石,推動(dòng)了可解釋AI向著更可靠、更透明的方向發(fā)展。

該研究獲得KDD 2025 Datasets and Benchmarks Track接收,提出首個(gè)全面評(píng)估視覺(jué)解釋的開(kāi)創(chuàng)性基準(zhǔn)Saliency-Bench。

為視覺(jué)解釋建立評(píng)估標(biāo)準(zhǔn)

深度神經(jīng)網(wǎng)絡(luò)(DNNs)在圖像分類等任務(wù)中取得了巨大成功,但其「黑盒」特性使其決策過(guò)程難以捉摸,這在醫(yī)療、金融等高風(fēng)險(xiǎn)領(lǐng)域是不可接受的。

可解釋AI(XAI)技術(shù),特別是通過(guò)生成「顯著性圖」(saliency map)來(lái)高亮模型決策關(guān)鍵區(qū)域的方法,已成為提升模型透明度的重要途徑。

然而,長(zhǎng)期以來(lái),對(duì)這些XAI方法的評(píng)估存在三大挑戰(zhàn):

  1. 缺乏標(biāo)準(zhǔn)化的評(píng)估框架:不同的研究使用不同的指標(biāo)和流程,導(dǎo)致結(jié)果難以橫向比較和復(fù)現(xiàn)。
  2. 缺少全面且多樣化的數(shù)據(jù)集:現(xiàn)有的基準(zhǔn)測(cè)試數(shù)據(jù)集要么局限于特定領(lǐng)域(如醫(yī)療或物體檢測(cè)),要么規(guī)模太小,無(wú)法全面評(píng)估XAI方法的泛化能力。
  3. 基準(zhǔn)和分析不夠深入:很少有工作能夠在多個(gè)數(shù)據(jù)集上對(duì)多種主流方法進(jìn)行系統(tǒng)性的橫向評(píng)測(cè)。

為了解決這些問(wèn)題,Saliency-Bench應(yīng)運(yùn)而生,不僅僅是一個(gè)數(shù)據(jù)集集合,更是一個(gè)完整的視覺(jué)解釋評(píng)估生態(tài)系統(tǒng)。

圖片

Saliency-Bench框架概覽圖,展示了Saliency-Bench的整體框架。從多樣化的應(yīng)用場(chǎng)景出發(fā),涵蓋了數(shù)據(jù)集構(gòu)建、多類型顯著性方法、標(biāo)準(zhǔn)化評(píng)估(包含忠實(shí)性和對(duì)齊性指標(biāo))到最終基準(zhǔn)測(cè)試結(jié)果的完整流程。

Saliency-Bench的核心貢獻(xiàn)可以總結(jié)為四點(diǎn):

  1. 全面的數(shù)據(jù)集集合:精心構(gòu)建并標(biāo)注了8個(gè)數(shù)據(jù)集,覆蓋了從性別分類、環(huán)境識(shí)別到癌癥診斷和行為分類等多種任務(wù),并且包含了二分類和多分類問(wèn)題。
  2. 標(biāo)準(zhǔn)化的評(píng)估流程:開(kāi)發(fā)了一套統(tǒng)一的評(píng)估流水線,能夠?qū)Σ煌@著性方法生成的視覺(jué)解釋進(jìn)行標(biāo)準(zhǔn)化處理,并使用統(tǒng)一的指標(biāo)進(jìn)行衡量,確保了實(shí)驗(yàn)的可復(fù)現(xiàn)性。
  3. 廣泛的基準(zhǔn)測(cè)試和分析:對(duì)6種主流的顯著性方法(如GradCAM, RISE等)在不同模型架構(gòu)(ResNet-18, VGG-19, ViT)上進(jìn)行了大規(guī)模的基準(zhǔn)測(cè)試,并提供了深入的性能分析。
  4. 用戶友好的評(píng)估工具包:提供了一個(gè)易于使用的Python工具包,封裝了數(shù)據(jù)加載、模型評(píng)估等功能,極大地簡(jiǎn)化了研究人員的評(píng)估過(guò)程。

八大真實(shí)世界數(shù)據(jù)集,一次性補(bǔ)齊XAI評(píng)測(cè)短板

Saliency-Bench最大的亮點(diǎn)之一就是其前所未有的數(shù)據(jù)集廣度和深度。研究人員通過(guò)人工標(biāo)注、利用先驗(yàn)知識(shí)(如前景提取)等多種方式,為8個(gè)來(lái)自不同領(lǐng)域的公開(kāi)數(shù)據(jù)集制作了高質(zhì)量的像素級(jí)解釋真值(ground-truth)。

八大數(shù)據(jù)集示例圖

圖片

來(lái)自Gender-XAI, Environment-XAI, Disease-XAI, Cancer-XAI, Security-XAI, Pet-XAI, Action-XAI, 和 Object-XAI 這8個(gè)數(shù)據(jù)集的示例圖片及其對(duì)應(yīng)的像素級(jí)真值解釋

圖片

8個(gè)數(shù)據(jù)集的類別(二分類/多分類)、類別數(shù)量、樣本總數(shù)、標(biāo)注類型(人工標(biāo)注/前景提取)和數(shù)據(jù)格式等關(guān)鍵信息

誰(shuí)是最好的視覺(jué)解釋方法?用數(shù)據(jù)說(shuō)話!

研究人員選取了6種主流的顯著性方法,在ResNet-18, VGG-19和ViT-B/16等不同架構(gòu)上進(jìn)行了全面的性能評(píng)測(cè)。評(píng)估指標(biāo)兼顧了兩個(gè)核心維度:

對(duì)齊性 (Alignment):生成的解釋與人類認(rèn)知的真值有多接近?(使用 mIoU 和 Pointing Game (PG) 指標(biāo))

忠實(shí)性 (Faithfulness):生成的解釋是否真實(shí)反映了模型的決策依據(jù)?(使用 iAUC 指標(biāo))

實(shí)驗(yàn)結(jié)果亮點(diǎn)

沒(méi)有「萬(wàn)金油」方法:不同方法在不同任務(wù)和模型上表現(xiàn)各異。總體而言,RISE 和 GradCAM/GradCAM++ 在多個(gè)數(shù)據(jù)集中表現(xiàn)相對(duì)穩(wěn)健和可靠。

模型架構(gòu)影響顯著:通常,在 ResNet-18 上的解釋質(zhì)量要優(yōu)于 VGG-19,這可能得益于其更先進(jìn)的架構(gòu)設(shè)計(jì)。

ViT注意力機(jī)制潛力巨大:Vision Transformer的自注意力圖作為一種內(nèi)生的解釋方法,表現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力,尤其在捕捉全局和長(zhǎng)距離依賴關(guān)系方面,其生成的顯著性圖比傳統(tǒng)CNN方法更精細(xì)。

圖片

主流方法在ResNet-18和VGG-19上的詳細(xì)評(píng)測(cè)結(jié)果,展示了6種顯著性方法在8個(gè)數(shù)據(jù)集上,基于ResNet-18和VGG-19模型的mIoU, PG, iAUC三項(xiàng)指標(biāo)的詳細(xì)得分。

總結(jié)與展望

研究人員推出了Saliency-Bench,一個(gè)為視覺(jué)解釋評(píng)估提供全面數(shù)據(jù)集、標(biāo)準(zhǔn)化流程和開(kāi)源工具的綜合性基準(zhǔn)測(cè)試套件。 通過(guò)對(duì)多種主流方法和模型的廣泛測(cè)試,為社區(qū)提供了一個(gè)可靠的平臺(tái)來(lái)衡量和比較XAI技術(shù)和視覺(jué)解釋的性能。

Saliency-Bench的發(fā)布將有效遏制當(dāng)前XAI評(píng)估中的「各自為政」現(xiàn)象,為開(kāi)發(fā)更忠實(shí)、更可靠的視覺(jué)解釋方法提供堅(jiān)實(shí)的基石,最終推動(dòng)可解釋AI在更多關(guān)鍵領(lǐng)域的應(yīng)用落地。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2025-10-23 12:49:08

2025-02-27 10:08:19

2013-11-04 14:56:17

IT

2025-06-04 08:40:00

AI教育生成

2020-03-10 10:44:11

網(wǎng)絡(luò)監(jiān)控網(wǎng)絡(luò)管理網(wǎng)絡(luò)監(jiān)控工具

2025-09-10 18:03:16

AI智能體開(kāi)源

2024-07-11 11:53:56

2022-07-14 14:00:01

Linux命令解析

2023-09-05 17:42:18

2025-02-12 10:12:00

視頻模型AI

2025-05-23 08:47:00

2024-07-15 07:52:00

2025-04-28 14:04:03

Gemini模型AI

2025-07-17 09:21:11

2024-10-21 13:50:00

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)

2023-10-31 12:23:17

GPT-4版本VLM

2020-10-10 10:35:17

人工智能機(jī)器學(xué)習(xí)技術(shù)

2024-06-12 11:50:23

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

久久久久久久电影| 日韩视频不卡| 亚洲第一色在线| 丰满少妇被猛烈进入高清播放| 国产小视频免费在线网址| 麻豆精品新av中文字幕| 国产69精品久久久久9999| 粉嫩av蜜桃av蜜臀av| **精品中文字幕一区二区三区| 亚欧色一区w666天堂| 亚洲国产一区二区三区在线| 亚洲乱码国产乱码精品精软件| 天堂蜜桃一区二区三区 | 黄色成人一级片| 日韩黄色小视频| 久久久久久尹人网香蕉| 国产精品理论在线| 欧美日韩导航| 日韩精品在线一区| www.成年人| 第四色男人最爱上成人网| 亚洲大片免费看| 国产一二三四五| 99免在线观看免费视频高清| 91丝袜国产在线播放| 亚洲综合精品一区二区| 亚洲一区精品在线观看| 人人精品人人爱| 国产精品999999| 亚洲欧美在线视频免费| 在线中文一区| 久久久极品av| 毛片视频免费播放| 成人在线丰满少妇av| 亚洲免费一在线| www.免费av| 给我免费播放日韩视频| 日韩一区二区高清| 亚洲制服中文字幕| 96视频在线观看欧美| 欧美精品高清视频| 日本三级黄色网址| 欧美aaaaaaaa| 69av一区二区三区| 九九久久久久久| www.久久99| 91精品国产色综合久久ai换脸| 亚洲77777| 日日夜夜亚洲精品| 7777精品伊人久久久大香线蕉| 国模私拍视频在线观看| 亚洲成人高清| 91精品国产福利在线观看| 97人人爽人人| 国产精品亚洲四区在线观看| 538prom精品视频线放| 黄色一级片免费的| 精品国产三级| 精品对白一区国产伦| 国产51自产区| 天天躁日日躁狠狠躁欧美| 亚洲精品网站在线播放gif| 90岁老太婆乱淫| 成人情趣视频| 久久伊人91精品综合网站| 2021亚洲天堂| 最新国产拍偷乱拍精品| 日本精品视频在线播放| 中文字幕乱伦视频| 国产一区二区三区在线观看精品| 亚洲综合日韩在线| 欧美特黄一级视频| 久久久久久日产精品| 日韩一区二区三区资源| 成人免费高清| 性感美女极品91精品| 日本精品久久久久中文字幕| 国产第一精品| 日韩欧美一级二级三级久久久| 日本一区二区在线观看视频| 蜜臀久久99精品久久一区二区| 亚洲人成电影在线观看天堂色| www.99re6| 亚洲片区在线| 国产欧美中文字幕| 老牛影视av牛牛影视av| 久久婷婷色综合| 日韩视频在线免费播放| 91桃色在线观看| 欧美三区在线观看| 亚洲精品久久一区二区三区777| 欧美日韩播放| 欧美俄罗斯乱妇| 国产情侣免费视频| 大尺度一区二区| 先锋影音欧美| 91九色porn在线资源| 欧美在线看片a免费观看| 97精品人人妻人人| 成人在线一区| 91av视频在线观看| 国产免费的av| 国产日韩在线不卡| av日韩一区二区三区| avav成人| 日韩大陆欧美高清视频区| 久草视频手机在线| 日本麻豆一区二区三区视频| 国产日韩一区欧美| 麻豆影院在线| 欧洲人成人精品| 日本黄色免费观看| 在线中文字幕亚洲| 国产欧美久久一区二区| 日本a一级在线免费播放| 亚洲一区二区三区激情| 亚洲天堂网2018| 精品国产91久久久久久浪潮蜜月| 欧美精品福利在线| 国产精品久久久久久69| 国产欧美精品一区二区色综合| 国产自产在线视频| 精品视频在线播放一区二区三区 | 国产一区二区三区四区老人| 国产精品视频午夜| 黄视频在线观看免费| 午夜精品视频一区| 好吊操视频这里只有精品| 99久久久久国产精品| 国产精品久久久久影院日本| 你懂的在线视频| 亚洲va欧美va人人爽| 亚洲av无一区二区三区久久| 五月天激情综合网| 国产一区二区丝袜| 日本免费视频在线观看| 欧美日韩在线观看一区二区 | 熟妇高潮一区二区高潮| 亚洲综合区在线| 久久黄色一级视频| 欧美激情视频一区二区三区免费| 成人亚洲综合色就1024| 国产在线看片| 日韩久久精品一区| 久久久久亚洲av成人片| 成人精品免费看| 日韩av在线播放不卡| 国产毛片在线| 99久久久久成人国产免费| 中国a一片一级一片| 欧美一级电影久久| 91视频国产一区| 91亚洲视频在线观看| 亚洲国产精品成人综合色在线婷婷 | 国产精品日产欧美久久久久| 天天爽人人爽夜夜爽| 色88久久久久高潮综合影院| 国产精品一区二区三| 欧美精品日韩少妇| 日韩在线播放一区二区| 在线综合视频播放| 2021亚洲天堂| 成人一级片网址| 18禁免费无码无遮挡不卡网站| 亚州综合一区| 国产精品r级在线| 91视频88av| 亚洲影院一区二区三区| 国产精品国产自产拍高清av| 性欧美在线视频| 欧美成人久久| 狠狠色噜噜狠狠色综合久| 性国裸体高清亚洲| 中文字幕综合一区| 成人av无码一区二区三区| 精品成人av一区| 亚洲图片第一页| 国产不卡在线一区| 国语对白做受xxxxx在线中国| 成人看的羞羞网站| 亚洲综合色激情五月| 国产精品13p| 中文字幕亚洲一区二区三区五十路 | 国产在线拍偷自揄拍精品| 污的网站在线观看| 亚洲色图五月天| av中文字幕免费在线观看| 欧美日韩亚洲系列| av在线免费播放网址| 成人自拍视频在线| 看欧美ab黄色大片视频免费| 亚洲五月综合| 久久本道综合色狠狠五月| 欧美一级网址| 26uuu亚洲伊人春色| 黄色国产网站在线播放| 亚洲免费电影在线观看| 国产福利小视频| 在线亚洲精品福利网址导航| 国产亚洲色婷婷久久99精品| 国产无遮挡裸体免费久久| 精品乱码亚洲一区二区不卡| jizz国产在线| 亚洲高清免费观看| 欧美激情一区二区三区在线视频| 日产电影一区二区三区| 中文字幕一区在线| 亚洲精品中文字幕在线播放| 国产最新精品精品你懂的| 久久精品香蕉视频| 亚洲青色在线| 视色,视色影院,视色影库,视色网| 性人久久久久| 国产精品久久久一区二区三区| 青青久久精品| 国产福利视频一区| 国产美女高潮在线观看| 伦伦影院午夜日韩欧美限制| 成人午夜影视| 精品网站999www| 嫩草影院一区二区| 日韩一区二区不卡| 国产又粗又黄又爽视频| 在线视频亚洲一区| 亚洲婷婷综合网| 舔着乳尖日韩一区| 国产一级片免费| 最新热久久免费视频| 中字幕一区二区三区乱码| 26uuu亚洲婷婷狠狠天堂| 大乳护士喂奶hd| 懂色av一区二区在线播放| 欧美成人三级在线播放| 日本中文字幕一区二区视频| 国产高清精品在线观看| 99人久久精品视频最新地址| 无码人妻精品一区二区蜜桃网站| 欧美一区影院| 中文字幕色呦呦| 在线观看国产精品入口| 只有这里有精品| 一区二区国产在线| 99久re热视频精品98| 亚洲人metart人体| 日本道在线视频| 欧美激情第二页| av一区二区三区免费观看| 欧美福利专区| 妺妺窝人体色www看人体| 黄色另类av| 成人免费毛片在线观看| 999亚洲国产精| 色欲av无码一区二区人妻| 麻豆久久精品| 自拍偷拍21p| 国产专区欧美精品| 手机看片国产精品| 国产宾馆实践打屁股91| 强迫凌虐淫辱の牝奴在线观看| 成人精品免费看| mm131美女视频| 日本一区二区视频在线| 五月婷婷综合激情网| 亚洲自拍偷拍图区| 久久精品国产成人av| 欧洲视频一区二区| 国产露脸91国语对白| 亚洲精品在线一区二区| 内衣办公室在线| 色777狠狠综合秋免鲁丝| 羞羞的视频在线观看| 69av在线播放| 99re66热这里只有精品4| 91精品久久久久久久久久久久久| 99久久人爽人人添人人澡| 久久国产精品亚洲va麻豆| 欧美一站二站| 丁香色欲久久久久久综合网| 99视频在线精品国自产拍免费观看| 国产女女做受ⅹxx高潮| 黄色小说综合网站| 超碰caoprom| 国产精品拍天天在线| 久久久一二三区| 色婷婷狠狠综合| 99热这里只有精品5| 日韩精品中文字幕视频在线| 天堂地址在线www| 97视频在线免费观看| 国产69精品久久久久按摩| 国产精选在线观看91| 成人短片线上看| 精品国产一区二区三区无码| 免费在线观看精品| 黄色国产在线视频| 国产精品视频在线看| 国产精品suv一区二区| 欧美视频精品在线观看| 欧美一级淫片aaaaaa| 色小说视频一区| 欧美男女交配| 成人资源av| 日韩成人精品一区二区| 国产女大学生av| 国产美女久久久久| 国产jjizz一区二区三区视频| 樱花草国产18久久久久| 亚洲天堂网在线观看视频| 日韩成人激情视频| 亚洲丝袜精品| 成人精品久久一区二区三区| 国产99久久精品一区二区300| 日韩精品久久一区二区| 美女诱惑一区二区| xxxx日本免费| 亚洲v日本v欧美v久久精品| 国产男男gay体育生白袜| 亚洲欧洲日本专区| 午夜影院在线播放| 粉嫩av一区二区三区免费观看| 999久久久91| 在线免费观看视频黄| 久久综合色婷婷| 日本在线观看中文字幕| 精品毛片乱码1区2区3区| 精品国产白色丝袜高跟鞋| 国产欧美韩国高清| 成人高清电影网站| 久久婷婷国产91天堂综合精品| www亚洲一区| 天天插天天操天天干| 精品黑人一区二区三区久久| 伊人春色在线观看| 5g影院天天爽成人免费下载| 天天综合久久| 天堂中文av在线| 99免在线观看免费视频高清| 欧美国产日本高清在线| 视频一区日韩| 韩国无码av片在线观看网站| 国产丶欧美丶日本不卡视频| 欧美第一页在线观看| 91精品欧美一区二区三区综合在 | x99av成人免费| 国产成人毛片| 黄色一级片网址| 国产精品正在播放| 欧美成欧美va| 欧美xxxx老人做受| 免费毛片在线看片免费丝瓜视频 | 亚洲国产日韩欧美在线观看| 亚洲国产激情av| 亚洲一区在线观| 久热精品在线视频| 视频精品国内| 97视频在线免费| 91丨九色丨黑人外教| av中文在线播放| 亚洲美女性视频| 国产精品久久亚洲不卡| 亚洲欧洲日韩综合二区| 国产剧情一区二区| 国产午夜视频在线| 亚洲精品自在久久| www.精品国产| 成人高清dvd| 99久久婷婷国产| 波多野结衣电影在线播放| 中文字幕在线看视频国产欧美在线看完整| 青青在线精品| 亚洲熟妇无码av在线播放| 91美女片黄在线观看| 中日精品一色哟哟| 九九九久久久久久| 天堂综合网久久| 国产无色aaa| 天涯成人国产亚洲精品一区av| 精华区一区二区三区| 91网站在线免费观看| 国产免费成人| 手机av在线看| 日韩精品免费在线播放| 9999在线精品视频| 国产特级黄色大片| 综合色中文字幕| 日韩一二三四| 18成人免费观看网站下载| 欧美亚洲网站| 久久艹精品视频| 中文字幕欧美日韩精品| 精品伊人久久久| 第四色婷婷基地| 激情成人在线视频| 黄色网页网址在线免费| 好看的日韩精品| 精品一区二区成人精品| 欧美a∨亚洲欧美亚洲| 久久最新资源网| 中日韩免视频上线全都免费| wwwww在线观看|