精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測? 原創

發布于 2024-4-25 11:41
瀏覽
0收藏

考慮一個標準的ResNet50模型,該模型經過訓練用于圖像分類任務。我們是否能夠理解這個模型中的卷積濾波器如何將輸入圖像轉換為其預測的標簽?或者,GPT-3中的注意力頭如何contribute到下一個標記的預測?理解這些模型組件——包括濾波器或頭等架構“構建塊”——如何集體塑造模型行為(包括模型失敗)是困難的。畢竟,深度網絡在很大程度上是黑匣子——由模型組件之間高度非線性交互構成的復雜計算圖。

受到這一挑戰的啟發,解釋性工作的一個方向旨在通過表征單個組件的功能,例如視覺模型中的曲線檢測器和對象特定濾波器,或語言模型中的知識神經元和歸納頭,來闡明內部模型計算。作為這一工作方向的一部分開發的方法旨在以各種方式“放大”特定的模型行為和/或組件。

改變模型組件如何集體改變個體預測?

顯式建模模型計算

為了解決上述問題,研究人員引入了一個稱為組件建模的任務。組件建模的目標是構建一個簡單且可解釋的估算器,以了解模型的輸出如何響應于對其組件的干預或消除。直觀地說,這里的關鍵想法(如下圖所示)是,如果我們真正理解模型組件對預測的貢獻,我們應該能夠估計如果我們改變一些組件,預測將如何改變

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

這項研究側重于組件建模的一種特殊“線性”情況,稱之為組件歸因。如下所示,對于給定模型預測的組件歸因首先為每個模型組件分配一個分數,然后估計消除一組組件的反事實效果,作為它們相應分數的總和:

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

組件歸因很簡單——它將給定的預測分解為來自每個模型組件的加法貢獻。它們也是可解釋的,因為分配給組件的“分數”表示該組件對感興趣的預測的“貢獻”(同時擺脫了模型的內部計算的復雜性)。

此外,研究人員在數據建模工作中探索了一種類似的思路——通過預測來理解,其目標是將模型行為預測為訓練數據的函數。組件模型和組件歸因可以被看作是“組件空間”中的數據模型和數據歸因(或線性數據建模)的類比,而不是“訓練數據集空間”。

通過回歸估計組件歸因(COAR)

事先不清楚組件歸因是否足夠表達深度網絡中從組件到預測的(固有的非線性)映射。然而,研究人員發現在視覺模型(例如ImageNet ViTs)和語言模型(例如Phi-2)上,實際上可以計算準確的組件歸因——即,線性性足以預測組件消除的效果!如下所示:

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

為了計算這些歸因(即上面的系數向量w),研究人員提出了一種簡單的方法——稱為COAR(通過回歸進行組件歸因),它將此任務轉化為標準的監督學習問題,并分兩步解決:

  • 構建組件消除數據集。隨機消除隨機子集的組件,并記錄每個感興趣示例的消除本身以及模型輸出如何改變。這樣可以得到一個組件消除數據集及其對模型預測的相應效果。
  • 擬合線性回歸模型。擬合一個線性模型,該模型接受“消除向量”作為輸入(編碼消除的組件的二進制向量)并預測給定示例的預測上的消除效果。該線性模型的學習權重作為組件歸因,量化了每個組件對模型預測的貢獻。

COAR歸因準確嗎?

回到在ImageNet數據集上訓練的ResNet-50模型,將這個模型視為由22,720個組件組成,每個組件對應一個卷積濾波器。能否使用COAR來預測這個模型將如何對組件消除做出響應(在這種情況下,消除對應于將給定一組濾波器的參數置零)?

為了回答這個問題,研究人員使用COAR來估計ImageNet驗證集中每個50,000個示例的組件歸因。結果是一組50,000個組件歸因—每個歸因估計每個組件對相應ImageNet示例上模型預測的貢獻。

為了確定結果的歸因是否有效,研究人員簡單地檢查組件歸因是否準確估計了(隨機地)消除模型輸出上的隨機子集的組件的效果。

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

例如,上圖聚焦在一個單獨的ImageNet示例上。每個點對應于一組(隨機的)模型組件。給定點的y值是消除該組件集的反事實效果(即,將相應參數設置為零);x軸是對該反事實效果的估計,由示例的組件歸因給出。隨機組件消除的基本事實和歸因估計的效果展現了高達0.70的高相關性,這意味著至少對于這個示例,組件歸因在預測模型行為方面相當不錯!

在下圖中,將其轉化為一個綜合分析。也就是說,評估了所有驗證示例中基本事實消除效果和基于歸因的估計之間的平均相關性——為了測試COAR的限制,研究人員還改變了消除的組件比例,并研究了COAR的性能變化。作為基線,研究人員將幾種“組件重要性”的概念調整到組件歸因設置中。

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

總的來說,研究人員發現COAR在數據集和模型中一直以很大的優勢 consistently outperforms多個歸因基線。

譯自(有刪改):https://gradientscience.org/modelcomponents-editing/


誰是Aleksander M?dry?

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區


Aleksander M?dry是波蘭裔計算機科學家,麻省理工學院(MIT)教授,OpenAI Preparedness團隊首席科學家。Aleksander M?dry的研究涉及機器學習、優化和圖論,著重于操作化技術,使得機器學習算法能夠安全地在現實世界中部署。他工作的主要焦點之一是開發能夠處理對抗攻擊的強大而高效的算法。這一研究方向導致了一種使神經網絡更加抗對抗攻擊和剖析對抗樣本廣泛存在根源的方法的開發。他還致力于基于連續優化的方法來解決組合優化問題,例如最大流問題和二部圖匹配問題。

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

Aleksander M?dry在2006年和2007年分別從弗羅茨瓦夫大學獲得了計算機科學和物理學的學士學位。然后,他在MIT攻讀計算機科學博士學位,于2011年完成。他的博士論文“從圖到矩陣,再到圖:圖算法的新技術”獲得了ACM博士論文獎榮譽提名和MIT喬治·M·斯普勞爾斯獎,被評為計算機科學領域的最佳論文。隨后,他曾在微軟研究新英格蘭分部擔任博士后研究員,并在瑞士洛桑聯邦理工學院擔任教職,然后加入了麻省理工學院電氣工程和計算機科學系的教職

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

Aleksander M?dry因其研究貢獻獲得了許多獎項和榮譽,包括NSF職業生涯獎。他的工作曾多次獲得諸如IEEE計算機科學基礎研究會議(FOCS)等會議的最佳論文獎。2019年,他被歐洲理論計算機科學協會授予普雷斯伯格獎。

OpenAI Preparedness團隊首席Aleksander Madry:機器學習模型的內部計算如何將輸入轉化為預測?-AI.x社區

本文轉載自公眾號AIGC最前線   

原文鏈接:??https://mp.weixin.qq.com/s/xYDwwvLYgW_ADYxUGdXtnw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
精品久久久久久综合日本| 国产三级精品三级在线专区| 欧美人在线观看| 欧美激情 亚洲| 欧美日韩精品免费观看视完整| 国产精品污污网站在线观看| 久久免费视频网站| 强伦人妻一区二区三区| 天天综合在线观看| 午夜av一区二区| 四虎永久在线精品免费一区二区| 精品久久久久成人码免费动漫| 亚洲精品免费观看| 日韩中文字幕在线免费观看| 噜噜噜在线视频| 电影中文字幕一区二区| 狠狠爱在线视频一区| 玖玖精品在线视频| 国产视频网站在线| 99天天综合性| 91成人免费看| 亚洲视频一区二区三区四区| 亚洲美女视频在线免费观看| 日韩视频免费在线观看| 欧美一区二区三区成人精品| 精品中文在线| 欧美日韩国产电影| 北条麻妃在线一区| 欧美黄色小说| 国产成人午夜电影网| 国产精品久久久av| 日韩精品一区二区不卡| 中文一区一区三区免费在线观看| 亚洲人成免费电影| www.超碰97| 国产精品久久久久久久久久白浆| 91精品国产丝袜白色高跟鞋| 啊啊啊国产视频| 黑人巨大亚洲一区二区久| 亚洲观看高清完整版在线观看| 中文字幕制服丝袜在线| 中国日本在线视频中文字幕| 久久亚洲捆绑美女| 狠狠色噜噜狠狠狠狠色吗综合| 亚洲AV无码精品国产| 亚洲福利国产| 美女视频黄免费的亚洲男人天堂| 2017亚洲天堂| 成久久久网站| 中文日韩电影网站| 超碰人人人人人人人| 国产精品免费大片| 亚洲午夜未满十八勿入免费观看全集| 丝袜美腿中文字幕| 国产一区二区欧美| 国产亚洲精品久久久久久| 熟女俱乐部一区二区| 一区二区三区日本久久久| 亚洲精品在线不卡| 人妻少妇一区二区| 欧美日韩在线观看视频小说| 在线观看欧美视频| 国产一二三四五区| 日韩av专区| 欧美成人综合网站| 中国特级黄色片| 风间由美一区二区av101| 精品三级av在线| 四虎精品一区二区| 日本午夜精品| 在线视频一区二区| 性生交大片免费全黄| 亚洲天堂一区二区三区四区| 欧美另类暴力丝袜| 国产在线观看免费av| 国产日韩高清一区二区三区在线| 7777免费精品视频| 日韩国产成人在线| 激情偷乱视频一区二区三区| 高清国产一区| 97超碰国产在线| 国产一区二区三区免费看| 97久久夜色精品国产九色| 欧美综合视频在线| 国产三级欧美三级日产三级99| 一区二区三区观看| 黄色成人在线网| 91久久久免费一区二区| 污污网站在线观看视频| 粉嫩av一区二区| 亚洲性夜色噜噜噜7777| 欧美久久久久久久久久久久| 999在线观看精品免费不卡网站| 日韩av免费一区| 国产精品theporn动漫| 国产日韩免费| 成人免费黄色网| 四虎免费在线观看| 成人涩涩免费视频| 精选一区二区三区四区五区| 中文字幕在线免费| 亚洲国产日日夜夜| 成人性生交免费看| 免费视频成人| 精品国产成人在线影院| 精品无码在线观看| 亚洲激情不卡| 91精品国产综合久久久久久久久| 无码人妻精品一区二| 国产欧美不卡| 91久久在线播放| 免费在线看v| 亚洲精品视频在线看| 国产a视频免费观看| 日韩在线亚洲| 神马久久久久久| 女人十八岁毛片| 国产福利一区在线观看| 色99中文字幕| 成人欧美大片| 亚洲第一av网| 欧美精品一区二区蜜桃| 久久精品国产秦先生| 欧美成人综合一区| 黄污视频在线观看| 91精品国产综合久久久蜜臀图片| 不用播放器的免费av| 欧美91在线| 欧美夫妻性生活视频| 在线视频欧美亚洲| 中文字幕第一页久久| 丰满人妻中伦妇伦精品app| 91精品国产自产精品男人的天堂| 久久精品99久久久久久久久 | 97精品在线| 国产成人精品电影久久久| 少妇一区二区三区四区| 亚洲综合色噜噜狠狠| 久久久福利影院| 国产精品成人a在线观看| 国产精品久久久久久久久久久久久久 | 日韩毛片在线播放| 成人精品在线视频观看| 青青在线视频免费观看| 日韩精品三级| 欧美成人精品影院| 国产夫绿帽单男3p精品视频| 日韩美女视频19| 色婷婷激情视频| 91精品国产自产拍在线观看蜜| 国产精品视频在线播放| 91在线看片| 9191精品国产综合久久久久久| 精品在线观看一区| 国产做a爰片久久毛片| 中文字幕av日韩精品| 国产精品1区在线| 欧美日韩999| 成人午夜免费福利| 午夜精品福利一区二区三区av| 国产精品久久久久久在线观看| 亚洲视频播放| 品久久久久久久久久96高清| 国产成人午夜性a一级毛片| 日韩中文字幕在线视频| av中文字幕播放| 亚洲国产精品欧美一二99| 人妻无码中文久久久久专区| 视频一区视频二区在线观看| 亚洲 国产 欧美一区| 亚洲伊人精品酒店| 欧美激情乱人伦一区| 亚洲区小说区图片区| 欧洲色大大久久| 裸体武打性艳史| 99久久综合99久久综合网站| 欧美日韩在线视频一区二区三区| 成人国产综合| 蜜臀久久99精品久久久无需会员| 亚洲精品久久久久久久久久 | 免费一级特黄毛片| 成人综合网站| 欧美理论电影在线播放| 天天摸夜夜添狠狠添婷婷| 在线观看日韩毛片| 欧美黄色aaa| www成人在线观看| 午夜精品久久久久久久99热影院| 欧美黄色大片网站| 日韩国产高清一区| 在线综合色站| 国产欧美一区二区三区在线| 久久香蕉一区| 精品久久免费看| 男人天堂视频网| 亚洲综合一区二区三区| 亚洲区自拍偷拍| 国产ts人妖一区二区| 免费看污污网站| 精品av久久久久电影| 亚洲成人蜜桃| 偷拍亚洲色图| 69久久夜色精品国产7777| 国产女人在线观看| 亚洲成人黄色网址| 国产又粗又猛又色又| 欧美日韩午夜剧场| 青青草成人免费| 国产精品美女一区二区| www.自拍偷拍| 国产高清成人在线| 五月婷婷六月丁香激情| 久久激情网站| 99在线免费视频观看| 免费观看亚洲天堂| 国产精品成人观看视频国产奇米| 色婷婷视频在线观看| 中国china体内裑精亚洲片| 熟妇人妻系列aⅴ无码专区友真希| 91精品国产日韩91久久久久久| 99久久久久久久久| 91看片淫黄大片一级在线观看| 在线观看日本www| 免费不卡在线视频| 一区二区三区四区五区视频 | 日韩jizzz| 日韩深夜影院| 国产在线精品日韩| 国产极品模特精品一二| 99久久精品免费看国产四区| 日韩成人一区| 91精品国产综合久久男男 | 国产色综合网| 成人免费毛片在线观看| 亚洲一级影院| 日韩极品视频在线观看| 综合在线视频| 777久久精品一区二区三区无码| 日韩亚洲一区在线| 亚洲人久久久| 成人在线丰满少妇av| 日韩精品无码一区二区三区| 国产欧美日韩影院| 欧美一区二区视频17c| 九九热线有精品视频99| 国产精品美女午夜av| 亚洲午夜天堂| 欧洲成人免费视频| 蜜臀国产一区| 国产精品日韩久久久久| 成人免费一区| 国产自摸综合网| 亚洲日本va| 国产日韩在线一区二区三区| 欧美一区 二区| 欧美三级网色| 色135综合网| 佐佐木明希av| 精品1区2区3区4区| 黄色动漫在线免费看| 日一区二区三区| 校园春色 亚洲色图| 国产做a爰片久久毛片| www.黄色网| 91麻豆6部合集magnet| 国产人妻大战黑人20p| 国产精品美女久久久久久2018| 久久久精品少妇| 亚洲高清在线精品| 无码人妻精品一区二| 4438x亚洲最大成人网| 国产高中女学生第一次| 国产婷婷成人久久av免费高清| 黄色影院在线播放| 欧美成人亚洲成人| 激情aⅴ欧美一区二区欲海潮| 国产精品高潮呻吟久久av野狼 | 99久久精品久久久久久ai换脸| 欧美电影完整版在线观看| 日韩中文一区| 欧美日韩免费| 亚洲国产另类久久久精品极度| 日本久久黄色| 大胆欧美熟妇xx| 久久久精品五月天| 91精品国产三级| ww亚洲ww在线观看国产| 免费一级suv好看的国产网站| 一片黄亚洲嫩模| 国产剧情在线视频| 91精品国产综合久久香蕉的特点| 午夜激情在线视频| 久久综合电影一区| 超碰国产一区| y111111国产精品久久婷婷| 国产一区二区精品久| 隔壁人妻偷人bd中字| 日韩av一区二区在线影视| 69堂免费视频| 精品一区二区三区欧美| 在线天堂www在线国语对白| 国产精品理论片| 五月天综合激情| 欧美一区二区视频在线观看2020| 欧美白人做受xxxx视频| 色综合91久久精品中文字幕| 精品无人乱码一区二区三区| 国产精品一 二 三| 天天做天天爱天天综合网2021 | 电影一区二区三区| 成人激情直播| 天天天综合网| 超碰在线播放91| jlzzjlzz国产精品久久| 午夜国产福利一区二区| 欧美在线短视频| 中国女人真人一级毛片| 91高清在线观看| 人成网站在线观看| 久久成人精品一区二区三区| 亚洲天堂1区| 欧美午夜精品久久久久久蜜| 影音国产精品| 亚洲天堂小视频| 亚洲情趣在线观看| 91女人18毛片水多国产| 亚洲一区二区久久| 人人视频精品| 精品视频一区二区| 一本综合精品| 欲求不满的岳中文字幕| 亚洲福利视频一区二区| 亚洲国产精品久久久久久6q| 久久国产色av| 国产亚洲高清在线观看| 午夜啪啪免费视频| 黑人精品欧美一区二区蜜桃 | 国产精品毛片久久| 亚洲欧洲日本精品| 国产精品久久精品日日| 波多野结衣二区三区| 亚洲视频在线免费看| 偷拍视频一区二区三区| 日韩av影视| 免费高清不卡av| www.com.av| 91精品国产91久久综合桃花| 免费a级人成a大片在线观看| 91视频国产精品| 中文在线日韩| 五月天丁香社区| 欧美日韩精品二区| 可以在线观看的黄色| 国产精品久久久久久久久久久久久 | 亚洲小视频在线观看| 黄色精品视频| 亚洲伊人婷婷| 国产精品系列在线观看| 国产一级黄色av| 日韩成人在线视频| 韩漫成人漫画| 欧美 日韩 国产 在线观看| 国产大陆a不卡| 亚洲黄色小说图片| 中文字幕国产亚洲| 精品一区视频| 免费无遮挡无码永久视频| 国产亚洲精品久| 国产乱淫片视频| 久久久久久久久久国产| 伊人久久综合影院| 日韩一区二区三区久久| 一区二区三区在线观看视频| 三级毛片在线免费看| 国产精品最新在线观看| 欧美日本不卡| 91精品人妻一区二区| 欧美老肥妇做.爰bbww| 91九色在线播放| 亚洲精品白虎| 国产91色综合久久免费分享| 国产午夜精品久久久久| 免费91麻豆精品国产自产在线观看| 精品国产18久久久久久洗澡| 黄色三级视频在线| 亚洲综合视频网| 国产区视频在线播放| 97人人模人人爽人人少妇| 久久国产福利| 九九视频在线观看| 亚洲人成毛片在线播放| 91精品啪在线观看国产爱臀 | 一级黄色免费在线观看| 91在线码无精品| 国产一区二区在线不卡| 亚洲2020天天堂在线观看| 国产精品美女久久久久| 国产免费黄视频| 亚洲综合色自拍一区| 91官网在线|