精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用LLaVA解讀數(shù)萬神經元,大模型竟然自己打開了多模態(tài)智能黑盒

人工智能 新聞
LMMs-Lab 團隊使用 LLaVA-OV-72B 對 LLaVA-NeXT-8B 中的神經元進行了自動解讀,獲得了非常多有趣的結果。

本文主要作者來自LMMs-Lab團隊與新加坡南洋理工大學,分別是張愷宸、沈逸飛、李博,指導老師為MMLab@NTU劉子緯教授。LMMs-Lab是一個由學生,研究人員和教師組成的團隊,致力于多模態(tài)模型的研究,主要研究方向包括多模態(tài)模型的訓練以及全面評估,此前的工作包括多模態(tài)測評框架 LMMs-Eval,以及多模態(tài)模型 LLaVA-OneVision,長視頻理解模型LongVA等。

圖片

多模態(tài)大模型(LMMs)給語言模型裝上了 “眼睛”,讓 AI 更接近通用智能。但它們的大腦里每個神經元到底在干啥?南洋理工大學 LMMs-Lab 團隊用 “模型看模型” 的方法,成功解鎖了數(shù)十萬神經元的秘密。

以 GPT4V 為代表的多模態(tài)大模型(LMMs)在大語言模型(LLMs)上增加如同視覺的多感官技能,以實現(xiàn)更強的通用智能。雖然 LMMs 讓人類更加接近創(chuàng)造智慧,但迄今為止,我們并不能理解自然與人工的多模態(tài)智能是如何產生的。

像 LLaVA 一樣的開源模型是理解多模態(tài)智能的一個契機。但這些模型(在未來)可能比人類更加聰明,如何去理解他們的智力呢?來自南洋理工大學的 LMMs-Lab 團隊給出的解決方案是:問問 LLaVA 自己是怎么說的。

LMMs-Lab 團隊使用 LLaVA-OV-72B 對 LLaVA-NeXT-8B 中的神經元進行了自動解讀,獲得了非常多有趣的結果。

傳統(tǒng)的可解釋性的研究是人工去檢查每個神經元并且解讀他們的含義。這樣的操作很難拓展到多模態(tài)大模型上:其一,多模態(tài)大模型的神經元數(shù)量是傳統(tǒng)模型的成百上千倍,人工檢查成本過于高昂;其二,根據(jù)神經科學中的分布式表示原理,一個神經元可能會有多個含義,一個語義可能分布在多個神經元當中。 

在大語言模型中,OpenAI 和 Anthropic 提出了使用稀疏自編碼機來解離特征表示,或者用更大的語言模型來解讀小模型里面的神經元。比如使用 GPT-4 解讀 GPT-2。但這些工作尚未被應用到多模態(tài)模型當中,圖像作為比語言更加自然的信號,解讀圖像與文字的交互能讓人們更加理解智能的產生。LMMs-Lab 基于這些工作對于 LLaVA-NeXT-8B 做出了初步的嘗試:使用稀疏自編碼機(SAEs)來把多語義神經元解離為單語義神經元,并且用 LLaVA-OV-72B 對單語義神經元進行自動解釋,解釋能夠接近人類水平。

圖片

  • 論文地址:arxiv.org/abs/2411.14982
  • 代碼:EvolvingLMMs-Lab/multimodal-sae: Auto Interpretation Pipeline and many other functionalities for Multimodal SAE Analysis.
  • 5k 個神經元解讀樣例:lmms-lab/llava-sae-explanations-5k?Datasets at Hugging Face

這個項目能夠讓自動挖掘多模態(tài)大模型中神經元的語義信息,讓后續(xù)研究工作可以通過修改神經元的激活來改變模型行為,包括減少幻覺和增加安全性。

圖片

(a) 把 SAE 放在 Llava 的某一層并且在 Llava-NEXT 所有數(shù)據(jù)上訓練;(b) 找到一個神經元的最大激活的圖片和區(qū)域,讓 Llava 找出公共點;(c) 刺激神經元可以改變模型行為

具體方法

使用 LMMs 解釋 LMMs 分為以下個步驟:

步驟一:用 SAEs 獲得單語義神經元

SAE 是一個可以追溯到 1996 年的經典解釋性的方法 [1] ,其本質是對特征找到一組互相關性很小的基,把特征分解為這組基的一個稀疏表示。因為基的互相關性很小,所以這些基很可能是單語義的。這篇文章使用了 OpenAI 的兩層 SAE 實現(xiàn):

圖片

其中 z 是稀疏表示也是 SAEs 的神經元,W_2 是一組基。

步驟二:使用 LLaVA 解釋單語義神經元

對于上一步當中 SAE 的每個神經元 z,獲得訓練集里面激活最大的 K 張圖片,以及激活最大的圖像區(qū)域,把這些圖像給 LLaVA-OV-72B 找出共同點。

模型對神經元生成的解釋:炸薯條。

圖片

步驟三:刺激對應的神經元

把 SAE 神經元的激活值調高,看看模型如何表現(xiàn)。

圖片


圖片

可以看到,無論是否包含圖像輸入或者是純文字輸入,LMM 與 LLM 的不同之處在于能夠理解視覺輸入,我們在稀疏編碼器的神經元中也找到了許多與 LLM 不一樣的地方。在進行神經元探測時,我們發(fā)現(xiàn)不同于先前的 LLM 工作,往往激活最強烈的神經元并不是與高層級概念直接相關的,而是許多低層級的感知神經元。這體現(xiàn)了模型的思考步驟,先看懂物體是什么,再去思考更高層級的抽象概念,譬如情感等概念。

LMMs 獨特的神經元

低層級感知神經元:對線條形狀紋理激活的神經元

圖片

物體神經元

圖片

感情與共情神經元

這種方法找到了很多情感神經元,在刺激這些神經元之前,模型是一個冰冷的 AI,刺激這些神經元能夠引發(fā)模型的共情。

圖片

多模態(tài)一致性神經元

對動作場景,以及對應文字圖像都激活的神經元。下圖描繪了對于吃和 hungry 文字都激活的神經元,這樣的神經元在人腦中也存在 [2] 。

圖片

定位模型錯誤原因

圖片

LMM 在實際應用使往往會產生許多幻覺,上面便是 LLaVA-NeXT-8B 在實際場景下產生幻覺的一個例子,圖片中并未標注玻利維亞但模型仍舊回答了 “Yes”。為了研究為何產生這一現(xiàn)象以及如何通過刺激神經元的方式抑制這一現(xiàn)象,我們效仿了 [3,4] 的方法進行探究。

圖片

通過探究發(fā)現(xiàn),造成模型輸出 Yes 的罪魁禍首并不在圖像的理解能力上,模型能夠很好的找到需要關注的點,并準確的找到各個國家的名字。然而,在文字上面,我們發(fā)現(xiàn)模型過分的關注了 Bolivia 這一詞,導致了最后的輸出產生幻覺。通過這一探究,我們思考如何能夠抑制這一幻覺現(xiàn)象并展開了實驗。

圖片

圖片

我們展示了兩個例子用刺激神經元的方式成功抑制了這一現(xiàn)象。我們嘗試激活 OCR 相關的神經元,強行讓模型關注點集中在圖像上,而這成功使得模型 “回心轉意”,不再依賴文字的輸出。

可能的應用以及局限性

因為這超出了文章的范圍,這篇文章只給出了一個應用:找到引起幻覺的神經元并糾正。在未來,這樣的方法可以找出模型有危害、不誠實行為的原因并加以修正,真正達到可控的 AGI。但到達這個目標還有很多問題需要一一攻克:

1. 更高效的自動可解釋流程 —— 由于稀疏編碼器中的神經元數(shù)量眾多且需要緩存大量激活值,解釋所有神經元在目前代價十分高昂。

2. 自動激活神經元的流程 —— 自動且高效地尋找并刺激神經元從而達到控制模型輸出的目的

3. 更準確的自動解釋流程 —— 由于模型的局限性,許多神經元的解釋往往存在錯誤,隨著多模態(tài)大模型的推理能力逐漸增強,我們相信這一問題將會被慢慢攻克

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-07 13:16:40

ChatGPT神經元模型

2023-05-10 15:45:08

GPT-4AI模型

2023-10-08 13:44:00

數(shù)據(jù)研究

2025-01-08 08:21:16

2024-10-14 14:10:00

大模型AI開源

2022-10-31 15:17:49

AI系統(tǒng)

2025-09-16 09:35:52

2023-08-21 10:48:25

2023-04-28 15:27:06

微軟模型

2024-12-30 00:01:00

多模態(tài)大模型Python

2024-12-12 00:25:09

2024-12-18 18:57:58

2024-11-13 09:39:13

2025-02-12 13:31:33

2019-10-11 14:48:42

技術研發(fā)指標

2024-12-31 15:18:42

2025-04-25 02:30:00

機械臂大模型多模態(tài)

2024-09-25 14:53:00

2025-08-15 12:38:58

點贊
收藏

51CTO技術棧公眾號

精品1区2区在线观看| 国产精品免费免费| 日韩av片免费在线观看| 少妇一级黄色片| 日韩精品一区国产| 黑人狂躁日本妞一区二区三区| 日韩精品另类天天更新| 国产高清第一页| 欧美综合国产| 欧美大荫蒂xxx| 国产肥白大熟妇bbbb视频| 亚洲高清影院| 欧美日韩在线视频一区二区| 中文字幕第一页亚洲| 神马久久久久| 国产成人在线色| 国产成人午夜视频网址| 欧美黄色一级网站| 欧美成人自拍| 亚洲欧美另类在线观看| gogo亚洲国模私拍人体| 91亚洲视频| 精品国产精品自拍| 91xxx视频| 国产区高清在线| 99精品视频中文字幕| 亚洲最大成人网色| 这里只有精品999| 一二三区精品| 欧美黑人狂野猛交老妇| 天天操天天摸天天舔| 亚洲欧洲色图| 亚洲精美色品网站| 人妻激情偷乱视频一区二区三区| 成人在线观看免费播放| 色综合色狠狠天天综合色| 国产精品久久..4399| 激情视频在线观看| 国产精品无遮挡| 欧洲一区二区在线观看| 五月天久久久久久| 成人ar影院免费观看视频| 91中文字幕在线| 国产内射老熟女aaaa∵| 看片的网站亚洲| 国产精品入口夜色视频大尺度| 天天操天天爽天天干| 欧美日韩1区2区3区| 久久精品2019中文字幕| 免费黄色激情视频| 欧美成人激情| 久久精品这里热有精品| 国产中文字幕久久| 亚洲成av人电影| 久久亚洲影音av资源网| 开心激情五月网| 91精品国产自产在线观看永久∴ | 国产成人亚洲精品无码h在线| 丰满大乳少妇在线观看网站| 亚洲综合激情另类小说区| 人人妻人人澡人人爽欧美一区| av免费在线网站| 亚洲黄色av一区| 屁屁影院ccyy国产第一页| av2020不卡| 欧美日韩日本国产| 日韩欧美xxxx| 欧美高清你懂的| 9191成人精品久久| 岛国av免费观看| 日韩福利视频一区| 亚洲视频在线免费观看| 免费看的黄色网| 小处雏高清一区二区三区| 欧美成人午夜免费视在线看片| 麻豆影视在线播放| 国产精品五区| 国产精品综合久久久| 精品国产伦一区二区三| 99久久精品免费看| 色一情一区二区三区四区| 国产在线1区| 欧美日韩国产黄| 久久午夜夜伦鲁鲁一区二区| 粉嫩一区二区三区在线观看| 亚洲成色www8888| 美女被到爽高潮视频| 国产精品7m凸凹视频分类| 欧美乱大交xxxxx| 国产一级做a爱片久久毛片a| 日韩 欧美一区二区三区| 亚洲综合色激情五月| 亚洲av片一区二区三区| 国产精品乱人伦中文| 国产一二三在线视频| 自拍偷拍亚洲视频| 欧美一区二区三区免费在线看| 丰满岳乱妇一区二区| 欧美色蜜桃97| 午夜精品www| 亚洲天堂网在线视频| 成人免费视频视频| 亚州欧美一区三区三区在线| 欧美色图天堂| 欧美三级日韩三级| 日本黄色录像片| 婷婷另类小说| 国产不卡精品视男人的天堂| 国产视频在线免费观看| 久久精品欧美日韩精品| 成人在线视频一区二区三区| 福利精品在线| 日韩av中文字幕在线| 91麻豆免费视频网站| 日韩av在线播放中文字幕| 高清国产一区| 黄网站免费在线播放| 色94色欧美sute亚洲线路二| 国产精久久久久| 91久久电影| 国产精品久久久久久久久久ktv| 亚洲国产综合网| 亚洲三级理论片| 三级在线视频观看| 中国av一区| 国内精品久久久久久久| 国产特黄一级片| 国产精品伦理在线| 男人搞女人网站| 免费看av成人| 68精品久久久久久欧美| 精品国产乱码久久久久久蜜臀网站| 亚洲国产高清aⅴ视频| 男人和女人啪啪网站| 日韩在线观看中文字幕| 不卡伊人av在线播放| 中文字幕av无码一区二区三区| 久久久国产综合精品女国产盗摄| 欧美一级片免费播放| 日韩三级不卡| 欧美黄色三级网站| 亚洲av无码乱码国产麻豆| 亚洲欧美视频在线观看| 亚洲综合av在线播放| 成人激情诱惑| 国产精品自在线| 免费在线看黄网站| 在线成人高清不卡| 中文字幕另类日韩欧美亚洲嫩草| 激情av综合网| 国产对白在线播放| 日韩综合一区二区三区| 久久夜色精品国产欧美乱| 国产精品亚洲欧美在线播放| 自拍偷自拍亚洲精品播放| 99九九精品视频| 你懂的网址国产 欧美| 91久久久一线二线三线品牌| 亚洲资源一区| 亚洲成色999久久网站| 中国一级特黄毛片| 久久久天堂av| 国产喷水theporn| 亚洲精品久久| 成人综合色站| 中文字幕在线直播| 一个人www欧美| 国产麻豆免费观看| 亚洲中国最大av网站| 人妻无码中文久久久久专区| 亚洲欧美bt| 亚洲最新在线| 久久精品免视看国产成人| 久久久免费精品视频| 欧洲天堂在线观看| 欧美日韩一本到| 精国产品一区二区三区a片| 丁香亚洲综合激情啪啪综合| 精品人妻一区二区三区四区在线| 欧美精品一二| 114国产精品久久免费观看| av电影在线免费| 国产亚洲精品美女| www.日本在线观看| 色诱亚洲精品久久久久久| 激情高潮到大叫狂喷水| 粉嫩绯色av一区二区在线观看| 午夜精品久久久久久久无码 | 国产麻豆视频一区二区| 大伊香蕉精品视频在线| 精品久久久久中文字幕小说| 92裸体在线视频网站| 亚洲女同志freevdieo| 在线日韩欧美视频| 免费看av毛片| 欧美日韩一区 二区 三区 久久精品| 波多野结衣不卡视频| 26uuu另类欧美亚洲曰本| 在线观看岛国av| 99av国产精品欲麻豆| 亚洲精品在线视频观看| 欧美三级午夜理伦三级小说| 国产日本欧美一区二区三区在线| 暧暧视频在线免费观看| 日韩有码在线电影| 欧美一区二区视频| 欧美不卡一区二区三区| 九九热最新视频| 亚洲成人综合在线| 日韩欧美国产成人精品免费| 久久久国产精华| 久久久久久久穴| 久久精品99国产精品日本| 日批视频在线免费看| 欧美午夜一区二区福利视频| 亚洲国产精品www| 亚洲女娇小黑人粗硬| 国产日韩三区| 亚洲国产中文在线| 成人免费淫片aa视频免费| 中文字幕av一区二区三区佐山爱| 欧美激情第三页| 快射av在线播放一区| 亚洲欧美日韩直播| 天天操天天操天天干| 日韩欧美一二区| 一区二区三区亚洲视频| 在线国产亚洲欧美| 黄色在线免费观看| 欧美日韩激情视频| 国产在线成人精品午夜| 亚洲男人的天堂av| 中文字幕电影av| 国产精品久久一卡二卡| 手机看片国产日韩| 国产喷白浆一区二区三区| 超碰97人人干| 久久综合久久99| 亚洲a v网站| 久久夜色精品国产欧美乱极品| av在线播放网址| 成人av资源在线| 国产chinese中国hdxxxx| 粉嫩av一区二区三区| 日本xxxx免费| 成人av第一页| 欧美精品欧美极品欧美激情| 99re视频精品| 国产艳俗歌舞表演hd| 久久久久国产精品厨房| 91精品人妻一区二区| 久久免费视频一区| 一区二区黄色片| 国产免费久久精品| 亚洲一级二级片| 亚洲欧美另类久久久精品2019| 波多野结衣亚洲一区二区| 亚洲欧美日韩电影| 久草资源在线视频| 五月天一区二区三区| 久久久久久91亚洲精品中文字幕| 色综合久久99| 91成年人视频| 91精品国产综合久久久久久 | 夜夜春亚洲嫩草影视日日摸夜夜添夜| 波多野结衣在线播放一区| 一区二区三区国| 欧美日本中文| 日本一区二区黄色| 免费不卡在线视频| 爱情岛论坛亚洲自拍| 成人av电影在线网| 亚洲精品91在线| 亚洲色图欧洲色图| 国产在线一区视频| 色老综合老女人久久久| 在线播放亚洲精品| 精品国产乱码久久久久久蜜臀| 五月婷婷伊人网| 色噜噜国产精品视频一区二区 | 热re91久久精品国99热蜜臀| 国外成人福利视频| 99在线首页视频| 国产成人黄色| 成人高清dvd| 丝瓜av网站精品一区二区| 欧美国产日韩在线视频| 91在线国产观看| 人人澡人人澡人人看| 亚洲成人av福利| 中文字幕视频二区| 精品国产成人系列| 日本在线视频网| 欧美一级免费看| 高清一区二区中文字幕| 免费看成人午夜电影| 欧美一区高清| 美女一区二区三区视频| www.亚洲在线| 国产精品视频看看| 日韩欧美在线视频| 成人高潮片免费视频| 中文字幕在线成人| 在线免费看h| av在线不卡观看| 色999国产精品| 日本中文字幕片| 国产成人日日夜夜| 精品在线观看一区| 色香蕉成人二区免费| 好吊色在线观看| 久久久精品欧美| jizz欧美| 欧洲视频一区二区三区| 国产欧美二区| 国产成人av免费观看| 国产精品全国免费观看高清| 成人毛片在线播放| 亚洲成人在线视频播放| 青青草原av在线| 91美女片黄在线观看游戏| 欧美综合久久| 青青青在线视频免费观看| 26uuu国产一区二区三区| 国产污视频在线观看| 日韩欧美在线123| 二区三区四区高清视频在线观看| 国产精品美女久久久久av超清| 日韩精品免费一区二区夜夜嗨| 91成人综合网| 国产91丝袜在线18| 欧美成人精品一区二区免费看片 | 免费观看的毛片| 欧美成人精品在线观看| 成人在线分类| 中文字幕一区二区三区在线乱码| 日韩av网站免费在线| 能直接看的av| 欧美日韩高清一区二区不卡| 亚洲视频tv| 国产有码在线一区二区视频| 全球成人免费直播| 亚洲精品午夜在线观看| 国产精品青草久久| 中文字幕乱码在线观看| 中文字幕亚洲国产| 日韩有码欧美| 欧美少妇一区二区三区| 国产精品一卡二卡在线观看| 免费一级片视频| 亚洲精品成人久久电影| 亚洲黄色免费av| 亚洲高清视频在线观看| 韩国成人福利片在线播放| 国产97免费视频| 精品国产制服丝袜高跟| а√天堂中文在线资源8| 久久天堂国产精品| 日韩精品五月天| 欧洲美熟女乱又伦| 3d动漫精品啪啪一区二区竹菊| 91蜜桃在线视频| 国产精品一级久久久| 欧美亚洲网站| 手机免费观看av| 日韩网站在线看片你懂的| 欧美理论电影| 欧美日韩一区二| 老司机精品视频一区二区三区| 国产盗摄一区二区三区在线| 亚洲国产精品va在线观看黑人| 中文字幕资源网在线观看免费| 亚洲高清视频一区二区| 国产成a人亚洲精品| 日韩电影在线观看一区二区| 日韩专区在线播放| 老司机在线精品视频| 亚洲黄色av网址| 亚洲精品免费播放| 欧美偷拍视频| 亚洲va久久久噜噜噜久久天堂| 在线观看视频日韩| 性猛交娇小69hd| 日韩欧美高清一区| 成人私拍视频| 久久av喷吹av高潮av| 91玉足脚交白嫩脚丫在线播放| 美女黄页在线观看| 性亚洲最疯狂xxxx高清| 人人狠狠综合久久亚洲婷婷| 国产精品日日摸夜夜爽| 在线观看不卡一区| 大黄网站在线观看| 亚洲春色在线视频| 91免费国产在线| 精品人妻伦一二三区久久 | 免费看日产一区二区三区| 欧洲av无码放荡人妇网站| 亚洲精品一二三| h视频在线播放|