精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI最強競品訓練AI拆解LLM黑箱,意外窺見大模型「靈魂」

人工智能
Anthropic的模型可解釋性團隊,從大模型中看到了它的「靈魂」——一個可解釋的更高級的模型。

為了拆開大模型的「黑箱」,Anthropic可解釋性團隊發表了一篇論文,講述了他們通過訓練一個新的模型去理解一個簡單的模型的方法。

Anthropic發表的一項研究聲稱能夠看到了人工智能的靈魂。它看起來像這樣:

圖片圖片

圖片圖片

論文地址:https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa

在研究者看來,這個新的模型能準確地預測和理解原本模型中神經元的工作原理和組成機制。

Anthropic的可解釋性團隊最近宣布他們成功分解了一個模擬AI系統中的抽象高維特征空間。

創建一個可解釋的AI去理解「AI黑盒」

研究人員首先訓練了一個非常簡單的512神經元AI來預測文本,然后訓練了另一個名為「自動編碼器」的AI來預測第一個AI的激活模式。

自動編碼器被要求構建一組特征(對應更高維度AI中的神經元數量),并預測這些特征如何映射到真實AI中的神經元。

結果發現,盡管原始AI中的神經元本身不易理解,但是新的AI中的這些模擬神經元(也就是「特征」)是單義的,每特征都表示一個指定的概念或功能。

例如,特征#2663代表「God」這個概念。

圖片圖片

激活它的訓練語句中最強的一條來自「Josephus」的記錄中「當God降下暴雪時,他前往Sepphoris」。

可以看到頂端的激活都是關于「God」的不同用法。

這個模擬神經元似乎是由一組真實神經元(包括407,182和259)組成的。

這些真實神經元本身與「God」沒有太大關系,例如神經元407主要對非英語(尤其是重音拉丁字母)和非標準文本(如HTML標簽)有響應。

但是在特征層面,一切都是井井有條的,當特征2663被激活時,它會增加文本中出現「bless」、「forbid」、「damn」或「-zilla」的概率。

這個AI并沒有將「God」這個概念與怪獸名字中的「God」區分開來。這可能是因為這個簡易AI沒有足夠的神經元資源來專門處理這個事。

但隨著AI具備的特征數量增加,這種情況會發生改變:

圖片圖片

在這棵樹的底部,你可以看到當這個AI具有越來越多的特征時,它在數學術語中對「the」的理解是如何變化的。

首先,為什么會有一個數學術語中「the」的特定特征?這很可能是由于AI的預測需求——知道某些特定的「the」之后應該會跟隨一些數學詞匯,比如「numerator」或者「cosine」。

在研究人員訓練的最小的那個只有512個特征的AI中,只有一個表示「the」的特征,而在具有16384個特征的最大AI中,這個特征已經分支出了一個表示機器學習中「the」的特征,一個表示復分析中「the」的特征,以及一個表示拓撲學和抽象代數中「the」的特征。

因此,如果能將系統升級到一個具有更多模擬神經元的AI,那表示「God」的特征很可能會分裂成兩個——一個表示宗教中「God」的含義,另一個表示怪獸名字中「God」的含義。

后來,可能會有基督教中的God、猶太教中的God、哲學中的God等等。

研究小組對412組真實神經元和相應的模擬神經元進行了主觀可解釋性評估,發現模擬神經元的可解釋性整體上比較好:

圖片圖片

一些特征,比如表示「God」的特征,是用于特定概念的。

許多其他高度可解釋的特征,包括一些最可解釋的,是用于表示文本的「格式」,比如大寫或小寫字母、英語或其他字母表等。

圖片圖片

這些特征有多常見呢?也就是說,如果你在相同的文本數據上訓練兩個不同的4096個特征的AI,它們會有大部分相同的4096個特征嗎? 它們會都有某些代表「God」的特征嗎?

或者第一個AI會將「God」和「哥斯拉」放在一起,而第二個AI會將它們分開?第二個AI是否就完全不會有表示「God」的特征,而是用那個空間存儲一些第一個AI不可能理解的其他概念?

研究小組進行了測試,發現他們的兩個AI模型是非常相似的!

平均而言,如果第一個模型中有一個特征,第二個模型中最相似的特征會有0.72的中值相關性。

圖片圖片

看到了AI的靈魂

后續的工作將是什么呢?

今年五月,OpenAI試圖讓GPT-4(非常大)理解GPT-2(非常小)。他們讓GPT-4檢查了GPT-2的個307200個神經元,并報告它發現的內容。

GPT-4找到了一系列有趣的結果和一堆隨機廢話,因為他們還沒有掌握將真實神經元投射到模擬神經元并分析模擬神經元的技巧。

盡管結果效果不明顯,但這確實是非常雄心勃勃的嘗試。

與Anthropic可解釋性文章中的這個AI不同,GPT-2是一個真實的(盡管非常小)AI,曾經也給大眾留下了深刻印象。

但是研究的最終目的是要能夠解釋主流的AI系統。

Anthropic的可解釋性團隊承認他們還沒有做到這一點,主要基于以下幾個原因:

首先,擴大自動編碼器的規模是一個很困難的事情。為了解釋GPT-4(或Anthropic的等效系統Claude)這樣的系統,你需要一個差不多同樣大小的解釋器AI。

但是訓練這樣規模的AI需要巨大的算力和資金支持。

其次,解釋的可擴展性也是一個問題。

即使我們找到了所有關于God、哥斯拉以及其他一切的模擬神經元,并畫出它們之間如何相連的巨大關系圖。

研究人員任然需要回答一些更復雜的問題,解決這些問題需要涉及成百上千萬的特征和連接的復雜交互。

所以需要一些自動化的流程,也就是某種更大規模的「讓GPT-4告訴我們GPT-2在做什么」。

最后,所有這些對理解人類大腦有什么啟發?

人類也使用神經網絡進行推理和處理概念。

人類大腦中有很多神經元,這一點和GPT-4是一樣的。

人類獲得的數據也非常稀疏——有很多概念(如烏賊)在日常生活中很少出現。

我們是否也在模擬一個更大的大腦?

目前這還是一個非常新的研究領域,但已經有一些初步的發現,表明人類視覺皮層中的神經元確實以某種超定位的方式編碼特征,與AI模型中觀察到的模式相似。

參考資料:https://transformer-circuits.pub/2023/monosemantic-features/index.html#phenomenology-fsa

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-08-24 09:24:07

2023-05-22 09:19:19

2023-09-09 06:56:55

螞蟻集團開源AI

2024-03-12 13:33:40

2024-02-04 13:56:03

2023-08-08 13:43:57

人工智能智能體GPU

2023-04-21 10:14:22

開源AI

2025-04-01 09:54:09

AI算法大模型AI

2024-04-03 12:48:00

2024-07-12 14:53:42

2025-02-21 13:45:00

2025-01-09 08:01:10

2020-08-26 11:50:25

谷歌開源工具

2020-05-06 11:04:52

Elasticsear架構運維

2024-03-05 09:16:32

AI模型GPT-4

2023-10-06 20:30:33

大模型LLMtoken

2025-08-01 09:41:52

2025-09-12 16:13:12

2023-10-16 12:51:32

點贊
收藏

51CTO技術棧公眾號

92看片淫黄大片欧美看国产片| 伊人伊成久久人综合网站| 99er在线视频| 极品白浆推特女神在线观看| 精品影视av免费| 欧美—级a级欧美特级ar全黄| 亚洲熟妇无码av| 亚洲青青一区| 午夜不卡av在线| 亚洲综合第一| 四虎影视在线观看2413| 久久精品国内一区二区三区| 久久久在线视频| 国产又粗又猛又爽又黄的视频小说 | 亚洲日本视频在线| 欧美在线免费播放| www.成年人视频| 天天在线视频色| 97se狠狠狠综合亚洲狠狠| 91人人爽人人爽人人精88v| 国产www在线| 国产精品va| 草民午夜欧美限制a级福利片| 成人乱码一区二区三区av| 日韩三级av高清片| 欧美日韩的一区二区| 丰满人妻中伦妇伦精品app| 四虎av在线| 涩涩视频在线观看| 精品久久久网| 精品久久香蕉国产线看观看gif| 国内外成人激情免费视频| 国产在线一在线二| gogo大胆日本视频一区| 亚洲精品欧美一区二区三区| 久久久999久久久| 国产精品普通话对白| 欧美激情免费视频| 日韩欧美综合视频| 91精品秘密在线观看| 色阁综合伊人av| 亚洲国产日韩一区无码精品久久久| 波多野结衣欧美| 精品日韩欧美一区二区| 奇米777在线| 91成人app| 欧美一级免费观看| 久久精品亚洲天堂| 日本久久久久| 欧美精品日日鲁夜夜添| 天天干天天操天天玩| 91久久久久久白丝白浆欲热蜜臀| 91久久精品一区二区三区| 免费无码av片在线观看| 中文字幕在线中文字幕在线中三区 | 日韩最新免费不卡| 91成人在线播放| 色婷婷国产精品免| 成人免费看片39| 色爱av美腿丝袜综合粉嫩av| 强制高潮抽搐sm调教高h| 欧美激情另类| 久久国产精品视频| 欧美成人黄色网| 黄色在线成人| 国产69精品久久久久9| 日韩av一二三区| 亚洲欧美成人综合| 日本精品久久久久影院| 精品一区二区无码| 麻豆精品在线看| 97久久夜色精品国产九色| 亚洲国产精品久久人人爱潘金莲| 成人av资源网站| 欧美成ee人免费视频| 国产精品天堂| 专区另类欧美日韩| 六月婷婷激情综合| 625成人欧美午夜电影| 在线亚洲一区观看| 九一精品久久久| 国产成人夜色高潮福利影视| 日韩精品福利网站| 国产精品视频在| 欧美先锋影音| 全亚洲最色的网站在线观看| 一级黄色小视频| 国产成人av电影在线| 欧美主播一区二区三区美女 久久精品人 | 国产一区二区三区高清播放| 激情久久av| av电影在线观看| 亚洲自拍偷拍图区| 日本熟妇人妻xxxxx| 天天干在线影院| а√中文在线8| 精品美女国产在线| 日本人69视频| 色综合www| www.日韩不卡电影av| 日本熟妇毛耸耸xxxxxx| 美国毛片一区二区三区| 精品国产二区在线| 视频三区在线| 欧美午夜影院在线视频| 国产又粗又猛又爽又黄| 精品久久中文| 午夜精品一区二区三区在线 | heyzo中文字幕在线| 在线观看亚洲a| 亚洲中文字幕无码一区| 欧美va久久久噜噜噜久久| 97人人模人人爽人人喊中文字| 一级做a爱片性色毛片| 2024国产精品视频| 青青草视频国产| 24小时成人在线视频| 国产亚洲成av人片在线观看桃| 免费在线观看一级片| 免费av成人在线| 久久偷窥视频| 96av在线| 日韩一级黄色片| 二区三区四区视频| 久久婷婷麻豆| 久久久久久精| 精精国产xxx在线视频app| 日韩精品一区二区三区四区视频| 女人裸体性做爰全过| 久久久久久自在自线| 国产一区二区三区色淫影院| 色图在线观看| 欧美一级二级在线观看| 成人涩涩小片视频日本| 久久福利视频一区二区| 亚洲国产一区二区在线| 日韩另类视频| 亚洲天堂影视av| 91黑人精品一区二区三区| 久久婷婷国产综合精品青草| 夫妻免费无码v看片| 久久动漫网址| 91黑丝高跟在线| 日韩有码第一页| 亚洲风情在线资源站| 91精品人妻一区二区三区蜜桃2| 婷婷中文字幕一区| 成人性生交大片免费看视频直播 | 午夜av一区二区| 毛茸茸free性熟hd| 在线视频精品| 欧美日韩高清免费| 国产经典一区| 在线观看日韩欧美| 亚洲一区二区影视| 自拍偷自拍亚洲精品播放| 亚洲精品无码久久久久久久| 欧美高清一区| 国产免费一区二区三区| 人成在线免费网站| 亚洲美女激情视频| 欧美性猛交xxxx乱大交hd| 欧美激情一区二区在线| 999久久久精品视频| 伊人久久大香线| 国产精品久久九九| a日韩av网址| 色婷婷av一区二区三区久久| 国产女无套免费视频| 一区二区三区在线观看视频| 无码成人精品区在线观看| 国产精品入口66mio| 视频一区二区在线| 精品午夜av| 91禁外国网站| 一级毛片视频在线观看| 欧美不卡视频一区| 欧产日产国产69| 中文字幕亚洲在| 蜜臀视频在线观看| 日韩高清不卡在线| 日本不卡一区二区三区四区| 福利在线一区| 国产精品亚洲片夜色在线| 伊人春色在线观看| 亚洲乱码av中文一区二区| 一级α片免费看刺激高潮视频| 尤物在线观看一区| 日本黄色网址大全| 国产乱码一区二区三区| 欧洲黄色一级视频| 五月开心六月丁香综合色啪| 国产亚洲精品自在久久| 欧美在线一级| 国内成人精品一区| 日本韩国在线视频爽| 亚洲国产欧美久久| 91丨porny丨在线中文| 亚洲超碰97人人做人人爱| 成人无码精品1区2区3区免费看| 成人免费电影视频| 九九热99视频| 久久久久国产一区二区| 日本a在线天堂| 成人免费av| 蜜桃精品久久久久久久免费影院 | 91精品国产品国语在线不卡| 久久久免费高清视频| 亚洲精品国产成人久久av盗摄 | 三级小视频在线观看| 欧美无人高清视频在线观看| 日韩黄色三级视频| 亚洲精品国产无天堂网2021| 国产精品麻豆免费版现看视频| 99精品偷自拍| 国产大学生av| 精品一区二区免费视频| 国产精品亚洲二区在线观看| 国产综合欧美| 日本一道在线观看| 成人中文在线| 激情小说综合区| 成人资源在线| 91嫩草免费看| 99精品女人在线观看免费视频| 国产精品国产自产拍高清av水多| 涩涩在线视频| 97久久精品人人澡人人爽缅北| 在线xxxx| 欧美成人精品激情在线观看| 久久精品视频免费看| 一本久久综合亚洲鲁鲁| 久久国产精品高清一区二区三区| 亚洲精品国产美女| 全部免费毛片在线播放一个| 欧美变态tickle挠乳网站| av男人天堂网| 久久青草免费| 亚洲精品美女在线观看播放| 国产高清在线观看视频| 欧美一区日本一区韩国一区| 国产精品一品二区三区的使用体验| 欧美日韩中文另类| 亚洲无码精品在线观看| 欧美日韩一区二区三区在线| 伊人网av在线| 欧美放荡的少妇| www.天堂在线| 欧美精品一区二区不卡| 神马一区二区三区| 亚洲国产小视频| 天堂在线一二区| 精品亚洲男同gayvideo网站 | 中文字幕亚洲欧美一区二区三区| 电影在线高清| 久久久精品2019中文字幕神马| 成人av福利| 久久免费视频网站| 国产理论在线| 日韩男女性生活视频| 欧美爱爱视频| 99久久99久久| 欧美调教视频| 欧美日韩一区在线视频| 日韩av有码| 久久亚洲国产成人精品无码区 | 一区二区成人在线观看| 日本一区二区免费在线观看| 好吊成人免视频| 久久久久久av无码免费看大片| 在线不卡欧美精品一区二区三区| 国产成人精品a视频| 亚洲福利视频久久| 国产免费永久在线观看| 精品国产欧美一区二区三区成人| 啦啦啦中文在线观看日本| 欧美亚洲在线观看| 日本免费成人| 国语精品中文字幕| 欧美伦理在线视频| 中文字幕乱码免费| a91a精品视频在线观看| 五月婷婷丁香色| 成人一级黄色片| 男人的天堂av网| 一区二区三区在线观看动漫| 美女又爽又黄免费视频| 91精品国产综合久久香蕉麻豆| 欧洲精品久久一区二区| 色噜噜狠狠狠综合曰曰曰| free性护士videos欧美| 国产精品一区久久久| 国产精品网址| 香蕉精品视频在线| 性xx色xx综合久久久xx| 成人高清在线观看视频| 久久久精品日韩欧美| 国产女人被狂躁到高潮小说| 一本大道久久a久久精二百| 99热这里只有精品99| 亚洲欧美在线磁力| 女囚岛在线观看| 国产欧美中文字幕| 欧美理伦片在线播放| 亚洲精品一区二区三区四区五区| 日韩亚洲精品在线| 色男人天堂av| 国产精品毛片久久久久久久| 国产又大又黄视频| 日韩精品资源二区在线| 秋霞午夜在线观看| 日本欧美黄网站| 精品一区二区男人吃奶| 一级二级三级欧美| 久久美女性网| 污污免费在线观看| 亚洲免费观看在线观看| 综合久久中文字幕| 亚洲美女性视频| 国产99在线| 97超级碰碰| 66视频精品| 天天干天天爽天天射| 久久久综合视频| 国产情侣在线视频| 精品女同一区二区| 丝袜综合欧美| 97视频中文字幕| 亚洲天堂免费| 8x8x成人免费视频| 国产精品三级在线观看| 天天爽夜夜爽人人爽| 精品伊人久久97| 美女的胸无遮挡在线观看 | 97人人精品| 另类小说第一页| 欧美韩国日本一区| 成年人晚上看的视频| 亚洲男人的天堂网站| 欧美粗大gay| 午夜一区二区三区| 美女一区二区三区在线观看| 国产又黄又粗视频| 欧美少妇一区二区| 欧美性猛交xxx乱大交3蜜桃| 成人av电影天堂| 天天综合网网欲色| 日本在线播放一区二区| 亚洲色图.com| xxxwww在线观看| 久久理论片午夜琪琪电影网| 欧美日韩精品一区二区三区在线观看| 老太脱裤子让老头玩xxxxx| 99这里只有精品| 黄色av一级片| 色偷偷88888欧美精品久久久| 婷婷丁香久久| av一区二区三区免费观看| 成人精品视频一区| 亚洲欧美精品一区二区三区| 一区二区欧美亚洲| 日韩专区视频网站| 人妻激情另类乱人伦人妻| 99re这里只有精品视频首页| 国产suv精品一区二区33| 中文一区二区视频| 日韩成人在线看| 欧美变态另类刺激| 中文字幕不卡在线观看| 国产老妇伦国产熟女老妇视频| 欧美国产日韩一区二区三区| 美国十次av导航亚洲入口| 日韩av播放器| 亚洲精品老司机| 你懂的好爽在线观看| 国产日韩在线播放| 国内视频精品| 免费一级做a爰片久久毛片潮| 欧美一级午夜免费电影| 国产伦理精品| 中文字幕中文字幕在线中一区高清| 成人av影院在线| 中文字幕你懂的| 久久久久成人精品| 欧美色图一区| 亚洲少妇中文字幕| 欧美日韩视频在线第一区| 久草在线视频网站| 日韩国产欧美一区| 国产99一区视频免费| 销魂美女一区二区| 欧美激情区在线播放| 欧洲激情综合| 国产乱淫av麻豆国产免费| 在线观看国产精品网站| 欧美hdxxxxx| 中文字幕一区二区三区最新 | 午夜一区二区三区| 北条麻妃一区二区三区| 一级二级三级视频|