精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI官宣開源Transformer Debugger!不用寫代碼,人人可以破解LLM黑箱

人工智能
研究人員于是在訓練期間「重采樣」這些死神經元,允許模型代表給定的自動編碼器隱藏層維度的更多特征,從而產生更好的結果。

AGI真的越來越近了!

為了確保人類不被AI殺死,在解密神經網絡/Transfomer黑箱這一方面,OpenAI從未停下腳步。

去年5月,OpenAI團隊發布了一個令人震驚的發現:GPT-4竟可以解釋GPT-2的三十萬神經元!

網友紛紛驚呼,智慧原來是這個樣子。

圖片圖片

而就在剛剛,OpenAI超級對齊團隊負責人又正式官宣,要開源內部一直使用的大殺器——Transformer調試器(Transformer Debugger)。

簡之,研究者可以用TDB工具分析Transformer的內部結構,從而對小模型的特定行為進行調查。

圖片圖片

也就是說,有了這個TDB工具,未來它就可以幫我們剖析和分析AGI了!

圖片圖片

Transformer調試器將稀疏自動編碼器,與OpenAI開發的「自動可解釋性」——即用大模型自動解釋小模型,技術相結合。

鏈接:OpenAI炸裂新作:GPT-4破解GPT-2大腦!30萬神經元全被看透

圖片圖片

論文地址:https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html#sec-intro

值得一提的是,研究人員不用寫代碼,就能快速探索LLM的內部構造。

比如,它可以回答「為什么模型會輸出token A而不是token B」,「為什么注意力頭H會關注token T」之類的問題。

圖片圖片

因為TDB能支持神經元和注意力頭,所以就可以讓研究人員通過消融單個神經元來干預前向傳遞,并觀察發生的具體變化。

不過根據Jan Leike的說法,這個工具現在還只是一個早期的版本,OpenAI放出來是希望更多的研究人員能夠用上,并且在現有基礎上進一步改進。

圖片圖片

項目地址:https://github.com/openai/transformer-debugger

工作原理

要理解這個Transformer Debugger的工作原理,需要回顧OpenAI在2023年5月份放出的一份和對齊有關的研究。

圖片

TDB工具是基于此前發布的兩項研究,不會發布論文

簡單來說,OpenAI希望用參數更大能力更強的模型(GPT-4)去自動分析小模型(GPT-2)的行為,解釋它的運行機制。

圖片圖片

當時OpenAI研究的初步結果是,參數比較少的模型容易被理解,但是隨著模型參數變大,層數增加,解釋的效果會暴降。

圖片圖片

當時OpenAI在研究中稱,限于GPT-4本身設計就不是用來解釋小模型行為的,所以整體上對于GPT-2的解釋成果還很差。

圖片圖片

未來需要開發出能夠更好地解釋模型行為的算法和工具。

而現在開源的Transformer Debugger,就是OpenAI在之后這一年的階段性成果。

而這個「更好的工具」——Transformer Debugger,就是將「稀疏自動編碼器」結合進這個「用大模型解釋小模型」的技術線路中去。

然后再將之前OpenAI在可解釋性研究中用GPT-4解釋小模型的過程零代碼化,從而大大降低了研究人員上手的門檻。

GPT-2 Small被看穿了

在GitHub項目主頁,OpenAI團隊成員通過視頻介紹了最新Transformer調試器工具。

與Python調試器類似,TDB可以讓你逐步查看語言模型輸出、跟蹤重要激活并分析上游激活。

進入TDB主頁,首先是「提示」一欄輸入——提示和感興趣的token:

Mary and Johon went to the store, Johon gave a drink to....

那么接下來,就是做一個「下一詞」的預測,需要輸入目標token,以及干擾性的token。

最后提交后,便可以看到系統給出的預測下一詞候選的對數。

下面的「節點表」是TDB的核心部分。這里的每一行都對應一個節點,也就是激活一個模型組件。

圖片圖片

如果要了解對某個特定提示中非常重要的注意力頭的功能,直接點擊組件的名稱。

然后TDB會打開「神經元瀏覽器 」頁面,頂部會顯示之前的提示詞。

圖片圖片

這里能看到淺藍色和粉色的token。每個對應顏色的token之下,從后續標記到這個token的注意力會讓一個大范數向量(large norm vector)被寫入后續token中。

圖片圖片

在另外兩個視頻中,研究人員介紹了TDB的概念,以及其在理解回路中的應用。與此同時,他還演示了TDB如何定性地再現論文中的一個發現。

OpenAI自動可解釋性研究

簡單來說,OpenAI自動可解釋性研究的思路是讓GPT-4對神經元的行為進行自然語言解釋,然后把這個過程應用到GPT-2中。

這何以成為可能?首先,我們需要「解剖」一下LLM。

像大腦一樣,它們由「神經元」組成,它們會觀察文本中的某些特定模式,這就會決定整個模型接下來要說什么。

比如,如果給出這么一個prompt,「哪些漫威超級英雄擁有最有用的超能力?」 「漫威超級英雄神經元」可能就會增加模型命名漫威電影中特定超級英雄的概率。

OpenAI的工具就是利用這種設定,把模型分解為單獨的部分。

第一步:使用GPT-4生成解釋

首先,找一個GPT-2的神經元,并向GPT-4展示相關的文本序列和激活。

然后,讓GPT-4根據這些行為,生成一個可能的解釋。

比如,在下面的例子中GPT-4就認為,這個神經元與電影、人物和娛樂有關。

圖片圖片

第二步:使用GPT-4進行模擬

接著,讓GPT-4根據自己生成的解釋,模擬以此激活的神經元會做什么。

圖片圖片

第三步:對比打分

最后,將模擬神經元(GPT-4)的行為與實際神經元(GPT-2)的行為進行比較,看看GPT-4究竟猜得有多準。

圖片圖片

還有局限

通過評分,OpenAI的研究者衡量了這項技術在神經網絡的不同部分都是怎樣的效果。對于較大的模型,這項技術的解釋效果就不佳,可能是因為后面的層更難解釋。

圖片圖片

目前,絕大多數解釋評分都很低,但研究者也發現,可以通過迭代解釋、使用更大的模型、更改所解釋模型的體系結構等方法,來提高分數。

現在,OpenAI正在開源「用GPT-4來解釋GPT-2中全部307,200個神經元」結果的數據集和可視化工具,也通過OpenAI API公開了市面上現有模型的解釋和評分的代碼,并且呼吁學界開發出更好的技術,產生得分更高的解釋。

此外,團隊還發現,越大的模型,解釋的一致率也越高。其中,GPT-4最接近人類,但依然有不小的差距。

圖片圖片

以下是不同層神經元被激活的例子,可以看到,層數越高,就越抽象。

圖片圖片

圖片圖片

圖片圖片

圖片圖片

稀疏自動編碼器設置

OpenAI使用的的稀疏自動編碼器是一個在輸入端具有偏置的模型,還包括一個用于編碼器的具有偏置和ReLU的線性層,以及另一個用于解碼器的線性層和偏置。

研究人員發現偏置項對自動編碼器的性能非常重要,他們將輸入和輸出中應用的偏差聯系起來,結果相當于從所有激活中減去固定偏差。

研究人員使用Adam優化器訓練自動編碼器,以使用MSE重建Transformer的MLP激活。使用MSE損耗可以避免多語義性的挑戰,用損失加上L1懲罰項來鼓勵稀疏性。

在訓練自動編碼器時,有幾個原則非常重要。

首先是規模。在更多數據上訓練自動編碼器會使特征主觀上“更清晰”且更具可解釋性。所以OpenAI為自動編碼器使用了80億個訓練點。

其次,在訓練過程中,一些神經元會停止激活,即使在大量數據點上也是如此。

研究人員于是在訓練期間「重采樣」這些死神經元,允許模型代表給定的自動編碼器隱藏層維度的更多特征,從而產生更好的結果。

判斷指標

怎樣判斷自己的方法是否有效?在機器學習中可以簡單地用loss作為標準,但在這里就不太容易找到類似的參考。

比如尋找一個基于信息的指標,這樣可以在某種意義上說,最好的分解是最小化自動編碼器和數據總信息的分解。

——但事實上,總信息通常與主觀特征可解釋性或激活稀疏性無關。

最終,研究人員使用了了幾個附加指標的組合:

- 手動檢查:特征是否看起來可以解釋?

- 特征密度:實時特征數量和觸發它們的token的百分比是一個非常有用的指導。

- 重建損失:衡量自動編碼器重建MLP激活的程度。最終目標是解釋MLP層的功能,因此MSE損耗應該很低。

- 玩具模型:使用一個已經非常了解的模型,可以清晰地評估自動編碼器的性能。

不過研究人員也表示,希望從Transformer上訓練的稀疏自動編碼器中,為字典學習解決方案確定更好的指標。

參考資料:

https://twitter.com/janleike/status/1767347608065106387?s=20

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-03-13 08:03:44

LLM人工智能技術

2024-12-05 08:30:00

2025-02-21 15:18:20

2023-12-01 14:34:42

AnthropicAILLM

2024-03-12 12:17:06

AI數據

2024-11-27 14:30:46

2024-08-01 09:30:00

2024-05-08 14:12:40

Redis軟件開源

2024-03-12 13:14:40

2018-04-17 11:47:06

if代碼參數

2024-09-11 14:40:00

OpenAI奧特曼

2024-02-05 13:34:16

模型訓練

2024-05-15 10:38:55

OpenAIGPT-4oIlya

2023-07-25 14:08:41

羊駝模型

2024-08-06 14:07:40

2024-04-02 11:37:59

2025-08-06 07:42:26

2023-08-17 13:35:44

OpenAI收購

2025-04-01 09:46:08

2019-01-29 11:58:15

996工作制員工
點贊
收藏

51CTO技術棧公眾號

美女100%一区| 北条麻妃在线| 在线精品观看| 日韩av在线网址| 国产激情在线观看视频| 污视频网站免费在线观看| 制服丝袜在线播放| 成人在线综合网| 性亚洲最疯狂xxxx高清| 小毛片在线观看| 日韩电影免费观| 中文字幕在线一区免费| 99久久精品久久久久久ai换脸| 日本三级理论片| 国产一区二区三区四区五区| 欧美日韩黄色影视| 日本a在线免费观看| 黄视频在线观看免费| 国产一区二区成人久久免费影院| 欧美激情在线播放| 少妇精品无码一区二区免费视频| 国产精品一区二区三区av| 亚洲成人免费视| 五码日韩精品一区二区三区视频| 国产wwwwwww| 丝袜美腿亚洲色图| 色综合久久中文字幕综合网小说| 亚洲第九十七页| 国产精品欧美一区二区三区不卡| 欧美日韩中文字幕| 日韩中文在线字幕| 岛国在线视频| 成年人网站91| 国产精品影片在线观看| 久久午夜免费视频| 亚洲中无吗在线| 一区二区欧美在线| 久久久久久久久免费看无码 | 欧美裸体xxxx极品少妇| 国产123在线| 日韩美女国产精品| 欧美zozozo| 日韩欧美理论片| 成人在线中文| 91福利国产成人精品照片| 欧美激情亚洲天堂| av在线free| 国产精品日韩成人| 欧美一二三区| 头脑特工队2免费完整版在线观看| 国产精品影视网| 91精品久久久久久久久久入口 | 综合精品久久| 日韩在线视频国产| 极品人妻videosss人妻| 西野翔中文久久精品字幕| 亚洲精品在线观看网站| 四虎永久免费观看| 51精品国产| 日韩久久久久久| 操人视频免费看| 精品欧美视频| 日韩一区二区三区四区五区六区 | 中文在线资源| 狠狠做深爱婷婷久久综合一区 | 熟妇高潮精品一区二区三区| 91精品丝袜国产高跟在线| 91精品国产91久久久久久最新毛片 | 国产a久久精品一区二区三区| 精品区一区二区| 蜜桃色一区二区三区| 51社区在线成人免费视频| 欧美成人一区二区三区在线观看 | 丁香另类激情小说| 国产精品国产亚洲精品看不卡15| 精品国产一级片| 懂色av一区二区夜夜嗨| 国产精品手机视频| 三级视频网站在线| 国产精品天天看| 亚洲最大色综合成人av| 精产国品自在线www| 一区二区三区精密机械公司| 丰满少妇大力进入| 外国成人直播| 欧美日韩国产首页在线观看| 久久久久久久久久毛片| 亚洲大奶少妇| 日韩av在线免费| 在线视频第一页| 亚洲美女视频| 久久久久久国产精品三级玉女聊斋| 国产一级特黄a高潮片| 99热在线精品观看| 国产精品99久久久久久白浆小说| 中文字幕精品一区二区精| 精品一区二区三区在线播放| 91|九色|视频| 十九岁完整版在线观看好看云免费| 久久亚洲精品小早川怜子| 亚洲欧洲精品一区| av福利在线导航| 91国产免费看| 日本在线视频播放| 免费成人网www| 久久久精品国产| 国产在线观看黄色| 国产一区 二区 三区一级| 久久精品第九区免费观看| 日本蜜桃在线观看| 图片区小说区区亚洲影院| 香蕉视频禁止18| 国产精品极品| 色七七影院综合| 日本少妇久久久| 久久精品国产亚洲高清剧情介绍 | 精品一区二区三区四区| 中国1级黄色片| 影音先锋在线一区| 成人高清视频观看www| 色视频在线观看| 亚洲激情五月婷婷| 精品亚洲一区二区三区四区| 精品中国亚洲| 欧美精品在线极品| 一区二区视频网| 91亚洲永久精品| 国产91porn| 91精品店在线| 亚洲九九九在线观看| 免费在线观看av网址| 蜜桃视频第一区免费观看| 国产视频一区二区不卡| 国产淫片在线观看| 欧美日韩亚州综合| 性高潮久久久久久久| 亚洲黄色成人| 成人欧美一区二区| 黄在线免费观看| 欧美三级电影网站| 国产精品815.cc红桃| 亚洲激情综合| 不卡视频一区| 成人福利网站| 欧美精品亚洲二区| 五月婷婷欧美激情| 视频一区二区欧美| 免费国产一区二区| 午夜欧美激情| 日韩av最新在线观看| 国产真实夫妇交换视频| 国产精品一二三在| www.黄色网址.com| 亚洲综合资源| 久蕉依人在线视频| 久久成人综合| 日本亚洲欧洲色α| 好男人www在线视频| 亚洲欧美偷拍三级| 久久人人爽人人爽人人片av高清| 日本视频免费观看| 99r国产精品| 一二三四视频社区在线| 超碰在线成人| 久久久久久91香蕉国产| 亚洲成人中文字幕在线| 亚洲精品日韩一| 宇都宫紫苑在线播放| 女人天堂亚洲aⅴ在线观看| 亚洲精品欧美日韩| 尤物yw193can在线观看| 欧美成人精品福利| 国产无码精品视频| 99久久国产综合精品色伊 | 精品人妻一区二区三区含羞草| 亚洲婷婷综合色高清在线| 日韩a一级欧美一级| 亚洲无中文字幕| aaa级精品久久久国产片| 欧美男男video| 欧美精品一区二区在线观看| 日韩精品视频免费看| 91尤物视频在线观看| 精品视频无码一区二区三区| 国产一区二区三区电影在线观看| 国产精品美女久久久久久免费| 日日夜夜精品一区| 日韩亚洲欧美一区二区三区| av资源吧首页| 久久久综合网站| 不卡的av中文字幕| 欧美日一区二区在线观看| 国产偷国产偷亚洲高清97cao| 悠悠资源网亚洲青| 最近2019中文字幕一页二页 | 爽爽淫人综合网网站| 一区二区不卡视频| 白白在线精品| 国产成+人+综合+亚洲欧洲 | 国产黑丝在线一区二区三区| 女人被男人躁得好爽免费视频| 欧美人妖视频| 国产精品久久一区| 欧美理论电影| 在线播放精品一区二区三区| 国产毛片久久久久| 狠狠色狠狠色综合日日小说| www.99re6| 成人av网址在线观看| 国产免费999| 欧美三级午夜理伦三级中文幕| 免费久久99精品国产自| 国产精品美女久久久久人| 4k岛国日韩精品**专区| 黄色在线免费| 精品五月天久久| 国产精品视频在线观看免费| 欧美日韩亚洲精品一区二区三区| 欧美日韩色视频| 久久久青草青青国产亚洲免观| 国产91在线免费观看| 日韩电影免费一区| av在线播放亚洲| 国产韩日影视精品| 日本一区二区不卡高清更新| www.爱久久| 91性高湖久久久久久久久_久久99| 蜜桃在线视频| 欧美理论电影在线观看| 91亚洲欧美| 亚洲日本成人网| 黄色一级大片在线免费看国产一| 欧美四级电影网| www.日本精品| 亚洲愉拍自拍另类高清精品| chinese全程对白| 久久九九全国免费| www.88av| 成人深夜在线观看| 久久黄色一级视频| 久久爱www久久做| 三级a在线观看| 羞羞答答国产精品www一本| 少妇久久久久久被弄到高潮| 欧美电影免费播放| 手机看片福利永久国产日韩| 色先锋久久影院av| 国产九色91| 91蜜桃臀久久一区二区| 91天堂在线观看| 午夜精品久久久久久毛片| 国产精品免费看久久久香蕉 | 一区二区欧美视频| 暗呦丨小u女国产精品| 中文字幕色av一区二区三区| 久久视频一区二区三区| 中文字幕欧美国产| 99自拍偷拍视频| 国产精品亲子乱子伦xxxx裸| 国产黄色大片免费看| 国产亚洲成年网址在线观看| wwwwww日本| 久久久五月婷婷| 特级西西www444人体聚色 | 国产成人免费在线观看视频| 国产欧美综合在线观看第十页| 久久久久久国产精品无码| 久久久久久久网| 三年中国中文观看免费播放| 国产精品乱人伦一区二区| 日韩亚洲欧美中文字幕| 亚洲欧美精品午睡沙发| 久久久精品视频在线| 婷婷夜色潮精品综合在线| 免费看毛片网站| 欧美日韩一级片网站| 国产乱淫a∨片免费视频| 日韩一区二区精品在线观看| 男人天堂网在线视频| 亚洲精品美女在线观看| 二区三区在线| 不卡中文字幕av| 国产夫妻在线| 国产精品成人v| 亚洲伦理一区二区| 国严精品久久久久久亚洲影视| 国产不卡一区| 日韩video| 99亚洲视频| 五月天亚洲视频| 国产剧情一区二区三区| 在线观看国产免费视频| 欧美精彩视频一区二区三区| 天天鲁一鲁摸一摸爽一爽| 亚洲综合激情另类小说区| 美女又爽又黄免费视频| 欧美区一区二区三区| 黑人精品一区二区| 亚洲午夜精品久久久久久性色| 欧美高清视频| 久久久久久国产| 欧美最新精品| 亚洲自拍偷拍网址| 妖精视频一区二区三区免费观看| 亚洲精品人成| 亚洲三级影院| jizz欧美性11| 成人国产免费视频| 麻豆一区在线观看| 婷婷丁香久久五月婷婷| 亚洲一区二区视频在线播放| 亚洲成人免费网站| 日本在线看片免费人成视1000| 久久久久久久一区二区三区| 成人福利一区二区| 国产一区二区免费电影| 色综合咪咪久久网| 欧美日韩国产精品激情在线播放| 国产一区不卡视频| 日韩视频在线观看免费视频| 亚洲国产综合色| 国产精品永久久久久久久久久| 亚洲精品自拍视频| 在线中文字幕电影| 国产精品亚洲自拍| 亚洲丁香日韩| 久草免费福利在线| 狠狠v欧美v日韩v亚洲ⅴ| 91视频在线网站| 亚洲福利视频一区| 精品国产99久久久久久宅男i| 亚洲桃花岛网站| cao在线视频| 91国产在线播放| 欧美gvvideo网站| 日本中文字幕片| av欧美精品.com| 久久视频免费在线观看| 日韩一区二区免费在线电影| 思思99re6国产在线播放| 日本国产高清不卡| 日韩精品福利一区二区三区| 欧美一级爱爱视频| 国产在线国偷精品产拍免费yy| 99在线视频免费| 日本韩国欧美一区二区三区| 亚洲精品国产av| 美女av一区二区三区| 国产成年精品| 色中文字幕在线观看| 六月丁香婷婷久久| 亚洲综合图片一区| 精品污污网站免费看| 超碰国产在线| 国产精品丝袜视频| 第一会所亚洲原创| 日日噜噜噜噜久久久精品毛片| 国产色产综合色产在线视频| 欧美一区二区三区不卡视频| 亚洲欧美日韩成人| 一呦二呦三呦精品国产| 日韩欧美视频一区二区三区四区| 日韩专区在线视频| 欧美xxxx精品| 欧美电影一区二区三区| av文字幕在线观看| 99r国产精品视频| 在线播放精品| 一区二区视频观看| 91国偷自产一区二区开放时间 | 成人深夜福利| 一区二区三区av在线| 国产在线精品不卡| 国产第一页在线播放| 日韩高清免费观看| 少妇精品视频一区二区免费看| 亚洲精品二区| 国产另类ts人妖一区二区| 国产一级视频在线观看| 亚洲美女性视频| 色综合天天色| 超碰在线免费观看97| 国产99久久久国产精品潘金| 国产成人无码精品久在线观看| 日韩精品中文在线观看| 久久久久久久性潮| 国产又粗又猛又爽又黄的网站| 国产69精品一区二区亚洲孕妇| 在线观看免费国产视频| 国产亚洲激情视频在线| 99久久99九九99九九九| 日韩av高清在线看片| 国产午夜久久久久| 成人黄色免费视频| 欧美在线性爱视频| 一本一道久久综合狠狠老| 偷偷色噜狠狠狠狠的777米奇| 在线视频一区二区三| 日韩伦理电影网站| 日本一区二区三区www|