精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI公開破解GPT-4思維的新方法,Ilya也參與了!

人工智能
OpenAI將其公開后,前超級對齊團隊成員、論文一作前來轉發分享:我們引入了一種基于TopK激活函數的新稀疏自編碼器訓練技術棧,消除了特征縮減問題,并允許直接設置L0。

OpenAI研究如何破解GPT-4思維,公開超級對齊團隊工作,Ilya Sutskever也在作者名單之列。

圖片

該研究提出了改進大規模訓練稀疏自編碼器的方法,并成功將GPT-4的內部表征解構為1600萬個可理解的特征。

由此,復雜語言模型的內部工作變得更加可理解。

圖片

其實,早在6個月前,研究就已經開始進行了:

圖片

OpenAI將其公開后,超級對齊團隊成員、論文一作前來轉發分享:

我們引入了一種基于TopK激活函數的新稀疏自編碼器訓練技術棧,消除了特征縮減問題,并允許直接設置L0。

我們發現這種方法在均方誤差/L0邊界上表現良好。即使在1600萬的規模下,也幾乎沒有失活的潛在單元(latent)

圖片

同樣在坐著名單里的、此前在OpenAI超級對齊團隊的Ilya同盟Jan Leike(就是從OpenAI憤而離職剛剛加入Anthropic的RLHF發明者之一)也表示:

這是一項重大的進步!稀疏自編碼器是目前用來真正理解模型內部思維的最好的方法。

圖片

更有意思的是,不久前Anthropic發了一項類似的工作。

成功從Claude 3.0 Sonnet的中間層提取了數百萬個特征,為其計算過程中的內部狀態提供了一個大致的概念性圖。

圖片

于是有網友就開麥了,工作牛是牛,但OpenAI是不是有點太著急了,論文鏈接沒有指向Arxiv,分析似乎也沒有那么深入。

是不是為了回應Anthropic的研究以及Jan Leike出走的事兒,誰知道呢?(doge)

圖片

回歸正題,OpenAI超級對齊團隊是如何想法子破解GPT-4思維的?

在OpenAI新公布研究中再見Ilya的名字

目前,語言模型神經網絡的內部工作原理仍是個“黑盒”,無法被完全理解。

為了理解和解釋神經網絡,首先需要找到對神經計算有用的基本構件。

然鵝,神經網絡中的激活通常表現出不可預測和復雜的模式,且每次輸入幾乎總會引發很密集的激活。而現實世界中其實很稀疏,在任何給定的情境中,人腦只有一小部分相關神經元會被激活。

圖片

由此,研究人員開始研究稀疏自編碼器,這是一種能在神經網絡中識別出對生成特定輸出至關重要的少數“特征”的技術,類似于人在分析問題時腦海中的那些關鍵概念。

它們的特征展示出稀疏的激活模式,這些模式自然地與人類易于理解的概念對齊,即使沒有直接的可解釋性激勵。

不過,現有的稀疏自編碼器訓練方法在大規模擴展時會面臨重建與稀疏性權衡、latent失活等問題。

在OpenAI超級對齊團隊的這項研究中,他們推出了一種基于TopK激活函數的新稀疏自編碼器(SAE)訓練技術棧,消除了特征縮小問題,能夠直接設定L0(直接控制網絡中非零激活的數量)。

該方法在均方誤差(MSE)與L0評估指標上表現優異,即使在1600萬規模的訓練中,幾乎不產生失活的潛在單元(latent)。

具體來看,他們使用GPT-2 small和GPT-4系列模型的殘差流作為自編碼器的輸入,選取網絡深層(接近輸出層)的殘差流,如GPT-4的5/6層、GPT-2 small的第8層。

并使用之前工作中提出的基線ReLU自編碼器架構,編碼器通過ReLU激活獲得稀疏latent z,解碼器從z中重建殘差流。損失函數包括重建MSE損失和L1正則項,用于促進latent稀疏性。

圖片

然后,團隊提出使用TopK激活函數代替傳統L1正則項。TopK在編碼器預激活上只保留最大的k個值,其余清零,從而直接控制latent稀疏度k。

圖片

不需要L1正則項,避免了L1導致的激活收縮問題。實驗證明,TopK相比ReLU等激活函數,在重建質量和稀疏性之間有更優的權衡。

圖片

此外,自編碼器訓練時容易出現大量latent永遠不被激活(失活)的情況,導致計算資源浪費。

團隊的解決方案包括兩個關鍵技術:

  • 將編碼器權重初始化為解碼器權重的轉置,使latent在初始化時可激活。
  • 添加輔助重建損失項,模擬用top-kaux個失活latent進行重建的損失。

如此一來,即使是1600萬latent的大規模自編碼器,失活率也只有7%。

團隊還提出了多重TopK損失函數的改進方案,提高了高稀疏情況下的泛化能力,并且探討了兩種不同的訓練策略對latent數量的影響,這里就不過多展開了。

圖片

為了證明該方法的可擴展性,團隊訓練了上述提到的一個具有1600萬個latent的稀疏自編碼器,并在GPT-4模型的激活上處理了40億個token。

在GPT-4激活上處理40億token

接下來,評估自編碼器質量的關鍵在于提取出的特征是否對下游應用任務有用,而不僅僅是優化重建損失和稀疏性。

因此,團隊提出了幾種評估自編碼器質量的新方法,包括:

  • 下游損失(Downstream Loss):評估自編碼器重建的latent對語言模型性能的影響。
  • 探測損失(Probe Loss):檢查自編碼器是否能夠恢復我們認為可能發現的特征。
  • 可解釋性(Explainability):評估自編碼器latent的激活是否能夠通過簡單且精確的解釋來理解。
  • 剔除稀疏性(Ablation sparsity):評估移除個別latent對下游預測的影響。

實驗發現,TopK自編碼器在下游損失上的改進幅度超過了重建MSE的改進。

圖片

探測損失隨latent數量增加而改善,但在某些區間會先升后降。

圖片

此外,研究人員發現精確度和召回率在latent數量較大、稀疏度適中時最優。

圖片

TopK模型相比ReLU模型有更高的召回率,能更好地壓制虛假激活。

圖片

剔除稀疏性方面(見上圖6 b),團隊發現自編碼器latent的影響較為稀疏,遠小于直接ablating殘差流通道。但當稀疏度k過高時,影響的稀疏性會下降。

最后,論文一作表示稀疏自編碼器的問題仍然遠未解決,這項研究中的SAE只捕獲了GPT-4行為的一小部分,即使看起來單義的latent也可能難以精確解釋。而且,從表現優異的SAE到更好地理解模型的行為,還需要大量的工作。

關于這項研究的更多細節,感興趣的家人可以查看原論文。

OpenAI還公開發布了完整源代碼和針對GPT-2的多個小規模自編碼器模型權重。還發布了一個在線可視化工具,用于查看包括這個1600萬latent GPT-4自編碼器在內的多個模型的激活特征。

OpenAI的:https://cdn.openai.com/papers/sparse-autoencoders.pdf
Anthropic的:https://transformer-circuits.pub/2024/scaling-monosemanticity/index.html

參考鏈接:
[1]https://x.com/OpenAI/status/1798762092528586945

[2]https://openai.com/index/extracting-concepts-from-gpt-4/
[3]https://news.ycombinator.com/item?id=40599749
[4]https://x.com/janleike/status/1798792652042744158
[5]https://openaipublic.blob.core.windows.net/sparse-autoencoder/sae-viewer/index.html

責任編輯:姜華 來源: 量子位
相關推薦

2023-08-16 15:25:43

2024-06-07 12:42:38

2024-06-07 18:14:53

2024-06-28 13:40:03

2023-03-16 19:17:57

2024-05-15 09:28:01

2023-04-09 16:17:05

ChatGPT人工智能

2023-12-16 09:45:56

論文GPT-4AI

2023-03-22 10:24:14

AI智能

2023-07-07 09:32:57

GPT-4OpenAI

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2023-12-15 12:52:17

AI模型

2023-06-19 08:19:50

2023-03-16 17:28:59

技術AI

2023-12-17 22:04:04

微軟GPT-4

2023-05-10 17:33:56

2024-05-28 14:40:00

2023-07-06 06:56:58

人工智能OpenAIGPT-4

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2024-05-14 07:30:52

OpenAIGPT-4模型
點贊
收藏

51CTO技術棧公眾號

爱福利视频一区二区| 亚洲已满18点击进入在线看片| 97精品人人妻人人| 96av在线| 国产亚洲欧美日韩俺去了| 国产91九色视频| 美女网站视频色| www.成人在线视频| 中文字幕一区二区三| 444亚洲人体| 国产成人在线播放视频| 国产亚洲一区二区三区不卡| 欧美吻胸吃奶大尺度电影| 一区二区三区欧美成人| 亚洲高清精品视频| 久久精品日韩欧美| 久久精品视频一| 国产精品99精品无码视亚| 蜜桃视频m3u8在线观看| 国产精品免费视频一区| 成人欧美一区二区| 日韩综合在线观看| 一本精品一区二区三区| 欧美一级黄色录像| 六月激情综合网| 成人黄色在线电影| 久久免费的精品国产v∧| 国产精品一区av| 久久免费精彩视频| 欧美日韩国产传媒| 亚洲成人精品在线| 成年网站免费在线观看| 国产伦理精品| 亚洲狼人国产精品| 麻豆久久久av免费| 国产女同91疯狂高潮互磨| 香蕉精品999视频一区二区| 久久av.com| 欧美人与性囗牲恔配| 波多野结衣在线一区二区| 欧美日韩视频专区在线播放| 国产精品久久久久久久乖乖| 在线观看免费黄视频| 成人av中文字幕| 91精品久久久久久久久中文字幕| 五月天婷婷激情| 欧美.www| 中文字幕在线国产精品| 无码人妻精品一区二区三区温州| 日本成人精品| 欧美乱熟臀69xxxxxx| 欧美三级一级片| 精精国产xxxx视频在线中文版| 中文字幕+乱码+中文字幕一区| 91久久偷偷做嫩草影院| 中文字幕777| 丝袜国产日韩另类美女| 性色av一区二区咪爱| 麻豆精品一区二区三区视频| 日产精品一区二区| 亚洲三级 欧美三级| 强迫凌虐淫辱の牝奴在线观看| 日韩中文一区二区| 51精品国自产在线| 中文字幕 欧美日韩| 在线观看涩涩| 岛国视频午夜一区免费在线观看| 一本久道高清无码视频| 成人短视频在线| 亚洲欧洲国产日本综合| 亚洲综合av一区| 亚洲乱亚洲乱妇| 17c精品麻豆一区二区免费| 五月天久久狠狠| www.视频在线.com| 日本一区免费视频| 日本一区二区三不卡| 国自产拍在线网站网址视频| 国产亚洲精品中文字幕| 18国产免费视频| 麻豆tv在线| 中文字幕不卡一区| 欧美日韩精品久久| 噜噜噜在线观看播放视频| 97se亚洲国产综合在线| 久久99蜜桃综合影院免费观看| www.麻豆av| 国产真实乱对白精彩久久| 91精品国产综合久久久久久久久| 91亚洲精品国偷拍自产在线观看 | av免费观看一区二区| 国产日韩高清在线| 亚洲一二三区精品| 午夜不卡视频| 樱桃国产成人精品视频| 尤物av无码色av无码| 亚洲天堂手机| 欧美少妇xxx| 污污视频在线免费| 国产精品x8x8一区二区| 日韩精品高清视频| 少妇无套高潮一二三区| 婷婷综合在线| 久久久午夜视频| 国产奶水涨喷在线播放| 久久午夜视频| 91亚洲精品在线| 欧洲精品久久一区二区| 国产精品美女久久久久久久久 | 亚洲国产一区二区在线| 国产激情小视频在线| 亚洲国产日韩av| 日本va中文字幕| 亚洲**毛片| 日韩成人av网址| 国产成人免费在线观看视频| 欧美日韩亚洲三区| 日本韩国在线不卡| 国产精品一级二级| 91女人视频在线观看| 国产一区二区三区免费不卡| 国产裸舞福利在线视频合集| 亚洲日本欧美天堂| 中国丰满人妻videoshd| 亚洲网站免费| 日韩精品免费观看| 国产真实乱在线更新| 日韩一区二区久久| 成人一区二区电影| 日韩av成人| 亚洲精品乱码久久久久久久久| 999香蕉视频| 一区二区视频| 日韩一区二区精品视频| 国产又大又黄又粗| 国产精品12区| 一区二区不卡在线| av日韩亚洲| 精品日韩欧美在线| 亚洲怡红院在线观看| 欧美中文日韩| 91久久国产自产拍夜夜嗨| 风间由美一区| 动漫精品一区二区| 日本wwwwwww| 欧美黄色一区| 国产日产久久高清欧美一区| 久久精品a一级国产免视看成人| 亚洲黄色尤物视频| 一区二区免费av| 精品在线99| 欧美一区在线直播| 国产综合视频在线| 一区二区三区四区在线播放| 亚洲精品久久久久久宅男| 欧美精品一二| 国产成人一区二区三区电影| 天天舔天天干天天操| 亚洲精品国产视频| 在线视频观看91| 99精品在线观看| 国产精品嫩草影院一区二区| 成人综合影院| 91福利国产精品| 99久久免费看精品国产一区| 亚洲高清不卡| 91一区二区三区| 高清全集视频免费在线| 3751色影院一区二区三区| 毛片久久久久久| 日韩伦理在线视频| 免费成人小视频| 一本—道久久a久久精品蜜桃| 国产亚洲人成a在线v网站| 久久久成人精品视频| a天堂视频在线| 午夜久久久久久电影| 我和岳m愉情xxxⅹ视频| 青青草国产精品97视觉盛宴 | 色爱综合网欧美| 91精品综合视频| av日韩中文| 亚洲欧美综合精品久久成人| 在线免费观看视频网站| 亚洲素人一区二区| 国产一级黄色录像| 首页亚洲欧美制服丝腿| 亚洲免费av网| 久久电影在线| 国产精品入口尤物| 亚洲夜夜综合| 亚洲图片欧美午夜| 中文字幕一区二区在线视频| 一区二区三区精品在线观看| 91精品啪在线观看国产| 日韩电影在线一区二区三区| 国产一二三四五| 亚洲+变态+欧美+另类+精品| 国产精品丝袜视频| 超碰在线最新网址| 在线观看久久av| 欧美一级在线免费观看| 欧美综合视频在线观看| 久久久久久久久久综合| 国产日产欧美一区二区三区| 亚洲欧美日韩中文字幕在线观看| 丝袜亚洲另类丝袜在线| 精品一区二区三区无码视频| 激情婷婷综合| 国产精品大全| 日韩综合av| 日本久久久久久久久久久| 国产乱色在线观看| 亚洲女人天堂成人av在线| 国产v在线观看| 在线亚洲+欧美+日本专区| 国产亚洲精品码| 国产精品国产精品国产专区不蜜 | 992kp快乐看片永久免费网址| 韩国一区二区三区在线观看| 自拍偷拍视频在线| 成人免费看片39| 蜜桃传媒一区二区| 澳门久久精品| aaa级精品久久久国产片| 91精品国产自产观看在线| 国产精品电影观看| 一根才成人网| 国产91精品久| 黄视频网站在线观看| 色综合五月天导航| a视频在线观看免费| 色偷偷av一区二区三区乱| 国产区视频在线| 亚洲男人天堂2019| 色视频精品视频在线观看| 精品国产乱码久久久久久久久| 国产又色又爽又黄又免费| 欧美日韩在线观看一区二区| 波多野结衣一区二区三区四区| 午夜精品久久久久久久久久久| 久操免费在线视频| 亚洲精品国产精华液| a级黄色片免费看| 一区二区三区在线视频播放| 国产性xxxx| 樱桃国产成人精品视频| 九九热精品免费视频| 亚洲精品ww久久久久久p站| 亚洲乱码国产乱码精品精大量| 九九热在线视频观看这里只有精品| 午夜精品在线免费观看| 性感少妇一区| 精品久久久久久久无码| 亚洲欧美日韩视频二区| 青草青青在线视频| 国产日韩欧美一区二区三区在线观看| 欧美交换配乱吟粗大25p| 91精品综合久久久久久久久久久 | 欧美一区二区三区久久精品| 亚洲欧洲一区二区| 91精品国产调教在线观看| 一区二区三区三区在线| 成人三级视频| 亚洲丰满在线| 亚洲天天综合| 成人在线视频一区二区三区| 午夜日本精品| 免费无码不卡视频在线观看| 亚洲三级观看| 老太脱裤让老头玩ⅹxxxx| 午夜在线一区| 激情五月婷婷久久| 青青草国产精品97视觉盛宴| 91亚洲免费视频| 韩国精品免费视频| 美女被艹视频网站| 国产一区二区福利| 国产精品久久久久久久无码| 91免费版在线| 亚洲精品成人无码熟妇在线| 国产精品久久网站| 国产97免费视频| 一区二区三区国产| 午夜精品久久久久久久久久久久久蜜桃| 欧美视频免费在线| 99久久久无码国产精品免费蜜柚 | www.69av| 亚洲欧美网站| 欧美大尺度做爰床戏| 精品无人码麻豆乱码1区2区| av漫画在线观看| 久久伊人中文字幕| 影音先锋男人在线| 亚洲综合网站在线观看| 日韩黄色在线视频| 日本韩国欧美一区二区三区| 国产黄a三级三级三级| 精品av综合导航| 久草视频视频在线播放| 久操成人在线视频| 中文字幕色婷婷在线视频| 国产精品色视频| 国产精品一区二区中文字幕| 欧美日韩一区二区三区在线观看免 | 91综合久久一区二区| 国产午夜福利100集发布| 日一区二区三区| 丰满少妇一区二区三区专区| 亚洲国产精品精华液ab| 日韩欧美中文字幕视频| 欧美午夜激情在线| 成人黄色在线观看视频| 亚洲欧美在线一区| 男女av在线| 久久久噜噜噜久久中文字免| 成人开心激情| 国产欧美日韩在线播放| 国产精品精品| 国产精品秘入口18禁麻豆免会员 | 992tv人人草| 91美女片黄在线观看91美女| 欧美黄色一区二区三区| 色综合久久久久综合体桃花网| 中文字幕欧美在线观看| 亚洲人成亚洲人成在线观看| 中文在线免费| 国产精品免费一区豆花| 国产一区二区三区天码| 狠狠精品干练久久久无码中文字幕| 老牛影视一区二区三区| 国产精品久久不卡| 一区二区三区在线视频观看58 | 久久精品欧洲| 亚洲精品在线视频免费观看 | 久久精品视频6| 欧美一级理论片| 三区四区电影在线观看| 国产成人免费av| 欧美中文一区| 日本五级黄色片| 国产精品综合二区| 亚洲一级二级片| 在线观看一区二区视频| 国产一区二区三区福利| 国内自拍欧美激情| 欧美经典影片视频网站| 青青视频免费在线观看| 久久国产精品99精品国产| 日本午夜精品视频| 色狠狠桃花综合| 亚洲日本在线播放| 91精品国产91久久久久久| 中文无码日韩欧| 免费看毛片的网址| 成人深夜福利app| 国产精品久久久久久99| 亚洲国产小视频| 超免费在线视频| av一区二区三区免费| 欧美一区网站| 男男一级淫片免费播放| 亚洲一本大道在线| 成人激情四射网| 久久久久久综合网天天| 粉嫩av一区二区| 免费av手机在线观看| 成人免费视频播放| 国产午夜激情视频| 亚洲人成毛片在线播放| 日本一道高清亚洲日美韩| 精品午夜一区二区三区| 日韩高清一区在线| 亚洲一区 欧美| 91精品国产综合久久小美女| 国产激情在线观看| 999在线观看免费大全电视剧| 99av国产精品欲麻豆| 国产精品1000部啪视频| 91福利精品视频| 免费在线观看黄| 国产视频一区二区三区四区| 国产欧美日韩亚洲一区二区三区| 国产伦精品一区二区三区妓女| 色综合久久久久综合99| 91精彩视频在线观看| 97久久天天综合色天天综合色hd| 欧美黄色精品| yjizz视频| 欧美色综合久久| 久草资源在线观看| 国产综合动作在线观看| 另类图片国产| 992在线观看| 亚洲娇小xxxx欧美娇小| 成人美女大片| 加勒比海盗1在线观看免费国语版| 丰满白嫩尤物一区二区| 色婷婷av国产精品| 久久韩国免费视频|