精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

未來將出現一個完全可解釋的GPT-3!OpenAI 華人一作重磅突破:首次揭秘AI內部的“微觀機制”,電路越小,模型越可解釋

原創 精選
人工智能
大家都知道,如今GPT、Claude等LLM越來越強大,寫文章、生成代碼、做推理,樣樣不在話下。但是,模型內部是如何“思考”的?這一直是一個黑箱問題。

編輯 | 聽雨

出品 | 51CTO技術棧(微信號:blog51cto)

就在幾個小時前,OpenAI發布了一篇重磅的最新研究,構建了一個實驗性的大語言模型,并且提出稀疏訓練+剪枝+橋接的新方法,讓原本黑箱的LLM內部機制可視化了。

大家都知道,如今GPT、Claude等LLM越來越強大,寫文章、生成代碼、做推理,樣樣不在話下。但是,模型內部是如何“思考”的?這一直是一個黑箱問題。

打個比方,傳統神經網絡的工作方式就像一堆糾纏在一起的電線:每個神經元與成千上萬個神經元相連,信號在其中不斷流動、疊加。這些連接雖然能讓模型學習復雜模式,但也形成了人類難以解讀的、高度密集的連接網絡。

圖片圖片

解釋 Transformer 的一個主要難點在于:其激活與權重并不直接可理解。例如,神經元會以難以預測的方式激活,這些激活模式往往并不對應于人類可理解的概念。

而OpenAI的最新研究,通過對語言模型進行極度稀疏權重訓練,“解開”了模型內部的機制。他們構建了一個權重稀疏的 Transformer模型,比 GPT-5、Claude 或 Gemini等主流模型要小得多。論文第一作者Leo Gao表示,它的性能大致相當于2018年的GPT-1。

相對于常規模型來說,更透明的模型有助于揭示語言模型為何會出現幻覺、行為不可預測,或在關鍵情況下做出不可靠的判斷。

圖片圖片

論文相關代碼已公開:https://github.com/openai/circuit_sparsity/

一、稀疏訓練:從“電線堆”到清晰電路

OpenAI提出對Transformer模型進行“稀疏訓練”方法,其核心思路在于:絕大多數權重設為零,讓每個神經元只連接少數節點,這樣網絡內部的信號不再在成千上萬個節點之間糾纏,而是沿著少量路徑傳遞。

他們首先在標準 Transformer 架構( GPT?2 風格)上訓練模型,并強制絕大多數權重為 0(L0 范數很小),讓每個神經元只連接少數其他神經元。

圖片圖片

二、電路可解釋性:AI任務的“微觀機制”

為了驗證稀疏訓練的效果,研究者設計了一些簡單任務,讓模型完成特定操作,例如:

  1. Python引號閉合任務:輸入 "hello,模型要輸出匹配的引號 "hello";

圖片圖片

  1. 列表嵌套深度計數:輸入 [ [ ] ],模型需要正確預測列表結束的符號;

圖片圖片

  1. 變量類型追蹤:跟蹤變量 current 是字符串還是集合類型。

圖片圖片

為了評估模型的可解釋性,研究者使用一種新型剪枝(Pruning)方法,以隔離關鍵電路:對每個任務,刪除模型中非必要的神經元/通道/權重,只保留完成任務所必需的最小子網絡。剪枝方法會通過“均值屏蔽”(mean-ablating)凍結被刪除節點的激活,保證任務行為仍然由剩下的電路完成。

圖片圖片

結果發現,每個任務對應一個最小電路(Minimal Circuit),只包含少量神經元和注意力通道,足以完成任務:

  • 剪掉電路之外的神經元,模型就會失敗;
  • 只保留這些神經元,模型就能正常完成任務。

這意味著,這些電路不僅可用,而且必要且充分——正是模型執行任務的核心“機制”。

舉個例子,閉合引號任務的電路只用到兩個MLP神經元和一個注意力頭,就能判斷字符串是單引號還是雙引號,然后正確閉合。

此外,研究者還發現電路越小、越獨立,模型行為就越可解釋。

他們比較了一個稀疏模型和一個在預訓練損失相同的稠密模型。通過調節目標損失,測量每個模型在完成該損失時所需的最小電路規模,并對任務進行平均。結果顯示,在任意給定損失下,稀疏模型的電路大約比稠密模型小16倍。

圖片圖片

三、能力與可解釋性的權衡

稀疏訓練還有一個亮點:可調控性。

  • 增加稀疏度:權重越少,電路越小,模型越可解釋,但能力略有下降。
  • 擴大模型規模:在保持稀疏度的情況下,增加神經元數量,可以同時提升能力和可解釋性。

研究者將這個關系繪制成“帕累托前沿”,顯示能力與可解釋性的權衡。在總參數量固定的情況下,提高模型稀疏度(即減小權重的L0 范數)會在能力和可解釋性之間產生權衡:能力下降,但可解釋性提升。

圖片圖片

四、橋接方法:擴展到已有大模型

稀疏模型雖然易解釋,但訓練成本高,難以直接替代像GPT-3這樣的前沿大模型。為了解決這個問題,研究者又提出了橋接方法(Bridges)。通過橋接,把稀疏模型與已有密集模型關聯,實現對已有模型行為的可解釋性分析。

圖片圖片

“橋接”就是一系列線性映射,用于在稀疏模型和稠密模型的表示之間轉換——從而確保通過稀疏層與稠密層混合的所有路徑在預訓練任務上仍能保持良好性能。

五、未來將訓練出一個完全可解釋的 GPT-3

在論文最后,研究者提到,稀疏訓練非常有前景,但仍有不少挑戰:

  1. 效率低:稀疏模型訓練和推理開銷是同等能力稠密模型的100–1000倍;
  2. 多語義特征:一些神經元仍同時參與多個任務,完全單語義化還需要改進;
  3. 規模挑戰:解釋復雜任務或更大模型時,電路會非常龐大,需要自動化可解釋性方法輔助。

論文第一作者Leo Gao也表示:

“我們還沒有完全解決可解釋性問題,仍有很大的改進空間,許多電路仍然比較復雜。但我們仍然能學到很多——例如,在檢查閉合嵌套列表的電路時,我們發現了一種對模型的對抗攻擊,這是我們原本不會想到的。”

ImageImage

對于未來的研究方向,研究團隊表示,他們對擴展這一技術感到非常興奮。

“雖然不太可能將其擴展到最前沿的規模,但一個令人激動的目標是訓練出一個完全可解釋的 GPT-3。這樣的‘模型生物體’將教會我們關于 AI 工作原理的重要經驗,這些經驗可能會遷移到最前沿的模型上。”

可以預見,可解釋性將是未來大模型發展的關鍵方向。在不遠的將來,我們有望真正理解“AI是怎么思考的”,而不是僅僅看它的輸出。

參考鏈接:

https://openai.com/index/understanding-neural-networks-through-sparse-circuits/

https://cdn.openai.com/pdf/41df8f28-d4ef-43e9-aed2-823f9393e470/circuit-sparsity-paper.pdf

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2022-06-06 07:52:41

反欺詐技術AI

2024-05-28 08:00:00

人工智能機器學習

2023-02-14 08:10:14

Python人工智能XAI

2023-08-11 13:54:31

AI因果

2019-03-28 09:26:26

數據科學模型機器學習

2019-08-29 18:07:51

機器學習人工智能

2023-09-20 11:42:44

人工智能AI

2022-07-29 15:28:45

人工智能Python框架

2024-11-04 14:33:04

機器學習SHAP黑盒模型

2025-07-15 10:29:17

2025-01-23 08:23:12

2022-01-06 10:21:56

自動駕駛數據人工智能

2022-10-20 15:58:51

人工智能研究

2020-08-19 09:20:00

機器學習人工智能Python

2024-11-05 14:10:00

神經網絡AI

2020-08-25 10:30:59

TensorFlow數據機器學習

2021-01-08 10:47:07

機器學習模型算法

2025-01-13 08:13:18

2024-09-18 05:25:00

可解釋性人工智能AI

2022-04-13 15:10:22

AI決策
點贊
收藏

51CTO技術棧公眾號

99精品国产高清一区二区麻豆| 蜜臀av在线观看| 欧美理论视频| 一区二区在线观看视频| av色综合网| 一区二区三区免费高清视频| 久久综合社区| 色婷婷综合久久久久中文一区二区| 欧美一区二区三区四区在线观看地址| 国产美女www| 午夜精品一区二区三区国产 | 黄色软件视频在线观看| 91在线观看下载| 国产精品com| 欧美激情精品久久久久久免费| 亚洲综合影院| 色欧美片视频在线观看| 一区二区成人国产精品| 亚洲免费视频网| 视频一区在线播放| 欧美成人精品影院| 岛国精品一区二区三区| 成人看片在线观看| 亚洲美女淫视频| 久久99精品久久久水蜜桃| av首页在线观看| 欧美午夜在线| 在线午夜精品自拍| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 日韩国产一区二区| 亚洲成年网站在线观看| 亚洲这里只有精品| 美女的胸无遮挡在线观看| 国产精品久久久久久久久免费樱桃 | 天天干天天综合| 好看的中文字幕在线播放| 久久久久久久综合| 91网站在线免费观看| 久久99国产综合精品免费| 亚洲无中文字幕| 国产一区二区三区网站| 一级全黄裸体片| www.久久久.com| 91国产视频在线观看| 欧美 日韩 国产 在线观看| 五月婷婷伊人网| 国产精品538一区二区在线| 国产精品美乳在线观看| 可以免费看的av毛片| 你懂的成人av| 久久精品最新地址| 国产一二三av| 国产欧美一区二区三区精品观看 | 麻豆av一区二区三区| 99草在线视频| 精品一区二区三区香蕉蜜桃| 国产成人精品一区二区| 国产一级18片视频| 亚洲三级网站| 久久久久国产视频| 久草资源在线视频| 欧美1区3d| 久久精品一本久久99精品| www.99热| 成人国产精品一级毛片视频| 亚洲欧美日韩区| 亚洲av无码一区二区三区网址| 中文久久电影小说| 日韩欧美视频一区| 亚洲三级视频网站| 91精品影视| 欧美视频在线一区二区三区| 玩弄中年熟妇正在播放| 漫画在线观看av| 欧美日韩激情视频8区| 欧美精品久久久久久久久久久| 丝袜美腿av在线| 亚洲午夜久久久久| 国产一区二区视频播放| 蜜桃av在线| 香蕉影视欧美成人| 毛片在线播放视频| 亚洲啊v在线| 狠狠久久亚洲欧美专区| 一本大道熟女人妻中文字幕在线 | 国产欧美日韩视频在线观看| 精品久久sese| 国产高清一级毛片在线不卡| 中文字幕精品一区二区三区精品| 欧美日韩在线精品一区二区三区| 成人免费黄色网页| 中文字幕亚洲视频| 国产素人在线观看| 成人一区视频| 精品不卡在线视频| 91在线无精精品白丝| 欧美激情亚洲| 国产精品久久久久久久久久新婚 | 成年在线观看视频| 精品91久久| 日韩一区二区在线看| 国产黄色网址在线观看| 久久精品亚洲人成影院 | 青娱乐在线免费视频| 国产精品自在欧美一区| 日韩国产欧美精品| 超碰在线97国产| 欧美三级韩国三级日本三斤| 蜜臀av粉嫩av懂色av| 日韩一区电影| 庆余年2免费日韩剧观看大牛| 97在线视频人妻无码| 92精品国产成人观看免费| 天天做天天爱天天高潮| 波多野结衣久久精品| 日韩精品一区在线观看| 国产成人在线网址| 午夜综合激情| 成人一区二区在线| 国产精品va在线观看视色| 色婷婷综合视频在线观看| 野战少妇38p| 综合激情在线| 国产日产欧美a一级在线| 青青草av免费在线观看| 亚洲伊人色欲综合网| 日本在线播放一区二区| 凹凸成人精品亚洲精品密奴| 欧美一级淫片播放口| 狠狠人妻久久久久久综合麻豆 | 国产在线综合网| 国产一区二区网址| 中文字幕剧情在线观看一区| 日本黄色一区| 亚洲丝袜一区在线| 97久久久久久久| 91色porny| 欧美成人免费在线观看视频| jizz性欧美2| 久久成人精品一区二区三区| 一级片在线观看视频| 国产欧美精品一区aⅴ影院 | 欧美free嫩15| 国产一区二区三区在线免费观看| 少妇一级淫片免费放中国| 99久久久国产精品免费蜜臀| 九九热只有这里有精品| 日韩精品一区二区三区中文字幕| 久久精品久久久久久国产 免费| 在线播放亚洲精品| 国产精品福利一区二区三区| 午夜啪啪小视频| 91精品国偷自产在线电影| 成人国产精品色哟哟| 成人免费网站在线观看视频| 91精品国产一区二区人妖| 亚洲一二三在线观看| 国产一区二区不卡在线| 国产又粗又长又爽视频| 极品束缚调教一区二区网站 | 天天爽夜夜爽夜夜爽精品| 91年精品国产| jizz欧美激情18| 日韩欧美一区二区三区免费看| 91精品视频在线| 在线中文字幕视频观看| 亚洲第五色综合网| 91精品国产综合久久久蜜臀九色| 国产午夜精品一区二区三区视频| 91福利国产成人精品播放| 国产精品99久久| 99精彩视频在线观看免费| 理论片午夜视频在线观看| 亚洲一品av免费观看| 一级黄色片免费| 亚洲一区二区三区四区在线免费观看 | 高清欧美性猛交xxxx| 欧美女子与性| 欧美美女一区二区三区| 国产一级片视频| 久久这里只有精品首页| 日韩中文字幕a| 亚洲手机在线| 日韩中文字幕一区二区| 欧美午夜在线播放| 96精品视频在线| 97视频在线观看网站| 欧美成人官网二区| 国产精品第六页| 一区二区三区欧美久久| 成人免费毛片日本片视频| 日精品一区二区| 菠萝蜜视频在线观看入口| 偷拍自拍一区| 亚洲精品欧美日韩专区| 亚洲男人av| 欧美激情视频给我| av免费在线一区二区三区| 精品久久久久一区二区国产| 久久人人爽人人爽人人片av免费| 亚洲精品视频一区| 国产精品久久久久无码av色戒| 狠狠色综合色综合网络| 欧美成人黑人猛交| 国产综合自拍| 一本久久a久久精品vr综合| 欧美三级午夜理伦三级小说| 国产综合香蕉五月婷在线| 中文在线а√在线8| 欧美精品一区二区三区国产精品| 免费理论片在线观看播放老| 精品久久久久香蕉网| 国产口爆吞精一区二区| 在线观看视频欧美| 日本三级黄色大片| 亚洲精选一二三| 欧美aaa级片| 久久久久成人黄色影片| 一区二区在线免费观看视频| 久久www免费人成看片高清| 国产精品wwwww| 亚洲国产午夜| 久艹在线免费观看| 欧美1区2区视频| 特级黄色录像片| 久久影视一区| 涩涩日韩在线| 国产一卡不卡| 欧洲精品国产| 免费视频一区三区| 欧美精品v日韩精品v国产精品| 国产成人精品福利| 成人动漫视频在线观看完整版| 在线日韩三级| 91久久综合亚洲鲁鲁五月天| 亚洲最大的免费视频网站| 国产精品va在线播放| 另类专区亚洲| 日本精品久久久| 六月婷婷综合| 国产成人精品免费视频| 午夜影院一区| 国产91ⅴ在线精品免费观看| 国模私拍一区二区国模曼安| 久久久久久18| 高端美女服务在线视频播放| 久久男人的天堂| 精精国产xxxx视频在线野外| 午夜精品在线观看| 天堂中文av在线资源库| 热久久99这里有精品| 日本综合字幕| 国产精品人成电影在线观看| 成人免费黄色| 成人激情视频免费在线| 久久的色偷偷| 成人区精品一区二区| 女仆av观看一区| 欧美成人蜜桃| 欧美另类69xxxxx| 在线播放 亚洲| 欧美日韩1区| 99热自拍偷拍| 喷白浆一区二区| 欧洲美女亚洲激情| 成人av一区二区三区| 性欧美成人播放77777| 久久品道一品道久久精品| 日韩一级片在线免费观看| 最好看的中文字幕久久| 精品视频久久久久| 欧美色视频日本版| 91精品在线视频观看| 日韩精品中午字幕| 你懂的视频在线免费| 色天天综合狠狠色| 秋霞在线午夜| 国产成人91久久精品| 亚洲精品一区av| 国产精品免费视频一区二区| 亚洲综合小说图片| 视频一区二区视频| 在线欧美视频| 色天使在线观看| 成人动漫一区二区| 中文天堂资源在线| 亚洲曰韩产成在线| 亚洲精品国产精品乱码视色| 欧美大片拔萝卜| 精品电影在线| 欧美高清性猛交| 亚洲电影有码| 豆国产97在线| 99久久精品国产亚洲精品 | 日韩福利二区| 国产综合欧美| 色戒在线免费观看| av一区二区三区四区| 99国产精品无码| 欧美日韩一区二区三区在线免费观看| 国产永久免费视频| 日韩精品在线看| 天堂av资源在线观看| 国产精品视频在线播放| 久久悠悠精品综合网| 精品国产一区二区三区在线| 乱人伦精品视频在线观看| 中文字幕一二三区| 中文字幕欧美区| 久久免费激情视频| 欧美本精品男人aⅴ天堂| www.在线播放| 日本精品视频网站| 精品精品国产毛片在线看| 黄色网zhan| 男人的j进女人的j一区| 久久国产精品影院| 性做久久久久久| 丰满人妻一区二区三区四区53 | 欧美一区1区三区3区公司| 亚洲乱码视频| 久久久精品人妻一区二区三区| 国产精品区一区二区三区| 欧美a视频在线观看| 日韩av网址在线| av美女在线观看| 国产精品区二区三区日本| 91精品久久久久久久蜜月| 黄色片视频在线| 欧美国产激情一区二区三区蜜月 | 欧美二区三区91| 在线中文资源天堂| 国产精品久久久久9999| 免费看日本一区二区| 国产淫片av片久久久久久| 97成人超碰视| www.毛片.com| 亚洲深夜福利视频| 九九热线视频只有这里最精品| 久久精品国产美女| 亚洲综合二区| 青青草视频成人| 日韩欧美成人区| 国产视频精选在线| 国产精品久久久久久久久久小说 | 国产欧美日韩视频一区二区| 日韩精品一区二区亚洲av观看| 亚洲人a成www在线影院| 自拍视频在线看| 日本成人三级| 日本视频一区二区三区| 久久精品国产亚洲AV成人婷婷| 欧美日韩在线三级| 日本中文字幕在线视频| 成人免费网站在线观看| 影音先锋成人在线电影| 9191在线视频| 大桥未久av一区二区三区| 青青草免费在线| 国产精品夜色7777狼人| 91精品精品| 午夜男人的天堂| 韩曰欧美视频免费观看| 国产无套粉嫩白浆在线2022年| 国产精品久久一区| 亚洲欧美色图| 水蜜桃av无码| 欧美性受xxxx黑人xyx性爽| 91福利在线视频| 成人在线观看网址| 午夜在线播放视频欧美| 成人精品一二三区| 精品国产网站在线观看| 巨茎人妖videos另类| 亚洲精品一品区二品区三品区| 国产精品一区二区x88av| 国产精选第一页| 一区二区成人av| 欧美成人精品午夜一区二区| 女人喷潮完整视频| 国产精品精品国产色婷婷| 精品国产av一区二区| 日本道色综合久久影院| 婷婷伊人综合| 爱爱的免费视频| 91精品在线观看入口| 成人免费图片免费观看| 亚洲午夜久久久影院伊人| 成人午夜视频福利| 狠狠躁夜夜躁人人爽视频| 欧美精品久久久久久久久| 成人亚洲一区| 永久免费未满蜜桃| 欧美日韩大陆一区二区| 麻豆免费版在线观看| mm131午夜| 国产欧美一区二区精品秋霞影院| www.精品久久| 国产精品一区av| 亚洲一区国产一区|