精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Claude 的腦海里在發(fā)生什么?

人工智能
Anthropic 公布了關(guān)于“追蹤語言模型思維過程”(tracing the thoughts of language models)的研究:嘗試解釋一個 LLM 是怎樣得出答案的、在生成答案時內(nèi)部發(fā)生了什么。 本篇就圍繞這一思路展開。

為什么大語言模型(LLM)能夠“樣樣精通”?

從形式上看,LLM 只是一個函數(shù):給定輸入,產(chǎn)出輸出——如此而已。然而,它們卻能勝任翻譯、診斷、推理、計算等多種任務(wù),這又是如何做到的?

圖片圖片

LLM 本質(zhì)上是一個數(shù)學(xué)函數(shù):輸入 → 輸出。

LLM 們能做的事包括:疾病初步診斷、多語互譯、算術(shù)與代數(shù)運算,乃至更復(fù)雜的推斷。為什么?

最近,Anthropic 公布了關(guān)于“追蹤語言模型思維過程”(tracing the thoughts of language models)的研究:嘗試解釋一個 LLM 是怎樣得出答案的、在生成答案時內(nèi)部發(fā)生了什么。 本篇就圍繞這一思路展開。

目標(biāo):什么叫“追蹤 LLM 的思維”?

設(shè)想你問 Claude:“36 + 59 等于多少?”

圖片圖片

我們希望知道:它是背過了這道題(比如曾在某測驗里見過),還是在推理/計算?換言之,機制不同,可信度與泛化也會不同。

圖片圖片

兩種可能的路徑:記憶 vs. 計算。

研究顯示:Claude 的策略并非“人類式的列豎式”,而是并行走兩條路——一條用粗略方式近似總和,另一條計算個位數(shù)的進(jìn)位與末位;兩條路徑的組合給出最終答案。

圖片圖片

機制:如何“追蹤”一條思維路徑?

第一步是構(gòu)造一個替代模型(replacement model)。

替代模型(Replacement model)

Anthropic 做了什么?

常見的 LLM 由多層 Attention 與 MLP(前饋網(wǎng)絡(luò))構(gòu)成,每層包含成組的“神經(jīng)元”。

圖片圖片

為了便于解釋,他們將每一層的 MLP替換為跨層轉(zhuǎn)碼器(Cross-Layer Transcoder,CLT):形似 MLP,但神經(jīng)元更多,以更細(xì)顆粒表示“特征”。

圖片圖片

訓(xùn)練目標(biāo)是讓每個轉(zhuǎn)碼器的輸出 ? 盡量逼近原 MLP 的輸出 y,即逐層對齊。

圖片圖片

此外,訓(xùn)練還引入稀疏正則——讓每個提示詞僅激活少量神經(jīng)元(特征),從而有利于“一個概念 → 少數(shù)特征”的可解釋映射。

圖片圖片

于是得到的替代模型具備三點重要性質(zhì):

  1. 近似等價:層級輸出與原模型近似一致,因此可以在不大幅改變功能的情況下做解釋;
  2. 容量更大:每層神經(jīng)元更多,代價是更低效,但更可能把“概念”單獨映射到可分離的特征上;
  3. 激活更稀疏:一次輸入只點亮少數(shù)特征,有助于“特征 ? 概念”的一對一或一對少映射。

從神經(jīng)元到“概念”:給特征貼標(biāo)簽

在替代模型里,研究者把神經(jīng)元稱為特征(features)。 若模型有 L 層、每層轉(zhuǎn)碼器維度為 m,那么總特征數(shù)約為 m×L。

圖片圖片

在 Anthropic 的實驗中,特征總量高達(dá) 3000 萬。接下來要做的,是把這些特征與可讀的概念對應(yīng)起來。

怎么做?

  • 他們先收集一批文本段落,送入模型,記錄逐 token 的激活。由于稀疏化,大多數(shù)特征為 0;少數(shù)非零者即為被激活,說明這些特征與當(dāng)前 token 的語義/形態(tài)相關(guān)。

圖片圖片

  • 然后反過來:挑一個特征,看它在什么文本模式下頻繁被點亮。若它總在“Texas/texas”之前激活,我們就可稱其為“Texas 特征”。

圖片圖片

通過這種方式,他們給大量特征貼上了可解釋的“標(biāo)簽”。進(jìn)一步地,特征大致可分為三類節(jié)點(nodes):

  1. 輸入節(jié)點(Input nodes):與輸入 token 的嵌入相關(guān);

圖片圖片

  1. 輸出節(jié)點(Output nodes):與輸出 token 的嵌入相關(guān);

圖片圖片

  1. 中間節(jié)點(Intermediate nodes):把輸入變?yōu)檩敵鏊璧闹虚g操作/概念;

圖片圖片

追蹤路徑:把“思維鏈”畫成圖

現(xiàn)在我們有了“節(jié)點”(概念化的特征),問題變成:如何復(fù)原它們之間的影響路徑,也就是模型“思考”的線路? 研究者將其稱為歸因圖(Attribution Graph)。

舉例,繼續(xù)用 “36 + 59 = ?”。

我們已知:

  • 輸入節(jié)點:由輸入 token 決定;
  • 目標(biāo)輸出節(jié)點:由模型最終輸出決定;
  • 任務(wù):找出介于兩者之間、真正推動輸出生成的那些中間節(jié)點及其有向邊(影響關(guān)系)。

圖片圖片

在實踐中,會先構(gòu)建一個大圖:節(jié)點是特征,邊代表“此特征對彼特征/對輸出 logits 的影響”。這張圖規(guī)模可達(dá)百萬級邊。 接著,對其進(jìn)行剪枝:僅保留對輸出影響顯著的節(jié)點與邊,從而獲得一個可視化、可解釋的精簡路徑。

最終的路徑圖大致如下:它解釋了 Claude 在“診斷任務(wù)”中如何分階段整合輸入線索、觸發(fā)中間概念、再導(dǎo)向輸出。

圖片圖片

小結(jié)與思考

本文聚焦于 Anthropic 近期關(guān)于電路追蹤(Circuit Tracing)的一系列工作,擇要說明了:

  • 替代模型如何在功能近似前提下提升可解釋性;
  • 稀疏激活如何幫助把“神經(jīng)元”貼上可讀標(biāo)簽;
  • 歸因圖如何把“輸入 → 中間概念 → 輸出”的邏輯鏈條具體化。

當(dāng)然,也存在局限:

  1. 替代模型畢竟是近似,與原模型的“機械同構(gòu)性”未必完美,對機制的類比可能仍有推測成分;因此,需要謹(jǐn)慎解讀。
  2. 論文中的若干示例是手工篩選與核驗過的,方法能否穩(wěn)定泛化到所有任務(wù)與模型,尚需更多證據(jù);盡管如此,在大量場景下它確實奏效。 換言之,它也許不是“徹底自底向上”理解 LLM 的終點,但無疑向前邁了一大步。
責(zé)任編輯:武曉燕 來源: 大遷世界
相關(guān)推薦

2012-12-31 14:19:18

程序應(yīng)屆畢業(yè)生

2025-04-27 08:11:26

2015-09-25 10:41:48

r語言

2013-09-27 09:42:37

工程師邏輯

2018-07-23 14:43:56

數(shù)據(jù)庫DBAMySQL

2021-04-23 23:19:26

加密貨幣穩(wěn)定幣比特幣

2013-10-09 13:12:39

App開發(fā)者

2023-04-12 08:04:09

MapReduce大數(shù)據(jù)框架

2025-07-28 06:32:12

Gogo func()

2021-08-19 17:27:41

IT數(shù)據(jù)中心災(zāi)難

2021-12-27 08:24:08

漏洞網(wǎng)絡(luò)安全

2019-11-12 14:41:41

Redis程序員Linux

2024-07-25 14:44:18

2021-11-15 14:02:27

RPCSpringBootRabbitMQ

2022-01-21 10:22:07

智能家居物聯(lián)網(wǎng)IOT

2018-01-19 12:56:19

Linux進(jìn)程

2023-08-26 07:44:13

系統(tǒng)內(nèi)存虛擬

2020-07-14 08:48:07

數(shù)據(jù)分析技術(shù)IT

2022-07-06 07:27:52

32Core樹莓派集群

2023-08-29 16:26:20

Linux命令行
點贊
收藏

51CTO技術(shù)棧公眾號

欧美三区在线观看| 国产香蕉久久精品综合网| 欧美videos中文字幕| 国产九色porny| 撸视在线观看免费视频| 免费在线视频一区| 欧美激情一级精品国产| 国产精品无码久久久久一区二区| av3级在线| 久久久99精品久久| 欧美在线xxx| 天堂在线中文视频| 高清成人在线| 洋洋av久久久久久久一区| 久久免费看av| 国产黄色大片网站| 日韩激情一区二区| 国色天香2019中文字幕在线观看| 国产精品亚洲一区二区无码| 精品欧美日韩精品| 午夜亚洲福利老司机| 亚洲蜜桃在线| 日本一卡二卡四卡精品| 国产黄色91视频| 国产精品一区二区久久国产| 欧美美女性生活视频| 久久93精品国产91久久综合| 欧美成人艳星乳罩| www.51色.com| 欧美网站免费| 欧美性大战久久| 免费无码不卡视频在线观看| 日本高清在线观看| 成人精品视频一区| 91在线短视频| 国产又粗又猛又爽又黄91| 中文av一区| 日韩一区二区欧美| 毛片aaaaaa| 一区二区三区四区在线看 | 熟女少妇a性色生活片毛片| 日本欧美高清| 亚洲精品久久久久久久久久久久 | 亚洲小说区图片区都市| 中文字幕av免费专区久久| 久久久av水蜜桃| 天天干,夜夜操| 国产成人精品影视| 99高清视频有精品视频| www.xxx国产| 国产成人在线视频播放| 成人91视频| 成人久久久精品国产乱码一区二区| 亚洲欧美日韩精品一区二区| 国产+人+亚洲| 特级西西人体高清大胆| 国产欧美一区二区精品久久久| 在线视频综合导航| 精品国产乱码久久久久久蜜柚| 波多野结衣在线电影| 久久精品五月| 国产精品久久中文| 一本色道久久综合精品婷婷| 久久国产精品99精品国产| 91精品美女在线| 国产精品无码久久久久成人app| 国产亚洲综合精品| 日韩美女写真福利在线观看| 无码一区二区三区在线观看| 蜜臀av一区二区| 国产69久久精品成人| 91视频免费网址| 欧美日韩国产综合网| 久久久亚洲精品视频| 精品欧美一区二区三区免费观看| 午夜天堂精品久久久久| 国产做受高潮69| 久久亚洲精品国产| 久久精品99久久久| 91免费看蜜桃| 天天干,夜夜操| 亚洲国产成人午夜在线一区| 激情视频小说图片| 欧亚在线中文字幕免费| 欧洲精品一区二区三区在线观看| 日韩在线一级片| 91国内外精品自在线播放| 91精品国产综合久久福利| 天天躁日日躁狠狠躁av| 精品av一区二区| 久久亚洲精品网站| 你懂得视频在线观看| 欧美片第1页综合| 日韩美女中文字幕| 国产国语亲子伦亲子| 久久久久99精品一区| 久久人人97超碰人人澡爱香蕉| 黄色片一区二区| 国产精品女同互慰在线看| 97干在线视频| 免费日韩成人| 亚洲精品720p| 欧美色图亚洲激情| 欧美一区二区三区久久精品茉莉花| 日韩视频免费观看| 日韩伦理在线视频| 国产在线精品一区二区| 欧美日产一区二区三区在线观看| 日韩a在线看| 亚洲猫色日本管| 国内自拍视频网| 久久悠悠精品综合网| 久久精品色欧美aⅴ一区二区| www.97视频| 亚洲免费一区二区| 99re资源| 黄色网址在线免费播放| 色播五月激情综合网| 男人网站在线观看| 亚洲综合中文| 国产欧美精品日韩精品| 男生女生差差差的视频在线观看| 国产亚洲人成网站| 免费 成 人 黄 色| 91国内精品| 久久成人精品视频| 91女人18毛片水多国产| 国产日产精品一区| 日本成年人网址| 激情小说一区| 亚州成人av在线| 国内老熟妇对白hdxxxx| 自拍av一区二区三区| 免费一级特黄录像| 大片网站久久| 国产精品欧美一区二区| 国产一二三区在线视频| 日韩欧美中文第一页| 国产精品无码一区二区三| 在线不卡亚洲| 国产成人精品一区二区三区福利| 你懂的好爽在线观看| 欧美视频第一页| 97超碰在线免费观看| 亚久久调教视频| 久久久久网址| 成人a在线视频免费观看| 欧美人妇做爰xxxⅹ性高电影 | 欧美日韩三区四区| 亚洲天堂av在线| 国产婷婷色综合av蜜臀av | 国产精品九色蝌蚪自拍| 国产精品乱码久久久久| 亚洲一区 二区| 久久久久久久色| 五月天激情开心网| 欧美三级欧美成人高清www| 波多野吉衣中文字幕| 久久这里有精品15一区二区三区| 亚洲xxx大片| 污污影院在线观看| 亚洲电影在线看| 久久99国产综合精品免费| 国产亲近乱来精品视频| 五月婷婷之婷婷| 欧美激情一级片一区二区| 国产精品一区二区在线观看| segui88久久综合9999| 亚洲精品美女在线观看| 性欧美videos| 99久久免费精品| 黄色一级二级三级| 亚洲视频电影在线| 国产精品自拍小视频| 日本中文字幕在线视频| 日韩欧美成人一区| 日韩久久中文字幕| 国产精品乱码久久久久久| 自拍视频第一页| 亚洲中字黄色| 中文字幕一区综合| 第四色在线一区二区| 国产精品福利无圣光在线一区| 四季av日韩精品一区| 色婷婷综合久久久中文字幕| 国产99在线 | 亚洲| 国产成人av电影在线观看| 日本三级免费观看| 久久国产亚洲精品| 狠狠久久综合婷婷不卡| 91九色综合| 精品偷拍一区二区三区在线看 | 国产人成在线视频| 午夜欧美视频在线观看 | 亚洲自拍偷拍图| 久久国产麻豆精品| 五月天国产一区| 538任你躁精品视频网免费| 日韩av免费看网站| 色呦呦网站在线观看| 日韩免费看网站| 麻豆精品传媒视频| 成人自拍视频| 国产精品狠色婷| 国产在线天堂www网在线观看| 丝袜在线视频| 亚洲天堂免费在线| 在线黄色av网站| 精品欧美激情精品一区| 国产精品丝袜一区二区| 国产黄色精品视频| 91精品无人成人www| 亚洲国产专区| www.-级毛片线天内射视视| 亚洲欧美日本伦理| 国产精品麻豆免费版| 激情久久免费视频| 国产精品久久不能| 中老年在线免费视频| 久久久亚洲天堂| 18+视频在线观看| 精品国内产的精品视频在线观看| 国产福利视频导航| 欧美军同video69gay| 久久久久久久久久91| 久久亚洲春色中文字幕久久久| 黄色三级视频片| 午夜在线视频观看日韩17c| 青春草国产视频| 欧美日本一区| 91免费版看片| 一区二区中文| 亚洲黄色网址在线观看| 久久九九热re6这里有精品| 国产999精品久久久| 欧美13videosex性极品| 欧美高清在线视频观看不卡| a黄色片在线观看| 欧美成人午夜激情视频| 欧美女优在线观看| 日韩精品小视频| 亚洲 另类 春色 国产| 亚洲第一页在线| 日韩在线观看视频网站| 欧美精品一区二区三| 成人午夜免费在线观看| 欧美不卡一二三| 手机看片一区二区| 欧美精品高清视频| 91资源在线视频| 日韩欧美精品网址| 欧美黑人性猛交xxx| 亚洲狼人国产精品| 亚洲精品在线观看av| 国产精品白丝在线| 国产喷水在线观看| 亚洲免费观看视频| 国产 日韩 欧美 成人| 亚洲国产美女搞黄色| 日本五十路女优| 色婷婷精品大视频在线蜜桃视频| 亚洲一级生活片| 亚洲激情一二三区| 国产精品第108页| 欧美视频不卡中文| 亚洲天堂久久久久| 日韩免费福利电影在线观看| 国产 欧美 自拍| 日韩久久精品成人| av在线第一页| 久久久99免费视频| 大香伊人久久| 国产精品高潮视频| 国产亚洲字幕| 精选一区二区三区四区五区| 国产乱码精品一区二区三区四区| 精品无码久久久久久久动漫| 欧美猛男男男激情videos| 亚洲高清视频在线观看| 欧美搞黄网站| 已婚少妇美妙人妻系列| 国产呦萝稀缺另类资源| 精品日韩久久久| 国产白丝精品91爽爽久久| 成人影视免费观看| 亚洲欧美在线另类| 日韩精品1区2区| 欧美日韩亚洲国产一区 | 亚洲美女在线一区| www日韩精品| 欧美日韩不卡一区| 污污网站在线免费观看| 日韩中文在线中文网三级| 国产黄色片在线播放| 欧美成人免费全部| 国产精品扒开腿做爽爽爽视频软件| 欧美性受xxxx黑人猛交| 婷婷激情成人| 蜜桃视频在线观看成人| 一区二区三区毛片免费| 一本久道中文无码字幕av| 国产精品123| 波多野结衣家庭教师在线观看| 国产精品美女久久久久高潮| 久久露脸国语精品国产91| 91精品国产91久久久久久一区二区 | 亚洲一区二区三区自拍| av在线免费播放网址| 五月天激情综合| 成人免费视频毛片| 日韩视频永久免费| 午夜影院在线视频| 免费99精品国产自在在线| 影音成人av| 美乳视频一区二区| 成人免费在线观看av| 97国产精东麻豆人妻电影| 国产精品88888| 一级性生活免费视频| 一区二区三区蜜桃| 一级片一区二区三区| 一区二区三区国产在线观看| 欧美freesex黑人又粗又大| 波多野结衣成人在线| 午夜欧美在线| 国产探花在线看| 国产精品色呦呦| 中文字幕在线播放av| 亚洲日本成人网| 日韩美女在线看免费观看| 久久亚洲国产精品日日av夜夜| 青草国产精品| 午夜激情福利在线| 国产成人一级电影| 亚洲av无码一区二区三区在线| 亚洲大型综合色站| 亚洲第一视频在线| 国产亚洲激情在线| 欧美日韩免费看片| 欧美精品在线一区| 日精品一区二区三区| 久久精品—区二区三区舞蹈| 欧美日韩在线一区| 精品电影在线| 国产精品久久久久免费a∨大胸| 久久伦理中文字幕| www.黄色网址.com| 国产精品系列在线观看| www.中文字幕av | 久久久综合久久| 欧美zozozo| 亚洲天堂手机| 神马影院午夜我不卡| 毛片av中文字幕一区二区| 99精品中文字幕| 日韩西西人体444www| av丝袜在线| 99re在线播放| 亚洲激情一区| 国产全是老熟女太爽了| 欧美午夜电影网| 丝袜+亚洲+另类+欧美+变态| 热久久免费国产视频| 精品丝袜久久| 欧美 日韩 激情| 国产日韩成人精品| 97精品人妻一区二区三区| 国产视频精品久久久| 黑人玩欧美人三根一起进| 精品国产91亚洲一区二区三区www 精品国产_亚洲人成在线 | 加勒比综合在线| 欧美日韩日本视频| 在线看一级片| 久久av一区二区三区漫画| 亚洲午夜电影| 人妻少妇一区二区| 7777精品伊人久久久大香线蕉超级流畅 | 操人在线观看| 欧美中文娱乐网| 国内精品久久久久影院一蜜桃| 国产破处视频在线观看| 91精品国模一区二区三区| 3344国产永久在线观看视频| 欧美亚洲精品日韩| 久久久久一区| 日本在线一级片| 精品性高朝久久久久久久| 麻豆久久久久| 日本成年人网址| 亚洲视频一二三区| 你懂的在线免费观看| 91在线网站视频| 美女诱惑一区| 麻豆国产尤物av尤物在线观看| 在线播放中文一区| 色多多在线观看| 国产a级黄色大片| 欧美韩国日本综合| 神马午夜精品95| 91久久精品美女|