精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

新聞 人工智能
在本文中,由 25 位研究者參與撰寫的論文,嘗試采用最原始的步驟逆向 transformer。

 Transformer 是 Google 團隊在 2017 年 6 月提出的 NLP 經(jīng)典之作,由 Ashish Vaswani 等人在論文《 Attention Is All You Need 》中提出。自 Transformer 出現(xiàn)以來,便在 NLP、CV、語音、生物、化學(xué)等領(lǐng)域引起了諸多進展。

Transformer 在現(xiàn)實世界中的應(yīng)用越來越廣泛,例如 GPT-3 、LaMDA 、Codex 等都是基于 Transformer 架構(gòu)構(gòu)建的。然而,隨著基于 Transformer 模型的擴展,其開放性和高容量為意想不到的甚至有害的行為創(chuàng)造了越來越大的空間。即使在大型模型訓(xùn)練完成數(shù)年后,創(chuàng)建者和用戶也會經(jīng)常發(fā)現(xiàn)以前從來沒見過的模型問題。

解決這些問題的一個途徑是機械的可解釋性(mechanistic interpretability),即對 transformers 計算過程進行逆向工程,這有點類似于程序員如何嘗試將復(fù)雜的二進制文件逆向工程為人類可讀的源代碼。

如果逆向工程可行,那么我們就會有更系統(tǒng)的方法來解釋當(dāng)前模型的安全問題、識別問題,甚至可能預(yù)見未來尚未構(gòu)建的模型安全問題。這有點類似于將 Transformer 的黑箱操作進行逆向,讓這一過程變得清晰可見。之前有研究者開發(fā)了 Distill Circuits thread 項目,曾嘗試對視覺模型進行逆向工程,但到目前為止還沒有可比的 transformer 或語言模型進行逆向工程研究。

在本文中,由 25 位研究者參與撰寫的論文,嘗試采用最原始的步驟逆向 transformer。該論文由 Chris Olah 起草,Chris Olah 任職于 Anthropic 人工智能安全和研究公司,主要從事逆向工程神經(jīng)網(wǎng)絡(luò)研究。之后 Neel Nanda 對論文初稿進行了重大修改,Nanda 目前是 DeepMind 的一名研究工程實習(xí)生。Nelson Elhage 對論文進行了詳細(xì)的編輯以提高論文章節(jié)清晰度,Nelson Elhage 曾任職于 Stripe 科技公司。

[[442646]]

左:Neel Nanda;右:Christopher Olah

考慮到語言模型的復(fù)雜性高和規(guī)模大等特點,該研究發(fā)現(xiàn),從最簡單的模型開始逆向 transformer 最有效果。該研究旨在發(fā)現(xiàn)簡單算法模式、主題(motifs)或是框架,然后將其應(yīng)用于更復(fù)雜、更大的模型。具體來說,他們的研究范圍僅包括只有注意力塊的兩層或更少層的 transformer 模型。這與 GPT-3 這樣的 transformer 模型形成鮮明的對比,GPT-3 層數(shù)多達(dá) 96 層。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

論文地址:https://transformer-circuits.pub/2021/framework/index.html#acknowledgments

該研究發(fā)現(xiàn),通過以一種新的但數(shù)學(xué)上等效的方式概念化 transformer 操作,我們能夠理解這些小模型并深入了解它們的內(nèi)部運作方式。值得注意的是,研究發(fā)現(xiàn)特定的注意頭,本文稱之為歸納頭(induction heads),可以在這些小模型中解釋上下文學(xué)習(xí),而且這些注意力頭只在至少有兩個注意層的模型中發(fā)展。此外,該研究還介紹了這些注意力頭對特定數(shù)據(jù)進行操作的一些示例。

各章節(jié)內(nèi)容概覽

為了探索逆向工程 transformers 面臨哪些挑戰(zhàn),研究者對幾個 attention-only 的 toy 模型進行了逆向功能。

首先是零層 transformers 模型的二元統(tǒng)計。研究者發(fā)現(xiàn),二元表可以直接通過權(quán)重訪問。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

在討論更復(fù)雜的模型之前,考慮零層(zero layer)transformer 很有用。這類模型接受一個 token,嵌入,再取消嵌入,以生成預(yù)測下一個 token 的 logits

由于這類模型無法從其他 tokens 傳輸信息,因此只能從當(dāng)前 token 預(yù)測下一個 token。這意味著,W_UW_E 的最優(yōu)行為是近似二元對數(shù)似然。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

零層 attention-only transformers 模型。

其次,單層 attention-only transformers 是二元和 skip 三元模型的集合。同零層 transformers 一樣,二元和 skip 三元表可以直接通過權(quán)重訪問,無需運行模型。這些 skip 三元模型的表達(dá)能力驚人,包括實現(xiàn)一種非常簡單的上下文內(nèi)學(xué)習(xí)。

對于單層 attention-only transformers 模型,有哪些路徑擴展(path expansion)技巧呢?研究者提供了一些。

如下圖所示,單層 attention-only transformers 由一個 token 嵌入組成,后接一個注意力層(單獨應(yīng)用注意力頭),最后是解除嵌入:

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

使用之前得到的張量標(biāo)記(tensor notation)和注意力頭的替代表征,研究者可以將 transformer 表征為三個項的乘積,具體如下圖所示:

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

研究者采用的核心技巧是簡單地擴展乘積,即將乘積(每個項對應(yīng)一個層)轉(zhuǎn)換為一個和,其中每個項對應(yīng)一個端到端路徑。他們表示,每個端到端路徑項都易于理解,可以獨立地進行推理,并能夠疊加組合創(chuàng)建模型行為。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

最后,兩層 attention-only transformers 模型可以使用注意力頭組合實現(xiàn)復(fù)雜得多的算法。這些組合算法也可以直接通過權(quán)重檢測出來。需要注意的是,兩層模型適應(yīng)注意力頭組合創(chuàng)建「歸納頭」(induction heads),這是一種非常通用的上下文內(nèi)學(xué)習(xí)算法。

具體地,當(dāng)注意力頭有以下三種組合選擇:

  • Q - 組合:W_Q 在一個受前面頭影響的子空間中讀取;
  • K - 組合:W_K 在一個受前面頭影響的子空間中讀??;
  • V - 組合:W_V 在一個受前面頭影響的子空間中讀取。

研究者表示,Q - 和 K - 組合與 V - 組合截然不同。前兩者都對注意力模式產(chǎn)生影響,允許注意力頭表達(dá)復(fù)雜得多的模式。而 V - 組合對一個注意力頭專注于某個給定位置時所要傳輸?shù)男畔a(chǎn)生影響。結(jié)果是,V - 組合頭變現(xiàn)得更像一個單一單元,并可以考慮用來創(chuàng)建額外的「虛擬注意力頭」。

對于 transformer 有一個最基礎(chǔ)的問題,即「如何計算 logits」?與單層模型使用的方法一樣,研究者寫出了一個乘積,其中每個項在模型中都是一個層,并擴展以創(chuàng)建一個和,其中每個項在模型中都是一個端到端路徑。

經(jīng)逆向工程,Transformer「翻譯」成數(shù)學(xué)框架 | 25位學(xué)者撰文

其中,直接路徑項和單個頭項與單層模型中的相同。最后的「虛擬注意力頭」項對應(yīng)于 V - 組合。虛擬注意力頭在概念上非常有趣,但在實踐中,研究者發(fā)現(xiàn)它們往往無法在小規(guī)模的兩層模型中發(fā)揮重大作用。

此外,這些項中的每一個都對應(yīng)于模型可以實現(xiàn)更復(fù)雜注意力模式的一種方式。在理論上,很難對它們進行推理。但當(dāng)討論到歸納頭時,會很快在具體實例中用到它們。

 

責(zé)任編輯:張燕妮 來源: 機器之心Pro
相關(guān)推薦

2022-02-10 15:15:41

人工智能強化學(xué)習(xí)谷歌

2023-01-09 13:06:21

AI

2016-01-05 15:20:02

Reverse逆向工具逆向工程

2022-04-19 09:24:18

QtC++框架

2020-09-28 10:47:41

Shellcode技術(shù)

2021-06-25 15:36:37

框架AI開發(fā)

2011-08-29 15:45:59

Lua函數(shù)

2011-03-24 09:57:28

PowerDesign逆向工程

2022-09-26 00:00:01

java代碼開發(fā)

2023-08-07 18:55:19

2023-05-23 14:05:09

智能AI

2022-03-26 10:18:26

GoogleRust獲獎?wù)?/a>

2022-11-01 13:52:44

AI數(shù)學(xué)

2021-04-02 06:18:27

Docker鏡像

2023-07-17 07:25:48

2017-07-11 09:46:00

防火墻翻譯安全

2023-10-11 12:32:53

AI模型

2019-04-11 18:31:29

面試開發(fā)架構(gòu)

2010-03-31 22:20:51

2025-06-03 09:08:49

點贊
收藏

51CTO技術(shù)棧公眾號

精品久久sese| 一区二区三区日韩精品视频| 日韩欧美久久久| 久久99精品久久久久久秒播放器 | 黄色一区二区在线观看| aaa亚洲精品| 成人网18免费网站| 91精品国产欧美一区二区成人| 国产精品久久久久久久久久| 亚洲av永久无码精品| 国产99在线观看| 国内精品久久久久久久影视麻豆| 国产婷婷色一区二区三区四区| 亚洲美女福利视频网站| 亚洲一区影院| 国产成人精品亚洲男人的天堂| 欧美久久天堂| 成人av片在线观看| 精品成人佐山爱一区二区| 国产性xxxx18免费观看视频| 日本电影全部在线观看网站视频| 免费黄色小视频在线观看| 国产调教在线| 国产在线1区| av不卡在线看| 亚洲视频在线看| 一区二区三区人妻| 日本中文字幕在线观看| aaa欧美日韩| 91aaaa| 男人天堂av在线播放| 亚洲国产精品久久久天堂| 日韩精品视频在线| 中文字幕第66页| 欧美白人做受xxxx视频| 粉嫩一区二区三区性色av| 国产精品欧美一区二区三区奶水 | 污视频免费在线观看| 午夜精品成人av| 亚洲午夜视频在线观看| 精品午夜一区二区三区| 国产高清在线免费| 最新亚洲精品| 亚洲国产黄色片| 国产视频九色蝌蚪| 精品一性一色一乱农村| 亚洲女同一区二区| av日韩中文字幕| 国产免费一区二区三区免费视频| 免费日本视频一区| 亚洲欧美国产一区二区三区| 国产chinese中国hdxxxx| 久久爱www.| 91啦中文在线观看| 精品无人区一区二区三区竹菊| 欧美一区,二区| 国产成人精品免费| 欧美做爰性生交视频| 懂色av蜜桃av| 精品一区免费| 亚洲精品资源美女情侣酒店| 久久丫精品国产亚洲av不卡| 欧美一级一片| 亚洲精品视频久久| 91成人破解版| 欧洲激情综合| 自拍偷拍亚洲在线| 久久嫩草捆绑紧缚| 亚洲欧洲日韩| 欧美激情videos| 日本三级网站在线观看| 亚洲毛片在线| 日本国产精品视频| 在线观看国产区| 蜜桃在线一区二区三区| 成人免费视频在线观看超级碰| 97在线公开视频| 国产自产v一区二区三区c| 91av免费看| 欧美 日韩 中文字幕| 91麻豆免费观看| 欧美另类视频在线| 1024视频在线| 伊人一区二区三区| 91九色丨porny丨国产jk| 国产伦子伦对白在线播放观看| 欧美日韩精品中文字幕| 国产精品专区在线| 国产伦精品一区二区三区视频金莲| 在线免费av一区| 精品久久久99| 99国产精品久久一区二区三区| 日韩av一卡二卡| 东京热无码av男人的天堂| 亚洲欧洲美洲一区二区三区| 97精品一区二区三区| 波多野结衣视频在线观看| 精品午夜一区二区三区在线观看| 国产99在线播放| 国产在线视频资源| 亚洲女厕所小便bbb| 人妻久久久一区二区三区| 日韩漫画puputoon| 精品国产91洋老外米糕| 一级黄色录像毛片| 黄色亚洲精品| 国产精品久久久久久久久久| www日本高清| 国产亚洲一区二区三区在线观看| 亚洲 欧洲 日韩| 日韩在线伦理| 欧美一区日本一区韩国一区| 中文字幕5566| 外国成人免费视频| 日本精品久久电影| 国产高清在线免费| 国产精品你懂的| 国自产拍偷拍精品啪啪一区二区 | 欧美一区三区| 午夜精品福利电影| 国产精品久久久久久免费免熟| 91亚洲国产成人精品一区二三 | 一本一本久久a久久综合精品| 国产69久久精品成人看| 国产成人精品av在线观| 国产精品伦一区| 亚洲精品无码久久久久久| 欧美成人精品午夜一区二区| 中文字幕av一区| 91精品国产乱码在线观看| 国产一区二区三区四区在线观看| 日韩成人av网站| 神马午夜在线视频| 亚洲缚视频在线观看| wwwav国产| 麻豆成人久久精品二区三区小说| 蜜桃传媒视频麻豆一区| 国产白丝在线观看| 日韩一区二区三| 黄色精品视频在线观看| 日韩电影免费一区| 免费日韩电影在线观看| f2c人成在线观看免费视频| 91精品综合久久久久久| 色偷偷男人天堂| 日韩精品福利网| 欧美成人在线免费观看| 国产污视频在线播放| 精品日韩成人av| 国产在线看片免费视频在线观看| 欧美一区二区成人6969| 色撸撸在线视频| 日韩高清欧美激情| 欧美久久久久久| 成人性生活av| 亚洲欧美激情另类校园| 日韩av大片在线观看| 日韩av色综合| 欧美日韩人妻精品一区二区三区| 日本特黄久久久高潮| 麻豆91av| 麻豆国产在线| 亚洲精品狠狠操| 国产稀缺真实呦乱在线| 国产.精品.日韩.另类.中文.在线.播放 | 99re热精品| 麻豆网站在线观看| 欧美高清你懂得| 91杏吧porn蝌蚪| 国产乱码精品一区二区三区av| 国产精品久久成人免费观看| 激情综合婷婷| 欧美精品精品精品精品免费| 人妻少妇精品无码专区久久| 亚洲va欧美va人人爽午夜| 97香蕉碰碰人妻国产欧美| 国产精品日本欧美一区二区三区| 欧美日韩国产精品一卡| 成人免费黄色| 久久人人爽人人爽人人片亚洲| 国产浮力第一页| 亚洲无人区一区| 亚洲国产欧美视频| 美女视频黄 久久| 国内精品国产三级国产99| 亚洲综合影院| 青草成人免费视频| 日韩黄色影院| 亚洲а∨天堂久久精品9966| 亚洲 日本 欧美 中文幕| 国产精品久久久久久户外露出| 亚洲视频在线不卡| 国产一级一区二区| 成年人免费观看的视频| 成人激情自拍| 国产精品极品美女在线观看免费| mm1313亚洲国产精品美女| 亚洲精品美女久久久久| 亚洲精品成人在线视频| 亚洲女与黑人做爰| 精品人妻无码一区| 国产精品99久久久久久似苏梦涵| 伊人成色综合网| 久久网站免费观看| 国产一区福利视频| 四虎国产精品成人免费影视| 97视频在线观看播放| 日本不卡不卡| 日韩精品在线免费观看| 国产精品久久久久久无人区| 欧美日韩一区二区免费在线观看 | 国产精品人妻一区二区三区| 婷婷丁香久久五月婷婷| 日韩av毛片在线观看| 成+人+亚洲+综合天堂| 在线免费观看视频黄| 一区在线免费| 精品少妇人妻av一区二区| 香蕉久久99| 成人av资源网| 亚洲国产精选| 国产成人精品日本亚洲| 91制片在线观看| 日韩亚洲综合在线| 黄色视屏网站在线免费观看| 亚洲第一福利网站| 99产精品成人啪免费网站| 欧美在线综合视频| 免费看日批视频| 亚洲五月六月丁香激情| 亚洲综合网在线| 国产精品久久久久影视| 久久国产精品影院| 99久久99久久免费精品蜜臀| 人妻巨大乳一二三区| 老鸭窝一区二区久久精品| 精品99在线视频| 日韩午夜一区| 91黄色在线看| 女主播福利一区| 亚洲精品一区二区三区av| 妖精一区二区三区精品视频| 激情五月综合色婷婷一区二区 | 欧美视频在线一区二区三区 | 五月激情久久久| 日韩亚洲视频在线| 久久爱www成人| 免费在线观看91| 色爱综合av| 欧美成熟毛茸茸复古| 亚洲日产av中文字幕| 久久偷窥视频| 一道本一区二区三区| 鲁丝片一区二区三区| 日韩动漫一区| 欧美精品亚洲精品| 久久99国产精品视频| 日韩久久精品一区二区三区| 精品国精品国产自在久国产应用| 欧美专区一二三 | 精品写真视频在线观看| 精品亚洲视频在线| 国产精品主播直播| 香蕉视频免费网站| av电影一区二区| 丰满少妇一区二区| 国产精品网站在线观看| av最新在线观看| 亚洲激情六月丁香| www.天天色| 色综合久久中文综合久久牛| 一级一片免费看| 欧美日本韩国一区二区三区视频| 国产精品视频一区二区三区,| 91精品蜜臀在线一区尤物| 国产浮力第一页| 日韩电视剧免费观看网站| 国产一二三区在线视频| 久久久av电影| 日本孕妇大胆孕交无码| 欧美一区二区大胆人体摄影专业网站| 美女福利一区二区三区| 国产在线拍偷自揄拍精品| 香港久久久电影| 蜜桃导航-精品导航| 色爱综合网欧美| www成人免费| 欧美亚洲专区| 亚洲一二三不卡| proumb性欧美在线观看| 91成人破解版| 亚洲激情图片一区| 精品欧美一区二区三区免费观看| 欧美视频一区二区三区在线观看| 99热这里只有精品1| 日韩av资源在线播放| 2021av在线| 国语自产在线不卡| 国语自产精品视频在线看抢先版结局| 91免费看片在线| 色老板在线视频一区二区| 一本一本a久久| 99在线精品免费视频九九视| 中文字幕亚洲乱码| 99久久久精品| 青青操在线视频观看| 欧美香蕉大胸在线视频观看| 91久久久久国产一区二区| 亚洲国产成人精品一区二区| 日本电影在线观看网站| 欧美激情亚洲精品| 日本免费一区二区三区等视频| 国产私拍一区| 97精品97| 亚洲精品高清无码视频| 成人久久视频在线观看| 永久免费看片直接| 欧美亚洲图片小说| 懂色中文一区二区在线播放| 大又大又粗又硬又爽少妇毛片| 自拍av一区二区三区| 国产亚洲欧美日韩高清| 亚洲成人精品久久久| 激情在线小视频| 国产精品狠色婷| 欧美丝袜美腿| 妞干网在线播放| 激情六月婷婷久久| 日韩一级av毛片| 欧美日韩另类视频| 精品无码久久久久成人漫画| 亚洲亚洲人成综合网络| 在线观看中文字幕码| 精品一区二区亚洲| 超级碰碰不卡在线视频| 91在线网站视频| 三上亚洲一区二区| www亚洲成人| 国产性色一区二区| 手机看片久久久| 亚洲第一精品福利| 国产呦小j女精品视频| 亚洲免费视频成人| 一本到在线视频| 在线视频精品一| 久久野战av| 欧美一区二区三区四区五区六区| 日韩一级网站| 黑森林av导航| 亚洲综合色丁香婷婷六月图片| 国产视频在线观看免费| 久久精品电影一区二区| 日韩黄色碟片| 一区二区三区视频| 久久99精品国产麻豆不卡| 大胸美女被爆操| 欧美在线观看18| 超碰免费在线| 国产精品高清在线| 不卡在线一区二区| 不卡的av中文字幕| 亚洲欧洲美洲综合色网| 国产又大又粗又硬| 欧美成人全部免费| 中文字幕一区日韩精品| 日韩av高清在线看片| 91视频你懂的| 国产精品久久久久久久久夜色| 伊人青青综合网站| 欧美一区二区三区婷婷| 少妇高潮大叫好爽喷水| 高清在线成人网| 日本网站在线播放| 亚洲色图18p| 日本免费一区二区三区等视频| 欧美与动交zoz0z| 成人看片黄a免费看在线| 黄色片视频免费| 日韩一区二区福利| 中文在线综合| 99视频在线免费| 综合电影一区二区三区| 国产91久久久| 日本人成精品视频在线| 97偷自拍亚洲综合二区| 成人啪啪18免费游戏链接| 狠狠综合久久av一区二区小说| 国产女人在线观看| 亚洲最大福利视频| 国产精品婷婷| www.xx日本| 精品999久久久| 成人国产精品一区二区免费麻豆| 日韩不卡视频一区二区| 91麻豆精品在线观看| 91美女精品网站| 97视频在线免费观看| 99精品网站| 我和岳m愉情xxxⅹ视频| 777午夜精品视频在线播放|