精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用最直觀的動畫,講解LLM如何存儲事實,3Blue1Brown的這個視頻又火了

人工智能 新聞
近日,3Blue1Brown 的《深度學習》課程第 7 課更新了,其中通過生動詳實的動畫展示了 LLM 存儲事實的方式。視頻瀏覽量高達 18 萬次。

向大模型輸入「Michael Jordan plays the sport of _____(邁克爾?喬丹從事的體育運動是……)」,然后讓其預測接下來的文本,那么大模型多半能正確預測接下來是「basketball(籃球)」。

這說明在其數以億計的參數中潛藏了有關這個特定個人的相關知識。用戶甚至會感覺這些模型記憶了大量事實。

但事實究竟如何呢?

近日,3Blue1Brown 的《深度學習》課程第 7 課更新了,其中通過生動詳實的動畫展示了 LLM 存儲事實的方式。視頻瀏覽量高達 18 萬次。

去年 12 月,谷歌 DeepMind 的一些研究者發布了一篇相關論文,其中的具體案例便是匹配運動員以及他們各自的運動項目。

圖片

雖然這篇論文并未完全解答有關 LLM 事實存儲的問題,但也得到了一些頗為有趣的結果,其中的一個重點是:事實保存在網絡中的一個特定部分,這個部分也就是我們熟知的多層感知器(MLP)。

在 3Blue1Brown 剛剛更新的這期視頻中,他們用 23 分的視頻演示了大型語言模型如何存儲和處理信息,主要包括以下部分:

  • LLM 中隱藏的事實是什么
  • 快速回顧 Transformers
  • 示例
  • 多層感知器
  • 計算參數

視頻地址:https://www.youtube.com/watch?v=9-Jl0dxWQs8

在演示視頻中,3b1b 的作者口齒清晰、語言標準,配合著高清畫面,讓讀者很好地理解了 LLM 是如何存儲知識的。

很多用戶在看完視頻后,都驚訝于 3Blue1Brown 教學質量:

圖片

還有網友表示,坐等更新這期視頻已經很久了:

圖片

接下來我們就深入 MLP 的細節吧。在這篇文章中,機器之心簡要介紹了核心內容,感興趣的讀者可以通過原視頻查看完整內容。

MLP 在大模型中的占比不小,但其實結構相比于注意力機制這些要簡單許多。盡管如此,理解它也還是有些難度。

為了簡單,下面繼續通過「喬丹打籃球」這個具體示例進行說明吧。

首先,我們先簡單了解一下 Transformer 的工作流程。Transformer 的訓練目標是基于已有 token 預測下一個 token(通常表示詞或詞組),而每個 token 都關聯了一個高維向量。

圖片

這些向量會反復通過兩類運算:注意力(允許向量之間彼此傳遞信息)與多層感知器(MLP)。當然,它們之間還存在一個特定的歸一化步驟。

在向量經過多次如此迭代之后,我們希望每個向量都已經吸收了足夠多的信息。這些信息有的來自訓練模型時植入模型權重的一般性知識,也有的來自上下文。這些知識就是模型預測下一 token 的依據。

圖片

需要注意的是,這些向量編碼的并不僅僅是單個詞匯,而是會在信息在網絡中流動時根據周圍的環境和模型的知識吸收更加豐富的含義。

總之,每一個向量編碼的信息都遠遠超過了單個詞匯的含義,如此模型才能預測接下是什么。而存儲這些信息就是 MLP(注意力的作用是將上下文結合在一起),也因此大模型的大多數參數都在 MLP 中(約三分之二)。

圖片

繼續「喬丹打籃球」這個示例。MLP 是如何存儲這一事實的。

圖片

首先我們做一些假設:在高維空間中有這樣三個不同的向量,它們分別定義了喬丹的姓 Jordan 和名 Michael 以及籃球 Basketball。

圖片

現在,如果該空間中有一個向量與 Michael 向量的乘積為 1,則我們認為該向量編碼了 Michael 這一概念;而如果這個乘積為 0 甚至負數,則認為該向量與 Michael 沒有關聯。

同樣,我們可以計算該向量與 Jordan 或 Basketball 的乘積,以了解其與這兩個概念的關聯程度。

圖片

而通過訓練,可讓該向量與 Michael 和 Jordan 的乘積均為 1,此時就可以認為該向量編碼了 Michael Jordan 這個整體概念。

MLP 的內部細節

圖片

當這個編碼了上述文本的向量序列穿過一個 MLP 模塊時,該序列中的每個向量都會經歷一系列運算:

圖片

之后,會得到一個與輸入向量同維度的向量。然后再將所得向量與輸入向量相加,得到輸出向量。

序列中的每個向量都會經歷這樣的操作,此時這些操作都是并行執行的,彼此之間互不影響。

圖片

對于「喬丹打籃球」,我們希望對于輸入的「Michael Jordan」,經過一系列運算之后,能得到「Basketball」的向量。

首先來看這個過程的第一步。這個線性投射過程就相當于讓輸入向量乘以一個大型矩陣。這個矩陣里面的數據就是所謂的模型參數(model parameter)。你可以將其視為一個布滿控制旋鈕的儀表盤 —— 通過調整這些參數,我們就能控制模型的行為。

圖片

對于矩陣乘法,視頻中分享了一個視角。我們可以將矩陣乘法看作是將矩陣的每一行都視為一個向量,然后將這些行與被處理的向量(這里用 E 表示,意為 embeding,即嵌入)進行一系列點乘。

圖片

如果我們假設該矩陣的第一行剛好編碼了「First Name Michael」且被處理向量也編碼了它,那么所得的點積就約為 1。

而如果它們同時編碼了姓和名,那么所得的結果應該約等于 2。

圖片

你可以認為該矩陣的其它行正在并行地處理其它問題。

圖片

另外,通常來說,這一步還會向輸出添加另一個向量,也就是所謂的偏置向量,其中的參數是從數據中學習得到的。

圖片

在這個例子中,我們可以看到這個偏置向量的第一個元素為 -1。也就是說在最終的輸出向量中,之前得到的相關點積減去了 1。為什么要這樣操作?這是因為這樣一來,當且僅當向量編碼了全名「Michael Jordan」時,所得向量的第一項為正數,否則就為 0 或負數。

在實踐中,模型矩陣的規模非常大,比如 GPT-3 的矩陣有 49152 行和 12288 列(這個列數就是嵌入空間維度)。

圖片

事實上,這個行數恰好是嵌入空間維數的四倍。其實這只是一種設計選擇,你可以讓它更多,也可以讓它更少。

圖片

接下來我們用更簡潔的方式表示這個矩陣和向量,如下動圖所示:

圖片

經過上述線性過程之后,需要對輸出向量進行整理。這里通常會用到一個非常簡單的函數:整流線性單元(ReLU)。

深度學習社區傳統上喜歡使用過于花哨的名字,這個非常簡單的函數通常被稱為整流線性單元(ReLU)。

繼續我們的例子,中間向量的第一個元素在當且僅當全名是 Michael Jordan 時才為 1,否則為零或負數,在將其通過 ReLU 后,會得到一個非常干凈的值,其中所有零和負值都被截斷為零。因此對于全名 Michael Jordan,該輸出為 1,否則為 0。這個行為和「與門」非常相似。另外 ReLU 還有一個相對平滑的版本 GeLU。

圖片

接下來又是一個線性投射步驟,這一步與第一步非常相似:乘以一個大型矩陣,加上偏置,得到輸出向量。

圖片

但這一次,對于這個大型矩陣,我們不再以行的思路來思考它,而是以列的思路來看。這些列的維度與向量空間一樣。

圖片

如果第一列表示的是「Basketball」且 n_0 為 1(表示該神經元已激活),則該結果就會被添加到最終結果中;否則就不會影響最終結果。當然,這些列也可以表示任何概念。

圖片

類似地,我們將這個大矩陣簡化表示為 W ↓,將偏置表示為 B↓,并將其放回到圖中。

圖片

舉例來說,如果輸入向量中同時編碼了名字 Michael 和姓氏 Jordan,那么觸發操作序列后,便會得到指向 Baskerball 方向的輸出向量。

圖片

這個過程會并行地針對所有向量執行

圖片

這就是 MLP 的運算過程:兩個矩陣乘積,每個都添加了偏置。此前這種網絡曾被用來識別手寫數字,效果還算不錯。

圖片

GPT-3 中有 1750 億參數是如何計算的?

在接下來的章節中,作者介紹了如何計算 GPT-3 中的參數,并了解它們的位置。

圖片

對于 GPT-3 來說,嵌入空間的大小是 12288,將它們相乘,僅該矩陣就有六億多個參數,而向下投影(第二個矩陣)具有相同數量的參數,只是形狀進行了轉置,所以它們加起來大約有十二億參數。

圖片

此外,作者表示還需要考慮另外幾個參數,但這只占總數的很小一部分,可忽略不計。嵌入向量序列流經的不是一個 MLP,而是 96 個不同的 MLP,因此用于所有這些塊的參數高達 1000 多億,這約占網絡中總參數的三分之二。

圖片

最后,將注意力塊、嵌入和 unembedding 等組件的所有參數加起來,總計可以得到 1750 億參數。

圖片


另外值得一提的是,還有另一組與歸一化步驟相關的參數,不過視頻示例中跳過了這些參數,它們只占總數的很小一部分。

圖片

視頻最后介紹了疊加(Superposition)這一概念。證據表明,單個神經元很少像邁克爾?喬丹那樣代表某個單一特征,實際上可能有一個很好的理由,這與目前在可解釋性研究人員中流傳的一個想法有關,稱為 Superposition,這是一個假設,可能有助于解釋為什么這些模型特別難以解釋,以及為什么它們的擴展性出奇地好。

圖片

感興趣的讀者可以參考原視頻,了解更多內容。

3blue1brown 介紹

3blue1brown 是一個專門制作可視化講解視頻的頻道,其內容覆蓋數學、人工智能等領域,每門課都配有直觀生動的動畫演示,幫助觀眾加深對概念定理的理解。

除了 YouTube 上 640 萬訂閱者之外,3b1b 在 B 站上還有官方賬號,粉絲數量超過 215 萬,每個視頻都是 10 萬以上播放量,甚至有老師在課堂上播放該頻道的視頻。對于一個硬核教學 UP 主來說,這樣的成績幾乎是無人可及了。

作為一直以來都十分受歡迎的理解數學概念的網站,3blue1brown 的可視化一直都做得非常好。在本期視頻中,我們可以直觀感受到了。

3b1b 的創立者 Grant Sanderson,畢業于斯坦福大學數學系,他的大部分視頻和動畫引擎是獨立完成的,這是他此前在斯坦福學習時的業余項目。

在斯坦福,Grant「走了點計算機科學的彎路」,隨后畢業加入了 Khan Academy 并擔任了兩年的數學講師,在 2016 年之后,他開始全身心投入 3b1b 的工作中。

如果你對自己的學習能力信心不足,或許看看 3b1b 的內容會是一個好主意,全程動畫演示,讓你對知識點明白的徹徹底底。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-02-21 14:07:00

2024-11-28 16:45:50

2013-03-27 14:13:16

Windows Blu

2019-05-25 11:19:03

華為開發者存儲

2023-07-12 13:29:44

2013-03-25 13:56:22

Windows Blu

2024-12-30 20:32:36

2024-10-16 12:51:56

2021-09-15 14:19:58

電腦軟件設置

2025-04-22 09:26:00

2021-01-12 09:46:00

深度學習編程神經網絡

2024-09-19 17:52:47

2011-10-19 07:58:50

2019-01-02 16:12:17

Linux系統 vmstat

2019-10-23 07:00:13

TCP三次握手四次揮手

2024-11-05 13:30:00

2017-07-12 08:33:04

機房數據中心服務器

2023-09-27 08:18:03

2017-12-13 12:58:12

Raid工作原理

2021-09-29 09:35:29

Python典型化事實代碼
點贊
收藏

51CTO技術棧公眾號

国产亚洲毛片| 你懂的视频欧美| 一区二区三区鲁丝不卡| 国产精品乱码| 真实新婚偷拍xxxxx| 香蕉av一区二区| 亚洲加勒比久久88色综合| 国产成人av影视| 中文字幕资源网在线观看| 91亚洲国产成人精品一区二三 | 国产精品裸体一区二区三区| 一级片视频在线观看| 我不卡手机影院| 亚洲老头同性xxxxx| 黄色小视频免费网站| 欧美办公室脚交xxxx| 日韩毛片一二三区| 国产酒店精品激情| 欧美丝袜一区二区三区| 正在播放精油久久| 五月天婷婷视频| 久久99国产精品尤物| 欧美一级电影免费在线观看| 在线看的片片片免费| 日韩精选在线| 精品国产在天天线2019| 久热精品在线播放| 电影网一区二区| 亚瑟在线精品视频| av 日韩 人妻 黑人 综合 无码| 久久精品蜜桃| 成人精品鲁一区一区二区| 国产欧美日韩综合精品| 中文字幕国产在线观看| 欧美视频导航| 九九热最新视频//这里只有精品 | av在线免费观看国产| 成人福利在线| 久久综合狠狠综合久久激情| 成人一区二区三区四区| 国产日韩欧美一区二区东京热| 日韩av电影天堂| 青青久久av北条麻妃黑人| 日韩精品一区二区在线播放 | 久久久久久亚洲综合影院红桃 | 26uuu国产精品视频| 国产亚洲精品久久久久久打不开 | x99av成人免费| 日本污视频网站| 精品无人区麻豆乱码久久久| 亚洲精品一区二区三区不| 色呦呦一区二区| 日韩美女精品| 亚洲精品国产欧美| 李丽珍裸体午夜理伦片| 18国产精品| 精品国产乱码久久久久久久久| 97超碰免费在线观看| 亚洲高清在线一区| 精品久久久三级丝袜| 女同性αv亚洲女同志| 亚洲天堂中文字幕在线观看| 欧美一区二区高清| 2018国产精品| 欧美日日夜夜| 亚洲欧洲黄色网| ass极品国模人体欣赏| 欧美xxxxx视频| 不卡av电影院| 久久精品国产av一区二区三区| 国产精品mv在线观看| 68精品国产免费久久久久久婷婷| 97久久久久久久| 日本欧美一区二区三区乱码| 国产精品日韩欧美| 国产av一区二区三区| 国产suv精品一区二区三区| 91九色极品视频| 精品国精品国产自在久不卡| 成人午夜免费电影| 欧美二区在线| 麻豆传媒视频在线| 夜夜揉揉日日人人青青一国产精品 | 一区二区三区欧美| 免费国产黄色网址| 成人a在线观看高清电影| 777xxx欧美| 亚洲天堂2024| 日本不卡高清| 久久久久成人网| 丁香社区五月天| 狠狠色2019综合网| 久久精品一二三区| 无遮挡动作视频在线观看免费入口| 一区二区三区中文字幕| 国产精品后入内射日本在线观看| 精品三区视频| 精品国产露脸精彩对白| 精品人妻一区二区三区四区| 欧美视频久久| 国产欧美一区二区三区久久| 刘亦菲毛片一区二区三区| 久久久久久久久久久久久女国产乱| 制服诱惑一区| 亚洲wwww| 亚洲国产精品成人av| 国产视频精品免费| 国产亚洲福利| 91香蕉电影院| 国产视频二区在线观看| 亚洲成人av一区二区| 小泽玛利亚视频在线观看| 红杏视频成人| 欧美成人免费播放| 在线观看国产精品入口男同| 99在线精品一区二区三区| 黄瓜视频免费观看在线观看www| 中文字幕在线中文字幕在线中三区| 8v天堂国产在线一区二区| 日韩精品电影一区二区| 亚洲黄色免费| aaa级精品久久久国产片| 在线免费观看的av网站| 欧美日韩一区免费| 国产乱国产乱老熟300部视频| 日韩欧美大片| 国产精品丝袜高跟| 九色在线观看| 色综合天天综合狠狠| 国产情侣久久久久aⅴ免费| 999久久久精品国产| 国产成人亚洲综合91精品| 偷拍精品一区二区三区| 亚洲一区二区三区中文字幕在线| 在线黄色免费看| 日韩中文首页| 国产精品视频最多的网站| 人成在线免费视频| 好吊成人免视频| 人妻在线日韩免费视频| 日韩午夜免费| 国产一区二区不卡视频在线观看| 黄页网站在线| 精品国产乱码久久久久久闺蜜| 全网免费在线播放视频入口| 国产乱子伦视频一区二区三区| 自拍亚洲欧美老师丝袜| 精品久久毛片| 精品国产一区二区三区久久久| 亚洲影视一区二区| 中文字幕在线不卡一区二区三区| 在线观看免费av网址| 国产高清欧美| 亚洲aⅴ日韩av电影在线观看 | 亚洲欧美自拍另类日韩| 不卡中文一二三区| 国产日韩欧美中文在线播放| 91大神xh98hx在线播放| 欧美美女一区二区在线观看| 免费中文字幕日韩| 国产一区二区免费看| 久久香蕉视频网站| 欧美sss在线视频| 日本电影亚洲天堂| 黄色av免费在线看| 精品视频免费看| 91视频青青草| av爱爱亚洲一区| 亚洲黄色a v| 91精品二区| 精品一区二区不卡| 亚洲综合av一区二区三区| 日韩在线观看免费网站| wwwav在线播放| 午夜精品久久久久影视| b站大片免费直播| 精品一区二区免费在线观看| 国产一线二线三线女| 日本中文字幕在线一区| 国产精品免费电影| 特级毛片在线| 亚洲女人天堂成人av在线| 伊人久久成人网| 一区二区三区免费| 国产中年熟女高潮大集合| 国产欧美一区二区三区视频在线观看| 91久久夜色精品国产按摩| 成人网在线观看| sm久久捆绑调教精品一区| 亚洲天堂av网| 亚洲黄色a级片| 日本丶国产丶欧美色综合| 国精产品久拍自产在线网站| 国产成人在线视频网站| 男人天堂999| 中文字幕一区二区av | 久久精品亚洲欧美日韩精品中文字幕| 成人欧美一区二区三区视频xxx| 成人性生活视频| 久久综合五月天| 国产在线一在线二| 欧美va亚洲va在线观看蝴蝶网| 中文字幕高清在线免费播放| 一区二区三区中文在线观看| 波多野在线播放| 不卡免费追剧大全电视剧网站| 日韩精品视频一二三| 99成人在线| 2022中文字幕| 99久久99久久精品国产片桃花| 久久一区二区三区欧美亚洲| 久久九九精品视频| 国产精品啪视频| 手机看片久久| 97碰在线观看| 污片视频在线免费观看| 日韩中文字幕视频在线观看| 欧美精品少妇| 亚洲精品720p| 黑人乱码一区二区三区av| 欧美精品三级日韩久久| 波多野结衣av无码| 欧美视频在线免费看| 精品一级少妇久久久久久久| 亚洲人123区| 人妻互换一区二区激情偷拍| 久久精品亚洲精品国产欧美 | 亚洲av无码国产精品永久一区| 欧美日韩视频专区在线播放| 成人免费视频国产免费| 欧美午夜精品久久久久久久| 日操夜操天天操| 亚洲国产日韩在线一区模特| 日本老熟俱乐部h0930| 亚洲人吸女人奶水| 久久一级免费视频| 中文字幕日韩av资源站| 欧美亚洲色综久久精品国产| 久久久久国产成人精品亚洲午夜| 久久午夜夜伦鲁鲁片| av网站免费线看精品| 丝袜熟女一区二区三区| 国产jizzjizz一区二区| 国产调教打屁股xxxx网站| 国产精品一色哟哟哟| 26uuu国产| 成人午夜免费av| 国产肉体xxxx裸体784大胆| 91免费观看在线| 亚洲精品视频久久久| 久久综合五月天婷婷伊人| 少妇饥渴放荡91麻豆| 2021久久国产精品不只是精品| 熟妇高潮精品一区二区三区| 久久看人人爽人人| www亚洲色图| 亚洲欧洲精品一区二区三区不卡| 2014亚洲天堂| 亚洲综合丁香婷婷六月香| 日韩激情一区二区三区| 婷婷丁香激情综合| 九九精品免费视频| 欧美在线三级电影| 国产一区二区三区三州| 欧美一级精品在线| 刘亦菲毛片一区二区三区| 精品一区电影国产| 1024视频在线| 久久国产天堂福利天堂| 久色国产在线| 日本亚洲欧美三级| 四虎视频在线精品免费网址| 9a蜜桃久久久久久免费| 自拍自偷一区二区三区| 亚洲一区二区精品在线观看| 综合久久一区| 国产精品宾馆在线精品酒店| 全部av―极品视觉盛宴亚洲| 黄色片子免费看| 99精品视频在线播放观看| 黄色片网站免费| 亚洲乱码国产乱码精品精可以看| 91精品国产高潮对白| 在线观看成人小视频| 国产视频手机在线观看| 亚洲精品国产综合久久| 日本a在线播放| 69视频在线免费观看| 免费高清视频在线一区| 97在线中文字幕| 国产一区二区三区四区五区传媒| 99久久久无码国产精品性色戒| 影音先锋在线一区| www.com黄色片| zzijzzij亚洲日本少妇熟睡| 任我爽在线视频| 欧美日韩午夜剧场| 国产强被迫伦姧在线观看无码| 亚洲精品一区二区网址| 日本一级理论片在线大全| 国产精品v片在线观看不卡| 国产福利一区二区精品秒拍| 亚洲精蜜桃久在线| 亚洲深夜激情| 亚洲精品一二三四| 国产精品美日韩| av网站中文字幕| 欧美videofree性高清杂交| 九七久久人人| 国产精品久久久91| 天海翼精品一区二区三区| www.国产二区| 精品在线免费观看| 免费视频91蜜桃| 色呦呦国产精品| 天天综合网在线观看| 色综合视频网站| 亚洲精品乱码日韩| 日本一区不卡| 玖玖玖国产精品| 国产精品麻豆入口| 亚洲一区中文在线| 国产免费无遮挡| 色青青草原桃花久久综合| 日韩av电影资源网| 日本10禁啪啪无遮挡免费一区二区| 激情亚洲成人| 88av在线播放| 一区二区三区视频在线看| 99re只有精品| 久久夜色精品国产| 日本午夜免费一区二区| 先锋影音一区二区三区| 天堂蜜桃91精品| 99久久久无码国产精品衣服| 一本色道久久综合亚洲aⅴ蜜桃| 午夜美女福利视频| 色综合久久88色综合天天看泰| 9999精品| 特级西西人体www高清大胆| 黄网站免费久久| 婷婷伊人五月天| 欧美一区二区三区白人| 性网站在线观看| 国产伦精品一区二区三区高清| 国产一区二区三区自拍| 在线看黄色的网站| 午夜精品影院在线观看| 天天射天天操天天干| 日本亚洲欧洲色| 日韩免费视频| 免费av不卡在线| 亚洲精品伦理在线| 黄色www视频| 欧美最近摘花xxxx摘花| 欧美裸体在线版观看完整版| 亚洲这里只有精品| 亚洲激情在线激情| 日韩一级免费毛片| 国产91在线播放| 欧美国产偷国产精品三区| 毛片毛片毛片毛片毛| 亚洲电影在线播放| 青青青草原在线| 国产精品女人网站| 亚洲欧美网站在线观看| 一级黄色免费视频| 日韩欧美一区二区三区| av女优在线| 99国产盗摄| 国产精品美女久久久| 超碰人人干人人| 欧美一个色资源| 亚洲欧洲美洲av| 曰韩不卡视频| 成人国产视频在线观看| 天天爱天天做天天爽| 久久久黄色av| 日韩母乳在线| 国产探花在线观看视频| 亚洲va韩国va欧美va精品| 国产永久免费高清在线观看视频| 91欧美激情另类亚洲| 99在线观看免费视频精品观看| 欧美波霸videosex极品| 精品免费日韩av| 性欧美videohd高精| 日本香蕉视频在线观看| 久久久久99精品国产片| 精品人妻一区二区三区含羞草| 欧美在线不卡区| 亚洲精品小说| 免费观看av网站| 欧美xfplay| www.26天天久久天堂| 91丨porny丨探花| 中文字幕一区二区三区在线播放| 亚洲 国产 欧美 日韩| 亚洲va欧美va国产综合久久| 亚洲一区日本|