精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

單一作者論文,谷歌提出百萬專家Mixture,超越密集前饋、稀疏MoE

人工智能 新聞
釋放進一步擴展 Transformer 的潛力,同時還可以保持計算效率。

標準 Transformer 架構(gòu)中的前饋(FFW)層會隨著隱藏層寬度的增加而導(dǎo)致計算成本和激活內(nèi)存的線性增加。在大語言模型(LLM)體量不斷增大的現(xiàn)在,稀疏混合專家(MoE)架構(gòu)已成為解決此問題的可行方法,它將模型大小與計算成本分離開來。很多新興的 MoE 模型都可以實現(xiàn)相同體量之上,更好的性能與更強大的表現(xiàn)。

最近發(fā)現(xiàn)的細粒度 MoE 擴展定律表明,更高的粒度可帶來更好的性能。然而由于計算和優(yōu)化方面的挑戰(zhàn),現(xiàn)有的 MoE 模型僅限于低數(shù)量專家。

本周二,Google DeepMind 的新研究引入了一種參數(shù)高效的專家檢索機制,其利用乘積密鑰技術(shù)從一百萬個微型專家中進行稀疏檢索

圖片


鏈接:https://arxiv.org/abs/2407.04153

該方法嘗試通過用于路由的學(xué)習(xí)索引結(jié)構(gòu)有效地串聯(lián)到大量微小專家,從而將計算成本與參數(shù)計數(shù)分離。與密集的 FFW、粗粒度 MoE 和產(chǎn)品密鑰存儲器 (PKM) 層相比,表現(xiàn)出卓越的效率。

這項工作引入了參數(shù)高效專家檢索(PEER) 架構(gòu)(parameter efficient expert retrieval),利用產(chǎn)品密鑰(product key)檢索高效地路由到大量專家,將計算成本與參數(shù)量分離。這種設(shè)計在實驗中展示了卓越的計算性能水平,將其定位為用于擴展基礎(chǔ)模型的密集 FFW 層的競爭性替代方案。這項工作的主要貢獻是:

極端 MoE 設(shè)置的探索:與以前的 MoE 研究中對少數(shù)大型專家的關(guān)注不同,這項工作研究了眾多小型專家的未充分探索的情況。

用于路由的學(xué)習(xí)索引結(jié)構(gòu):首次證明學(xué)習(xí)索引結(jié)構(gòu)可以有效地路由到超過一百萬個專家。

新的層設(shè)計:將產(chǎn)品密鑰路由與單神經(jīng)元專家相結(jié)合,我們引入了 PEER 層,它可以擴展層容量而無需大量計算開銷。實證結(jié)果表明,與密集 FFW、粗粒度 MoE 和產(chǎn)品密鑰內(nèi)存 (PKM) 層相比,其效率更高。

綜合消融研究:我們研究了 PEER 的不同設(shè)計選擇(例如專家數(shù)量、活動參數(shù)、頭數(shù)量和查詢批量規(guī)范化)對語言建模任務(wù)的影響。

方法介紹

本節(jié)中,研究者詳解了參數(shù)高效專家檢索 (PEER) 層,它一種混合專家架構(gòu),使用路由中的產(chǎn)品密鑰和單神經(jīng)元 MLP 作為專家。下圖 2 展示了 PEER 層內(nèi)的計算過程。

圖片

PEER 層概覽。從形式上看,PEER 層是一個函數(shù) f : R^n → R^m,它由三部分組成:一個由 N 個專家組成的池 E := {e_i}^N_i=1,其中每個專家 e_i : R^n → R^m 與 f 共享相同的簽名;一組相應(yīng)的 N 個產(chǎn)品密鑰 K := {k_i}^N_i=1 ? R^d ;以及一個查詢網(wǎng)絡(luò) q : R^n → R^d,它將輸入向量 x ∈ R^n 映射到查詢向量 q (x)。

令 T_k 表示 top-k 運算符。給定輸入 x,首先檢索 k 個專家的子集,這些專家的相應(yīng)產(chǎn)品鍵與查詢 q (x) 具有最高的內(nèi)積。

圖片


然后將非線性激活(例如 softmax 或 sigmoid)應(yīng)用于前 k 個專家的查詢鍵內(nèi)積,以獲得路由分數(shù)。

圖片


最后通過對路由分數(shù)加權(quán)的專家輸出進行線性組合來計算輸出。

圖片


產(chǎn)品密鑰檢索。由于研究者打算使用大量專家(N ≥ 10^6),單純計算公式 1 中的前 k 個索引可能成本非常高,因此應(yīng)用了產(chǎn)品密鑰檢索技術(shù)。他們不使用 N 個獨立的 d 維向量作為密鑰 k_i,而是通過連接兩個獨立的 d/2 維子密鑰集(即 C, C ′ ? R d/2) 中的向量來創(chuàng)建它們:

圖片

參數(shù)高效專家和多頭檢索。與其他 MoE 架構(gòu)不同,這些架構(gòu)通常將每個專家的隱藏層設(shè)置為與其他 FFW 層相同的大小。而在 PEER 中,每個專家 e_i 都是一個單例 MLP,換句話說,它只有一個帶有單個神經(jīng)元的隱藏層:

圖片

研究者沒有改變單個專家的規(guī)模,而是使用了多頭檢索來調(diào)整 PEER 層的表達能力,這類似于 transformer 中的多頭注意力機制和 PKM 中的多頭記憶。

具體來說,他們使用 h 個獨立的查詢網(wǎng)絡(luò),每個網(wǎng)絡(luò)計算自己的查詢并檢索一組單獨的 k 個專家。不過,不同的頭共享同一個專家池,具有相同的產(chǎn)品密鑰集。這 h 個頭的輸出簡單地總結(jié)如下:

圖片

為什么要有大量的小專家?給定的 MoE 層可以用三個超參數(shù)來表征它:參數(shù)總數(shù) P、每個 token 的活躍參數(shù)數(shù)量 P_active 和單個專家的大小 P_expert。Krajewski 等人 (2024) 表明,MoE 模型的 scaling law 具有以下形式:

圖片

對于 PEER,研究者通過設(shè)置 d_expert = 1 來使用盡可能最小的專家規(guī)模,激活神經(jīng)元的數(shù)量是檢索頭的數(shù)量乘以每個頭檢索到的專家數(shù)量:d_active = hk。因此,PEER 的粒度始終為 G = P_active/P_expert = d_active/d_expert = hk。

圖片

實驗結(jié)果

我們首先來看在語言建模數(shù)據(jù)集上的評估結(jié)果。

在根據(jù) isoFLOP 曲線確定每種方法的計算最優(yōu)模型后,研究者在以下幾個流行語言建模數(shù)據(jù)集上評估了這些預(yù)訓(xùn)練模型的性能:

  • Curation Corpus
  • Lambada
  • Pile
  • Wikitext
  • 預(yù)訓(xùn)練數(shù)據(jù)集 C4

下表 1 展示了評估結(jié)果。研究者根據(jù)訓(xùn)練期間使用的 FLOP 預(yù)算對模型進行了分組。可以看到,PEER 在這些語言建模數(shù)據(jù)集上的困惑度最低。

圖片

在消融實驗中,研究者改變了專家總數(shù)量。下圖 1 中 isoFLOP 曲線所示的模型都有超過一百萬個(1024^2  )專家。

圖片

研究者選擇了 isoFLOP 最優(yōu)位置的模型,并改變了 PEER 層中的專家數(shù)量(N = 128^2、256^2、512^2、1024^2),同時保持活躍專家數(shù)量不變(h = 8,k = 16)。結(jié)果如下圖 3 (a) 所示。

可以看到,isoFLOP 曲線在具有 1024^2 個專家的 PEER 模型和相應(yīng)的密集主干之間進行插值,而無需用 PEER 層替換中間塊中的 FFW 層。這表明,只需增加專家數(shù)量就可以提高模型性能。

同時,研究者改變了活躍專家的數(shù)量。他們系統(tǒng)地改變了活躍專家的數(shù)量(hk = 32、64、128、256、512),同時保持專家總數(shù)不變(N = 1024^2)。對于給定的 hk,研究者則聯(lián)合改變 h 和 k 以確定最佳組合。下圖 3 (b) 繪制了關(guān)于頭數(shù)量 (h) 的 isoFLOP 曲線。

圖片

下表 2 列出了使用和不使用 BN 時不同數(shù)量專家的專家使用率和不均勻性。可以看到,即使對于 1M 個專家,專家使用率也接近 100%,并且使用 BN 可以使專家的利用率更加均衡,困惑度更低。這些發(fā)現(xiàn)證明了 PEER 模型在利用大量專家方面的有效性。

圖片

研究者還比較了有無 BN 的 isoFLOP 曲線。下圖 4 顯示,有 BN 的 PEER 模型通常可以實現(xiàn)較低的困惑度。雖然差異并不顯著,但在 isoFLOP 最優(yōu)區(qū)域附近差異最為明顯。

圖片

作者介紹

PEER 研究只有一位作者 Xu He(Owen),他是 Google DeepMind 研究科學(xué)家,2017 年博士畢業(yè)于荷蘭格羅寧根大學(xué)。

圖片

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-02-26 18:46:35

機器學(xué)習(xí)數(shù)據(jù)集算法

2024-07-15 13:22:56

2022-04-14 18:03:16

深度學(xué)習(xí)AI谷歌

2022-04-18 15:56:49

AI模型系統(tǒng)

2024-01-10 17:37:17

概率token模型

2022-06-13 11:57:04

谷歌模型計算

2024-11-11 13:24:02

2024-11-21 10:21:06

2025-03-11 00:35:00

DeepSeektoC業(yè)務(wù)

2024-10-21 12:30:00

模型框架

2024-01-10 16:01:28

2020-03-02 11:04:19

人工智能機器學(xué)習(xí)技術(shù)

2025-01-07 11:22:15

2023-03-09 14:04:00

谷歌研究

2021-01-13 15:16:45

谷歌架構(gòu)開發(fā)者

2024-11-01 16:46:48

2025-09-29 14:02:02

DeepMind模型AI

2024-12-20 11:41:52

2019-11-06 17:00:51

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)人工智能

2025-02-17 03:00:00

LLMsMoELLM
點贊
收藏

51CTO技術(shù)棧公眾號

97视频免费观看| 欧美日韩成人激情| 欧洲亚洲一区二区三区四区五区| 黄色av一级片| 欧美一区二区| 日韩电影大全免费观看2023年上 | 国产精品视频一区二区久久| 日本伊人精品一区二区三区观看方式| www.国产一区| 国产精品第七页| 亚洲精品aaa| 精品久久在线播放| 3atv一区二区三区| 日韩在线三级| 国产18精品乱码免费看| 日本 国产 欧美色综合| 高清视频欧美一级| 亚洲色图日韩精品| 日韩欧美ww| 91精品国产色综合久久ai换脸| 久久久亚洲精品无码| 黄色在线免费看| 久久久精品综合| 国产一级精品aaaaa看| 96日本xxxxxⅹxxx17| 久久视频一区| 69av在线视频| 久草网在线观看| 制服丨自拍丨欧美丨动漫丨| 精品肉辣文txt下载| 亚洲一二三四在线观看| 亚洲一区二区精品在线观看| 欧美午夜黄色| 成av人片一区二区| 97视频中文字幕| 91精品国产综合久| 日本免费在线视频不卡一不卡二| 88xx成人精品| 国产无遮挡免费视频| 欧美激情麻豆| 久久婷婷国产麻豆91天堂| 熟女少妇内射日韩亚洲| 国产精品密蕾丝视频下载| 精品国产一区二区三区av性色| 国产在线久久久| 国产一级特黄a大片免费| 爱情岛亚洲播放路线| 亚洲精品国产无天堂网2021| 丰满女人性猛交| 日本中文字幕在线观看| 国产精品护士白丝一区av| 日韩影片在线播放| 高清福利在线观看| 国产女主播视频一区二区| 久久99精品国产99久久| 亚洲欧美一区二区三| k8久久久一区二区三区| 精品毛片久久久久久| 欧美在线 | 亚洲| 不卡的电视剧免费网站有什么| 成人情视频高清免费观看电影| 超碰97免费观看| 日韩福利片在线观看| 国产综合久久| 91福利视频网| 夜夜爽妓女8888视频免费观看 | 久久久国产欧美| 欧美日韩五区| 制服丝袜一区二区三区| 国产成人av影视| 电影一区电影二区| 欧美丰满少妇xxxxx高潮对白| 在线播放免费视频| 6080成人| 亚洲乱亚洲乱妇无码| 五月天综合视频| 91亚洲一区| 欧美激情成人在线视频| 国产精品二区三区| 精品人妻av一区二区三区| 国产成人亚洲综合a∨婷婷图片| 成人自拍网站| 欧美少妇另类| 国产精品第13页| 欧日韩免费视频| 我爱我色成人网| 欧美日韩国产精品自在自线| 国产chinesehd精品露脸| 视频福利一区| 日韩在线观看免费高清完整版| 日本妇女毛茸茸| 午夜亚洲影视| 91精品视频网站| 日本激情视频网站| 国产精品每日更新| 久久久av一区| 亚洲乱妇老熟女爽到高潮的片 | 欧美精品一区二区三区久久久| 亚洲天堂资源在线| 久久精品99久久无色码中文字幕| 精品中文字幕视频| 不卡av电影在线| 国产精品99久久久| 欧美裸体网站| 女子免费在线观看视频www| 色一区在线观看| 色哟哟网站在线观看| 成人精品中文字幕| 性色av一区二区三区| 一级片免费网站| 2023国产一二三区日本精品2022| 国产一区一区三区| 日韩在线观看不卡| 中文字幕一区二区三区欧美日韩| 久久久久久久国产精品| 亚洲熟女乱色一区二区三区久久久| 成人动漫在线一区| 亚洲日本欧美在线| 成人片免费看| 精品国产第一区二区三区观看体验| 国产精品av久久久久久无| 影音先锋亚洲电影| 91精品视频在线免费观看| 国产福利小视频在线观看| 亚洲国产另类av| 宇都宫紫苑在线播放| 国产成人一区二区三区影院| 97在线免费观看| 亚洲第一视频在线播放| 中文字幕在线不卡一区| 超碰av在线免费观看| 国产富婆一级全黄大片| 日产午夜精品一线二线三线| 欧美精品免费在线观看| 一区二区视频免费观看| 国产午夜精品一区二区| 亚洲中文字幕无码专区| 大伊香蕉精品在线品播放| 欧美精品免费在线观看| 国产女人18毛片18精品| 国产精品免费久久| 一区二区三区韩国| 欧洲grand老妇人| 国产精品成人观看视频国产奇米| 日本黄色三级视频| 疯狂欧美牲乱大交777| 国产xxxx视频| 99国产精品自拍| 久久国产精品亚洲va麻豆| 国产自产自拍视频在线观看| 国产精品系列在线播放| 久久久久久97| 丁香六月色婷婷| 亚洲成人在线网站| 久久久老熟女一区二区三区91| 精品成人久久| 国产一区二区在线观看免费播放| cao在线视频| 日韩av在线最新| 无码人妻精品一区二区三区不卡| 久久久久国色av免费看影院| 欧美激情精品久久久久久小说| 伊人久久大香线蕉av不卡| 国产成人一区二区三区小说| av网站在线免费播放| 欧美丝袜自拍制服另类| 操她视频在线观看| 国产一区二区三区av电影| 日韩视频一二三| 丁香一区二区| 成人午夜在线视频| 国产在线视频一区| 呦呦在线视频| 亚洲国产精品悠悠久久琪琪| 天天干天天色综合| 日本一区二区三区在线观看| 日韩va在线观看| 欧美日韩爆操| 蜜桃视频在线观看成人| av免费在线一区| 蜜臀久久99精品久久久无需会员 | 久久久精品人妻一区二区三区四| 成人av在线看| 992kp快乐看片永久免费网址| 91日韩视频| 精品国产综合久久| 日本成人一区二区| 国外成人在线直播| 色婷婷免费视频| 亚洲福利影视| 午夜精品久久17c| 91在线直播| 亚洲白虎美女被爆操| 青青草视频在线观看免费| 亚洲欧美另类小说视频| 免费a v网站| 久久99久久精品| 精品少妇在线视频| 久久免费精品视频在这里| 国产区一区二区| 欧美一区=区三区| 97人人爽人人喊人人模波多| 免费在线观看av片| 亚洲欧洲成视频免费观看| 99久久精品国产成人一区二区| 精品欧美国产一区二区三区| 性欧美疯狂猛交69hd| 91视频在线看| 性折磨bdsm欧美激情另类| 污网站在线免费看| 国产精品免费视频一区| 亚洲av熟女高潮一区二区| 蜜桃视频在线观看一区| 欧美国产激情视频| 欧美福利一区| 中文字幕在线中文字幕日亚韩一区| 亚洲精品一级二级三级| 超碰97在线资源| 国产欧美88| 国产在线精品一区免费香蕉| 亚洲www.| 日本一区二区三区在线播放| av中文字幕在线观看第一页| 久久不射电影网| 在线观看av黄网站永久| 亚洲免费视频观看| 手机在线观看毛片| 欧美哺乳videos| 国产三级第一页| 欧美色涩在线第一页| 国产精品熟女视频| 日韩欧美黄色| 国产精品96久久久久久| 成人性生活视频| 6080yy精品一区二区三区| 波多野结衣在线播放| 欧美日本亚洲视频| av网站大全在线| 久久精品人人做人人爽| 欧美成人hd| 日韩亚洲综合在线| 欧美一区二区三区| 视频在线观看99| 天天影视久久综合| 日韩亚洲精品视频| 精品51国产黑色丝袜高跟鞋| 日本免费一区视频| 亚洲二区中文字幕| 天天干,夜夜操| 日韩经典一区二区三区| 日本一卡二卡四卡精品| 亚洲精品中文字幕av| 欧美理论在线观看| 伊人性伊人情综合网| 亚洲三区四区| 加勒比色老久久爱综合网| 国产激情美女久久久久久吹潮| 视频精品一区| 国产欧美一区二区在线播放| 果冻天美麻豆一区二区国产| 九九九久久久| 红桃成人av在线播放| 亚洲一一在线| 欧美fxxxxxx另类| 国产二区视频在线| 六月婷婷一区| 日韩中文字幕a| 高清成人免费视频| 黄色短视频在线观看| 国产日本亚洲高清| 女同久久另类69精品国产 | 久久久久久激情| 亚洲成人资源网| 免费看一级视频| 69成人精品免费视频| 黄频在线免费观看| 久久免费黄色| 国产xxxx振车| 羞羞答答国产精品www一本| 蜜臀视频一区二区三区| 狠狠狠色丁香婷婷综合激情| 成人欧美精品一区二区| 久久美女高清视频| 欧美三级黄色大片| 福利视频导航一区| 亚洲一区中文字幕在线| 精品免费99久久| 国产免费av在线| 欧美福利在线观看| 中韩乱幕日产无线码一区| 99久热re在线精品996热视频| 杨幂一区二区三区免费看视频| 一道精品一区二区三区| 国产日韩欧美一区| 亚洲一二区在线观看| 久久久久久久久蜜桃| 农村黄色一级片| 色噜噜狠狠色综合欧洲selulu| 国产女人高潮毛片| 永久免费看mv网站入口亚洲| 日本福利片在线观看| 亚洲黄色三级| 大肉大捧一进一出好爽动态图| 国产一级精品在线| 日韩女同一区二区三区 | 国产精品va视频| 欧美日韩一区二区三| 欧美成人中文| 99re精彩视频| 久久这里都是精品| 国产一级特黄毛片| 91精品久久久久久蜜臀| 国产一级网站视频在线| 久久久久久久爱| 视频精品一区二区三区| 亚洲一区二区高清视频| 久久久久国产一区二区| 怡红院一区二区| 亚洲美女在线国产| 中文字幕精品一区二区精| 日韩国产高清污视频在线观看| gogo在线高清视频| 国产精品一区二区久久精品| 亚洲一级理论片| 亚洲免费av在线| 一区二区三区黄色片| 亚洲香蕉成视频在线观看| 国产传媒在线| 国产精品欧美久久| 国产精品vip| 日本黄色一级网站| 亚洲免费在线视频一区 二区| 国产偷人爽久久久久久老妇app| 日韩精品在线免费播放| 久草免费在线视频| 狠狠色噜噜狠狠色综合久| 国产精品jizz在线观看美国| 欧美高清精品一区二区| 综合在线观看色| 国产老女人乱淫免费| 久久精彩免费视频| 中文幕av一区二区三区佐山爱| 一区二区三区欧美在线| 久久精品国产色蜜蜜麻豆| 九九九视频在线观看| 欧美亚洲免费在线一区| 成年人视频在线看| 国产成人在线视频| 日韩精品一区二区三区免费观影 | 久久99视频免费| 日本精品国产| 青草网在线观看| 成人精品高清在线| 草久久免费视频| 亚洲日韩中文字幕在线播放| 国产综合色区在线观看| 午夜久久资源| 精品一区二区三区欧美| 国产免费无码一区二区视频| 日韩精品一区二区三区四区 | 好男人免费精品视频| 国产成人在线精品| 99久久99久久精品国产片果冰| 亚洲第一成肉网| 亚洲小说欧美激情另类| 天天干天天色天天| 日韩免费在线看| 97精品在线| 蜜臀av粉嫩av懂色av| 一本大道久久a久久综合婷婷 | 国产精品传媒在线| 成年人看片网站| 欧美激情综合色综合啪啪| 一个色综合久久| 亚洲国产你懂的| 国产在线资源| 91亚洲永久免费精品| 雨宫琴音一区二区在线| 中文字幕第4页| 欧美一级高清片| 无码小电影在线观看网站免费| 日韩久久久久久久| 国产精品白丝av| 国产精品成人国产乱| 亚洲视频日韩精品| 亚洲一区 二区| 99色精品视频| 亚洲女性喷水在线观看一区| 亚洲三区在线观看无套内射| 国产情人节一区| 99精品99| 欧美黄色免费看| 亚洲一区第一页| 草草视频在线一区二区| 污网站免费在线| 黑人欧美xxxx| 免费污视频在线| 无遮挡亚洲一区| 91亚洲大成网污www| 国产99视频在线|