精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

顏水成袁粒提出新一代MoE架構:專家吞吐速度最高提升2.1倍!

人工智能 新聞
這個通用架構叫做MoE++,由顏水成領銜的昆侖萬維2050研究院與北大袁粒團隊聯合提出。

比傳統MoE推理速度更快、性能更高的新一代架構,來了!

這個通用架構叫做MoE++,由顏水成領銜的昆侖萬維2050研究院與北大袁粒團隊聯合提出。

總體來看,MoE++的創新之處在于引入了“零計算量專家”,得益于這個設計,使得新架構有了三大優勢:

  • 降低計算成本:MoE++允許每個Token使用可變數量的FFN專家,甚至可以完全跳過當前的MoE層。
  • 提升性能:通過減少簡單Token所需的FFN專家數量,MoE++使更多專家能夠專注于復雜的Token,釋放出比傳統MoE更大的性能潛力。
  • 零計算量專家的參數極小:可以在每個GPU上同時部署所有的零計算量專家,避免了分布式FFN專家部署帶來的通信開銷和專家負載不均的問題。

除此之外,MoE++還讓每個Token在選擇專家時參考前一層的路由路徑。

實驗結果表明,在0.6B到7B參數規模的LLMs上,MoE++在相同模型大小的情況下,相比傳統MoE,性能更優,同時實現了1.1到2.1倍的專家吞吐速度。

并且這個模型權重也已開源!

那么MoE++具體是如何做到的,我們繼續往下看。

MoE++是如何做到的?

現有的大多數混合專家(MoE)方法通常為所有Token激活固定數量的FFN專家。

在許多研究中,每個Token會選擇Top-2 FFN專家,并將它們的輸出加權合成為下一層的輸入。然而,并非所有Token的預測難度都是相同的。

例如,像逗號等簡單符號可能只需要一個FFN專家來處理。

甚至在某些特殊情況下,某些Token如果與當前MoE層的專家不匹配,繞過該層而不選擇Top-2 FFN專家反而可能更為高效。

基于這一見解,研究團隊認為,現有MoE使用的固定混合機制可能導致訓練和推理效率下降,同時限制模型性能。

為了在提升速度的同時增強性能,研究團隊提出了一種通用的異構MoE框架,稱為MoE++。

具體來說,團隊引入了三種零計算量專家:

  • Zero專家,輸出空向量
  • Copy專家,將輸入直接作為輸出
  • Constant專家,用可訓練的向量替代輸入作為輸出。

如圖1所示,與傳統MoE方法不同,MoE++允許每個Token使用可變數量的FFN專家,接受恒定向量的替換,甚至完全跳過當前的MoE++層。

圖片

△圖1:MoE++和普通MoE的對比

這種異構結構通過擴大網絡的組合空間,提升了模型的擬合能力,并顯著降低了計算成本。

此外,研究團隊還將前一層的路由分數整合到當前層的專家選擇中,使Token在選擇專家時能夠參考其先前的路由路徑,從而實現更穩定的專家分配。

研究團隊認為,新設計的MoE架構應滿足以下標準:

  1. 設計應盡量簡化,以高效處理簡單的Token
  2. 為了確保公平比較,新增參數應保持在可忽略的范圍

在這些原則的指導下,研究團隊引入了零計算量專家,每個專家僅執行最基本的操作。

如圖2(a)所示,團隊設計了三種類型的零計算量專家:Zero專家、Copy專家和Constant專家,分別對應丟棄、跳過和替換操作。

圖片

△圖2:MoE++的核心組成部分

Zero專家

最簡單的零計算量專家是丟棄當前輸入的Zero專家。

本質上,Zero專家的存在可以將Top-2 MoE++層降級為Top-1 MoE++層。

具體來說,當Zero專家被激活時,Top-2 MoE++層的輸出將等同于另一個專家的單獨輸出。

這樣,Zero專家的引入提升了模型在處理簡單Token和復雜Token時的靈活性。

圖片

Copy專家

Copy專家直接將輸入作為輸出,直觀上相當于跳過當前MoE++層。

具體而言,當輸入Token與現有專家的匹配較差時,選擇繞過MoE++層可能更為有利。

圖片

Constant專家

Constant專家通過可訓練向量替換輸入Token。

然而,完全替換會導致輸入Token信息的丟失。

為此,研究團隊引入了可訓練的權重矩陣,用于動態預測替換的比例。由于Constant專家的計算開銷極小,因此仍被歸類為零計算量專家。

圖片

路由分數殘差

由于MoE++包含異構專家,因此與普通MoE相比,路由器的設計變得更加關鍵。

為此,如圖2(b)所示,研究團隊提出了一種路徑感知路由器,它在選擇合適的專家時考慮了前一層所采用的路徑。

具體來說,MoE++將前一層的路由分數通過一個可學習的轉換矩陣合并到當前層的專家選擇中。

這些路由分數殘差使每個Token在選擇專家時可以考慮其先前的路由路徑。

圖片

為什么MoE++比MoE更好(Why)?

對于這個問題,主要可以總結三點原因。

首先就是靈活的計算量分配

MoE++通過為簡單Token分配較少的FFN專家,優化了計算資源的分配,從而使更多FFN專家能夠專注于處理更具挑戰性的Token。

正如圖3所示,研究團隊發現,在MoE++中,動詞激活的FFN專家數量最多,其次是名詞,而拆分后的詞片激活的FFN數量最少。

這表明,MoE++能夠讓語義較少的Token使用更少的FFN專家,從而釋放更多專家來處理語義更豐富的Token。因此,MoE++不僅減少了計算開銷,還提升了整體性能。

圖片

△圖3:在MoE++中不同Token所需要的平均FFN專家數量

其次是穩定的路由

MoE++將前一層的路由分數合并到當前層的專家選擇中。

這些路由分數殘差使每個Token在選擇專家時考慮其先前的路由路徑。

如圖4所示,路由分數殘差有效地建立了不同MoE++層之間的聯系,減小了路由分數的方差。

同時,路由分數殘差不改變路由分數的均值和取值范圍。因此,路由分數殘差有助于在MoE++中實現異構專家架構的穩定路由。

圖片

△圖4:路由分數殘差對路由分數分布的影響

最后是更低的計算復雜度

如下表所示,MoE++具有比普通MoE更低的理論計算復雜度。

圖片

實驗結果

從0.6B的參數量逐漸擴展到7B參數量的大量實驗結果表明,MoE++方法明顯優于普通MoE方法。

與相同大小的普通MoE模型相比,MoE++的專家吞吐量提高了約15% ~ 111%,同時具有更高的性能。

圖片
圖片

現有的LLMs模型通常需要大量的訓練預算,比如OpenMoE-8B/32E使用1.1T Tokens,TinyLlama-1.1B使用3T Tokens。

研究人員也將MoE++模型的訓練預算擴展到1T Tokens。

研究人員發現MoE++模的性能與具有2到3倍激活參數的稠密模型相當。

值得注意的是,MoE++優于OpenMoE-8B/32E,這是一個從零開始訓練的更大的MoE模型,使用更多的訓練Tokens。

這些結果表明,MoE++框架是一種很有前途的LLMs框架方案。

圖片

任務級專家負載分布的可視化

研究人員還探索了MoE++模型中跨不同任務的專家負載分。這些可視化揭示了幾個有趣的發現:

  1. 專家負載在不同層之間存在相關性,特別是在相鄰層之間。例如,當第j層激活很大比例的FFN專家時,第j + 1層很可能也會以同樣大的比例激活FFN專家。
  2. 與中間層相比,淺層和最后一層的專家分配模式在不同任務之間的差異更大。這表明該模型主要通過其淺層和最終層而不是中間層來適應不同的任務。未來的工作可以集中在這些層中設計更復雜的結構,以增強模型對不同任務的適應性。
  3. 不同任務中每個Token激活的FFN專家數量存在顯著差異,但并不一定是更簡單的任務激活更少的FFN專家。例如,ARC Challenge任務通常比ARC Easy任務激活更多的FFN專家。這些結果表明,MoE++模型根據知識內容和Token級別的復雜性來分配專家,而不是根據整體任務難度來分配專家。
  4. 在所有專家類型中,Zero專家的平均激活次數最高,更簡單的任務顯示出更高的平均激活次數。例如,ARC Easy任務比ARC Challenge任務激活更多的零專家。這表明Zero專家的激活水平可能可以作為模型任務難度的一個指標。
  5. 在MoE++模型的所有層中,不同任務主題的專家分配差異顯著,這表明MoE++模型通過采用不同的專家分配模式來處理不同主題的任務。

圖片
圖片
圖片
圖片
圖片

論文地址:https://arxiv.org/abs/2410.07348

GitHub地址:https://github.com/SkyworkAI/MoE-plus-plus

Huggingface地址:https://huggingface.co/Chat-UniVi/MoE-Plus-Plus-7B

責任編輯:張燕妮 來源: 量子位
相關推薦

2012-10-12 09:44:09

AdobeAcrobat XI

2021-01-29 11:37:26

同態加密HE隱私保護

2016-09-29 15:13:34

以太網網絡速度

2009-03-20 11:12:32

HX 路由器產品Hughes

2012-08-30 09:34:08

VMware

2012-08-06 13:28:25

Wi-Fi

2010-12-14 12:48:43

SafeNetPKI應用程序虛擬環境

2015-02-04 11:06:39

VMware

2011-04-28 20:37:12

2020-09-30 10:39:01

VMware

2013-12-12 14:14:15

戴爾

2014-05-13 13:33:33

2017-04-12 16:05:24

思科MDS存儲網絡導向器

2015-11-23 17:58:25

疊云

2011-07-11 17:33:36

華為TP3106智真系統

2014-12-15 10:43:19

戴爾

2021-12-14 15:59:38

數據模型推理

2024-01-02 15:15:00

AI模型開源
點贊
收藏

51CTO技術棧公眾號

欧美日韩aaaa| 正在播放亚洲一区| 五月天丁香综合久久国产| 亚洲熟妇无码久久精品| 亚洲有吗中文字幕| 亚洲精品理论电影| 欧美日韩一区二区三区69堂| 污污片在线免费视频| 99久久精品99国产精品| 国产精品一区二区三区久久久| 黄色在线观看免费| 国产一区二区三区探花| 日韩欧美区一区二| 国产福利一区视频| 欧美理论电影| 国产亚洲欧美一区在线观看| 99精品国产高清一区二区| 日本免费在线观看视频| 欧美成人嫩草网站| 亚洲免费视频观看| 成年人小视频在线观看| 69堂免费精品视频在线播放| 亚洲国产一区二区三区青草影视| 日韩中文字幕一区| 无码国产色欲xxxx视频| 国产精品一级黄| 国产欧美亚洲视频| 国产精品国产三级国产专区52| 一区二区电影| 日韩在线精品一区| 国产精品高清无码在线观看| h视频久久久| 在线电影一区二区三区| 爆乳熟妇一区二区三区霸乳| 538在线观看| 亚洲猫色日本管| 中国人体摄影一区二区三区| 日本五码在线| 99久久久久久| 精品视频免费观看| 国精产品乱码一区一区三区四区| 激情图片小说一区| 国产精品永久免费| 中文字幕有码无码人妻av蜜桃| 欧美亚洲一区二区三区| 性欧美亚洲xxxx乳在线观看| 免费在线观看黄视频| 影视亚洲一区二区三区| xxav国产精品美女主播| 亚洲欧美另类日本| 国产精品久久久乱弄| 色系列之999| 最新日韩免费视频| 久久影院100000精品| 中文字幕国产日韩| 国产极品视频在线观看| 日韩一区二区在线| xx视频.9999.com| 欧美a级片免费看| 天堂美国久久| 久久久极品av| 妺妺窝人体色www聚色窝仙踪 | 一区二区三区短视频| 偷窥国产亚洲免费视频| 国产亚洲精品网站| 日韩a**中文字幕| 欧美揉bbbbb揉bbbbb| 午夜剧场高清版免费观看| 欧美特黄色片| 56国语精品自产拍在线观看| 特黄特黄一级片| 9l亚洲国产成人精品一区二三| 亚洲成人精品在线| 草草影院第一页| 欧美伦理在线视频| 色婷婷久久av| 日本在线小视频| 久久三级福利| 国产中文字幕91| www.国产黄色| 久久久久久久久久久久久夜| 亚洲精品成人a8198a| 大片免费在线观看| 亚洲aaa精品| 免费激情视频在线观看| www一区二区三区| 日韩av网址在线观看| 日韩视频在线观看免费视频| 亚洲精品在线观看91| 久久久久久中文字幕| 男人天堂2024| 国产真实精品久久二三区| 国产青春久久久国产毛片| 加勒比一区二区三区在线| 国产精品麻豆视频| 99热久久这里只有精品| 播放一区二区| 欧美成人欧美edvon| 日韩精品卡通动漫网站| 亚洲自拍偷拍网| 青青青国产精品一区二区| 国产理论片在线观看| 26uuu国产一区二区三区| 一区二区视频在线免费| 日本不卡网站| 欧美一区二区三区不卡| 亚欧洲乱码视频| 欧美激情视频一区二区三区免费| 日本欧美一二三区| 亚洲成人黄色片| 国产欧美一区二区在线| 精品一区二区三区无码视频| 成人午夜sm精品久久久久久久| 欧美精品一区二区三区在线播放| 四虎影视1304t| 销魂美女一区二区三区视频在线| 91综合免费在线| 国产精品秘入口| 亚洲成av人影院| 999热精品视频| 第一会所sis001亚洲| 91成品人片a无限观看| 精品人妻一区二区三区日产乱码| 中文字幕精品在线不卡| 欧美日韩亚洲一| 激情亚洲另类图片区小说区| 超在线视频97| 亚洲系列第一页| 国产日韩欧美在线一区| 男人靠女人免费视频网站| 亚洲三级av| 欧美噜噜久久久xxx| 在线观看毛片av| 国产欧美日韩三区| 别急慢慢来1978如如2| 亚洲三级性片| 日韩av手机在线看| 天堂视频中文在线| 欧美日韩免费在线观看| 亚洲 欧美 日韩在线| 国模大胆一区二区三区| 成人91视频| 美女精品导航| 精品久久久久久亚洲综合网| 国产精品白嫩白嫩大学美女| 国产真实乱偷精品视频免| 亚洲一区二区三区色| 国产亚洲精彩久久| 久久精品91久久香蕉加勒比| 国产又粗又长又黄| 亚洲美女区一区| 国产精品偷伦视频免费观看了| 欧美激情精品久久久六区热门| 99re国产在线播放| 里番在线播放| 亚洲精品国产精品国自产在线| 国产一级在线免费观看| 成人免费高清视频| 亚洲熟女乱色一区二区三区| 亚洲图区在线| 国产精品一区二区性色av| 日本三级视频在线观看| 8x8x8国产精品| 激情视频在线播放| caoporen国产精品视频| 白嫩少妇丰满一区二区| 欧洲福利电影| 91欧美日韩一区| 成人女同在线观看| 亚洲精品小视频| 中文天堂在线播放| 亚洲视频一区二区在线| 国产av一区二区三区传媒| 夜久久久久久| 无遮挡亚洲一区| 日本精品视频| 清纯唯美亚洲激情| 草莓福利社区在线| 亚洲国产精品va在线看黑人动漫| 91玉足脚交嫩脚丫在线播放| 中文一区一区三区高中清不卡| 夜夜夜夜夜夜操| 亚洲东热激情| 五月天亚洲综合| 亚洲精品一二三**| 国产97在线观看| 国产1区在线| 亚洲精品资源美女情侣酒店| 在线观看亚洲一区二区| 亚洲午夜久久久久久久久电影网| 中日韩精品一区二区三区| 久久国产夜色精品鲁鲁99| 精品人妻人人做人人爽| 国产一区网站| 肥熟一91porny丨九色丨| 韩国美女久久| 久久久久国产精品免费| 国产私拍精品| 日韩精品中文字幕一区二区三区| 亚洲 日本 欧美 中文幕| 伊人色综合久久天天| 白白色免费视频| 不卡视频一二三四| 女人高潮一级片| 日韩黄色免费网站| 欧美激情亚洲天堂| 日韩免费久久| 蜜桃av噜噜一区二区三| 日韩精品一区二区三区中文字幕| 57pao成人国产永久免费| 成人短视频在线| 国产亚洲精品一区二区| 无码h黄肉3d动漫在线观看| 7777精品伊人久久久大香线蕉 | 超级碰碰不卡在线视频| 日韩小视频在线| 欧美日韩伦理片| 亚洲高清福利视频| www.亚洲欧美| 7777精品伊人久久久大香线蕉超级流畅 | 国内精品视频在线| 久草中文在线| 色婷婷成人综合| www 日韩| 国产亚洲欧美另类中文| 午夜影院免费体验区| 日韩欧美久久一区| 国产乱人乱偷精品视频| 欧美日韩黄色影视| 波多野结衣mp4| 日韩欧美国产一区二区| 国产无遮挡又黄又爽又色| 一区二区三区精品在线| 亚洲色偷偷综合亚洲av伊人| 国产女主播视频一区二区| 国产交换配乱淫视频免费| 99在线精品免费| 成人做爰www看视频软件| 狠狠色丁香九九婷婷综合五月| 精品久久久噜噜噜噜久久图片| 性伦欧美刺激片在线观看| 国产精品999视频| 国产偷自视频区视频一区二区| 17c丨国产丨精品视频| 欧美激情日韩| 久久久久久久香蕉| 欧美日韩精选| 国产毛片久久久久久国产毛片| 亚洲高清资源在线观看| 丰满女人性猛交| 欧美国产高潮xxxx1819| 国产精品igao激情视频| 欧美视频亚洲视频| av无码久久久久久不卡网站| 国内精品久久久久久久97牛牛| 老司机激情视频| 亚洲美女啪啪| 国产一区二区视频免费在线观看| 日本成人在线一区| 17c国产在线| 国产激情精品久久久第一区二区| 师生出轨h灌满了1v1| 成人毛片老司机大片| 亚洲国产欧美视频| 国产视频一区二区在线| 超碰人人人人人人人| 综合色天天鬼久久鬼色| 国产亚洲精品女人久久久久久| 亚洲成人激情自拍| 成人a v视频| 9191精品国产综合久久久久久| 亚洲国产精品成人久久蜜臀| 亚洲成人免费在线视频| 久久精品色图| 日韩三级成人av网| а√在线中文在线新版| 国产精品黄色av| 警花av一区二区三区| 国产一区再线| 日韩免费在线| 无码 制服 丝袜 国产 另类| 久久久久国产一区二区| 婷婷中文字幕在线观看| 成人免费精品视频| 日本污视频网站| 一区二区日韩电影| 中文字幕一区二区人妻电影| 6080午夜不卡| 亚洲欧洲成人在线| 久久久999精品免费| 蜜桃视频www网站在线观看| 国产精品久久久久久久久久久久久久 | 成人av影院在线观看| 国产91色在线| 最新国产精品精品视频| 日韩精品一区二区三区色偷偷 | 欧美日韩亚洲一| 国产自产高清不卡| 日韩乱码人妻无码中文字幕久久 | 国产午夜视频在线播放| 91国产免费观看| 高潮一区二区三区乱码| 一区二区欧美日韩视频| 国产精品探花在线| 国产精品青青在线观看爽香蕉 | 精品一区二区三区欧美| 疯狂揉花蒂控制高潮h| 亚洲精品国产a| 国产一级精品毛片| 亚洲精品成a人在线观看| 黄色av电影在线观看| 日韩av片免费在线观看| 国产精品毛片视频| 中文字幕乱码免费| 日韩av网站免费在线| 日本xxx在线播放| 亚洲夂夂婷婷色拍ww47| 国产巨乳在线观看| 色播久久人人爽人人爽人人片视av| 美女搞黄视频在线观看| 国产高清一区视频| 欧美在线黄色| 爱爱爱爱免费视频| 欧美极品少妇xxxxⅹ高跟鞋| 六月丁香婷婷综合| 日韩禁在线播放| 国产伦理精品| 国产综合色一区二区三区| 欧美日本久久| 91精品人妻一区二区三区蜜桃2 | 国产精一区二区三区| 天天干天天操天天拍| 色8久久人人97超碰香蕉987| 图片区 小说区 区 亚洲五月| 欧美区二区三区| 狂野欧美xxxx韩国少妇| 亚洲精品永久www嫩草| 日韩国产精品91| 最近中文字幕免费| 色综合av在线| 精品无吗乱吗av国产爱色| 欧美一区二区三区艳史| 你懂的一区二区三区| 116极品美女午夜一级| 99久久99久久综合| www欧美在线| 国产小视频国产精品| 精品3atv在线视频| 五月天国产一区| 精一区二区三区| 欧美做爰啪啪xxxⅹ性| 制服丝袜中文字幕一区| 成人免费高清| 91精品国产99久久久久久红楼| 午夜国产精品视频| 尤物网站在线观看| 天天av天天翘天天综合网 | 在线免费av网| 日韩亚洲第一页| 警花av一区二区三区| 亚洲熟妇无码av在线播放| 成人av午夜影院| 国产免费av一区| 中文字幕最新精品| 精品久久亚洲| 97在线国产视频| 久久久国产精华| 在线免费观看av片| 欧美剧在线观看| 午夜精品福利影院| 国内外成人免费在线视频| 亚洲色图制服诱惑| 人妻91麻豆一区二区三区| 欧美中在线观看| 久久在线视频免费观看| 日本77777| 婷婷成人激情在线网| 国产在线小视频| 亚洲综合在线小说| 久久精品一本| 日韩在线中文字幕视频| 亚洲成人免费网站| 78精品国产综合久久香蕉| 大桥未久一区二区三区| 成人av电影在线播放| 亚洲免费视频二区| 欧美高清无遮挡| 青青草原综合久久大伊人精品| 超碰91在线播放| 日韩欧美在线观看视频| 黄色成人影院| 日本视频一区在线观看| 国产老女人精品毛片久久| www欧美在线| 欧美精品免费看| 欧美肉体xxxx裸体137大胆| 免费黄色在线播放| 在线免费观看日韩欧美| 91黄页在线观看| 国产福利片一区二区|