精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從DeepSeek MoE專家負載均衡談起

人工智能
本文開頭提到了一個比較有趣的說法:“Dense模型適合toB業務,MoE模型適合toC業務”, GPT4是MoE模型吧, 它適合toB還是toC? Llama3是一個Dense模型吧? 它適合toB還是toC?

上周中的時候, 同事給我了一份線上DeepSeek-R1推理的Expert激活的數據用來研究一些專家負載均衡的算法, 當然這些線上數據來自于公司內部的請求, 從中觀測出前面10層專家基本上是相對均衡的, 而越到后面不均衡程度差異越大。當時討論到這個問題時, 是懷疑內部的一些請求是否專注于電商領域而帶來的不平衡特性, 于是做了一些研究。恰好搜到Intel的一篇論文《Semantic Specialization in MoE Appears with Scale: A Study of DeepSeek-R1 Expert Specialization》有一些基于語義的MoE分析專家的專業性相關的問題, 再加上前幾天看到某個公眾號采訪某院長的一個比較有趣的說法:“Dense模型適合toB業務,MoE模型適合toC業務”. 因此做了一些分析, 在此記錄下來。

1. 專家Overlap分析

從這篇論文的第一個Word-in-Context的實驗來看, DeepSeek-R1的前面十層專家Overlap的概率相對于較高, 和線上的一些數據分析是一致的。

圖片圖片

比較特別的是在第十層后,不同語義和相似語義之間的區分度完全顯現出來了, 而模型本身因為細粒度MoE(256選8)而產生的區分度也顯著降低了, 同時論文還對比了Mistral的兩個MoE模型, 它采用8選2的方式, 看來語義間對不同專家的區分度有很大的差距. 這個結論也支撐了DeepSeek逐漸向更加細粒度專家的技術路線的正確性。

當然產生這樣的結果有幾方面可能的因素:

  • Shared Expert的重要性, 通過Shared Expert消除了一些專家之間的影響, 使得Routed Expert Overlap的概率降低?
  • 本質上就是Routed Expert數量的影響?
  • R1強化學習的工作流對于Expert Specialization進一步增強了?

但是值得注意的是另一個問題是, 在模型的后面20層內, 層間的Overlap的差異還是很大的, 并且沒有進一步的下降, 這個和我拿到的線上的數據分布也是相似的.

這里引入一個思考, 每一層模型的AlltoAll通信時間實際上是受到分布式部署的帶寬和延遲約束的, 因此模型深度過深后將會影響到TPOT, 雖然可以用一些ScaleUP的辦法來解決, 但是看看GB200的可靠性和成本, 這種取舍是不太恰當的。另一方面, 看到上圖中第40層overlap有明顯的抖動, 一方面是模型在后面的層中還可以更加稀疏來進一步降低Overlap, 是否也會有一個類似的ScalingLaw我們在稍微后面的章節來分析。

2. SAE分析

從論文中SAE的分析來看, 能夠得出不同的專家在負責不同的推理以及認知專業化的結論, 這和DeepSeek設計細粒度MoE和專家專業化的初衷是匹配的。

圖片圖片

其實渣B一直在建議從SAE的角度來分析大模型, 并通過對SAE Activation的約束來作為強化學習工作流的一種手段,SAE對于概念的可視化解釋, Anthropic和OAI都做了相應的可視化展示, 例如Anthropic的多模態對金門大橋的概念。

圖片圖片

OAI和Claude都在這方面有了蠻長時間的布局, 而國內相對還是落后了一些。

3. 從范疇論的視角看R1

這是一個爛尾很久的專題, 一直想抽一周的時間來好好分析并寫一篇筆記, 但是最近幾個月不停的在各種項目的死線上掙扎. 先簡短的寫一些吧. 其實R1的整個訓練流程從范疇論的意義上來看:

  • 首先是V3-Base的模型本質上是通過一系列數據集的Pre-train流程構成了一個預層范疇(Presheaf)。
  • R1-Zero是基于V3-Base的Presheaf上來強化了一些Morphism的權重, 而這些權重在MoE模型的底子上使得模型具有了更強的泛化能力。
  • 然后在V3-Base的基礎上混合R1-Zero的Coldstart數據和一些General samples來構建最終的R1。

圖片圖片

比較好奇的是在整個后訓練的過程中, 不知道DeepSeek是否記錄了梯度更新的情況, 感覺這個地方配合SAE做一些分析可能會有更多的發現, 個人覺得雖然ORM取得了很好的結果, 而PRM本身還有一些過程上的缺陷, 是否可以在SAE的視角上來看出更多的原因, 并且某種意義上還可以給ORM訓練輸出一些更加抽象泛化的約束能力。

當然這樣也會面臨一個比較大的算力的挑戰, SAE的算力消耗和RL工作流的整體效率上的一個取舍問題。

4. MoE ScalingLaw

本文開頭提到了一個比較有趣的說法:“Dense模型適合toB業務,MoE模型適合toC業務”, GPT4是MoE模型吧, 它適合toB還是toC? Llama3是一個Dense模型吧? 它適合toB還是toC? 本質的問題是算力的約束下MoE成為繼續提高Scaling的一個必然手段. 當然MoE模型本身的Gating數值穩定性問題和Reasoning模型本身通常設置的溫度參數相對較低, 使得模型的幻覺程度有所增加而不太適合一些toB的業務場景。

最近還有一篇《Chain-of-Experts: 釋放MoE專家的溝通潛能》[2]挺有意思的, 即通過在同一層的專家之間的互相處理來得到最后的output hidden. 實際上這里又有了一些RNN的味道.  但是這樣的機制如果迭代次數多了感覺很難去兼顧訓練和推理的效率。

圖片圖片

從本文第一節的配圖上來看, 似乎某種程度上能夠得出和DeepSpeed-MoE[3]中提出的pyramid-MoE相似的結構, 隨著模型的層數越來越深, 專家專業化程度越來越高, 相應的專家數量和TopK選擇數量也需要對應的提高?

圖片圖片

其實這也是我最近在考慮的一個問題, MoE的本質是否和HNSW(Hierarchical Navigable Small Word)算法某種程度上有相似性?

圖片圖片

那么借助Grace+Blackwell的架構, 是否還能做出點有趣的東西呢? 大概想到一個增量MoE的算法:

  • 首先按照一個相對細粒度的模型進行訓練, 例如256 Routed Experts, TopK=8
  • 例如訓練到500B tokens時, 模型逐漸添加一些新的專家在后面若干層
  • 反復訓練的過程中把模型逐漸迭代成一個金字塔結構.
  • 最后在PostTraining過程中, 基于SAE或者某些層的MoE路由規則凍結一些Expert的參數或者是在這個基礎上做一些KL散度的約束來降低幻覺?

為什么需要Grace呢, 因為某種程度上還是需要CPU側的更大的內存空間來做一些專家權重的置換. PCIe本身的帶寬還是太小了. 當然這樣的模型部署時在推理階段可能還有更多的挑戰. 設計模型架構時兼顧推理性能是必須要考慮的一個因素了, 這部分內容暫時還沒想明白, 隱約覺得在這樣的一個模型下, 順便把Next Few layer的Expert Prediction/Prefetch做了可能是一條路.

目前,阿里云正在GPU加CPU的異構資源池上做優化。未來,數據庫要研發的關鍵能力是將昂貴的GPU盡可能地省下來做最珍貴的計算和緩存,將次要的計算和緩存推到CPU加內存和存儲的三層池化中,讓在線推理變得更低成本。

在基礎設施和分布式系統的視角來看, 和模型的協同還有更多的工作要做。

參考資料

[1] Semantic Specialization in MoE Appears with Scale: A Study of DeepSeek-R1 Expert Specialization: https://arxiv.org/pdf/2502.10928

[2] Chain-of-Experts: 釋放MoE專家的溝通潛能: https://sandy-server-87f.notion.site/Chain-of-Experts-MoE-1ab9bb750b79801bbfebf01ae9a77b3f

[3] DeepSpeed-MoE: https://arxiv.org/pdf/2201.05596

責任編輯:武曉燕 來源: zartbot
相關推薦

2010-04-22 09:44:29

2025-02-17 03:00:00

LLMsMoELLM

2025-11-21 08:36:04

2017-04-25 16:45:11

2017-07-03 08:08:25

負載均衡分類

2024-11-11 13:24:02

2024-01-10 16:01:28

2010-04-20 14:15:49

負載均衡產品

2010-04-22 22:51:36

2022-11-02 08:36:35

ArgoAIOPS

2022-10-13 08:32:44

手機故障IO

2010-04-25 17:18:09

TCP負載均衡

2015-11-30 16:02:13

應用交付網絡優化

2010-05-04 13:20:01

負載均衡服務

2025-11-20 12:48:51

2025-04-02 02:17:00

2019-03-18 10:44:41

負載均衡DNSUDP
點贊
收藏

51CTO技術棧公眾號

女女互磨互喷水高潮les呻吟| 精品一区日韩成人| 呻吟揉丰满对白91乃国产区| 视频一区在线免费看| 国产亚洲婷婷免费| 99久久婷婷国产综合精品电影| 欧美日韩一区国产| 免费看av软件| 亚洲国产精品久久人人爱潘金莲| 亚洲婷婷免费| 亚洲第一精品夜夜躁人人躁| a√天堂在线观看| 粉嫩av一区| 九九久久精品视频| 色中色综合影院手机版在线观看| 久久性爱视频网站| 99只有精品| 亚洲精品国产精品乱码不99 | 欧美tk—视频vk| 日韩免费一级视频| 在线观看麻豆| 成人一区二区三区中文字幕| 欧美中文字幕在线观看| 999精品视频在线观看播放| 伊人精品久久| 欧美午夜精品久久久久久超碰| 宅男一区二区三区| 午夜激情小视频| 久久成人综合网| 午夜精品久久17c| 久久精品在线观看视频| 榴莲视频成人app| 欧美在线小视频| 国产曰肥老太婆无遮挡| 超碰在线国产| 91麻豆精东视频| 亚洲字幕一区二区| 国产精品乱子乱xxxx| 国产精品夜夜夜爽阿娇| 福利在线一区| 8x8x8国产精品| 青青在线视频观看| 免费在线播放电影| 国产精品国产三级国产普通话99 | 一本久久精品一区二区| 亚洲成人动漫在线| 色婷婷av一区二区三| 国产真实乱偷精品视频免| 日本久久久久久久久| 免费在线观看国产精品| 欧美高清视频手机在在线| 欧美精品一区二区高清在线观看| 免费精品99久久国产综合精品应用| 在线免费av资源| 亚洲午夜日本在线观看| 丰满女人性猛交| 91大神xh98hx在线播放| 久久亚区不卡日本| 久久av一区二区三区亚洲| 亚洲一区 中文字幕| 日韩精品视频网站| 日本精品视频在线| 在线观看精品国产| 伊人久久大香线蕉综合热线| 欧美日韩网址| 欧美午夜一区二区三区| 免费av手机在线观看| 色呦呦网站在线观看| ●精品国产综合乱码久久久久| 日韩高清dvd| 国产玉足榨精视频在线观看| 久久亚洲一区二区三区四区| 国产免费一区二区| 蜜臀av午夜精品| 国产尤物一区二区| 亚洲一区二区中文| 国产黄色小视频在线观看| 国产综合久久久久久鬼色| 国产精品吴梦梦| 69成人免费视频| 国产精品久久久久久久免费软件| 国内精品一区二区三区| 日本亚洲欧美在线| 中文一区在线| 欧美一二三视频| 一级一片免费看| 一本一道久久综合狠狠老精东影业| 高清一区二区三区四区五区| 青青操免费在线视频| 亚欧美中日韩视频| 国产成一区二区| 六月丁香婷婷综合| 日韩精品电影在线观看| 91亚洲永久免费精品| 黄色一级大片在线免费看国产一 | 亚洲午夜一区二区三区| 男女激情无遮挡| 日韩毛片一区| 精品精品国产高清一毛片一天堂| www.久久国产| 久久久五月天| 91精品国产色综合久久不卡98| 国产99久久久久久免费看| 国产一区二区精品久久99| 国产欧美一区二区三区不卡高清| 国产高清视频在线| 亚洲主播在线观看| 国产三级日本三级在线播放| 我要色综合中文字幕| 亚洲天堂第一页| 久久99久久久| 六月婷婷色综合| 国产私拍一区| 麻豆av在线免费看| 日韩欧美高清在线视频| av在线天堂网| 久久在线播放| 国产999精品久久久| 国产色片在线观看| 国产欧美日韩三区| 国产二级片在线观看| 二区三区精品| 中文字幕区一区二区三| 欧美性猛交xxxx偷拍洗澡| 日本77777| 一区三区在线欧| 久久久天堂国产精品女人| 亚洲综合一区中| 久久九九久久九九| 国产综合av在线| 亚洲乱码一区| 久久久国产一区| 久久久久久无码精品大片| 99国产精品一区| 欧美极品少妇无套实战| 成人综合日日夜夜| www.xxxx精品| 日本欧美www| 久久精品一区二区三区不卡牛牛| 国产二区视频在线| 成人三级av在线| 欧美黑人xxxx| www.四虎在线观看| 亚洲精品ww久久久久久p站| 天天干天天av| 水蜜桃精品av一区二区| 国产精品高潮呻吟视频| 国产午夜精品一区理论片| 狠狠色狠狠色综合日日小说| 亚洲精品乱码久久| 亚洲第一精品影视| 国产一区二区三区高清视频| 国产丝袜在线观看视频| 欧美成人激情免费网| 丁香花五月激情| 国产久卡久卡久卡久卡视频精品| gogogo免费高清日本写真| 91精品亚洲一区在线观看| 久久视频中文字幕| 国产精品怡红院| 亚洲精品国产品国语在线app| 人妻av一区二区三区| 影音先锋一区| 久久成人资源| 成人天堂yy6080亚洲高清| 亚洲视频专区在线| 波多野结衣mp4| 国产人妖乱国产精品人妖| 欧美自拍小视频| 91一区二区| 69174成人网| 91在线超碰| 亚洲男人天堂2024| 中文永久免费观看| 亚洲日本韩国一区| youjizz.com国产| 免播放器亚洲| 亚洲图片都市激情| 日韩精品成人| 日本高清不卡的在线| av资源网站在线观看| 8x福利精品第一导航| 日韩欧美亚洲国产| 国产亚洲欧洲一区高清在线观看| mm131亚洲精品| 亚洲视频免费| 欧洲精品久久| 在线日韩成人| 日本成人免费在线| av中文字幕在线播放| 日韩精品在线免费播放| 中文字幕一区二区三区四区免费看 | 国产成人+综合亚洲+天堂| 日本综合在线| 亚洲国产精品视频在线观看| 波多野结衣激情视频| 悠悠色在线精品| 魔女鞋交玉足榨精调教| 精品一区二区三区在线观看国产| 日本a在线免费观看| 久久看人人摘| 黑人中文字幕一区二区三区| 看片一区二区| 欧美亚洲视频在线看网址| 国产美女福利在线| 亚洲欧美国产精品专区久久| 国产美女www爽爽爽视频| 丰满岳妇乱一区二区三区| 激情无码人妻又粗又大| 99久久er热在这里只有精品66| 中文字幕免费高清在线| 新67194成人永久网站| 国产精品久久成人免费观看| 最近国产精品视频| 99电影在线观看| 精品久久99| 亚洲一区精品在线| 蜜桃免费一区二区三区| 国产成人精品一区二区三区在线| 欧美日韩爱爱视频| 97人人在线| 亚洲裸体xxxx| 黄色www视频| 欧美一区2区视频在线观看| 波多野结衣视频免费观看| 亚洲国产成人porn| avove在线播放| 国产精品毛片久久久久久| 在线免费观看成年人视频| 国产91丝袜在线观看| 午夜激情视频网| 美国三级日本三级久久99| 日韩久久一级片| 中文一区在线| 日本中文字幕网址| 亚洲大胆在线| 菠萝蜜视频在线观看入口| 91精品推荐| 一区二区精品在线观看| 成人系列视频| 五月天综合网| 精品一区二区三区中文字幕老牛| 欧美精品成人一区二区在线观看 | 毛片网站在线看| 久久精品青青大伊人av| 免费a级毛片在线播放| 伊人伊成久久人综合网小说| 国产香蕉在线| 有码中文亚洲精品| bbbbbbbbbbb在线视频| 中文精品99久久国产香蕉| 中文字幕在线视频区| 日日骚久久av| 亚洲视频电影| a∨色狠狠一区二区三区| 日本精品视频在线播放| 亚洲a∨精品一区二区三区导航| 欧美在线免费观看| 久久精品女人天堂av免费观看| 青青久久av北条麻妃黑人| 中文字幕在线看片| 情事1991在线| 成人国产一区| 成人网欧美在线视频| 国产精品毛片aⅴ一区二区三区| 亚洲tv在线观看| 成人福利免费在线观看| 精品国产综合久久| 国产成人3p视频免费观看| 日本成人三级| 婷婷久久综合| 日韩欧美精品免费| 亚洲免费综合| 国产精品久久a| 精品无人码麻豆乱码1区2区| 人妻精品久久久久中文字幕69| 国产99久久久国产精品潘金网站| 亚洲av成人精品一区二区三区| 91蝌蚪porny成人天涯| 高清国产在线观看| 自拍偷拍亚洲综合| 久久香蕉精品视频| 日本精品免费观看高清观看| 亚洲自拍偷拍另类| 精品毛片乱码1区2区3区| 涩爱av在线播放一区二区| 在线精品91av| 黄页网站大全在线免费观看| 欧美在线观看视频| 青青青国产精品| 国产精品免费在线| 成人一区二区| 国产精品第157页| 视频一区欧美精品| 日本中文字幕精品| 久久久五月婷婷| 曰本女人与公拘交酡| 日韩欧美在线观看视频| 中文字幕在线观看1| 亚洲成人久久久久| 91在线直播| 亚洲97在线观看| 91久久青草| 欧美男人的天堂| 国内精品嫩模av私拍在线观看| 国产视频一区二区视频| 国产激情视频一区二区在线观看| 国产高潮呻吟久久| 一区二区高清免费观看影视大全| 在线免费观看av网址| 日韩欧美卡一卡二| 阿v免费在线观看| 欧日韩精品视频| 亚洲综合av在线播放| 狠狠久久亚洲欧美| 性少妇bbw张开| 亚洲国产精品久久久男人的天堂| 亚洲精品无码久久久久| 精品999在线播放| 黄色精品免费看| 国产精品久久二区| 妖精一区二区三区精品视频| 中文精品无码中文字幕无码专区| 日本不卡视频在线观看| 噜噜噜在线视频| 亚洲午夜av在线| 精品人妻少妇嫩草av无码专区| 国产一区二区三区视频免费| 亚洲黄色网址| 国精产品一区二区| 极品尤物久久久av免费看| 中文字幕永久有效| 国产亚洲精品bt天堂精选| 国产精品黄色大片| 亚洲第一男人天堂| 91探花在线观看| 国产精品久久精品国产| 国产精品草草| 欧美69精品久久久久久不卡| 国产精品免费视频观看| 国产又粗又猛又爽又| 亚洲人成网7777777国产| 少妇视频在线观看| 久久国产精品精品国产色婷婷| 在线播放精品| 丝袜熟女一区二区三区| 亚洲风情在线资源站| 噜噜噜久久,亚洲精品国产品| 欧美激情视频三区| 凹凸av导航大全精品| 黄色一级片av| 国产精品18久久久久久久久久久久 | 试看120秒一区二区三区| 小说区视频区图片区| 国产一区二区三区在线观看免费| 国产精品国产三级国产传播| 51午夜精品国产| 国产精品实拍| 91成人免费看| 亚洲成人资源| 人妻大战黑人白浆狂泄| 91精品1区2区| 色三级在线观看| 国产精品久久久久秋霞鲁丝| 欧美电影三区| 国产精品无码自拍| 亚洲国产wwwccc36天堂| 亚洲aa在线观看| 99成人超碰| 91成人在线观看喷潮蘑菇| 亚洲观看高清完整版在线观看| 日韩性xxxx| 国产91精品网站| 久久久综合色| 精品无码av一区二区三区| 精品二区三区线观看| 国产资源在线看| 亚洲在线视频福利| 亚洲作爱视频| 精品视频第一页| 日韩一二在线观看| 欧美gv在线| 樱花www成人免费视频| 成人三级伦理片| 波多野结衣绝顶大高潮| 欧美成人精品三级在线观看| 欧美电影完整版在线观看| 久久综合久久色| 亚洲人精品午夜| 亚洲人成色777777精品音频| 国产精品视频1区| 亚洲小说欧美另类社区| 永久免费av无码网站性色av| 欧美一级生活片| 都市激情亚洲综合| 韩国黄色一级大片| 91免费观看视频在线| 中文字幕观看在线| 97国产在线视频| 99国内精品久久久久久久|