精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

K2、M2之后LLM架構還會有哪些變化?

發布于 2025-11-10 07:41
瀏覽
0收藏

大家好,最近Kimi K2 Thinking 與MiniMax-M2的開源帶火了國產大模型。但在這背后,我們是否真正看到了LLM架構突破性的變化,還是僅僅在打磨相同的架構基礎?

LLM架構子集:Kimi 2,Kimi K2 Thinking,MiniMax-M1、MiniMax-M2,Kimi Linear,Qwen3-Next

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

前文回顧:???從DeepSeek-V3到Kimi K2:八種現代 LLM 架構大比較??

Kimi K2 與 Kimi K2 Thinking

2025 年 11 月 6 日,Kimi 團隊又發布了“Thinking”版。架構與上述 K2 完全一致,僅把上下文長度從 128k 提升到 256k。

官方基準顯示,該版本甚至超越了當前最強的閉源 LLM(可惜未與 DeepSeek R1 直接對比)。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

DeepSeek R1 與 Kimi K2 Thinking 架構對比(上)及 Kimi K2 Thinking 基準成績(下)。

Kimi 2(高達 1 萬億參數)采用了DeepSeek V3的架構,并進行了擴展。它使用了Muon優化器而非AdamW,這可能是其訓練損失曲線表現優異的原因之一。此外,Kimi 2在MoE模塊中使用了更多的專家,在MLA模塊中使用了更少的頭。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

DeepSeek V3 與 Kimi K2 架構對比。

這些設計使得Kimi 2在訓練過程中表現優異,訓練損失曲線平滑且下降迅速。這可能有助于該模型躍居上述基準測試的榜首

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

MiniMax-M2

最近,新作 MiniMax-M2 目前已被視為最強的開源權重模型(按基準成績)。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

MiniMax-M2 與主流開源 / 閉源模型的基準對比。

如下面總覽圖所示,我把 MiniMax-M2 歸在“解碼器風格 Transformer”一列——它沒再用 M1 的高效 Lightning Attention,而是回歸全注意力,顯然是為了換回建模(與 benchmark)性能。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

本文涉及的主要 LLM 時間線,以及幾條“注意力-混合”高效方案。

整體來看,MiniMax-M2 與 Qwen3 驚人地相似:除了層數、尺寸等不同,組件幾乎一一對應。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

模塊

關鍵設計

備注

QK-Norm

逐頭 RMSNorm

每層、每頭獨立縮放參數,提升穩定性

位置編碼

Partial RoPE

僅旋轉前 rotary_dim 通道,利于外推

MoE

無共享專家,每 token 激活 10 B 參數

總參 235 B,稀疏度 4.37 %

Kimi Linear

最近,線性注意力機制又一次翻紅,目標直指 LLM 的效率瓶頸。

2017 年《Attention Is All You Need》提出的縮放點積注意力仍是當今 LLM 的絕對主流。除了傳統多頭注意力,它還被包裝成各種高效變體:分組查詢注意力(GQA)、滑動窗口注意力(SWA)、多頭潛在注意力(MLA)等。

1 傳統注意力 = 二次方代價

原始注意力隨序列長度 ??n?? 呈二次方增長:??Q/K/V??? 均為 ??n×d??? 矩陣 → 計算 ??QK^???? 需要 ??O(n2d)?? 時間與顯存。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

序列長度 n 帶來的二次方開銷示意。

2 線性注意力:老梗新談

線性注意力并非新鮮事——2020 年起就論文成山。例:Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention(2020)用核技巧近似,繞過顯式的 ??n×n??? 注意力矩陣,把復雜度降到 ??O(n)?? 時間與顯存。然而,這些早期方案掉點明顯,始終沒能在開源 SOTA 模型里落地。

3 線性注意力復興

今年下半年劇情反轉:

時間

模型

動作

6 月

MiniMax-M1

456 B MoE,46 B 活躍,Lightning Attention 上陣

8 月

Qwen3-Next

大部分層換成 DeltaNet(線性門控注意力)

9 月

DeepSeek V3.2

引入 稀疏線性注意力

就當大家以為“線性 Attention 穩了”時,MiniMax 團隊反手發布 230 B 的 M2——棄用線性,回歸全注意力。官方直言:


線性注意力在推理與多輪對話場景精度拉胯,而這兩塊恰是聊天與 Agent 應用的核心。

故事本該到此結束,然而——

10 月,Kimi 團隊拋出 Kimi Linear,再次把線性注意力請回舞臺

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

線性注意力混合架構一覽

Kimi Linear vs. Qwen3-Next

Kimi Linear 與 Qwen3-Next 在骨架上“撞車”:雙方都采用 混合注意力策略——3 份輕量化線性注意力 + 1 份重火力全注意力,比例鎖定 3:1,如下圖。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

Qwen3-Next 與 Kimi Linear 并排對比。

Gated DeltaNet 本質是“線性注意力 + RNN 門控”的混血,思想來自論文《Gated Delta Networks: Improving Mamba2 with Delta Rule》。一句話:DeltaNet 是線性注意力,Gated DeltaNet 再給 DeltaNet 裝上 Mamba 風格的門控。


圖中 Kimi Linear 部分故意沒畫 RoPE 框,因為 Kimi 在全局 MLA 層里直接用了 NoPE(No Positional Embedding)。作者稱這能讓 MLA 在推理時退化成純多查詢注意力,省掉為長文本重調 RoPE 的麻煩;位置偏差交由 Kimi Delta Attention 塊暗中消化。對 MLA / 多查詢注意力背景知識

Qwen3-Next

2025 年 9 月 11 日,Qwen3 團隊發布 Qwen3-Next 80B-A3B,同步推出 Instruct 與 Thinking 兩版。

1 專家數量與尺寸

新架構最顯眼的是:

  • 總參數量僅為前代 235B-A22B 的 1/3,卻塞進4 倍數量的專家;
  • 額外增加1 個共享專家

這兩條恰好是我之前在視頻版文章里預測的下一步方向——“小專家 + 共享專家”。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

5 月發布的原版 Qwen3(左)與 9 月發布的 Qwen3 Next(右)對比。

2 Gated DeltaNet + Gated Attention 混合

另一大變動:用 “Gated DeltaNet + Gated Attention” 混合模塊取代全部常規注意力,從而把原生上下文長度從 32 k(235B-A22B)一舉拉到 262 k(無需 YaRN 外推)。

混合比例

每 3 個 DeltaNet 塊插 1 個 Gated Attention 塊,比例 3:1。

K2、M2之后LLM架構還會有哪些變化?-AI.x社區

Gated DeltaNet + Gated Attention 混合示意。

Gated Attention 塊 ≈ “加強版 GQA”

  • 輸出門(sigmoid 逐通道縮放)給注意力結果加權重;
  • Zero-centered RMSNorm做 QK-Norm;
  • Partial RoPE(僅部分維度旋轉)?!?本質是給 GQA 打“穩定性補丁”。

Gated DeltaNet 塊 = 線性時間記憶

  • 輕量卷積 + 線性投影生成 q, k, v 與兩門控 α, β;
  • 完全去掉 softmax 注意力,改用快速權重 Δ 規則更新一小塊記憶;
  • 記憶用 q 讀取,時間與緩存均 **O(n)**,對標 Mamba 的 SSM 思路。→ 代價:內容尋址精度下降,因此必須留 1 層 Gated Attention 救場。

3 多 token 預測(MTP)

效率提速的“第三板斧”:Multi-Token Prediction。

  • 訓練階段:在每個位置 t 額外掛k 個輕量頭(論文推薦 k=4),同時預測 t+1…t+k;
  • 損失 = 原始交叉熵 + k 步預測交叉熵之和;
  • 推理階段:可扔掉 MTP 頭,也可用它做投機解碼(speculative decoding)。

這么多年過去,LLM 發布依舊讓人上頭——下一站驚喜在哪兒?拭目以待。

https://sebastianraschka.com/blog/2025/the-big-llm-architecture-comparison.html

本文轉載自??PaperAgent??

已于2025-11-10 07:41:59修改
收藏
回復
舉報
回復
相關推薦
国产精品白丝久久av网站| 国产系列在线观看| 亚洲国产mv| 国产亚洲在线播放| 欧美性猛交乱大交| 欧美精品总汇| 亚洲一区在线观看视频| 欧美日韩电影一区二区| 国产日韩欧美中文字幕| 免费视频一区| 欧美成人免费全部观看天天性色| 国产精品三级在线观看无码| 精品国产鲁一鲁****| 懂色av影视一区二区三区| 99热这里只有精品7| 香蕉视频成人在线| 国产精品一区久久久久| 日韩美女主播视频| 国产在线视频你懂的| 色无极亚洲影院| 精品视频www| 女人扒开双腿让男人捅| 日韩av电影资源网| 欧美午夜xxx| 亚洲精品蜜桃久久久久久| yw193.com尤物在线| 91在线视频18| 7777精品久久久大香线蕉小说| 精品国产www| 欧美中文日韩| 91av成人在线| 日产精品久久久久| 欧美日本一区| 超碰日本道色综合久久综合| 西西444www无码大胆| 农村少妇一区二区三区四区五区 | 天天干天天色综合| 在线不卡视频| 久久久久亚洲精品| 欧美成人精品一区二区免费看片 | 中文字幕一区二区三区免费看| 国产午夜精品一区二区三区欧美| 九九九久久久久久| 青娱乐国产精品| 亚洲天天影视网| 久久夜色精品国产欧美乱| 影音先锋制服丝袜| 红桃成人av在线播放| 亚洲欧美国内爽妇网| avtt香蕉久久| 日韩精品丝袜美腿| 国产网站欧美日韩免费精品在线观看 | 日本视频精品一区| 国产三级在线免费| 欧美激情一区二区| 亚洲成人在线视频网站| 在线免费看黄网站| 亚洲欧美国产高清| www.18av.com| 9765激情中文在线| 欧美性生交大片免网| 超碰网在线观看| 国产一区二区精品调教| 欧美美女喷水视频| 人妻少妇偷人精品久久久任期| 国产视频一区二| 精品日韩一区二区三区免费视频| 国产又粗又猛又色| 免费一区二区三区视频导航| 亚洲香蕉成视频在线观看| 中文字幕伦理片| 外国成人免费视频| 国模精品视频一区二区| 手机在线看片1024| 精彩视频一区二区| 国产精品久久国产精品| 三级无遮挡在线观看| 国产女主播在线一区二区| 黄色高清视频网站| av毛片午夜不卡高**水| 在线观看av一区| 中文字幕一区二区在线观看视频 | 国产丝袜精品第一页| 夫妇交换中文字幕| 国内精品福利| 国产成人一区二区在线| 国产精品无码久久av| 国产成人av电影在线| 欧美一区二区三区在线播放| 麻豆视频在线免费观看| 欧美日韩国产区| 亚欧激情乱码久久久久久久久| 一区二区免费| 一本色道久久88综合日韩精品| www欧美com| 日韩一区精品视频| 成人av资源网| av每日在线更新| 亚洲国产成人va在线观看天堂| 性生交免费视频| 超碰成人在线免费| 日韩中文字幕在线免费观看| 国内免费精品视频| 国产在线精品一区二区| 欧美日韩精品综合| 毛片大全在线观看| 欧美片在线播放| 亚洲自拍偷拍一区二区| 国户精品久久久久久久久久久不卡| 国产精品jvid在线观看蜜臀| 你懂的网站在线| 最新欧美精品一区二区三区| 久久久久久久久久福利| 亚洲一区二区三区免费| 一本色道久久综合狠狠躁篇的优点| 日韩精品国产一区二区| 国产高清成人在线| 在线观看国产一区| 亚洲日本在线观看视频| 日韩av中文字幕在线| 精国产品一区二区三区a片| 日本欧美在线看| 欧美日韩一区二区三区免费| 不卡的av影片| 精品国产乱码久久久久久夜甘婷婷| 貂蝉被到爽流白浆在线观看| 久久国产免费| 久久伊人资源站| 97天天综合网| 精品第一国产综合精品aⅴ| 日韩欧美综合视频| 精品影视av免费| 亚洲高清视频一区| 巨胸喷奶水www久久久免费动漫| 日韩av一区在线观看| 国产午夜福利片| 成人激情午夜影院| 亚洲色欲久久久综合网东京热| 日本一区二区乱| 久久天堂电影网| 99久久99久久久精品棕色圆| 成人欧美一区二区三区黑人麻豆| 蜜桃免费在线视频| 青青草综合网| 国产在线999| 男人天堂手机在线| 欧美放荡的少妇| 538精品在线视频| 国产在线一区二区| 一二三四中文字幕| 哺乳挤奶一区二区三区免费看| 欧美日韩成人在线视频| 日韩有码第一页| 精品久久久久久国产91| 性少妇bbw张开| 日韩黄色免费电影| 亚洲一区二区三区精品在线观看 | 狂野欧美性猛交xxxxx视频| 日韩亚洲欧美高清| 国产精品成人国产乱| 99久久精品一区二区| 国产熟女高潮视频| 日韩国产一区二区| 99国产超薄肉色丝袜交足的后果| 里番在线播放| 亚洲欧洲在线免费| 中文在线观看av| 亚洲精品视频自拍| 中国极品少妇videossexhd| 久久久国产亚洲精品| 一本色道久久99精品综合| 欧美精品影院| 668精品在线视频| 成年人视频在线看| 日韩三区在线观看| 国产无人区码熟妇毛片多| 国产日产精品一区| 国产伦精品一区二区三区妓女下载| 亚洲三级影院| 亚洲a∨一区二区三区| 欧美电影在线观看一区| 1769国产精品| √天堂资源地址在线官网| 欧美v亚洲v综合ⅴ国产v| 日韩色图在线观看| 中文字幕亚洲一区二区va在线| 国产一级二级av| 久色成人在线| www.男人天堂网| 国产一区二区三区天码| 91久久大香伊蕉在人线| 91精品产国品一二三产区| 久久中文字幕视频| 欧美新色视频| 日韩丝袜美女视频| 国产第一页在线观看| 亚洲综合一区二区三区| 18啪啪污污免费网站| 99久久精品国产麻豆演员表| 日韩va在线观看| 亚洲综合精品| 男人天堂新网址| 日产精品一区二区| 精品午夜一区二区| 日韩在线成人| 国产精品丝袜久久久久久不卡| 国产乱码在线| 美女国内精品自产拍在线播放| 蜜芽tv福利在线视频| 精品国产伦一区二区三区免费 | 亚洲一区二区三区精品在线观看| 成人三级毛片| 91热福利电影| 成人免费一区| 日本高清视频一区| 8x8ⅹ拨牐拨牐拨牐在线观看| 久久影院在线观看| av色图一区| 亚洲天堂色网站| 婷婷五月综合久久中文字幕| 日韩视频一区二区在线观看| 亚洲天堂网在线视频| 91久久人澡人人添人人爽欧美| 色婷婷在线观看视频| 亚洲mv在线观看| 免费一级黄色大片| 亚洲精品乱码久久久久| 在线日韩国产网站| 国产精品久久久久久久久久免费看| 90岁老太婆乱淫| 91蜜桃网址入口| 熟女丰满老熟女熟妇| 99国产精品久久久| 亚洲国产综合视频| 91丨国产丨九色丨pron| www.超碰97| www国产精品av| 久久久久国产精品区片区无码| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 鲁片一区二区三区| 蜜桃久久久久| 久久riav| 伊人春色之综合网| 欧美一级片免费观看| 国产欧美日韩精品一区二区免费 | 日韩在线播放一区二区| 蜜臀久久99精品久久久酒店新书 | 免费网站在线观看黄| 精品一区二区三区免费| 91日韩精品视频| 国产伦精品一区二区三区在线观看| 中文字幕第22页| 国产丶欧美丶日本不卡视频| 95视频在线观看| 972aa.com艺术欧美| 免费黄色在线视频| 国产欧美日韩亚州综合 | 亚洲午夜在线| 每日在线更新av| 久久精品主播| 亚洲国产精品三区| 国产在线精品一区二区夜色| 99热这里只有精品2| 91麻豆精东视频| 国产传媒视频在线| 一区二区在线看| 久久精品国产成人av| 欧美亚洲一区二区在线观看| 91久久国语露脸精品国产高跟| 欧美一卡二卡在线观看| 蜜臀av午夜精品| 国产一区二区三区18| 精品孕妇一区二区三区| 久久久这里只有精品视频| 欧美日韩电影免费看| 91网站免费看| 日韩成人动漫在线观看| 神马影院一区二区三区| 国产一区亚洲| 91蝌蚪视频在线观看| 国产一区二区三区高清播放| 在线观看国产免费视频| 中文欧美字幕免费| 日韩成人av毛片| 欧美日韩高清一区| 四虎在线视频免费观看| 色妞欧美日韩在线| 成人国产电影在线观看| 国产狼人综合免费视频| 精品人人人人| 特级毛片在线免费观看| 国产情侣久久| 91欧美一区二区三区| 久久综合久久99| 欧美日韩免费一区二区| 欧洲激情一区二区| 天天干视频在线| 蜜臀久久99精品久久久久久宅男| 91av亚洲| 国产欧美日韩亚洲| 91精品国产乱码久久久久久| 国产又大又硬又粗| 成人一级黄色片| 欧美性x x x| 在线观看日韩电影| 日韩中文字幕综合| 欧美成人一区二区三区电影| av高清一区| 精品网站在线看| 国内精品99| 26uuu国产| 亚洲三级小视频| 国模私拍一区二区| 亚洲久久久久久久久久| 草美女在线观看| 999国内精品视频在线| 国产精品麻豆久久| 麻豆三级在线观看| 久久久国产精品麻豆| 午夜精品三级久久久有码| 日韩三级在线免费观看| 久草资源在线| 国产日韩在线观看av| 欧美日韩国产一区二区三区不卡| 3d动漫一区二区三区| 成人激情综合网站| 18精品爽视频在线观看| 欧美一级黄色片| 国产激情小视频在线| 国产在线日韩在线| 久久一区二区三区电影| 在线免费观看视频黄| 日本一区二区免费在线| 黄色大全在线观看| 国产一区二区三区欧美| 成人黄色免费短视频| 欧美欧美一区二区| 久久午夜视频| 成人黄色a级片| 欧美丝袜第三区| 137大胆人体在线观看| 国产精品视频一区国模私拍| 精品一区二区三区的国产在线观看| 北条麻妃在线视频| 国产日韩精品一区二区浪潮av| 无码免费一区二区三区| 中文国产成人精品久久一| 精品乱码一区二区三区四区| 一区二区三区四区欧美日韩| 精品一区二区三区在线观看| 侵犯稚嫩小箩莉h文系列小说| 欧美一级黄色大片| f2c人成在线观看免费视频| 国产有色视频色综合| 国产美女精品| 卡一卡二卡三在线观看| 欧美人体做爰大胆视频| 国产cdts系列另类在线观看| 粉嫩高清一区二区三区精品视频 | 特黄aaaaaaaaa真人毛片| 人人做人人澡人人爽欧美| 成人a'v在线播放| 蜜桃福利午夜精品一区| 一区二区三区在线高清| 五月婷婷六月激情| 国产精品国模在线| 亚洲最新色图| 精品无码国产一区二区三区51安| 在线观看三级视频欧美| 制服丝袜在线播放| 久久精品magnetxturnbtih| 天使萌一区二区三区免费观看| 战狼4完整免费观看在线播放版| 91精品国产综合久久福利软件| 图片区小说区亚洲| 久久综合入口| 国产综合色在线| 久久露脸国语精品国产91| 在线视频一区二区| 中文字幕一区二区三区中文字幕 | 久久国内精品自在自线400部| 放荡的美妇在线播放| 亚洲精品国产欧美| 国产精品美女午夜爽爽| 国产美女主播在线播放| 中文字幕av在线一区二区三区| 亚洲av无码片一区二区三区| 国产91久久婷婷一区二区| 欧美涩涩网站| 免费黄在线观看| 亚洲成人性视频| 午夜精品久久久久久毛片| 毛片在线视频播放| 亚洲同性同志一二三专区| 日韩黄色影片| 2022国产精品| 秋霞午夜鲁丝一区二区老狼| 久久久无码一区二区三区| 色狠狠久久aa北条麻妃| 日韩理论电影中文字幕|