精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

唯快不破:上海AI Lab 82頁(yè)綜述帶你感受LLM高效架構(gòu)的魅力

人工智能 新聞
本文從 LLM 架構(gòu)角度出發(fā),帶你剖析大模型的效率秘訣。這一切的核心在于 Transformer 架構(gòu)。

作者:孫偉高 上海人工智能實(shí)驗(yàn)室

近年來(lái),大語(yǔ)言模型(LLMs)展現(xiàn)出強(qiáng)大的語(yǔ)言理解與生成能力,推動(dòng)了文本生成、代碼生成、問(wèn)答、翻譯等任務(wù)的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已經(jīng)深刻改變了人機(jī)交互方式。LLMs 的邊界也不止于語(yǔ)言和簡(jiǎn)單問(wèn)答。隨著多模態(tài)(VLMs)與推理能力(LRMs)的興起,LLMs 正不斷擴(kuò)展到多模態(tài)理解、生成與復(fù)雜推理場(chǎng)景。

但模型性能持續(xù)提升的背后,是模型尺寸、數(shù)據(jù)規(guī)模、RL 推理長(zhǎng)度的快速 Scaling,是算力和存儲(chǔ)資源的急劇消耗。大模型的訓(xùn)練與推理的成本居高不下,成為制約其廣泛落地和應(yīng)用的現(xiàn)實(shí)瓶頸。

本文從 LLM 架構(gòu)角度出發(fā),帶你剖析大模型的效率秘訣。這一切的核心在于 Transformer 架構(gòu)。Transformer 的自注意力機(jī)制雖帶來(lái)了遠(yuǎn)距離建模的突破,卻因 O(N2) 的復(fù)雜度在長(zhǎng)序列任務(wù)中成本高昂。而在 RAG、智能體、長(zhǎng)鏈推理、多模態(tài)等新興場(chǎng)景下,長(zhǎng)序列需求愈發(fā)突出,進(jìn)一步放大了效率與性能之間的矛盾。同時(shí) Transformer 的 FFN 部分采用密集的 MLP 層,同樣面臨模型規(guī)模放大后的訓(xùn)練和推理效率問(wèn)題。

近年來(lái)針對(duì) Transformer 架構(gòu)改進(jìn)的創(chuàng)新工作層出不窮,卻一直缺乏一篇全面深入的綜述文章進(jìn)行總結(jié)。

圖 1:常見(jiàn)長(zhǎng)序列場(chǎng)景

近期,上海 AI Lab 聯(lián)合港科廣、澳門(mén)大學(xué)、中科院自動(dòng)化所、蘇州大學(xué)、瑞典 KTH、北大、港中文等多家機(jī)構(gòu),總結(jié) 440 余篇相關(guān)論文,深入探討了當(dāng)前 LLM 高效結(jié)構(gòu)的最新進(jìn)展,形成這篇 82 頁(yè)的綜述論文:

  • 論文標(biāo)題:Speed Always Wins: A Survey on Efficient Architectures for Large Language Models
  • 論文地址:https://arxiv.org/pdf/2508.09834
  • 項(xiàng)目倉(cāng)庫(kù):https://github.com/weigao266/Awesome-Efficient-Arch

圖 2:大語(yǔ)言模型高效架構(gòu)概覽

該綜述將目前 LLM 高效架構(gòu)總結(jié)分類為以下 7 類:

  • 線性序列建模:降低注意力訓(xùn)練和推理復(fù)雜度,無(wú)需 KV Cache 開(kāi)銷。
  • 稀疏序列建模:通過(guò)稀疏化注意力矩陣,降低計(jì)算與顯存需求。
  • 高效全注意力:在保持完整注意力的前提下優(yōu)化內(nèi)存訪問(wèn)與 KV 存儲(chǔ)。
  • 稀疏專家模型:通過(guò)條件激活部分專家,大幅提升模型容量而不增加等比例計(jì)算成本。
  • 混合模型架構(gòu):結(jié)合線性/稀疏序列建模與全注意力,兼顧效率與性能。
  • 擴(kuò)散語(yǔ)言模型:利用非自回歸的擴(kuò)散模型進(jìn)行語(yǔ)言生成。
  • 其他模態(tài)應(yīng)用:將這些高效架構(gòu)應(yīng)用于視覺(jué)、語(yǔ)音、多模態(tài)模型。

這些方向的探索不僅關(guān)乎 LLM 的未來(lái)效率,也關(guān)乎如何在算力受限的條件下,持續(xù)推動(dòng) AI 走向更強(qiáng)的智能的關(guān)鍵選擇。綜述涉及的方法類別和代表性論文可見(jiàn)如下樹(shù)狀圖:

圖 3:綜述完整組織架構(gòu)

線性序列建模

線性序列建模是近年來(lái)研究相當(dāng)火熱的一個(gè)方向,代表性工作像 Mamba、Lighting Attention、RWKV、GLA、TTT 等在模型架構(gòu)方向都引起過(guò)廣泛關(guān)注。我們將這類技術(shù)細(xì)分為以下幾個(gè)類別:

  • 線性注意力
  • 線性 RNN
  • 狀態(tài)空間模型
  • 測(cè)試時(shí)推理 RNN

并且正如在多篇文獻(xiàn)里已經(jīng)提出的,這些線性序列建模方法可以概括為統(tǒng)一建模的數(shù)學(xué)形式,并且能夠通過(guò)線性化過(guò)程將預(yù)訓(xùn)練模型權(quán)重的 Softmax Attention 架構(gòu)轉(zhuǎn)為 Linear Sequence Modeling 架構(gòu),從而獲得模型效率的大幅提升,如下圖所示。

圖 4:線性序列建模方法

我們將已有的線性序列建模方法從記憶視角和優(yōu)化器視角分別進(jìn)行梳理和對(duì)比,詳細(xì)形式可見(jiàn)下表:

表 1:線性序列建模方法統(tǒng)一建模的 Memory 視角和 Optimizer 視角

其中線性化技術(shù)可以進(jìn)一步細(xì)分為基于微調(diào)的線性化,和基于蒸餾的線性化,如下圖所示:

圖 5:線性化方法

綜述還進(jìn)一步總結(jié)歸納了目前在線性序列建模領(lǐng)域常見(jiàn)的硬件高效實(shí)現(xiàn)方法,可以歸納為 Blelloch Scan、Chunk-wise Parallel 和 Recurrent for Inferences,如下圖所示:

圖 6:線性序列建模方法的硬件高效實(shí)現(xiàn)

稀疏序列建模

稀疏序列建模是另一類有代表性的高效注意力機(jī)制,通過(guò)利用 Attention Map 天然具有的稀疏性加速注意力的計(jì)算,這類方法可以進(jìn)一步細(xì)分為:

  • 靜態(tài)稀疏注意力
  • 動(dòng)態(tài)稀疏注意力
  • 免訓(xùn)練稀疏注意力

代表性的稀疏注意力方法如 Global Attention、Window Attention、Dilated Attention 等,及其工作原理如下圖所示:

圖 7:稀疏注意力的幾種經(jīng)典形式

高效全注意力

另一類高效注意力算法可以統(tǒng)一歸納為高效全注意力,這類方法可以根據(jù)算法思路進(jìn)一步細(xì)分為如下幾類:

  • IO-Aware Attention
  • Grouped Attention
  • Mixture of Attention
  • Quantized Attention

其中 IO-Aware Attention 指代目前使用非常廣泛的 Flash Attention 系列工作,Grouped Attention 則包含廣為使用的 GQA、MLA 等全注意力變體,幾種代表性方法如下圖所示。

圖 8:Grouped Attention 的幾種代表性方法

稀疏混合專家

稀疏混合專家是對(duì) Transformer 架構(gòu)中另一個(gè)重要模塊 FFN 做的一類重要改進(jìn),已經(jīng)逐漸成為(語(yǔ)言和多模態(tài))大模型架構(gòu)的事實(shí)標(biāo)準(zhǔn)。綜述中將相關(guān)文獻(xiàn)按以下三個(gè)方向進(jìn)行分類:

  • Routing Mechanisms
  • Expert Architectures
  • MoE Conversion

路由機(jī)制包括 Token-choice 和 Expert-choice 兩類,其原理如下圖所示:

圖 9:MoE 路由機(jī)制

專家結(jié)構(gòu)的創(chuàng)新工作包括:共享專家、細(xì)粒度專家、零專家、深度路由等,其作用和原理可見(jiàn)下圖:

圖 10:MoE 專家架構(gòu)

另外一個(gè)重要的方向是 MoE 轉(zhuǎn)換,已有的工作包括通過(guò) Split、Copy、Merge 等手段對(duì)專家進(jìn)行構(gòu)造,如下圖所示:

圖 11:MoE 轉(zhuǎn)化機(jī)制

混合架構(gòu)

混合架構(gòu)是近年來(lái)出現(xiàn)的一種實(shí)用的新型架構(gòu),可以在線性/稀疏注意力和全注意力之間取得微妙的 Trade-off,也在效率和效果間找到了最佳甜蜜點(diǎn)。具體可細(xì)分為:

  • 層間混合
  • 層內(nèi)混合

圖 12:混合架構(gòu)形式

擴(kuò)散大語(yǔ)言模型

擴(kuò)散大語(yǔ)言模型是近期出現(xiàn)的一個(gè)熱門(mén)方向,創(chuàng)新性地將擴(kuò)散模型從視覺(jué)生成任務(wù)遷移至語(yǔ)言任務(wù),從而在語(yǔ)言生成速度上取得大幅進(jìn)步。相關(guān)工作可以細(xì)分為:

  • Non-Autoregressive Diffusion LLM
  • Bridging Diffusion LLM and Autoregressive
  • Extending Diffusion LLM to Multimodality

圖 13:擴(kuò)散大語(yǔ)言模型機(jī)制

應(yīng)用至其他模態(tài)

最后一個(gè)重要的部分是高效架構(gòu)在其他模態(tài)上的應(yīng)用,涵蓋視覺(jué)、音頻和多模態(tài)。以 Mamba 為代表的線性模型被廣泛應(yīng)用至多種模態(tài)任務(wù)上,并取得了優(yōu)秀的表現(xiàn),綜述將這類模型總結(jié)梳理至如下表格:

寄語(yǔ)

最后正如帝國(guó)時(shí)代 3 中這條神奇代碼「Speed Always Wins」能讓游戲世界「Increases build, research, shipment, and gather rates by 100 times for all players」一樣,我們希望綜述中的 Efficient Architectures 可以真被用來(lái) 100x 加速 AI 世界的構(gòu)建,更快更便宜地訓(xùn)練出更強(qiáng)更實(shí)用的大模型。請(qǐng)記住這條神奇代碼:「Speed Always Wins」

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2018-06-19 16:48:42

華為

2021-01-26 09:19:58

Redis框架架構(gòu)

2018-04-13 10:36:44

Web應(yīng)用優(yōu)化

2016-08-01 10:38:14

華為

2020-06-22 13:43:46

代碼編碼語(yǔ)言

2014-12-04 17:30:08

編程

2014-12-04 15:19:51

程序員

2012-12-24 09:57:58

ERPDynamics AX

2022-02-21 09:35:36

機(jī)器學(xué)習(xí)自然語(yǔ)言模型

2018-12-19 06:38:01

Wi-Fi 6Wi-Fi網(wǎng)絡(luò)

2017-06-20 11:10:13

2021-02-23 10:15:31

軟件開(kāi)發(fā)IT領(lǐng)導(dǎo)者首席信息官

2021-03-03 11:36:00

嵌入式項(xiàng)目開(kāi)發(fā)字符串格式化

2016-01-13 15:11:32

leangoo工具

2023-07-03 09:55:01

2018-01-26 16:28:24

阿里Blink核心

2018-01-25 12:01:08

阿里巴巴機(jī)器學(xué)習(xí)大數(shù)據(jù)

2023-07-17 10:45:04

模型應(yīng)用

2009-12-17 17:00:32

無(wú)線路由linksys
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

午夜老司机在线观看| 亚洲成人av影片| 综合久久成人| 欧美日韩在线视频首页| 日韩av一区二区三区在线观看| 美女黄页在线观看| 国产精品激情| 亚洲性夜色噜噜噜7777| 宇都宫紫苑在线播放| av小说在线播放| 国产欧美精品区一区二区三区 | 亚洲欧美综合另类中字| 天天色天天综合网| 伊人久久精品一区二区三区| 国产精品黄色在线观看| 精品午夜一区二区三区| 国产尤物视频在线观看| 国产日韩欧美一区| www.亚洲人.com| 中文字幕狠狠干| **欧美日韩在线| 精品久久久久久久久国产字幕| 杨幂一区欧美专区| 婷婷久久久久久| 国产制服丝袜一区| 国产黑人绿帽在线第一区| 黄色录像二级片| 国产成人影院| 亚洲高清福利视频| www.51色.com| 成人在线免费| 日本黄色一区二区| 精品久久一二三| 国产99re66在线视频| 最新成人av在线| 日韩av电影在线观看| 亚州视频一区二区三区| 成人午夜短视频| 亚洲一区二区三区四区视频| 狠狠躁夜夜躁人人爽视频| 国产精品毛片在线| 97在线观看免费高清| 欧美成人黄色网| 婷婷久久综合| 色阁综合伊人av| 男人的天堂av网| 精品国产乱码久久久| 日韩经典第一页| 国产伦精品一区三区精东| 一区二区免费| 精品成人a区在线观看| 免费人成视频在线播放| 精品国产乱码久久久久久樱花| 欧美日韩久久久| 无需播放器的av| 激情中国色综合| 欧美日韩亚洲另类| 奇米视频7777| 麻豆国产一区| 精品成人一区二区三区| 色综合久久五月| 日韩大片在线免费观看| 亚洲毛片在线看| 精品国产av无码| 成人一级毛片| www.亚洲天堂| 免费一级全黄少妇性色生活片| 欧美精品激情| 777精品视频| 自拍偷拍校园春色| 另类小说综合欧美亚洲| 91老司机在线| 亚洲奶汁xxxx哺乳期| 99视频在线精品| 欧美极品一区| 日本高清视频在线观看| 亚洲欧美视频在线观看视频| 99热这里只有精品免费| а√天堂中文资源在线bt| 欧美日韩在线视频观看| 在线观看免费视频高清游戏推荐| 国产成人免费av一区二区午夜| 日韩欧美一级二级三级久久久| 制服丝袜av在线| 亚洲涩涩av| 日韩在线观看免费全| 免费一级片视频| 天堂一区二区在线| 国产啪精品视频网站| 亚洲第一成年人网站| 99re视频这里只有精品| 亚洲啪啪av| 日韩免费影院| 日韩人在线观看| www.51色.com| 欧美欧美黄在线二区| 精品久久国产精品| 成年人午夜视频| 久久丁香综合五月国产三级网站| 97久草视频| 国产在线免费观看| 一区二区免费在线| 亚洲人成无码www久久久| 99精品女人在线观看免费视频| 精品国产91乱码一区二区三区| 四季av中文字幕| 在线观看视频日韩| 国产日韩中文字幕在线| 天堂成人在线视频| 最新成人av在线| 99久久激情视频| 福利在线一区| zzjj国产精品一区二区| 欧美性猛交bbbbb精品| 国产精品自产自拍| 日韩在线第一区| 色是在线视频| 精品久久五月天| 97在线观看视频免费| 久久动漫亚洲| 国产成人精品免费视频大全最热| www视频在线观看免费| 亚洲aaa精品| 男人操女人下面视频| 狠狠色丁香婷婷综合影院| 国模gogo一区二区大胆私拍| 国产又粗又猛又黄又爽无遮挡| 久久亚洲私人国产精品va媚药| 日韩欧美视频免费在线观看| 欧美成人福利| 国产一区二区三区久久精品| 日韩欧美成人一区二区三区| 国产成人av电影在线观看| 宅男在线精品国产免费观看| 素人一区二区三区| 亚洲欧美一区二区三区在线| 日韩伦人妻无码| 成人黄色综合网站| 国产在线视频在线| 免费观看亚洲视频大全| 中文字幕亚洲情99在线| 中文字幕一区二区三区四区欧美| 99国产欧美另类久久久精品| 国产美女在线一区| 成人午夜大片| 国内免费精品永久在线视频| 人妻无码中文字幕免费视频蜜桃| 亚洲综合精品自拍| 亚洲精品成人无码毛片| 精品999网站| 精品久久蜜桃| 中文字幕资源网在线观看免费 | av电影在线观看网址| 日本韩国欧美在线| 免费黄色片网站| 久久黄色级2电影| 最新中文字幕久久| 日韩三级av高清片| 久久免费视频观看| 香蕉视频911| 色琪琪一区二区三区亚洲区| 亚洲色成人网站www永久四虎| 三级欧美在线一区| 亚洲一区三区视频在线观看| a一区二区三区亚洲| 久久国产精品影视| 懂色av一区二区三区四区| 天天操天天干天天综合网| 国产制服丝袜在线| 日韩电影在线一区二区三区| 99精品视频网站| 亚洲精品国产九九九| 性欧美长视频免费观看不卡| 亚洲欧美一区二区三| 精品视频全国免费看| 国产成人av免费在线观看| 国产馆精品极品| 免费观看日韩毛片| 欧美hd在线| 高清国产在线一区| 色老太综合网| 欧美成人午夜剧场免费观看| 少妇人妻一区二区| 欧美熟乱第一页| 免费视频一二三区| 国产婷婷精品av在线| 成人免费黄色av| 国产精品婷婷| 在线观看日韩片| 国产精品主播在线观看| 国产精品第2页| 制服丝袜在线播放| 亚洲天堂男人天堂| jlzzjlzz亚洲女人18| 欧美性高潮在线| a在线视频播放观看免费观看| av一二三不卡影片| jizzzz日本| 一区二区毛片| 潘金莲一级淫片aaaaaa播放1| 日韩黄色网络| 91在线中文字幕| 欧美特黄aaaaaaaa大片| 欧美肥老妇视频| aⅴ在线视频男人的天堂| 精品国产欧美一区二区| 一区二区三区免费在线| 午夜欧美大尺度福利影院在线看 | 亚洲av成人无码久久精品老人 | 日韩免费高清在线观看| av片在线观看永久免费| 亚洲天堂一区二区三区| 色婷婷在线视频| 91精品欧美福利在线观看| 9i看片成人免费看片| 亚洲精品成人天堂一二三| 国产综合精品久久久久成人av | 日韩福利在线视频| 9人人澡人人爽人人精品| 欧美激情第一区| 毛片av一区二区三区| 日本精品www| 亚洲毛片一区| 欧美国产视频一区| 亚州av乱码久久精品蜜桃| 日韩动漫在线观看| 亚洲婷婷伊人| 久久综合伊人77777麻豆| 岛国av一区| 不卡视频一区二区| 激情不卡一区二区三区视频在线 | 成人一级片网站| 一本综合久久| 久久亚洲中文字幕无码| 欧美精品91| 欧美一级特黄aaaaaa在线看片| 日韩在线观看电影完整版高清免费悬疑悬疑 | 热久久最新地址| 欧美在线亚洲综合一区| 正在播放久久| 91精品动漫在线观看| 亚洲人成人77777线观看| 日韩欧美网址| 一本一本a久久| 欧美hd在线| 天堂av在线中文| 伊人成综合网| 日韩一区二区高清视频| 国产精品久久| 欧美一级在线看| 久久精品动漫| jizz欧美激情18| 免费在线看成人av| 国产精品自在自线| 国产在线精品视频| 国产人妖在线观看| 波多野结衣精品在线| 亚洲一区二区三区无码久久| 久久一区二区三区四区| 亚洲最大成人网站| 国产午夜精品一区二区三区嫩草| 波多野在线播放| 国产精品久久99| 私库av在线播放| 亚洲成av人片一区二区三区| 日韩免费视频一区二区视频在线观看| 岛国视频午夜一区免费在线观看| 国产一级18片视频| 欧美亚洲国产怡红院影院| 91麻豆成人精品国产| 欧美变态tickle挠乳网站| 色视频在线观看福利| 在线观看欧美视频| www国产在线观看| 国外色69视频在线观看| 裤袜国产欧美精品一区| 国产在线a不卡| 综合激情久久| 欧美亚洲另类久久综合| 国产大片一区| 成年人午夜免费视频| 日本在线观看不卡视频| 亚洲女人在线观看| 99综合电影在线视频| 欧美人与禽zoz0善交| 亚洲精品videosex极品| 天干夜夜爽爽日日日日| 91精品国产综合久久久蜜臀粉嫩 | 亚洲欧美日韩激情| 欧美肥胖老妇做爰| 天堂av一区二区三区| 丝袜美腿亚洲一区二区| 成人性生交大片免费看网站| 国产精品999| 2023国产精华国产精品| 日韩av电影免费观看| 激情综合久久| 中文字幕久久av| 久久―日本道色综合久久| 日本a级片视频| 日本韩国欧美国产| 亚洲精品国产精品国| 一区二区av在线| 69av成人| 成人性生交大片免费看视频直播 | 亚洲人午夜精品免费| 伊人影院蕉久影院在线播放| 日韩美女写真福利在线观看| 97一区二区国产好的精华液| 日韩在线三区| 国产精品视区| aaa黄色大片| 亚洲欧洲日本在线| 成人毛片一区二区三区| 亚洲成人黄色在线观看| 老司机精品影院| 国产精品成人久久久久| 亚洲另类春色校园小说| 91午夜在线观看| 国产一区二区三区av电影| 久久久视频6r| 欧美午夜精品久久久久久久| 亚洲乱码精品久久久久.. | 爱啪啪综合导航| 亚洲a一级视频| 日韩欧美伦理| 手机视频在线观看| 久久久不卡影院| 少妇一级淫片免费放中国| 日韩欧美国产电影| а√中文在线8| 国产自摸综合网| 99久久夜色精品国产亚洲1000部| 熟妇人妻va精品中文字幕| 91丨porny丨蝌蚪视频| 国产一级视频在线| 欧美mv日韩mv亚洲| 亚洲区欧洲区| av一区和二区| 欧美精品不卡| 五月天丁香社区| 亚洲国产综合人成综合网站| www.精品久久| 久久99久久99精品免观看粉嫩| 91精品福利观看| 青少年xxxxx性开放hg| 精品一区二区三区免费播放| 成人欧美一区二区三区黑人一| 欧美日韩午夜精品| 日本在线免费| 91探花福利精品国产自产在线| 亚洲精品a级片| 亚洲少妇一区二区| 亚洲国产精品欧美一二99| 日本波多野结衣在线| 国外成人在线直播| 久久av综合| 久久99999| 亚洲免费观看视频| 丰满人妻妇伦又伦精品国产 | 韩国美女久久| 五月天婷亚洲天综合网鲁鲁鲁| 日韩成人午夜精品| 国产精品精品软件男同| 日韩欧美久久一区| 大菠萝精品导航| 欧美日韩综合久久| 久久精品国产精品亚洲精品| 成年人二级毛片| 欧美不卡激情三级在线观看| 中文字幕在线看片| 亚洲黄色成人久久久| 国产精品影视在线| 国产精品高颜值在线观看| 国产久一一精品| 国产一区二区三区四区三区四| free性中国hd国语露脸| 在线观看91视频| 怡红院红怡院欧美aⅴ怡春院| 国产另类自拍| 日韩高清不卡一区二区三区| 黄色精品视频在线观看| 精品国一区二区三区| 成人av免费电影网站| www亚洲国产| 26uuu亚洲婷婷狠狠天堂| 在线视频 91| 久久人人爽人人| 日本久久精品| 国产国语老龄妇女a片| 欧美一a一片一级一片| 亚洲区欧洲区| 视频二区一区| 成人性生交大合| 中文字幕欧美在线观看| 欧美肥婆姓交大片| 日韩精品1区| 国产高清自拍视频| 欧美一级欧美三级| 欧洲成人一区|