精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

第二代InfLLM開源,同尺寸快三倍!零參數,可訓練稀疏注意力

人工智能 新聞
InfLLM-V2是一種可高效處理長文本的稀疏注意力模型,僅需少量長文本數據即可訓練,且性能接近傳統稠密模型。通過動態切換短長文本處理模式,顯著提升長上下文任務的效率與質量。從短到長低成本「無縫切換」,預填充與解碼雙階段加速,釋放長上下文的真正生產力。

長序列高效處理已成為大模型應用的關鍵。

傳統稠密注意力在序列變長時計算開銷極速增長,直接限制了產品可用性與成本可控性。

為解決這一痛點,清華 、OpenBMB 和哈工大提出 InfLLM-V2:一種零額外參數、訓練高效的原生稀疏注意力框架。

InfLLM在短文本場景保持原生高效率,在長文本場景則切換為稀疏模式,帶來端到端的顯著加速。

該方法僅用5B的長文本詞元,即可完成稀疏注意力的訓練(而DeepSeek-V3.2-Exp訓練了近 1T 詞元的數據,才完成稀疏注意力的訓練)。

具體而言,InfLLM-V2相比于稠密注意力機制可以實現4倍的速度提升,在長文本理解任務上保持98.1%的稠密模型性能,在深思考任務上保持99.7%的稠密模型性能。

InfLLM有三個核心優勢

1. 低成本訓練:僅需5B長文本數據即可完成稀疏注意力能力的訓練,訓練成本低,適配周期短。

2. 短到長無縫切換、效率雙優:零新增參數,短序列用稠密、長序列切換為稀疏,完全對齊「短序列預訓練-長序列后訓練」的主流范式,訓練穩定、收斂快。

3. 高效算子實現:針對稀疏注意力「相關上下文選擇」(塊選擇)的時間瓶頸進行系統優化,提出面向硬件的高效實現,顯著降低HBM I/O與計算開銷,釋放稀疏注意力的全部潛能。

論文鏈接:https://www.arxiv.org/pdf/2509.24663

模型鏈接:https://huggingface.co/openbmb/MiniCPM4.1-8B

InfLLM-V2如何做到既「強」又「快」

在標準 Transformer 的自注意力中,每個查詢詞元 (Q[t]) 需與全部歷史詞元 (K[:t]) 計算相似度并參與注意力計算。

在長上下文(動輒數十萬詞元)時造成難以承受的時延與成本。經驗上,長序列中絕大多數遠距離注意力計算并非同等重要,注意力矩陣呈現顯著的「稀疏性」(多數注意力得分接近零)。

如果能僅對「少量相關上下文」進行計算,就能顯著降低模型注意力計算開銷。

稀疏注意力將「每個查詢詞元都與所有鍵值交互」的稠密范式,替換為「每個查詢詞元只與一個選定子集交互」的稀疏范式。

核心包括兩個步驟:

塊選擇,將上下文拆分為鍵值塊,并為每個查詢確定需要參與注意力計算的鍵值子集;

稀疏注意力計算,僅在被選中的子集上進行注意力計算。

可訓練的稀疏注意力在模型訓練過程中即引入稀疏機制,能夠系統性地提升模型在長文本場景下的效率與質量。

然而,現有代表性方法主要為 DeepSeek提出的NSA架構。

NSA雖然采用了成熟的塊稀疏結構并配套專用CUDA內核,但其架構與主流的「短序列預訓練—長序列微調」范式存在明顯錯配:引入三套獨立的 KV 緩存與三種注意力分支,在「長序列微調」中將使得模型收斂不穩,并且對短序列場景增加了大量的額外開銷。

針對上述痛點,InfLLM-V2 提出「零額外參數、長短無縫切換」 的可訓練稀疏路徑,在不改變原有注意力參數的前提下,完成從稠密到稀疏的平滑切換。

無縫短長切換:僅用一套共享鍵值緩存(零額外參數),把 NSA 多分支并為單一分支;與稠密注意力在參數與計算方式上完全對齊,按序列長度動態切換稠密/稀疏,訓練更穩。

長短序列效率雙優:短文本直接使用稠密注意力機制,零額外開銷與性能回退;長文本用統一的稀疏范式,prefill 與 decode 全鏈路提速。

硬件友好的塊選擇:基于 MLP 的塊壓縮操作修改為無參數池化操作;壓縮注意力(圖中Compressed Attetntion)修改為僅生成選擇分數,計算 Top-K;配合 GQA 組內共享 Top-K,實現了更優的計算 Kernel 融合,避免塊選擇代替稀疏注意力成為效率瓶頸。

在以上技術的支持下,InfLLM-V2僅需使用5B詞元即可實現稀疏注意力模型的訓練!

與DeepSeek Sparse Attention對比

值得注意的是,在9月29日,DeepSeek-V3.2-Exp中提出了NSA的升級版 —— DeepSeek Sparse Attention(DSA)。

DSA拋棄了NSA中三套獨立KV緩存與三種注意力分支的設計,并在后訓練階段引入稀疏注意力算法。

實驗結論

研究人員基于MiniCPM4的基座模型,在長文本理解與深思考任務上對比了不同稀疏注意力算法的效果。

長文本理解任務

在長文本理解任務RULER、LongBench與LongPPL評測中,InfLLM-V2實現了與稠密注意力模型完全可比的性能,展現了InfLLM-V2的優越性。其他稀疏注意力方法一定程度上都會導致模型性能下降。

NSA方法新增了大量參數,在少量的長文本訓練后,無法讓模型捕捉到長上下文中的前后語義關聯。

深思考任務

在數學、代碼深思考任務中,InfLLM-V2能夠實現與稠密注意力可比的性能,而 NSA 方法卻對模型效果有著較大的損害。

隨著愈來愈多的任務要求模型進行更深入的推理與分析,「如何高效加速模型的思考過程」已成為當下的重要研究方向。InfLLM-V2充分展現了稀疏注意力在深思考場景下的潛力。

效率評測

研究人員在A100與4090兩款芯片上對InfLLM-V2進行了推理效率評測。

結果表明,InfLLM?V2相對稠密注意力可獲得顯著加速,在128K長文本中,InfLLM-V2 可實現4-9倍算子加速比。

分解分析與消融實驗表明,高效塊選擇設計是關鍵加速來源。

端到端評測中,InfLLM?V2在prefill與decode分別實現約2.1×與2.3×加速。

算子速度測評


端到端速度測評

首個開源原生稀疏注意力模型

MiniCPM4/MiniCPM4.1

在今年6月,OpenBMB聯合清華提出了InfLLM-V2架構,并基于該架構共同發布了首個開源的原生稀疏注意力模型MiniCPM4,并在9月初開源了混合思考版本MiniCPM4.1

MiniCPM4.1在眾多深思考任務上取得綜合平均分同尺寸模型第一。

MiniCPM4.1充分利用稀疏注意力、投機采樣等高效算法,在LiveCodeBench、AIME等代碼、數學推理的測試中,推理速度比Qwen3-8B等同尺寸開源模型快3倍以上。

研究人員表示,將持續優化InfLLM-V2的訓練算子與推理算子,將InfLLM-V2集成至SGLang等主流推理框架中。

同時,為了促進稀疏注意力機制的研究,也將陸續開源論文中使用到的基座模型(Base模型)與長文本訓練數據。

責任編輯:張燕妮 來源: 新智元
相關推薦

2009-02-13 16:54:50

EMCSSDSymmetrix

2012-05-15 18:04:57

Trinity

2019-09-30 07:10:08

第二代云計算IT專業人員

2019-10-08 11:49:06

第二代云計算多云

2013-12-12 15:36:35

亞馬遜

2011-08-30 17:29:55

2015-02-02 13:15:59

2013-05-03 09:44:02

Surface平板

2011-12-11 23:19:21

2014-10-18 13:53:26

2021-04-20 10:30:43

區塊鏈安全互聯網

2020-08-13 10:50:55

Graphcore

2012-05-08 13:18:42

流控引擎流控

2012-08-08 11:02:54

Surface微軟

2015-08-24 10:18:05

2010-01-27 18:12:55

2013-04-19 11:08:57

E-Band微波LTE移動通信網絡

2014-10-30 09:40:13

2014-04-17 10:24:42

點贊
收藏

51CTO技術棧公眾號

亚洲аv电影天堂网| 亚洲综合免费观看高清完整版| 2024亚洲男人天堂| 女女互磨互喷水高潮les呻吟| 国产成人精品一区二区三区视频| 成人欧美一区二区三区白人 | 国产极品在线播放| 美女网站一区| 欧美一区二区三区白人| 成熟了的熟妇毛茸茸| 1024免费在线视频| 成人高清伦理免费影院在线观看| 国产精品成人一区| 久草免费在线视频观看| 国产一区二区三区电影在线观看| 91精品国产美女浴室洗澡无遮挡| 欧美精品99久久| а√资源新版在线天堂| 久久影音资源网| 波多野结衣精品久久| 成人a v视频| 亚洲视频高清| 日韩亚洲欧美中文在线| 欧美大片免费播放器| 四虎成人精品一区二区免费网站| 欧美午夜性色大片在线观看| 糖心vlog在线免费观看| 成人综合影院| 久久这里都是精品| av在线不卡一区| 国产又黄又粗又硬| 视频一区二区国产| 4438全国成人免费| 国产精品二区一区二区aⅴ| 99精品美女| 国产亚洲精品激情久久| 国产亚洲色婷婷久久99精品91| gogo大尺度成人免费视频| 色综合视频在线观看| 欧美日韩福利在线| 日韩另类在线| 亚洲伊人色欲综合网| 国产高清免费在线| 欧美激情免费| 国产精品成人免费| 亚洲欧洲精品一区二区| 福利在线午夜| 国产欧美一区二区精品忘忧草| 久久精品日产第一区二区三区乱码| av中文字幕第一页| 国产精品456露脸| 亚洲xxxx18| 精品欧美一区二区精品少妇| 国产美女精品人人做人人爽| 91精品久久久久久久久久入口| 日韩中文字幕高清| 日韩在线a电影| 国产精品美女在线| 亚洲无码精品在线播放| 九一九一国产精品| 亚洲a∨日韩av高清在线观看| 国产麻豆免费观看| 国产精品影视网| 官网99热精品| 色视频在线看| 久久久国际精品| 亚洲一卡二卡三卡四卡无卡网站在线看| 国产视频第一页在线观看| 久久久久久久av麻豆果冻| 茄子视频成人在线观看| 成年网站在线| 亚洲色图制服诱惑| 久久亚洲精品无码va白人极品| sm久久捆绑调教精品一区| 黄色精品在线看| 999精品网站| 成人污版视频| 亚洲国产免费av| 波多野结衣 在线| 久久免费av| 欧美高清视频免费观看| 日本黄色片视频| 视频一区视频二区在线观看| 国产精品影院在线观看| 亚洲精品国产suv一区| 99精品1区2区| 亚洲人成77777| 欧美激情成人动漫| 色婷婷精品大在线视频 | 午夜欧美巨大性欧美巨大 | 亚洲国产综合一区| 91麻豆6部合集magnet| 色视频一区二区三区| 在线视频国产区| 欧美性精品220| 亚洲一二三不卡| 美女毛片一区二区三区四区最新中文字幕亚洲 | 中文字幕制服丝袜成人av| 亚洲色图都市激情| 澳门成人av网| 日韩视频在线永久播放| 色噜噜日韩精品欧美一区二区| 先锋资源久久| 奇米影视亚洲狠狠色| 亚洲一区二区色| 91麻豆国产自产在线观看| 做爰高潮hd色即是空| 免费日韩电影| 欧美va亚洲va| 国产大屁股喷水视频在线观看| 亚洲狼人精品一区二区三区| 国产在线视频一区| 青青青免费视频在线2| 一区二区三区欧美日韩| 污污网站免费观看| 亚州综合一区| 欧美激情手机在线视频 | 亚洲福利在线看| 伊人久久久久久久久久久久久久| 国产日韩欧美| 粉嫩精品一区二区三区在线观看 | 色综合老司机第九色激情| 国产女主播喷水视频在线观看| 成人一级视频在线观看| 中文字幕在线亚洲精品| 搜成人激情视频| 亚洲娇小xxxx欧美娇小| 中文字幕av久久爽av| 免费在线观看不卡| 日本黑人久久| 亚洲黄色网址| 亚洲美女性生活视频| 日韩成人高清视频| 成人蜜臀av电影| 精品免费久久久久久久| 国产精品日本一区二区不卡视频 | 国产一区二区三区免费看| 欧美一区三区二区在线观看| 国产污视频在线播放| 精品国产乱码久久久久久浪潮| 中文字幕人妻一区二| 精品一区二区三区日韩| 亚洲视频sss| 日本肉肉一区| 自拍偷拍亚洲欧美| 人妻中文字幕一区二区三区| 国产丝袜欧美中文另类| 男人天堂999| 最近国产精品视频| 国产91久久婷婷一区二区| 日本天堂影院在线视频| 色系网站成人免费| 日本人亚洲人jjzzjjz| 日韩精品电影在线观看| 亚洲欧美日韩精品在线| 亚洲电影二区| 欧美老女人性生活| 日本国产在线观看| 大桥未久av一区二区三区| 一本加勒比波多野结衣| 亚洲影院免费| 色噜噜狠狠一区二区三区| 欧美成人家庭影院| 九九热视频这里只有精品| 性色av蜜臀av| 欧美日韩一区二区免费视频| 精品无码国产污污污免费网站 | 青青草视频在线免费观看| 日韩欧美中文字幕在线观看| 最近中文字幕在线mv视频在线| 日本成人在线电影网| 亚洲图片小说在线| 秋霞影院一区| 欧美中文字幕在线| 免费在线毛片网站| 欧美第一区第二区| 精品人妻一区二区三区免费看| 国产日韩欧美高清| 国产一级免费大片| 国产精品人人爽人人做我的可爱| 日韩欧美亚洲区| 超碰国产精品一区二页| 国模精品一区二区三区色天香| 九色国产在线观看| 777久久久精品| 国产一级免费观看| 国产日本亚洲高清| 黄页网站在线看| 噜噜噜91成人网| 免费观看中文字幕| 神马日本精品| 亚洲xxxxx电影| 日本综合字幕| 欧美日韩爱爱视频| 韩国中文免费在线视频| 日韩午夜激情免费电影| 国产性生活视频| 亚洲一区二区三区四区在线免费观看 | 久久国产精品首页| 青春草在线观看| 91精品国产欧美一区二区成人| 国产又粗又爽视频| 亚洲人吸女人奶水| 1024手机在线观看你懂的| 成人免费视频caoporn| 亚洲综合色在线观看| 日韩午夜av| 中文字幕中文字幕在线中心一区| 欧美人妖视频| 成人av免费电影| 欧美伊人亚洲伊人色综合动图| 91av在线免费观看| 女同一区二区免费aⅴ| 中文字幕欧美日韩| 男操女在线观看| 欧美精品一区视频| 国产欧美久久久| 欧美日韩精品免费| 中日韩黄色大片| 一区二区三区四区五区视频在线观看| 午夜影院黄色片| 久久久噜噜噜久久人人看 | 国产精品国产三级国产专播品爱网| 国产69视频在线观看| 激情综合五月婷婷| 亚洲视频第二页| 久久亚洲国产精品一区二区| 男女视频网站在线观看| 欧美体内she精视频在线观看| 亚洲一区在线免费| 欧美中文字幕一区二区| 日韩av电影免费观看| 国产欧美日韩在线一区二区| 久久av免费一区| 精品自拍偷拍| 极品尤物一区二区三区| 久久亚州av| 国外成人在线视频网站| 凹凸av导航大全精品| 成人综合av网| 精品视频高潮| 精品乱码一区| 人人香蕉久久| 蜜桃狠狠色伊人亚洲综合网站| 农村少妇一区二区三区四区五区| 国产精品swag| 国偷自产av一区二区三区| 国产精品一区二区三区免费| 粉嫩一区二区三区四区公司1| 产国精品偷在线| 成人高潮a毛片免费观看网站| www.av一区视频| 精品三级av在线导航| 久久一区免费| 欧美日韩水蜜桃| 在线免费观看一区二区三区| 91精品1区| 阿v天堂2018| 国产日韩综合| 免费观看成人在线视频| 秋霞电影网一区二区| 午夜精品免费看| 国产.欧美.日韩| 少妇光屁股影院| 国产精品视频九色porn| 三级黄色录像视频| 一区二区三区在线影院| 国产一级做a爱片久久毛片a| 日本韩国精品一区二区在线观看| 99re这里只有精品在线| 欧美另类videos死尸| 丰满熟妇人妻中文字幕| 亚洲欧美另类人妖| 麻豆视频在线免费观看| 久久男人av资源网站| 粉嫩一区二区| 91精品视频网站| 国产精品白浆| 亚洲精品成人久久久998| 欧美激情偷拍| wwwxxx黄色片| 国产乱码精品一区二区三| 玖玖爱在线精品视频| 中文字幕欧美日本乱码一线二线| 久久精品视频免费在线观看| 精品国产91久久久久久老师| 波多野结衣一二区| 精品少妇一区二区三区在线视频| 日本一区二区三区在线观看视频| 日韩视频免费观看| 最近中文字幕在线观看| 欧美亚洲专区| 999精品网站| 国产91色综合久久免费分享| 欧美熟妇激情一区二区三区| 亚洲精品一二三区| 黄色污污网站在线观看| 日韩三级精品电影久久久| 精品视频一二区| 欧美高清在线观看| 777午夜精品电影免费看| 99在线国产| 欧美在线观看视频一区| 黄色激情在线视频| 九九国产精品视频| 一道本在线观看| 亚洲va天堂va国产va久| 97在线视频人妻无码| 亚洲人成网7777777国产| 国产极品人妖在线观看| 国产中文字幕日韩| 精品国产乱码久久久| 精品视频免费在线播放| 韩国精品在线观看| 免费成人深夜天涯网站| 欧美性极品少妇精品网站| 欧美一级在线免费观看| 久久久国产视频91| 欧美在线va视频| 女人一区二区三区| 一区二区日本视频| 中文字幕人妻一区| 一区二区不卡在线播放| 97超碰人人草| 自拍偷拍亚洲精品| 国产精品99久久久久久董美香 | 久久久久99人妻一区二区三区| 国产精品欧美久久久久一区二区 | 老色鬼久久亚洲一区二区| 日本国产在线视频| 亚洲综合在线五月| 精品国产亚洲av麻豆| 日韩午夜在线视频| 日韩专区视频| 一区二区三区欧美在线| 麻豆视频观看网址久久| 中国女人特级毛片| 欧美艳星brazzers| 97电影在线| 国产精品午夜国产小视频| 精品视频97| 亚洲欧美偷拍另类| 最新热久久免费视频| 国产日本精品视频| 久精品免费视频| 99国产精品免费网站| 免费高清一区二区三区| 丁香网亚洲国际| 国产福利拍拍拍| 国产网站欧美日韩免费精品在线观看| 一个人www视频在线免费观看| 久久久水蜜桃| 久久在线91| 久久中文字幕精品| 欧美日韩黄色影视| 久cao在线| 91情侣在线视频| 亚洲大片在线| 三上悠亚影音先锋| 欧美日韩www| 亚洲综合图区| 精品日韩电影| 日韩高清不卡一区二区三区| 国产午夜精品久久久久久久久| 欧美日韩一区二区三区免费看| 黄色av电影在线播放| 2014亚洲精品| 中文在线不卡| 一级黄色片网址| 91精品免费在线| av中文在线资源库| 日本一区二区三区四区高清视频 | 精品自拍一区| 精品伦理一区二区三区| 日本不卡高清视频| 亚洲精品久久久久久国| 精品国产91乱码一区二区三区| 高清精品在线| 先锋影音网一区| 国产成人欧美日韩在线电影| 国产又大又黄视频| 日日狠狠久久偷偷四色综合免费 | 全球最大av网站久久| av中文字幕av| 国产清纯美女被跳蛋高潮一区二区久久w| 91久久精品无码一区二区| 欧美国产日产韩国视频| 国产精品密蕾丝视频下载| 国产性生活一级片| 色婷婷综合久久久久中文| 大片免费在线观看| 欧美高清视频一区| 国产精品一区二区黑丝| 日本视频在线观看免费| 久久精品男人天堂| 狠狠做深爱婷婷综合一区| 亚洲丝袜在线观看| 欧美主播一区二区三区| 黄色大片在线| 伊人久久av导航|