精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于閃電注意力機(jī)制,創(chuàng)新高效開源大模型

人工智能 新聞
MiniMax開源了基于閃電注意力機(jī)制的專家混合模型Minimax。

從數(shù)學(xué)競賽、編程到自然語言處理,通過大規(guī)模的強(qiáng)化學(xué)習(xí)的模型正不斷提升其推理能力。但傳統(tǒng)的Transformer架構(gòu)由于其注意力機(jī)制的二次計(jì)算復(fù)雜度,在處理長文本和復(fù)雜推理任務(wù)時(shí)面臨著效率瓶頸。

盡管有研究提出了多種改進(jìn)方法,如稀疏注意力、線性注意力等,但這些方法在大規(guī)模推理模型中的應(yīng)用效果尚未得到充分驗(yàn)證,大多數(shù)領(lǐng)先的模型仍然依賴于傳統(tǒng)的注意力設(shè)計(jì)。

所以,MiniMax開源了基于閃電注意力機(jī)制的專家混合模型Minimax。

圖片

開源地址:https://github.com/MiniMax-AI/MiniMax-M1

在架構(gòu)方面,MiniMax-M1總參數(shù)為4560億,459億參數(shù)處于激活狀態(tài),包含32個(gè)專家。其注意力設(shè)計(jì)采用混合模式,每七個(gè)配備閃電注意力機(jī)制的Transnormer塊后跟隨一個(gè)帶有Softmax注意力的Transformer塊。

這種設(shè)計(jì)從理論上支持推理長度高效擴(kuò)展至數(shù)十萬token,例如,在生成長度為10萬token時(shí),相比DeepSeek R1僅消耗25%的FLOPs,顯著降低了計(jì)算成本。同時(shí),模型原生支持100萬token的上下文長度,是DeepSeek R1的8倍,遠(yuǎn)超當(dāng)前所有開源權(quán)重的大型推理模型,為長文本處理和深度推理提供了基礎(chǔ)。

創(chuàng)新模塊方面,MiniMax-M1的核心突破體現(xiàn)在注意力機(jī)制和強(qiáng)化學(xué)習(xí)算法的優(yōu)化。閃電注意力機(jī)制作為線性注意力的一種I/O感知實(shí)現(xiàn),通過減少傳統(tǒng)softmax注意力的二次計(jì)算復(fù)雜度,實(shí)現(xiàn)了測試時(shí)計(jì)算的高效擴(kuò)展。

該機(jī)制不僅在推理階段提升效率,還為強(qiáng)化學(xué)習(xí)訓(xùn)練提供了天然優(yōu)勢,配合混合MoE架構(gòu),使得模型在處理長序列時(shí)的計(jì)算量增長更接近線性,而非傳統(tǒng)架構(gòu)的指數(shù)級增長。

圖片

另一關(guān)鍵創(chuàng)新是CISPO算法,這是一種專為提升強(qiáng)化學(xué)習(xí)效率設(shè)計(jì)的新型算法。CISPO放棄了信任區(qū)域約束,轉(zhuǎn)而對重要性采樣權(quán)重進(jìn)行裁剪,確保所有token都能參與梯度計(jì)算,避免了傳統(tǒng)PPO/GRPO中因裁剪token更新導(dǎo)致的關(guān)鍵推理節(jié)點(diǎn)丟失問題。

例如,在基于Qwen2.5-32B模型的對照實(shí)驗(yàn)中,CISPO相比DAPO實(shí)現(xiàn)了2倍的速度提升,且在相同訓(xùn)練步數(shù)下性能優(yōu)于GRPO和DAPO,有效穩(wěn)定了訓(xùn)練過程并加速了模型收斂。

在訓(xùn)練框架上,MiniMax-M1結(jié)合混合注意力與CISPO算法,實(shí)現(xiàn)了高效的強(qiáng)化學(xué)習(xí)擴(kuò)展。模型在512塊H800 GPU上僅用三周完成全RL訓(xùn)練,租賃成本約53.47萬美元。

訓(xùn)練數(shù)據(jù)涵蓋從傳統(tǒng)數(shù)學(xué)推理到基于沙盒的現(xiàn)實(shí)軟件工程環(huán)境等多元任務(wù),其中可驗(yàn)證問題通過規(guī)則驗(yàn)證,非可驗(yàn)證問題則借助生成式獎(jiǎng)勵(lì)模型提供反饋。此外,模型還通過持續(xù)預(yù)訓(xùn)練和監(jiān)督微調(diào)強(qiáng)化基礎(chǔ)推理能力,注入鏈狀思維模式,為后續(xù)RL階段奠定基礎(chǔ)。

在處理長上下文訓(xùn)練時(shí),MiniMax-M1采用分階段平滑擴(kuò)展上下文長度的策略,從32K逐步擴(kuò)展至100萬token,解決了混合Lightning架構(gòu)下訓(xùn)練長度激進(jìn)擴(kuò)展導(dǎo)致的梯度爆炸問題。同時(shí),針對訓(xùn)練與推理內(nèi)核的精度不匹配問題,通過將LM輸出頭精度提升至FP32,使訓(xùn)練與推理概率的相關(guān)性從0.9左右提升至0.99以上,確保了獎(jiǎng)勵(lì)增長的穩(wěn)定性。

圖片

針對優(yōu)化器超參數(shù)敏感性,調(diào)整AdamW的β?、β?和ε值,適應(yīng)模型訓(xùn)練中梯度幅度跨度大、相鄰迭代梯度相關(guān)性弱的特點(diǎn),避免了訓(xùn)練不收斂的問題。

模型還引入基于token概率的重復(fù)檢測早期截?cái)鄼C(jī)制,當(dāng)連續(xù)3000個(gè)token的概率均高于0.99時(shí)終止生成,防止長序列生成中的重復(fù)循環(huán)導(dǎo)致模型不穩(wěn)定,提升了生成吞吐量。這些創(chuàng)新模塊的協(xié)同作用,使MiniMax-M1在復(fù)雜軟件工程、工具利用和長上下文任務(wù)中表現(xiàn)突出,成為下一代語言模型代理處理現(xiàn)實(shí)挑戰(zhàn)的堅(jiān)實(shí)基礎(chǔ)。

責(zé)任編輯:張燕妮 來源: AIGC開放社區(qū)
相關(guān)推薦

2024-06-28 08:04:43

語言模型應(yīng)用

2024-12-09 00:00:10

2023-05-05 13:11:16

2025-10-16 09:00:00

大模型

2024-12-17 14:39:16

2022-03-25 11:29:04

視覺算法美團(tuán)

2018-08-26 22:25:36

自注意力機(jī)制神經(jīng)網(wǎng)絡(luò)算法

2024-04-03 14:31:08

大型語言模型PytorchGQA

2025-02-25 10:21:15

2024-09-19 10:07:41

2021-03-23 14:44:54

RDP攻擊漏洞

2022-01-29 08:26:45

數(shù)據(jù)泄露數(shù)據(jù)安全

2025-08-04 09:31:49

2025-08-11 06:17:54

2025-02-25 09:40:00

模型數(shù)據(jù)AI

2024-04-17 12:55:05

谷歌模型注意力

2025-10-22 08:52:23

2024-12-05 16:19:14

2022-07-21 14:55:24

算力

2025-09-29 18:51:01

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

在线观看免费视频黄| 中文字幕在线亚洲精品| 精品成人av一区二区在线播放| 国产精品对白| 在线观看日韩毛片| 91视频成人免费| 亚洲av成人无码久久精品老人| 一区二区三区国产盗摄| 中文字幕精品视频| 中文字幕 欧美 日韩| 伊人网在线播放| 亚洲天天做日日做天天谢日日欢| 国产日本一区二区三区| 中文天堂在线视频| 午夜欧美精品| 一本色道久久88综合日韩精品| 99久久99精品| 黄色美女视频在线观看| 2017欧美狠狠色| 成人黄色av网站| 日本特黄特色aaa大片免费| 精品国产一区一区二区三亚瑟| 粉嫩老牛aⅴ一区二区三区| 一区二区三区在线视频111| 性高潮久久久久久久久久| 久久av中文字幕片| 欧美一级免费视频| 国产十六处破外女视频| 精品午夜久久| 亚洲精品久久7777777| www.com污| 日本不卡一二三| 亚洲午夜激情av| 少妇熟女一区二区| 成人亚洲综合天堂| 久久麻豆一区二区| 国产午夜精品在线| aaa一区二区| 久久精品噜噜噜成人av农村| 日本精品一区二区三区在线播放视频 | 午夜在线a亚洲v天堂网2018| 久久成人人人人精品欧| 国产一区二区三区精品在线| 伊人春色之综合网| 亚洲а∨天堂久久精品9966| 交换做爰国语对白| 亚洲成人高清| 欧美中文字幕一区| 日韩毛片在线免费看| 多野结衣av一区| 亚洲第一在线综合网站| 男人c女人视频| 高h视频在线观看| 国产精品白丝在线| 中文字幕一区二区三区在线乱码| 99re在线视频| 国产精品视频你懂的| 日本中文不卡| 888av在线| 国产农村妇女毛片精品久久麻豆 | 欧美性一区二区三区| 欧美成人精品欧美一级乱黄| 妖精视频成人观看www| 久久久久久久久久久久久久久久久久av| 内射一区二区三区| 一区二区在线影院| 久久91超碰青草是什么| 久草视频免费播放| 亚洲国产高清一区| 91成人免费观看网站| 久热这里只有精品6| 妖精视频成人观看www| 欧洲成人在线观看| 欧美brazzers| 毛片av中文字幕一区二区| 成人国产精品色哟哟| 99热这里是精品| 丁香桃色午夜亚洲一区二区三区| 国产精品国产亚洲精品看不卡15| 蜜桃久久一区二区三区| 99视频精品在线| 欧美成人dvd在线视频| 国际av在线| 国产精品精品国产色婷婷| 裸体大乳女做爰69| 爱情岛论坛亚洲品质自拍视频网站 | 欧美videos中文字幕| 人妻换人妻a片爽麻豆| 一区二区三区四区在线看| 正在播放亚洲1区| 夫妻性生活毛片| 影音先锋久久久| 国产精品18久久久久久首页狼 | 日本中文在线一区| 国产日韩欧美自拍| 六月丁香色婷婷| 久久久av毛片精品| 男人的天堂视频在线| 是的av在线| 91麻豆精品国产| 久久丫精品国产亚洲av不卡| 日韩一区欧美| 国语自产精品视频在线看一大j8| 日本久久综合网| 国内精品久久久久影院薰衣草 | 亚洲私人黄色宅男| 少妇av一区二区三区无码| 国精品产品一区| 精品99久久久久久| 手机免费观看av| 尤物在线精品| 国产日韩欧美影视| 网站黄在线观看| 亚洲视频在线一区| 国产精品第12页| 91久久精品无嫩草影院| 在线不卡国产精品| 成人毛片18女人毛片| 国产精品中文字幕一区二区三区| 欧美中文娱乐网| 1区2区3区在线| 欧美精品乱码久久久久久| 少妇精品一区二区三区| 综合天堂久久久久久久| 国产精品jvid在线观看蜜臀 | 国产成人在线视频免费播放| 日韩久久久久久久| 小早川怜子影音先锋在线观看| 337p亚洲精品色噜噜噜| 黄免费在线观看| av成人毛片| 动漫精品视频| av软件在线观看| 欧美日韩不卡一区二区| 久久久久久久久久久久| 亚洲激情一区| 俄罗斯精品一区二区| 岛国成人毛片| 在线不卡免费欧美| 国产精品情侣呻吟对白视频| 欧美一级网站| 久久99九九| 91超碰国产在线| 欧美www视频| 看片网站在线观看| 国产麻豆日韩欧美久久| 中文字幕日韩一区二区三区| 精品肉辣文txt下载| 亚洲欧美综合另类中字| 中文字幕在线观看视频网站| av动漫一区二区| 国产资源在线视频| 国产美女撒尿一区二区| 久久久亚洲影院| 好男人www在线视频| 亚洲综合久久av| 精品国产aⅴ一区二区三区东京热| 亚洲香蕉av| 91中文字幕一区| 亚洲综合影视| 欧美va亚洲va香蕉在线| 亚洲国产精一区二区三区性色| 国产成人三级在线观看| 成人短视频在线观看免费| 亚洲2区在线| 欧美激情一区二区久久久| 国产小视频免费观看| 精品国产91久久久| 免费黄色在线视频| 免费成人在线影院| 三年中文高清在线观看第6集 | 亚洲欧美日韩国产| 欧美 日韩 国产在线| 大胆人体一区| 最近中文字幕日韩精品| 国产精品视频a| 亚洲一区二区三区小说| 麻豆av免费看| 免费一区视频| 一区二区三区视频在线播放| 秋霞影院一区| 欧美在线xxx| 95在线视频| 日韩一区二区三区在线| 一区二区三区视频免费看| 久久美女艺术照精彩视频福利播放| 性刺激的欧美三级视频| 欧美成人有码| 欧美在线视频二区| 日韩一区二区三区精品| 全亚洲最色的网站在线观看| 中国日本在线视频中文字幕| 欧美精品一区二区三区蜜桃| 精品人妻一区二区三区潮喷在线| 中文字幕中文在线不卡住| 国产a级黄色片| 日韩不卡一区二区| 国产xxxx振车| 成人激情电影在线| 国产精品露出视频| 久久久加勒比| 韩日精品中文字幕| 色开心亚洲综合| 亚洲精品美女久久| 国产精品无码免费播放| 黑人与娇小精品av专区| 国产精品国产精品88| 91麻豆免费在线观看| 三级黄色片播放| 日韩在线a电影| 国产日韩亚洲欧美在线| 成人av动漫在线观看| 国产精品一区免费观看| 色成人综合网| 日本中文字幕久久看| 国产丝袜视频在线播放| www.精品av.com| 搞黄视频免费在线观看| 亚洲第一页中文字幕| 91一区二区视频| 色综合久久66| 日韩免费视频一区二区视频在线观看| 亚洲精选视频免费看| 波多野结衣一二三四区| 2020日本不卡一区二区视频| 亚洲一级Av无码毛片久久精品| 久久9热精品视频| 久久九九国产视频| 亚洲精品护士| 日本香蕉视频在线观看| 欧美国产专区| 国产又粗又硬又长| 视频在线不卡免费观看| 日韩欧美亚洲日产国| 色哟哟精品丝袜一区二区| 国产伦理一区二区三区| 视频精品一区| 亚洲自拍偷拍第一页| 在线视频成人| 国产伊人精品在线| 成人国产激情| 国产精品男人的天堂| 三级成人黄色影院| 日韩美女视频中文字幕| 2022成人影院| 国产99久久精品一区二区| 中文字幕人成乱码在线观看| 午夜精品久久久久久99热软件| 污片在线免费观看| 欧美高清视频在线播放| 婷婷丁香在线| 欧美劲爆第一页| 白白色在线观看| 2019中文字幕在线免费观看| 在线人成日本视频| 国产99在线|中文| 成人美女黄网站| 国产精品白丝jk喷水视频一区| 日韩不卡免费高清视频| 国产精品夫妻激情| 香蕉久久一区| 99国产盗摄| 成人三级av在线| 美女一区视频| 激情五月综合| 男人天堂成人网| 欧美日韩一区二区三区四区在线观看 | 成人综合专区| 宅男噜噜99国产精品观看免费| 亚欧美无遮挡hd高清在线视频| 日韩中文在线字幕| 亚洲电影在线| 啊啊啊国产视频| 国产精品自在在线| 少妇精品一区二区| 亚洲国产精品精华液2区45| 国产第一页浮力| 亚洲国产成人91porn| www.久久精品视频| 欧美精品免费视频| 少妇一级淫片免费看| 国产亚洲视频中文字幕视频| 国产丝袜在线| 97在线视频免费看| 国产成人精选| 国产伦精品一区二区三区免费视频| 久久99国内| 日本一道在线观看| 午夜在线观看免费一区| 性生生活大片免费看视频| 国产成人在线免费观看| 亚洲人成人无码网www国产 | 69堂免费精品视频在线播放| 成人福利网站在线观看| 鲁大师精品99久久久| 亚洲精品中字| 在线一区免费观看| 久久精品亚洲天堂| 久久这里只有精品首页| 国产天堂av在线| 色婷婷精品大视频在线蜜桃视频| 国产女同91疯狂高潮互磨| 亚洲精品一区av在线播放| 美女网站视频久久| 成人xxxxx色| 美女主播精品视频一二三四| 亚洲第一导航| 亚洲夜间福利| 奇米视频888| 91视频你懂的| 国内偷拍精品视频| 日本韩国视频一区二区| 国 产 黄 色 大 片| 日韩中文字幕免费视频| 综合另类专区| www久久99| 欧美色女视频| 成人免费毛片网| 粉嫩av一区二区三区粉嫩| 国产在视频线精品视频| 欧美视频在线观看免费| 成人精品在线播放| 久久av中文字幕| 成人精品国产| 日韩av一级大片| 一级成人国产| 黑人玩弄人妻一区二区三区| 亚洲欧洲www| 中文字幕网址在线| 亚洲欧洲高清在线| 欧美xxxhd| 国产有色视频色综合| 欧美精品97| 深夜福利网站在线观看| 国产精品美女久久久久久久久| 中文字幕第四页| 日韩国产在线看| 国产伦子伦对白在线播放观看| 99久久无色码| 欧美午夜久久| 先锋资源在线视频| 亚洲人吸女人奶水| 一级全黄裸体免费视频| 日韩视频永久免费观看| 国产成人精品一区二区三区在线| 日韩免费av一区二区三区| 日本欧美一区二区三区乱码 | 色8久久久久| 亚洲精品日韩精品| 久久超碰97中文字幕| 羞羞在线观看视频| 4438x成人网最大色成网站| 黄网站app在线观看| 91精品啪aⅴ在线观看国产| 国产精品成人a在线观看| 国产xxxxhd| 亚洲综合丝袜美腿| 姝姝窝人体www聚色窝| 国产91ⅴ在线精品免费观看| 妖精一区二区三区精品视频| 国产aaa一级片| 中文无字幕一区二区三区| 中文字字幕在线中文乱码| 久久久成人精品| 1769国产精品视频| 日本日本19xxxⅹhd乱影响| 久久奇米777| 中文字幕在线网站| 精品中文字幕在线2019| 极品尤物一区| 欧美污视频网站| 亚洲国产电影在线观看| 一级淫片免费看| 欧美黄色三级网站| 色综合久久中文| 亚洲欧美自偷自拍另类| 亚洲激情第一区| 手机看片1024国产| 国产精品久久久| 欧美精品一卡| 亚洲永久无码7777kkk| 欧美综合亚洲图片综合区| 超碰人人在线| 含羞草久久爱69一区| 免费观看日韩电影| 九九热最新地址| 日韩av在线一区| 欧美在线se| 成品人视频ww入口| 欧美极品美女视频| 草草视频在线播放| 日本不卡视频在线播放| 亚洲一区色图| 中文字幕一区二区三区人妻不卡| 欧美日韩不卡在线| 小h片在线观看| 青青草综合视频| 久久久久久久综合| www.国产视频| 国产精品成人v|