精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!生產環境下更劃算!但還不夠美觀

原創 精選
人工智能
標準評估基準方面,MiniMax-M1 顯著優于當前主流開源大模型,如 DeepSeek-R1 和 Qwen3-235B,特別是在復雜軟件工程、工具使用、長上下文處理等任務中表現突出。

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

大模型的內卷遠遠沒有結束了。今天凌晨,MiniMax 扔出了一記重磅炸彈——MiniMax-M1。

先來看看,M1 有多猛?

  • 上下文長度 100 萬 tokens(這里指的輸入,達到全球最高水平),秒殺 DeepSeek R1 的 8 倍;
  • 激活參數 45.9 億/次,精度不打折;
  • 計算效率較 DeepSeek 提升 4 倍,生成 10 萬token只用后者 1/4 的算力;
  • 思維預算最高 80K,真正的「長考型」AI;
  • 全面超越 Qwen3-235B、DeepSeek-R1,尤其擅長復雜編程、工具使用與長文本理解。

如果數字看著頭疼,可以看下省流版:

一、長推理能力:實現具有實際生產力的代碼任務,并具備競賽級的數學解題能力。

二、強工具調用能力:穩定處理包含長鏈路思考與工具調用的復雜任務,是Agent時代的優秀基座模型。

三、百萬token長上文支持:提供卓越的海量信息檢索與分析能力,在超長多輪對話中保持強大記憶力。

“省省流”版本,面向三個場景:生產級別環境、Agent工具調用、超長上下文的復雜任務。

多項指標屠榜,超越 DeepSeek R1

MiniMax-M1,這次除了兩個版本,即,輸出 token 方面分別對應 40K 和 80K 的“思維預算(thinking budget)”。

在 Minimax 在 Gihub 上放出的技術報告中顯示——

標準評估基準方面,MiniMax-M1 顯著優于當前主流開源大模型,如 DeepSeek-R1 和 Qwen3-235B,特別是在復雜軟件工程、工具使用、長上下文處理等任務中表現突出。

下圖是核心的基準表現,比如擴展思維能力、數學、編程、推理與知識、軟件工程、長上下文、工具調用智能體、事實問答、通用助手任務等。(下表為 80K 與 40K 版本對比,其他模型包括 Qwen3、DeepSeek、Claude、Gemini、OpenAI 等):

圖片圖片

為了便于大家查看,這里特別制作了一組核心對比。

圖片圖片

從上圖可以看到,MiniMax-M1 尤其在長文本理解、軟件工程與多工具使用方面有明顯領先。

如何做到的?技術亮點一覽

省流版:

1.Hybrid-MoE 架構 + Lightning Attention:少激活,大聰明,既節省算力又保證推理力。

2.大規模 RL 訓練 + 自研 CISPO 強化學習算法:不是靠刷網頁堆語料,而是真刀真槍去練“腦力”。

MiniMax-Text-01 擁有 4560 億參數,每個 token 激活參數為 45.9 億。延續其設計理念,M1 模型原生支持長達 100 萬個 token 的上下文長度,是 DeepSeek R1 的 8 倍。

此外,得益于 lightning attention 機制,M1 在推理時大幅降低計算開銷——例如在生成長度為 10 萬 token 的任務中,M1 所需的計算量僅為 DeepSeek R1 的 25%。

這使得 M1 特別適用于需要處理超長輸入、進行深度思考的復雜任務。

那么,為什么 M1 用更少的參數量 456B就做到了超越 DeepSeek R1 的水平?究竟怎么訓練的呢? 

官方介紹到,M1 通過大規模強化學習(RL)訓練,覆蓋從傳統數學推理到基于沙盒環境的真實世界軟件工程等多種任務。為此,Minimax 團隊開發了一套高效的 RL 擴展框架,亮點包括:

  1. CISPO 算法:提出了一種新穎的策略——不裁剪 token 更新,而是裁剪重要性采樣權重,在多種 RL 變體中表現更優;
  2. 混合注意力設計:天然增強 RL 訓練效率,并解決了混合架構在擴展過程中的一系列獨特挑戰。

此外,MiniMax-M1 開放了:

  • HuggingFace 權重下載(40K / 80K 兩種版本)
  • vLLM 快速部署指南(企業用,真香)
  • Transformers 接入文檔
  • Function Calling(函數調用)支持
  • 支持聯網搜索的 Chatbot / API。
  • 甚至還提供通過 MCP 使用以下能力:視頻生成、圖像生成、語音合成、聲音克隆。

Agent 能力實測:推理比DS-R1更快!

登錄 MiniMax 的對話界面,你就會發現相當囂張的問候語:

Ask anything!No question too long,no query too complex.(盡管來問!沒有問題太長,也沒有提問太復雜。)

圖片圖片

圖片關于 M1 的實測案例,MiniMax 在官方媒體賬號上有放出不少。這里小編更關心的 Agent 場景下的表現。

正如前文所提到的,在 TAU-bench 方面, M1-80k 取得了 62 分的結果,幾乎是 Qwen-32B 得分的兩倍,同時也超越了 Deepseek R1 的 53.5 分。

一位 X 網友對于 M1 在零售場景的表現大為驚嘆:

“在 TAU-bench 零售場景中,僅用 1M 上下文窗口 + 40K 思維預算,就超越了 Gemini 2.5 Pro —— 真是驚艷!”

圖片圖片

小編這里科普一下,這里 TAU-bench retail 測試,其實是一個企業 Agent 的能力測試,它讓大模型完成一個“企業智能助理”或“客戶服務智能代理”在零售場景下的真實任務,比如:

  • 分析庫存和銷售數據
  • 查找和調用特定工具(比如退貨系統、訂單查詢、商品比價 API)
  • 理解復雜政策和規則文檔(如退換貨、會員積分、商品上下架)
  • 制定合理的下一步行動(比如建議補貨、替代商品、發優惠券)

既然都說到這里了,小編忍不住想實際動手測一測。Agent 能力測試題如下:

你是一名智能客服代理,負責處理零售用戶的退貨請求。你可以使用以下工具來完成任務:

【你可以使用的工具】
1. 查詢訂單狀態:`get_order_info(order_id)` → 返回下單時間、狀態、商品信息、用戶ID
2. 查詢用戶積分:`get_user_points(user_id)` → 返回當前積分余額
3. 申請退款:`create_refund(order_id, amount)` → 向用戶發起退款流程
4. 發放積分:`grant_points(user_id, amount)` → 給用戶發放積分

【退貨政策文檔】
- 所有商品支持15天無理由退貨。
- 超過15天需用戶提供合理理由并經人工審核。
- 特殊情況可發放最高不超過20元等值積分補償。
- 咖啡機類產品需保留原包裝和配件,狀態良好。

【任務目標】
請處理用戶的退貨請求,合理使用工具,做出符合政策的判斷,并以自然、溫和的語氣生成一段客服回復。

【用戶輸入】
Hi,我想退掉我上個月買的咖啡機(訂單號:#8492035),但是系統說退貨時間已過。我剛生完孩子,沒時間處理。請你幫我看能不能特殊處理一下,或者給點補償?

請按以下格式輸出:
1. 使用了哪些工具?輸入與輸出是什么?
2. 你的判斷邏輯是什么?
3. 最終給用戶的客服回復是什么?

問 M1、Gemini2.5 Pro、DeepSeek R1 這三款同樣的問題。來看下 表現。

先說結果:三款模型的回答可以說都挺準確。但差距在于:

一、思考過程和速度上。

DeepSeek 明顯是思考過程最長最多的,光思考就占了一分半鐘。

圖片圖片

M1 思考過程相當 37.8s,與 Gemini 2.5 Pro 時長相當(后者只能自己計時,從思考的token長度上看是相當的。) 

圖片圖片

二,輸出答案質量上。三者都答對了。

但是,不得不承認,Gemini 生成的結果更為讓讀者賞心悅目一些,只能說領先模型對于生成結果的細致包裝程度還是值得學習的。

M1 答案如下:

圖片圖片

圖片下面是Gemini 2.5 Pro預覽版的輸出效果——

圖片圖片

圖片然后是 DeepSeek-R1 的答案,給出答案中的判斷邏輯和 Gemini 2.5 Pro比較類似。

圖片圖片

圖片圖片

可以說Agent調用能力方面,Minimax M1 的優勢在于思索很快,答案精簡一些。Gemini 2.5 Pro 和 DeepSeek R1 可以說不相上下,但后者輸入速度更慢一些。

怎么看呢?真要是用在生產環境中,在答案都對的情況下:誰最省 token 誰是最合適的解~

還有歪果仁驚嘆 M1 的 LiveCode 能力的。小編沒有測試哈,如果各位測好了可以評論區反饋一下。

圖片圖片

不過小編,倒是測了一個“抓娃娃”的小游戲。雖然豐富性上差一些,可玩性上倒是超過了 Gemini 2.5 Pro。

M1 的效果如下:簡單到只有個娃娃,但說抓就抓到。

圖片圖片

而 Gemini 2.5 生成畫面更為精致,生成的畫面也更為逼真,但是小編發現,真的是一次都沒抓到過娃娃。難道是 Gemini 更懂得“抓娃娃”的商業邏輯~

圖片圖片

最后,還有一個 one more thing,這一周 MiniMax 也打算來個開源周。看網友們呼聲最高的還是:音視頻模型的開源。靜待深夜的炸彈吧!

圖片圖片

圖片圖片

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2022-03-20 19:03:00

M1 Ultra蘋果芯片

2024-12-16 16:05:34

2022-12-06 07:34:36

語音助手自動語音音箱

2012-04-17 11:48:32

清華紫光掃描儀

2021-09-10 08:31:36

技術Prometheus監控

2011-12-15 09:07:21

javaeclipse

2023-02-07 19:46:35

NIOCQ內核

2011-07-09 15:21:48

筆記本評測

2021-04-06 11:36:47

Starlink網速互聯網

2020-11-26 06:08:39

MacBook

2021-03-13 06:56:56

M1版SSDMacBook

2023-11-16 15:10:39

RustJavaZig

2016-06-06 11:14:21

DockerDelphix

2022-04-06 10:23:41

Linux系統蘋果

2009-08-05 16:19:19

2025-09-22 04:00:00

2020-06-04 17:13:12

JavaScript語言Web

2025-06-20 18:45:01

2025-06-18 16:42:38

2009-09-07 16:17:32

2M寬帶費
點贊
收藏

51CTO技術棧公眾號

成人短视频app| 天天色棕合合合合合合合| 国产精品麻豆久久| 3d成人动漫网站| 麻豆一区二区三区在线观看| 亚洲av无码国产精品永久一区| 激情综合自拍| 亚洲欧洲xxxx| 色噜噜狠狠一区二区三区狼国成人| av毛片在线| 91免费看视频| 国产欧美在线看| 久久人人爽人人爽人人| 精品国产91久久久久久浪潮蜜月| 欧美精品第一页| 日韩五码在线观看| 三区四区在线视频| av电影在线观看不卡| 成人黄色免费片| 日韩手机在线观看| 久久久综合色| 日韩精品欧美激情| 国产裸体视频网站| 亚洲日本在线观看视频| 亚洲成人777| 一区二区三区四区欧美日韩| 黄色一级a毛片| 久久国产精品无码网站| 97不卡在线视频| 国产成人免费在线观看视频| 久久aimee| 欧美电影在线免费观看| 一本久道综合色婷婷五月| 丁香影院在线| 成人欧美一区二区三区| 日韩电影天堂视频一区二区| 噜噜噜久久,亚洲精品国产品| 麻豆成人免费电影| 国产精品video| 日产精品久久久久久久| 亚洲区综合中文字幕日日| 国产亚洲美女精品久久久| 少妇一级淫片免费放播放| 成人亚洲精品| 欧美日韩精品三区| 国产情侣av自拍| 日本不良网站在线观看| 亚洲自拍偷拍欧美| 国产一二三四区在线观看| av大片在线观看| 久久久久国产成人精品亚洲午夜| 国产精品免费一区二区三区四区| 国产人妖一区二区| 精品中文字幕一区二区小辣椒| 日韩免费av一区二区| 九九热在线视频播放| 亚洲性色视频| 久久久久久久电影一区| 欧美人与禽zozzo禽性配| 亚洲成av人片一区二区密柚| 精品国偷自产在线| 国产一区二区精彩视频| 中文一区一区三区免费在线观看| 久久久精品免费| 久久r这里只有精品| 综合久久精品| 欧美激情xxxx性bbbb| 黄色一级视频免费| 影音先锋国产精品| 国语自产精品视频在免费| 精品无码一区二区三区电影桃花| 午夜日韩电影| 欧美激情乱人伦| 日本一级淫片免费放| 亚洲激情专区| 日本高清久久天堂| 中文字幕免费高清网站| 日韩成人免费在线| 成人免费网站在线| 亚洲精品久久久久久动漫器材一区 | 国产精品va在线播放我和闺蜜| 97人妻精品视频一区| 国内精品写真在线观看| av蓝导航精品导航| 污视频在线免费| 国产色综合一区| 艳色歌舞团一区二区三区| 中文字幕有码在线视频| 亚洲国产乱码最新视频| 久久久久久久久久久久久国产精品| 亚洲成人av观看| 日韩一区二区免费视频| 天天躁日日躁狠狠躁免费麻豆| 婷婷亚洲精品| 在线看欧美日韩| 欧美日韩精品在线观看视频 | 亚洲av中文无码乱人伦在线视色| 日本欧美在线看| 亚洲一区二区三区成人在线视频精品| 亚洲国产精品欧美久久 | 欧美日韩日日骚| 永久看看免费大片| 免费一区二区| 色综合五月天导航| 91在线视频免费播放| 韩国av一区二区| 国产一区在线免费| 日本美女在线中文版| 亚洲va中文字幕| 欧美黄色性生活| 国产福利一区二区精品秒拍| 中文字幕成人在线| 日本少妇性生活| 久久精品国产秦先生| 精品国产一区二区三区麻豆小说| 拍真实国产伦偷精品| 精品久久香蕉国产线看观看亚洲| 岛国毛片在线播放| 婷婷综合电影| 欧美风情在线观看| 亚洲一区 中文字幕| 91亚洲永久精品| 99热这里只有精品7| 日韩电影大全网站| 亚洲电影中文字幕| 日韩欧美国产成人精品免费| 久久美女性网| 黄色91av| 久草在线视频网站| 777亚洲妇女| 男人舔女人下部高潮全视频 | av一二三不卡影片| 午夜久久久久久久久久久| 欧美大片高清| 亚洲加勒比久久88色综合| 538精品在线观看| 久久精品国内一区二区三区| 欧美国产二区| 国产高清自产拍av在线| 日韩女优视频免费观看| 中文字幕求饶的少妇| 欧美一级一区| 国产精品乱码视频| 国产啊啊啊视频在线观看| 欧美一区二区三区在线观看视频| 欧美aaa级片| 三级亚洲高清视频| 欧美日韩综合久久| 国产精品一区二区av影院萌芽| 亚洲黄色成人网| 精品无码久久久久久久| 国产成人综合在线观看| 麻豆视频传媒入口| 天堂av一区| 欧美激情视频在线免费观看 欧美视频免费一 | 亚洲国产精品av| 欧美日韩在线免费播放| 国产日韩视频在线| 国产精品成人va在线观看| 久久伊伊香蕉| 欧美色爱综合网| 国产在线免费看| 国产一区二区看久久| 日本女人高潮视频| 视频精品国内| 国产做受69高潮| 午夜性色福利影院| 日本乱人伦一区| 精品一区二区6| 国产一区在线视频| 欧洲精品在线播放| 色老板在线视频一区二区| 欧美伊久线香蕉线新在线| 嫩草精品影院| 欧美色区777第一页| 国产97免费视频| 国产成人精品aa毛片| 色综合久久久久无码专区| 国产日产精品一区二区三区四区的观看方式 | 亚洲日穴在线视频| 亚洲少妇一区二区| 中文日韩在线| 新呦u视频一区二区| 国产日韩中文在线中文字幕| 国内精品一区二区三区四区| 暖暖视频在线免费观看| 欧美日韩黄视频| 久久久久久免费观看| 久久日韩精品一区二区五区| jizz大全欧美jizzcom| 黄页网站一区| 涩涩涩999| 亚洲视频一起| 国产精品成人va在线观看| 最爽无遮挡行房视频在线| 亚洲精品99999| 一级黄色a毛片| 亚洲一区二区三区四区不卡| 成人片黄网站色大片免费毛片| 免费美女久久99| 日本wwwcom| 第一sis亚洲原创| 国产精品国产精品国产专区蜜臀ah | 中文在线中文资源| 久久久www成人免费精品| 天天摸天天碰天天爽天天弄| 欧美浪妇xxxx高跟鞋交| 日本道在线观看| 亚洲欧美电影一区二区| 亚洲第一成人网站| 国产综合成人久久大片91| 日韩av资源在线| 欧美不卡在线| 相泽南亚洲一区二区在线播放| 91精品短视频| 国产精品自拍视频| 另类专区亚洲| 97人人爽人人喊人人模波多 | 韩国欧美亚洲国产| 九义人在线观看完整免费版电视剧| 日韩电影在线观看永久视频免费网站 | 欧美久久一级| 亚洲一区二区高清视频| 亚洲警察之高压线| 国产精品毛片va一区二区三区| 国产精品伊人| 国产成人精品在线| 黄色aa久久| 欧美极品少妇全裸体| 毛片在线播放a| 一本色道久久综合狠狠躁篇怎么玩| 六月婷婷中文字幕| 日韩免费看网站| 国产精品久久久久久久成人午夜| 色久优优欧美色久优优| a v视频在线观看| 亚洲午夜电影网| 欧美三级日本三级| 成人免费一区二区三区在线观看| 先锋影音av在线| 久久精品日韩一区二区三区| 黄色国产在线观看| 99久久免费国产| 亚洲av永久无码精品| 大美女一区二区三区| 丰满少妇一区二区三区专区| 久久97超碰色| 中文字幕资源在线观看| 麻豆成人久久精品二区三区红| 精品久久久久久中文字幕2017| 久久先锋资源| 青青在线免费观看视频| 日韩黄色免费网站| 欧美自拍小视频| 美国毛片一区二区三区| 久久久久久蜜桃一区二区| 蜜臀99久久精品久久久久久软件| www.精品在线| 久久99精品久久久久久动态图| 天堂在线中文在线| 国产精品性做久久久久久| 无码人妻丰满熟妇区毛片蜜桃精品 | 日韩亚洲精品视频| 黄色在线免费看| 久久91超碰青草是什么| а_天堂中文在线| 97欧美精品一区二区三区| 自拍视频在线看| 国产精品激情自拍| 亚州精品国产| 91丝袜美腿美女视频网站| 日本高清精品| 久久综合伊人77777麻豆| 欧美日韩久久精品| 中文字幕乱码免费| 亚洲精品美女91| 无码少妇一区二区三区芒果| 久久99在线观看| 国内精品国产三级国产aⅴ久| 成人h版在线观看| 亚洲区免费视频| 日韩一区有码在线| 日韩欧美一区二区一幕| 欧美亚洲一区二区三区四区| 99久久久国产精品无码网爆 | 欧美精品a∨在线观看不卡 | 国产精品久久观看| 久久国产午夜精品理论片最新版本| 性色一区二区三区| 爽爽爽在线观看| 99re免费视频精品全部| 国产黄色录像视频| 亚洲香肠在线观看| 欧美一级黄视频| 日韩欧美高清dvd碟片| 色av男人的天堂免费在线| 播播国产欧美激情| 日本在线播放一二三区| 91久久国产婷婷一区二区| 色综合久久中文| 国产免费一区二区三区四在线播放| 1024日韩| 天天干天天色天天干| 久久久久国产精品人| 国产一级理论片| 欧美日韩日日夜夜| 日本黄在线观看| 久久久久久中文| 欧美亚洲福利| 欧美成人免费在线| 欧美日韩第一区| a在线观看免费视频| 97se亚洲国产综合自在线观| 在线观看黄网址| 一本久久a久久精品亚洲| 亚洲av无码乱码在线观看性色| 一级做a爰片久久毛片美女图片| 99久久精品免费看国产小宝寻花| 国产主播喷水一区二区| 妖精视频一区二区三区| 亚洲精品无码国产| 国产一二精品视频| 日韩免费av一区| 欧美在线免费观看亚洲| 水中色av综合| 久久久久久久久久久成人| 国产精品亚洲一区二区在线观看| 日本一区美女| 香蕉av777xxx色综合一区| 亚洲成a人片在线www| 亚洲免费观看高清完整版在线观看熊| 中文字幕日日夜夜| 亚洲欧洲自拍偷拍| 性欧美18xxxhd| 激情欧美一区二区三区中文字幕| 国产精品vip| 欧美色图校园春色| 亚洲图片欧美激情| 国产又大又黄的视频| 正在播放欧美一区| 国产精品亚洲d| 日韩av一级大片| 丝袜美腿成人在线| 一区二区三区四区免费| 欧美色视频日本版| 欧美日韩影视| 国产999在线观看| 欧美日韩在线观看视频小说| 亚洲精品高清无码视频| 国产欧美日韩中文久久| 超碰在线免费97| 日韩中文字幕网| 99国内精品久久久久| 久久久成人精品一区二区三区 | www.色呦呦| 欧美大片在线看免费观看| 亚洲伊人影院| 一二三四视频社区在线| 99精品欧美一区二区三区小说 | 思思久久精品视频| 亚洲私人影院在线观看| 国产欧美日韩综合精品一区二区三区| 久久人体大胆视频| 欧洲大片精品免费永久看nba| 国产在线xxxx| 91丝袜高跟美女视频| 中文字幕国产在线观看| 在线视频欧美日韩精品| 色999韩欧美国产综合俺来也| 男女h黄动漫啪啪无遮挡软件| 国产成人午夜电影网| 在线观看 中文字幕| 亚洲深夜福利在线| 青青国产精品| 丰满的少妇愉情hd高清果冻传媒| av在线综合网| 国产午夜无码视频在线观看| 精品国内产的精品视频在线观看| 无人区乱码一区二区三区| 精品久久一二三| 中文字幕av一区二区三区高| 99久久久久成人国产免费| 97视频人免费观看| 欧洲福利电影| 日本黄色www| 色噜噜偷拍精品综合在线| 午夜在线免费观看视频| 成人在线看片| 日韩精品一二三| 丁香花五月激情| 精品亚洲国产成av人片传媒| 日韩亚洲国产免费| 日韩国产一级片| 欧美激情一区二区三区蜜桃视频 | 美女诱惑一区二区| 国产在线视频二区| 夜夜躁日日躁狠狠久久88av| 亚洲精品福利| 乌克兰美女av| 亚洲大片一区二区三区|