精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS! 原創

發布于 2025-6-17 15:09
瀏覽
0收藏

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

大模型的內卷遠遠沒有結束了。今天凌晨,MiniMax 扔出了一記重磅炸彈——MiniMax-M1。

先來看看,M1 有多猛?

  • 上下文長度 100 萬 tokens(這里指的輸入,達到全球最高水平),秒殺 DeepSeek R1 的 8 倍;
  • 激活參數 45.9 億/次,精度不打折;
  • 計算效率較 DeepSeek 提升 4 倍,生成 10 萬token只用后者 1/4 的算力;
  • 思維預算最高 80K,真正的「長考型」AI;
  • 全面超越 Qwen3-235B、DeepSeek-R1,尤其擅長復雜編程、工具使用與長文本理解。

如果數字看著頭疼,可以看下省流版:

一、長推理能力:實現具有實際生產力的代碼任務,并具備競賽級的數學解題能力。

二、強工具調用能力:穩定處理包含長鏈路思考與工具調用的復雜任務,是Agent時代的優秀基座模型。

三、百萬token長上文支持:提供卓越的海量信息檢索與分析能力,在超長多輪對話中保持強大記憶力。

“省省流”版本,面向三個場景:生產級別環境、Agent工具調用、超長上下文的復雜任務。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

多項指標屠榜,超越 DeepSeek R1

MiniMax-M1,這次除了兩個版本,即,輸出 token 方面分別對應 40K 和 80K 的“思維預算(thinking budget)”。

在 Minimax 在 Gihub 上放出的技術報告中顯示——

標準評估基準方面,MiniMax-M1 顯著優于當前主流開源大模型,如 DeepSeek-R1 和 Qwen3-235B,特別是在復雜軟件工程、工具使用、長上下文處理等任務中表現突出。

下圖是核心的基準表現,比如擴展思維能力、數學、編程、推理與知識、軟件工程、長上下文、工具調用智能體、事實問答、通用助手任務等。(下表為 80K 與 40K 版本對比,其他模型包括 Qwen3、DeepSeek、Claude、Gemini、OpenAI 等):

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

為了便于大家查看,這里特別制作了一組核心對比。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

從上圖可以看到,MiniMax-M1 尤其在長文本理解、軟件工程與多工具使用方面有明顯領先。

如何做到的?技術亮點一覽

省流版:

1.Hybrid-MoE 架構 + Lightning Attention:少激活,大聰明,既節省算力又保證推理力。

2.大規模 RL 訓練 + 自研 CISPO 強化學習算法:不是靠刷網頁堆語料,而是真刀真槍去練“腦力”。

MiniMax-Text-01 擁有 4560 億參數,每個 token 激活參數為 45.9 億。延續其設計理念,M1 模型原生支持長達 100 萬個 token 的上下文長度,是 DeepSeek R1 的 8 倍。

此外,得益于 lightning attention 機制,M1 在推理時大幅降低計算開銷——例如在生成長度為 10 萬 token 的任務中,M1 所需的計算量僅為 DeepSeek R1 的 25%。

這使得 M1 特別適用于需要處理超長輸入、進行深度思考的復雜任務。

那么,為什么 M1 用更少的參數量 456B就做到了超越 DeepSeek R1 的水平?究竟怎么訓練的呢? 

官方介紹到,M1 通過大規模強化學習(RL)訓練,覆蓋從傳統數學推理到基于沙盒環境的真實世界軟件工程等多種任務。為此,Minimax 團隊開發了一套高效的 RL 擴展框架,亮點包括:

  1. CISPO 算法:提出了一種新穎的策略——不裁剪 token 更新,而是裁剪重要性采樣權重,在多種 RL 變體中表現更優;
  2. 混合注意力設計:天然增強 RL 訓練效率,并解決了混合架構在擴展過程中的一系列獨特挑戰。

此外,MiniMax-M1 開放了:

  • HuggingFace 權重下載(40K / 80K 兩種版本)
  • vLLM 快速部署指南(企業用,真香)
  • Transformers 接入文檔
  • Function Calling(函數調用)支持
  • 支持聯網搜索的 Chatbot / API。
  • 甚至還提供通過 MCP 使用以下能力:視頻生成、圖像生成、語音合成、聲音克隆。

Agent 能力實測:推理比DS-R1更快!

登錄 MiniMax 的對話界面,你就會發現相當囂張的問候語:

Ask anything!No question too long,no query too complex.(盡管來問!沒有問題太長,也沒有提問太復雜。)

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

關于 M1 的實測案例,MiniMax 在官方媒體賬號上有放出不少。這里小編更關心的 Agent 場景下的表現。

正如前文所提到的,在 TAU-bench 方面, M1-80k 取得了 62 分的結果,幾乎是 Qwen-32B 得分的兩倍,同時也超越了 Deepseek R1 的 53.5 分。

一位 X 網友對于 M1 在零售場景的表現大為驚嘆:

“在 TAU-bench 零售場景中,僅用 1M 上下文窗口 + 40K 思維預算,就超越了 Gemini 2.5 Pro —— 真是驚艷!”

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

小編這里科普一下,這里 TAU-bench retail 測試,其實是一個企業 Agent 的能力測試,它讓大模型完成一個“企業智能助理”或“客戶服務智能代理”在零售場景下的真實任務,比如:

  • 分析庫存和銷售數據
  • 查找和調用特定工具(比如退貨系統、訂單查詢、商品比價 API)
  • 理解復雜政策和規則文檔(如退換貨、會員積分、商品上下架)
  • 制定合理的下一步行動(比如建議補貨、替代商品、發優惠券)

既然都說到這里了,小編忍不住想實際動手測一測。Agent 能力測試題如下:

復制

你是一名智能客服代理,負責處理零售用戶的退貨請求。你可以使用以下工具來完成任務:

【你可以使用的工具】
1. 查詢訂單狀態:`get_order_info(order_id)` → 返回下單時間、狀態、商品信息、用戶ID
2. 查詢用戶積分:`get_user_points(user_id)` → 返回當前積分余額
3. 申請退款:`create_refund(order_id, amount)` → 向用戶發起退款流程
4. 發放積分:`grant_points(user_id, amount)` → 給用戶發放積分

【退貨政策文檔】
- 所有商品支持15天無理由退貨。
- 超過15天需用戶提供合理理由并經人工審核。
- 特殊情況可發放最高不超過20元等值積分補償。
- 咖啡機類產品需保留原包裝和配件,狀態良好。

【任務目標】
請處理用戶的退貨請求,合理使用工具,做出符合政策的判斷,并以自然、溫和的語氣生成一段客服回復。

【用戶輸入】
Hi,我想退掉我上個月買的咖啡機(訂單號:#8492035),但是系統說退貨時間已過。我剛生完孩子,沒時間處理。請你幫我看能不能特殊處理一下,或者給點補償?

請按以下格式輸出:
1. 使用了哪些工具?輸入與輸出是什么?
2. 你的判斷邏輯是什么?
3. 最終給用戶的客服回復是什么?

問 M1、Gemini2.5 Pro、DeepSeek R1 這三款同樣的問題。來看下 表現。

先說結果:三款模型的回答可以說都挺準確。但差距在于:

一、思考過程和速度上。

DeepSeek 明顯是思考過程最長最多的,光思考就占了一分半鐘。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

M1 思考過程相當 37.8s,與 Gemini 2.5 Pro 時長相當(后者只能自己計時,從思考的token長度上看是相當的。) 

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

二,輸出答案質量上。三者都答對了。

但是,不得不承認,Gemini 生成的結果更為讓讀者賞心悅目一些,只能說領先模型對于生成結果的細致包裝程度還是值得學習的。

M1 答案如下:

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

下面是Gemini 2.5 Pro預覽版的輸出效果——

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

然后是 DeepSeek-R1 的答案,給出答案中的判斷邏輯和 Gemini 2.5 Pro比較類似。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

可以說Agent調用能力方面,Minimax M1 的優勢在于思索很快,答案精簡一些。Gemini 2.5 Pro 和 DeepSeek R1 可以說不相上下,但后者輸入速度更慢一些。

怎么看呢?真要是用在生產環境中,在答案都對的情況下:誰最省 token 誰是最合適的解~

還有歪果仁驚嘆 M1 的 LiveCode 能力的。小編沒有測試哈,如果各位測好了可以評論區反饋一下。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

不過小編,倒是測了一個“抓娃娃”的小游戲。雖然豐富性上差一些,可玩性上倒是超過了 Gemini 2.5 Pro。

M1 的效果如下:簡單到只有個娃娃,但說抓就抓到。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

而 Gemini 2.5 生成畫面更為精致,生成的畫面也更為逼真,但是小編發現,真的是一次都沒抓到過娃娃。難道是 Gemini 更懂得“抓娃娃”的商業邏輯~

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

最后,還有一個 one more thing,這一周 MiniMax 也打算來個開源周。看網友們呼聲最高的還是:音視頻模型的開源。靜待深夜的炸彈吧!

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本文轉載自??51CTO技術棧??,作者:云昭

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
1條回復
按時間正序
/
按時間倒序
wx68426ac5b5c8a
wx68426ac5b5c8a

回復
2025-6-17 17:44:40
回復
相關推薦
激情综合网五月| 丁香花在线高清完整版视频| 青娱乐精品在线视频| 国产亚洲精品一区二555| 粗暴91大变态调教| 一区二区三区视频在线观看视频| 日韩中文字幕区一区有砖一区 | 风间由美一区| 国产成人精品一区二区三区四区 | 国产黄色片视频| 亚洲老女人视频免费| 欧美日本在线一区| 国产夫妻自拍一区| 国产一二三区在线| 成人午夜激情片| 国产精品欧美一区二区| 麻豆国产尤物av尤物在线观看 | 国产另类ts人妖一区二区| 久久久久国产精品免费| 三区四区在线观看| 精品国产一区二区三区不卡蜜臂| 欧美视频在线播放| 3d动漫一区二区三区| 毛片在线看片| 国产拍揄自揄精品视频麻豆| 亚洲影院污污.| 无码无套少妇毛多18pxxxx| 中文字幕一区二区av| 亚洲人成网站免费播放| 一级全黄裸体片| 国产精品美女午夜爽爽| 欧美日韩亚洲视频| 日本a在线天堂| 日本黄色片在线观看| 久久综合五月天婷婷伊人| 97久久精品午夜一区二区| www.五月婷婷.com| 亚洲欧美高清| 国内成人精品一区| 麻豆亚洲av熟女国产一区二| 四虎国产精品免费观看 | 香蕉视频国产在线观看| 久久久久久久综合色一本| 国偷自产av一区二区三区小尤奈| 国产精品天天操| 麻豆国产一区二区| 国产精品久久久久aaaa九色| 中文字幕精品无码一区二区| 日韩午夜av| 国产最新精品视频| 国产主播在线观看| 国内在线观看一区二区三区| 欧美精品一区二区免费| 四虎永久免费在线| 香蕉综合视频| 欧美成年人在线观看| 免费看特级毛片| 99久久亚洲精品| 日韩在线视频播放| 亚洲二区在线播放| 亚洲精品成人| 欧美另类69精品久久久久9999| 国精产品一区一区| 国产精品福利在线观看播放| 日韩在线观看av| 欧美老熟妇一区二区三区| 亚洲成人日韩| 欧美极度另类性三渗透| 久久无码精品丰满人妻| 国精品一区二区| 久久久久久久一| 国产又黄又粗又爽| 天堂资源在线中文精品| 国产精品久久久久久久久粉嫩av| 中文av免费观看| 狠狠色狠狠色综合| 97超碰人人看人人| 亚洲三级黄色片| 欧美激情一区三区| 在线观看成人免费| eeuss鲁一区二区三区| 岛国av一区二区三区| 日本成人黄色网| 成人乱码手机视频| 精品福利av导航| xxxxx在线观看| 亚洲国产精品久久久天堂| 欧美激情极品视频| 亚洲 欧美 成人| 久久成人av少妇免费| 成人在线免费观看一区| 欧美偷拍视频| 国产精品不卡视频| 2018中文字幕第一页| 成人开心激情| 精品久久人人做人人爰| 国产交换配乱淫视频免费| 欧美人妖在线| 九九视频这里只有精品| 天天爽夜夜爽夜夜爽精品| 免费在线播放第一区高清av| 成人在线视频网| 污视频在线免费观看| 国产精品国产三级国产普通话三级| 日本大胆人体视频| 日韩高清在线| 亚洲国产日韩欧美在线99| 黄色国产在线播放| 亚洲日本黄色| 91网在线免费观看| 欧美色综合一区二区三区| 亚洲免费观看高清完整版在线观看 | 亚洲国产精品第一页| 欧美日韩亚洲在线观看| 午夜精品福利视频| 亚洲视频一区二区三区四区| av在线一区二区| 国产人妻人伦精品| 久久久久毛片| 亚洲精品一二区| 久久精品性爱视频| 国产精品一二三区| 亚洲精品在线观看免费| www.日韩| 日韩成人在线播放| 精品爆乳一区二区三区无码av| 日本午夜一区二区| 欧美国产二区| 狠狠操一区二区三区| 日韩一区二区三区电影 | 午夜视频www| 一区二区三区小说| 国产无色aaa| 成人综合专区| 国产精品福利网站| 欧美美女色图| 色综合久久综合网欧美综合网| 亚洲精品乱码久久久久久蜜桃欧美| 婷婷精品进入| 国产一区香蕉久久| 国产九九在线| 在线观看欧美黄色| 国产成人av一区二区三区不卡| 亚洲三级观看| 国产99午夜精品一区二区三区 | 污视频网站观看| 精品理论电影在线| 国产成人综合久久| 国内在线免费高清视频| 日本黄色一区二区| 一级黄色录像毛片| 日本大胆欧美人术艺术动态| 日韩成人在线资源| 久久女人天堂| 色妞色视频一区二区三区四区| 这里只有精品免费视频| 欧美国产在线观看| 手机av在线免费| 正在播放日韩欧美一页| 亚洲自拍偷拍区| 性欧美videoshd高清| 欧美mv日韩mv国产网站app| 免费在线观看黄视频| 成人做爰69片免费看网站| 免费超爽大片黄| 任我爽精品视频在线播放| 欧美综合一区第一页| 国产在线电影| 欧美精品少妇一区二区三区| 亚洲色婷婷一区二区三区| 国产成人欧美日韩在线电影| 日韩黄色短视频| 偷拍亚洲精品| 国产欧美精品在线播放| 黄色精品免费看| 精品国产三级a在线观看| 国产成人免费观看视频| 久久精品人人做| 黄色一级片免费的| 亚洲网址在线| 日韩福利二区| 国产精品美女久久久久| 高清一区二区三区四区五区| 国产福利在线观看| 欧美一区二区三区四区在线观看| 中文字幕一区二区三区手机版| 91丝袜国产在线播放| 爱情岛论坛亚洲首页入口章节| 亚洲天天综合| 美媛馆国产精品一区二区| 亚洲www啪成人一区二区| 九九久久综合网站| 日本高清中文字幕二区在线| 欧美久久婷婷综合色| 免费观看一级视频| 欧美高清在线精品一区| 亚洲成人福利视频| 日韩电影在线一区二区三区| 男人的天堂视频在线| 国产99久久| 97视频中文字幕| gogo亚洲高清大胆美女人体| 欧美成人免费播放| 国产无套粉嫩白浆在线2022年| 日韩欧美一区二区免费| 国产又粗又猛又黄视频| 艳妇臀荡乳欲伦亚洲一区| 亚洲av无码一区二区三区人 | 大片免费在线看视频| 日韩国产高清视频在线| 国产三级在线观看视频| 一本大道久久a久久精二百| 青青草精品在线视频| 国产三级三级三级精品8ⅰ区| 制服.丝袜.亚洲.中文.综合懂| 丝袜美腿亚洲一区| 日韩精品在线观看av| 图片区亚洲欧美小说区| 欧美国产视频在线观看| 国内精品偷拍| 91av免费看| 欧美高清你懂的| 国产精品99导航| 色资源二区在线视频| 欧美理论片在线观看| 免费**毛片在线| 在线不卡国产精品| 三级国产在线观看| 亚洲第一精品久久忘忧草社区| 国产乱叫456在线| 欧美日韩一区二区三区视频| 中文字幕黄色片| 精品欧美aⅴ在线网站| 国产一级视频在线观看| 亚洲欧美一区二区三区国产精品 | 熟妇人妻中文av无码| 欧美一区二区三区免费大片| 在线观看中文字幕av| 在线中文字幕不卡| 欧美啪啪小视频| 婷婷久久综合九色综合伊人色| 欧美日韩精品在线观看视频 | 国产成人a级片| 一区二区久久精品| 久久成人18免费观看| 午夜国产福利在线观看| 久久99热这里只有精品| 精品999在线| 青草av.久久免费一区| 男人女人黄一级| 丝袜美腿高跟呻吟高潮一区| 国产亚洲天堂网| 乱人伦精品视频在线观看| 黄色动漫网站入口| 久久国产精品99国产| 日韩有码免费视频| 人妖欧美一区二区| 国产精品久久久毛片| 久久精品国产色蜜蜜麻豆| 午夜精品久久久久久久99热影院| 精品一区二区三区香蕉蜜桃| 中文字幕一区久久| 国产美女视频一区| 任你躁av一区二区三区| 成人av网站免费| 久久精品老司机| 国产欧美日产一区| 午夜国产小视频| 一区二区三区四区视频精品免费 | 老**午夜毛片一区二区三区| 国产精品网站免费| 视频一区中文字幕| 婷婷激情综合五月天| 成人黄色大片在线观看 | 亚洲精品欧美激情| 欧美一级高潮片| 色婷婷综合激情| 97在线视频人妻无码| 精品免费国产一区二区三区四区| 婷婷开心激情网| 一区二区欧美久久| 成年视频在线观看| 91精品国产免费久久久久久| 天然素人一区二区视频| 亚洲最大av在线| 亚欧日韩另类中文欧美| 一本色道久久综合亚洲精品婷婷| 欧美99久久| a在线视频观看| 久久99久久99小草精品免视看| 少妇极品熟妇人妻无码| 久久久久久久综合狠狠综合| 中文字幕亚洲欧美日韩| 欧美视频中文在线看| 国产精品呻吟久久| 精品夜色国产国偷在线| 欧美精品日韩少妇| 国内精品国产三级国产在线专| 国产一区二区三区四区五区3d| 丁香五月网久久综合| 欧美精品系列| 国产精品久久国产| 日本女优在线视频一区二区| 中文字幕视频观看| 国产精品国产成人国产三级| 国产区在线观看视频| 制服视频三区第一页精品| 欧美日韩在线中文字幕| 欧美国产中文字幕| 久久99久久久精品欧美 | 日韩欧美自拍| av之家在线观看| 国产成人精品一区二区三区四区| 亚洲精品国产91| 亚洲成人777| 国产又粗又长视频| 亚洲视频第一页| 精品极品在线| av一区和二区| 水蜜桃精品av一区二区| 国产自偷自偷免费一区| 99在线精品免费| 免费人成在线观看| 在线不卡的av| 97在线观看免费观看高清| 欧美亚洲第一页| 久久夜色精品国产噜噜av小说| 免费观看中文字幕| 麻豆91小视频| 亚洲一级黄色录像| 色老汉一区二区三区| 深夜视频在线免费| 国内免费久久久久久久久久久| 日韩精品视频在线看| 色中文字幕在线观看| 美腿丝袜一区二区三区| 免费一级做a爰片久久毛片潮| 天天做天天摸天天爽国产一区| 亚洲第一色视频| 欧美日本精品在线| 秋霞影院一区| 穿情趣内衣被c到高潮视频| 久久成人精品无人区| 男人在线观看视频| 欧美日韩成人综合| 在线激情小视频| 国产一区二区色| 99国产**精品****| 国产福利精品一区二区三区| 国产精品久久午夜| 亚洲香蕉在线视频| 精品国产一区二区三区在线观看| 日韩一区二区三免费高清在线观看| 亚洲欧洲久久| 激情国产一区二区| 国产一区二区播放| 欧美成人高清电影在线| 国产桃色电影在线播放| 国内一区在线| 老牛嫩草一区二区三区日本| 天堂网av2018| 91精品国产综合久久香蕉麻豆| 午夜影院免费在线| 国产精品一区二区免费看| 一本久久综合| 69视频在线观看免费| 欧美日韩精品欧美日韩精品| 黄色网页在线看| 99在线视频免费观看| 国产精品久久久久9999高清| 乐播av一区二区三区| 欧美日韩aaaaa| 精品一性一色一乱农村| 精品在线观看一区二区| 久久综合网络一区二区| 国产麻豆a毛片| 精品国产三级a在线观看| 日韩福利一区| 国产盗摄视频在线观看| 91一区二区三区在线观看| 波多野结衣影片| 美日韩精品免费观看视频| 超碰在线成人| 欧美牲交a欧美牲交aⅴ免费真| 国产精品福利影院| 成人午夜免费福利| 日本高清视频一区| 91精品在线观看国产| 9.1成人看片| 欧美日韩国产精品自在自线| 超黄网站在线观看| 任我爽在线视频精品一| 国产精选一区二区三区| 国产专区第一页| 久久九九精品99国产精品| 久久夜色电影| 男插女视频网站| 日本乱人伦一区| 不卡的av影片| 亚洲亚洲精品三区日韩精品在线视频 |