精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Kimi K2官方技術報告出爐:采用384個專家,訓練不靠刷題靠“用自己的話再講一遍”

人工智能 新聞
沒錯,就是整整32頁的Kimi K2官方技術報告。業內人士第一波repo已火速出爐

Kimi K2稱霸全球開源模型的秘籍公開了!

沒錯,就是整整32頁的Kimi K2官方技術報告。業內人士第一波repo已火速出爐:

這篇論文中有很多令人印象深刻的內容。

圖片

nice!它分享了很多關于Kimi(以及中國實驗室)對這些模型的看法(他們關注/優化的內容)。

圖片

Kimi K2,作為Kimi最新MoE基礎模型,總參數1T,激活參數32B,能力領先性尤其展現在代碼、Agent、數學推理任務上。

上線僅一周,它就在競技場千人盲評中擊敗DeepSeek,登頂全球最強開源模型,而且能媲美Grok 4、GPT 4.5等頂尖閉源模型。

那它是咋做到的呢?

別急,這篇最新論文來給答案了——一次性大公開Kimi K2的訓練過程及“秘密配方”

包括但不限于大家已經熱議的:MuonClip優化器、大規模Agentic Tool Use數據合成、通用強化學習等等。

圖片

下面詳細來看。

都有哪些技術亮點

首先,Kimi團隊認為,現如今大語言模型正從靜態模仿學習向Agentic Intelligence轉型。

這意味著,模型需要具備在復雜動態環境中自主感知、規劃、推理和行動的能力。

要實現這一點,當前人們面臨兩大挑戰:

  • 預訓練需在高質量數據有限的約束下,通過提升每token效率構建通用先驗(universal prior)。
  • 后訓練需將先驗轉化為可行動行為,但Agentic能力在自然數據中稀缺且難以規模化。

對此,團隊在Kimi K2中采用了三大核心創新技術

1、MuonClip優化器:拋棄傳統的Adam優化器,創新性地使用了Muon優化器。結合Muon的token效率與QK-Clip的穩定性,支持15.5萬億token無損失spike預訓練。

2、大規模Agentic Tool Use數據合成:構建可大規模生成多輪工具使用場景的合成pipeline,覆蓋數百領域、數千工具。

3、通用強化學習框架:結合可驗證獎勵(RLVR)和自我批判評估獎勵,將對齊從靜態擴展到開放域。

得益于以上技術,Kimi K2在SWE Bench Verified、Tau2、AceBench等基準性能測試中,均取得開源模型中的SOTA成績。

圖片

以下為技術細節部分:

預訓練階段

在Kimi K2預訓練階段,團隊主要對優化器和數據進行了優化。

整體而言,其預訓練采用了MoE架構+穩定優化器+高效token利用這一全新組合拳,以此構建通用語言和推理能力。

模型架構上,一共包含384個專家,每層激活其中8個,通過這種高度稀疏的設計在保證性能的同時優化計算效率。

在注意力機制上,K2使用MLA(Multi-head Latent Attention)結構代替傳統的密集注意力(dense attention),有效減少了計算量和帶寬壓力。

而且將每層的注意力頭數量降至64個,與同類模型相比進一步降低了推理過程中的資源消耗,使模型能更好地處理長上下文。

圖片

優化器選擇上,K2采用了MuonClip優化器,其核心是在Muon優化器基礎上融合了QK-Clip機制。

這一機制會定期檢查模型注意力的關鍵參數(query和key),如果它們的值太大,就自動“收緊”,防止計算過程出現異常,從而顯著提升了訓練穩定性。

團隊最終也發現,借助MuonClip可讓K2在15.5萬億token的預訓練過程中實現零損失spike,確保了大規模訓練的連續性和有效性。

數據方面,其核心目標為,在高質量數據有限時,通過提升每token的有效學習信號(token效用)來增強訓練效率,避免重復訓練導致的過擬合。

而為了讓模型“吃透”有限的優質訓練數據,K2團隊采取了一種所謂的“重述法”

  • 對知識類文本:不是簡單重復讀,而是換著說法再講一遍。
  • 對數學類文本:把枯燥的教材式內容改寫成更易理解的“學習筆記”風格,還加入了多語言版本的翻譯文本,讓模型見多識廣。

一言以蔽之,K2的訓練數據覆蓋網頁、代碼、數學、知識四大板塊,所有數據都經過嚴格的質量篩選,確保模型學到的都是有用的信息。

而且它不是靠“多刷題”訓練出來的,而是靠“換種說法講一遍”讓模型真正理解知識

用重寫10次的數據訓練1輪(28.94%),其準確率超過了用原始數據訓練10輪(23.76%)的結果 。

圖片

概括而言,K2采用了與DeepSeek-V3相似的多頭潛在注意力(MLA),具體對比如下:

圖片

后訓練階段

K2后訓練階段主要涉及監督微調和強化學習。

值得一提的就是大規模Agentic Tool Use數據合成,主要流程如下:

  • 工具生成:3000多真實MCP工具+20000多合成工具,覆蓋金融、機器人控制等領域;
  • Agentic與任務生成:為工具集生成多樣化Agentic(系統提示+工具組合)和帶評估標準的任務;
  • 軌跡生成:模擬用戶交互、工具執行環境(含狀態更新和隨機結果),生成多輪工具使用軌跡;
  • 結合真實執行沙箱(如編碼任務),確保數據真實性。

最終,Judge Agent會依據任務rubrics對軌跡質量進行判斷,只保留高質量樣本用于訓練。

這一過程本質上是一種大規模拒絕采樣(rejection sampling)機制,結合模擬規模與真實反饋,實現了大范圍、高保真的訓練數據構建。

圖片

而在強化學習階段,K2主要經歷了三大步驟:

第一,構建可驗證的獎勵環境(Verifiable Rewards Gym)。

簡單說,團隊為不同任務設計了“可打分”的訓練場景,讓模型的表現可以被客觀評估。

比如對于編碼場景,團隊利用真實世界的數據(如程序競賽題目、GitHub的PR和issue)構建任務,并通過自動化測試來驗證模型的代碼是否正確運行。

第二,除了外部評判,還訓練模型自己評估自己,即引入自我評估獎勵機制(Self-Critique Rubric Reward)。

具體而言,模型會將自己的多個輸出結果進行兩兩比較,并根據一套明確的標準(如語言清晰度、對話是否連貫、是否啰嗦或拍馬屁)給出獎勵分,同時還引入一些規則約束(如“不要無腦稱贊用戶”)來避免生成套路化或迎合性回答。

這個機制不僅增強了模型的自我反饋能力,也能將客觀任務中的評估信號遷移到主觀對話場景(如回答開放性問題等人類主觀評判場景),形成閉環優化。

第三,為了更高效、穩定地進行強化學習訓練,K2還對算法進行了多項改進。

包括但不限于下面這些:

  • 預算控制機制:限制每個樣本的最大token數,避免生成啰嗦、重復或無意義的長文本。
  • 引入PTX輔助損失:使用高質量預訓練樣本時再加一個損失項,以防模型在RL階段“遺忘”已有知識。
  • 溫度衰減策略:訓練初期用高溫度鼓勵模型大膽嘗試、廣泛探索,后期逐步降低溫度,讓模型輸出更穩定、更收斂。

最后據論文介紹,K2的訓練依托于由NVIDIA H800構成的大規模高帶寬GPU集群,通過混合并行策略,既保證了訓練效率,又能在不同規模資源下靈活適配。

每個節點配備2TB內存,并通過NVLink和NVSwitch將8塊GPU在節點內部高速互聯。不同節點之間則使用8×400 Gbps的RoCE網絡互聯,以實現節點間的高效通信。

圖片

One More Thing

就在剛剛,阿里通義Qwen3模型也更新了——

正式由Qwen3-235B-A22B更新至Qwen3-235B-A22B-2507

官方表示,他們停用了混合思維模式,改為分別訓練Instruct和Thinking模型以提升質量,并正式發布性能更強的 Qwen3-235B-A22B-Instruct-2507及其FP8版本。

而且官方測評顯示,最新版Qwen3又擊敗了Kimi K2模型,開源新王或將再次易主。

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-17 08:14:22

2025-07-16 09:29:39

2025-11-12 08:54:13

2019-07-30 14:58:52

人工智能AI

2025-07-22 11:38:38

2021-08-12 10:36:18

order byMySQL數據庫

2023-01-10 19:47:47

Redis原理多線程

2017-12-26 14:17:24

潤乾報表

2025-07-31 01:00:00

LLM架構模型

2025-11-10 16:57:11

Kimi k2ClaudeGPT

2021-06-15 07:15:15

Oracle底層explain

2022-01-17 20:59:37

開發group by思路

2025-07-29 07:46:00

2025-07-22 11:03:07

2025-02-13 09:06:27

2021-12-01 07:26:13

IO模型異步

2024-03-26 07:59:32

IO模型多路復用

2024-03-12 08:20:57

零拷貝存儲開發

2015-10-10 11:10:24

重敲代碼拷貝粘貼

2021-10-07 20:12:03

MVCC事務原理
點贊
收藏

51CTO技術棧公眾號

92精品国产成人观看免费| 精品成人在线| 日韩一卡二卡三卡| 男人添女人下部视频免费| 亚洲精品视频91| 亚洲专区免费| www亚洲欧美| 欧美xxxxx精品| av在线一区不卡| 亚洲精品成人精品456| 久久久久无码国产精品一区| 91麻豆精品在线| 欧美黄色大片网站| 亚洲男人第一网站| 色诱av手机版| jizz欧美| 精品久久中文字幕| 中文字幕av导航| 亚洲aaaaaaa| 国产乱对白刺激视频不卡| 欧美一区二区三区艳史| 国产wwwwxxxx| 国产精品密蕾丝视频下载 | 亚洲av综合色区| 外国精品视频在线观看 | 视频国产一区二区三区| 狠狠v欧美v日韩v亚洲ⅴ| 日韩美女免费观看| 日本熟妇毛茸茸丰满| 9999国产精品| 永久免费毛片在线播放不卡| 制服丝袜第一页在线观看| 国产一区二区三区四区五区3d| 欧美视频在线观看免费网址| a级黄色片免费| 男人的天堂在线视频免费观看 | 免费高清视频精品| 欧美夜福利tv在线| 国产精品99精品| 中文一区一区三区免费在线观看| 正在播放欧美视频| 91网站免费视频| 卡通动漫精品一区二区三区| 精品美女在线观看| 8x8x成人免费视频| 欧美一级免费| 欧美日韩国产影片| av污在线观看| h1515四虎成人| 欧美在线视频日韩| 激情五月亚洲色图| 欧美精品资源| 欧美性受xxxx黑人xyx性爽| 91视频最新入口| 日韩激情电影| 欧美视频一区二区三区…| 国产黄色一级网站| 悠悠资源网亚洲青| 日韩欧美在线看| 97在线免费公开视频| 在线手机中文字幕| 日韩欧美一区视频| 国产熟人av一二三区| 成人h在线观看| 欧美日韩免费不卡视频一区二区三区| www.亚洲高清| 国产aa精品| 精品国产免费人成电影在线观看四季| 中国黄色片视频| 欧美激情影院| 亚洲人成电影网站色…| 国产一区二区三区四区五区六区| 国产伦一区二区三区| 中文字幕精品网| 你懂得在线观看| 欧美一区免费| 性欧美暴力猛交69hd| 国产www在线| 美女视频一区二区| 亚洲一区二区日本| 天堂在线视频网站| 国产欧美日韩在线观看| 美女黄色片网站| www.youjizz.com在线| 欧美午夜宅男影院在线观看| 在线视频日韩一区| 曰本一区二区| 亚洲激情在线观看视频免费| 美女洗澡无遮挡| 综合久久一区| 91成人天堂久久成人| 亚洲高清视频免费观看| 国模大尺度一区二区三区| 国产精品毛片一区视频| 欧美3p视频在线观看| 中文字幕在线一区免费| 日韩中文字幕在线免费| 九九热线视频只有这里最精品| 91超碰这里只有精品国产| 在线xxxxx| 日韩一区自拍| 97成人精品区在线播放| 中文字幕人妻一区二区三区视频| 国产成人av一区二区三区在线| 日本在线观看一区| 日本在线观看大片免费视频| 日本精品视频一区二区三区| 男生操女生视频在线观看| 精品国产影院| 久久精视频免费在线久久完整在线看| 国产又大又黑又粗免费视频| 九九视频精品免费| 精品免费国产| 黄色免费在线观看网站| 一本到三区不卡视频| 日韩精品国产一区| 色婷婷色综合| 日本国产高清不卡| 亚洲av无码片一区二区三区 | a毛片不卡免费看片| 欧美日韩一区二区在线视频| 女同性恋一区二区三区| 欧美日韩一区二区高清| 国产精品亚洲视频在线观看| 亚洲av成人精品日韩在线播放| 亚洲免费看黄网站| 色多多视频在线播放| 思热99re视热频这里只精品| 欧美日本在线视频中文字字幕| 中文字幕一区二区三区人妻四季| 99re在线视频这里只有精品| 欧美日韩视频免费| 95精品视频| 色妞久久福利网| 乱子伦一区二区三区| 久久免费的精品国产v∧| 欧美人成在线观看| 国产一区二区三区免费在线| 菠萝蜜影院一区二区免费| 综合久久中文字幕| 国产亚洲一区二区三区在线观看| 97国产精东麻豆人妻电影| www.豆豆成人网.com| 欧美精品一二区| 91午夜交换视频| 国产精品久久久久久久久久免费看| 欧美a在线视频| 神马日本精品| 45www国产精品网站| 午夜影院免费视频| 欧美视频第一页| 国产精品无码一区二区三区| 免费在线欧美黄色| 欧美日韩在线精品一区二区三区| 国产伦子伦对白在线播放观看| 精品电影一区二区| 日产电影一区二区三区| 北条麻妃国产九九精品视频| 国产精品久久久久7777| 激情亚洲另类图片区小说区| 欧美一级高清免费| 看电影就来5566av视频在线播放| 一本一本久久a久久精品综合麻豆| 变态另类丨国产精品| 亚洲一区中文| 美女主播视频一区| 无人区在线高清完整免费版 一区二| 亚洲图中文字幕| 中文字幕av影视| 亚洲欧美日韩中文字幕一区二区三区 | 国产原创精品视频| 精品日韩在线观看| 国产三级av片| 亚洲国产成人午夜在线一区| 天堂av2020| 亚洲一本视频| 欧美一级爽aaaaa大片| 99riav视频一区二区| 欧美成人午夜免费视在线看片| 亚洲国产av一区二区| 精品久久久久久中文字幕大豆网| 丰满少妇高潮一区二区| 老司机免费视频一区二区| 男女爱爱视频网站| 香蕉久久夜色精品国产使用方法 | 日韩在线免费视频| www黄色网址| 色悠久久久久综合欧美99| 四虎永久免费地址| 成人av在线资源网站| 五月婷婷深爱五月| 午夜欧美视频| 日本高清久久一区二区三区| 视频亚洲一区二区| 欧美在线日韩在线| 成人ww免费完整版在线观看| 日韩国产激情在线| 一级日韩一级欧美| 欧美日韩一区二区免费视频| 久草福利资源在线| 久久这里只精品最新地址| 一本一道久久a久久综合蜜桃| 亚洲人体大胆视频| 超碰在线免费观看97| 综合伊思人在钱三区| 91久久精品国产91性色| 性欧美18xxxhd| 欧美巨大黑人极品精男| 高h视频在线| 亚洲福利视频在线| 国产又粗又猛又爽又黄的| 岛国精品视频在线播放| 极品久久久久久| 国产午夜一区二区三区| 日韩少妇一区二区| 精品一区二区三区日韩| 超碰影院在线观看| 99国产精品久久久久久久成人热| 一区二区在线观看网站| 国产免费久久| 久久国产精品免费一区| 2020国产精品极品色在线观看| 国产在线观看不卡| 日日夜夜天天综合| 97视频在线观看网址| 91一区二区三区在线| 最新的欧美黄色| 黄视频在线观看免费| 日韩国产激情在线| 无码h黄肉3d动漫在线观看| 日韩免费看网站| av官网在线观看| 精品视频免费在线| 中文字幕av久久爽| 色狠狠综合天天综合综合| 六月丁香在线视频| 午夜视频久久久久久| 九九久久免费视频| 亚洲狠狠丁香婷婷综合久久久| 中文字幕观看av| 国产精品久久久久久久久搜平片 | 性猛交xxxx乱大交孕妇印度| 欧美日韩精品福利| 波多野结衣理论片| 色婷婷综合久久久中文字幕| 国内自拍视频在线播放| 欧美色图在线视频| 永久免费无码av网站在线观看| 欧美日韩亚洲视频一区| 精品国产一区二区三区四| 欧美午夜视频一区二区| 三级网站在线播放| 欧美色倩网站大全免费| 这里只有精品9| 欧美日韩国产乱码电影| 国产精品系列视频| 日韩欧美一区二区视频| 亚洲av无码一区二区乱子伦| 精品日韩在线观看| 天天躁日日躁狠狠躁喷水| 日韩精品一区二区视频| 嫩草精品影院| 中文字幕久久亚洲| 顶级网黄在线播放| 久久久免费av| 性欧美hd调教| 国产欧美日韩高清| 亚洲成av人片在线观看www| 国产精品三区在线| 视频一区欧美| 日日噜噜噜夜夜爽爽| 欧美人成在线| 女人和拘做爰正片视频| 日本强好片久久久久久aaa| 91丨九色丨蝌蚪| 成人污视频在线观看| 熟女高潮一区二区三区| 中文在线一区二区| 久久久久久久国产视频| 欧美性猛交xxxx富婆| 亚洲综合免费视频| 欧美大片在线观看| 你懂的在线免费观看| 色婷婷久久av| 888av在线视频| 国产精品自拍小视频| 日韩精品免费视频一区二区三区 | 欧美日韩中字| 国产激情片在线观看| 男人的天堂亚洲| 一卡二卡三卡四卡五卡| 99re热这里只有精品免费视频| 男人的天堂av网| 亚洲一二三区不卡| 中文字幕一区2区3区| 精品少妇一区二区三区在线视频| 邻居大乳一区二区三区| 欧美日韩成人在线播放| 日韩在线影院| 国产精品日韩欧美一区二区三区| 成人写真视频| 青青视频在线播放| 国产精品 日产精品 欧美精品| 中文精品在线观看| 亚洲精品第1页| 夜夜嗨av禁果av粉嫩avhd| 日韩av在线免费观看一区| 免费在线午夜视频| 日韩免费观看在线观看| 一区二区三区自拍视频| 一本一生久久a久久精品综合蜜 | 性色av一区二区三区在线观看| 高清欧美日韩| 欧美日韩综合另类| 在线播放一区| 国产伦精品一区二区三区妓女下载| 久久蜜臀精品av| 日韩人妻无码一区二区三区99| 欧美一区中文字幕| 亚洲麻豆精品| 国产精品久久久91| 伊人久久大香线蕉| 青青草视频在线免费播放| 国产在线不卡视频| 婷婷丁香综合网| 欧美羞羞免费网站| 国产女主播在线写真| 欧美亚洲视频在线看网址| 国内精品国产成人国产三级粉色 | 黄色av电影在线播放| 国产mv免费观看入口亚洲| 青青草这里只有精品| 国产一线二线三线女| 国产精品亚洲а∨天堂免在线| 激情五月激情综合| 欧美挠脚心视频网站| youjizz在线播放| 日本欧美精品在线| 同性恋视频一区| 成人免费观看cn| 成人免费视频免费观看| 国产性70yerg老太| 精品动漫一区二区三区在线观看| 日本片在线看| 国产91亚洲精品一区二区三区| 欧美黄免费看| 国产精品亚洲一区二区无码| 亚洲一区二区欧美| 亚洲狼人综合网| 98精品国产自产在线观看| 另类春色校园亚洲| 欧美一区二区三区爽大粗免费| av电影在线观看一区| 日韩精品在线免费视频| 亚洲精品日韩欧美| 视频二区不卡| 亚洲国产综合自拍| 韩国v欧美v日本v亚洲v| 国产性xxxx| 亚洲成人精品av| xxxxxx欧美| 亚洲毛片aa| 国产美女av一区二区三区| 国产十六处破外女视频| 亚洲第一精品久久忘忧草社区| 97超碰在线免费| 日韩资源av在线| 国产自产v一区二区三区c| 国产亚洲精品成人| 日韩成人免费视频| 欧美va视频| 国产成人三级视频| av在线不卡网| 亚洲国产av一区二区三区| xvideos亚洲人网站| 91久久偷偷做嫩草影院电| 波多野结衣乳巨码无在线| 国产色综合一区| 国产欧美一区二区三区视频在线观看| 欧美激情精品久久久久久黑人| 亚洲自拍电影| 色婷婷一区二区三区在线观看| 亚洲一区二区视频| 精品推荐蜜桃传媒| 亚洲影院污污.| 亚洲在线观看| 污污的视频在线免费观看| 欧美精品一区二区高清在线观看| 99re66热这里只有精品4| 男人天堂网站在线| 久久亚区不卡日本| a在线观看免费| 91精品国产精品| 99精品综合| 变态另类丨国产精品| 91精品国产91久久久久久一区二区 | 国产精品麻豆欧美日韩ww| 亚洲成a人片在线| 国产精品久久久久久久久久久不卡 | av在线成人|