國(guó)產(chǎn)模型新王登基！剛剛，Kimi K2 Thinking發(fā)布，多項(xiàng)能力超越GPT-5 原創(chuàng)

發(fā)布于 2025-11-7 17:08

瀏覽

0收藏

一場(chǎng)開源與閉源的較量再次迎來(lái)轉(zhuǎn)折點(diǎn)。

在AI模型快速迭代的競(jìng)技場(chǎng)上，開源與閉源之間你追我趕，但兩者之間的差距一度被認(rèn)為是難以逾越的鴻溝。然而，最新發(fā)布的Kimi K2 Thinking再次打破了鴻溝。

今天凌晨，月之暗面正式發(fā)布并開源了Kimi K2 Thinking模型，發(fā)布不到24小時(shí)，它已經(jīng)被譽(yù)為“迄今能力最強(qiáng)的開源思考模型”，在多項(xiàng)關(guān)鍵基準(zhǔn)測(cè)試中超越了GPT-5和Claude Sonnet 4.5等頂尖閉源模型。

國(guó)產(chǎn)模型新王登基！剛剛，Kimi K2 Thinking發(fā)布，多項(xiàng)能力超越GPT-5-AI.x社區(qū)
?
更有網(wǎng)友再次放出了那張“經(jīng)典梗圖”：
?

?

全面超越的技術(shù)表現(xiàn)

在被稱為“人類最后考試”的HLE基準(zhǔn)測(cè)試中，Kimi K2 Thinking在使用工具的條件下取得了44.9%的高分，創(chuàng)造了新的SOTA紀(jì)錄。

國(guó)產(chǎn)模型新王登基！剛剛，Kimi K2 Thinking發(fā)布，多項(xiàng)能力超越GPT-5-AI.x社區(qū)
?

在另一項(xiàng)衡量網(wǎng)絡(luò)搜索和推理能力的BrowseComp測(cè)試中，它的表現(xiàn)更為突出，達(dá)到了60.2%的得分，遠(yuǎn)超人類平均29.2%的水平，同時(shí)也超過(guò)了GPT-5的54.9%和Claude 4.5的24.1%。
?

在編程能力方面，Kimi K2 Thinking在SWE-bench Verified和LiveCodeBench v6兩個(gè)編碼評(píng)估中分別獲得71.3%和83.1%的分?jǐn)?shù)，展現(xiàn)出與頂尖閉源模型相抗衡的實(shí)力。

?
國(guó)產(chǎn)模型新王登基！剛剛，Kimi K2 Thinking發(fā)布，多項(xiàng)能力超越GPT-5-AI.x社區(qū)

這意味著，開源模型不僅在追趕閉源模型，更在復(fù)雜的推理和工具使用任務(wù)中實(shí)現(xiàn)了反超。

架構(gòu)創(chuàng)新的核心驅(qū)動(dòng)力

Kimi K2 Thinking的技術(shù)突破源于其創(chuàng)新的模型架構(gòu)。作為一個(gè)混合專家模型，它擁有1萬(wàn)億的總參數(shù)，每次推理激活320億參數(shù)。

模型采用INT4量化而非行業(yè)常見的FP8，這使得生成速度提升了約2倍，同時(shí)增強(qiáng)了對(duì)國(guó)產(chǎn)加速計(jì)算芯片的兼容性。

同時(shí)，該模型擁有256K的上下文窗口，結(jié)合“測(cè)試時(shí)擴(kuò)展”技術(shù)，通過(guò)同時(shí)擴(kuò)展思考Token和工具調(diào)用輪次，實(shí)現(xiàn)了更強(qiáng)的Agent和推理性能。
?

這種架構(gòu)設(shè)計(jì)使得模型能夠執(zhí)行200-300次連續(xù)工具調(diào)用而無(wú)需人工干預(yù)，展現(xiàn)出真正的自主推理能力。

開源戰(zhàn)略的加速度

Kimi K2 Thinking采用最為寬松的MIT協(xié)議，允許免費(fèi)商業(yè)使用，僅在大規(guī)模部署時(shí)要求顯示“Kimi K2”標(biāo)識(shí)。

在定價(jià)策略上，其定價(jià)為緩存命中時(shí)0.15美元/百萬(wàn)Token，緩存未命中時(shí)0.6美元/百萬(wàn)Token，輸出為2.5美元/百萬(wàn)Token。

國(guó)產(chǎn)模型新王登基！剛剛，Kimi K2 Thinking發(fā)布，多項(xiàng)能力超越GPT-5-AI.x社區(qū)

這一價(jià)格不僅遠(yuǎn)低于GPT-5的1.25美元輸入和10美元輸出定價(jià)，也低于MiniMax-M2的0.3美元輸入和1.2美元輸出定價(jià)。

低成本高性能的組合，使得像Kimi K2 Thinking這樣的頂尖開源模型能夠普惠全球開發(fā)者，為全球大模型創(chuàng)新生態(tài)帶來(lái)巨大紅利。
?

從技術(shù)追趕到實(shí)現(xiàn)反超，開源模型正以前所未有的速度縮短與閉源模型的差距。

Kimi K2 Thinking的成功不是孤例，它反映的是中國(guó)AI產(chǎn)業(yè)開源戰(zhàn)略的集體加速度。在Hugging Face的大模型開源趨勢(shì)榜單上，前10名全都是中國(guó)的開源模型。

李開復(fù)在近期的一次演講中指出，世界大模型競(jìng)賽中只有中美兩國(guó)，而競(jìng)爭(zhēng)關(guān)鍵正是“開源與閉源的路線之爭(zhēng)”。

Kimi K2 Thinking的突破不僅是一個(gè)產(chǎn)品的成功，更是開源發(fā)展路徑的有力驗(yàn)證。

隨著開源模型的不斷成熟和算力成本的下降，AI技術(shù)將更加深入地融入到各個(gè)行業(yè)。

當(dāng)AI技術(shù)真正實(shí)現(xiàn)普惠，當(dāng)每一個(gè)企業(yè)都能以合理成本獲得頂尖的AI能力，我們將會(huì)見證一場(chǎng)前所未有的產(chǎn)業(yè)變革。

大家怎么看？歡迎交流討論~

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2025-11-7 17:08:34修改

贊

回復(fù)

舉報(bào)

社區(qū)頭條

回復(fù)

相關(guān)推薦

Sam Altman：GPT-5，將會(huì)比現(xiàn)在的大模型更智能

Aceryt ? 3749瀏覽 ? 0回復(fù)
OpenAI展示草莓，很快發(fā)布“GPT-5”獵戶座！

Aceryt ? 3038瀏覽 ? 0回復(fù)
Qwen2-VL全面解讀！阿里開源多模態(tài)視覺語(yǔ)言模型，多項(xiàng)超越GPT4o與Claude 3.5-Sonnet

angel ? 1.6w瀏覽 ? 0回復(fù)
Kimi發(fā)布k1視覺思考模型，實(shí)力顛覆K12教育賽道，涌現(xiàn)能力強(qiáng)得可怕，免費(fèi)可用！網(wǎng)友：國(guó)產(chǎn)之光！

51CTO技術(shù)棧 ? 5636瀏覽 ? 0回復(fù)
Kimi發(fā)布最新模型k1.5，技術(shù)報(bào)告也干貨滿滿

NLP工作站 ? 5515瀏覽 ? 0回復(fù)
OpenAI深夜更新GPT-5路線圖，奧特曼高密度爆料全模型免費(fèi)計(jì)劃。GPT-5真的要來(lái)了嗎？我懷疑

51CTO技術(shù)棧 ? 3436瀏覽 ? 0回復(fù)
Gemini 2.5 Pro：AI新王登基，炸裂來(lái)襲！

墨風(fēng)如雪小站 ? 2949瀏覽 ? 0回復(fù)
Kimi K2發(fā)布：1萬(wàn)億參數(shù)，128K上下文，還能跑17個(gè)工具流程？

Halo咯咯 ? 9279瀏覽 ? 0回復(fù)
Kimi K2：開源智能體模型的巔峰之作

51CTO內(nèi)容精選 ? 2824瀏覽 ? 0回復(fù)
八大LLM架構(gòu)大比較總結(jié)：從DeepSeek-V3->qwen3->Kimi K2看LLM架構(gòu)設(shè)計(jì)

大模型自然語(yǔ)言處理 ? 6924瀏覽 ? 0回復(fù)
在 Claude Code + Kimi K2：一個(gè)新的 AI 編碼組合

AI取經(jīng)路 ? 4225瀏覽 ? 0回復(fù)
8種LLM架構(gòu)設(shè)計(jì)大比拼：從 DeepSeek-V3 到 Kimi K2，究竟有啥不同

CourseAI ? 4513瀏覽 ? 0回復(fù)
Kimi K2 智能體模型正式亮相！

PyTorch研習(xí)社 ? 7113瀏覽 ? 0回復(fù)
從 DeepSeek R1 到 Kimi K2 八種大模型架構(gòu)設(shè)計(jì)剖析

玄姐聊AGI ? 5341瀏覽 ? 0回復(fù)
Kimi K2深度解析：萬(wàn)億參數(shù)大模型的開源標(biāo)桿？

Halo咯咯 ? 6693瀏覽 ? 0回復(fù)
GPT-5今夜亮相？OpenAI神秘直播預(yù)告，暗示新模型將至

算家計(jì)算 ? 2395瀏覽 ? 0回復(fù)
GPT-5 發(fā)布：長(zhǎng)文本、多模態(tài)與代碼生成的新紀(jì)元

mb686ba423d8aa5 ? 3784瀏覽 ? 0回復(fù)
小模型，大推理：MBZUAI 開源 K2 Think，32B 模型超越超大體量對(duì)手

Halo咯咯 ? 3465瀏覽 ? 0回復(fù)
Unsloth的Kimi K2 Thinking 本地運(yùn)行實(shí)戰(zhàn)

sbf_2000 ? 1226瀏覽 ? 0回復(fù)

算家計(jì)算

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

51CTO

51CTO博客

51CTO學(xué)堂

國(guó)產(chǎn)模型新王登基！剛剛，Kimi K2 Thinking發(fā)布，多項(xiàng)能力超越GPT-5 原創(chuàng)

全面超越的技術(shù)表現(xiàn)

架構(gòu)創(chuàng)新的核心驅(qū)動(dòng)力

開源戰(zhàn)略的加速度

目錄