國(guó)產(chǎn)模型新王登基!剛剛,Kimi K2 Thinking發(fā)布,多項(xiàng)能力超越GPT-5 原創(chuàng)
一場(chǎng)開源與閉源的較量再次迎來(lái)轉(zhuǎn)折點(diǎn)。
?
在AI模型快速迭代的競(jìng)技場(chǎng)上,開源與閉源之間你追我趕,但兩者之間的差距一度被認(rèn)為是難以逾越的鴻溝。然而,最新發(fā)布的Kimi K2 Thinking再次打破了鴻溝。
?
今天凌晨,月之暗面正式發(fā)布并開源了Kimi K2 Thinking模型,發(fā)布不到24小時(shí),它已經(jīng)被譽(yù)為“迄今能力最強(qiáng)的開源思考模型”,在多項(xiàng)關(guān)鍵基準(zhǔn)測(cè)試中超越了GPT-5和Claude Sonnet 4.5等頂尖閉源模型。
?

?
更有網(wǎng)友再次放出了那張“經(jīng)典梗圖”:
?

?
全面超越的技術(shù)表現(xiàn)
?
在被稱為“人類最后考試”的HLE基準(zhǔn)測(cè)試中,Kimi K2 Thinking在使用工具的條件下取得了44.9%的高分,創(chuàng)造了新的SOTA紀(jì)錄。
?

?
在另一項(xiàng)衡量網(wǎng)絡(luò)搜索和推理能力的BrowseComp測(cè)試中,它的表現(xiàn)更為突出,達(dá)到了60.2%的得分,遠(yuǎn)超人類平均29.2%的水平,同時(shí)也超過(guò)了GPT-5的54.9%和Claude 4.5的24.1%。
?
在編程能力方面,Kimi K2 Thinking在SWE-bench Verified和LiveCodeBench v6兩個(gè)編碼評(píng)估中分別獲得71.3%和83.1%的分?jǐn)?shù),展現(xiàn)出與頂尖閉源模型相抗衡的實(shí)力。
?

?
這意味著,開源模型不僅在追趕閉源模型,更在復(fù)雜的推理和工具使用任務(wù)中實(shí)現(xiàn)了反超。
?
架構(gòu)創(chuàng)新的核心驅(qū)動(dòng)力
?
Kimi K2 Thinking的技術(shù)突破源于其創(chuàng)新的模型架構(gòu)。作為一個(gè)混合專家模型,它擁有1萬(wàn)億的總參數(shù),每次推理激活320億參數(shù)。
?
模型采用INT4量化而非行業(yè)常見的FP8,這使得生成速度提升了約2倍,同時(shí)增強(qiáng)了對(duì)國(guó)產(chǎn)加速計(jì)算芯片的兼容性。
?
同時(shí),該模型擁有256K的上下文窗口,結(jié)合“測(cè)試時(shí)擴(kuò)展”技術(shù),通過(guò)同時(shí)擴(kuò)展思考Token和工具調(diào)用輪次,實(shí)現(xiàn)了更強(qiáng)的Agent和推理性能。
?
這種架構(gòu)設(shè)計(jì)使得模型能夠執(zhí)行200-300次連續(xù)工具調(diào)用而無(wú)需人工干預(yù),展現(xiàn)出真正的自主推理能力。
?
開源戰(zhàn)略的加速度
?
Kimi K2 Thinking采用最為寬松的MIT協(xié)議,允許免費(fèi)商業(yè)使用,僅在大規(guī)模部署時(shí)要求顯示“Kimi K2”標(biāo)識(shí)。
?
在定價(jià)策略上,其定價(jià)為緩存命中時(shí)0.15美元/百萬(wàn)Token,緩存未命中時(shí)0.6美元/百萬(wàn)Token,輸出為2.5美元/百萬(wàn)Token。
?

?
這一價(jià)格不僅遠(yuǎn)低于GPT-5的1.25美元輸入和10美元輸出定價(jià),也低于MiniMax-M2的0.3美元輸入和1.2美元輸出定價(jià)。
?
低成本高性能的組合,使得像Kimi K2 Thinking這樣的頂尖開源模型能夠普惠全球開發(fā)者,為全球大模型創(chuàng)新生態(tài)帶來(lái)巨大紅利。
?
從技術(shù)追趕到實(shí)現(xiàn)反超,開源模型正以前所未有的速度縮短與閉源模型的差距。
?
Kimi K2 Thinking的成功不是孤例,它反映的是中國(guó)AI產(chǎn)業(yè)開源戰(zhàn)略的集體加速度。在Hugging Face的大模型開源趨勢(shì)榜單上,前10名全都是中國(guó)的開源模型。
?
李開復(fù)在近期的一次演講中指出,世界大模型競(jìng)賽中只有中美兩國(guó),而競(jìng)爭(zhēng)關(guān)鍵正是“開源與閉源的路線之爭(zhēng)”。
?
Kimi K2 Thinking的突破不僅是一個(gè)產(chǎn)品的成功,更是開源發(fā)展路徑的有力驗(yàn)證。
?
隨著開源模型的不斷成熟和算力成本的下降,AI技術(shù)將更加深入地融入到各個(gè)行業(yè)。
?
當(dāng)AI技術(shù)真正實(shí)現(xiàn)普惠,當(dāng)每一個(gè)企業(yè)都能以合理成本獲得頂尖的AI能力,我們將會(huì)見證一場(chǎng)前所未有的產(chǎn)業(yè)變革。
?
大家怎么看?歡迎交流討論~

















