精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

KTransformers入選計算機系統頂會、與主流框架合作,趨境&清華讓「異構」成為推理新范式

人工智能 新聞
這是一個高性能異構推理框架,專注于高效利用底層GPU、CPU、內存等多樣化算力,讓大模型在更低算力、更靈活的硬件架構上高效運行。

全球AI基礎設施快速演進的浪潮中,一個誕生自中國的開源項目,正在被世界看見。

它就是KTransformers,由趨境科技與清華大學KVCache.AI團隊聯合研發,聚焦大模型推理階段的系統創新。

這是一個高性能異構推理框架,專注于高效利用底層GPU、CPU、內存等多樣化算力,讓大模型在更低算力、更靈活的硬件架構上高效運行,項目論文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》入選了剛剛落幕的“計算機系統領域奧斯卡” SOSP 2025。

SOSP是計算機系統領域最具影響力的國際頂會之一。過去幾十年間,從虛擬化到分布式文件系統,無數里程碑式的技術成果都曾首次亮相于此。

如今,KTransformers也在這個舞臺上獲得了全球系統學術界的最高背書。

幾乎在同一時間,KTransformers宣布與主流推理框架SGLang合作,雙方架構合入同一分支。這次合作意味著全GPU推理與異構推理的融合,推動大模型推理架構變得更加完善,將邁向更廣泛的產業落地。

在更遠的未來,它即將成為更多AI產品背后能跑得起大模型的底層路徑。

加入核心創新“專家延遲機制”,異構架構實現MoE模型高效推理

大模型推理領域,算力瓶頸正在成為全球技術界的核心問題。

尤其是當MoE(Mixture of Experts,專家混合)架構成為主流后,這個瓶頸更顯突出。MoE模型以“稀疏激活”為特征,每次推理只會調用部分專家子網絡,從而在不犧牲模型能力的前提下降低計算負擔。

問題隨之而來,如何高效調度這些專家從而避免資源浪費與設備空轉,成了產學研三界共同的新挑戰。

《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》正是在這一背景下誕生的。它提出了一條不同以往的道路:一套面向CPU+GPU異構架構的MoE推理系統方案,讓原本只能依賴昂貴多卡GPU的大模型,能在CPU參與的硬件環境中實現接近同等性能的推理體驗。

KTransformers的初衷是通過創新的異構推理的架構,充分釋放底層所有的硬件算力資源,優化計算調度,擺脫對單一硬件的依賴,從而實現更普惠、更高效的大模型部署與應用。

技術層面上,它通過一系列系統級創新,讓GPU負責注意力和主干網絡的高并行計算,CPU則承擔稀疏專家模塊的推理任務,實現了高效的CPU+GPU協同執行。

KTransformers的核心創新首先體現在底層算子優化上。

通過針對Intel AMX指令集開發的高吞吐計算核,結合自定義的tile-aware內存布局,KTransformers在單路Xeon上實現了PyTorch實現近4倍的提速,極大釋放了CPU在專家計算中的性能。至此,CPU成為推動系統吞吐提升的關鍵一環。

此外,KTransformers在異構任務協調方面也進行了系統性重構,為減少CPU與GPU之間的協調成本,KTransformers引入了NUMA感知張量并行和基于CUDA Graph的調度,以確保兩個設備以最小的同步延遲運行。

值得一提的是,在論文中KTransformers還提出了另一個創新技術——Expert Deferral(專家延遲機制)。

傳統MoE推理嚴格遵循層級順序,GPU必須等待CPU完成專家計算后才能繼續下一步,這種串行依賴導致了大量性能浪費。KTransformers打破了這一限制。

KTransformers研究團隊發現,Transformer模型的殘差連接具有一定的延遲容忍性,部分中間結果的計算并不需要嚴格同步完成。于是團隊提出讓部分專家計算延遲執行——也就是在GPU執行注意力模塊時,CPU專家仍在計算上一層結果,兩者并行推進。

這樣就使得CPU與GPU的負載得以動態重疊,模型吞吐提升約1.45倍,單卡decode速度最高超過30+ tokens/s,而模型精度變化低于0.5%,幾乎無損。

Expert Deferral是MoE推理異構化落地的關鍵突破,真正讓CPU與GPU實現了平等協作。

得益于這些設計,KTransformers能夠在一臺RTX 4080+雙路Xeon的單機環境中成功運行DeepSeek-V3-671B模型,單路性能接近多卡GPU集群水準。

推動推理架構融合,助力全球開發者高效創新

到今天,論文的全部思想已被完整工程化,衍生為開源系統KTransformers。

這其實是推理生態流變分化的一個具象化體現:一邊是以SGLang為代表的高吞吐、高并發全GPU路線;另一邊,則是仍在探索中的讓CPU與GPU協同工作的異構路線,嘗試用更靈活、成本更低的方式支持大模型運行。

KTransformers正是后者的代表之一。

KTransformers與SGLang的合作,是雙方基于各自推理引擎能力展開深度對接,聯合推動大模型推理向更高性能、更低成本的方向演進。

SGLang,全稱Structured Generation Language,是一種專為大型語言模型(LLM)和視覺語言模型(VLM)設計的高效推理與服務框架,它通過聯合設計前端語言和后端運行時來提升模型推理的速度和靈活性。

由于在多輪對話、復雜任務規劃和結構化輸出方面表現突出,在當下的大模型推理框架生態中,SGLang成為了最主流、最具工程實用性的開源推理引擎之一。

SGLang的優勢在于通用性和工程落地能力,全GPU推理思路也更適用于高吞吐量高并發等需求,KTransformers作為算子庫合入SGLang之后,雙方互為補充,開發者用戶可以直接獲得全GPU推理與異構推理兩種能力,不再需要手動集成、單獨調用。尤其是在GPU資源受限但本地CPU富余的場合,許多原本無法落地的模型都有了新的可行路徑。

例如通過KTransformers與SGLang合作實現的Multi-GPU+CPU混合推理能力,將更多專家放置在GPU上,這減少了帶寬瓶頸下的CPU內存訪問,相對單GPU的場景極大提升吞吐量。

此次合作實現了異構推理方案與主流推理框架的深度融合。這推動了雙方底層架構的協同進化,使其邁向更成熟、更工程化的新階段;同時使開發者能夠更便捷地調用各類模型,在硬件選擇上也更具靈活性。

KTransformers,想做的不止是“在本地跑得動”

技術成果背后,是持續構建生態的決心。

如今的KTransformers已成為一個被開發者、廠商與開源社區廣泛復用的共建式底層框架。

目前,其GitHub Star數已突破15.2K,成為全球Star數排名前列的大模型推理框架。

全球頭部開源模型方,如Qwen、Kimi、智譜 AI等多個主流大模型,都在模型發布首日就推薦KTransformers作為推理引擎支持;其工程實踐與兼容性也被多家一體機產品線采納。

在這條異構路線逐漸成型的過程中,趨境科技始終是最核心的推動者之一。

在KTransformers的架構設計、核心實現、算子優化、框架適配以及社區維護等多個關鍵層面,趨境科技始終處于一線角色——

在與清華大學KVCache.AI團隊聯合研發的基礎上,趨境負責了項目中的大量底層開發、接口對接、系統調度和社區推廣工作。

這一次與SGLang的對接合作中,趨境科技也作為主要實現方與維護貢獻者,完成了從對接設計、功能聯調,到主分支合入的全部工程閉環。

對趨境來說,KTransformers輸出的是一種價值理念的承載,更是一個更長期的目標:

在大模型時代,需要有人站出來為推理基礎設施提供新的可能性。大模型落地不能只有精英算力路徑,也需要一條更廣譜的路線:以異構協同釋放本地硬件的潛力,以開源能力幫助更多團隊和組織用得起、調得動、融得進自己的業務中。

正因此,趨境已經與多個國產CPU、GPU硬件平臺合作,共同推進全國產高性價比方案;為數十家行業開發伙伴提供算力底座,逐步實現算力普惠,讓大模型真正能夠為業務所用。

今天的KTransformers,已經讓大模型推理不再專屬于高端算力;未來,趨境希望讓AI能力也不再專屬于少數企業。

Gossip time

KTransformers已經可以在一張消費級GPU上穩定運行千億參數大模型。那么,下一步呢?

給大家附上一個圈內人最近才剛知道的小道消息:

研究團隊好像已經有人在內部試水微調了。而且是在不擴卡、不改架構的前提下來做輕量調優。

從KTransformer的設計思路來看,確實是順理成章的一步:

既然推理已經解決了,那接下來的方向,不就是能跑也能調么。

大家期待的小手手可以隨時搓起來了哈!

論文鏈接:

https://madsys.cs.tsinghua.edu.cn/publication/ktransformers-unleashing-the-full-potential-of-cpu/gpu-hybrid-inference-for-moe-models/SOSP25-chen.pdf

技術細節詳見SGLang博客:

https://lmsys.org/blog/2025-10-22-KTransformers/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-29 09:13:00

2022-03-30 15:25:28

鏈接過程計算機系統程序

2014-04-10 09:40:51

System 360計算機計算機系統

2025-07-01 13:52:19

2021-09-02 10:15:50

計算平臺MaxCompute 阿里云

2018-07-05 09:25:07

系統存儲層次

2022-10-31 08:17:04

內存計算機cpu

2025-05-29 03:00:00

混合推理模型LHRMAI

2022-07-12 10:37:08

阿里巴巴達摩院機器學習

2020-10-15 14:23:30

計算機互聯網 技術

2012-09-12 09:59:26

云計算超級計算機數據中心

2025-04-08 09:16:00

推理模型AI

2023-09-07 11:16:15

GPU機器學習

2012-06-20 10:40:36

量子計算機

2020-06-04 11:52:09

阿里云

2013-12-18 13:35:22

微軟頂新信息化

2024-08-13 14:00:00

AI訓練

2009-07-04 09:38:07

2020-06-19 10:33:16

阿里AIICML

2014-05-14 16:46:47

點贊
收藏

51CTO技術棧公眾號

国产欧美va欧美va香蕉在| 亚洲国产成人自拍| 久久久久久久国产精品视频| 女尊高h男高潮呻吟| 成人免费直播| 中文字幕日本不卡| 韩国成人av| 伊人免费在线观看| 999久久久精品国产| 日韩欧美国产系列| 麻豆传传媒久久久爱| 波多野结衣在线网站| 国产视频一区欧美| 亚洲福利视频久久| 日本成人在线免费视频| 国产精品刘玥久久一区| 日韩电影免费一区| 性色av香蕉一区二区| 鲁丝一区二区三区| 97青娱国产盛宴精品视频| 精品久久久久国产| 日本成人性视频| 欧美孕妇孕交xxⅹ孕妇交| 国产一区二区三区免费播放| 国产91ⅴ在线精品免费观看| 国产成人av免费在线观看| 欧美91在线| 日韩一区国产二区欧美三区| 爱情岛论坛成人| 阿v视频在线| 亚洲麻豆国产自偷在线| 亚洲成人a**址| 免费黄色在线视频网站| 大尺度一区二区| 成人国内精品久久久久一区| 国产天堂av在线| 久久亚洲精品中文字幕蜜潮电影| 亚洲精品网址在线观看| 潘金莲激情呻吟欲求不满视频| 中文字幕21页在线看| 亚洲韩国精品一区| 国产制服91一区二区三区制服| 韩日视频在线| 99久久精品免费看国产| 成人性生交大片免费看小说| 特黄视频免费看| 亚洲在线观看| 欧美综合第一页| www.99re7.com| 91日韩视频| 中文字幕亚洲综合| 娇妻被老王脔到高潮失禁视频| 日韩母乳在线| 日韩精品中文字幕在线观看 | 午夜欧美激情| 午夜精品福利在线| xxxx18hd亚洲hd捆绑| a级大胆欧美人体大胆666| 亚洲精品一二三| av日韩在线看| 日本欧美电影在线观看| 一卡二卡欧美日韩| av免费观看大全| av中文字幕在线观看第一页| 亚洲成av人片一区二区| 久久久一本二本三本| 涩涩涩视频在线观看| 色综合婷婷久久| 国产肥臀一区二区福利视频| 成人福利av| 欧美手机在线视频| 国内自拍第二页| 成人三级视频在线观看| 久久精品国产亚洲blacked| 亚洲国产小视频在线观看| 天天av天天操| 精品福利一区| 国产亚洲精品综合一区91| 日本污视频网站| 综合天堂av久久久久久久| 欧美激情亚洲视频| 精品国产一区二区三区四| 日本女人一区二区三区| 成人高清视频观看www| www.久久精品.com| 成人av在线影院| 日韩欧美精品一区二区| 91福利在线视频| 一区二区三区在线免费播放| 少妇高潮毛片色欲ava片| 欧美色网一区| 欧美一区二区三区成人| 熟女丰满老熟女熟妇| 国产亚洲电影| 欧美另类交人妖| 青青草成人免费| 美女网站久久| 国产黑人绿帽在线第一区| 国产欧美日韩综合精品一区二区三区| 成人黄色在线网站| 亚洲图片都市激情| 黄色软件视频在线观看| 丰满岳妇乱一区二区三区| 91最新在线观看| 极品国产人妖chinesets亚洲人妖| 亚洲小视频在线观看| 免费中文字幕视频| 免费亚洲网站| 国产精品久久久久久久免费大片 | 中文字幕在线观看一区二区三区| 麻豆影视国产在线观看| 一本色道综合亚洲| 一级黄色在线播放| 欧洲杯半决赛直播| 91精品91久久久久久| 亚洲调教欧美在线| 日韩成人a**站| 欧美高跟鞋交xxxxhd| 天天干在线播放| 成人看片黄a免费看在线| 亚洲精品中文综合第一页| 人在线成免费视频| 欧美成人福利视频| 欧产日产国产v| 蜜桃视频在线观看一区| 欧美在线激情| 免费一二一二在线视频| 日韩精品最新网址| 久久中文字幕精品| 美女视频一区免费观看| 九九九九精品| 国产在线xxx| 日韩精品中文字幕在线一区| 国产免费美女视频| 午夜亚洲视频| 精品国产一二| 丁香花在线影院| 日韩视频一区二区在线观看| 日本一级片免费| 经典三级在线一区| 在线观看日韩羞羞视频| 日韩精品99| 亚洲成人黄色在线| 日本少妇久久久| 北条麻妃一区二区三区| 蜜桃视频一区二区在线观看| 精品一区二区三区中文字幕在线 | 性色国产成人久久久精品 | 日韩精品视频网址| 999国产精品永久免费视频app| 国产精品三级网站| 视频免费一区| 欧美一区二区三区免费观看视频| 91麻豆免费视频网站| 免费精品视频在线| 亚洲精品电影在线一区| 日本免费成人| 久久久精品国产一区二区| 日韩不卡高清视频| 国产精品美女久久久久av爽李琼| 性生活免费在线观看| 91麻豆国产自产在线观看亚洲| 91中文字幕在线观看| 18视频在线观看网站| 精品成人一区二区| 国产午夜免费福利| 国产婷婷一区二区| 超碰人人草人人| 国产精品成人一区二区不卡| 91精品国产综合久久久久久丝袜| 欧美卡一卡二| 日韩高清欧美高清| 中文字幕一区二区三区免费看| 综合精品久久久| 五月天丁香社区| 亚洲在线日韩| 久久免费看毛片| 国产一区二区三区亚洲| 欧洲精品久久久| 国产精品久久麻豆| 亚洲成人av中文字幕| 久久久久久久久久一级| 中文无字幕一区二区三区| mm131国产精品| 欧美日韩ab| 久久久久久久久久码影片| 666av成人影院在线观看| 久久国产精品久久久| 日韩毛片在线一区二区毛片| 欧美久久久久久久久| 中文字幕在线观看成人| 91在线porny国产在线看| 欧美一级特黄a| 精品91在线| 亚洲精品高清视频| 欧美丝袜足交| 91色精品视频在线| 涩涩av在线| 色综合男人天堂| 搞黄视频在线观看| 欧美精品一区二区三区四区 | 精品久久久久久久人人人人传媒 | 日韩精品中文字幕在线一区| 久久久久久亚洲av无码专区| 一区二区三区在线免费| 五月婷婷六月香| 2020国产精品自拍| 高潮一区二区三区| 国产欧美日本| 国产 国语对白 露脸| 欧美一区电影| 蜜桃视频日韩| 猫咪在线永久网站| 日韩三级视频中文字幕| 少妇又紧又色又爽又刺激视频| 亚洲国产精品天堂| 国产白丝一区二区三区| 波多野结衣中文字幕一区| 亚洲男人天堂2021| 国产精品永久| 日韩五码在线观看| 欧美大片一区| 日韩人妻一区二区三区蜜桃视频| 一区二区小说| 久久精品二区| 乱中年女人伦av一区二区| 国产在线视频不卡| 亚洲天堂一区二区| 91高清免费视频| 欧美xxx黑人xxx水蜜桃| 久久综合九色九九| 看黄网站在线| 色综合影院在线| 日本啊v在线| 日韩成人av一区| 国产理论片在线观看| 亚洲精品网站在线观看| 性久久久久久久久久| 久久综合色综合88| 中文字幕精品视频在线| 9人人澡人人爽人人精品| 亚洲av午夜精品一区二区三区| 国产一区二区视频在线播放| 超碰在线公开97| 免费日本视频一区| 内射国产内射夫妻免费频道| 性娇小13――14欧美| 一区二区在线观看网站| 成人在线免费观看91| 亚洲国产成人不卡| 亚洲影院天堂中文av色| 欧美日韩三区四区| 国产在线观看91一区二区三区| 欧美一区二区视频17c| 精品国产一区二区三区香蕉沈先生| 国产手机精品在线| 亚洲三级精品| 色之综合天天综合色天天棕色| 日本精品三区| 99精品一级欧美片免费播放| 欧美激情视频一区二区三区在线播放 | 国产日韩欧美a| 国产真实乱人偷精品人妻| 欧美国产精品久久| 一二三四国产精品| 中文字幕巨乱亚洲| 手机av免费看| 国产精品国产精品国产专区不蜜| 国产一区二区三区在线视频观看| ...xxx性欧美| 国产一级淫片免费| 亚洲永久免费av| 美女又爽又黄免费视频| 亚洲国产一区二区视频| 亚洲成人第一网站| 欧美高清精品3d| 六月丁香综合网| 亚洲一区二区三区不卡国产欧美| 国产一级做a爱免费视频| 欧美日韩另类在线| 国产性猛交╳xxx乱大交| 欧洲色大大久久| 99在线观看免费| 亚洲精品福利视频| 日韩一级片免费观看| 亚洲一二三在线| av在线看片| 国产不卡精品视男人的天堂| 美女国产精品久久久| 久久精品国产美女| 91精品国产91久久久久久黑人| 亚洲国产一二三精品无码| 久久人人超碰| 中文字幕第100页| 99久久精品99国产精品 | 久青草国产在线| 欧美超级乱淫片喷水| 日本欧美日韩| 国产不卡一区二区三区在线观看| 精品99久久| 国产原创中文在线观看| 韩国一区二区视频| 美女100%无挡| 亚洲成a人片综合在线| 亚洲影院一区二区三区| 日韩电影在线观看永久视频免费网站| 日本韩国在线视频爽| 91超碰中文字幕久久精品| 国色天香久久精品国产一区| 欧美激情第一页在线观看| 国语对白精品一区二区| 在线观看免费视频高清游戏推荐| 91啦中文在线观看| 国产一级一级片| 欧美一区二区久久| 亚洲成人第一区| 久久韩国免费视频| videos性欧美另类高清| 国产精品12| 欧美色图麻豆| 福利视频999| 国产精品毛片无遮挡高清| 国产嫩bbwbbw高潮| 日韩精品欧美国产精品忘忧草| 波多野结衣在线播放| 亚洲japanese制服美女| 成人羞羞网站| 日韩爱爱小视频| 国产精品久久久久久久久久免费看 | 日本美女xxx| 一本大道av伊人久久综合| 人妻无码一区二区三区久久99| 久久精品国产一区二区三区| 韩国成人在线| 五月天亚洲综合情| 视频在线观看91| av在线播放网址| 亚洲午夜一区二区三区| 亚洲精品喷潮一区二区三区| 久久久av免费| 日本精品国产| av 日韩 人妻 黑人 综合 无码| 韩国一区二区视频| 青青青在线视频| 欧美不卡在线视频| 51漫画成人app入口| 高清视频一区二区三区| 欧美伊人久久| 色哟哟无码精品一区二区三区| 亚洲aⅴ怡春院| 亚洲欧美色视频| 国产不卡在线观看| 第一社区sis001原创亚洲| 日本999视频| 国产精品美女久久久久aⅴ | 欧美精品一区二区三区很污很色的 | 国产精品伦一区二区三级视频| 亚洲中文字幕在线一区| 久久视频在线看| av成人app永久免费| 国产精品国三级国产av| www.欧美日韩国产在线| 国产寡妇亲子伦一区二区三区四区| 亚洲第一精品夜夜躁人人爽| 樱桃视频成人在线观看| 亚洲成人一区二区三区| 国产酒店精品激情| 欧美成人精品欧美一级私黄| 亚洲激情自拍图| 欧美成人资源| 亚洲一区三区电影在线观看| 国产高清视频一区| 国产午夜性春猛交ⅹxxx| 国产亚洲精品久久久久久| 国产区一区二| 青青艹视频在线| 中文字幕第一区第二区| 亚洲高清视频免费观看| 在线观看视频99| 亚洲欧美日本国产| www污在线观看| 国产人伦精品一区二区| 国产成人三级在线播放| 91av视频在线免费观看| av一区二区在线播放| 亚洲中文字幕久久精品无码喷水| 亚洲天堂免费在线观看视频| 国产精品-色哟哟| 国模精品系列视频| 欧美成免费一区二区视频| 精品人妻在线视频| 欧美日韩一区不卡| 爱情岛亚洲播放路线| 亚洲激情图片| 99久久伊人精品| 国产又粗又猛视频| 欧美专区日韩视频| 欧美精品九九| 国产一区在线观看免费| 亚洲精品久久久久久下一站|