精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

超大模型推理加速2.18倍!SGLang聯(lián)合美團(tuán)技術(shù)團(tuán)隊(duì)開源投機(jī)采樣訓(xùn)練框架

人工智能 新聞
SGLang,當(dāng)前趨勢(shì)下最受青睞的推理框架之一,為DeepSeek提供了專屬優(yōu)化,也深受英偉達(dá)、AMD、xAI等廠商喜愛。

專門適用超大模型、帶來2.18倍推理加速,最新投機(jī)采樣訓(xùn)練框架開源!

SGLang團(tuán)隊(duì)聯(lián)合美團(tuán)搜推平臺(tái)、Cloudsway.AI開源SpecForge。

SGLang,當(dāng)前趨勢(shì)下最受青睞的推理框架之一,為DeepSeek提供了專屬優(yōu)化,也深受英偉達(dá)、AMD、xAI等廠商喜愛。

這一次開源,主要是針對(duì)當(dāng)下超大模型趨勢(shì)。

隨著Kimi K2、Qwen Coder的開源,越來越多的超大型模型進(jìn)入大家的視野。這些模型具有強(qiáng)勁的性能,但受制于模型尺寸導(dǎo)致推理效率較低。對(duì)于超大尺寸的模型,除了進(jìn)一步優(yōu)化算子之外。還有像投機(jī)采樣這樣的技術(shù)能加速它們的推理。

投機(jī)采樣(Speculative Sampling)通過引入輕量級(jí)的輔助模型來提升推理效率,同時(shí)確保結(jié)果的質(zhì)量和正確性。

目前性能強(qiáng)勁的投機(jī)采樣技術(shù)分別有MTPEagle3,但MTP其需要在預(yù)訓(xùn)練階段與基礎(chǔ)模型一起訓(xùn)練,限制了MTP在業(yè)界的廣泛應(yīng)用。而Eagle3作為一種訓(xùn)練后而集成的技術(shù),很適合在已開源的超大尺寸模型上繼續(xù)訓(xùn)練,而進(jìn)一步提升推理效率。

SpecForge正是基于Eagle3,它不僅是首個(gè)支持超大模型投機(jī)采樣訓(xùn)練并開箱即用的框架,還與SGLang推理引擎深度集成。一鍵打通投機(jī)采樣訓(xùn)練推理全流程。

為何推出新的Spec訓(xùn)練框架?

投機(jī)采樣(speculative decoding)已成為大語言模型(LLM)推理加速的共識(shí)方案,但其端到端訓(xùn)練工具的缺失仍是明顯短板。目前開源社區(qū)中,尚無能夠支持超大尺寸模型訓(xùn)練且與SGLang深度結(jié)合的框架,而這些工具層面的不足,直接導(dǎo)致此類模型的部署面臨巨大挑戰(zhàn)。

SpecForge為此而來,一個(gè)專為投機(jī)采樣訓(xùn)練而生、并與SGLang原生集成的生態(tài)系統(tǒng),其核心功能包括:

  • 原生支持最新開源架構(gòu):SpecForge支持主流模型,包括復(fù)雜的MoE層和Transformer變體。
  • 可擴(kuò)展的分布式訓(xùn)練:SpecForge集成了FSDP(Fully Sharded Data Parallel)和TP(Tensor Parallelism)等并行策略,可在GPU集群上實(shí)現(xiàn)高效擴(kuò)展。
  • 內(nèi)存高效訓(xùn)練優(yōu)化:顯著降低了大規(guī)模模型訓(xùn)練時(shí)的內(nèi)存開銷;即使是萬億參數(shù)的基礎(chǔ)模型,訓(xùn)練Eagle3也同樣高效。

SpecForge核心特性

Eagle3集成

Eagle是一種最先進(jìn)的投機(jī)采樣方法,旨在加速大型語言模型推理。它通過訓(xùn)練一個(gè)專門的輕量級(jí)草稿模型來準(zhǔn)確預(yù)測(cè)較大目標(biāo)模型的token分布,從而實(shí)現(xiàn)高接受率和顯著的性能提升。下圖展示了Eagle3的端到端訓(xùn)練流程:

圖片

訓(xùn)練時(shí)測(cè)試(TTT)支持

EAGLE3的高性能提升主要來源于其創(chuàng)新的訓(xùn)練時(shí)測(cè)試(Training-Time Test)架構(gòu),該架構(gòu)通過模擬多步生成來增強(qiáng)草稿模型的健壯性。盡管TTT性能強(qiáng)大,但其實(shí)現(xiàn)卻極具有挑戰(zhàn)性,因?yàn)樗蕾囉趶?fù)雜的專用注意力掩碼(specialized attention masks)和遞歸式數(shù)據(jù)循環(huán)(recursive data loops)。

SpecForge將這一復(fù)雜過程完全封裝,提供了內(nèi)置且經(jīng)過驗(yàn)證的TTT支持。實(shí)現(xiàn)嚴(yán)格參照了官方Eagle3的核心邏輯,以確保其計(jì)算的正確性與性能,從而免除底層實(shí)現(xiàn)負(fù)擔(dān)。

雙重訓(xùn)練模式:在線與離線

SpecForge通過提供兩種訓(xùn)練模式:在線(Online)和離線(Offline)來簡(jiǎn)化隱藏狀態(tài)的收集,隱藏層的收集是Eagle類模型的特點(diǎn)。它通過主模型的隱藏層訓(xùn)練草稿模型,讓草稿模型整體分布和主模型對(duì)齊。

該框架的雙模式設(shè)計(jì)能讓用戶能找到高效的訓(xùn)練模式,關(guān)于在線和離線訓(xùn)練的優(yōu)缺點(diǎn)如下文所示。

圖片

選擇在線或離線模式,可以根據(jù)您的具體需求和資源調(diào)整訓(xùn)練過程。

  • 在線模式:可實(shí)現(xiàn)最大速度和靈活性。它非常適合快速實(shí)驗(yàn)和存儲(chǔ)有限的場(chǎng)景,因?yàn)樗軇?dòng)態(tài)生成數(shù)據(jù),無需大量磁盤空間。
  • 離線模式:適用于可復(fù)現(xiàn)性和數(shù)據(jù)復(fù)用至關(guān)重要的場(chǎng)景。通過預(yù)先計(jì)算和存儲(chǔ)隱藏狀態(tài),此模式可保證實(shí)驗(yàn)之間的一致性,在存儲(chǔ)空間充足時(shí)效率很高。

擴(kuò)展性優(yōu)先

SpecForge在設(shè)計(jì)時(shí)高度重視可擴(kuò)展性,以滿足工程生產(chǎn)需求。該框架使用模塊化接口實(shí)現(xiàn)了新草稿模型和主模型的直接實(shí)現(xiàn)和注冊(cè)。

為了實(shí)現(xiàn)可擴(kuò)展性,團(tuán)隊(duì)實(shí)現(xiàn)了多種訓(xùn)練時(shí)并行策略。包括FSDP(Fully Sharded Data Parallel) 和TP并行實(shí)現(xiàn),確保超大型模型的高效訓(xùn)練。

實(shí)驗(yàn)

為驗(yàn)證SpecForge的有效性,團(tuán)隊(duì)利用它在包含320K樣本的ShareGPT和UltraChat數(shù)據(jù)集上,為L(zhǎng)LaMA 4訓(xùn)練了Scout和Maverick草稿模型。

這些模型在MT-Bench等行業(yè)標(biāo)準(zhǔn)基準(zhǔn)上表現(xiàn)出色,充分證明了其模型質(zhì)量以及與Eagle3架構(gòu)的兼容性。特別值得一提的是,團(tuán)隊(duì)為L(zhǎng)lama 4 Maverick訓(xùn)練的草稿模型在MT-Bench上實(shí)現(xiàn)了2.18倍的推理加速。

詳細(xì)的實(shí)驗(yàn)結(jié)果與性能指標(biāo)總結(jié)如下。

在下圖所示的所有測(cè)試中,x軸代表投機(jī)采樣步長(zhǎng),對(duì)應(yīng)于SGLang中的speculative-num-steps。同時(shí),將 SGLang 的speculative-eagle-topk固定為8,將speculative-num-draft-tokens固定為10,這樣可以使用 tree attention達(dá)到更高的接受率。為了找到最優(yōu)的投機(jī)采樣參數(shù),可以使用SGLang代碼庫中的bench_speculative腳本。該腳本會(huì)在不同配置下運(yùn)行吞吐量基準(zhǔn)測(cè)試,針對(duì)硬件調(diào)優(yōu)出最佳性能。

圖片圖片

最后,可以在GitHub上查看源代碼,并在Hugging Face上試用已訓(xùn)練的模型。

GitHub倉庫: 訓(xùn)練框架的完整源代碼,包括TTT和數(shù)據(jù)處理的實(shí)現(xiàn)細(xì)節(jié)。https://github.com/sgl-project/SpecForge

Hugging Face模型:下載LLaMA 4 Scout(https://huggingface.co/lmsys/sglang-EAGLE3-Llama-4-Scout-17B-16E-Instruct-v1)和Maverick(https://huggingface.co/lmsys/sglang-EAGLE3-Llama-4-Maverick-17B-128E-Instruct-v1)Eagle3 heads(不含完整模型)用于您的項(xiàng)目。

SpecForge的Roadmap如下:

  • 支持更多模型架構(gòu),包括Kimi K2和Qwen-3 MoE。
  • 將視覺-語言模型 (VLM) 集成到 SpecForge 中。
  • 通過更好的并行策略和kernel優(yōu)化來支持更高效的訓(xùn)練。

Blog地址:https://lmsys.org/blog/2025-07-25-spec-forge/

團(tuán)隊(duì)成員

SGLang核心團(tuán)隊(duì):Shenggui Li、Shuai Shi、Fan Yin、Yikai Zhu、Yi Zhang、Yingyi Huang、Yineng Zhang 及其他成員。

美團(tuán)搜推平臺(tái):Chao Wang

SafeAILab團(tuán)隊(duì):Yuhui Li、Hongyang Zhang及其成員

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-11-02 10:28:03

2023-01-05 09:33:37

視覺模型訓(xùn)練

2022-04-26 15:09:14

優(yōu)化模型訓(xùn)練

2023-09-12 14:45:18

2025-06-30 08:42:00

模型訓(xùn)練AI

2023-05-30 14:17:00

模型推理

2025-03-07 09:57:01

2025-04-11 09:15:00

語言模型AI數(shù)據(jù)

2023-09-12 13:43:00

智能技術(shù)

2024-11-21 15:00:00

大語言模型數(shù)據(jù)

2022-03-21 17:56:59

大模型訓(xùn)練訓(xùn)練框架

2022-03-21 15:06:10

模型字節(jié)跳動(dòng)框架

2022-07-18 17:37:27

字節(jié)跳動(dòng)人工智能AI模型

2025-10-14 08:58:00

2025-10-24 12:14:32

2015-05-28 09:54:33

美團(tuán)docker容器

2025-07-07 08:46:00

2024-11-01 13:30:56

2025-11-06 09:03:00

2025-06-05 08:40:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

不卡一区二区三区四区五区| 亚洲日韩中文字幕在线播放| 69精品丰满人妻无码视频a片| av一区二区三| 99亚洲伊人久久精品影院红桃| 精品视频在线导航| 91丨九色丨蝌蚪| a毛片不卡免费看片| 久久精品一区二区三区av| 国产美女主播一区| 国产奶水涨喷在线播放| 欧美在线色图| 精品日韩一区二区三区免费视频| avav在线看| 成人区精品一区二区不卡| 91在线视频在线| 91视频九色网站| 日韩电影在线观看一区二区| 一本一本久久a久久综合精品| 日韩风俗一区 二区| 国产三级生活片| 在线能看的av网址| 亚洲精品免费电影| 日本不卡一区二区三区在线观看| 国产深喉视频一区二区| 久久综合九色| 91国内在线视频| 欧美黄色一区二区三区| 精品一区电影| 亚洲欧美www| 四虎成人免费视频| avtt久久| 欧美三级日本三级少妇99| 国产精品无码人妻一区二区在线| 黄色成人在线| 欧美高清在线一区二区| 就去色蜜桃综合| 粉嫩av一区二区夜夜嗨| 国产美女一区二区三区| 国产精品一区二区久久国产| 日本视频在线观看免费| 极品av少妇一区二区| 日韩中文字幕免费视频| 亚洲一区二区自偷自拍| 天堂成人娱乐在线视频免费播放网站 | 黄色视屏在线免费观看| 一级特黄大欧美久久久| 亚洲美女自拍偷拍| 日韩美女网站| 国产精品日韩精品欧美在线| 欧美日韩国产一二| 日本久久一级片| 国产成人av福利| 99精彩视频| 亚洲AV无码一区二区三区少妇 | 97人人模人人爽人人澡| 国产一区二区色噜噜| 欧美亚洲丝袜传媒另类| 日日碰狠狠躁久久躁婷婷| 中文字幕高清在线播放| 欧美性猛交xxxx乱大交| 国产精品沙发午睡系列| 麻豆mv在线看| 欧美日韩中文在线观看| 国产成人精品视频免费看| 激情aⅴ欧美一区二区欲海潮| 亚洲高清视频中文字幕| 国产精品又粗又长| 九色porny自拍视频在线观看 | 国产无遮挡一区二区三区毛片日本| 久久综合一区二区三区| 国产永久免费高清在线观看视频| 久久精品视频在线看| 日韩欧美一区二区在线观看| 无遮挡动作视频在线观看免费入口| 国产精品久久毛片av大全日韩| 五月天色婷婷综合| av毛片在线免费看| 亚洲一区二区欧美激情| 国产视频九色蝌蚪| 偷拍精品精品一区二区三区| 欧美三级日韩三级| 久草福利在线观看| 韩国精品福利一区二区三区| 亚洲另类欧美自拍| 国精产品视频一二二区| 综合天堂久久久久久久| 97视频色精品| 超碰在线97观看| 国产毛片一区二区| 久久99蜜桃综合影院免费观看| 国内在线精品| 亚洲人成网站在线| 日本三级免费网站| 日本午夜免费一区二区| 日韩欧美的一区二区| 先锋资源av在线| 欧美精品久久久久久| 成年无码av片在线| 亚洲欧美偷拍一区| 国产精品原创巨作av| 久久av一区二区三区漫画| 亚洲视频tv| 亚洲国产精品人人做人人爽| 国内自拍视频一区| 在这里有精品| 中文在线不卡视频| 日本少妇xxxx动漫| 麻豆国产精品官网| 久久精精品视频| caopo在线| 色婷婷av一区| 国产免费a级片| 久久国产电影| 日本欧美精品在线| 黄色av一区二区三区| 欧美国产精品v| 波多野结衣50连登视频| 视频在线亚洲| 国产一区二区三区中文| 精品肉丝脚一区二区三区| 欧美a级理论片| 精品国产一区二区三区麻豆小说| 国产美女在线观看| 欧美影院精品一区| 成人精品在线观看视频| 女人色偷偷aa久久天堂| 国产精品中文字幕久久久| 亚洲欧洲综合在线| 亚洲成人在线观看视频| 污视频在线观看免费网站| 国产乱码精品一区二区三区四区| 91黑丝在线观看| 国精品人妻无码一区二区三区喝尿| 国产精品女主播av| 欧美激情国产精品日韩| 久久精品色播| 欧美国产在线视频| 国产免费黄色录像| 国产精品久久久一区麻豆最新章节| 久久久久久久久久久视频| 成人线上播放| 欧美福利小视频| 亚洲国产剧情在线观看| 亚洲免费av在线| 下面一进一出好爽视频| 亚洲综合色站| 91精品国产综合久久久久久丝袜| 69av在线| 91精品免费观看| 黄色片在线观看网站| 国产一区二区三区观看| 亚洲免费视频播放| 国产精品日韩精品在线播放| 久久亚洲国产成人| 国产美女永久免费| 亚洲日本在线观看| 性色av浪潮av| 雨宫琴音一区二区在线| 国产伦精品一区二区三区高清| 欧美色图天堂| 精品国产免费久久 | 欧洲精品中文字幕| 性欧美精品男男| 免费成人av资源网| 伊人久久大香线蕉午夜av| 国产一区一区| 久久久久久中文字幕| 亚洲av电影一区| 在线精品亚洲一区二区不卡| 中文字幕91视频| 国产美女在线精品| 欧美视频在线免费播放| 最新国产一区| 国产欧美精品一区二区三区-老狼| 日本在线免费网| 欧美不卡在线视频| 中文字幕视频网| 国产欧美中文在线| 另类小说色综合| 久久精品免费一区二区三区| 久久你懂得1024| 国产精品日韩专区| 日韩精品毛片| 日韩一区二区电影在线| 91porny在线| 久久久久久久久免费| 欧美极品欧美精品欧美图片| 免费一区二区三区视频导航| 成人a视频在线观看| 成人免费观看视频大全| 欧美精品一区二区久久婷婷| 国产污污视频在线观看| 成人午夜电影久久影院| 国产午夜福利视频在线观看| 激情综合网站| 91免费精品国偷自产在线| 久久www人成免费看片中文| 亚洲欧美制服综合另类| 91美女精品网站| 亚洲观看高清完整版在线观看| 97伦伦午夜电影理伦片| 日本欧美一区二区在线观看| www插插插无码免费视频网站| 神马日本精品| 国产欧美欧洲在线观看| 国产精品186在线观看在线播放| 夜夜嗨av色综合久久久综合网| 国产巨乳在线观看| 精品久久久久久中文字幕大豆网| japanese中文字幕| 麻豆精品在线播放| 131美女爱做视频| 日韩在线欧美| 国产精品污www一区二区三区| 欲香欲色天天天综合和网| 久久国产精品电影| 日韩欧美亚洲系列| 91精品视频网| 日韩三级一区二区| 亚洲国产欧美在线| 蜜桃av免费在线观看| 不卡一区二区三区四区| www.日本一区| 日韩1区2区3区| 给我免费播放片在线观看| 91亚洲国产| 欧美日韩精品中文字幕一区二区| 中文字幕亚洲在线观看| 国产精品第10页| 国产中文在线播放| 欧美精品一区三区| av免费在线观看网址| 亚洲午夜av电影| 你懂的网站在线| 欧美一区二区三区四区五区| 一级二级三级视频| 日韩欧美成人精品| 日本在线观看视频网站| 亚洲欧美一区二区三区国产精品| 97超碰在线资源| 波多野结衣一区二区三区| 男生操女生视频在线观看| 久热精品在线| 久久视频这里有精品| 欧美日韩第一区| eeuss中文| 日韩精品诱惑一区?区三区| 五月天亚洲综合小说网| 少妇久久久久| 精品亚洲一区二区三区四区五区高| 看亚洲a级一级毛片| 91日韩久久| 欧美电影院免费观看| 国产日韩亚洲欧美| 久久影视精品| 成人黄色激情网| 午夜精品一区二区三区av| 中文在线字幕免费观看| www.xxxx精品| 欧美日韩经典丝袜| 欧美高清第一页| a毛片在线观看| 久久91亚洲人成电影网站| av片哪里在线观看| 欧美肥婆姓交大片| 在线天堂新版最新版在线8| 欧美一区二区三区免费观看| 色戒汤唯在线| 国产精品88a∨| 精品176极品一区| 成人两性免费视频| 999精品嫩草久久久久久99| 99re在线播放| 精品网站aaa| 欧美色图亚洲自拍| 欧洲美女日日| 91大学生片黄在线观看| 欧美三级午夜理伦三级中文幕| 800av在线免费观看| 国产精品一二| 欧美日韩在线观看不卡| 精品一区二区三区免费| 五月天激情播播| 99久久精品国产一区二区三区| 亚洲国产精品成人综合久久久| 久久综合色之久久综合| 国产精品综合激情| 一级特黄大欧美久久久| 男女啊啊啊视频| 欧美三级蜜桃2在线观看| 亚洲乱码在线观看| 精品视频—区二区三区免费| 国产美女性感在线观看懂色av| 这里只有视频精品| 欧美大片黄色| 国产91在线视频| 成人污污视频| 欧美中日韩免费视频| 天天射成人网| 欧美日韩一道本| 日韩av一级电影| 亚洲天堂美女视频| 国产精品美日韩| 久久久香蕉视频| 欧美人成免费网站| 熟妇人妻av无码一区二区三区| 亚洲天堂男人天堂女人天堂| tube8在线hd| 国产精品偷伦视频免费观看国产| 91久久久久久白丝白浆欲热蜜臀| 国产欧美 在线欧美| 国产乱论精品| 亚洲一区二区三区午夜| 免费亚洲一区| 国产农村妇女精品久久| 99re成人精品视频| 麻豆疯狂做受xxxx高潮视频| 精品久久久久久久久久久久久久| 中文字幕人妻一区二区在线视频| 日韩亚洲欧美综合| 三区四区电影在线观看| 97碰碰碰免费色视频| 日韩大陆av| 午夜精品福利一区二区| 伊人久久久大香线蕉综合直播 | 亚洲精品成人无码| 亚洲精品欧美激情| 波多野结衣视频在线看| 日韩精品视频观看| free性欧美hd另类精品| 国产国语videosex另类| 日本免费一区二区视频| 欧美日韩国产综合在线| 99国产精品久久久久久久成人热 | 欧美一二三在线| 在线国产91| 4438全国成人免费| 97久久精品| 无码毛片aaa在线| 奇米综合一区二区三区精品视频| 欧类av怡春院| 亚洲人成在线观看一区二区| 91丨九色丨蝌蚪丨对白| 一本久久综合亚洲鲁鲁| 三级在线观看视频| 美女一区视频| 欧美三级网页| 91精品人妻一区二区三区蜜桃2| 国产精品亲子乱子伦xxxx裸| 日本黄色中文字幕| 亚洲人成电影网站色www| 麻豆免费版在线观看| 国产精品伊人日日| 国产日韩欧美三级| av无码av天天av天天爽| 亚洲大片一区二区三区| 日批视频在线播放| 97色在线观看| 欧洲vs亚洲vs国产| av动漫在线观看| 国产欧美一区二区三区在线看蜜臀| 中日韩黄色大片| 亚洲午夜色婷婷在线| 久久久一本精品| 日韩欧美亚洲区| 狠狠网亚洲精品| 日韩黄色免费观看| 欧美电影精品一区二区| 草美女在线观看| 国产亚洲一区二区三区在线播放| 在线播放不卡| 91网站免费视频| 欧美性色aⅴ视频一区日韩精品| 国产高清在线| 成人精品久久一区二区三区| 国产精品久久久久一区二区三区厕所 | 91在线视频精品| 午夜视频一区| 无码人妻一区二区三区精品视频| 午夜不卡在线视频| 久蕉在线视频| 国产在线拍偷自揄拍精品| 中文精品久久| 50一60岁老妇女毛片| 五月天亚洲婷婷| 成人免费在线电影| 亚洲精品欧美一区二区三区| 欧美性久久久| 香蕉视频久久久| 欧美一区二区三区视频在线| 在线观看国产原创自拍视频| 999日本视频| 久久久国产精品一区二区中文| 成人精品999| 欧美日韩一区二区不卡| 50度灰在线| 欧美另类视频在线| 国产自产v一区二区三区c| 国产精久久久久久|