精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小紅書hi lab首次開源文本大模型,14個checkpoint覆蓋Pretrain與Instruct階段

人工智能 開源
dots.llm1 是一個大規模的 Mixture of Experts (MoE)語言模型,在總共 1420 億參數中激活 140 億參數,借助精心設計且高效的數據處理流程,dots.llm1 在訓練 11.2T token 高質量數據后,達到了可與 Qwen2.5-72B 相媲美的性能。為促進大模型社區的研究工作,hi lab團隊開源了Pretrain階段每經過1T token的中間訓練檢查點

01、簡介

小紅書hi lab(Humane Intelligence Lab,人文智能實驗室)團隊首次開源文本大模型 dots.llm1。 dots.llm1是一個中等規模的Mixture of Experts (MoE)文本大模型,在較小激活量下取得了不錯的效果。該模型充分融合了團隊在數據處理和模型訓練效率方面的技術積累,并借鑒了社區關于 MoE 的最新開源成果。hi lab團隊開源了所有模型和必要的訓練信息,包括Instruct模型、長文base模型、退火階段前后的多個base模型及超參數等內容,希望能對大模型社區有所貢獻。

模型地址:

https://huggingface.co/rednote-hilab

https://github.com/rednote-hilab/dots.llm1

先來了解下dots.llm1的基本情況:

  • 模型參數:總參數量142B、激活參數14B
  • MoE配置:6in128 Expert、2個共享Expert
  • 預訓練數據:11.2T token高質量數據,顯著優于開源數據
  • 訓練效率:基于Interleaved 1F1B 流水并行的AlltoAll overlap和高效Grouped GEMM的MoE訓練框架

再來看下dots.llm1的模型效果,dots.llm1在預訓練階段一共使用了11.2T 高質量token,然后經過兩階段sft訓練,得到dots.llm1 base模型和instruct模型,在綜合指標上打平Qwen2.5 72B模型,具體指標對照情況如下:

關于dots.llm1開源,hi lab團隊做到了迄今為止行業最大力度:

  • 開源dots.llm1.inst模型,做到開箱即用
  • 開源一系列pretrain base模型,包括預訓練過程中每經過1T tokens后所保存的checkpoint——是目前開源中間checkpoint模型中,首個參數超過千億的大模型
  • 退火兩階段訓練對應的模型checkpoint
  • 長文base模型
  • 詳細介紹了lr schedule和batch size等信息,便于大家做Continue Pretraining和Supervised Fine-tuning

基于Interleave1F1B流水并行的AlltoAll overlap優化已經提交至NVIDIA Megatron-LM社區,會在未來一段時間正式發版。

02、dots.llm1訓練過程

2.1 預訓練數據

數據是文本大模型訓練的核心燃料,dots.llm1所用預數據主要來自Common Crawl和自有Spider抓取得到的web數據。hi lab團隊秉承寧缺毋濫的原則,精心設計了數據處理流程,在保證數據安全、準確以及豐富多樣的基礎上,確保預訓練數據的人工評測和對照實驗結果顯著優于開源數據,也幫助dots.llm1在僅訓練11.2T token的前提下,綜合指標打平Qwen2.5 72B模型,大大減少了算力消耗。

dots.llm1的數據處理流程分為以下三部分:

  • web 文檔準備

對于web HTML數據,先用URL過濾方式刪除黃賭毒等內容,再利用團隊優化后的trafilatura軟件包,提取HTML正文內容,最后進行語種過濾和MD5去重,得到web document。

  • 規則處理

參考RefinedWeb和Gopher的方案進行數據清洗和過濾操作,再采用minhash方法進行document間的去重;為處理document首尾噪聲文本,dots.llm1特別引入了document內的行級別去重策略,具體來說:首先提取每個document的前五行和后5行句子,然后按行計算在整個語料中的出現頻次,僅保留前200次出現的行句子,刪除多余的行句子,經過人工檢查,這些重復次數較多的行句子大都是廣告、導航欄等噪聲文本。

  • 模型處理

基于模型的數據處理由網頁類型模型、語料質量模型、行噪聲刪除模型、語義去重和類別均衡模型等組成。其中語料質量模型和語義去重模型采用行業通用實現方案;網頁類型模型會對web數據的站點屬性進行分類,保留以文本核心的數據,刪除音頻、視頻等非文本網頁以及地圖、公交查詢等工具類網頁文本;行噪聲刪除模型是在行級別去重策略基礎上,通過生成式模型判別的方法,繼續對行級別的長尾噪聲進行document內刪除處理;dots.llm1采用一個包含200個類別的web數據分類模型進行數據均衡和配比,提高知識類內容的比例,降低虛構內容(比如玄幻小說)、結構化內容(比如電商)的數據比例。

為了保障數據安全,hi lab團隊過濾掉包含不安全內容、個人隱私信息(PII)及被安全分類器判定為有害的站點和數據。經過上述處理流程,hi lab團隊得到一份高質量的預訓練數據,并經過人工校驗和實驗驗證,證明該數據質量顯著優于開源Txt360數據。

2.2 訓練效率

在MoE模型訓練中,EP rank之間的A2A通信在端到端時間中占據了相當大比重,對訓練效率影響很大,特別是對于 Fine-grained MoE Model,EP Size 會比較大,跨機通信基本無法避免。hi lab團隊通過讓EP A2A通信盡可能和計算overlap,用計算來掩蓋通信的時間,進而提升訓練效率。具體來說,團隊采用interleaved 1F1B with A2A overlap 方案,通過將穩態的1F1B stage 中第一個micro batch 的fprop提前到warmup stage,即 warmup step + 1,就可以在 interleaved 1F1B實現1F1B穩態階段不同 micro batch 前反向之間的 EP A2A 與計算的overlap。如下圖所示。

同時,hi lab團隊還優化了Grouped GEMM的實現,具體來說,將 M_i(專家i的token段)對齊到一個固定的塊大小。這個固定的塊大小必須是異步warpgroup 級別矩陣乘加(WGMMA,即 wgmma.mma async)指令中 tile 形狀修飾符 mMnNkK 的 M 的整數倍。因此,單個 threadblock 中的所有 warpgroups 都采用統一的tiling,且由該 threadblock 處理的整個 token 段(Mi)必定屬于同一位專家,這使得調度過程與普通 GEMM 操作非常相似。與 NVIDIA Transformer Engine中的 Grouped GEMM API 相比,hi lab團隊的實現方案展現出了顯著優勢。下表展示了在 H800 上前向和反向計算的性能對比,其中 token 被平均路由到各個專家。hi lab提出的方案在前向計算中平均提升了 14.00%,在反向計算中平均提升了 6.68%。

訓練效率部分內容與NVIDIA中國研發團隊合作完成

2.3 MoE模型設計與訓練

dots.llm1是基于Decoder-only Transformer的MoE模型,在架構方面主要參考DeepSeek系列來設計實現,具體參數如下:

dots.llm1采用WSD學習率調度方式,在學習率穩定階段保持3e-4訓練10T token語料,在此期間先后兩次增加batch size,從64M增大至128M,整個訓練過程非常穩定,沒有出現需要回滾的loss spike。在學習率退火階段,分兩個stage訓練1.2T token語料,其中stage1期間模型學習率由3e-4退火降至3e-5,數據方面強化推理和知識類型語料,共訓練1T token,stage2期間模型學習率由3e-5退火降至1e-5,數據方面提升math和code語料占比,共訓練200B token。

2.4 Post-train

在高質量預訓練完成后,dots.llm1通過兩階段監督微調進一步釋放模型潛力。hi lab 團隊精心篩選了約 40 萬條涵蓋多輪對話、知識問答、復雜指令遵循、數學與代碼推理的高質量指令數據。針對多輪對話場景,hi lab 團隊將社區開源的中英對話數據與內部標注的高質量中文指令融合,并采用教師模型優化低質量回答;為了提升知識問答能力,hi lab 團隊引入了包含事實性知識與閱讀理解的數據集;為了使模型更好地遵循復雜指令,hi lab 團隊設計了伴隨條件約束的指令數據,并過濾不遵循約束的回復;而在數學與代碼領域,微調數據則經過規則驗證器與測試樣例驗證,獲取更高質量的監督信號。

微調過程分為兩個階段:首先對全量數據進行2輪基礎訓練,通過過采樣、動態學習率調整、多輪對話拼接等技術,初步釋放模型潛力;隨后聚焦數學與代碼等特別領域,引入拒絕采樣微調(RFT),結合驗證器篩選高置信度重要樣本,進一步提升模型的推理性能。

最終評測顯示,dots.llm1.inst在僅激活 14B 參數的情況下,在中英文通用場景、數學、代碼、對齊任務上的表現亮眼,與Qwen2.5-32B-Instruct、Qwen2.5-72B-Instruct相比具備較強的競爭力;同時與Qwen3-32b相比,在中英文、數學、對齊任務上展現相似或先進性能。

03、總結

dots.llm1是小紅書首次嘗試開源的文本大模型,是一個可供大模型社區使用的中等參數規模下性能較優的MoE模型。期待大家能在dots.llm1基礎上開展各項研究和任務訓練,包括持續訓練(Continue Pretraining)、退火訓練、長文訓練、有監督微調(Supervised Fine-tuning)等;對hi lab團隊來說,dots.llm1只是一個開始,還有很大進步空間,同時希望更多優秀的大模型研究人員能加入小紅書hi lab團隊,與我們共同打造更多更強的全模態大模型!

04、團隊簡介

小紅書 hi lab 團隊(人文智能實驗室,Humane Intelligence Lab)致力于突破人工智能的邊界,通過發展人際智能、空間智能、音樂智能等多元智能形態,不斷拓展人機交互的可能性,愿景是“讓AI成為人類貼心和有益的伙伴”。

責任編輯:龐桂玉 來源: 小紅書技術REDtech
相關推薦

2025-08-07 02:00:00

2025-06-10 05:00:00

2025-08-01 03:00:00

2025-06-25 09:53:59

2025-06-11 14:44:48

AI文本大模型

2024-01-19 12:51:00

AI數據

2025-08-07 16:24:19

小紅書開源dots.vlm1

2025-06-09 09:41:25

2024-10-12 10:57:39

2024-12-05 15:22:19

2025-01-20 15:50:00

AI軟件模型

2025-03-28 09:46:05

AI算法AI人工智能

2024-01-16 12:10:33

模型數據

2025-02-10 08:30:00

2025-08-01 09:03:16

2024-01-12 21:18:22

負樣本大模型蒸餾

2025-11-20 08:35:59

2025-11-18 10:00:56

2024-10-25 14:30:00

模型AI
點贊
收藏

51CTO技術棧公眾號

刘亦菲久久免费一区二区| √天堂中文官网8在线| 666av成人影院在线观看| 久久九九久久九九| 精品少妇一区二区三区日产乱码| 国产免费一区二区视频| 黄色软件在线观看| 国产精品一区二区黑丝| 人妖精品videosex性欧美| 91无套直看片红桃在线观看| aaa国产精品视频| 91极品视觉盛宴| 毛片在线视频观看| 亚洲天堂999| 激情久久中文字幕| 日日骚久久av| 亚洲第九十七页| 国产精品3区| 一本一道综合狠狠老| 国产又粗又大又爽的视频| 蜜桃视频在线观看视频| 国产精品18久久久久久久久| 国产成人在线一区二区| 免费在线视频观看| 99热精品久久| 亚洲天堂网站在线观看视频| 无码人妻aⅴ一区二区三区玉蒲团| 久久野战av| 欧美日韩国产黄| 强开小嫩苞一区二区三区网站| 欧美日韩伦理片| 国产91对白在线观看九色| 国产精品亚洲美女av网站| 麻豆久久久久久久久久| 国产在线成人| 欧美日本在线视频中文字字幕| 久久日免费视频| 中文字幕精品影院| 亚洲精品久久视频| 中文字幕人妻熟女在线| 国产不卡精品| 欧美精品 日韩| 亚洲免费一级视频| 亚洲a∨精品一区二区三区导航| 精品福利在线看| 免费一级特黄毛片| av中文字幕电影在线看| 亚洲曰韩产成在线| 在线观看18视频网站| 免费在线午夜视频| 中文字幕中文字幕在线一区| 色999日韩自偷自拍美女| 四虎永久在线精品免费网址| 国产aⅴ精品一区二区三区色成熟| 亚洲综合中文字幕在线| 久久久久久久伊人| 雨宫琴音一区二区三区| 久久久精品网站| 91视频青青草| 永久91嫩草亚洲精品人人| 米奇精品一区二区三区在线观看| 色老板免费视频| 欧美一区91| 亚洲老司机av| 三上悠亚影音先锋| 国精一区二区| 色婷婷综合久久久久| 欧美h片在线观看| 一区二区三区四区日韩| 欧美日本国产在线| 国产a∨精品一区二区三区仙踪林| 亚洲人体大胆视频| 欧美在线免费视频| 特级西西444www大胆免费看| 日本vs亚洲vs韩国一区三区二区 | 国产欧美日韩精品一区二区免费 | 久久久久久穴| 久久精品视频在线观看| 三级av在线免费观看| 欧美视频成人| 欧美资源在线观看| 91亚洲国产成人精品一区| 国产成人精品综合在线观看| 国产精品初高中精品久久| 中文字幕免费观看| 精品一区二区三区蜜桃| 97精品欧美一区二区三区| 日韩精品一区二区不卡| 久久一综合视频| 国产专区欧美专区| 人妻少妇一区二区三区| 久久精品欧美一区二区三区不卡| 99亚洲精品视频| 免费看男女www网站入口在线| 在线精品观看国产| 成人三级做爰av| 国产成人3p视频免费观看| 另类少妇人与禽zozz0性伦| 好吊操这里只有精品| 青青草视频一区| 国产精品免费一区二区三区四区 | 天天干天天操天天做| 激情国产在线| 欧美日韩亚洲综合一区二区三区 | 在线观看毛片网站| www.一区二区| 97久久精品午夜一区二区| 午夜影院免费体验区| 国产精品国产三级国产三级人妇| 亚洲理论电影在线观看| 成人国产一区二区三区精品麻豆| 日韩精品在线一区| 91无套直看片红桃在线观看| 国产一区二区三区久久久久久久久| 国产精品香蕉av| 日本在线丨区| 亚洲一区二区三区免费视频| 久久久久久久久久久久91| 久久草在线视频| 亚洲精品一区二区三区香蕉| 国产精品国产三级国产专业不 | 久久精品夜色噜噜亚洲a∨| 久久天天东北熟女毛茸茸| 户外露出一区二区三区| 亚洲国产精品中文| 久久久久久福利| 韩国视频一区二区| 性欧美videosex高清少妇| 男人天堂视频在线观看| 精品国产污污免费网站入口| 登山的目的在线| 美女诱惑一区二区| 婷婷四月色综合| 日韩电影免费观看高清完整版| 精品久久久久久综合日本欧美| 小嫩苞一区二区三区| 日本中文字幕不卡| 日本不卡一二三区| 91porn在线观看| 在线视频观看一区| 亚洲av无码一区二区三区人| 亚洲一区二区三区四区五区午夜| 国产精品一 二 三| 91桃色在线观看| 精品成人在线观看| 国产在线观看成人| 国产91丝袜在线观看| 国产 国语对白 露脸| 久久wwww| 欧美激情精品久久久| av网站免费大全| 亚洲精品国产高清久久伦理二区 | 成人妖精视频yjsp地址| 精品国产一区二区三区日日嗨| 污污的网站在线免费观看| 欧美一区二区在线免费观看| 538任你躁在线精品视频网站| 国产在线视频精品一区| 国产女人18毛片| 亚洲视频精选| 午夜精品一区二区三区视频免费看 | 老头老太做爰xxx视频| 日韩国产欧美在线视频| 亚洲国产精品一区二区第一页 | 欧美极品jizzhd欧美| 免费电影日韩网站| 曰本色欧美视频在线| 91高清免费看| 风流少妇一区二区| 波多野结衣乳巨码无在线| 日韩精品欧美大片| 国产精品91一区| av资源网在线观看| 欧美一区二区三区视频免费播放| 无码人妻精品一区二区三区夜夜嗨| 国产福利一区二区三区| 日韩精品视频在线观看视频| 日本中文字幕在线一区| 国产福利成人在线| 大地资源网3页在线观看| 精品国产在天天线2019| 可以免费在线观看的av| 国产精品女上位| 少妇极品熟妇人妻无码| 午夜亚洲福利在线老司机| 先锋影音欧美| 国产ts一区| 久久这里只有精品视频首页| 黄色av免费观看| 色婷婷久久久亚洲一区二区三区| 亚洲精品国产精品乱码在线观看| 国产精品亚洲欧美| 亚洲精品欧洲精品| av不卡一区| 国产精品久久网| 国产盗摄精品一区二区酒店| 欧美一区二区私人影院日本| 日本少妇性高潮| 亚洲欧美综合另类在线卡通| 亚洲一级Av无码毛片久久精品| 日韩精彩视频在线观看| 国产女教师bbwbbwbbw| 亚洲国产最新| 福利视频一区二区三区| 欧美日韩尤物久久| 国内精品免费午夜毛片| 午夜免费福利在线观看| 亚洲国产日韩欧美在线图片| 国产精品视频a| 色偷偷久久一区二区三区| 国产亚洲精品成人| 亚洲欧洲成人自拍| 久久国产柳州莫菁门| 不卡的av网站| 日本少妇激三级做爰在线| 久久综合伊人| 北条麻妃在线视频观看| 欧美1区2区3区| 亚洲精品日韩在线观看| 亚洲系列另类av| 精品久久久久久一区二区里番| 99久久久成人国产精品| 久久精品最新地址| 日本护士...精品国| 精品国产成人系列| 国产高清视频免费观看| 欧美日韩一区二区电影| 国产91国语对白在线| 欧美日韩国产综合视频在线观看中文| 成人观看免费视频| 亚洲丝袜自拍清纯另类| 国产黄色一区二区三区| 日韩激情在线观看| 欧美视频免费播放| 欧美在线综合| www.浪潮av.com| 99国产精品视频免费观看一公开| 麻豆精品传媒视频| 国内视频在线精品| 国产精品久久久久久久小唯西川 | 欧美老年两性高潮| 最近中文字幕在线观看| 在线观看91视频| 伊人久久久久久久久久久久 | 欧美激情一区二区三级高清视频| 国产福利视频在线| 久久综合电影一区| 中文字幕有码在线视频| 欧美精品免费播放| 污污的视频在线观看| 久久久久久午夜| 91探花在线观看| 欧美在线亚洲在线| av激情成人网| 91精品久久久久久综合乱菊| 国产成年精品| 国产免费一区二区| 欧洲亚洲视频| 日本一区二区三区www| 精品无人区麻豆乱码久久久| 日韩免费av电影| 五月婷婷亚洲| 成人免费毛片在线观看| 国产精品老牛| 欧美自拍小视频| 精品一区精品二区高清| 亚洲午夜精品在线观看| 国产91精品露脸国语对白| 色婷婷免费视频| 久久九九久久九九| 青青操在线视频观看| 一区二区三区四区在线播放| 日韩欧美不卡视频| 91久久精品一区二区三| 国产又粗又猛又黄又爽| 日韩视频在线一区二区| 婷婷色在线观看| 夜夜嗨av一区二区三区四区| 免费黄色在线看| 欧美理论片在线观看| 中文字幕在线直播| 国产有码在线一区二区视频| 一区二区三区在线免费看| 欧美成人综合一区| 天堂网在线观看国产精品| 成人免费在线网| 秋霞影院一区二区| 国产精品91av| 欧美激情一二三区| 精品一区二区三区四| 91传媒视频在线播放| av免费观看在线| 亚洲欧美日韩精品久久亚洲区| 欧美69xxx| 欧美在线精品免播放器视频| 国产精品视频首页| 欧美日韩电影一区二区三区| 在线国产一区| 乱子伦视频在线看| 粉嫩嫩av羞羞动漫久久久| 成人免费视频入口| 精品国产91久久久久久老师| 国产又大又黄又爽| 亚洲欧美精品在线| 久久不射影院| 成人综合网网址| 精品国产91久久久久久浪潮蜜月| 天天做天天躁天天躁| 日本成人中文字幕在线视频| fc2成人免费视频| 综合久久久久久| 国产乡下妇女三片| 日韩精品在线影院| 爱情岛论坛亚洲品质自拍视频网站| 国产精品中文字幕久久久| 九色丨蝌蚪丨成人| 国产1区2区3区中文字幕| 免费美女久久99| 老鸭窝一区二区| 午夜影视日本亚洲欧洲精品| 国产精品毛片一区视频播 | 欧美乱熟臀69xxxxxx| 美女欧美视频在线观看免费 | 在线电影av不卡网址| 日韩欧美精品一区二区三区| caoporen国产精品| 亚洲国产精品成人| 天天干天天操天天玩| 国产日本一区二区| 亚洲 欧美 中文字幕| 国产丝袜高跟一区| 女海盗2成人h版中文字幕| 成人91视频| 欧美涩涩网站| 国产大尺度视频| 亚洲线精品一区二区三区八戒| 99国产精品久久久久久久成人| 日韩视频免费在线观看| 国产成人免费精品| 亚洲成人av动漫| 蜜桃av一区二区| 日韩在线不卡av| 欧美精品自拍偷拍| 51xtv成人影院| 亚洲xxxxx性| 欧美天堂亚洲电影院在线观看| 国产精品嫩草影视| 亚洲免费在线电影| www.国产欧美| 亚洲国产精品网站| 9999在线视频| 免费试看一区| 老司机午夜精品视频在线观看| 白丝女仆被免费网站| 色综合久久99| 日本天堂在线观看| 51国产成人精品午夜福中文下载| 欧美黄色免费| 国产激情第一页| 色婷婷综合久久久久中文一区二区| 国产精品毛片一区二区三区四区| 国产精品欧美激情在线播放| 99tv成人| 欧美日韩在线中文| 亚洲国产精品高清| 国产精品久久无码一三区| 九九九久久久久久| 美女网站色精品尤物极品姐弟| 国产成人精品视频免费看| 久久精品人人做人人爽97| 伊人网av在线| 欧美人成在线视频| 欧美调教在线| 91女神在线观看| 亚洲一区二区在线免费观看视频| 天天摸天天干天天操| 国产精品久久国产精品99gif| 久久久久久久久久久9不雅视频| 国产裸体视频网站| 日韩欧美精品中文字幕| 午夜视频在线| 狠狠色噜噜狠狠色综合久| 日韩va亚洲va欧美va久久| 天天综合天天做| 亚洲女成人图区| 精品国产亚洲日本| 国产美女三级视频| 亚洲女同一区二区| 外国精品视频在线观看| 久久免费视频在线观看| 蜜桃一区二区| 中文字幕第六页| 色婷婷综合久久久中文一区二区 | 国产精品91久久久| 欧美特黄一级| 秋霞欧美一区二区三区视频免费 | 91福利视频导航| 久久精品电影| 久久中文字幕在线观看| 日韩在线观看高清|