精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節新推理模型逆襲DeepSeek,200B參數戰勝671B,豆包史詩級加強?

人工智能 新聞
字節Seed團隊聚焦大規模強化學習,并從三個角度提升了推理表現:數據、RL算法和RL基礎設施。

字節最新深度思考模型,在數學、代碼等多項推理任務中超過DeepSeek-R1了?而且參數規模更小。

同樣是MoE架構,字節新模型Seed-Thinking-v1.5有200B總參數和20B激活參數。

對比DeepSeek-R1的671B總參數和37B激活參數,可以算得上輕量級了。

圖片

目前,完整的技術報告已公開發布,其中揭示了諸多秘訣。

字節Seed團隊聚焦大規模強化學習,并從三個角度提升了推理表現:數據、RL算法和RL基礎設施。

圖片

可驗證與不可驗證問題

從數據開始說起,字節團隊把RL訓練數據分為兩個部分,具有明確答案的可驗證問題和沒有明確答案的不可驗證問題,采用不同的獎勵建模方法。

這其中,模型的推理能力主要來自可驗證問題,并可以推廣到不可驗證問題。

可驗證問題包括問題與答案配對的STEM問題、附帶單元測試的代碼問題,以及適合自動驗證的邏輯推理問題(24點、迷宮、數獨等)。

不可驗證問題主要包括根據人類偏好評估的非推理任務,如創意寫作、翻譯、知識QA、角色扮演等。

對于不可驗證問題,字節團隊丟棄了樣本分數方差低、難度低的數據。此類數據可能過于簡單或已在數據集中大量表示。離線實驗表明,過度優化此類樣本會導致模型的探索空間過早崩潰并降低性能。

此外,團隊還打造了全新數學推理評測集BeyondAIME。

當前的推理模型通常使用AIME作為評估數學推理能力的首選基準,但該基準每年只發布30個問題,有限的規模可能會導致高方差的評估結果,難以有效區分最先進的推理模型。

字節與數學專家合作,根據既定的比賽形式開發原創問題。通過結構修改和情景重新配置來系統地調整現有的比賽問題,確保不會發生直接重復。此外還確保答案不是容易猜的數值(例如問題陳述中明確提到的數字),以減少模型在沒有適當推理的情況下猜出正確答案的機會。

RL算法

強化學習雖然強大,但訓練起來也很不穩定,經常崩潰。

字節在技術報告中提到”有時,兩次運行之間的分數差異可能高達10分”。

針對這個問題,團隊提出了VAPO和DAPO兩個RL框架,分別從基于價值和無價值的RL范式出發來穩定訓練。

圖片

VAPO和DAPO兩篇論文都已單獨發布。

圖片

圖片

此外,在Seed-Thining-v1.5中,還借鑒了之前學術界工作中的很多關鍵技術:

  • 價值預訓練(Value-Pretraining),保證價值網絡和策略網絡一致
  • 解耦的GAE(Decoupled-GAE),讓兩個網絡更獨立高效
  • 長度自適應GAE(Length-adaptive GAE),更好處理不同長度序列
  • 解耦PPO損失(Clip-Higher),為低概率token的增長創造,了更多空間鼓勵模型探索新方案
  • Token級損失(Token-level Loss),平衡每個token對訓練過程的影響。
  • 正例增強(Postive Example LM Loss),提高RL訓練過程中正樣本的利用效率,從而提高模型整體性能

圖片

RL基礎設施

在Long-CoT生成過程中,字節團隊觀察到各種提示詞之間的響應長度差異較大,在生成過程中出現大量GPU空閑時間。

為了緩解長尾響應生成的滯后問題,提出了SRS(流式Rollout系統),一種資源感知型調度框架,可戰略性地部署獨立的流式計算單元,將系統約束從內存綁定轉換為計算綁定。

為了有效地大規模訓練,團隊還設計了一個混合分布式訓練框架,集成高級并行策略、動態工作負載平衡和內存優化:

  • 并行機制:將TP (張量并行)/EP (專家并行)/CP (上下文并行)與全分片數據并行 (FSDP) 組合在一起,具體來說,將TP/CP 應用于注意力層,將EP應用于 MoE 層。
  • 序列長度平衡:DP等級之間的有效序列長度可能不平衡,導致計算工作量不平衡和訓練效率低下。利用KARP算法在一個mini-batch內重新排列輸入序列,使它們在micro-batch之間保持平衡。
  • 內存優化:采用逐層重新計算、激活卸載和優化器卸載來支持更大micro-batch的訓練,以覆蓋FSDP引起的通信開銷。
  • 自動并行:為了實現最佳系統性能,開發了AutoTuner 自動調整系統,按照基于配置文件的解決方案 對內存使用情況進行建模。然后估計各種配置的性能和內存使用情況以獲得最優配置。
  • 檢查點:使用ByteCheckpoint支持從不同的分布式配置中以最小的開銷恢復檢查點,彈性訓練以提高集群效率。

圖片

最終,在多項自動評估中,Seed-Thinking-v1.5在AIME 2024基準測試中取得86.7,與OpenAI的o3-mini-high模型的性能相當。但在最近的AIME 2025和BeyondAIME中,Seed-Thinking-v1.5仍然落后于o3級別的性能。

對于GPQA任務,Seed-Thinking-v1.5達到77.3%的準確率,接近o3-mini-high的性能。

在Codeforces等代碼生成場景中,Seed-Thinking-v1.5的性能與Gemini 2.5 Pro 的性能相當,但仍落后于o3-mini-high。

Seed-Thinking-v1.5在SimpleQA上的表現不太理想。但團隊認為,該基準測試預訓練模型規模的相關性更強,而不是考驗推理能力。

圖片

許多人看完這篇技術報告,都很感興趣,不過找了一圈也沒找到模型在哪發布。

圖片

從技術報告的口徑來看,該模型與目前豆包中的Doubao-1.5 Pro并不是一回事。

但從作者名單看,這是由字節Seed團隊負責人吳永輝帶隊,主要成員都參與的大項目。

那么是否將來會部署到豆包APP,可以期待一波了。

圖片

論文地址:
https://github.com/ByteDance-Seed/Seed-Thinking-v1.5/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-11 12:04:58

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-06-17 08:45:00

模型智能工具

2025-03-07 08:30:00

2025-05-01 10:33:59

2025-03-06 08:11:25

2025-04-03 06:30:00

2025-09-02 10:20:10

2025-03-27 10:28:32

2025-04-03 15:57:48

2025-07-18 09:55:11

2025-08-04 08:51:00

2025-07-18 10:12:00

2025-04-11 14:54:44

2025-03-06 12:43:03

DeepSeek阿里推理模型

2025-08-25 09:03:00

2025-06-25 08:54:03

模型訓練AI
點贊
收藏

51CTO技術棧公眾號

亚洲精品欧美日韩专区| 欧美日韩加勒比精品一区| 国产精品午夜视频| 好吊色视频在线观看| 牛牛精品成人免费视频| 欧美少妇性性性| 激情成人开心网| 欧美日韩国产亚洲沙发| 精品一二三四区| 国内精品在线一区| 亚洲一级二级片| 亚洲va久久| 91精品国产综合久久久久久久| 国产一区二区四区| 亚乱亚乱亚洲乱妇| 96av麻豆蜜桃一区二区| 91在线观看免费观看 | 欧美日韩ab片| 亚洲电影网站| www.com欧美| 日韩精品乱码av一区二区| 中文字幕在线成人| 国产精品无码永久免费不卡| 国产a亚洲精品| 美女91精品| 欧美成人一区二区三区| 日韩av在线综合| 高h视频在线播放| 中文字幕一区二区三区色视频| 久久99精品久久久久久三级| 国产成人免费看一级大黄| 午夜久久中文| 成人一区二区视频| 国产综合色香蕉精品| 国产精品久久久免费视频| 亚洲中无吗在线| 中文字幕自拍vr一区二区三区| 极品人妻一区二区三区| 国内精品麻豆美女在线播放视频| 欧美精品一级二级| 少妇一级淫免费播放| 桃色一区二区| 色综合天天综合狠狠| 青青青在线视频播放| jizzjizz亚洲| 亚洲免费色视频| 久久久无码中文字幕久...| 91香蕉嫩草影院入口| 久草视频手机在线观看| 亚洲第一偷拍| 美女性感视频久久久| 亚洲欧美卡通动漫| 999精品色在线播放| 爽爽爽爽爽爽爽成人免费观看| 人妻少妇一区二区| 精品成人影院| 中文字幕在线看视频国产欧美在线看完整 | 免费看一级一片| 国内一区二区三区| 国内免费久久久久久久久久久| 日韩黄色精品视频| 校园激情久久| 国产精品视频1区| 国产孕妇孕交大片孕| 狠狠色丁香婷综合久久| 亚洲综合大片69999| 另类的小说在线视频另类成人小视频在线 | 日韩视频免费播放| 1区2区在线| 欧美性xxxxx极品娇小| 日本精品一区二区三区四区| 桃花岛成人影院| 在线播放欧美女士性生活| 亚欧精品在线视频| 超碰一区二区三区| 亚洲欧美一区二区三区四区 | 国产一区二区三区四区二区| 在线观看欧美日韩| 91麻豆精品成人一区二区| 欧美激情视频一区二区三区在线播放 | 欧美一区二区高清在线观看| 成人不用播放器| 自拍偷拍亚洲欧美日韩| 精品无码国产一区二区三区av| 免费v片在线观看| 欧美性猛交xxxx乱大交退制版| 亚洲无在线观看| 岛国精品一区| 色av吧综合网| 日韩精品视频播放| 久草精品在线观看| 精品无人区一区二区三区竹菊 | 国产精品嫩草影院com| 日本精品免费视频| 亚洲少妇视频| 91精品欧美综合在线观看最新| 熟妇高潮一区二区| 欧美色蜜桃97| 97超级碰碰碰久久久| 中文字幕二区三区| 成人av片在线观看| 一区二区三区的久久的视频| xxx在线免费观看| 欧美性色黄大片| 欧美亚一区二区三区| 欧美阿v一级看视频| 国产aaa精品| 老牛影视av牛牛影视av| 国产精品九色蝌蚪自拍| 国内性生活视频| 亚洲网址在线观看| 精品国产拍在线观看| 亚洲AV无码成人精品区东京热| 国产乱国产乱300精品| 欧美日韩国产精品一卡| 国产深夜视频在线观看| 欧美日韩aaaaa| 人妻视频一区二区| 亚洲一区日韩| 国产精品麻豆免费版| 久草资源在线| 欧美在线视频日韩| 欧美色图亚洲激情| 日韩视频一区二区三区在线播放免费观看| 91久久久国产精品| 日韩免费啪啪| 欧美色精品在线视频| 三级电影在线看| 亚洲mm色国产网站| 波多野结衣人妻| 99视频一区二区三区| 中文字幕免费高| 福利精品一区| 国产亚洲一区二区精品| 欧美日韩一二三四区| 北条麻妃国产九九精品视频| 国产女教师bbwbbwbbw| 伊人久久精品| 久久久精品国产亚洲| 中文字幕在线网站| 久久久精品影视| 国产日韩一区二区在线观看| 秋霞蜜臀av久久电影网免费| 欧美国产日本高清在线| 国产黄色一区二区| 成人欧美大片| 这里只有精品视频在线观看| 18啪啪污污免费网站| 免费一级片91| 一级特黄录像免费播放全99| 免费视频观看成人| 日韩在线观看成人| 91一区二区视频| 亚洲人亚洲人成电影网站色| 老女人性生活视频| 伊人精品视频| 精品一区二区国产| 日韩免费va| 中文字幕日韩在线观看| 亚洲图片小说视频| 亚洲视频一区二区在线观看| 黄色一级片免费播放| 欧美久久成人| 久久爱av电影| 成人在线黄色| 欧美成人一二三| 天天操天天操天天干| 日本高清视频一区二区| 999精品久久久| 国产高清成人在线| 免费看的黄色大片| 欧美中文一区二区| 亚洲综合大片69999| 国产精选在线| 这里只有精品在线播放| 国产乱人乱偷精品视频a人人澡| 一区二区三区久久| 亚洲第一香蕉网| 国产真实精品久久二三区| 男的插女的下面视频| 国产成人精品999在线观看| 91色在线观看| 综合久久2023| 免费97视频在线精品国自产拍| 少妇一级淫片免费看| 欧美吻胸吃奶大尺度电影| 亚洲成人生活片| 91丨国产丨九色丨pron| 亚洲精品成人在线播放| 亚洲久久一区二区| 亚洲第一综合| 人人精品视频| 亚洲一区美女视频在线观看免费| 黄色在线观看www| 久久久国产精品一区| 欧美色视频免费| 日韩视频在线你懂得| 欧美精品v日韩精品v国产精品| 一级欧美视频| 日本成人免费在线| 欧洲在线视频| 日韩亚洲在线观看| 蜜芽tv福利在线视频| 欧美一区二区性放荡片| 无码人妻久久一区二区三区不卡| 一区二区三区精品在线| 超碰97av在线| 91视频在线看| 丰满少妇一区二区三区专区 | 国产精品传媒入口麻豆| 亚洲av无码一区二区三区观看| 狠狠色丁香久久婷婷综合_中 | 亚洲欧美制服第一页| 亚洲av无码乱码国产精品| 欧美三级三级三级| www.久久精品视频| 红桃av永久久久| 妺妺窝人体色www聚色窝仙踪| 国产精品久久久久影院亚瑟| 四虎永久免费影院| 成人avav影音| 一级黄色大片免费看| 999精品色在线播放| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 国产成人综合精品三级| 亚洲 激情 在线| 久久一二三四| 日本网站免费在线观看| 激情综合电影网| 天堂а√在线中文在线| 99精品视频在线观看免费播放| 欧洲亚洲一区二区| 西野翔中文久久精品国产| 国产欧美一区二区三区另类精品 | 免看一级a毛片一片成人不卡| 国产精品剧情在线亚洲| 久久久久99精品成人| 欧美激情综合在线| 亚洲日本精品视频| 国产午夜精品在线观看| 性高潮久久久久久久| 久久久久久久久久久99999| a天堂视频在线观看| 99久久综合色| 日本一区二区三区网站| 91蝌蚪porny九色| 中文字幕在线看高清电影| 久久久久久9999| av手机在线播放| 久久久亚洲综合| 久久久久久久毛片| 国产精品久久久久久久久果冻传媒 | 中文字幕在线网站| 91精品国产综合久久国产大片 | 国产一区二区三区黄视频| 捷克做爰xxxⅹ性视频| 国产一区 二区 三区一级| 奇米777在线视频| 成人午夜免费av| 日韩精品卡通动漫网站| 日本一区二区三区久久久久久久久不| 久久精品三级视频| ㊣最新国产の精品bt伙计久久| 午夜精品福利在线视频| 亚洲国产精品久久人人爱蜜臀 | 丝袜脚交一区二区| 超碰超碰在线观看| 国产成人8x视频一区二区| 亚洲国产精品狼友在线观看| 99riav久久精品riav| 欧美熟妇激情一区二区三区| 国产精品国产三级国产普通话99 | 永久免费成人代码| 亚洲私人黄色宅男| 日本系列第一页| 在线免费亚洲电影| 精品毛片一区二区三区| 亚洲精品福利视频| 在线视频婷婷| 欧美精品第一页在线播放| 成年美女黄网站色大片不卡| 国产啪精品视频| 欧美a级网站| 亚洲在线不卡| 亚洲精品偷拍| 黄色一级片免费的| 99久久精品国产导航| 日本激情视频一区二区三区| 亚洲国产精品久久不卡毛片 | 欧美成人性战久久| 伦理片一区二区三区| 欧美猛少妇色xxxxx| 香蕉久久免费电影| 成人动漫视频在线观看完整版 | 一区二区三区视频播放| 日本一区免费| 在线国产日韩| 欧洲在线免费视频| 久久久国际精品| 国产精品19乱码一区二区三区| 欧美在线免费播放| 日日夜夜精品免费| 久久久精品一区| av免费在线一区| 久久精品中文字幕一区二区三区 | 亚洲精品美国一| 成人av网站在线播放| 亚洲国产小视频在线观看| 免费观看久久久久| 国产99久久久欧美黑人 | 日本国产亚洲| 欧美日韩另类综合| 亚洲人成在线影院| 4438x全国最大成人| 国产精品国产三级国产有无不卡| 国产寡妇亲子伦一区二区三区四区| 日韩精品一区二区三区中文精品| 无遮挡的视频在线观看| 日产日韩在线亚洲欧美| 狠狠久久伊人| 国产精品久久久久9999爆乳| 精品一区二区三区免费| 毛片aaaaaa| 色av成人天堂桃色av| 手机福利在线| 97涩涩爰在线观看亚洲| 亚洲乱码一区| 国产资源第一页| 国内精品国产三级国产a久久| 91激情视频在线观看| 色婷婷激情综合| 久久久久久青草| 日韩av电影在线播放| 妖精视频一区二区三区| 欧美在线观看成人| 91在线国内视频| 69视频免费在线观看| 精品五月天久久| 波多视频一区| 日本一区二区在线| 视频在线观看91| 少妇一级黄色片| 欧美日本在线看| 超碰个人在线| 91在线视频九色| 欧美一区免费| 香蕉久久久久久av成人| 亚洲综合精品自拍| 天堂网在线观看视频| 欧美在线国产精品| 久久av综合| 亚洲一级片网站| 亚洲欧美韩国综合色| 亚洲女人18毛片水真多| 性色av一区二区三区在线观看| 狼人精品一区二区三区在线| 国产深夜男女无套内射| 91色porny在线视频| 在线免费观看av网址| 久久精品一区中文字幕| 亚洲专区**| 国产中文字幕在线免费观看| 久久久久成人黄色影片| 国产一区二区在线不卡| 欧美丰满少妇xxxx| 丝袜连裤袜欧美激情日韩| 国产熟人av一二三区| 亚洲欧洲国产日本综合| 亚洲第一色视频| 欧洲亚洲免费在线| 99久久99久久精品国产片桃花| 亚洲热在线视频| 激情成人在线视频| 97电影在线看视频| 超碰97在线人人| 视频在线观看91| 欧美极品视频在线观看| 日韩av在线免播放器| 欧美黑粗硬大| 777av视频| 最新国产成人在线观看| 欧美特级特黄aaaaaa在线看| 国产精品电影观看| 亚洲一级二级| 刘亦菲国产毛片bd| 精品国产免费视频| 欧美成人福利| 波多野结衣综合网| 亚洲欧洲日产国码二区| 少妇一级淫片免费看| 成人高清视频观看www| 夜久久久久久| 91嫩草丨国产丨精品| 亚洲欧洲日韩国产| 一级毛片精品毛片| a在线观看免费视频| 婷婷亚洲久悠悠色悠在线播放| 色视频在线免费观看| 久久精品午夜一区二区福利| 国产精品一二三|