精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開

發布于 2025-4-9 10:23
瀏覽
0收藏

今天凌晨4點,著名大模型訓練平臺Together AI和智能體平臺Agentica,聯合開源了新模型DeepCoder-14B-Preview。


該模型只有140億參數,但在知名代碼測試平臺LiveCodeBench的測試分為60.6%,高于OpenAI的o1模型(59.5%),略低于o3-mini(60.9%)。在Codeforces、AIME2024上的評測數據同樣非常出色,幾乎與o1、o3-mini差不多。


值得一提的是,Together AI不僅開源了DeepCoder-14B模型權重,還把訓練數據集、訓練方法、訓練日志和優化方法全部公開,幫助開發者更深度的了解這個模型所有開發流程。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

開源地址:??https://huggingface.co/agentica-org/DeepCoder-14B-Preview??

github:??https://github.com/agentica-project/rllm??


DeepCoder是在Deepseek-R1-Distilled-Qwen-14B基礎之上,通過分布式強化學習(RL)進行了微調。


在開發過程中,研究人員首先構建了一個高質量訓練數據集,包含24K個可驗證的編程問題:涵蓋TACOVerified 問題、PrimeIntellect 的 SYNTHETIC-1 數據集中的驗證問題等。

為了確保數據質量,通過程序驗證、測試過濾和去重等步驟。程序化驗證,每個問題都會使用外部官方解決方案自動進行驗證。會過濾數據集,只包含官方解決方案通過所有單元測試的問題。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

測試過濾,每個問題必須至少包含5個單元測試。重復數據刪除,刪除了數據集中的重復問題,以避免污染。


在代碼強化學習訓練中,DeepCoder 使用了兩種沙盒來運行單元測試并計算獎勵。

Together Code Interpreter 是一個快速高效的環境,與RL訓練直接兼容,成本低且可擴展性強,能夠支持100多個并發沙盒和每分鐘1000多個沙盒執行。


本地代碼沙盒則是一個獨立的、受保護的 Python子進程,遵循官方 LiveCodeBench倉庫中的相同評估代碼,確保了結果與現有排行榜的一致性。


在獎勵函數設計方面,DeepCoder采用了稀疏結果獎勵模型(ORM),避免分配部分獎勵,從而防止模型通過獎勵黑客行為來獲取不準確的獎勵信號。


獎勵函數簡單而明確:如果生成的代碼通過所有采樣單元測試,則獎勵為 1;否則為 0。這種設計確保了模型能夠專注于生成高質量的代碼,而不是通過記憶測試用例來獲取獎勵。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

為了實現更穩定的訓練過程,DeepCoder的訓練采用了 GRPO+,這是對原始 GRPO 算法的改進版本。


通過消除熵損失和 KL 損失、引入過長過濾和上限裁剪等技術,GRPO+ 使得模型在訓練過程中能夠保持穩定的熵值,避免訓練崩潰,并且能夠更自然地生成較長的輸出,從而提高了模型的推理能力。


此外,DeepCoder-14B-Preview 采用了迭代上下文擴展技術,使模型能夠從較短的上下文長度開始學習,然后逐步泛化到更長的上下文。該模型的上下文窗口從 16K 擴展到 32K,最終在 64K上下文中評估時達到了60.6%的準確率。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

為了加速端到端的RL訓練,DeepCoder 團隊引入并開源了 verl-pipeline,這是 verl 的一個優化擴展。通過一次性流水線技術,DeepCoder 實現了訓練、獎勵計算和采樣的完全流水線化。


同時,獎勵計算與采樣交錯進行,減少了獎勵評估的開銷。這些優化使得訓練時間減少了 2 倍,特別是在需要運行數千個測試用例的編碼任務中,顯著提高了訓練效率。


雖然DeepCoder剛開源但評價非常高,網友表示,這相當令人驚訝。它不僅是真正意義上的開源,而且他們還對廣義信賴域策略優化算法(GRPO)進行了多項改進,并且在訓練過程中為采樣流水線增添了額外的效率提升。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

太厲害了!等不及這款模型在 Ollama 平臺上體驗了。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

圣誕節提前到來了。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

傳奇!開源就應該這樣。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

關于Together AI

Together AI成立于2022年,主打云大模型平臺支持超過200種開源AI模型,包括Llama系列、DeepSeek-R1等,并優化了高速推理和模型訓練的基礎設施。目前擁有超過3.6萬塊GB200 NVL72組成的超大GPU算力群。


此外,Together AI還提供模型微調、Agent智能自動化工作流和合成數據生成等,為大企業提供底層服務。

媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數據集大公開-AI.x社區

前不久,Together AI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。


本文轉自 AIGC開放社區  ,作者:AIGC開放社區


原文鏈接:??https://mp.weixin.qq.com/s/CJLmnlCuq3Wgv308uCYrgg??

收藏
回復
舉報
回復
相關推薦
欧美午夜国产| 久久伊人久久| 国产精品色噜噜| 国产在线精品播放| 久久精品www人人爽人人| 成人午夜大片| 欧美亚洲综合另类| 91传媒免费视频| 黄色美女网站在线观看| 精品一区二区三区蜜桃| 欧美精品18videos性欧| 日本一级免费视频| 999久久久精品一区二区| 色哟哟欧美精品| 2022中文字幕| 午夜在线播放| 91小视频免费观看| 亚洲伊人久久综合| 国语对白做受69按摩| 欧美另类女人| 中文字幕亚洲欧美一区二区三区| 动漫美女无遮挡免费| 欧美极品免费| 午夜精品视频一区| 国内外成人激情免费视频| 韩国福利在线| 99在线视频精品| 亚洲伊人成综合成人网| 中文字幕av免费观看| 9国产精品视频| 欧美成人免费va影院高清| 久久成人激情视频| 欧美一性一交| 精品嫩草影院久久| 欧美性受xxxx黒人xyx性爽| 色香欲www7777综合网| 亚洲国产视频一区| 9l视频自拍9l视频自拍| av大片在线播放| 91免费国产在线观看| 粉嫩高清一区二区三区精品视频| 国产乱码精品一区二区| 蜜臀精品久久久久久蜜臀| 日韩av色综合| 久草视频一区二区| 国产精品毛片一区二区三区| 久久久亚洲影院| 日本一级二级视频| 亚洲欧美综合久久久| 日韩中文字幕在线视频播放| 在线观看亚洲大片短视频| 国产伦精品一区二区三区视频 | 综合久久国产九一剧情麻豆| 日韩电影免费观看在| 欧美色18zzzzxxxxx| 91麻豆蜜桃一区二区三区| 国产一区自拍视频| 手机看片国产1024| 99久久国产免费看| 麻豆av一区二区三区| 青草久久伊人| 久久久久久久久久久99999| 欧美国产综合视频| 黄上黄在线观看| 国产亚洲一区二区三区四区 | 欧美日韩中国免费专区在线看| 丰满少妇大力进入| 欧美aa免费在线| 色综合久久久久| 麻豆三级在线观看| 亚洲一区二区三区久久久| 欧美二区三区91| 女同性αv亚洲女同志| 一区二区三区四区精品视频| 亚洲国产精品系列| 3d动漫精品啪啪一区二区下载| 偷窥自拍亚洲色图精选| 一本大道亚洲视频| 大吊一区二区三区| 国产尤物精品| 日本精品va在线观看| 天天干天天插天天射| 久久99蜜桃精品| 成人黄色片视频网站| 婷婷五月综合激情| 国产精品视频免费| 91成人综合网| 亚洲播播91| 欧美一区二区三区在线| 国产伦精品一区三区精东| 视频一区欧美| 久久综合国产精品台湾中文娱乐网| 久久黄色小视频| 日韩国产高清影视| 91久久国产综合久久蜜月精品| 内射后入在线观看一区| 国产日韩成人精品| 国产精品igao激情视频| 欧美舌奴丨vk视频| 日韩欧美视频在线| 久久亚洲AV无码专区成人国产| 婷婷综合久久| 欧美有码在线观看| 99久久夜色精品国产亚洲| 91在线观看高清| 亚洲精品日韩精品| 国产免费拔擦拔擦8x高清在线人| 欧美日韩亚洲国产综合| 色悠悠在线视频| 日本一区二区在线看| 98精品在线视频| 国产精品视频a| 国产亚洲精品精华液| 日韩成人三级视频| 国产91在线精品| 亚洲国产成人精品久久| 欧美风情第一页| 久久综合九色综合欧美狠狠| 99九九电视剧免费观看| 日本在线视频站| 日韩欧美中文字幕在线播放| 亚洲欧洲日韩综合| 久久中文字幕二区| 国产精品video| 天堂在线观看视频| 一区二区三区中文在线| 中文av一区二区三区| 免费一区二区三区视频导航| 欧美夫妻性生活xx| 一级黄色片在线看| 欧美国产精品专区| 国产熟女高潮视频| 欧美黑人做爰爽爽爽| 久久久久久久国产精品视频| 亚洲图片中文字幕| 中文字幕精品一区| 欧美性猛交久久久乱大交小说 | 欧美下载看逼逼| 国内精彩免费自拍视频在线观看网址| 欧美一区二区三区免费| 国产白丝一区二区三区| 免费成人av资源网| 亚洲精品中文字幕乱码三区不卡| 第84页国产精品| 亚洲精品视频在线观看视频| 成人免费看片98欧美| 国产jk精品白丝av在线观看| 欧美高清不卡| 91久久国产自产拍夜夜嗨| 国产原创精品视频| 正在播放亚洲一区| 动漫性做爰视频| 国产乱人伦精品一区二区在线观看| 亚洲一区二区精品在线| 久久精品超碰| 久久精品国产一区| 国产毛片毛片毛片毛片毛片| 亚洲视频一区二区在线| 亚洲色图欧美自拍| 欧美福利一区| 精品国产免费人成电影在线观...| av影片在线| 国产视频丨精品|在线观看| 五月天激情四射| 日本一区二区三区国色天香| 羞羞的视频在线| 先锋资源久久| 国产传媒一区二区| 欧美男男激情videos| 亚洲乱码国产乱码精品精天堂| 亚洲另类在线观看| 国产精品少妇自拍| 久草福利在线观看| 99精品视频免费| 久久综合网导航| 欧美gayvideo| 国产一区二区色| 成人免费网址| 成人97人人超碰人人99| 欧美国产日韩激情| 丝袜美腿一区二区三区动态图| 日本免费一区二区三区视频观看 | 日日夜夜一区二区| 永久久久久久| 白嫩白嫩国产精品| 欧日韩在线观看| 欧美a免费在线| 欧美大黄免费观看| 99久久久无码国产精品免费蜜柚| 国产精品久线在线观看| 在线观看视频你懂得| 亚洲每日在线| 亚洲精品影院| 大奶在线精品| 国产欧美日韩视频| 超碰在线网站| 中文字幕亚洲专区| 好吊视频一二三区| 欧美视频在线一区二区三区| 久久国产免费观看| 国产精品每日更新| 性囗交免费视频观看| 看国产成人h片视频| 777av视频| 欧美激情欧美| 久久综合色一本| 欧美二区观看| 国产精品视频一区二区三区四| 污污视频在线| 丝袜亚洲欧美日韩综合| 色综合久久网女同蕾丝边| 91精品国产高清一区二区三区| 中文字幕亚洲精品一区| 亚洲欧美日韩中文播放 | 69影院欧美专区视频| 欧美另类极品| 亚洲日本成人网| 好吊视频一区二区三区| 欧美丰满嫩嫩电影| a片在线免费观看| 精品日本高清在线播放| 欧美黄片一区二区三区| 国产精品美女久久久久久| 一区二区三区免费在线观看视频| 国产激情一区二区三区桃花岛亚洲| 国产一级片黄色| 制服诱惑一区二区| 国产精品成人久久电影| 午夜国产精品视频| 艳母动漫在线观看| 99精品网站| 亚洲巨乳在线观看| 精品久久久久久久久久久下田| 国语精品免费视频| 中文字幕一区二区三区日韩精品| 国产在线日韩在线| 国产精品久久久久久吹潮| 国产ts一区二区| 欧美男男tv网站在线播放| 高清欧美性猛交xxxx黑人猛交| 国内精品不卡| 日韩在线观看免费全| √新版天堂资源在线资源| 最近2019年好看中文字幕视频| 国产区av在线| 一区二区三区美女xx视频| 九色视频在线播放| 亚洲深夜福利在线| 国产二区在线播放| 在线国产精品播放| 一区二区三区视频网站| 在线观看国产精品日韩av| 91xxx在线观看| 色黄久久久久久| av毛片在线免费| 欧美福利在线观看| 国产天堂在线播放视频| 国内精品美女av在线播放| 丰乳肥臀在线| 欧美一级视频一区二区| 欧美gay囗交囗交| 国产精品男女猛烈高潮激情| 日韩深夜福利网站| 91免费国产视频| 91嫩草精品| 噜噜噜噜噜久久久久久91| 美日韩中文字幕| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 国产精品二区不卡| 老司机午夜网站| 亚洲久色影视| 亚洲高清在线免费观看| 国内精品伊人久久久久影院对白| 中文字幕在线播放一区二区| 成人黄色在线看| 欧美激情aaa| 亚洲日韩欧美一区二区在线| 免费在线视频观看| 色婷婷久久久综合中文字幕| 国产精品久久久久久免费 | 亚洲精品乱码久久久久久蜜桃图片| 91视频免费看| 爱爱视频免费在线观看| 五月婷婷久久丁香| 伊人网中文字幕| 亚洲电影天堂av| 男人天堂手机在线| 97色在线播放视频| 欧美成人毛片| 久久riav二区三区| 欧美hd在线| 99色精品视频| 国产精品主播直播| 日韩av在线看免费观看| 1区2区3区精品视频| 午夜精品久久久久久久久久久久久蜜桃| 色噜噜夜夜夜综合网| 性欧美18一19性猛交| 国产性猛交xxxx免费看久久| 男女羞羞视频在线观看| 国产精品成人品| 国产一区二区在线视频你懂的| 亚洲国产日韩美| 99热精品在线| 亚洲高清av一区二区三区| 久久精品亚洲乱码伦伦中文| 久久久久久久久久一区二区三区| 欧美天天综合网| 午夜av免费观看| 久久99国产精品自在自在app| 日韩经典一区| 久久99精品久久久久子伦| 女同性一区二区三区人了人一| 欧在线一二三四区| www.亚洲国产| 成年人av电影| 欧美精品一卡两卡| 成人免费在线电影| 81精品国产乱码久久久久久| 视频二区欧美| 综合网五月天| 日韩高清在线观看| 亚洲成人网在线播放| 精品国产户外野外| 丰满人妻一区二区三区免费| 久久精品福利视频| 91精品一区| 一区二区在线观看网站| 免费视频最近日韩| 国产中年熟女高潮大集合| 亚洲成人黄色影院| 性做久久久久久久| 久久大大胆人体| 成人亚洲精品| 91xxx视频| 国产一区二区三区久久久 | 亚洲综合激情在线| 日本不卡一区在线| 国产精品美女视频| 中文字幕在线播放av| 一区二区福利视频| 国产一区二区主播在线| 少妇免费毛片久久久久久久久| 美女尤物久久精品| 精品国产av无码| 色婷婷综合久久久中文一区二区| 欧美日韩在线中文字幕| 国产成人一区二区三区| 精品国产91| 亚洲一级片网站| 亚洲三级理论片| 国产www免费观看| 欧美激情一二三| 欧美一区 二区| 国产成人精品无码播放| 亚洲国产岛国毛片在线| 91片黄在线观看喷潮| 久热精品视频在线观看| 久久伦理中文字幕| 无码人妻精品一区二区蜜桃网站| 国产成人啪免费观看软件| 国产精品16p| 亚洲欧洲一区二区三区在线观看| 欧美电影免费观看高清完整| 色综合久久88色综合天天提莫| 久久99久久精品欧美| 免费在线观看一级片| 亚洲的天堂在线中文字幕| 美女100%一区| 亚洲在线视频一区二区| 丁香六月综合激情| 特黄视频免费看| 日韩在线小视频| av综合网站| 日韩免费高清在线| 日韩毛片在线免费观看| 黄色美女一级片| 国产精欧美一区二区三区| 亚洲h色精品| 粉嫩av懂色av蜜臀av分享| 欧美色图免费看| 丰满诱人av在线播放| 日韩欧美99| 国产99久久精品| 无码人妻丰满熟妇精品区| 中文字幕不卡av| 懂色av一区二区| 亚洲另类第一页| 亚洲成人自拍网| 日本在线观看视频| 久久国产精品高清| 狠狠色丁香婷综合久久| 黄色片视频网站| 久久精品一区中文字幕| 午夜a一级毛片亚洲欧洲| 亚洲综合20p| 色婷婷综合久久久中文一区二区| gogogogo高清视频在线| 日本公妇乱淫免费视频一区三区| 国产一区在线观看麻豆|