精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!

發布于 2025-9-24 07:07
瀏覽
0收藏

昨天刷到美團龍貓又開源新模型了,LongCat-Flash-Thinking,這次是思考模型。

8月底,美團先開了LongCat模型,我也是第一時間評測了!

這次LongCat-Flash-Thinking的技術報告依舊干貨滿滿,很多有意思的東西,就比如各領域數據分開進行RL,然后融合,我之前只看到在SFT上會這么做,沒想到RL也行~

咱們依舊老規矩先看細節,再評測。

LongCat-Flash-Thinking,也是MoE模型,模型結構跟LongCat一樣,依舊是零計算專家等等,相關介紹看我上一篇。

核心區別在于訓練方式不同,訓練涉及兩個階段,長CoT冷啟動訓練和強化學習,訓練流程如下圖所示:

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

先看冷啟動部分,包括Mid-training和SFT,核心是高質量數據構建,Mid-training階段(也可以叫做增量預訓練)采用課程學習的思想,將通用數據加入 STEM (競賽難度)和 Code (編程競賽) 數據,在不削弱模型通用基礎能力的前提下,建立較高地推理能力起點。

SFT階段主要涉及三個部分數據,通用推理數據,包括STEM、Code、邏輯和問答,Prompt過濾,用LLM初篩過濾不完整、無法回答或質量過低的Query,而對于Code,需具備清晰描述、不少于5組單元測試、有可執行評測腳本;同時,按照題目通過率,丟棄太過簡單地題目,按難度分布采用構建Prompt數據集。

回答構建,采用拒絕采樣用LongCat-Chat為每題生成多個候選回答,結合規則與模型評判選出最高質量響應作為訓練數據。

形式推理數據,(形式推理就是以機器可驗證的格式進行推理,例如,Lean4形式語言,前段時間DeepSeek-Prover模型就是干這個的),利用8B模型將自然語言題目轉換為Lean4形式,再用語法和語義進行雙重過濾,證明過程合成時采用迭代合成,不斷將驗證成功的數據,添加到訓練數據中,最后形成陳述-思考-證明數據集。

Agent推理數據,采用雙路徑評估選擇需要使用工具的Query,然后在MCP工具服務器上對Query生成多個候選路徑,利用多模型評估正確性、邏輯一致性、工具完整性,通過的數據保留。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

整體SFT數據比例,STEM-35%,Code-20%,General QA-20%,Agent-14%,Proving-8%,Logic-3%。

RL部分真是做了好多工程上優化,再次感嘆,美團在infra上的實力,我是真沒想到~

為了提高RL的訓練效率,美團提出了DORA(Dynamic ORchestration for Asynchronous rollout)異步彈性共卡系統系統,利用多個舊版本 Actor 模型進行流式 rollout,避免最長樣本阻塞,可以采樣一致性,支持中斷樣本 KV-cache 復用,同時通過彈性共卡調度(elastic colocation)并行化生成與訓練,實現接近零氣泡的設備利用率。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

DORA 采用分離式架構,將加速器集群劃分為兩類:

  • 獨立組:僅承擔生成角色,為 Actor 模型的推理副本
  • 彈性組:可按需動態切換為Reference & Actor,Reward & Critic 等角色,實現資源彈性

RL的目標為GRPO,不過移除了 GRPO 中的 KL 懲罰項,避免 biased 梯度并允許大更新,同時采用 Token 級損失,緩解長樣本偏差;還引入三重裁剪,防止稀疏 MoE 下重要性權重爆炸。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

最有意思的就是在RL階段,多領域并行訓練,再融合的策略,不過我在SFT階段用過,當時是做多領域訓練,但RL也能用嗎?

美團這波用了是有效果的,融合后的模型,相較于單一模型,在不同場景下均有提高,緩解了混合訓練時,不同領域數據之間的干擾。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

融合策略采用了Normalization、Dropout、Erase,感興趣的同學自己去看吧,最好去看引用的原論文。

榜單效果如下,在coding、工具使用、形式化推理證明要更好一些!

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

報告里內容挺多的,加上上次LongCat的論文內容,infra真是拉滿~

還有個有意思的點,就是LongCat的回答模板,跟其他的不太一樣,多輪情況下,要記錄輪數,不知道這點出于什么考慮!

SYSTEM:{system_prompt} [Round 0] USER:{query} /think_on ASSISTANT:{response}</longcat_s>... [Round N-1] USER:{query} /think_on ASSISTANT:{response}</longcat_s> [Round N] USER:{query} /think_on ASSISTANT:

下面開始實測,沒有卡部署的同學,就官網體驗就行,點“深度思考”就是think模型了,要不然就是chat模型。

??https://longcat.ai/??

懶人速度版:

  • 快,很快,超級快,你用了你就知道有多快,
  • 整體上相比于chat模型是有一定提高的,
  • 指令遵循效果不錯,能理解隱含的意圖信息,
  • 回答整體要比Chat短,這個是一個很有意思的現象,有時候即使加上think部分,長度也沒chat時長,代碼、數學除外
  • 跟榜單展示結果差不多,但是代碼這里有時候代碼在think里,回答結果就會省略部分內容,
  • agent我沒真實場景測試,寫了幾個假的工具,理解的還不錯,后面調一下api試試看
  • 模型內置code interpreter

常規測試

Promtp:將“I love LongCat”這句話的所有內容反過來寫

結果:回答正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

知識理解

Prompt:如何理解“但丁真不會說中國話,但丁真會說中國話”

結果:回答正確,理解了但丁和丁真是兩個人,之前Chat模型是不對的,通過回答看得出模型會判斷調不調工具

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

角色扮演&創作

Prompt:用甄嬛體吐槽地鐵早高峰

結果:味兒還行

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:幫小學生寫一篇“我最討厭的動物”作文,不能是貓狗

結果:文筆很小學生,字數350字,相比于chat模型,理解了隱含意圖~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

弱智吧

Prompt:生蠔煮熟了叫什么?

結果:正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:用水來兌水,得到的是濃水還是稀水

結果:正確。

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

依舊小紅,依舊老鷹

Prompt:小紅有2個兄弟,3個姐妹,那么小紅的兄弟有幾個姐妹

結果:回答正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:未來的某天,李同學在實驗室制作超導磁懸浮材料時,意外發現實驗室的老鼠在空中飛,分析發現,是因為老鼠不小心吃了磁懸浮材料。第二天,李同學又發現實驗室的蛇也在空中飛,分析發現,是因為蛇吃了老鼠。第三天,李同學又發現實驗室的老鷹也在空中飛,你認為其原因是

結果:回答錯誤,判斷老鷹本來就會飛的模型很少~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

數學

Prompt:一個長五點五米的竹竿,能否穿過一扇高四米,寬三米的門?請考慮立體幾何

結果:回答正確

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:大數計算,178939247893 * 299281748617等于多少?

結果:回答正確,我發現它內置了python工具,用代碼執行,算是取巧了~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

Prompt:2025年高考全國一卷數學試題

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

結果:前兩問對了,最后一問錯了

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

代碼

Prompt:可愛風格五子棋游戲界面,畫面有兩個模式按鈕“人人對戰”和“人機對戰”,界面整體采用馬卡龍色調,棋盤簡潔清晰,棋子設計成卡通小動物(如貓咪和小熊),背景帶有輕微漸變和星星點綴,界面邊緣圓潤,按鈕Q萌,整體風格溫馨可愛,適合兒童或休閑玩家使用,2D插畫風,用html呈現

結果:整體風格不錯,但是人機還是有點呆~

美團龍貓再開源LongCat-Flash-Thinking模型,細節滿滿!-AI.x社區

最后想說,我真沒想到,都2025年了,大模型賽道還能殺出個美團來,有點不鳴則已,一鳴驚人的感覺,期待LongCat持續更新,來點小尺寸模型是最好的,

雖然你很快,但是我真沒有8張H100部署。

本文轉載自??NLP工作站??,作者:NLP工作站

已于2025-9-24 10:26:40修改
收藏
回復
舉報
回復
相關推薦
中文字幕一区图| 久草免费在线| 日韩高清在线电影| 色吧影院999| 久久综合桃花网| 91色在线看| 欧美激情中文不卡| 97国产超碰| 日韩人妻精品中文字幕| 日韩av有码| 欧美va天堂va视频va在线| 亚洲精品无码久久久久久| jizzjizz在线观看| 丁香激情综合国产| 国产成人在线一区| 青青草国产在线观看| 一区三区在线欧| 日韩一区二区精品在线观看| 91产国在线观看动作片喷水| 欧美做受xxxxxⅹ性视频| 日本免费在线一区| 欧美日韩国产一区在线| 99re6这里有精品热视频| 国家队第一季免费高清在线观看| 极品尤物久久久av免费看| 欧美三级韩国三级日本三斤| 日本免费a视频| 国产按摩一区二区三区| 日韩中文字幕一区二区三区| 九九热精品视频| 国产毛片欧美毛片久久久| 高清日韩欧美| 日韩一区二区电影在线| 国产区二区三区| 在线能看的av网址| 亚洲一区二区av在线| 亚洲午夜久久久影院伊人| 日韩porn| av一区二区久久| 亚洲最大成人网色| 亚洲一区二区三区网站| 午夜精品一区二区三区国产| 日韩av中文字幕在线| 亚洲妇女无套内射精| 欧美v亚洲v综合v国产v仙踪林| 婷婷丁香久久五月婷婷| 污污污污污污www网站免费| av电影在线观看| 久久免费视频色| 久久国产精品久久| 免费a级片在线观看| 国产米奇在线777精品观看| 国产在线播放91| 亚洲天堂自拍偷拍| 免费成人美女在线观看.| 国产成人精品电影| 福利网址在线观看| 久久午夜av| 国产精品va在线播放| 成人免费毛片视频| 天堂蜜桃一区二区三区| 欧美在线精品免播放器视频| 国产精品美女高潮无套| 欧美亚视频在线中文字幕免费| 欧美成人免费网站| 肉丝美足丝袜一区二区三区四| 国产精品亚洲欧美日韩一区在线| 555www色欧美视频| 波多野结衣乳巨码无在线| 国产丝袜在线播放| 香蕉乱码成人久久天堂爱免费| 六月婷婷激情综合| 欧美24videosex性欧美| 亚洲成年人影院| 国产资源在线视频| 国模套图日韩精品一区二区| 欧美亚一区二区| 亚洲欧美自偷自拍另类| 日韩黄色三级| 日韩欧美一级在线播放| 日韩一级在线免费观看| 国产亚洲一区二区手机在线观看| 欧美亚洲综合另类| 超碰中文字幕在线观看| 日本免费一区二区三区视频| 欧美精品一区二区三区高清aⅴ| a天堂视频在线观看| 黄色成人在线视频| 69av一区二区三区| 亚洲成人精品在线播放| 亚洲老女人视频免费| 在线成人激情视频| 少妇久久久久久被弄高潮| 亚洲激情不卡| 国产精品91久久久久久| 国产精品亚洲lv粉色| 成人av在线资源网| 日韩国产一区久久| 99在线播放| 国产精品久久久久桃色tv| 黄色一级片av| 欧美大片1688| 91精品久久久久久蜜臀| 日本xxxx裸体xxxx| 91麻豆精品国产91久久久平台 | 亚洲综合婷婷久久| 成人另类视频| www.亚洲免费视频| 成人精品在线看| 狠狠色丁香久久婷婷综合丁香| 国产美女精品久久久| 国产露脸国语对白在线| jiyouzz国产精品久久| 亚洲免费在线精品一区| 51av在线| 日韩一区二区三区三四区视频在线观看 | 欧美在线综合视频| 亚洲色图欧美另类| 日韩精品首页| 欧美野外猛男的大粗鳮| 精品欧美在线观看| 亚洲国产高清在线观看视频| 久久久久一区二区| а√中文在线8| 18欧美乱大交hd1984| 欧美精品99久久| 警花av一区二区三区| 欧美日本在线播放| 欧美一级特黄aaa| 日韩深夜影院| 欧美国产亚洲精品久久久8v| 国产福利久久久| 美女在线观看视频一区二区| 蜜桃视频在线观看91| 牛牛影视精品影视| 亚洲丶国产丶欧美一区二区三区| 亚洲天堂2018av| 国产日产一区| 日韩美女视频免费看| 亚州男人的天堂| 亚洲一区中文日韩| 99久久久无码国产精品性波多| 久久精品高清| 国产精品一区二区三区久久久| 欧美日韩免费做爰大片| 激情成人在线视频| 久久人妻少妇嫩草av无码专区| 欧美日韩亚洲国产精品| 95av在线视频| caopon在线免费视频| 欧美日韩美少妇| 老司机精品免费视频| 青青草国产成人99久久| 午夜精品福利一区二区| 性欧美freehd18| 在线看国产精品| 中文字幕第2页| 国产成人一区二区精品非洲| 国产成年人在线观看| 国产日韩在线观看视频| 九九久久综合网站| 欧美 日韩 国产 成人 在线 91| 樱花草国产18久久久久| 永久看看免费大片| 在线精品在线| 精品伊人久久大线蕉色首页| 欧美激情护士| 51精品久久久久久久蜜臀| 可以免费看av的网址| 国产综合一区二区| 日本一级黄视频| 哺乳挤奶一区二区三区免费看| 性色av一区二区咪爱| 日韩av资源| 欧美性淫爽ww久久久久无| 一级片黄色录像| 国产在线观看一区二区| av片在线免费| 国产在线观看91一区二区三区| 国产精品黄色av| 国产美女av在线| 亚洲国语精品自产拍在线观看| 国产精品va无码一区二区三区| 国产午夜亚洲精品理论片色戒| 亚欧激情乱码久久久久久久久| 欧美在线高清| 蜜桃av色综合| 日本亚洲欧洲无免费码在线| 久久久欧美精品| 国产人成在线视频| 91精品国产欧美一区二区成人| 日韩美女视频网站| 国产精品伦理在线| 亚洲av无码一区东京热久久| 日韩福利视频导航| 菠萝蜜视频在线观看入口| 一区二区三区四区在线看| 91精品久久久久久久久久| 91超碰在线播放| 色偷偷9999www| 天天操天天干天天干| 欧美日韩在线不卡| 日韩免费视频网站| 中文字幕一区二区三区色视频| 丰满少妇xbxb毛片日本| 免费看黄色91| 三上悠亚久久精品| 四季av一区二区凹凸精品| 精品国产综合久久| 久久免费福利| 国产精品久久久久高潮| 丁香花电影在线观看完整版| 一区二区三区黄色| 人妻无码中文字幕| 91精品国产综合久久久久久| 亚洲综合久久网| 亚洲成av人片在www色猫咪| 国产传媒视频在线| 91一区二区三区在线观看| 91视频福利网| 麻豆视频一区二区| 中文字幕久久一区| 视频精品在线观看| 国产伦精品一区二区三区四区免费 | 日本超碰一区二区| 国产在线久久久| 色婷婷综合久久久中字幕精品久久| 欧美国产日本高清在线 | 久久久久久麻豆| 国产一卡二卡三卡四卡| 国产在线不卡一区| 五月天激情播播| 蜜桃传媒麻豆第一区在线观看| 国产精自产拍久久久久久| 欧美黑人一级片| 99在线精品视频| 亚洲性图第一页| 国产精品2024| 小日子的在线观看免费第8集| 男女男精品视频网| 亚洲五月天综合| 亚洲专区一区| 欧美老熟妇喷水| 亚洲少妇在线| 久久久亚洲精品无码| 影音先锋亚洲电影| 久久久久久久久久网| 亚洲国产婷婷| 国产伦精品一区二区三区四区视频_| 国模 一区 二区 三区| 一级性生活视频| 国产精品99一区二区| 欧美一级爱爱视频| 亚洲高清不卡| 精品无码一区二区三区在线| 亚洲三级影院| 国产乱子夫妻xx黑人xyx真爽| 午夜一区在线| 久久综合久久色| 青青草一区二区三区| 亚洲人视频在线| 国产成人亚洲精品狼色在线| 亚洲欧洲国产视频| 99久久精品国产导航| 三级网站在线免费观看| 国产日本欧美一区二区| 精品一区二区三孕妇视频| 日韩一区中文字幕| 青青青在线免费观看| 一二三四社区欧美黄| 日本熟妇乱子伦xxxx| 欧美性生交xxxxx久久久| 天堂网视频在线| 欧美日韩精品一区二区三区 | 亚洲自拍偷拍色片视频| 亚洲亚洲一区二区三区| 国产私拍一区| 国产精品三级| 青春草在线视频免费观看| 欧美日韩网址| 992kp快乐看片永久免费网址| 精品一二三四区| 免费不卡的av| 久久精品免费在线观看| 国产精品 欧美激情| 午夜激情久久久| 羞羞色院91蜜桃| 日韩久久久精品| 精品成人一区二区三区免费视频| 日韩在线精品一区| 不卡一本毛片| 国产精品日韩欧美综合| 最新国产精品精品视频| 色综合电影网| 亚洲图片在线| 久久婷五月综合| 成人动漫精品一区二区| 四季av中文字幕| 亚洲国产日韩综合久久精品| 波多野结衣二区三区| 欧美成va人片在线观看| 国产三区四区在线观看| 高清视频欧美一级| 日韩黄色三级在线观看| 欧美久久综合性欧美| 欧美在线影院| 亚洲成色www.777999| 99视频精品全部免费在线| 亚洲欧美卡通动漫| 色婷婷av一区二区三区gif| 亚洲AV无码精品国产| 一区二区欧美在线| 欧亚av在线| 97免费资源站| 成人直播大秀| 国产在线观看福利| 不卡欧美aaaaa| 男人操女人的视频网站| 欧美写真视频网站| 精品推荐蜜桃传媒| 欧美一级成年大片在线观看| 欧洲一区在线| 一区二区三区在线视频看| 久久一区欧美| 毛片网站免费观看| 亚洲午夜视频在线| 草草视频在线播放| 免费不卡在线观看av| 少妇高潮一区二区三区99| 日本欧美色综合网站免费| 欧美中文字幕| 国产精品无码在线| 午夜精品久久久久久久久久 | 国产一区二区三区在线观看精品| 国产美女免费网站| 日韩欧美在线字幕| 日韩精品系列| 国产91精品不卡视频| 精品人人人人| 九一国产精品视频| 成人午夜又粗又硬又大| 久久婷婷综合国产| 成人欧美一区二区三区白人| 日韩精品一区二区亚洲av观看| 亚洲精品按摩视频| 两个人看的在线视频www| 国产精品视频福利| 亚洲午夜一级| 中文字幕第九页| 五月天一区二区| 五月婷婷开心中文字幕| 欧美性受xxxx黑人猛交| 伊人成综合网伊人222| 日本熟妇人妻xxxxx| 久久精品网站免费观看| 中文在线观看av| www.xxxx精品| www一区二区三区| 女人床在线观看| 白白色 亚洲乱淫| 91porny在线| 亚洲视频电影图片偷拍一区| 色婷婷综合久久久中字幕精品久久 | 久久精品人人做| 中文字幕理论片| 久久亚洲春色中文字幕| 瑟瑟视频在线看| 久久亚洲综合网| 日韩福利电影在线| 中文字幕求饶的少妇| 日韩精品资源二区在线| 国产夫妻在线播放| 欧美日韩一区二区三区在线观看免 | 青青国产精品| 亚洲国产一二三精品无码| 成人综合婷婷国产精品久久蜜臀| 精品亚洲永久免费| 亚洲区在线播放| 日本在线一区二区| 东北少妇不带套对白| 麻豆91在线观看| 天天看片中文字幕| 日韩经典一区二区三区| 欧美成人福利| av免费观看国产| 欧美激情一区二区在线| www久久久久久| 日本免费久久高清视频| 亚洲91视频| 中文字幕日韩三级片| 51精品国自产在线| 亚洲黄色免费看| 中文字幕日韩精品久久| 99久久久精品| 国产精品欧美久久久久天天影视| 欧美极品在线视频| 日韩aaaa| 最新在线黄色网址| 91精品国产黑色紧身裤美女| 伊人成综合网站|