精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2025 | 中科大、港中深、通義千問聯合發布CoRT:僅30個樣本教會大模型高效推理,token消耗降低50%

人工智能 新聞
來自中國科學技術大學、香港中文大學(深圳)、通義千問的聯合研究團隊給出了他們的答案:CoRT (Code-Optimized Reasoning Training) —— 一個旨在教會大型語言模型高效利用代碼工具進行推理的后訓練(post-training)框架。

近年來,以 OpenAI-o1、Qwen3、DeepSeek-R1 為代表的大型推理模型(LRMs)在復雜推理任務上取得了驚人進展,它們能夠像人類一樣進行長鏈條的思考、反思和探索。然而,這些模型在面對精確的數學計算時,仍然會「心有余而力不足」,常常出現效率低下甚至算錯的問題。

一個直觀的解決方案,是為模型配備代碼解釋器(Code Interpreter)等計算工具。但這引入了一個更深層次的挑戰,也是當前領域面臨的關鍵瓶頸:

  1. 認知沖突:模型內部基于概率的、模糊的「思考」,與外部工具返回的確定性的、精確的「知識」之間存在沖突,導致模型陷入無意義的反復驗證和「糾結」。
  2. 行為低效:模型傾向于先用自然語言進行冗長的推演,再用代碼驗證,造成「延遲計算」;或者不信任代碼返回的結果,進行不必要的「結果不信任」和手動核算,白白浪費了大量計算資源(tokens)。
  3. 數據稀缺:如何為這種新型的「模型 - 工具」協同推理模式,合成高質量的訓練數據,本身就是一個開放性難題。

那么,如何讓大模型學會「何時」以及「如何」高效地使用工具,將自身的抽象推理能力與工具的精確計算能力完美結合?

來自中國科學技術大學、香港中文大學(深圳)、通義千問的聯合研究團隊給出了他們的答案:CoRT (Code-Optimized Reasoning Training) —— 一個旨在教會大型語言模型高效利用代碼工具進行推理的后訓練(post-training)框架。該框架通過創新的數據合成策略和多階段訓練流程,顯著提升了模型的數學推理能力和效率。

目前,該論文已被 NeurIPS 2025 接收,相關模型和代碼均已開源。

  • 論文鏈接:https://arxiv.org/abs/2510.20342
  • 項目倉庫:https://github.com/ChengpengLi1003/CoRT

方法核心:從「數據冷啟動」到「智能體調優」的三步走

CoRT 框架的核心思想是,通過高質量的數據和精細化的訓練,重塑模型與工具的交互模式,使其從低效的「驗證」思維轉向高效的「計算」思維。

1.Hint-Engineering (提示工程):數據冷啟動的藝術

  • 挑戰:高質量的「模型 - 工具」交互數據極度稀缺。簡單地提示模型使用代碼,會產生大量冗長、低效的推理軌跡。
  • 核心思路:研究團隊首次提出了一種名為「提示工程」(Hint-Engineering) 的全新數據合成策略。其核心是在推理路徑的關鍵決策點,策略性地注入引導性提示,從而糾正模型的低效行為。

a.當模型試圖手動進行復雜計算時,注入提示:「這看起來很繁瑣,我們可以用 python 代碼來簡化推理」,引導其立即計算。

b.當模型得到代碼結果后試圖手動驗證時,注入提示:「我們不需要懷疑 python 計算的準確性」,打消其結果不信任。

  • 效果:遵循「數據質量遠重于數量」的原則,團隊僅手動標注了 30 個高質量樣本,就為后續訓練奠定了堅實基礎。這種方法生成的推理軌跡不僅正確,而且極其簡短高效。

2.多階段訓練流程:精細化能力塑造

在高質量數據的基礎上,CoRT 設計了一套包含 SFT、RFT 和 RL 的完整訓練管線:

  • 監督微調 (SFT):使用 30 個「提示工程」樣本進行初步微調,讓模型快速學習到高效交互的基本模式。
  • 拒絕采樣微調 (RFT):讓初步微調后的模型生成大量解答,并自動過濾掉錯誤的、或存在「延遲計算」「結果不信任」等不良行為的軌跡,只保留優質軌跡用于進一步訓練,強化模型的「好品味」。
  • 強化學習 (RL):將模型視為一個智能體 (Agent),將代碼解釋器視為環境 (Environment)。通過精心設計的獎勵函數(同時獎勵最終答案的準確性和代碼執行的成功率),讓模型在與環境的交互中,通過試錯自主學習最優的工具使用策略。這一步極大地提升了模型的穩定性和上限,尤其對于小尺寸模型效果顯著。

實驗結果:性能與效率的雙重飛躍

CoRT 框架在 5 個極具挑戰性的數學推理基準上進行了全面評估,結果證明了其卓越的性能。

  • 性能顯著提升:在同等規模的開源模型基礎上,CoRT 為 DeepSeek-R1-32B 帶來了 4% 的絕對精度提升,為 1.5B 模型帶來了高達 8% 的絕對提升,效果媲美乃至超越了許多依賴更多數據訓練的模型。
  • 效率革命性優化:與純自然語言推理的基線模型相比,CoRT 將 32B 模型的 token 消耗降低了約 30%,1.5B 模型更是降低了驚人的 50%。這意味著用一半的計算成本,就能達到更高的準確率。
  • 重塑代碼使用行為:分析顯示,傳統方法促使模型將代碼主要用于「驗證」(占比 68.2%),而 CoRT 成功地將模型行為轉變為以「計算」為核心(占比 51.1%),從根本上提升了推理效率。
  • 強大的泛化能力:在完全沒見過的化學問題(OOD)測試中,CoRT 訓練的模型不僅性能更優,還能自發地發現并使用一個從未在訓練中出現過的專業工具庫(RDKit),使用率高達 81.3%,展現了真正的智能涌現。

意義與展望

CoRT 框架的提出,為解決大型語言模型在精確推理領域的短板提供了一條高樣本效率、高計算效率的全新路徑。

它證明了,通過精巧的數據設計和先進的智能體強化學習框架,我們不僅能教會模型「使用」工具,更能教會它們「高效、智能」地 與工具協作。

這項工作展示了構建更強大、更可靠、更經濟的 AI 智能體系統的巨大潛力,為 AI 在科學發現、教育輔助、工程設計等需要精確推理的領域的落地應用,掃清了一大障礙。未來,將此框架擴展到更多樣化的工具和更復雜的任務場景,將是該方向激動人心的研究路徑。

作者介紹

核心作者:

  • 唐正陽,香港中文大學(深圳)博士生,參與了 Qwen3 模型的開發,提出了 MathScale、ORLM 等代表性工作。
  • 李成鵬,中國科學技術大學博士生,參與了 Qwen2.5、QwQ、Qwen3 等模型的開發,提出了 Mugglemath, START 等代表性工作。
  • 李子牛,香港中文大學(深圳)博士生,提出了 ReMax、Knapsack RL 等代表性工作。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-27 09:15:00

2023-10-30 15:06:00

模型數據

2024-06-17 07:10:00

2023-12-04 13:23:00

數據訓練

2025-06-05 11:49:21

AI模型數據

2025-06-10 09:07:00

2025-03-03 08:00:00

小紅書AI圖像檢測模型AI

2025-03-19 09:10:00

2025-09-15 03:00:00

2025-09-01 08:51:00

2024-07-10 12:38:22

2025-05-08 09:10:30

2024-12-02 10:40:00

AI模型

2024-09-18 11:00:00

AI工具數據

2024-04-07 09:00:00

數據模型

2023-04-07 14:01:18

ChatGPT人工智能

2025-08-28 09:09:00

AI強化學習模型

2024-01-26 16:33:00

2024-01-15 13:11:22

模型數據
點贊
收藏

51CTO技術棧公眾號

国产情侣呻吟对白高潮| 亚洲精品国产一区二区三区| 视频三区在线观看| 日韩精品福利网| 欧美日韩精品专区| 国产日韩欧美一区二区三区四区 | 天堂网中文字幕| 精品伊人久久| 狠狠躁夜夜躁久久躁别揉| 91嫩草视频在线观看| 国产一区二区三区影院| 日本不卡高清| 亚洲国产欧美一区二区丝袜黑人| 女女同性女同一区二区三区按摩| 欧美一区二区三区久久久| 99re6这里只有精品| 亚洲第一男人天堂| 久久撸在线视频| а√天堂中文在线资源8| 国产精品三级久久久久三级| 国产精品视频免费一区| xxxxxx国产| 欧美成人自拍| 欧美一区三区四区| www.xxx亚洲| 超碰激情在线| 一区二区三区精密机械公司| 99久久精品无码一区二区毛片| 免费无遮挡无码永久在线观看视频| 精品一区二区三区亚洲| 欧美在线观看禁18| 久久精品免费一区二区| 丁香影院在线| 亚洲精品少妇30p| 一区二区三区四区在线视频| 伦理片一区二区三区| 丝袜美腿亚洲一区| 九九热精品视频在线播放| 丁香激情五月少妇| 香蕉国产成人午夜av影院| 精品国产欧美一区二区| 日韩中文字幕在线视频观看 | 国产精品亚洲成人| 国产精品人人做人人爽| 亚洲黄色激情视频| 一本综合久久| 久久久久久久亚洲精品| 日韩三级久久久| 四虎8848精品成人免费网站| 永久免费看mv网站入口亚洲| 国产精品一区二区入口九绯色| 婷婷综合六月| 精品福利樱桃av导航| 国产一区 在线播放| 超碰在线观看免费版| 国产精品第13页| 亚洲一区美女| 男人天堂手机在线| 亚洲色图第一区| 国产av不卡一区二区| 老司机精品视频在线观看6| 国产精品久久久久久久久动漫| 超碰97国产在线| 激情五月婷婷网| 久久婷婷亚洲| 国产精品欧美久久久| 中文人妻熟女乱又乱精品| 青青草伊人久久| 国产三级精品网站| 国产aⅴ一区二区三区| 国产成人av福利| 国产精品www网站| 国产天堂第一区| 看电视剧不卡顿的网站| 91免费看片网站| www.国产黄色| 91麻豆国产精品久久| 欧美日韩在线播放一区二区| 北岛玲一区二区三区| 亚洲欧洲制服丝袜| 99色这里只有精品| 97caopron在线视频| 一区二区免费视频| 人妻熟妇乱又伦精品视频| 二区三区在线观看| 亚洲成人激情av| 国产精品动漫网站| 久久免费影院| 欧美成人激情免费网| 免费看黄色aaaaaa 片| av成人综合| 亚洲男人的天堂在线播放| 欧美日韩生活片| 国产精品xvideos88| 热99精品里视频精品| 国产又黄又粗又硬| 91免费国产在线观看| 永久久久久久| 日本中文字幕在线播放| 亚洲国产精品尤物yw在线观看| 国产对白在线播放| 小视频免费在线观看| 欧美日韩亚州综合| 先锋资源av在线| 久久久久久久久国产一区| 色偷偷av一区二区三区| 国产精品a成v人在线播放| 日韩精品国产欧美| 国产精品一区二区免费看| a中文在线播放| 欧美日韩加勒比精品一区| 依人在线免费视频| 西野翔中文久久精品国产| 欧美日韩国产成人在线观看| 久久精品女人毛片国产| 国产精品99一区二区| 国产精品成久久久久三级| 性欧美18一19性猛交| 国产日韩欧美麻豆| 成人手机视频在线| 婷婷六月国产精品久久不卡| 亚洲精品一区二区三区福利| 神马久久精品综合| 日本亚洲天堂网| 成人午夜激情免费视频| 麻豆国产在线播放| 午夜激情久久久| 手机看片国产精品| 国产成人精品福利| 日韩手机在线导航| 成人欧美一区二区三区黑人一| 亚洲欧洲日韩| 国产日本欧美一区二区三区| 经典三级在线| 日韩欧美一区二区三区久久| 国产a级黄色片| 欧美天天视频| 波多野结衣成人在线| 艳母动漫在线看| 亚洲地区一二三色| 中文字幕 欧美 日韩| 欧美一区在线看| 亚洲影视中文字幕| 亚洲七七久久综合桃花剧情介绍| 偷窥少妇高潮呻吟av久久免费| 无码少妇一区二区三区芒果| 日韩中文av| 午夜精品久久17c| 懂色av一区二区三区四区| 亚洲最新视频在线播放| 人妻巨大乳一二三区| 欧美精品黄色| 国产精品一区二区三区在线观| 国产高清免费av在线| 色综合久久天天| 中文字幕 自拍| 日本中文字幕一区二区视频| 国产精品久久久久免费| 久草在线视频福利| 欧美成人乱码一区二区三区| 国产精品www爽爽爽| 免费黄网站欧美| 中文字幕剧情在线观看一区| 亚洲小少妇裸体bbw| 亚洲精品一区二区三区不| 久草免费在线视频观看| 日本aⅴ亚洲精品中文乱码| 亚洲图片小说在线| 韩国一区二区三区视频| 久久久久中文字幕| 日本私人网站在线观看| 在线观看欧美日本| 日韩在线一卡二卡| 日本美女视频一区二区| 在线丝袜欧美日韩制服| 欧美日韩女优| 亚洲欧美日韩一区二区三区在线| 国产亚洲第一页| 九九**精品视频免费播放| 亚洲区成人777777精品| 牛牛影视一区二区三区免费看| 久久国产天堂福利天堂| 一级黄色片在线观看| 亚洲在线视频一区| 国产精品815.cc红桃| 精品系列免费在线观看| 国产毛片视频网站| 久久精品高清| 国产精品丝袜白浆摸在线| 怡红院av在线| 日韩精品一区二区三区三区免费| 欧美精品久久久久久久久46p| 免费成人小视频| 又大又硬又爽免费视频| 国产一区日韩| julia一区二区中文久久94| 国内激情视频在线观看| 日韩在线视频导航| 凸凹人妻人人澡人人添| 欧美精品v国产精品v日韩精品| 免费看的黄色录像| 日本欧洲一区二区| 国产精品久久久久久久久电影网| 日韩精品一区二区三区中文字幕 | 一本色道久久综合亚洲aⅴ蜜桃 | 日韩视频免费在线观看| 一级片一区二区三区| 国产精品美女久久久久久久久久久| 欧美国产日韩在线播放| 欧美久久久久| 亚洲欧洲精品在线观看| 欧美黄色网视频| 999热视频在线观看| 国产激情欧美| 青草成人免费视频| 国产乱码在线| 日韩av最新在线观看| 国产精品乱码久久久| 91官网在线免费观看| 激情五月色婷婷| 久久蜜桃一区二区| 91性高潮久久久久久久| 青青青伊人色综合久久| 黄色影视在线观看| 日韩理论片av| 欧美日韩一区二区视频在线| 精品欧美午夜寂寞影院| 99蜜桃在线观看免费视频网站| 538视频在线| 欧美日本亚洲视频| 精品美女在线观看视频在线观看| 精品国产乱码久久久久久牛牛 | 在线观看av一区二区| 国产无码精品一区二区| 国产日本一区二区| 蜜桃精品成人影片| zzijzzij亚洲日本少妇熟睡| 亚洲免费av一区二区三区| 国产精品主播| 免费高清在线观看免费| 一区二区激情| 国产精品后入内射日本在线观看| 色婷婷亚洲mv天堂mv在影片| 欧美三级网色| 加勒比久久综合| 日韩欧美亚洲在线| 国产成人在线中文字幕| 岛国一区二区三区高清视频| 综合激情网...| 99在线视频免费观看| 91精品国产乱码久久久竹菊| 91超碰在线免费观看| 日本少妇精品亚洲第一区| 99精彩视频| 精品国模一区二区三区| 国产精品久久久91| 国产亚洲精彩久久| 欧美亚洲另类制服自拍| 波多野结衣久久精品| 国产成人精品视频在线观看| 欧美色片在线观看| 91产国在线观看动作片喷水| 天堂中文av在线资源库| 国产激情视频一区| 神马午夜在线视频| 日韩女在线观看| 国内自拍亚洲| 国产成人午夜视频网址| 丁香花在线影院| 日本欧美中文字幕| 欧美综合影院| 国产精品亚洲不卡a| 一区二区三区视频免费观看| 四虎影院一区二区三区| 亚洲电影一级片| 亚洲mv在线看| 清纯唯美亚洲综合一区| 欧美性受黑人性爽| 99精品国产在热久久| 久久久国产欧美| 国产不卡视频在线播放| 波多野结衣一本| 亚洲欧美日韩综合aⅴ视频| 日本三级中文字幕| 欧美日韩一区二区三区在线| www.蜜臀av.com| 亚洲欧美制服第一页| 黄色网址在线免费观看| 欧美一区第一页| 伊人久久大香伊蕉在人线观看热v| 国产精品日韩在线一区| 91成人福利| 亚洲日本精品国产第一区| 亚洲欧洲日本mm| 久久人人爽av| 91视频免费观看| 婷婷久久综合网| 日韩欧美成人区| www.av导航| 日韩中文字幕在线免费观看| 日p在线观看| 欧美亚洲国产日韩2020| 欧美二区观看| 亚洲精品一品区二品区三品区| 日韩夫妻性生活xx| 99热在线这里只有精品| 国产乱人伦偷精品视频不卡| a级片在线观看| 亚洲日本中文字幕区| 免费看日批视频| 精品播放一区二区| 成人影院在线看| 国产精品爽爽爽| 一道在线中文一区二区三区| 精品丰满人妻无套内射| 国产中文字幕精品| 欧美人与性囗牲恔配| 欧美日韩精品中文字幕| 亚洲精品字幕在线观看| 久久久精品免费| av在线理伦电影| 亚洲专区国产精品| 欧美xxxx中国| 麻豆一区二区三区视频| 久久影院电视剧免费观看| 久久精品视频国产| 精品国产亚洲在线| 日本片在线看| 99蜜桃在线观看免费视频网站| 欧美人与动xxxxz0oz| 欧美人成在线观看| 国产成人免费视频精品含羞草妖精 | 精品少妇一区二区三区在线播放 | 亚洲第一影院| 91精品免费| 牛牛国产精品| 成年人看片网站| 国产丝袜欧美中文另类| 欧美日韩精品在线观看视频 | 国产91精品欧美| 久久久精品视频免费观看| 777a∨成人精品桃花网| 浪潮av一区| 97免费高清电视剧观看| 国产综合久久| 国产二级一片内射视频播放| 亚洲aaa精品| 日本一二三区在线视频| 日韩美女毛茸茸| 欧美偷拍综合| 午夜视频在线观| 亚洲精品国产精品乱码不99| 国产不卡精品视频| 久久久久久久久久国产| 99久久婷婷国产综合精品青牛牛| 亚洲va韩国va欧美va精四季| 亚洲日本久久| 香蕉网在线播放| 欧美最猛性xxxxx直播| 日本免费在线观看| 热久久99这里有精品| 国产伦一区二区三区| 国产精品视频分类| 亚洲欧美一区二区三区孕妇| 亚洲AV无码乱码国产精品牛牛 | 黄色精品免费| 日本黄色录像片| 在线一区二区视频| 日韩大片在线永久免费观看网站| 国产成人综合精品| 日韩高清电影免费| 一区二区在线播放视频| ww久久中文字幕| 中国一级片黄色一级片黄| 精品久久国产精品| 卡一精品卡二卡三网站乱码| av观看免费在线| 久久久精品蜜桃| 国产乱人乱偷精品视频| 午夜精品久久久久久久男人的天堂| 日韩精品一区二区三区中文字幕 | 777色狠狠一区二区三区| 丁香花在线电影| 国产精品裸体一区二区三区| 美女精品在线| 欧美一区免费观看| 亚洲成人aaa| 欧美成人高清视频在线观看| av一区二区三区免费观看| 久久久高清一区二区三区| 国产伦精品一区二区三区免.费| 神马久久桃色视频| 国产精品色在线网站| www.日本一区| 亚洲第一综合色| 麻豆影院在线观看| 欧美激情论坛| 国产二区国产一区在线观看| 亚洲第一网站在线观看| 欧美激情精品在线|