精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICLR 2025 | 真正「Deep」的「Research」,通過強化學習實現可自主進化的科研智能體來了!

人工智能 新聞
牛津大學教授 Will MacAskill 最新預言未來 AI 的增長率足以在不到 10 年的時間里,推動相當于 100 年的技術進步。

CycleResearcher 研究團隊成員包括:張岳教授,西湖大學人工智能系教授,工學院副院長,其指導的博士生朱敏郡、張鴻博、鮑光勝、訪問學生翁詣軒;UCL 訪問研究員楊林易博士,25 Fall 入職南方科技大學擬任獨立 PI,博士生導師,研究員。

AI 技術不斷進步,科研自動化浪潮正在深刻改變學術世界!近日,來自西湖大學、UCL 等機構的研究團隊在自動化科研方向發布了一項突破性的成果:CycleResearcher 。 CycleResearcher 首次實現了可訓練的科研流程的全鏈路端到端訓練,覆蓋智能文獻檢索、模型主動提問、強化學習迭代優化論文創新點、方法論架構設計、實驗設計到論文自動生成的完整閉環。 

值得一提的是,同類功能在 OpenAI 商業化方案中需支付高達 2 萬美元 / 月的服務費用,而團隊開源了所有代碼、數據、和 Demo:

圖片

  • 論文鏈接:https://openreview.net/forum?id=bjcsVLoHYs
  • 網頁鏈接:https://ai-researcher.net/
  • 代碼鏈接:https://github.com/zhu-minjun/Researcher

牛津大學教授 Will MacAskill 最新預言未來 AI 的增長率足以在不到 10 年的時間里,推動相當于 100 年的技術進步。如何讓 AI 實現「遞歸自我改進」成為了解決這個問題的關鍵!然而,現有的一系列工作包括 SakanaAI 公司于去年 8 月發布的 AI Scientist、香港大學最近發布的 AI-Researcher 都是基于調用 API 構建推理的框架去實現自動化科研,而無法被訓練優化。CycleResearcher(模型上傳于 24 年 8 月)是全球首個通過強化學習迭代優化訓練實現的 AI 科研智能體。

圖片

圖 1: AI Researcher 功能展示圖

CycleResearcher 首次實現了通過強化學習進行科研過程的自動迭代改進,它能夠模擬完整的科研流程,包括文獻綜述、研究構思、論文撰寫,以及模擬實驗結果。

研究團隊主要干了三件事情:

1)數據集: 發布了兩個大規模數據集 Review-5k 和 Research-14k,用于評估和訓練學術論文評審和生成模型。

2)CycleResearcher 模型: 可以生成質量接近人類撰寫預印本的論文(評分 5.36 分),實現 31.07% 的接受率。

3)CycleReviewer 模型: 一個做論文評審的模型,在平均絕對誤差 (MAE) 方面顯示出令人鼓舞的結果,與人類評審員相比,平均絕對誤差(MAE)降低了 26.89%。

利用商業大型語言模型(LLMs)作為研究助理或想法生成器已經取得了顯著進展,但在多達上萬次模擬同行評議中通過反饋而自我進化的自動科研大模型從未實現過。這項研究的提出旨在解決了這個領域難題。

圖片

圖 2: CycleResearcher 訓練框架圖

創新點詳細解讀:

1. 高質量數據集與模型規模化:為訓練 CycleResearcher,研究團隊專門構建了包含近 1.5 萬篇高質量學術論文的數據集(Research-14K),數據來源覆蓋了 ICLR、NeurIPS、ICML、ACL、EMNLP、CVPR 和 ICCV 等頂級會議。提供了多個不同規模的模型(12B、72B、123B),滿足不同科研需求。

2. 強化學習與迭代反饋機制:如圖二所示,CycleResearcher 的核心技術,在于其采用迭代式偏好優化(Iterative SimPO)的訓練框架,這一方法使得在線強化學習(Online RLHF)成為了可能。這個框架包含兩個關鍵模型:策略模型 (CycleResearcger) 和獎勵模型 (DeepReveiwer)。

3. 指令微調(SFT)熱身階段:策略模型 CycleResearcher 負責生成論文的各個部分,它首先會進行廣泛的文獻綜述,從輸入的 bib 文件中獲取所有參考文獻及其摘要,全面了解研究背景。然后,它會交替生成論文的大綱和正文,確保邏輯流暢。具體來說,它會先生成動機和大綱中的主要思想,然后生成標題、摘要、引言和方法部分。接下來,概述實驗設置和結果,隨后生成實驗設計和模擬結果(注意,這里的實驗結果是模擬的)。最后,它會分析實驗結果并形成結論。整個過程就像一位經驗豐富的科研人員在撰寫論文一樣,有條不紊,邏輯清晰。獎勵模型 CycleReviewer 則負責模擬同行評議,對生成的論文進行評估和反饋。它會從多個維度對論文進行打分,并給出具體的評審意見。

4. 迭代反饋訓練階段:研究人員首先通過拒絕采樣獲取樣本,通過 CycleReviewer 的打分構成偏好對,兩個模型相互配合,通過強化學習的方式不斷優化,CycleResearcher 根據 CycleReviewer 的反饋不斷改進自身的論文生成策略,CycleReviewer 則根據 CycleResearcher 生成的論文不斷提高自身的評審能力。兩個模型交互反饋,不斷優化策略。在 Iterative SimPO 算法中,SimPO 算法雖然可以幫助 AI 區分 “好” 論文和 “壞” 論文,但它不能保證 AI 生成的文本是流暢的。因此,我們將 SimPO 損失和 NLL 損失結合起來,讓 AI 模型既能寫出高質量的論文,又能保證文本的流暢性。

5. 實驗結果:CycleResearcher 生成論文的模擬評審平均得分達到 5.36 分,超過目前 AI Scientist 的 4.31 分,且十分接近人類真實預印本的平均水平(5.24 分)。同時,CycleResearcher 論文的接受率達到了 35.13%,遠高于 AI Scientist 的 0%。

總結

1.這篇工作首次提出了一個用于自動化整個研究生命周期的迭代強化學習框架 通過集成 CycleResearcher(策略模型)和 CycleReviewer(獎勵模型),該框架能夠模擬真實世界的研究 - 評論 - 改進的迭代循環。

2.團隊發布了兩個大規模數據集,用于學術論文生成和評論的評估與訓練 Review-5k 和 Research-14k 數據集專為捕捉機器學習中同行評審和研究論文生成的復雜性而設計,為評估和訓練學術論文生成和評審模型提供了寶貴的資源。

3.CycleResearcher 在研究構思和實驗設計方面表現出一致的性能,可以達到人類撰寫預印本的論文質量,接近會議接受論文的質量。 這表明 LLM 可以在科學研究和同行評審過程中做出有意義的貢獻。

我們堅信科研工具應當開放共享,因此提供了完整的開源資源套件:

pip install ai_researcher

開源套件包含:

1. 不同規模模型:所有模型均支持本地部署

  • CycleResearcher:提供 12B、72B 和 123B 三種規模
  • CycleReviewer:提供 8B、70B 和 123B 三種規模
  • DeepReviewer:提供 7B 和 14B 兩種規模 

2. 大規模訓練數據集: 

  • Review-5K:包含 4,989 篇論文的專業評審數據
  • Research-14K:包含 14,911 篇高質量論文的結構化數據
  • DeepReview-13K:包含 13,378 篇論文的多維度深度評審數據

3. 詳盡教程: 

  • CycleResearcher 教程:https://github.com/zhu-minjun/Researcher/blob/main/Tutorial/tutorial_1.ipynb
  • CycleReviewer 教程:https://github.com/zhu-minjun/Researcher/blob/main/Tutorial/tutorial_2.ipynb
  • DeepReviewer 教程:https://github.com/zhu-minjun/Researcher/blob/main/Tutorial/tutorial_3.ipynb
責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-23 10:12:14

算法強化學習

2024-05-30 16:37:29

2025-08-01 09:05:00

2025-08-12 08:58:03

2025-07-24 09:05:00

2024-07-22 08:30:00

神經網絡AI

2025-03-10 12:09:37

2017-03-28 10:15:07

2023-08-28 06:52:29

2025-10-10 08:33:49

2025-07-01 09:05:28

2017-04-04 19:52:24

強化學習深度學習機器學習

2025-06-03 06:12:03

2025-10-11 04:00:00

2023-10-19 13:25:00

AI訓練

2020-05-06 16:07:05

百度飛槳

2024-07-23 14:10:48

2022-11-02 14:02:02

強化學習訓練

2025-01-06 09:45:00

AI訓練數據

2023-06-16 20:50:13

大模型
點贊
收藏

51CTO技術棧公眾號

麻豆一区二区三区精品视频| 亚洲黄色小视频在线观看| 人成网站在线观看| 欧美亚洲一区| 日韩在线观看免费高清完整版| 一级淫片在线观看| 欧美a级在线观看| 国产拍揄自揄精品视频麻豆| 91麻豆桃色免费看| 日韩黄色在线播放| 亚洲激情五月| 精品无码久久久久久国产| 国产一二三区av| 波多野结衣在线观看| 国产欧美精品一区二区色综合| 亚洲精品日韩av| 中文字幕黄色片| 亚洲特级毛片| xxxx欧美18另类的高清| 亚洲国产精品无码久久久久高潮| 欧美高清免费| 欧美色图在线视频| 亚洲一区三区电影在线观看| 性感美女福利视频| 国产成人av电影在线| 国产精品亚发布| 国语对白永久免费| 黄色av成人| 久久精品电影一区二区| 久久精品成人av| 欧美aaaaaaaa牛牛影院| 欧美一区二区三区四区五区 | 最新电影电视剧在线观看免费观看| 国产黄色精品视频| 日本精品久久中文字幕佐佐木| 亚洲成人生活片| 日韩欧美一区免费| 亚洲欧美国产制服动漫| 在线免费看黄色片| 国产一区 二区| 欧美一区二区久久| 色91精品久久久久久久久| 亚洲人体影院| 欧美视频一二三| 国产 日韩 亚洲 欧美| 女子免费在线观看视频www| 国产精品国产三级国产| 色噜噜狠狠一区二区三区| 欧美视频免费一区二区三区| www.日韩大片| 国产日韩二区| 无码精品人妻一区二区| 成人av资源在线观看| 超碰国产精品久久国产精品99| 国产婷婷在线视频| 国产麻豆精品theporn| 成人性生交大片免费观看嘿嘿视频| 久久影视中文字幕| 视频一区国产视频| 国产精品旅馆在线| 中文字字幕在线观看| 全国精品久久少妇| 国产精品99一区| 国产情侣免费视频| 蜜臀av性久久久久蜜臀aⅴ流畅 | 久久精品日韩一区二区三区| 日韩和欧美的一区二区| 中文字幕在线视频区| 国产精品久久夜| 一级全黄肉体裸体全过程| 精品自拍一区| 亚洲综合在线第一页| 91黄色在线看| 欧美www.| 91精品国产色综合久久不卡电影| 一级 黄 色 片一| 91九色鹿精品国产综合久久香蕉| 亚洲精品成人久久电影| 3d动漫精品啪啪一区二区下载| 国产免费久久| 久久精品这里热有精品| 欧美人妻精品一区二区三区| 亚洲片区在线| 国产99久久精品一区二区 夜夜躁日日躁| av一级在线观看| 蜜臂av日日欢夜夜爽一区| 成人激情视频在线| 色呦呦免费观看| 中文字幕精品在线不卡| 韩国无码av片在线观看网站| а√天堂中文在线资源8| 一本色道久久综合亚洲aⅴ蜜桃| 午夜免费福利在线| 4438全国亚洲精品观看视频| 亚洲精品视频二区| www日韩在线| 久久成人亚洲| 91视频免费在线观看| 天天综合网天天综合| 中文字幕+乱码+中文字幕一区| 亚洲小说欧美另类激情| 日韩伦理精品| 欧美一区二区精品| 国产精成人品免费观看| 欧美另类视频| 国产精品丝袜高跟| 人妻精品一区一区三区蜜桃91| 国产欧美精品一区aⅴ影院| 中文字幕日韩精品无码内射| 99久久伊人| 亚洲高清免费观看高清完整版| 一级片黄色录像| 在线亚洲伦理| 国产精品区一区| 免费av在线播放| 色综合网站在线| 欧美激情一区二区三区p站| 日韩精品dvd| 全亚洲最色的网站在线观看| 亚洲大尺度网站| 国产精品另类一区| 国产aaa一级片| 成人线上播放| 欧美黄色片视频| 91tv国产成人福利| 国产欧美一区二区精品忘忧草| 久久国产午夜精品理论片最新版本| av在线成人| 中文字幕亚洲欧美一区二区三区| 看片网址国产福利av中文字幕| 国产乱码一区二区三区| 日本不卡免费新一二三区| 97超碰在线免费| 精品国产91洋老外米糕| 国产极品国产极品| 韩国一区二区在线观看| 亚洲一区二区在| 看片一区二区| 中日韩美女免费视频网址在线观看 | 亚洲午夜久久| 91精品国产高清自在线| 乱精品一区字幕二区| 亚洲欧美日韩电影| 亚洲最大成人在线观看| 国产一区99| 国产精品久久久久久一区二区| 久久av少妇| 一本高清dvd不卡在线观看| 国产肉体xxxx裸体784大胆| 伊人精品在线| 精品国产_亚洲人成在线| 成人黄色动漫| 亚洲精品videossex少妇| 精品成人久久久| eeuss影院一区二区三区 | av在线免费网站| 欧美日韩大陆一区二区| 欧日韩不卡视频| 激情文学综合插| 中文字幕中文字幕一区三区| 香蕉久久久久久| 久久在线免费视频| 精品人妻一区二区三区换脸明星| 亚洲精品成人悠悠色影视| 欧美一区二区三区影院| 国产精品va| 国产嫩草一区二区三区在线观看| 极品在线视频| 精品呦交小u女在线| 中文字幕日本视频| 亚洲欧洲日产国产综合网| 香蕉视频xxx| 亚洲三级免费| 特级西西444www大精品视频| 欧美亚洲人成在线| 欧美肥臀大乳一区二区免费视频| 免费的黄色av| 欧美色综合久久| 五月婷婷一区二区| 91亚洲永久精品| 91精品无人成人www| 欧美激情综合色综合啪啪| 精品国产乱码久久久久久蜜柚| 户外露出一区二区三区| 美女av一区二区三区| 人妻无码中文字幕| 欧美亚洲国产一区二区三区va | 日韩黄色影片| 欧美精品欧美精品系列| 国产网站在线看| 日本一区二区免费在线观看视频| 特黄特黄一级片| 校园春色综合网| 99re99热| 欧美女王vk| 99久久伊人精品影院| 日韩中文视频| 久久久久久久999| avav免费在线观看| 精品91自产拍在线观看一区| 日韩国产成人在线| 亚洲国产欧美在线| www.5588.com毛片| 久久久噜噜噜久久人人看 | 日韩中文字幕在线视频观看| 久久裸体网站| 欧美另类视频在线| aaa国产精品| 91精品久久久久久久久久久久久久| 超免费在线视频| 久久精品福利视频| av在线免费一区| 国产丝袜一区二区三区| 丰满人妻一区二区| 欧美欧美欧美欧美首页| 精品人妻一区二区三区免费看| 一区二区三区美女视频| 久久久国产一级片| 国产三区在线成人av| 999精品免费视频| 国产一区不卡视频| 亚洲欧美日韩综合网| 久久久久在线| 噜噜噜久久亚洲精品国产品麻豆| 亚洲五月综合| 樱花www成人免费视频| 国产成人3p视频免费观看| 好吊色欧美一区二区三区| 中文字幕区一区二区三| 国产一区私人高清影院| 精品亚洲美女网站| 全球成人中文在线| 成人性生活av| 国产91|九色| 天天综合av| 97在线免费观看视频| 成人影音在线| 久久久久国产视频| 激情av在线播放| 国内精品中文字幕| 女囚岛在线观看| 欧美精品九九久久| 丁香花在线影院| 午夜精品久久久久久久99黑人 | 久久精品国内一区二区三区水蜜桃 | 日本人视频jizz页码69| 日韩黄色免费电影| 欧美一级裸体视频| 日本sm残虐另类| 中日韩av在线播放| 麻豆成人久久精品二区三区小说| 日本xxxx黄色| 国产在线麻豆精品观看| 亚洲av无日韩毛片久久| 国产一区二区剧情av在线| 日本女人黄色片| 成熟亚洲日本毛茸茸凸凹| yjizz视频| 久久免费美女视频| 国产不卡在线观看视频| 亚洲日本欧美天堂| 激情视频在线播放| 午夜精品久久久久久久久久| 欧美一二三区视频| 在线视频一区二区三区| 亚洲一级特黄毛片| 日韩欧美国产1| 人妻va精品va欧美va| 亚洲人成电影在线播放| 91激情在线| 欧美日韩国产成人在线| 欧美a级在线观看| 国产精品欧美激情| 日本精品在线播放| 免费国产一区二区| 国产精品x453.com| 青草青青在线视频| 日精品一区二区| 亚洲丝袜在线观看| 久久夜色精品一区| 久久高清内射无套| 精品国产91久久久久久老师| 夜夜躁日日躁狠狠久久av| 91精品国产入口在线| 香蕉久久一区二区三区| 在线观看精品自拍私拍| 天堂av资源在线观看| 奇米一区二区三区四区久久| 日韩午夜电影免费看| 国内精品视频免费| 日韩免费视频| 国产69精品久久久久999小说| 日本中文字幕一区| av免费观看不卡| 亚洲欧洲成人自拍| 国产成人自拍视频在线| 欧美日韩国产天堂| 殴美一级特黄aaaaaa| 日韩在线激情视频| 热色播在线视频| 亚洲综合av影视| 精品少妇av| 亚洲 自拍 另类小说综合图区| 日本亚洲一区二区| 亚洲少妇18p| 亚洲人xxxx| 国产精品尤物视频| 亚洲电影免费观看高清完整版在线| 日本在线观看视频| 日本久久91av| 久9re热视频这里只有精品| 正在播放亚洲| 日本中文字幕一区| 精品夜夜澡人妻无码av | 日本三级片在线观看| 欧美日韩国产天堂| 国产视频精品久久| 国产69精品久久久久久| 7777精品| 成人污网站在线观看| 蜜桃视频在线观看一区| 不卡一区二区在线观看| 亚洲午夜久久久久久久久电影院| 国产一区二区三区在线观看 | 新版中文在线官网| 91精品久久久久久久久久久| 国产一区日韩| 日韩 欧美 高清| 91视频com| 精品无码久久久久久久| 日韩欧美一卡二卡| 伦xxxx在线| 国产中文字幕亚洲| 日韩精品影视| 亚洲一级免费观看| 亚洲国产精华液网站w| 中文字幕精品视频在线观看| 亚洲经典中文字幕| 极品在线视频| 久久久久无码国产精品一区| 在线高清一区| 亚洲天堂美女视频| 欧美日韩久久久久| 视频一区二区在线播放| 亚洲精选视频在线| 日本免费在线观看视频| 亚洲免费电影一区| 卡通欧美亚洲| 欧美日韩精品免费在线观看视频| 久久精品系列| 日本少妇xxxxx| 在线视频欧美区| 尤物网址在线观看| 成人精品网站在线观看| 午夜精品视频| 这里只有精品在线观看视频| 精品日韩美女的视频高清| 欧美一级片免费| 日本精品免费一区二区三区| 国产影视一区| 91最新在线观看| 亚洲欧洲国产日韩| 亚洲精品久久久久久动漫器材一区| 久久久久久久久久久免费 | 国产精品va在线观看无码| 国产成人精品免费网站| 国产乡下妇女做爰视频| 日韩精品高清在线| 免费一级欧美在线观看视频| 99re8这里只有精品| av午夜精品一区二区三区| 久久精品久久久久久久| 色老头一区二区三区在线观看| 九七电影院97理论片久久tvb| 最新精品视频| 99久久国产免费看| 久久亚洲精品国产| 综合国产在线观看| 中文字幕日韩高清在线| 蜜臀久久99精品久久久酒店新书 | 精品无码m3u8在线观看| 精品丝袜一区二区三区| 亚洲精品aaa| 日本系列欧美系列| 黄色免费视频网站| 欧洲亚洲国产日韩| 在线三级电影| 欧美第一黄网| 国产精品一区二区久久不卡| 久久亚洲天堂网| 久久中国妇女中文字幕| 日韩一级电影| 久久久久久国产精品日本| 岛国视频午夜一区免费在线观看 | 欧美国产97人人爽人人喊| 国产强被迫伦姧在线观看无码| 26uuu另类亚洲欧美日本一| 日韩理论片av| 中文字幕丰满孑伦无码专区| 欧美精品第一页|