全球首款通用AI科研智能體問世:我一個文科生用它寫了份CRISPR基因編輯綜述報告
最近,科研圈里越來越多的人在討論一種叫 SciMaster 的「AI 科學助手」,有讓它做實驗的,有讓他幫忙開題的,還有跟他聊科幻的。

仿佛有一個 AI 大模型加持的助手就可以包打天下了。
這個 SciMaster 是上周在世界人工智能大會 WAIC 上,由上海交通大學、深勢科技與上海算法創新院聯合發布的,號稱全球首個真正意義的通用科研智能體。
發布之后異常火爆,人們都在尋找測試機會,邀請碼已經被炒到近千元。到底是怎樣的 AI 產品才能讓賣家有如此底氣?

一番努力后,我們獲得了一個邀請碼,發現它的水平果然不一樣,可能 AI 社區熱炒的「AI 科學家」概念終于有了一個可實際應用的雛形。簡單來說,它集成了頂尖的思維鏈(CoT)能力,可以自動搜索分析文獻、搞理論計算、做實驗、寫論文以及與人協作進行科研。
SciMaster 已經超出了此前 AI 大模型工具的范疇。通過自動完成科研流程中最繁瑣的一些環節,它可以極大提升科研效率。對于全球數千萬必須在文獻和實驗數據上耗費大量時間的科研人員而言,這簡直就是對科研流程的「降維打擊」。
從煉丹到 AI 科學家的范式革命
要理解 SciMaster 的意義,首先須得了解當前 AI 領域的宏觀趨勢。在當今這個被一些觀察者認為即將進入「AI 下半場」的時代,AI 的前沿正從基于海量數據和算力的「煉丹」轉向「如何將強大的 AI 能力轉變成應用」,也即著名數學家陶哲軒所說的 AI 現在應該從技術質變走向應用量變。
而 AI 科學家,正站在這一宏觀趨勢的最前沿。但遺憾的是,雖然我們此前已經見證了能自動搜索人工生命、發現新的蛋白質或模型架構的自動研究模型的誕生,但還未有一個真正可用且實用的 AI 科研助手。
SciMaster 填補了這一空白。
整體而言,SciMaster 的目標是成為一個覆蓋讀、算、做、寫全流程的通用科研 AI 智能體,是目前 AI 領域多智能體化的全新探索。
首先是「讀」,SciMaster 以玻爾科研空間站為支撐,這是一個擁有 1.7 億科研文獻的龐大數據庫。當用戶提問時,SciMaster 會直接從這個文獻庫中尋找信息,進而把問題自動拆分成一系列子任務(讀、算、做、寫)執行,最終生成完整可靠的研究報告。

與此同時,SciMaster 也會基于互聯網上的信息,為用戶查詢提供更全面以及更有時效性的結果。
機器之心獲悉,在數據檢索和整合過程中,SciMaster 的大模型幻覺趨近于零,因為答案中每個論斷都可以追溯到源文獻。
其次是「算」。我們知道,智能體系統會在理解任務之后進行拆分執行,SciMaster 也是一樣,它會對任務拆分出的子問題分別調用工具,并行執行多個子任務。如果輸入的問題涉及計算,它除了會進行搜索、內容整合之外還會調用各類 AI for Science 的計算工具。
SciMaster 未來也可以「做」實驗。如果你提出的需求涉及后續實驗驗證,SciMaster 可以直接調用 Uni-Lab 提供的 MCP 服務,從而連接自動化實驗室系統,進行濕實驗。最后,數據會返回到科研報告中。
最后是「寫」,根據收集到的相關信息與文獻內容,SciMaster 的核心模塊之一 InfoMaster 會生成深度調研報告,支持一鍵導出 PDF 和鏈接分享。
SciMaster 的特點不僅在于自動進行的科研,也包含一定的人機協作機制。在 SciMaster 進行深度思考、規劃任務時,我們可以點擊暫停,在「深度思考」框內對任務邏輯、內容進行修改,實時指揮 AI 調整策略,這樣就能讓 SciMaster 更準確地響應用戶的需求。
看起來一個既能幫你尋找 idea,又能幫你實現的科研 AI 出現了,或許這會成為未來人與 AI 共同進行科學探索的范式。
SciMaster 是這樣煉成的
再仔細搜索網絡上的信息,我們發現其實在本月初,上海交大、深勢科技就在一篇論文中介紹了 SciMaster 的工作流程、機制和能力。該研究在 X 等社交平臺上也引發了關注。

- 論文標題:SciMaster: Towards General-Purpose Scientific AI Agents
- 論文鏈接:https://arxiv.org/abs/2507.05241
作為 SciMaster 系列研究成果的 Part I,這篇論文關注的重點是 SciMaster 智能體所使用的基礎架構 X-Master。
具體來說,如下圖所示,X-Master 是深勢科技開發的一套工具增強型推理智能體:給定一個用戶查詢,該智能體首先會開始思考過程。在此過程中,工具調用等與環境的交互是通過生成 Python 代碼片段實現的。執行所得到的結果將被附加到智能體的上下文中,進而豐富其理解并為其后續思考提供信息。
AI 自動使用 Python 代碼來表示交互意圖,意味著其實現的功能具備通用性、準確性以及較高的兼容性,讓科研智能體的指令遵循能力大大加強。

X-Master 是一款工具增強推理智能體。
在上圖這個具體案例中,X-Master 智能體進行三次交互(搜索以獲取 GitHub 鏈接,解析以獲取 arXiv 論文鏈接,然后再次解析以獲取所屬機構),然后得出了最終答案。
工作流程上,X-Master 采用了一種名為 scattered-and-stacked(分散-堆疊)的智能體工作流程。
該工作流程是讓 X-Master 扮演不同角色,以在推理時提高解答的質量。其中包括:(1)求解器(Solver)生成五個初始解答;(2)批評器(Critic)對初始解答進行細化;(3)重寫器(Rewriter)綜合所有五個解答并生成五個新解答;(4)選擇器(Selector)挑選最佳解答。

X-Masters 在高難度的 Humanity's Last Exam (HLE, 人類最后考試)基準上創造了新的 SOTA 記錄,得分達到 32.1%,超過了 OpenAI 和谷歌的 Deep Research(分別為 26.6% 和 26.9%),在 2025 年六月底,成為了首個突破 HLE 30% 大關的方案。

基于 X-Master 的配置,大模型可以基于靈活的內部推理和工具使用來模擬人類的問題解決方式,基于開源模型就能在 HLE 等具有挑戰性的基準上達到極高的性能,無需大量再訓練即可增強 LLM 能力。
我們可以期待一下 SciMaster 系列研究的后續 Part 了。
在 SciMaster 幫助下搞科研
我們實測了一下
那么,SciMaster 的實際表現如何呢?
在玻爾科研空間站(Bohrium)中打開 SciMaster,首先映入眼簾的其預置的兩大能力:通用助手和深度調研。

鏈接:https://scimaster.bohrium.com
其中,通用助手更適用于科研日常中遇到的一般問題查詢,比如檢索基本概念、查詢實驗流程、甚至提出《十萬個為什么》那樣的基礎科普問題。
深度調研則是一個具備 Deep Research 能力的「科研專家」。當研究者提出一個科學問題時,SciMaster 會對問題進行評估分析,將問題拆分成多個子任務,并靈活調用 WebSearch、WebParse、PaperSearch 三種檢索方式,檢索全域互聯網、全量文獻,收集領域相關的資訊、數據、論文、專利等資料。最后經過整理,SciMaster 會向交付用戶一份翔實可靠的調研報告。
接下來,我們就通過一些實際任務來看看 SciMaster 究竟能做到什么程度?
首先,為了直觀地展示 SciMaster 的能力,我們向其通用助手提出了一個經典的科普問題:「為什么細胞是球形的?」

可以看到,SciMaster 首先會進行深度思考,對問題進行初步的分析,然后確定所要使用的工具,包括使用 web_search 來獲取一些基礎知識以及再使用 science_navigator 查找是否有相關論文討論細胞形態的物理原理。
之后,SciMaster 便會開始編寫一些 Python 腳本并實際執行這些工具,如果代碼執行出錯,SciMaster 還會進行反思,并對出錯的部分進行修正。而如果工具返回的結果不理想,它可能還會更換關鍵詞再次搜索。這種探索 + 嘗試的方式極大地模擬了人類專家解決問題的思路。
上圖右側,我們可以看到其第一次成功執行 web_search 后所檢索到的部分結果。在上面,我們也可以切換瀏覽不同工具執行后得到的結果。
而當需要更專業的生物物理學解釋時,SciMaster 會通過 science_navigator 工具查詢專業文獻,從而確保結果準確,避免幻覺。整個過程完整透明。

經過一系列的探索和信息整合,SciMaster 最終會給出一個綜合答案。可以看到,SciMaster 不僅從物理和生物學角度解釋了細胞為球形的優勢,同時還點明了我們提問中一個預設的錯誤前提 ——「細胞是球形的」。實際上,SciMaster 指出,并非所有細胞都趨于球形,比如神經元和肌肉細胞分別呈現星形分支和長纖維狀。
下圖展示了 SciMaster 解答這個問題的全過程。
長圖滾動查看
與此同時,SciMaster 還提供了便捷的分享功能,可以一鍵生成分享整個解答過程的鏈接,將所得到的結果分享出去,從而可以共享優質成果,避免重復計算,實現更加有效的溝通。比如,你可在此處查看上述查詢和解答:
https://scimaster.bohrium.com/chat/share/86c2ef04aef7477b8df3c7bdba3cc2cb
再來一個更有爭議的問題:「轉基因食物是否有害健康?」

同樣,SciMaster 依然首先是簡單分析問題,然后使用 web_search 工具,以形成對問題本身的初步了解。在通過互聯網獲得了來自權威機構的信息之后,SciMaster 也并未盲信,依然繼續進行了專業檢索,最終得出了結論:「通過安全評價的轉基因食品與傳統食品同等安全,無證據表明其危害人類健康。」

而在此基礎上,為了做到概念明確,我們還可以繼續追問:「什么是通過安全評估的轉基因食品?」而這一次,SciMaster 的思考就更加深度了。不僅引述了多個權威的定義標準,還給出了一些典型案例、政策以及依舊存在的爭議現狀。

接下來,該讓 SciMaster 深度調研上場炫技了:「為 CRISPR 基因編輯寫一份綜述報告」。
可以看到,與通用助手類似,SciMaster 同樣第一步是分析問題;不同的是這一次其分析的深度和廣度都有明顯提升,另一個非常明顯的區別是在使用深度調研時,SciMaster 的工作語言會切換成英語,如此能夠針對專業術語等進行更加深度的搜索,避免了專業文獻在翻譯過程中可能出現的錯漏和幻覺問題。

然后,它會制定更加詳細的計劃,包括綜述報告的內容規劃、所要用到的工具以及具體將要執行的研究步驟。
實際上,這個過程背后,正是其論文中提到的分散 - 堆疊的智能體工作流程在發揮作用。多個智能體分別扮演求解器、批評器、重寫器和選擇器,通過層層探索和優化,以確保報告的深度和廣度。
接下來,SciMaster 便會按照自己的計劃逐步執行,并最終生成一份內容詳情且帶有豐富參考資料的報告 —— 不用擔心,如果你使用的是中文頁面,那么生成的最終報告也會是中文版。

當然,SciMaster 也支持將最終報告下載成 PDF 文件,你可以在這里查看和下載:
https://scimaster.bohrium.com/chat/share/4925c3b83b1244c685bd247af21e9573
整體實測下來,我們的最大感受是:強大、可靠、透明。
SciMaster 的強大之處在于能在短短半小時內完成原本人類研究者需要花費數小時乃至數天時間完成的深度調研課題。而說它可靠,是因為它能有效抑制大語言模型(LLM)司空見慣的幻覺問題;通過強制性的文獻溯源和交叉驗證,SciMaster 提供的每一個關鍵信息都有據可查,這對于嚴謹的科研工作至關重要。最后,它的透明體現在會將自己的思考過程完全開放給用戶;我們可以非常明晰地了解它為了解決問題究竟采用了怎樣的方法和工具。
可以說,對科研工作者而言,SciMaster 的價值遠不僅僅是一個搜索引擎或寫作工具,更是一個不知疲倦、知識淵博的科研助手。不知當 SciMaster 再進一步進化,真正做到「讀算做寫」四項全能時,我們又將見證怎樣的驚喜。
AI for Science 的浪潮才剛剛開始
用 AI 搞科研,如今已不再是遙遠的想象,而是人人都可實踐的現實。
前幾天,馬斯克在發布 Grok 4 時曾說過,如果在今年底之前 AI 不能完成新的科學發現,他會很驚訝。Grok 4 展示出來的科學探索能力已經給我們留下了很深的印象,不過它畢竟是通用大模型,真正要落到科研上,我們還需要更加專業的工具。實際上,我們已經在 AI 領域看到了利用 AI 來發現新模型架構的研究正在涌現。
在 AI 與生命科學、醫藥、新材料等交叉的垂直領域中,同樣不斷涌現的新技術正在吸引著我們的眼球。在去年 10 月諾貝爾獎的評選中,來自 DeepMind 的 AI 蛋白質結構預測方法獲得化學獎,成功為生物學領域的 AI 輔助研究正名。
而在更廣泛的科研領域上,我們也在看到希望,SciMaster 就是一個很好的開始。
這不得不讓我們再次對于國內的 AI 刮目相看。自 DeepSeek-R1 開源以來,世界已經再次刷新了對于中國 AI 技術的認知,國內科技公司正不斷以創新的方法、更低成本、高效率的方法席卷全球市場。其實在 AI for Science 的賽道上,中國科技公司投入得更早,布局得更快,可以說早早領先了身位。未來,AI 科學家的落地可能會持續推動科學技術前沿的發展。SciMaster 的問世,正是這一前瞻性布局的集中體現。
正如其技術報告中寫到的那樣,SciMaster 并非一個孤立的產品,而是一個宏大系列研究的開篇。深勢科技表示,SciMaster 未來也將覆蓋更加廣泛科學知識的訴求,目標是開發出通用的科研 AI 智能體。一個由 AI 驅動的、人人皆可參與的科研新時代,或許真的不遠了。
























