精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)

發(fā)布于 2025-9-17 07:36
瀏覽
0收藏


能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

谷歌全新人工智能系統(tǒng)將大型語言模型(LLMs)與樹搜索(Tree Search)技術相結合,實現(xiàn)了專家級科學軟件的自動化創(chuàng)建。通過將研究重構為“可評分任務”,該系統(tǒng)在生物信息學、流行病學和神經(jīng)科學領域展現(xiàn)出超越人類的性能,預示著加速科學發(fā)現(xiàn)的新時代到來。

假設你是一名科學家,正凝視著屏幕。你的目標是研究亞馬遜雨林的森林砍伐問題——你已掌握拍字節(jié)(PB)級別的衛(wèi)星數(shù)據(jù),但要將這些原始數(shù)據(jù)轉化為可靠的“森林砍伐檢測工具”,還需要專門的軟件支持。這絕非普通軟件,而是實證軟件(empirical software) ——一組復雜的代碼組合,需經(jīng)過精心設計,以最大化單一可測量的質(zhì)量分數(shù)。從數(shù)據(jù)預處理到模型架構,每一個選擇都如同道路的岔路口,而可供選擇的路徑幾乎無窮無盡。

你該如何選擇?

數(shù)十年來,答案始終離不開深厚的領域專業(yè)知識、直覺判斷、有根據(jù)的猜測,以及耗時費力的反復試驗。這一過程——即實證軟件的人工創(chuàng)建過程——是制約現(xiàn)代研究發(fā)展的“隱形痛點瓶頸”。它效率低下、枯燥繁瑣,且嚴重受限于人類的能力邊界:我們只能探索極小部分可能的解決方案。

若能改變這一現(xiàn)狀呢?若能構建一個不僅能協(xié)助科學家,還能主動代其探索這片廣闊可能性空間的系統(tǒng)呢?

谷歌團隊發(fā)表的一篇突破性論文《一款助力科學家編寫專家級實證軟件的人工智能系統(tǒng)》(“An AI system to help scientists write expert-level empirical software”),恰好揭開了這類系統(tǒng)的面紗。這并非人工智能輔助編碼領域的又一小步迭代,而是人類探索計算科學方式的根本性范式轉變。該團隊開發(fā)的人工智能系統(tǒng)能夠系統(tǒng)性地自動生成科學軟件,且在眾多學科領域中,其性能不僅能與人類持平,還能持續(xù)超越人類專家。

接下來,我們將深入探討谷歌如何打造出這款能夠加速科學本身發(fā)展的人工智能。

科學領域的隱形瓶頸:實證軟件的“創(chuàng)建之痛”

在深入了解谷歌的解決方案前,我們首先需要認清問題的嚴重性。如今,從基因組學到天體物理學,幾乎所有學科都依賴軟件來驗證假設、實現(xiàn)發(fā)現(xiàn)。其中大部分軟件被論文稱為“面向可評分任務的實證軟件”。

可評分任務(Scorable Task):指可通過明確指標衡量解決方案質(zhì)量的科學問題。例如,預測新冠病毒(COVID-19)住院人數(shù)就是一項可評分任務,其中“加權區(qū)間分數(shù)(Weighted Interval Score,WIS)”即為質(zhì)量指標。而用于實現(xiàn)該預測的軟件就是實證軟件。

創(chuàng)建這類軟件堪稱一項“赫拉克勒斯式的艱巨任務”。盡管實證軟件曾助力化學、蛋白質(zhì)折疊等領域取得諾貝爾獎級別的突破,但其創(chuàng)建過程始終停留在“手工匠人式”的階段。科學家們往往被迫基于直覺或便利性做出無數(shù)設計選擇,而非通過全面的實驗驗證。

  • 我應選擇哪種統(tǒng)計模型?
  • 如何預處理這些含噪聲的數(shù)據(jù)?
  • 哪些超參數(shù)能帶來最佳結果?
  • 是否應結合兩種不同的理論方法?

每個問題都代表一個分支節(jié)點。潛在程序的總數(shù)構成了一個“解決方案空間”,其規(guī)模之龐大,任何人類團隊都無法完全探索。我們找到的只是“足夠好”的解決方案,但在那些未被探索的分支中,幾乎必然隱藏著具有革命性的發(fā)現(xiàn)——而這些發(fā)現(xiàn)正被我們遺憾地錯過。

這一局限嚴重拖累了科學進步的步伐。若能更高效地探索這片解決方案空間,我們本可以為更多疾病建立模型、預測更多氣候模式。

谷歌的解決方案:能“撰寫科學”的人工智能系統(tǒng)

谷歌團隊的核心洞見在于重新定義這一挑戰(zhàn)的本質(zhì):不再將軟件創(chuàng)建視為人類執(zhí)行的任務,而是將其視為人工智能可解決的“搜索問題”。最終目標是:在廣闊的解決方案空間中,找到能最大化質(zhì)量分數(shù)的特定程序。

為實現(xiàn)這一目標,團隊構建了一個如同“不知疲倦、才華橫溢且極具系統(tǒng)性的研究助手”的系統(tǒng)。它基于一個簡單卻深刻的反饋循環(huán)運行:提出方案→測試驗證→學習改進→循環(huán)迭代

該系統(tǒng)的核心由兩個協(xié)同工作的組件構成:

  1. 創(chuàng)意編碼器(大型語言模型——LLM):這是系統(tǒng)的“創(chuàng)新引擎”。給定問題描述和當前最優(yōu)代碼后,LLM的任務是重寫代碼,提出可能提升分數(shù)的智能“變異(mutation)”。它就像一位出色的程序員,能根據(jù)高層級思路,瞬間生成代碼的新版本。
  2. 策略主導者(樹搜索——TS):這是系統(tǒng)的“核心大腦”。若缺乏策略指導,生成無數(shù)代碼變體將毫無意義。樹搜索算法會智能引導探索過程:它會構建一個包含所有已嘗試代碼解決方案的“樹結構”,記錄有效與無效的方案。關鍵在于,它會通過平衡“利用(exploitation)”與“探索(exploration)”來決定下一步探索的路徑——“利用”指對已有高分程序進行小幅調(diào)整,“探索”則指嘗試全新且具有風險、可能帶來重大突破的思路。

不妨將其比作國際象棋大師:樹搜索算法如同大師,俯瞰全局棋盤并規(guī)劃多步之后的走法;而LLM則像大師可咨詢的一組世界級棋手,大師會向他們提問:“從當前局面出發(fā),有哪些有創(chuàng)意的走法可嘗試?”隨后,大師會綜合這些建議,選擇符合整體獲勝策略的走法。

這種組合將緩慢的人工科學編碼過程,轉化為自動化、系統(tǒng)性且可規(guī)模化的“高分解決方案搜索過程”。

探索引擎的內(nèi)部機制:LLM與樹搜索如何開辟新領域

讓我們揭開“引擎蓋”,看看這一系統(tǒng)的實際運作方式。LLM與樹搜索算法的協(xié)作,就像一場精心編排的舞蹈。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

本方法的示意圖與性能表現(xiàn)。a,本方法算法的示意圖:將可評分任務及用于解決該任務的研究思路輸入LLM,LLM在“沙箱(sandbox,安全測試環(huán)境)”中生成用于評估該可評分任務的代碼。隨后,代碼被嵌入樹搜索算法中,新節(jié)點的選擇會平衡“利用”與“探索”,并從LLM中采樣(具體方法見“方法”章節(jié))。b,代碼生成方法在Kaggle Playground基準測試中的性能表現(xiàn):結果顯示16項任務的公共排行榜百分位平均性能。基于本方法的模型以粗體標注。誤差線代表標準差。BDT,梯度提升決策樹(boosted decision tree)。c,用于生成解決科學問題的初始研究思路的機制。

整個過程始于一個初始提示詞(prompt),其中包含AI啟動所需的所有信息:

  • 科學問題描述(例如“預測新冠病毒住院人數(shù)”);
  • 具體評分指標(例如“最小化加權區(qū)間分數(shù)WIS”);
  • 相關數(shù)據(jù)的訪問權限;
  • 初始代碼(可非常簡單,如基礎模板)。

該提示詞被發(fā)送至LLM后,LLM會生成第一個候選解決方案。代碼在安全的“沙箱環(huán)境”中執(zhí)行,其性能會被評分——至此,樹搜索正式啟動。

該算法基于因AlphaGo而聞名的樹預測Upper Confidence邊界算法(Predictor + Upper Confidence bound for Trees,PUCT) 構建可能性樹。樹中的每個節(jié)點都是一個完整、可運行的軟件片段。為決定下一個待擴展的節(jié)點,PUCT會為每個候選節(jié)點計算一個“價值分數(shù)”,該分數(shù)同時兼顧節(jié)點的已知性能和未來改進潛力。

這一設計可避免系統(tǒng)陷入“局部最優(yōu)陷阱”:若系統(tǒng)僅對高分代碼進行調(diào)整(純“利用”),可能會錯過另一種最終性能更優(yōu)的全新方法;而通過將部分搜索資源分配給探索較少的分支(“探索”),系統(tǒng)能夠實現(xiàn)類似人類“概念飛躍”的突破,進而催生真正的創(chuàng)新。

更重要的是,該系統(tǒng)并非盲目搜索——它能結合人類知識進行引導。提示詞可通過多種渠道補充“研究思路”:

  • 科學論文:系統(tǒng)可利用另一款LLM閱讀并總結相關學術論文,將核心思路直接注入提示詞;
  • 專家建議:人類科學家可提供高層級策略建議,例如“嘗試將線性模型與梯度提升機結合”或“重點優(yōu)化特征工程的魯棒性”;
  • 過往解決方案:最巧妙的是,系統(tǒng)能從自身成功經(jīng)驗中學習——它可提取兩個此前發(fā)現(xiàn)的高分解決方案,讓LLM將二者“重組”,生成融合兩者優(yōu)勢的全新混合方案。

這種整合外部知識、生成新型混合方案的能力,正是系統(tǒng)的“超能力”。它模仿了人類科學發(fā)現(xiàn)的過程——“站在巨人的肩膀上”——但執(zhí)行規(guī)模和速度遠超人類能力極限。

技術深度解析:引導式進化與思路重組的藝術

對于希望深入了解機制的讀者,我們將聚焦兩個關鍵技術細節(jié):搜索算法與“思路重組”過程。

PUCT搜索算法

樹搜索的核心并非簡單選擇分數(shù)最高的節(jié)點,而是通過PUCT公式計算并選擇下一個待擴展的節(jié)點??u*??:

??u* = argmax(u) [RankScore(u) + C * P(u) * sqrt(N_total) / (1 + V(u))]??

我們將在不陷入復雜數(shù)學的前提下拆解這一公式:

1. RankScore(u):這是“利用”項,代表該代碼解決方案迄今為止的表現(xiàn)優(yōu)劣——分數(shù)越高,表明這是一條已知的優(yōu)質(zhì)路徑。

2. C * P(u) * sqrt(N_total) / (1 + V(u)):這是“探索”項,各參數(shù)含義如下:

  • ??P(u)??:先驗概率(系統(tǒng)初始時認為所有路徑的可能性均等);
  • ??V(u)??:該節(jié)點的訪問次數(shù)——若某節(jié)點被訪問多次,此項數(shù)值會變小,系統(tǒng)選擇該節(jié)點的概率也會降低;
  • ??N_total??:總模擬次數(shù)——隨著搜索推進,此項會促使系統(tǒng)去探索訪問較少的節(jié)點;
  • ??C??:控制“利用”與“探索”權衡關系的常數(shù)——C值越大,系統(tǒng)越傾向于探索。

這一簡潔的公式讓系統(tǒng)能夠動態(tài)調(diào)整策略:既聚焦有潛力的路徑,又不放棄對新穎思路的嘗試。它為管理龐大的搜索空間提供了一套嚴謹?shù)姆椒ㄕ摗?/p>

程序化思路重組

這或許是最令人興奮的技術細節(jié)。假設系統(tǒng)已完成兩次獨立搜索,為單細胞RNA測序(scRNA-seq)的批次整合任務找到了兩個性能優(yōu)異但思路迥異的解決方案:一個基于??ComBat???方法,另一個基于??BBKNN??方法。人類科學家可能需要數(shù)周時間研究兩者,才能想出融合方案——而AI系統(tǒng)可實現(xiàn)這一過程的自動化。具體步驟如下:

1. 提取最優(yōu)代碼:系統(tǒng)從??ComBat???搜索樹和??BBKNN??搜索樹中,分別提取最終的最高分代碼。

2. 基于LLM的分析:系統(tǒng)將兩個代碼解決方案輸入LLM(如論文實驗中使用的Gemini 2.5 Flash),并附帶特定提示詞:

“對比這兩個代碼解決方案……解釋兩者在核心原理上的差異。”

3. 生成混合提示詞:LLM對差異的解釋會被程序化地嵌入一個新的提示詞中,用于啟動新的樹搜索。該新提示詞會明確指示系統(tǒng):

“請設計一種算法,融合兩種策略的優(yōu)勢部分,構建一種出色的混合策略,使其性能分數(shù)高于兩種單獨策略中的任意一種。”

4. 啟動新搜索:以“重組思路”為起點的全新樹搜索正式啟動,此時LLM的核心目標是生成能智能融合兩種“父思路”的代碼。

這種自動化的“分析→合成→實現(xiàn)”過程,是強大的創(chuàng)新引擎。正如我們將在下文看到的,這些AI生成的混合方案往往能超越兩種“父方案”的性能。

從理論到實踐:跨科學領域的“超人類”成果

該系統(tǒng)實力最有力的證明,在于其在真實科學基準測試中的表現(xiàn)。谷歌團隊在六個極具多樣性和挑戰(zhàn)性的領域對其進行了測試,結果令人震驚。

案例研究1:重塑單細胞分析領域的生物信息學

挑戰(zhàn):單細胞RNA測序(scRNA-seq)讓我們能夠研究單個細胞,但來自不同實驗室或實驗的數(shù)據(jù)集(稱為“批次”)存在技術差異,會掩蓋真實的生物信號。“批次整合(batch integration)”是消除這類技術噪聲的關鍵任務,同時也是一大難題——目前已有近300種相關工具,該領域競爭異常激烈。

結果:研究團隊在OpenProblems基準測試(該任務的公共排行榜)中對AI系統(tǒng)進行了測試:

  • 系統(tǒng)開發(fā)出40種全新方法,全部超越排行榜上已有的所有方法;
  • 其表現(xiàn)最佳的解決方案是對BBKNN(一種常用批次整合方法)的改進版本,相比已發(fā)表的最優(yōu)方法,**整體性能提升了14%**;
  • 突破點:系統(tǒng)并非簡單優(yōu)化BBKNN的實現(xiàn)——如以下圖表所示,它發(fā)現(xiàn)了一項關鍵創(chuàng)新:將BBKNN與另一種方法??ComBat??(批次效應校正方法)結合,在“尋找鄰居”前先對數(shù)據(jù)進行校正。這一混合思路由系統(tǒng)自主發(fā)現(xiàn),正是其性能領先的核心原因。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

樹搜索在scRNA-seq批次整合任務中的性能表現(xiàn)。a,批次整合任務示意圖:對不同數(shù)據(jù)集(青綠色和紅色)進行處理,消除數(shù)據(jù)中的批次效應,同時保留生物變異性。b,樹搜索方法(方法名稱以粗體標注,后綴為“(TS)”)與已發(fā)表的同類方法在OpenProblems基準測試v2.0.0中的性能對比。“按細胞類型添加抖動的完美嵌入(Perfect embedding by celltype with jitter)”是代表最佳可能性能的陽性對照方法,“按批次隨機整合(Shuffle integration by batch)”是不進行任何批次整合的陰性對照方法。“整體分數(shù)(Overall score)”是所有數(shù)據(jù)集和指標的平均值。“數(shù)據(jù)集(Datasets)”列中的每一項均為該數(shù)據(jù)集所有指標的平均值。“指標(Metrics)”列中的每一項均為該指標在所有數(shù)據(jù)集上的平均值。若指標無法計算或性能低于最低陰性對照,則賦值為0,顯示為空。c,表現(xiàn)最佳的批次平衡k近鄰(BBKNN)實現(xiàn)版本的性能提升與代碼創(chuàng)新標注:在第429次實現(xiàn)嘗試中引入了基于ComBat的嵌入生成方法。d,OpenProblems基準測試v2.0.0中,非對照方法、有無思路重組的本方法、Gemini深度研究(Gemini Deep Research)方法以及帶AI協(xié)科學家(AI co-scientist)的本方法的整體分數(shù)。Y軸下限為陰性對照方法“按批次隨機整合”的整體分數(shù)。未顯示7種重組方法、5種基礎方法和2種未達此性能的AI協(xié)科學家方法。*表示該方法為重組方法(即使未明確提示重組)。TS,樹搜索(tree search);fastMNN、mnnCorrect,均為batchelor工具包中的批次整合方法。

這一結果意味著什么?它表明,人工智能現(xiàn)在可以進入一個復雜、成熟的生物信息學領域,并在幾小時內(nèi)發(fā)明出優(yōu)于人類數(shù)年研究成果的全新解決方案。

案例研究2:用更智能的新冠模型“超越疫情預測極限”

挑戰(zhàn):預測新冠病毒住院人數(shù)是一項關鍵的公共衛(wèi)生任務。美國疾病控制與預防中心(CDC)協(xié)調(diào)管理的“新冠預測中心(COVID-19 Forecast Hub)”匯總了數(shù)十個專家團隊的模型,其中“新冠中心集成模型(CovidHub Ensemble)”(融合最優(yōu)模型的結果)是準確性的黃金標準——要超越這一模型難度極大。

結果:谷歌團隊對2024-2025賽季進行了回顧性研究:

  • AI系統(tǒng)生成了14種不同的預測策略,全部超越官方的“新冠中心集成模型”;
  • 其最終的“谷歌回顧性模型(Google Retrospective)”平均WIS得分為26,顯著優(yōu)于集成模型的29(分數(shù)越低越好);
  • 協(xié)同混合優(yōu)勢:系統(tǒng)發(fā)現(xiàn),性能最佳的模型均為“混合模型”——它持續(xù)將簡單穩(wěn)定的“氣候學基礎模型”與復雜且響應迅速的“自回歸模型”融合,生成了兼具魯棒性和高適應性(能快速應對最新趨勢)的全新模型——這一復雜策略完全由AI自主發(fā)現(xiàn)。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

樹搜索在新冠病毒預測任務中的性能表現(xiàn)。a,預測實驗中使用的滾動驗證窗口:每次搜索的輸出結果在之前的時間段(藍色)進行內(nèi)部驗證,生成的模型隨后用于其對應預測周期(橙色)的預測。訓練數(shù)據(jù)包括2020年8月8日及之后、驗證集之前的所有日期。b,時間序列排行榜:顯示各參與團隊和“谷歌回顧性模型”的每周預測性能(平均WIS),按平均WIS排序。分數(shù)為所有52個轄區(qū)和4個預測時間范圍的匯總結果。每個單元格內(nèi)的數(shù)字為該模型當周的絕對平均WIS。單元格背景色直觀顯示相對于“新冠中心集成模型(CovidHub-ensemble)”的性能:藍色表示W(wǎng)IS更低(性能更好),紅色表示W(wǎng)IS更高(性能更差)。c,本模型與“新冠中心集成模型”在轄區(qū)層面的預測誤差(平均WIS)直接對比:表明本模型在大多數(shù)地區(qū)的性能更優(yōu)。d,本模型在2024/25新冠賽季全周期內(nèi)預測誤差(平均WIS)的地理分布:誤差值越低(顏色越淺),性能越好。e,不同建模策略的匯總預測性能對比:包括新冠中心競賽的基準模型、本研究的回顧性模型、對提交模型的復現(xiàn)結果、通過重組生成的新型混合模型、深度研究模型(Deep Research)和AI協(xié)科學家模型。在3周評估周期(3個參考日期×4個時間范圍×52個轄區(qū))內(nèi),有14種策略(10種重組策略、2種深度研究策略、1種AI協(xié)科學家策略和1種復現(xiàn)基準策略)的性能超越官方“新冠中心集成模型”。未顯示性能低于“新冠中心基準模型(CovidHub-baseline)”的模型。

這一案例證明,該系統(tǒng)能夠在高風險、高競爭的環(huán)境中運作,并生成性能優(yōu)于數(shù)十個人類專家團隊集體智慧的策略。

案例研究3:從斑馬魚大腦到復雜積分運算

研究團隊還在其他多個領域測試了系統(tǒng)的通用性:

  • 地理空間分析:在DLRSD基準測試(用于衛(wèi)星圖像分割)中,AI生成的解決方案平均交并比(mean Intersection over Union,mIoU)得分超過0.80,顯著優(yōu)于此前的學術領域最優(yōu)結果;
  • 神經(jīng)科學:在ZAPBench基準測試(用于預測幼體斑馬魚全腦神經(jīng)活動)中,系統(tǒng)生成的模型性能超越所有其他基準模型(包括復雜的視頻基模型),且訓練速度快了數(shù)個數(shù)量級——在單塊GPU上訓練僅需不到2小時,而對比模型在16塊A100 GPU上訓練需36小時;
  • 數(shù)值分析:最令人驚訝的是,團隊還讓系統(tǒng)解決了一個純數(shù)學問題:求解標準且高度權威的??scipy.integrate.quad()??函數(shù)無法處理的復雜積分。系統(tǒng)從調(diào)用??quad()??的簡單代碼開始,逐步優(yōu)化,最終生成了一個復雜的全新程序——在19個“無法求解”的預留積分問題中,該程序正確求解了17個,相當于為這類特殊場景提供了一個可直接替代標準庫函數(shù)的解決方案。

能 “替科學家寫代碼” 的 AI 來了!谷歌新系統(tǒng)突破科研瓶頸,加速科學發(fā)現(xiàn)-AI.x社區(qū)

各模型在DLRSD基準測試中的性能對比表:表格顯示了樹搜索解決方案和參考論文中方法的發(fā)表年份、架構、關鍵特征及報告的平均交并比(mIoU)。

在所有領域中,結果都指向同一個結論:自動化系統(tǒng)能夠系統(tǒng)性地探索可能的程序空間,并找到性能等同于甚至優(yōu)于人類多年專注研究成果的解決方案。

未來屬于“可評分”:我們正處于科學革命的臨界點嗎?

這項研究的潛在影響怎么強調(diào)都不為過——我們正在見證一個“計算發(fā)現(xiàn)過程被根本性加速”的未來。

反復試驗是科學進步的核心……該系統(tǒng)能以極快的速度生成專家級解決方案,將一組思路的探索時間從數(shù)周或數(shù)月縮短至數(shù)小時或數(shù)天。以這種方式加速研究,將對科學發(fā)展產(chǎn)生深遠影響。

這項技術為科學研究增添了一件全新的“利器”:對于任何可通過“評分”衡量進步的領域,都可部署該系統(tǒng)。試想這樣一個未來:

  • 材料科學家為新型電池電解質(zhì)的“效率與穩(wěn)定性”定義“質(zhì)量分數(shù)”,AI系統(tǒng)探索化學和模擬空間,提出全新候選材料;
  • 氣候科學家讓AI優(yōu)化全球氣候模型中“云形成參數(shù)化”(一項眾所周知的“可評分任務”);
  • 制藥公司利用類似系統(tǒng)優(yōu)化臨床試驗設計,探索能最大化患者療效和統(tǒng)計效力的方案。

當然,該系統(tǒng)并非萬能藥。其主要局限在于,它需要以“可評分任務”為前提——而許多科學研究具有探索性,無法簡化為單一數(shù)值。此外,對“解決方案背后原理”的解釋仍需人類洞察力:系統(tǒng)能發(fā)現(xiàn)性能卓越的新型方法組合,但理解其成功的深層理論原因,仍是人類的任務。

但對于日益龐大的“計算型科學領域”而言,這無疑是一個分水嶺。我們正從“科學家使用軟件作為工具”的時代,邁向“科學家與軟件作為創(chuàng)新伙伴協(xié)作”的時代。

谷歌的這篇論文不僅展示了一款強大的新型人工智能,更讓我們得以窺見未來:人類直覺的瓶頸被打破,科學發(fā)現(xiàn)的速度僅受限于“提出正確問題”和“定義正確評分標準”的能力。

科學革命由新工具驅動——望遠鏡、顯微鏡莫不如此。而這款人工智能探索引擎,或許將成為21世紀最具決定性的科學工具。

核心要點

  • 新范式:科學軟件開發(fā)可被定義為一個搜索問題,借助人工智能實現(xiàn)自動化,從而加速科學發(fā)現(xiàn)。
  • LLM + 樹搜索:系統(tǒng)核心是“創(chuàng)意LLM代碼生成器”與“策略樹搜索算法”的強大組合,后者負責引導對可能解決方案的探索。
  • 知識整合:系統(tǒng)的真正優(yōu)勢在于其整合外部知識的能力——可融入論文、專家建議及自身過往發(fā)現(xiàn)(思路重組)中的研究思路。
  • 超人類性能:在生物信息學、流行病學等多樣且競爭激烈的科學領域,該系統(tǒng)已展現(xiàn)出超越專家水平的領域最優(yōu)性能。
  • 加速科學:通過自動化實證軟件的人工創(chuàng)建過程,這一方法有望從根本上提升科學進步的速度。

參考文獻

Aygün, E., Belyaeva, A., Comanici, G., et al. (2025). An AI system to help scientists write expert-level empirical software. arXiv:2509.06503v1

本文轉載自?????????AIGC深一度??

收藏
回復
舉報
回復
相關推薦
日韩精品中文字幕久久臀| 亚洲美女淫视频| 国产精品99导航| 精品少妇一区二区三区密爱| 国语精品视频| 欧美午夜女人视频在线| 亚洲精美视频| 人妻少妇精品无码专区| 日韩黄色片在线观看| 欧美大尺度在线观看| 中文乱码人妻一区二区三区视频| 色综合天天色| 亚洲影院在线观看| 欧美精品一区二区视频| 国产精品怡红院| 亚洲一区日韩| 欧美富婆性猛交| 欧美色精品在线视频| 精品电影一区二区| 久久久噜噜噜www成人网| 日本欧美在线视频免费观看| 国产a区久久久| 国产精品视频自拍| 99久在线精品99re8热| 午夜精品毛片| 国产亚洲精品久久| 免费黄色三级网站| 免费精品一区二区三区在线观看| 色噜噜狠狠色综合欧洲selulu| 国产人妻人伦精品| 99re在线视频| 久久久不卡网国产精品一区| 国产激情美女久久久久久吹潮| 中文字幕理论片| 久久精品道一区二区三区| 欧美激情18p| 国产极品美女在线| 青草国产精品| 亚洲深夜福利在线| 亚洲天堂成人av| 精品av导航| 欧美成人精品福利| 亚洲国产日韩在线一区| 亚洲伦理一区二区| 欧美日韩国产另类一区| av在线无限看| av在线一区不卡| 色妞www精品视频| 精品国产成人av在线免| 小草在线视频免费播放| 亚洲福利国产精品| 日本免费成人网| 秋霞在线视频| 夜夜揉揉日日人人青青一国产精品 | 国产精一品亚洲二区在线视频| 国产精品福利在线| 国产精品无码粉嫩小泬| 日韩二区在线观看| 国产精品久久一区主播| 人人妻人人爽人人澡人人精品| 亚洲欧美不卡| 国产成人精品久久二区二区91| 日本视频在线观看免费| 欧美中文字幕| 国产精品wwwwww| 亚洲字幕av一区二区三区四区| 麻豆成人久久精品二区三区红| 国产精品美女免费| 国产一区二区三区四区视频| 韩国av一区二区三区| 91国产在线播放| 亚洲爱爱综合网| 99久久国产综合精品色伊| 久久超碰亚洲| yes4444视频在线观看| 国产精品大尺度| 中文字幕超清在线免费观看| 在线看女人毛片| 欧美日韩亚洲系列| 亚洲成人福利在线| 1204国产成人精品视频| 亚洲第一福利网站| x88av在线| 中文字幕免费一区二区| 91国语精品自产拍在线观看性色| www.久久精品视频| 国产一区在线视频| 精品欧美一区二区在线观看视频| 国产在线超碰| 一区二区在线免费观看| 久久婷婷五月综合色国产香蕉| 香蕉视频亚洲一级| 欧美一级久久久| 制服丝袜第二页| 97精品一区| 亚洲3p在线观看| 中文字幕在线观看精品| 成人高清伦理免费影院在线观看| 欧美国产视频在线观看| 欧美午夜电影一区二区三区| 午夜成人免费电影| 在线观看国产福利| 老牛精品亚洲成av人片| www.久久久久| 中文在线第一页| 国产99久久久精品| 婷婷精品国产一区二区三区日韩| 欧美性video| 欧美丝袜自拍制服另类| 动漫美女无遮挡免费| 欧美日韩激情在线一区二区三区| 欧美国产视频一区二区| 中文字幕在线观看你懂的| 成人av先锋影音| 黄色免费高清视频| 精品欧美一区二区三区在线观看| 日韩欧美一级在线播放| 美女网站视频色| 午夜综合激情| 国产亚洲一区二区三区在线播放| 77导航福利在线| 色婷婷亚洲婷婷| 伊人久久一区二区三区| 影视一区二区| 国产欧美一区二区三区四区 | 精品国产乱码久久久久久樱花| 日韩高清a**址| 久青草免费视频| 精品一区二区日韩| 亚洲成人a**址| 欧美7777| 亚洲欧美日韩在线高清直播| 国产精品99无码一区二区| 国产乱国产乱300精品| 亚洲精品第一区二区三区| 免费观看亚洲| 精品无人国产偷自产在线| 国产精品成人av久久| 精品一区二区三区在线观看国产 | 免费黄色网址在线观看| 欧美日韩国产精品一区| 日本人添下边视频免费| 伊人蜜桃色噜噜激情综合| 51国产成人精品午夜福中文下载| 麻豆电影在线播放| 欧美狂野另类xxxxoooo| 免费精品在线视频| 精东粉嫩av免费一区二区三区| 色播亚洲视频在线观看| 主播大秀视频在线观看一区二区| 亚洲视频在线视频| 国产一级片免费在线观看| 久久精品夜色噜噜亚洲aⅴ| 日韩中文字幕在线视频观看 | 亚洲精品美女久久久久| 日操夜操天天操| 92精品国产成人观看免费| 少妇人妻在线视频| 天堂成人娱乐在线视频免费播放网站 | 麻豆精品蜜桃一区二区三区| 中文字幕资源网在线观看免费| 日韩av在线导航| 久久夜色精品国产噜噜亚洲av| 久久久久久一二三区| 男女无套免费视频网站动漫| 日韩激情一区| 亚洲一区二区少妇| 青春草视频在线| 亚洲精品福利免费在线观看| 久久久精品免费看| 欧美激情中文字幕一区二区| 色91精品久久久久久久久| 国产精品久久观看| 国产精品污www一区二区三区| 超碰在线99| 亚洲图片欧美午夜| 国产精品国产三级国产普通话对白 | 日韩欧美高清一区| 久久国产精品系列| 国产女主播视频一区二区| 色18美女社区| 亚洲免费播放| 亚洲最新在线| 第四色在线一区二区| 日韩av电影免费观看高清| 乱人伦中文视频在线| 欧美mv日韩mv| 无码人妻一区二区三区线| 日韩理论片在线| 久久精品综合视频| 激情文学综合丁香| 男人日女人逼逼| 97人人精品| 精品久久久久久乱码天堂| 免费高清视频在线一区| 欧美激情综合亚洲一二区| 户外极限露出调教在线视频| 欧美高清激情brazzers| 天天综合天天干| 亚洲美女少妇撒尿| 3d动漫精品啪啪一区二区下载 | 91久久久久久久久久| 成人免费观看在线观看| www.亚洲男人天堂| 日本在线丨区| 日韩欧美国产三级电影视频| 国产裸体美女永久免费无遮挡| 亚洲黄色av一区| 超薄肉色丝袜一二三| 波多野结衣在线一区| 伊人五月天婷婷| 日一区二区三区| 日韩国产一级片| 亚洲国产精品久久久久蝴蝶传媒| 免费av一区二区三区| 亚洲超碰在线观看| 国产欧美日韩专区发布| 性欧美又大又长又硬| 久久91精品国产| 黄色免费在线看| 中文字幕国产亚洲| 黄色av网站在线免费观看| 日韩av在线网| 人妻精品一区一区三区蜜桃91| 91精品国产欧美一区二区18| 少妇又紧又色又爽又刺激视频 | 538在线视频观看| 中文日韩欧美| 久久久久久久久久网| 欧美精选在线| 黄色网址在线免费看| 日韩.com| 亚洲国产高清国产精品| 九九久久成人| 欧美日韩成人一区二区三区 | 亚洲精品国产精品国产自| www.黄色小说.com| 欧美一区二区在线免费观看| 亚洲天堂狠狠干| 欧美三区在线视频| 免费黄色一级大片| 色综合天天综合网天天看片| 亚洲一区欧美在线| 亚洲国产sm捆绑调教视频 | 91在线视频免费看| 国产性猛交xxxx免费看久久| 久久天堂电影| 国产亚洲成精品久久| 亚洲人在线观看视频| 日韩黄色av网站| 日本大片在线观看| 亚洲一级黄色av| 亚洲欧美视频一区二区| 上原亚衣av一区二区三区| 9191在线观看| 久久福利视频导航| 免费毛片在线看片免费丝瓜视频| 欧美激情免费视频| 国产高清视频色在线www| 91国产视频在线播放| 中文日产幕无线码一区二区| 国产91精品网站| 国产情侣一区二区三区| 91久久国产综合久久91精品网站| 成人午夜888| 国产精品 日韩| 天堂99x99es久久精品免费| 欧美日韩综合另类| 日韩欧美电影| 欧美极品少妇无套实战| 99视频一区| 色七七在线观看| 激情综合色播五月| 亚洲av成人精品一区二区三区| 久久综合九色欧美综合狠狠| wwwww黄色| 一区二区三区中文在线观看| 国产精品7777777| 欧美网站一区二区| www精品国产| 国产网站欧美日韩免费精品在线观看| 国产一二在线观看| 欧美成人自拍视频| 超碰一区二区| 亚洲精品免费网站| 五月天亚洲一区| 好吊色这里只有精品| 国产欧美欧美| www.久久av.com| 99精品国产99久久久久久白柏| 人与嘼交av免费| 亚洲一卡二卡三卡四卡无卡久久| 亚洲熟女综合色一区二区三区| 67194成人在线观看| 四虎成人免费在线| 久久精品人人做人人爽| 激情国产在线| 91亚洲精品在线观看| 伊甸园亚洲一区| 欧美少妇在线观看| 久久午夜视频| 亚洲麻豆一区二区三区| 亚洲国产成人一区二区三区| 豆国产97在线 | 亚洲| 欧美日韩一区不卡| 天堂视频中文在线| 久久91亚洲精品中文字幕奶水| 国产综合av| 精品在线观看一区二区| 无需播放器亚洲| 日本熟妇人妻中出| www..com久久爱| 91精品国产高清一区二区三蜜臀| 色狠狠色噜噜噜综合网| 亚洲免费成人在线| 久久精品亚洲94久久精品| 欧美精品高清| 久久久精品国产一区二区三区| 中文字幕亚洲精品乱码| 免费看污污网站| 久久久久久免费网| 日韩av综合在线| 欧美v国产在线一区二区三区| av天在线观看| 国产精品99久久久久久人 | 亚洲国产成人爱av在线播放| 麻豆网站在线观看| 国产精品入口夜色视频大尺度 | 日韩中文有码在线视频| 范冰冰一级做a爰片久久毛片| 国产一区二区高清视频| 国产精品vip| 日本少妇xxx| 亚洲免费观看高清完整版在线观看 | 精品视频导航| 亚洲经典三级| 亚洲美女在线播放| 亚洲电影第三页| 蜜臀久久99精品久久久| 欧美国产日韩一区| 99re8这里有精品热视频8在线| 在线观看污视频| 国产精品一二三区| 少妇影院在线观看| 日韩欧美国产精品| 波多野在线观看| 国产精品一区二区欧美黑人喷潮水| 欧美午夜不卡| 波多野结衣办公室双飞| 亚洲国产日韩一区二区| 免费国产黄色片| 68精品国产免费久久久久久婷婷| 国产亚洲精品美女久久| 日韩小视频在线播放| 91丨porny丨户外露出| 亚洲天堂男人av| 深夜成人在线观看| 999久久久国产999久久久| 久久国产精品免费观看| 国产成人综合网站| 久久精品视频6| 亚洲美女精品久久| 成人黄色毛片| 欧美日韩一区二区三区电影| 福利一区二区在线观看| 日韩欧美不卡视频| 亚洲性69xxxbbb| 亚洲男女网站| 少妇人妻无码专区视频| 国产亚洲人成网站| 一级黄色片免费| 欧美精品videossex88| 丝袜美腿综合| 999在线精品视频| 亚洲h在线观看| 国产高清视频在线| 成人性生交xxxxx网站| 亚洲日本成人| 日韩不卡av在线| 日韩一区二区电影在线| 2022成人影院| 亚洲自拍偷拍一区二区三区| 成人的网站免费观看| 国产九色91回来了| 欧美日韩成人在线播放| 亚洲裸色大胆大尺寸艺术写真| 亚洲天堂av线| 午夜精品成人在线| 日本蜜桃在线观看| 精品不卡一区二区三区| 麻豆精品视频在线观看| 日本一区二区三区四区五区 | 精品成人无码一区二区三区| 制服丝袜激情欧洲亚洲| 亚洲妇女成熟| 国产 欧美 日韩 一区| 日本一区二区动态图| 狠狠躁日日躁夜夜躁av| 国产在线日韩在线| 亚洲国产黄色|