精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達的AI已經開始接管整個項目了?SATLUTION自主進化代碼庫登頂SAT競賽

人工智能 新聞
NVIDIA Research 的研究人員提出了?SATLUTION,首個將 LLM 代碼進化能力從「算法內核」擴展到「完整代碼庫」規模的框架。

AI 開發復雜軟件的時代即將到來?

近年來,以 Google 的 AlphaEvolve 為代表的研究已經證明,AI 智能體可以通過迭代來優化算法,甚至在某些小型、獨立的編程任務上超越人類。然而,這些工作大多局限于幾百行代碼的「算法內核」或單個文件。

但現實世界的軟件,比如一個頂級的 SAT 求解器,是一個龐大而復雜的系統工程,包含數百個文件、精密的編譯系統和無數相互關聯的模塊。手動打造一個冠軍級求解器不僅需要極高的領域知識,而且投入產出比越來越低。

為此,NVIDIA Research 的研究人員提出了 SATLUTION,首個將 LLM 代碼進化能力從「算法內核」擴展到「完整代碼庫」規模的框架。SATLUTION 能夠處理包含數百個文件、數萬行 C/C++ 代碼的復雜項目,并在被譽為「計算理論基石」的布爾可滿足性(SAT)問題上,取得了超越人類世界冠軍的性能。

  • 論文標題:Autonomous Code Evolution Meets NP-Completeness 
  • 論文地址:https://arxiv.org/pdf/2509.07367

SATLUTION 框架通過協調 LLM 智能體,在嚴格的正確性驗證和分布式運行時反饋的指導下,直接對 SAT 求解器的代碼庫進行迭代優化。值得一提的是,在這一過程中,它還會同步地「自我進化」其進化策略與規則。

基于 2024 年 SAT 競賽的代碼庫與基準,SATLUTION 進化出的求解器不僅在 2025 年的 SAT 競賽中擊敗了人類設計的冠軍,而且在 2024 年的基準測試集上,其性能也同時超越了 2024 年和 2025 年兩屆的冠軍。

SATLUTION 在 2025 年 SAT 競賽基準測試中的驚人表現。圖中柱狀圖的高度代表 PAR-2 分數(一種衡量求解器性能的指標,越低越好)。左側顏色漸變的柱體是 SATLUTION 進化出的求解器家族,它們的分數顯著低于人類設計的 2025 年競賽冠軍(藍色)和亞軍(綠色)。

SATLUTION 是如何工作的?

SATLUTION 圍繞 LLM 智能體、一套動態規則系統以及一個嚴格的驗證與反饋循環構建。

雙智能體架構

該系統由兩個協同工作的 LLM 智能體驅動,基于 Cursor 環境和 Claude 系列模型實現。

規劃智能體:負責高層次的戰略制定。在進化周期的初始階段,它會分析作為起點的求解器代碼庫及其性能,提出有潛力的修改方向。在后續周期中,它會綜合考量累積的代碼變更、性能指標和歷史失敗記錄,為下一次迭代制定新的進化計劃。

編碼智能體:負責執行具體的開發任務。它根據規劃智能體的藍圖,直接對 C/C++ 求解器代碼庫進行編輯和實現。其職責還包括管理輔助任務,例如更新 Makefile 等構建系統配置、修復編譯錯誤以及調試功能性或執行時錯誤。

規則系統:引導與約束

規則系統是確保進化過程高效和穩定的關鍵。它為智能體的探索提供了必要的引導,有效減少了在無效或錯誤方向上的嘗試。

在進化開始前,研究人員為系統設定了一套靜態規則,編碼了基礎的領域知識和硬性約束。這包括:基本的 SAT 啟發式算法原則、嚴格的正確性要求(如必須為無解實例生成 DRAT 證明)、統一的代碼庫目錄結構規范以及詳細的評估協議。

實驗表明,在缺少這套初始規則的情況下,智能體的表現會顯著下降,容易產生偏離目標的修改。

該框架的一個核心特點是規則庫本身能夠動態演進。在每個進化周期結束后,一個分析器會對過程中的編譯錯誤、驗證失敗和新出現的失效模式進行復盤,并自動提出規則補丁。

例如,系統可以根據一次失敗的經驗,自動向規則庫中添加一個新的「禁止代碼模式」,從而防止智能體在未來重復同樣的錯誤。這使得規則系統與求解器代碼共同進化,不斷提升框架的整體效率和魯棒性。

驗證與評估流程

為保障代碼質量和求解的正確性,每個新生成的求解器版本都必須通過一個嚴格的流程。

  • 兩階段驗證

第一階段是編譯和基本功能測試。 系統會嘗試編譯新代碼,成功后在一個包含 115 個簡單 CNF 實例的測試集上運行,以捕捉編譯錯誤、段錯誤等基礎問題。

第二階段是完整的正確性驗證。 通過第一階段的求解器會在一個更大的、結果已知的基準測試集上運行。對于其輸出的每一個結果,系統都會進行核查:如果報告「可滿足」(SAT),則驗證所給出的賦值是否正確;如果報告「不可滿足」(UNSAT),則使用外部檢查工具驗證其生成的 DRAT 證明的有效性。

只有完全通過這兩個階段驗證的求解器,才會被認為是「正確」的,并進入下一步的性能評估。

  • 分布式評估與反饋

通過驗證的求解器會被部署到一個由 800 個 CPU 節點組成的集群上,在完整的 SAT Competition 2024 基準測試集(包含 400 個實例)上進行并行評估。這種大規模并行使得整個評估過程可以在大約一小時內完成,從而為智能體提供近乎實時的性能反饋。

反饋指標非常詳盡,包括已解決的 SAT/UNSAT 實例數量、不同時間段內解決的實例分布、內存使用情況,以及作為核心驅動指標的 PAR-2 分數(一種對未解決實例進行高額時間懲罰的平均運行時指標)。

實驗結果

SATLUTION 在 70 個進化周期的實驗中,展現了清晰且穩健的性能提升軌跡。

根據論文中對 2024 年基準測試集的性能追蹤圖表(圖 8)顯示,在最初的 5-10 個迭代周期中,系統取得了快速進展,這主要是因為它整合了多個初始種子求解器的互補優勢。

隨后,性能提升的速度有所放緩,但仍在持續進行,表明智能體開始處理更細微和復雜的優化問題。

大約在第 50 次迭代時,SATLUTION 進化出的求解器在 2024 年的基準上已經開始優于 2025 年的人類設計冠軍。

到第 70 次迭代結束時,其性能已穩定地超越了所有用于比較的基準求解器。整個過程表現出高度的穩定性,由于驗證保障措施的存在,沒有發生過嚴重的性能衰退。

SATLUTION 自進化性能曲線。

整個 SATLUTION 自我進化實驗過程的總計成本低于 20000 美元。相比之下,由人類專家開發一個具有競爭力的 SAT 求解器通常需要數月乃至數年的持續工程投入,而 SATLUTION 在數周內便取得了超越頂尖人類水平的成果。

更多細節請參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-20 13:16:45

2024-03-22 13:36:51

英偉達微服務

2025-10-09 18:02:37

黃仁勛OpenAI英偉達

2022-07-20 13:55:28

算法AI人工智能

2025-01-26 07:30:00

2024-05-28 14:41:00

2024-07-22 08:30:00

神經網絡AI

2023-05-26 17:15:40

AI搜索

2023-05-29 09:55:11

GPT-4英偉達

2024-03-04 00:40:00

英偉達AI引擎

2021-03-29 12:47:58

Crate.io代碼開源

2023-05-26 17:15:45

2025-03-10 12:09:37

2021-12-06 09:35:38

英偉達人工智能軟件

2023-10-13 13:11:58

數據智能

2025-11-05 09:00:00

2024-09-05 14:10:00

AI計算

2023-09-28 08:04:39

GPU芯片AI芯片
點贊
收藏

51CTO技術棧公眾號

国产精品网曝门| 久久精品视频观看| 亚洲一级在线| 在线播放一区二区三区| 四虎免费在线观看视频| 亚洲第一色网站| 亚洲国产精品第一区二区三区| 日韩高清av一区二区三区| 国产淫片av片久久久久久| 日本福利在线| 国产一区二区免费在线| 97精品视频在线| 成人黄色a级片| 国产一区二区三区亚洲综合| 午夜精彩视频在线观看不卡| 日本一区二区在线| 中文字幕精品在线观看| 亚洲欧美一级二级三级| 亚洲成人在线网| 欧美日韩大尺度| 婷婷色在线播放| 久久青草欧美一区二区三区| 国产精品99久久久久久人 | 国产精品一区二区在线观看不卡| 欧美极品少妇xxxxx| 手机免费看av| 亚洲一区二区电影| 日本精品一区二区三区高清 | 蜜臀aⅴ国产精品久久久国产老师| yellow字幕网在线| 国产精品久久久久久久久搜平片| 国产精品视频在线免费观看| 亚洲无码久久久久久久| 亚洲最黄网站| 欧美成人精品一区| 国产精品理论在线| 日韩av不卡一区| 91精品免费在线观看| 干日本少妇首页| 老司机午夜在线视频| 久久综合色鬼综合色| 成人蜜桃视频| 日韩欧美国产另类| 在线综合亚洲| 久久综合久久美利坚合众国| 欧美三级视频网站| 色橹橹欧美在线观看视频高清| 欧美一级淫片007| 久久99999| 国模冰冰炮一区二区| 亚洲一二三四久久| 免费观看黄色的网站| 黄色小视频在线免费观看| av中文一区二区三区| 亚洲va欧美va国产综合剧情| 亚洲大片免费观看| 国产美女诱惑一区二区| 国产做受69高潮| 久久久久成人精品无码| 亚洲成人二区| 久久久精品中文字幕| 美国美女黄色片| 精品久久中文| 亚洲丝袜在线视频| 久久精品国产亚洲av久| 欧美电影在线观看免费| 亚洲精品在线观| 妖精视频在线观看| 黄色精品视频| 欧美系列在线观看| 爱情岛论坛vip永久入口| 中文在线8资源库| 欧美性猛交xxxx免费看漫画| 国产精品videossex国产高清| www.久久久久.com| 亚洲日本青草视频在线怡红院| 色姑娘综合av| se在线电影| 国产精品乱人伦| 一级做a爰片久久| 久久电影中文字幕| 中文字幕乱码久久午夜不卡| 一本久久a久久精品vr综合| 欧美极品视频| 亚洲精品福利视频网站| 中文字幕第50页| 麻豆蜜桃在线| 污片在线观看一区二区| 欧美日韩在线视频一区二区三区| 电影网一区二区| 欧美日精品一区视频| 国产高潮免费视频| 精品国产亚洲一区二区在线观看| 欧美xxxx在线观看| 欧美做受喷浆在线观看| 精品久久久久中文字幕小说| 国产一区二区三区在线看 | 黄色三级中文字幕| 欧美aa在线| 在线免费观看日本欧美| 欧美在线a视频| 黑人久久a级毛片免费观看| 日韩精品在线免费| 日韩欧美在线视频播放| 欧美精品麻豆| 欧美最顶级的aⅴ艳星| 一级黄色片在线| 成人久久久精品乱码一区二区三区| 久久久久久亚洲精品不卡4k岛国 | 久久99成人| 日韩电影中文字幕av| 日本成人免费在线观看| 在线日韩中文| 国产91ⅴ在线精品免费观看| 一级久久久久久久| 成人动漫视频在线| 视频一区视频二区视频三区视频四区国产 | 91 中文字幕| a在线播放不卡| 宅男噜噜99国产精品观看免费| 久久男人天堂| 欧美一级二级三级蜜桃| 久久久久久久久久久久久久久| 亚洲国产老妈| 国产精品99蜜臀久久不卡二区| www.色婷婷.com| 亚洲国产精品传媒在线观看| 美脚丝袜脚交一区二区| 日日狠狠久久| 亚洲日本aⅴ片在线观看香蕉| 天天干中文字幕| 人人精品人人爱| 久久久久se| 色呦呦在线视频| 88在线观看91蜜桃国自产| 日韩乱码人妻无码中文字幕久久| 国产一区二区三区四区三区四| 26uuu另类亚洲欧美日本一| 国产又粗又长又黄| 久久精品一区二区三区av| 青青青青在线视频| 高清一区二区中文字幕| 亚洲午夜激情免费视频 | 一区二区免费在线播放| 日韩一级免费片| 国产欧美日韩精品一区二区免费 | 久久精品无码一区二区三区| 日本丰满少妇黄大片在线观看| 亚洲精品成人图区| 精品卡一卡二卡三卡四在线| 久久久99999| 精品亚洲国产成人av制服丝袜| 亚洲精品高清视频| 日韩亚洲国产免费| 久久av在线看| 亚洲老妇色熟女老太| 亚洲成av人片一区二区梦乃| 精品人妻伦一二三区久| 亚洲免费网站| 色综合电影网| 国产精品麻豆| 久久久久久一区二区三区| 四虎精品一区二区三区| 日韩欧美视频一区二区三区| 精品无码人妻一区二区免费蜜桃| 秋霞电影网一区二区| 夜夜爽www精品| 我要色综合中文字幕| 欧美黑人巨大精品一区二区| 熟妇人妻一区二区三区四区 | 久久精品色综合| 青青久久av北条麻妃黑人| 国产成人天天5g影院在线观看| 欧美色网一区二区| www色aa色aawww| 成人综合在线网站| 岳毛多又紧做起爽| 日韩欧美二区| 国产91视觉| 精品视频一区二区三区四区五区| www国产精品视频| 日韩性xxxx| 欧洲色大大久久| 成人免费毛片东京热| 91在线丨porny丨国产| 精品日韩久久久| 国自产拍偷拍福利精品免费一| 欧美日韩一区二区三区在线视频 | 国产伦精品一区二区三区照片| 美女搞黄视频在线观看| 色哟哟入口国产精品| 亚洲高清精品视频| 在线一区二区三区做爰视频网站| 中文字幕五月天| 91麻豆高清视频| √天堂资源在线| 免费在线成人| 狠狠噜天天噜日日噜| 国产99精品| 99九九视频| 福利一区二区免费视频| 亚洲18私人小影院| 美女隐私在线观看| 亚洲美女在线视频| 丰满肥臀噗嗤啊x99av| 欧美日韩在线观看一区二区| 香蕉视频一区二区| 亚洲伦理在线精品| 久久久久99精品成人| 99国产精品国产精品久久| 亚洲综合伊人久久| 欧美aaa在线| 日韩av综合在线观看| 综合亚洲视频| 亚洲v国产v在线观看| 乱亲女h秽乱长久久久| 91精品久久久久久久久久另类| 成人欧美一区二区三区的电影| 欧美巨乳美女视频| 免费a级人成a大片在线观看| 亚洲性视频网址| 香蕉久久国产av一区二区| 日韩欧美亚洲国产另类| 国产一区二区三区成人| 精品视频1区2区| 亚洲性猛交富婆| 一本高清dvd不卡在线观看| 五月天婷婷网站| 一区二区三区小说| 成年人av电影| 亚洲视频免费在线| av在线播放中文字幕| 国产精品网站一区| 国产精品久久久久久久av| 久久美女高清视频| 特级西西人体wwwww| 成人动漫视频在线| www.日本高清| 97se亚洲国产综合自在线不卡| 成年女人免费视频| 成人的网站免费观看| 精品一区二区三区四区五区六区| 国产精品一区二区在线观看不卡 | 国产农村老头老太视频| 欧美精品精品一区| 99久久99久久久精品棕色圆| 在线电影国产精品| 国产精品久久777777换脸| 欧美视频一区二区三区| 一级片在线免费观看视频| 精品视频免费在线| 91久久精品无码一区二区| 欧美日韩大陆一区二区| 国产免费叼嘿网站免费| 91精品欧美一区二区三区综合在| 国产同性人妖ts口直男| 日韩欧美在线不卡| 欧美一区二区在线观看视频| 亚洲国产成人精品电影| 天堂在线资源库| 亚洲人午夜精品| 日韩美女网站| 欧美日韩国产二区| av资源中文在线| 全亚洲最色的网站在线观看| 亚洲爱爱视频| 1区1区3区4区产品乱码芒果精品| 一区二区三区四区高清视频| 国产伦精品一区二区三区四区免费| 欧美男男freegayvideosroom| 欧美精品一区二区三区在线四季 | 国产女人18毛片水真多成人如厕| 一区二区三区在线观看免费视频| 国产精品入口麻豆原神| www深夜成人a√在线| 午夜电影网一区| 无码人妻一区二区三区线| 欧美久久久久久久久| 亚洲精品911| 亚洲人成在线观| 影音先锋男人在线资源| 欧美一级成年大片在线观看| 国产精品久久久久77777丨| 成人动漫在线观看视频| 精品国内自产拍在线观看视频| 特级黄色录像片| 免费亚洲一区| 美女日批在线观看| 久久久99精品免费观看| 久久国产精品国语对白| 大桥未久av一区二区三区| 在线免费看91| 日韩hd视频在线观看| 欧美日本一道| 欧洲s码亚洲m码精品一区| 精品国产一区二区三区2021| 欧美激情第六页| 欧美日韩免费观看一区=区三区| 日韩欧美在线播放视频| 国产精品夜夜嗨| 男人的天堂官网| 黑人巨大精品欧美一区二区一视频 | 亚洲午夜久久久久久久国产| 亚洲精品国产一区二区三区四区在线| 久久青青草视频| 日韩三级电影网址| caoporn国产精品免费视频| 久久人人爽人人爽人人片av高请 | 久久精品国产精品亚洲精品| 日本一区二区在线免费观看| 一区视频在线播放| 国产精品尤物视频| 日韩精品久久久久 | 国产精品吊钟奶在线| 红杏aⅴ成人免费视频| 黄色www在线观看| 日韩av午夜在线观看| 艳妇乳肉亭妇荡乳av| 亚洲精品国产精华液| 91九色蝌蚪91por成人| 国产亚洲视频在线| 芒果视频成人app| 好吊色欧美一区二区三区四区| 欧美一区二区三区免费看| 欧美三级午夜理伦三级富婆| 国产三级一区二区| 国产精品久久久久久久久久久久久久久久久 | 亚洲欧美一区二区视频| 一级片在线免费播放| 亚洲男女自偷自拍图片另类| 成年人在线网站| 国产精品免费一区二区三区观看| 久久视频在线| 日韩爱爱小视频| 亚洲国产精品ⅴa在线观看| 国产剧情在线视频| 亚洲免费人成在线视频观看| 日韩电影毛片| 欧美二区三区| 日韩综合小视频| 蜜桃传媒一区二区亚洲| 色欧美片视频在线观看| 懂色av中文在线| 国产精品黄色av| 区一区二视频| 日本美女视频一区| 亚洲视频资源在线| 国产偷人妻精品一区二区在线| 欧美成人性色生活仑片| 欧美一级片网址| 成人午夜免费在线视频| 成人精品视频一区二区三区尤物| 精品无码久久久久久久| 亚洲国产精品人久久电影| 国产精品yjizz视频网| 精品久久久久久一区| 久久精品国语| 美国黄色特级片| 91精品国产手机| 久久香蕉av| 蜜桃999成人看片在线观看| 久热精品在线| 看黄色录像一级片| 日韩精品一区二区三区视频| 国产精品25p| 日韩免费一区二区三区| 精品在线播放免费| 久久久国产精品人人片| 亚洲女人被黑人巨大进入| 91精品国产66| 妺妺窝人体色www看人体| 91免费视频网| 一二三四区在线| 久久久久久久久网站| 亚洲丁香日韩| 天堂av在线8| 亚洲成在人线免费| 成人在线观看黄色| 91视频九色网站| 国产婷婷精品| 性爱在线免费视频| 日韩精品一区二区三区在线| 欲香欲色天天天综合和网| 亚洲砖区区免费| 波波电影院一区二区三区| 国产日韩久久久| 欧美激情第99页| 国产一区三区在线播放| 91精品国产三级| 色香蕉成人二区免费| av网站在线看| 青青草成人网| 国产成人综合在线观看| 波多野结衣视频免费观看| 欧美人与性动交| jlzzjlzz亚洲女人| 香蕉视频污视频| 欧美疯狂性受xxxxx喷水图片| 涩涩网在线视频| 日本一本草久p|