精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄

發布于 2024-4-11 12:57
瀏覽
0收藏

首位超越國際奧林匹克競賽金牌得主的AI,剛剛誕生了!


印度理工學院海得拉巴分校、圖賓根AI中心、劍橋大學的研究者發現——


通過「吳方法」,可以讓AI變成和人類數學奧賽銀牌得主同樣的水平,而「AI數學大師」AlphaGeometry,則直接超越了IMO金牌得主。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

吳方法,是吳文俊在1970年代提出的開創性算法。


經過改進后,它變得非常強大,可以解決國際數學奧林匹克競賽30個問題中的27個!直接秒殺人類。


相比之下,之前的AlphaGeometry,僅能解決25個。


史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

論文地址:?https://arxiv.org/abs/2404.06405??

項目地址:https://huggingface.co/datasets/bethgelab/simplegeometry


之前曾有人估計,到2026年代,AI才能達到IMO人類金牌得主的水平。而如今,這個時間表再次被打破了。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

AI做IMO奧數題,有新SOTA了

證明幾何定理是視覺推理的重要表現,它融合了直覺和邏輯思維。


因此,自動化證明奧林匹克級別的幾何題目,代表著人類級自動推理的一個重要里程碑。


此前推出的AlphaGeometry,是一個通過1億個合成樣本訓練的神經符號模型,代表了一個重大的突破。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

論文地址:??https://www.nature.com/articles/s41586-023-06747-5??


它成功解決了國際數學奧林匹克(IMO)30個問題中的25個,而傳統的基于吳方法的系統,僅能解決10個。


但這一次,研究者們重新評估了AlphaGeometry引入的IMO-AG-30挑戰,有了新的發現——

吳方法異常強大!


僅靠吳方法,就能解決15個問題,其中一些問題是靠其他方法根本無法解決的。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

而這就帶來了兩個關鍵發現:


1. 通過將「吳方法」和經典的演繹數據庫(DD)以及角度、比率和距離追蹤(AR)的合成方法相結合,僅使用一臺配備CPU的筆記本,在每個問題的5分鐘限時內,就能解決30個問題中的21個。

這種經典組合方法(Wu&DD+AR)僅比AlphaGeometry少解決了4個問題,并建立了第一個完全基于符號的基準,其性能足以與國際數學奧林匹克(IMO)銀牌得主媲美。

2.吳方法還解決了AlphaGeometry未能解決的5個問題中的2個。

因此,現在IMO-AG-30有新的SOTA了!

通過將AlphaGeometry與吳方法結合產生的新AI,直接解決了30個問題中的27個,一舉超越IMO金牌得主,成為世上首個達此成就的AI。

歐氏幾何,AI推理能力的試金石

如何測試AI的推理能力強不強?歐幾里得幾何就是一個很好的標準。


因為,歐幾里得幾何已經被有限地公理化了,而且這么多年來,有許多非常適合自動定理證明的歐幾里得幾何證明系統被提了出來。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

此外證明的搜索可以通過圖形表示、概率驗證,或是使用人類設計的啟發式方法,來對角度、面積和距離進行大量推理引導。


國際數學奧林匹克中,這些方法被參賽者戲稱為「三角破解」和「重心破解」。

還有一件有趣的事,就是這個領域的缺陷——它需要定義特定的證明系統來指定問題,缺乏訓練數據,問題時常涉及復雜的退化情況。


這些困難非常棘手,由此坊間有這樣一句戲言——「幾何問題永遠不會解決退化問題。」

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

在幾何自動推理領域,可以將方法分為代數方法和合成方法。


演繹數據庫(DD)這個合成方法就頗受關注。


它會模仿人類的證明技巧,通過將定理證明視為依據一組幾何公理進行的逐步搜索問題,從而生成易于理解的證明。


比如,DD會采用一組固定的、由專家策劃的幾何規則,這些規則會不斷地應用到初始的幾何配置上,直至系統達到一個狀態,即用現有規則無法推導出新的事實為止。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

而神經符號證明器AlphaGeometry在這一領域取得了突破性的進展。


在DD的基礎上,它增加了新的規則,用于進行角度、比率和距離的追蹤(AR),并通過大模型(DD+AR+LLM-構造)提出的構建方法,進一步增強了由此生成的符號引擎。該模型是基于1億個合成證明訓練的。


而吳方法和Gr?bner基方法之類的代數方法,能夠將幾何假設,轉換成多項式系統,來驗證結論。


這些方法已被證實,能夠有效處理廣泛的幾何問題。


其中,對于所有假設和結論都能用代數方程表示的問題,吳方法都能處理,并且還能自動產生非退化條件。


而這就表明,吳方法不僅適用于平面幾何問題,也適用于固體和更高維的幾何問題。

5秒解決14個問題

今年1月,谷歌DeepMind團隊同時推出了新的基準測試IMO-AG-30。


這是團隊從2000年至2022年間競賽題中,篩選出30道經典幾何問題組成的測試集,目的是為了展示AlphaGeometry的性能。


基準中,問題的解決數量與IMO選手的平均解題數量相對應。


如下圖,灰色水平線所示,銅牌、銀牌和金牌得主平均分別解決了19.3個、22.9個和25.9個問題。


所有參賽者平均解題數為15.2。


IMO-AG-30收集的具體問題集在圖1(B)的左列中有所列出。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

(A)在IMO-AG-30問題集上,符號系統和增強型大模型(LLM-Augmented)的表現,以及與人類表現的對比


(B)展示了不同方法在解決IMO-AG-30問題集時的情況

實驗

研究人員根據Trinh等人提供的基線和數據集,使用IMO-AG-30基準進行性能評估。


他們通過JGEX軟件手動將IMO-AG-30問題轉換成兼容格式,并重新實現了吳方法。


同時,研究者也從AlphaGeometry代碼庫中成功重現了必要的DD+AR基線。


經過手動驗證了自己翻譯的幾個問題,團隊確認JGEX生成的假設和結論方程是正確的。

吳方法解決了AlphaGeometry未能解決的兩個問題,方案插圖如下所示。


2008-P1B(JGEX):

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

生成的答案:

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

2021-P3(JGEX):

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

生成的答案:

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

結果

研究結果與的先前結果,已經在圖1中進行了展示。


圖1(A)比較了解決問題的數量,圖1(B)展示了各種方法解決的具體問題,以此可視化不同方法之間的重疊或互補性。


具體來說,研究人員將吳方法與DD+AR結合,創建了一個新的符號性能基準(Wu&DD+AR),該基準比所有傳統方法多解決了6個問題。


這種組合解決了IMO-AG-30問題中的21個,與圖2中未經微調(僅FT-9M)的AlphaGeometry的表現相匹配。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

(A)展示了在IMO-AG-30問題集上,符號方法和LLM增強(LLM-Augmented)方法的表現,以及與人類表現的對比


(B)展示了不同方法在IMO-AG-30問題上的表現


吳方法在非常低的計算需求下實現了這一表現。


在一臺裝有AMD Ryzen 7 5800H處理器和16 GB RAM的筆記本上,研究人員在5秒內解決了15個問題中的14個,其中一個問題(2015 P4)需要耗時3分鐘。


在實驗中,吳方法要么幾乎立即解決問題,要么在5分鐘內使筆記本內存耗盡。


值得一提的是,研究者通過吳方法解決的15個問題中的2個(2021 P3, 2008 P1B),原本是AlphaGeometry難以解決的5個問題之中的2個。


因此,通過簡單地將Wu的方法與AlphaGeometry結合,實現了在IMO-AG-30基準上解決了27個問題,這一成就在圖1的綠色/橙色條形(Wu&AG)中有所展示。


代數方法攻克IMO

代數方法,在自動化幾何推理中解決IMO幾何問題中,蘊藏著巨大的潛力。


這項研究恰恰印證了這一點,吳方法也從過往能夠解決10個問題,增加到了15個問題。


而這些問題中,有幾個對于目前流行的合成方法,以及增強LLM的方法,也具有非常高的挑戰性。


研究者表示,其設立的符號基線,是首個在性能上超越一般IMO參賽者,并接近銀牌水平。


此外,AlphaGeomtery和吳方法結合的系統,也是首個在IMO幾何問題上超越人類金牌得主的AI系統。


這一成就證明了,代數方法與合成方法在這一領域的互補性。特別是,2008 P1B和2021 P3這兩個問題目前僅有吳方法能解決,顯示了代數方法的獨特價值。

史上首次,AI超越人類奧賽金牌得主!吳方法加持,30題做出27道破紀錄-AI.x社區

盡管代數方法以其理論保證而著稱,但之前因速度慢和難以為人理解而受到質疑。


而最新的研究觀察顯示,吳方法在多個問題上的效率遠超預期,作者認為不應僅因其無法生成人類可讀的證明而忽視它。


目前,研究還在進行中,受限于現有實現的不足,包括結構的限制和性能不佳。


研究者相信,傳統方法有可能超越AlphaGeometry的證明能力,并希望這份研究能促進這一領域經典計算方法軟件的改進。


另一方面,最新方法取得的顯著成功表明,盡管IMO幾何問題對人類具有挑戰性,但可能并未充分挑戰現代計算求解器的極限。


解題的成功更多依賴于,重復使用人定義的啟發式方法和有限的構造,而不是深入探索復雜的組合可能性。


這與國際象棋殘局的情況類似,其相對較早就被暴力求解器掌握了。


而研究人員希望這份研究,能激勵開發幾何領域自動定理證明器的新基準。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/rQvybNUGJ2Z35CP6SYUVgg??

標簽
收藏
回復
舉報
回復
相關推薦
中文字幕av专区| 欧美黑人一级爽快片淫片高清| 国产精品第157页| 少妇高潮久久久| 久久精品女人| zzjj国产精品一区二区| 久久久国产精品久久久| 欧美a级在线观看| 国产精品―色哟哟| 成人免费看片网站| 亚洲精品久久久久久久蜜桃| 久久久久久久久久久久久久| 亚洲精品电影在线| 中文字幕 91| 精品极品在线| 一区在线观看视频| 精品国产_亚洲人成在线| 中文区中文字幕免费看| 亚洲成人在线| 久久亚洲一区二区三区四区五区高| www国产视频| 亚洲日本免费电影| 国精产品一区二区三区有限公司| 日韩和欧美一区二区| 欧美xxxx14xxxxx性爽| 麻豆av免费观看| 日韩欧美中文在线观看| 欧美探花视频资源| 精品少妇人妻av免费久久洗澡| 永久免费在线观看视频| 91欧美一区二区| 1卡2卡3卡精品视频| 日韩精品一区二区亚洲av观看| 欧美精品入口| 按摩亚洲人久久| 日本黄色特级片| 国产aⅴ精品一区二区四区| 色婷婷精品久久二区二区蜜臂av | 日韩中文首页| 亚洲天堂色网站| 亚洲精品中文字幕在线播放| 久久久久久亚洲精品美女| 欧洲生活片亚洲生活在线观看| www.av毛片| 日本成人在线播放| 中文av一区二区| 欧美一区二区三区精美影视| 国产又爽又黄网站亚洲视频123| 国产一区二区成人久久免费影院| 国产精品综合网站| 成人小视频在线播放| 国产欧美亚洲一区| 91国产视频在线| 日本特黄特色aaa大片免费| 中文字幕人成人乱码| 久久精品视频va| 欧美性x x x| 91精品国产福利在线观看麻豆| 日韩在线视频一区| 女人18毛片毛片毛片毛片区二| 青青草国产成人a∨下载安卓| 国产亚洲精品久久久久久777| 亚洲欧美日韩视频一区| 日韩精品一区二区三区久久| 性爽视频在线| 狠狠躁天天躁日日躁欧美| 精品视频免费在线播放| 日本不卡网站| 色婷婷国产精品久久包臀| 已婚少妇美妙人妻系列| 桃子视频成人app| 欧美系列日韩一区| 在线观看日本一区二区| 国产日韩一区二区三免费高清| 欧美一区欧美二区| 337p日本欧洲亚洲大胆张筱雨| 这里视频有精品| 日韩经典中文字幕在线观看| 亚洲区免费视频| 日本电影一区二区| 久久五月情影视| 国产对白videos麻豆高潮| 国产欧美日本| 国产精品中文字幕在线| 国产欧美久久久| 成人va在线观看| 欧美高清一区二区| 在线播放麻豆| 一区二区三区四区激情| 男人天堂网视频| 欧美成人黄色| 亚洲国产精品一区二区三区| 国产亚洲精品熟女国产成人| 中出一区二区| 欧美中文字幕在线| 91精品中文字幕| 成人av网站在线| 亚洲欧美日韩在线综合| 日本在线视频中文有码| 色狠狠桃花综合| 中文字幕无人区二| 波多野结衣在线观看一区二区| 久久69精品久久久久久久电影好 | 91福利在线尤物| 欧美综合色免费| 波霸ol色综合久久| 亚洲国产无码精品| 亚洲成人最新网站| 4444欧美成人kkkk| 国产免费黄色网址| 久久久av毛片精品| 精品人妻大屁股白浆无码| 欧美片第一页| 日韩三级.com| 91精品人妻一区二区| 在线成人动漫av| 欧美xxxx综合视频| 欧美成人一区二区三区四区| 日本少妇一区二区| 国产伦视频一区二区三区| 裸体xxxx视频在线| 亚洲欧美经典视频| 国产h视频在线播放| 四虎精品一区二区免费| 亚洲精品国产综合区久久久久久久| 欧美丰满美乳xxⅹ高潮www| 亚洲九九在线| 国产脚交av在线一区二区| 性欧美videos另类hd| 久久这里都是精品| 自拍日韩亚洲一区在线| 欧美美女被草| 日韩久久午夜影院| 久久网中文字幕| 美腿丝袜亚洲一区| 国产视频精品网| 欧美四级在线| 欧美日韩视频在线第一区| 中文字幕一区二区人妻电影丶| 日韩欧美午夜| 国产精品444| 四虎永久在线观看| 午夜精品视频在线观看| 亚洲高清视频免费| 日韩aaaa| 日本午夜人人精品| 欧美一区二区三区黄片| 亚洲男同性恋视频| 被黑人猛躁10次高潮视频| 成人羞羞网站入口免费| 4444欧美成人kkkk| 先锋av资源站| 精品国产乱码久久久| 51精品国自产在线| 99热在线观看精品| 免费在线看一区| 色综合久久av| 在线成人视屏| 亚洲人成在线观| 欧美精品一二三四区| 国产成人亚洲精品青草天美| a级片一区二区| 国产剧情一区二区在线观看| 一区二区三区四区视频| 欧美激情黑白配| 91网站黄www| 日韩av一二三四区| 日韩不卡在线视频| 欧美大片网站在线观看| 精品国产无码一区二区三区| 一区二区三区四区在线免费观看| 亚洲综合中文网| 欧美日韩免费| 久久久影院一区二区三区| 老牛影视精品| 亚洲无线码在线一区观看| 久久久精品毛片| 欧美极品xxx| 亚洲天堂网2018| 欧美亚洲不卡| 精品国产一二| 午夜激情成人网| 色系列之999| a毛片在线免费观看| 亚洲男人的天堂av| 麻豆av免费看| 99成人在线| 欧美日韩一区在线视频| 在线观看精品| 欧美成人合集magnet| 亚洲av片在线观看| 91福利视频网站| 青青操在线播放| 国产成人综合在线播放| 国产v片免费观看| 国内精品国产成人国产三级粉色| 国产精品大片wwwwww| 免费在线观看av网站| 精品国产123| 男女视频免费看| 国产精品情趣视频| 亚洲观看黄色网| 日本欧美一区二区| 高清无码视频直接看| 啪啪小视频网站| 三级一区在线视频先锋 | 国产伦精品一区二区三区千人斩 | 男人天堂久久| 欧美国产在线视频| 久草视频在线看| 91精品国产黑色紧身裤美女| 国产污视频在线看| 18欧美亚洲精品| 亚洲激情 欧美| 精品一区精品二区高清| 国产青青在线视频| 外国成人免费视频| 鬼打鬼之黄金道士1992林正英| 日韩av超清在线观看| 久久亚洲一区二区三区四区五区高| 天堂av资源网| 6080日韩午夜伦伦午夜伦| 日本午夜视频在线观看| 一区二区三区四区乱视频| 成人黄色a级片| 93久久精品日日躁夜夜躁欧美 | 三级影片在线观看欧美日韩一区二区| 大地资源网在线观看免费官网| 欧美**vk| 美脚丝袜一区二区三区在线观看| 国产精品视频一区二区三区综合 | 日韩中文视频| 久久免费视频在线| 日本美女在线中文版| 日韩电影大片中文字幕| 99在线观看免费| 欧美高清性hdvideosex| 免费看污视频的网站| 亚洲成a人片综合在线| 日韩av毛片在线观看| 国产日韩高清在线| 初高中福利视频网站| 国产麻豆精品视频| 天天干天天草天天| 久久都是精品| 久久久久久久中文| 精久久久久久| 人人妻人人添人人爽欧美一区| 综合久久精品| 男同互操gay射视频在线看| 色呦哟—国产精品| 亚洲图片都市激情| 黄色一级片免费在线观看| 国内成人自拍视频| 99久久激情视频| 国产精品人人爽人人做我的可爱 | 亚洲国产高清一区| 国产亚洲黄色片| 欧美日韩国产探花| 日本免费a视频| 国产精品a级| 日本黄大片在线观看| 亚洲视频1区| 欧美黄色免费影院| 久久精品伊人| 成人在线观看黄| 日韩专区欧美专区| 国产免费毛卡片| 日本网站在线观看一区二区三区 | 久久免费黄色| 成年人免费大片| 久久婷婷av| 91精品999| 国产精品一区二区三区网站| 亚洲黄色片免费看| 粉嫩久久99精品久久久久久夜| 50一60岁老妇女毛片| av电影在线观看完整版一区二区| 亚洲av网址在线| 久久久久久**毛片大全| 欧美丰满美乳xxⅹ高潮www| 亚洲三级免费观看| 麻豆chinese极品少妇| 亚洲国产另类av| www.日本精品| 欧美性开放视频| 国产又黄又大又粗的视频| 日韩西西人体444www| 欧美特黄一级视频| 亚洲另类欧美自拍| 成年人视频在线看| 精品国产一区二区在线 | 久久精品视频在线播放| 亚洲奶水xxxx哺乳期| 日本亚洲欧洲色α| 黄页免费欧美| 国产精华一区二区三区| 嫩草一区二区三区| 日韩少妇中文字幕| 伊人蜜桃色噜噜激情综合| 精品99在线视频| 激情亚洲综合在线| yy1111111| 亚洲免费电影在线| 日韩在线第一区| 亚洲男女在线观看| 成人一区福利| 先锋a资源在线看亚洲| 91国偷自产一区二区使用方法| 欧美系列在线观看| 精品1区2区在线观看| 精品久久久三级| 亚洲一区视频在线播放| av播放在线| 亚洲激情网站| 国产69精品久久久久9999apgf| 国产 日韩 欧美 综合 一区| 久久久com| 香蕉久久网站| 国产成人无码精品久久久性色| 蜜乳av一区二区三区| 精品影片一区二区入口| 国产精品久久久久影院亚瑟 | 美女视频亚洲色图| 亚洲精品一品区二品区三品区 | 国产免费一区二区三区最新不卡| 日韩亚洲欧美在线| 看黄网站在线| 日本免费在线精品| 大奶一区二区三区| 性欧美18一19内谢| 午夜一区不卡| 香蕉视频免费网站| 成人欧美一区二区三区在线播放| 一级片免费在线播放| 欧美精品日日鲁夜夜添| 日中文字幕在线| 久久久久久久久久久免费 | 国产一区二区在线观看视频| 97免费公开视频| 欧美国产成人精品| 欧美福利视频一区二区| 日韩精品一区二区三区三区免费| 激情小视频在线| 国自产精品手机在线观看视频| 国产视频网站一区二区三区| 亚洲成人18| 丝袜亚洲另类欧美| 影音先锋男人在线| 色婷婷av一区二区三区软件| 网站黄在线观看| 欧美激情手机在线视频 | 日韩欧美成人精品| 日本人妻熟妇久久久久久| 欧美成人精品一区| 99综合99| 精品视频在线观看一区二区| 国产成人亚洲精品狼色在线 | 亚洲综合精品自拍| 亚洲精品911| 欧美激情18p| 成人午夜大片| 免费 成 人 黄 色| 国产不卡视频在线播放| 国产97免费视频| 日韩一区二区精品在线观看| 国产丝袜在线| 91精品久久久久久久久久入口| 亚洲成av人片乱码色午夜| 三级av免费看| 亚洲一区二区三区自拍| 国产黄色片免费观看| 欧美大片第1页| 国产精品videossex| 国自产拍偷拍精品啪啪一区二区 | 黄色性视频网站| 粉嫩老牛aⅴ一区二区三区| 桃花色综合影院| 日本在线精品视频| 色一区二区三区四区| 97中文字幕在线观看| 精品免费在线观看| 青青草观看免费视频在线| 欧美在线播放视频| 成人91在线| 国产999免费视频| 亚洲成人激情自拍| 天天爱天天干天天操| 国产精品美女免费看| 久久久久久久久久久久久久久久久久| 午夜诱惑痒痒网| 亚洲一区二区三区视频在线| 日本a一级在线免费播放| 国产精品夜间视频香蕉| 一区二区中文| 亚洲成av人片在线观看无| 欧美日韩一区精品| 欧美人与性动交α欧美精品图片| 久久99精品久久久久久久久久 | 中国黄色片一级|