精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI再卷數學界,DSP新方法將機器證明成功率提高一倍

人工智能 新聞
谷歌的吳宇懷 (Yuhuai Tony Wu)等研究者設計了一種叫做「Draft, Sketch, and Prove」 (DSP)的新方法將非形式化的數學證明轉化為形式化的證明。實驗結果顯示,自動證明器在 miniF2F 上解決的問題比例從 20.9% 提高到了 38.9%。

自動證明數學定理是人工智能的一個初衷,也是一直以來的難題。到目前為止,人類數學家使用了兩種不同的方式來書寫數學。

第一種是大家都熟悉的方式,即用自然語言來描述數學證明。大部分的數學都是以這種方式書寫的,這包括數學課本,數學論文,等等。

第二種稱之為形式化數學(formal mathematics)。這是近半個世紀計算機科學家創造的,用來檢驗數學證明的一種工具。

如今看來,計算機可以被用來驗證數學證明,但它們只有在使用專門設計的證明語言時才能做到這一點,而無法處理數學符號和數學家使用的書面文本的混合體。如果把用自然語言編寫的數學問題轉換為形式化代碼,讓計算機更容易解決它們,或許能夠幫助構建能探索數學新發現的機器。這個過程被稱為形式化(formalisation),自動形式化(autoformalization)指的是自動從自然語言數學翻譯成形式化語言的任務。

形式化證明的自動化是一項具有挑戰性的任務,深度學習方法在該領域尚未大獲成功,這主要是因為形式化數據的稀缺。事實上,形式化證明本身是非常困難的,且只有少數專家能做到,這使得大規模的注釋工作并不現實。最大的形式化證明語料庫是用 Isabelle 代碼 (Paulson, 1994) 編寫的,大小不到 0.6GB,比視覺或自然語言處理中常用的數據集小幾個數量級。為了解決形式證明的稀缺性,以往的研究提出使用合成數據、自監督或強化學習來合成額外的形式化訓練數據。雖然這些方法在一定程度上緩解了數據的不足,但都無法將大量人工撰寫的數學證明充分利用起來。

我們以語言模型 Minerva為例。當在足夠多的數據訓練之后,我們發現它的數學能力非常強,可以在高中數學測試中拿到高于平均分水平。然而這樣的語言模型也有不足,它只能模仿,而不能自主訓練而提高數學水平。形式化證明系統提供了一個訓練環境,但形式化數學的數據非常少。

與形式化的數學不同,非形式化的數學數據是豐富和廣泛可用的。最近,在非形式化數學數據上訓練的大型語言模型展示了令人印象深刻的定量推理能力。然而,它們經常產生錯誤的證明,而自動檢測這些證明中的錯誤推理是很有挑戰性的。

在最近的一項工作中,谷歌的吳宇懷 (Yuhuai Tony Wu)等研究者設計了一種叫做 DSP(Draft, Sketch, and Prove )的新方法,將非形式化的數學證明轉化為形式化的證明,從而同時具備形式化系統提供的邏輯嚴謹性和大量的非形式化數據。

圖片

論文鏈接:https://arxiv.org/pdf/2210.12283.pdf

今年早些時候,吳宇懷與幾位合作者使用了 OpenAI Codex 的神經網絡進行自動形式化工作,證明了用大型語言模型將非形式化語句自動翻譯成形式化語句的可行性。DSP 則更進一步,利用大型語言模型從非形式化證明中生成形式化證明草圖。證明草圖由高層次的推理步驟組成,可以由交互式定理證明器這樣的形式化系統來解釋。它們與完整的形式化證明不同,因為它們包含無理由的中間猜想的序列。在 DSP 的最后一步,形式化證明草圖被闡述為一個完整的形式化證明,使用一個自動驗證器來證明所有中間猜想。

吳宇懷表示:現在,我們展示了 LLM 可以將其生成的非形式化證明轉化為經過驗證的形式化證明!

圖片

方法

方法部分描述了用于形式化證明自動化的 DSP方法,該方法利用非形式化證明來指導自動形式化定理證明器的證明草圖。這里假設每個問題都有一個非形式化命題和一個描述該問題的形式化命題。整體 pipeline 包括三個階段(如圖 1 所示)。

圖片

圖 1.

非形式化證明的起草

DSP 方法的初始階段,包括根據問題的自然數學語言描述(可能用 LATEX)為其尋找非形式化證明。由此產生的非形式化證明被看作是后續階段的草稿。在數學教科書中,一般都會提供定理的證明,但有時會缺失或不完整。因此,研究者考慮了與非形式化證明的存在或不存在相對應的兩種情況。

在第一種情況下,研究者假設有一個「真實的」非形式化證明(即由人寫的證明),這是現有數學理論形式化實踐中的典型情況。在第二種情況下,研究者做了一個更普遍的假設,即沒有給出真實的非形式化證明,并且用一個經過非形式化數學數據訓練的大型語言模型來起草證明候選。該語言模型消除了對人類證明的依賴,并能為每個問題產生多種備選解決方案。雖然沒有簡單的方法來自動驗證這些證明的正確性,但非形式化證明只需要在下一階段對生成一個好的形式化證明草圖有用。

將非形式化證明映射為形式化草圖

形式化證明草圖對解決方案的結構進行編碼,并撇開低層次的細節。直觀地說,它是一個部分證明,概述了高層次的猜想命題。圖 2 是一個證明草圖的具體例子。盡管非形式化證明經常撇開低層次的細節,這些細節不能在形式化證明中排出,這使得非形式化證明到形式化證明的直接轉換變得困難。相反,本文建議將非形式化證明映射到共享相同高層結構的形式化證明草圖上。證明草圖中缺少的低層次細節可以由自動證明器來填補。由于大型非形式化 - 形式化平行語料庫不存在,標準的機器翻譯方法不適合這項任務。相反,這里使用一個大型語言模型的小樣本學習能力。具體來說,用了一些包含非形式化證明及其相應的形式化草圖的例子對來 prompt 該模型,然后是一個有待轉換的非形式化證明,然后讓模型生成后續的 token,以獲得所需的形式化草圖。這個模型稱為「自動形式化器」。

圖片

圖 2.

證明草圖中的公開猜想

作為這個過程的最后一部分,研究者執行現成的自動證明器來填補證明草圖中缺失的細節,這里的「自動證明器」是指能夠產生形式上可驗證的證明的系統。該框架對自動證明器的具體選擇是不可知的:它可以是符號證明器(如啟發式證明自動化工具)、基于神經網絡的證明器或者混合方法。如果自動證明器成功地填補了證明草圖中的所有空白,它就會返回最終的形式化證明,可以對照問題的規格進行檢查。如果自動證明器失敗(例如,它超過了分配的時間限制),則認為評估是不成功的。

實驗

研究者進行了一系列實驗,包括從 miniF2F 數據集中生成問題的形式化證明,并表明很大一部分定理可以用這種方法自動證明。此處研究了兩種環境,其中非形式化證明是由人類寫的,或者是由一個在數學文本上訓練的大型語言模型起草的。這兩種設置對應于現有理論形式化過程中經常出現的情況,即通常有非形式化證明,但有時作為練習留給讀者,或者由于空白處的限制而缺失。

表 1 展示了在 miniF2F 數據集上發現的成功形式化證明的比例。結果包括本文實驗的四條 baseline,以及帶有人類編寫的證明和模型生成的證明的 DSP 方法。

圖片

可以看出,附加了 11 種啟發式策略的自動證明器大大增加了 Sledgehammer 的性能,在 miniF2F 的驗證集上將其成功率從 9.9% 提高到 18.0%,在測試集上從 10.4% 提高到 20.9%。兩個使用語言模型和證明搜索的 baseline 在 miniF2F 的測試集上分別達到 29.9% 和 35.2% 的成功率。

基于人類編寫的非形式化證明,DSP 方法在 miniF2F 的驗證和測試集上取得了 42.6% 和 39.3% 的成功率。488 個問題中共有 200 個可以通過這種方式進行證明。Codex 模型和 Minerva(8B)模型在解決 miniF2F 上的問題時給出了非常相似的結果:它們都指導自動驗證器分別解決了驗證集和測試集上 40.6% 和 35.3% 的問題。

當切換到 Minerva(62B)模型時,成功率分別上升到 43.9% 和 37.7%。與人編寫的非形式化證明相比,其在驗證集上的成功率要高 1.3%,在測試集上要低 1.6%。總的來說,Minerva(62B)模型能夠解決 miniF2F 上的 199 個問題,比用人編寫的證明少一個。Minerva(540B)模型在 miniF2F 的驗證集和測試集中分別解決了 42.6% 和 38.9% 的問題,也生成了 199 個成功的證明。

在兩種情況下,DSP 方法都能有效地指導自動證明器:使用人類的非形式化證明或語言模型生成的非形式化證明。DSP 幾乎將證明器的成功率提高了一倍,并在使用 Isabelle 的 miniF2F 上產生了 SOTA 性能。此外,更大的 Minerva 模型在指導自動形式化證明器方面幾乎和人類一樣有幫助。

如下圖所示,DSP 方法顯著提高了 Sledgehammer + 啟發式證明器的性能(~20% -> ~40%),在 miniF2F 上實現了新的 SOTA。

Minerva 的 62B 和 540B 版本生成的證明與人類的證明非常相似。

圖片

更多內容,請參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-30 17:23:54

數據模型

2009-09-16 10:05:06

GoogleChrome 3.0瀏覽器

2023-07-03 16:01:51

AI數學

2024-01-03 17:39:23

云計算混合云

2010-11-18 10:59:00

求職

2024-02-05 08:00:00

代碼生成人工智能自然語言

2022-06-24 08:20:56

requests爬蟲Python

2021-01-20 18:13:52

VRAR守門員

2025-11-18 16:47:16

AI模型訓練

2024-04-02 10:13:25

在線小工具開發

2012-07-04 08:48:59

程序員

2023-04-10 14:22:26

PCIe6.0PCIe

2012-07-04 09:30:49

程序員開發效率

2025-09-03 09:02:00

2024-10-23 19:47:54

2020-05-12 10:43:30

谷歌算法人工智能

2011-02-22 09:29:33

無線網絡無線網速

2013-01-22 17:39:57

360瀏覽器搶票專版

2025-07-29 00:15:00

2009-06-15 08:47:33

微軟Windows 7操作系統
點贊
收藏

51CTO技術棧公眾號

欧美三级蜜桃2在线观看| 不卡视频在线观看| 日韩在线观看免费av| 日本中文字幕在线不卡| 老色鬼在线视频| 国产欧美日韩视频在线观看| 91蜜桃网站免费观看| 日韩黄色一级大片| 欧美3p在线观看| 欧美精品一区在线观看| 午夜久久久精品| 97人人爽人人澡人人精品| 国产女同互慰高潮91漫画| 翡翠波斯猫1977年美国| 日韩xxx视频| 影音先锋一区| 久久久精品999| xxxx日本黄色| 免费看成人人体视频| 欧美一区三区二区| 国产wwwxx| 亚洲精品国产精品国产| 亚洲伊人色欲综合网| 一区二区三区精品国产| 巨骚激情综合| 99久久精品国产一区| 亚洲一区二区三区四区在线播放 | 精品欧美aⅴ在线网站| 一道精品一区二区三区| 波多野结衣在线影院| 91年精品国产| 国语精品免费视频| 亚洲a视频在线观看| 狠狠色丁香久久婷婷综合丁香| 91av在线看| 国产极品美女高潮无套嗷嗷叫酒店| 91亚洲国产| 中文字幕av一区中文字幕天堂| av无码一区二区三区| 亚洲电影一区| 日韩欧美国产电影| 在线视频日韩欧美| 国产精品日本一区二区三区在线| 欧美性videosxxxxx| 亚洲人成无码www久久久| 亚洲少妇视频| 欧美性猛交xxxx免费看久久久| 国产精品网站免费| 多野结衣av一区| 五月天久久比比资源色| 国产精品12345| 国产在线天堂www网在线观看| 艳妇臀荡乳欲伦亚洲一区| 色一情一乱一乱一区91| 成人三级网址| 亚洲综合色网站| 青青青在线观看视频| 污污片在线免费视频| 亚洲精品国产一区二区三区四区在线| 99久re热视频精品98| 18+激情视频在线| 亚洲综合自拍偷拍| 人妻少妇精品无码专区二区| 亚洲十八**毛片| 色天天综合久久久久综合片| 亚洲免费看av| 国产aa精品| 亚洲国产成人精品女人久久久| 一级欧美一级日韩片| 蜜桃tv一区二区三区| 尤物精品国产第一福利三区| 国产精品视频一区二区在线观看| 最新欧美人z0oozo0| 欧美激情精品久久久久久变态| 国产五月天婷婷| 久久精品导航| 成人激情在线观看| 丰满少妇被猛烈进入| 久久久久久一级片| 男插女免费视频| 成人ssswww在线播放| 91高清视频在线| 午夜视频在线观| 久久影视三级福利片| 亚洲图片欧美日产| 午夜免费激情视频| 免费视频久久| 91精品中文在线| 色呦呦视频在线| 日本一区二区成人| 无码人妻精品一区二区蜜桃网站| 色网在线免费观看| 6080日韩午夜伦伦午夜伦| 亚洲国产果冻传媒av在线观看| 精品久久不卡| 国产69精品99久久久久久宅男| 日韩精品一区不卡| 国产成人综合视频| 手机成人在线| 国产传媒在线| 宅男在线国产精品| 瑟瑟视频在线观看| 欧美日韩福利| 成人黄色在线免费| 欧美女同网站| 亚洲午夜久久久久久久久电影院 | 国产精品久久久久9999爆乳| 精品视频在线一区二区在线| 精品国产免费一区二区三区香蕉| 天天操天天干天天操天天干| 亚洲黄色影片| 亚洲最大福利视频网站| 国产精品一二三区视频| 亚洲成人av福利| 永久免费黄色片| 久久成人高清| 午夜精品久久久久久久99热| 国产美女免费看| 中文一区在线播放| 国产无套内射久久久国产| 98视频精品全部国产| 精品国内产的精品视频在线观看| 国产一级精品视频| 懂色av中文一区二区三区| 中文网丁香综合网| 97人人做人人爽香蕉精品| 亚洲国产日韩欧美在线99| 久草视频在线资源| 国产一区在线精品| 一级做a爰片久久| 91精品国产经典在线观看| 亚洲欧洲国产一区| 日韩精品在线观看免费| 波多野结衣中文一区| 91免费版看片| 91午夜精品| 欧美高清视频在线| 国产三级在线观看视频| 成人欧美一区二区三区黑人麻豆| 少妇性l交大片| 亚洲人成精品久久久 | 成人国产在线看| 韩国一区二区三区视频| 日韩一区二区三区xxxx| 一本色道久久综合无码人妻| 中文字幕在线一区| 亚洲xxx在线观看| 欧美gvvideo网站| 成人妇女淫片aaaa视频| 麻豆系列在线观看| 日韩写真欧美这视频| 青青青在线免费观看| 国产91丝袜在线观看| 国产黄色激情视频| 激情小说亚洲色图| 欧美诱惑福利视频| 超碰在线影院| 欧美精品在欧美一区二区少妇 | 婷婷夜色潮精品综合在线| 欧美熟妇精品一区二区蜜桃视频| 亚洲美女毛片| 欧洲精品在线一区| 久久久久伊人| 欧美国产日本高清在线| 日本私人网站在线观看| 欧美午夜精品一区| 国内偷拍精品视频| 成人激情综合网站| 不卡av免费在线| 99精品美女| 成人激情直播| 在线观看欧美日韩电影| 神马久久久久久| 亚洲精品97久久中文字幕| 五月婷婷欧美视频| 国产又粗又硬视频| 国产成人aaaa| 熟妇人妻va精品中文字幕| 91久久夜色精品国产按摩| 99re在线| 性欧美18一19sex性欧美| 日韩一区二区三区在线播放| 日本黄色一区二区三区| 欧美又粗又大又爽| 久久久精品一区二区涩爱| 久久久久综合网| 人人爽人人爽av| 亚洲综合国产| 特级黄色录像片| 综合亚洲自拍| 亚洲最大的网站| 手机看片久久| 欧美精品第一页在线播放| 成年人在线视频免费观看| 精品久久一区二区| 中文字幕乱码视频| 亚洲二区在线视频| 国产wwwwxxxx| 2020国产精品| 亚洲成a人片在线www| 日本不卡免费在线视频| 国产色一区二区三区| 国产精品久久久久久影院8一贰佰| 国产精品久久精品视| jvid一区二区三区| 97福利一区二区| 在线中文字幕第一页| 国产一区二区免费| 天天射天天操天天干| 日韩一级片在线观看| 怡春院在线视频| 色一区在线观看| 国产性xxxx高清| 夜夜精品视频一区二区| 久久精品在线观看视频| 久久伊人中文字幕| 小毛片在线观看| 国产成人免费网站| 在线观看免费视频污| 蜜臀久久99精品久久久画质超高清| 两根大肉大捧一进一出好爽视频| 欧美va天堂| 异国色恋浪漫潭| 日韩免费av| 视频一区二区三区免费观看| 免费视频亚洲| 欧美不卡三区| 国产伦精品一区二区三区千人斩| 国产一区二区精品免费| 凹凸av导航大全精品| 99re视频| 综合中文字幕| 亚洲一区二区三区视频| 国产成年精品| 97视频资源在线观看| 国产在线一区不卡| 亚洲专区国产精品| 欧美二区观看| 97超级碰碰| 亚洲精品一区二区三区中文字幕| 亚洲一区二区三区视频播放| 精品国产第一国产综合精品| 91亚洲va在线va天堂va国| 亚洲男女网站| 91九色在线观看| 成人av影音| 精品国产一二| 久久91精品| 日韩色妇久久av| 99精品电影| 日韩视频 中文字幕| 午夜精品久久| 人妻少妇精品无码专区二区| 99国产精品久久久久久久成人热 | 亚洲天堂第一页| porn视频在线观看| 色一情一乱一区二区| av网址在线看| 久久青草福利网站| xxxxxx欧美| 国产欧美精品久久久| 日韩成人视屏| 激情五月综合色婷婷一区二区| 奇米色欧美一区二区三区| 亚洲乱码一区二区三区| 91精品蜜臀一区二区三区在线| www.九色.com| 久久国产精品99国产| 羞羞的视频在线| 成人黄色大片在线观看| 欧美老熟妇乱大交xxxxx | 日本福利视频导航| 国产综合自拍| 91看片就是不一样| 国产一区二区三区精品欧美日韩一区二区三区| 两女双腿交缠激烈磨豆腐 | 中国1级黄色片| 一区二区三区中文字幕| 毛片毛片女人毛片毛片| 欧美伦理视频网站| 后进极品白嫩翘臀在线视频| 亚洲男子天堂网| 中国av在线播放| 日本aⅴ大伊香蕉精品视频| 四虎国产精品免费久久| 国产一区不卡在线观看| 成人嘿咻视频免费看| 日本免费a视频| 日本不卡一区二区| 国产一线在线观看| 国产精品理论在线观看| 国产精品视频免费播放| 91精品免费在线观看| 欧美成人片在线| 久久99国产综合精品女同| 无人区在线高清完整免费版 一区二| 3d精品h动漫啪啪一区二区| 亚洲人成网站77777在线观看| 国产成年人在线观看| 免费在线播放第一区高清av| 丰满少妇一区二区三区专区| 日本一区二区三级电影在线观看| 欧美日韩成人免费观看| 91精品福利在线| 污视频网站免费观看| 乱亲女秽乱长久久久| 秋霞国产精品| 久久福利电影| 欧美日韩国产欧| 91av视频免费观看| 国产欧美一区在线| 日本韩国欧美中文字幕| 精品国内二区三区| 国产剧情在线| 国产精品美女久久久久av超清| 人妖一区二区三区| 成人在线观看你懂的| 国产东北露脸精品视频| 欧美日韩色视频| 欧美日韩不卡在线| 中文字幕在线播放| 国产精品第1页| 奇米狠狠一区二区三区| 自慰无码一区二区三区| 成人激情午夜影院| 国产精品二区一区二区aⅴ| 欧美一个色资源| 国产成人在线视频免费观看| 国产日韩欧美夫妻视频在线观看 | 在线免费看91| 国产一区二区三区欧美| 日韩毛片免费观看| 日韩aⅴ视频一区二区三区| 免费在线欧美黄色| 波多野结衣片子| 色狠狠色狠狠综合| 毛片在线免费| 国产成人鲁鲁免费视频a| 亚洲肉体裸体xxxx137| 日韩av黄色网址| 久久综合五月天婷婷伊人| 国产精品男女视频| 亚洲欧洲美洲在线综合| 日日av拍夜夜添久久免费| 蜜桃传媒视频麻豆第一区免费观看 | 国外色69视频在线观看| 国产伦理久久久久久妇女| 国产日韩av网站| 99久久精品99国产精品| 国产精品久久久久久久久久久久久久久久久 | 久久99精品国产麻豆婷婷洗澡| 2017亚洲天堂| 欧美一级一级性生活免费录像| 羞羞视频在线观看不卡| 国产66精品久久久久999小说| 亚洲国产美女| 国产精品无码久久久久一区二区| 精品视频123区在线观看| 日本在线免费网| 国产 高清 精品 在线 a| 国产视频亚洲| 色撸撸在线视频| 日韩女优av电影| 深夜福利视频一区二区| 日韩一区二区电影在线观看| 极品美女销魂一区二区三区| 欧洲猛交xxxx乱大交3| 亚洲国产美女精品久久久久∴| 奇米777日韩| aaa免费在线观看| 不卡的av电影在线观看| 亚洲午夜无码久久久久| 欧美老女人性视频| 少妇高潮一区二区三区| 九九热99视频| 亚洲1区2区3区视频| 国产在线网站| 99三级在线| 视频在线观看一区| 欧美日韩成人免费观看| 亚洲摸下面视频| 久久伦理中文字幕| 日韩视频第二页| 亚洲你懂的在线视频| 香蕉视频黄在线观看| 成人免费高清完整版在线观看| 亚洲美女黄色| 三级在线观看免费大全| 亚洲精品美女久久| av成人在线网站| 欧美一区二区三区爽大粗免费 | 天天插天天操天天干| 日韩亚洲欧美中文高清在线| 国产精品自在| 日本美女视频一区| 日韩欧美综合在线视频| 中文字幕在线三区| 色阁综合av| 97久久精品人人做人人爽50路| 国产精品乱码久久久|