精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 原創(chuàng)

發(fā)布于 2024-6-12 11:30
瀏覽
0收藏

盡管近年來大型語言模型(LLM)在代碼生成方面取得了驚人的成功,但這種由人工智能生成的代碼的可信性仍然是一個問題。為了解決這個問題,研究人員提出了Clover模式,即閉環(huán)可驗證代碼生成,通過檢查代碼、文檔字符串和注釋之間的一致性,強制執(zhí)行AI生成的代碼的正確性。

在軟件開發(fā)中,利用大型語言模型(LLM)進行代碼生成是一個快速發(fā)展的趨勢。然而,如果沒有有效的方法來確保AI生成的代碼的正確性,這一趨勢可能導致不可取的結果。在這項工作中,研究人員引入了一種名為Clover的模式,即閉環(huán)可驗證代碼生成,以解決這一挑戰(zhàn)。Clover將正確性檢查降低到更容易解決的一致性檢查問題,并保護LLM驅(qū)動的代碼生成免受可能造成昂貴錯誤的影響。

Clover的核心是一個檢查器,它在代碼、文檔字符串和形式注釋之間執(zhí)行一致性檢查。該檢查器使用形式驗證工具和大型語言模型的新穎集成實現(xiàn)。研究人員通過實證研究在一個手工設計的數(shù)據(jù)集(CloverBench)上驗證了其可行性,該數(shù)據(jù)集包含在教科書水平的帶注釋語言中的注釋程序。實驗結果表明,對于該數(shù)據(jù)集,(i)LLM在自動生成形式規(guī)范方面取得了合理的成功;(ii)一致性檢查器在正確實例上實現(xiàn)了一個有希望的接受率(高達87%),同時對于錯誤實例保持零容忍(沒有誤報)。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

正式驗證和人工智能是一對良好的搭檔

大語言模型(LLM)最近展示了令人矚目的能力。它們可以進行對話、檢索和總結大量信息、生成和解釋文本和代碼等等。在眾多可能的應用中,它們基于自然語言描述合成代碼的能力令人驚嘆,有可能極大地提高程序員的生產(chǎn)效率。

然而,在實現(xiàn)這一未來之前,必須克服一個根本性的挑戰(zhàn)。目前還沒有一種可靠的方法來確保AI生成的代碼的正確性。目前對于AI生成的產(chǎn)物的最佳實踐是讓人參與其中,例如Copilot。雖然這比沒有人工參與要好,但人工監(jiān)督是昂貴且效率低下的,長期來看難以擴展。

可以預見,在未來幾年中,策劃AI生成內(nèi)容的質(zhì)量將成為最關鍵的研究問題之一。首先,生成的代碼必須在功能上是正確和可靠的。代碼中的錯誤或漏洞可能導致軟件故障,尤其是在醫(yī)療軟件、金融系統(tǒng)或自動駕駛車輛等關鍵系統(tǒng)中,這可能具有成本高昂、危險或兩者兼而有之的后果。此外,如果生成的代碼不可信,可能會在軟件中無意中引入安全漏洞。這可能被惡意實體利用,導致數(shù)據(jù)泄露、侵犯隱私和其他安全事件。幸運的是,在代碼生成的特定情況下,正式驗證可以對任意代碼的質(zhì)量和正確性提供數(shù)學上嚴格的保證。如果有一種方法可以自動將正式驗證應用于生成的代碼,這不僅提供了可擴展的解決方案,還有可能為AI生成的代碼比人工編寫的代碼更可靠的未來鋪平道路。

目前,正式驗證只能依靠人類專業(yè)知識實現(xiàn)。本研究的主要假設是,LLM能夠生成所需的附屬信息,以幫助正式驗證成功,同時不損害正式方法提供的形式保證。

目前,正式驗證只能在耗時的人類專業(yè)知識的幫助下實現(xiàn)。在典型的正式驗證過程中,構建系統(tǒng)的數(shù)學模型后,人類專家提供了系統(tǒng)的正式規(guī)范(見清單1),該模型滿足規(guī)范。對于代碼,已經(jīng)存在一些工具(例如Dafny),可以證明某個輸入規(guī)范滿足某個輸入代碼。傳統(tǒng)上,需要大量的人類專業(yè)知識來創(chuàng)建正式規(guī)范,并確保規(guī)范在內(nèi)部一致且準確捕捉到預期的功能。

基于基于AI的代碼生成技術的輸出應該包括代碼、正式規(guī)范和自然語言文檔字符串。然后,可以使用形式工具與生成的AI技術相結合,確保它們是一致的。這種方法被稱為Clover,即閉環(huán)可驗證代碼生成。

Clover模式包括兩個階段。在第一階段(生成階段),創(chuàng)建帶有正式規(guī)范(注釋)和自然語言文檔字符串(文檔字符串)的代碼。在第二階段(驗證階段),對代碼、注釋和文檔字符串進行了六個一致性檢查。如果一致性檢查通過,則表示(i)代碼在功能上與其注釋一致;(ii)注釋完整地捕捉了代碼的功能;(iii)文檔字符串也準確地反映了代碼的功能(見圖1)。

這個想法是可以利用越來越強大的生成式AI技術在生成階段,然后使用驗證階段作為一個強大的過濾器,只批準經(jīng)過形式驗證、文檔準確、內(nèi)部一致的代碼。

Dafny

Dafny是評估中使用的編程語言。Dafny的后端包括一個編譯器,能夠生成可運行的二進制文件,以及一個驗證器,可以形式化地檢查代碼是否符合其規(guī)范。清單1列出了一個用于找到自然數(shù)平方根的Dafny函數(shù),包括三個組成部分(文檔字符串、注釋和代碼)。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover 第一階段:生成

研究人員首先展示了 Clover 中生成階段可以生成帶有注釋和文檔字符串的代碼。具體而言,研究人員使用 OpenAI 的 GPT-4 進行實驗。圖2a展示了在不同條件下,當 GPT-4 被要求為 CloverBench 中的每個例子生成代碼時的結果。第一個柱狀圖("one try")顯示了單次嘗試的結果。下一個柱狀圖允許 GPT-4 嘗試三次,每次提供 Dafny 編譯器和驗證器的輸出作為反饋。第三個柱狀圖類似,但只使用了 Dafny 編譯器的輸出。在最后一個柱狀圖中,允許三次嘗試,并且還提供了文檔字符串。圖2b展示了當提供代碼時,要求 GPT-4 生成注釋的結果。雖然不是完美的,但 GPT-4 在大多數(shù)程序中可以生成正確的注釋。這表明使用 LLM 進行規(guī)范生成是可行的。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover 第二階段:驗證

Clover 期望生成階段的輸出包含三個組成部分:代碼、注釋和文檔字符串。它還期望每個組成部分提供足夠的細節(jié),以明確確定在任何給定輸入上運行代碼的唯一結果。驗證階段檢查每對組成部分的一致性,如圖1所示,只有當所有檢查都通過時才會成功。

具體而言,總共有六個檢查:

  • (1)anno-sound:一種演繹驗證工具(評估使用 Dafny)檢查代碼是否滿足注釋。
  • (2)anno-complete:根據(jù)注釋,使用 LLM 生成新的代碼,然后檢查生成的代碼與原始代碼的等價性。
  • (3)anno2doc:要求 LLM 根據(jù)注釋生成新的文檔字符串,然后使用 LLM 檢查新的文檔字符串與原始文檔字符串的語義等價性。
  • (4)doc2anno:要求 LLM 根據(jù)文檔字符串生成新的注釋,然后使用形式工具檢查新的注釋與原始注釋的邏輯等價性。
  • (5)code2doc:要求 LLM 根據(jù)代碼生成新的文檔字符串,然后檢查新的文檔字符串與原始文檔字符串的語義等價性。
  • (6)doc2code:要求 LLM 根據(jù)文檔字符串生成代碼,然后檢查新的代碼與原始代碼的功能等價性。

重構測試

在每個檢查中,重構原始構件是關鍵。給定三個組成部分(代碼、文檔字符串、注釋)作為輸入,研究人員嘗試從一個構件中重構出另一個構件,然后檢查重構結果是否等價于原始構件。

在下圖中,將屏蔽的函數(shù)簽名和注釋提供給 GPT4,并解析生成的代碼。

等價性檢查

用于代碼的標準等價性檢查包括輸入輸出比較、符號執(zhí)行測試,甚至是完整的形式等價性檢查。評估使用作為 CloverBench 數(shù)據(jù)集的一部分包含的單元測試。檢查文檔字符串的等價性是具有挑戰(zhàn)性的,因為自然語言不是數(shù)學上精確的。在評估中,要求 GPT-4 檢查兩個文檔字符串是否語義上等價。為了檢查兩個注釋的等價性,將兩個注釋的等價性寫成一個形式引理,并要求 Dafny 證明該引理。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

在下圖中,測試文檔字符串的等價性。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

在不同領域中有幾個受歡迎的代碼生成數(shù)據(jù)集,但沒有一個包含注釋或使用 Dafny 語言。研究人員引入了一個新的手工制作的數(shù)據(jù)集,稱為 CloverBench。在撰寫本文時,它基于60個小型手寫示例程序,類似于標準計算機科學教科書中的示例,例如選擇排序。對于每個程序,有四個變體:一個地面真實的變體,其代碼、注釋和文檔字符串都是正確和一致的(經(jīng)手工驗證);以及三個不正確的變體。

評估一致性檢查算法

主要實驗評估了 Clover 一致性檢查算法的能力。對于 CloverBench 中的每個示例,研究人員運行上述描述的所有6個檢查。評估多次獨立運行的效果,這意味著將每個6個檢查重復 k 次。端到端的結果總結在表1中。當 k=1 時, Clover 實現(xiàn)接受了60個正確(地面真實)示例中的45個,并拒絕了所有不正確的示例。當 k=10 時,Clover 接受了60個正確示例中的52個,并拒絕了所有不正確的示例。

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

Clover - 通過閉環(huán)可驗證的代碼生成確保可信AI生成的代碼 -AI.x社區(qū)

結論

本文介紹了 Clover,一個用于閉環(huán)可驗證代碼生成的框架。研究人員將檢查正確性的問題簡化為檢查一致性的更容易解決的問題。

使用 GPT-4、Dafny 和一組簡單的教科書示例的初步實驗結果是令人鼓舞的。本文展示了87%的地面真實示例接受率和100%的不正確示例拒絕率。未來的工作可能集中在設計更好的驗證工具、改進代碼/注釋/文檔字符串生成質(zhì)量、改進 LLM 對 Dafny 語法的理解,或者擴展到更具挑戰(zhàn)性的示例上。

?譯自(有刪改):????https://ai.stanford.edu/blog/clover???


本文轉載自公眾號AIGC最前線   

原文鏈接:?https://mp.weixin.qq.com/s/FnBCCe-7tpkKAFtcmWLzqw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-6-12 11:35:39修改
收藏
回復
舉報
回復
相關推薦
久久综合久中文字幕青草| 欧美精品在线视频| 色综合久久88色综合天天提莫| 无码人妻久久一区二区三区| 日韩免费看片| 日韩视频免费观看高清完整版在线观看| 996这里只有精品| 色av男人的天堂免费在线| 轻轻草成人在线| 欧美韩国理论所午夜片917电影| 亚洲精品视频大全| 国产一区一区| 色先锋久久av资源部| 成年人三级视频| 午夜视频免费在线| 久久精品国产在热久久| 97在线观看视频国产| 欧美激情 一区| 国产精品一区二区三区美女| 欧美日韩你懂得| 欧美午夜小视频| 欧美激情午夜| 久久久精品中文字幕麻豆发布| 亚洲自拍偷拍视频| 懂色av蜜臀av粉嫩av喷吹| 国内成人在线| 一本色道久久综合狠狠躁篇怎么玩 | 色网站在线视频| 亚洲欧美电影| 亚洲成年人影院| 免费看污污视频| av大片在线观看| 91视频www| 国产精品午夜av在线| 国产露脸无套对白在线播放| 三级欧美在线一区| 欧美xxxx14xxxxx性爽| 黄色av免费播放| 九色精品国产蝌蚪| 精品伊人久久97| 亚洲中文字幕无码一区| 亚洲一区网址| 91麻豆精品国产综合久久久久久| 国产天堂在线播放| 成人美女视频| 精品久久在线播放| 日本中文字幕网址| 国产美女一区视频| 亚洲综合精品久久| 日本丰满大乳奶| 成a人片在线观看| 亚洲欧美综合网| 亚洲欧美综合一区| 91.xxx.高清在线| 国产精品成人免费精品自在线观看 | 国产免费叼嘿网站免费| 精品无人区卡一卡二卡三乱码免费卡| 国产精品欧美久久久| 天堂av免费在线观看| 日韩电影一区二区三区| 国产精品劲爆视频| 中文字幕视频在线播放| 奇米精品一区二区三区在线观看| 国产精品高清在线观看| 91丨九色丨海角社区| 日韩二区三区四区| 成人女保姆的销魂服务| 国产jzjzjz丝袜老师水多| 国产一区二区精品久久99| 亚洲自拍偷拍在线| 日本激情视频网站| 久久综合九色综合97婷婷女人| 欧美一区二区在线视频观看| 成全电影播放在线观看国语| 国产精品美女久久久久久| 中文字幕精品—区二区日日骚| 黄色网址在线免费播放| 亚洲高清免费一级二级三级| 免费 成 人 黄 色| 亚洲精品.com| 欧美一区二区大片| 亚洲一区二区三区综合| 伊人久久大香线蕉综合网蜜芽| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 大黄网站在线观看| 富二代精品短视频| 九色porny自拍| 最新国产精品精品视频| 日韩精品中文字幕在线观看| 免费一级suv好看的国产网站 | 中文字幕日韩欧美精品在线观看| 精品在线观看一区| 欧美婷婷在线| 国产97人人超碰caoprom| 一区二区三区免费观看视频| 成人少妇影院yyyy| 日本精品二区| 日韩三级免费| 在线精品国精品国产尤物884a| 91日韩精品视频| 欧美日韩另类图片| 最近中文字幕日韩精品 | 欧美成人午夜精品免费| 天天天综合网| 26uuu久久噜噜噜噜| 国产永久免费视频| 91丝袜国产在线播放| 影音欧美亚洲| 成人性生活视频| 日韩欧美一级二级三级| 国产一二三四五区| 一区久久精品| 成人免费视频在线观看超级碰| 无码国精品一区二区免费蜜桃| 1024成人网色www| 777久久久精品一区二区三区| 国产精品777777在线播放| 亚洲免费av网址| 久久久久久久久久99| 日本sm残虐另类| 久久五月天婷婷| 男人添女人下部高潮视频在线观看 | 99久久综合狠狠综合久久| 手机成人av在线| 成人啊v在线| 精品视频久久久| 精品一区在线视频| 国产在线一区二区| 少妇特黄a一区二区三区| 高端美女服务在线视频播放| 欧美不卡在线视频| 日本黄色片免费观看| 青草av.久久免费一区| 久久久水蜜桃| 高清在线视频不卡| 日韩美一区二区三区| 成人在线观看免费完整| 久久成人综合网| 一区二区三区四区五区视频| 日本综合视频| 亚洲午夜未删减在线观看 | 91成人看片片| 无码人妻精品一区二区三应用大全| 影音先锋久久| 精品国产电影| 超碰成人av| 日韩的一区二区| 国产成人精品a视频一区| 岛国精品在线观看| 日韩欧美不卡在线| 老牛影视av一区二区在线观看| 欧美极品少妇xxxxⅹ免费视频| 草草视频在线播放| 一区二区三区中文在线观看| av在线免费观看不卡| 欧美影院一区| 国产高清精品一区二区三区| 黑人精品视频| 亚洲第一区第一页| 黄网在线观看视频| 久久伊人蜜桃av一区二区| 人妻有码中文字幕| 狠狠综合久久av一区二区蜜桃| 国产成人精品av在线| 国产福利电影在线| 欧美年轻男男videosbes| 日韩福利小视频| 国产91精品在线观看| 成人黄色av片| 国产欧美日韩影院| 国产精品一二区| 国产不卡在线| 亚洲аv电影天堂网| 特级做a爱片免费69| 中文字幕 久热精品 视频在线| 中文字幕22页| 亚洲一本视频| 久久久一本精品99久久精品66| 日本h片久久| 欧美大胆在线视频| 天天操天天射天天舔| 狠狠色香婷婷久久亚洲精品| x88av在线| 国产麻豆午夜三级精品| 阿v天堂2017| 99久久99热这里只有精品| 99三级在线| 日韩新的三级电影| 欧美成人高清视频| 欧美捆绑视频| 91精品国产黑色紧身裤美女| 国产午夜性春猛交ⅹxxx| 国产精品久久网站| a级片在线观看视频| 天使萌一区二区三区免费观看| 在线丝袜欧美日韩制服| 加勒比色老久久爱综合网| 国产精品久久久久久久久久久久久| 里番在线观看网站| 精品视频在线播放色网色视频| 懂色av蜜臀av粉嫩av喷吹| 亚洲午夜精品在线| 国产精品视频在| av一区二区三区四区| 九九热99视频| 亚洲免费在线| 国产成人艳妇aa视频在线| av伊人久久| 韩国精品一区二区三区六区色诱| 美女视频一区| 欧日韩在线观看| 污污视频在线看| 一区二区三区美女xx视频| 隣の若妻さん波多野结衣| 欧美日韩一二三区| 国产一区二区三区影院| 亚洲三级在线免费| 天天躁夜夜躁狠狠是什么心态| 成人综合婷婷国产精品久久| 久久国产这里只有精品| 日日夜夜免费精品| 国产午夜福利100集发布| 久久精品影视| 神马影院一区二区| 日韩欧美国产大片| 国产99午夜精品一区二区三区 | 精品亚洲aⅴ无码一区二区三区| 成人国产亚洲欧美成人综合网| 日韩精品视频网址| 麻豆成人综合网| 国产免费视频传媒| 天堂久久久久va久久久久| 美脚丝袜脚交一区二区| 最新精品国产| 国产成人三级视频| 色综合天天综合网中文字幕| 日韩一区国产在线观看| 蜜桃成人av| 欧美大香线蕉线伊人久久| 日本三级久久| 国产在线精品一区二区三区》| 澳门精品久久国产| 成人三级在线| 国产精品白丝av嫩草影院| 99c视频在线| 亚洲不卡在线| 国产精品久久久久久久久久久久冷| 欧美黄视频在线观看| 91亚洲国产成人久久精品网站| 色综合一区二区日本韩国亚洲| 国产精品久久久久久久久免费看| 午夜无码国产理论在线| 国产精品久久一区| 经典三级一区二区| 国产精品吹潮在线观看| 日本在线中文字幕一区二区三区| 国产精品久久久久久久久男 | 成人综合色站| 久久视频在线观看| 免费99视频| 成人免费看片39| 中文字幕欧美日韩一区二区三区| 香蕉av一区二区| 久久久99精品视频| 精品99视频| 韩国日本在线视频| 久久精品国产第一区二区三区| 57pao国产成永久免费视频| 国产一区二区电影| 国产在线不卡av| 国产亚洲一区二区三区四区| 日本污视频网站| 亚洲黄色免费网站| 国产女同在线观看| 日本丰满少妇一区二区三区| 夜夜嗨aⅴ一区二区三区| 欧美一区二区在线观看| 欧美熟妇另类久久久久久不卡| 国产视频在线观看一区二区| 在线毛片网站| 欧美激情视频一区| 三上悠亚一区二区| 91久久久久久久久久久| 红杏一区二区三区| 日韩视频在线观看国产| 国产精品hd| 国产精品人人妻人人爽人人牛| 国模大尺度一区二区三区| 中文字幕在线永久| 欧美激情资源网| 久久精品欧美一区二区| 色成年激情久久综合| 国产成人精品一区二三区四区五区| 亚洲电影免费观看| yiren22亚洲综合伊人22| 九九热99久久久国产盗摄| 亚洲黄色中文字幕| 亚洲自拍偷拍福利| 欧美日韩在线网站| 国产69精品久久久久久久| 麻豆精品新av中文字幕| 日韩Av无码精品| 18欧美乱大交hd1984| 特级西西444www大精品视频免费看| 欧美日韩国产免费一区二区 | 国产一区二区视频免费| 欧美大片一区二区三区| √新版天堂资源在线资源| 97精品国产97久久久久久春色| 日韩色性视频| 欧美三级网色| 亚洲国产影院| 51自拍视频在线观看| 国产欧美一区二区三区在线老狼| 欧美亚洲天堂网| 欧美一区二区三区在线看| 国产高清美女一级毛片久久| 国外视频精品毛片| 欧美日本三级| 精品国产无码在线| 日韩av网站在线观看| 丰满圆润老女人hd| 亚洲午夜久久久久久久久电影院 | 亚洲国产成人精品女人久久久| 国产在线高清视频| 国产精品伦子伦免费视频| 日韩欧美影院| 国产素人在线观看| 不卡电影一区二区三区| 中文字幕av久久爽av| 欧美日韩大陆一区二区| 国产精品久久久久一区二区国产 | 欧美在线观看黄| 麻豆精品久久久| 国产三级在线观看完整版| 一本到高清视频免费精品| 天堂网av在线播放| 久久久久免费精品国产| 亚洲成人五区| 国产成人生活片| 国产成人一级电影| 欧美交换国产一区内射| 日韩女优av电影| 少女频道在线观看免费播放电视剧| 91精品综合视频| 91精品啪在线观看国产81旧版 | av电影在线观看一区| 日本少妇裸体做爰| 亚洲成色999久久网站| av中文在线资源库| 九九热久久66| 日韩精品一二三| 亚洲精品国产精品国自| 欧美午夜片在线看| 一区二区三区视频网站| 成人免费淫片视频软件| 91精品啪在线观看国产18| 久久黄色一级视频| 亚洲高清免费在线| 青青草av免费在线观看| 青青久久av北条麻妃黑人| 国产不卡一二三区| 最新国产黄色网址| 亚洲乱码精品一二三四区日韩在线| www.国产三级| 午夜精品久久久久久久男人的天堂| 欧美性生活一级片| 久久久久久久久久久久久久国产| 欧美激情一区二区| 国产精品区在线观看| 欧美激情在线观看视频| 婷婷精品在线| 日本xxxx黄色| 亚洲精品成人在线| 视频在线观看你懂的| 国产精品香蕉在线观看| 欧美一区成人| 久久久亚洲av波多野结衣| 欧美精品tushy高清| 91超碰在线免费| 日韩激情久久| 国产成人一级电影| 成人h动漫精品一区二区下载 | 成人福利影视| 日韩aⅴ视频一区二区三区| 久久99精品国产.久久久久久| 久久久久亚洲av成人片| 亚洲天堂av在线播放| 国产一区二区三区| 久久免费视频3| 午夜精品视频| 91视频国产高清| 日本在线视频www鲁啊鲁| 精品一区日韩成人| 麻豆精品在线播放| 在线看成人av| 日韩一区二区福利| 欧美色图婷婷| 绯色av蜜臀vs少妇| 欧美视频一二三区|