精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用大模型幫程序員找Bug,中科院剖析102篇論文總結出這些方案

人工智能
來自中國科學院軟件研究所、澳大利亞Monash大學、加拿大York大學的研究團隊收集了截止到2023年10月30日發表的102篇相關論文,并分別從軟件測試和大模型視角進行了全面分析,總結出一篇關于大模型在軟件測試領域應用的全面綜述。

中科院對“找Bug”下手了,一口氣總結了N種方案!

法寶就是大模型。

圖片

大模型由于其卓越的自然語言理解、推理等能力,已經被應用于各種場景,取得了前所未有的效果。

類似的,軟件測試領域也受益于其強大的能力,能夠幫助生成逼真且多樣化測試輸入,模擬各種異常,加速缺陷的發現,提升測試效率,進行潛在提高軟件質量。

來自中國科學院軟件研究所、澳大利亞Monash大學、加拿大York大學的研究團隊收集了截止到2023年10月30日發表的102篇相關論文,并分別從軟件測試和大模型視角進行了全面分析,總結出一篇關于大模型在軟件測試領域應用的全面綜述。

圖片

(論文地址見文末)

研究發現一覽圖是這樣嬸兒的:

圖片

詳細內容我們接著往下看。

從軟件測試的視角來看

首先,研究人員從軟件測試的角度進行了分析,并將收集到的研究工作按照測試任務進行組織。

如下圖所示,大模型的應用主要集中在軟件測試生命周期的后段,用于測試用例準備(包括單元測試用例生成、測試預言生成、系統級測試輸入生成)、測試報告分析、程序調試和修復等任務。然而,在測試生命周期的早期任務(如測試需求、測試計劃等)上,目前還沒有使用大語言模型的相關工作。

圖片

進一步地,研究人員還對大模型在各種軟件測試任務上的應用進行了詳細分析。

以單元測試用例生成為例,單元測試用例生成任務主要涉及為獨立的軟件或組件單元編寫測試用例,以確保它們的正確性。傳統的基于搜索、約束或隨機的生成技術存在著測試用例覆蓋率弱或可讀性差的問題。

引入大模型后,相對于傳統方法,大模型不僅能夠更好地理解領域知識以生成更準確的測試用例,而且還可以理解軟件項目和代碼上下文的信息,從而生成更全面的測試用例。

對于系統級測試輸入,模糊測試作為常用技術,主要圍繞著生成無效、意外或隨機的測試輸入來達到測試的目的,研究人員也詳細分析了大模型如何改進傳統模糊測試技術。

例如有研究提出通用模糊測試框架Fuzz4All、ChatFuzz等,也有研究專注于特定軟件開發基于大模型的模糊測試技術,包括深度學習庫、編譯器、求解器、移動應用、信息物理系統等。

這些研究的一個關注重點是生成多樣化的測試輸入,以實現更高的覆蓋率,通常通過將變異技術與基于大模型的生成相結合來實現;另一個關注重點是生成可以更早觸發錯誤的測試輸入,常見做法是收集歷史上觸發錯誤的程序來對大模型進行微調或將其作為演示程序在查詢大模型時使用。

論文中對于各種研究的技術思路有更為詳細的介紹和比較。

從大模型的視角來看

隨后,研究人員再從大模型的視角出發,分析了軟件測試任務中選用的大模型,并進一步介紹了如何讓大模型適應測試任務,包括提示工程技術、大模型的輸入以及與傳統測試技術的結合使用。

在所選用的大模型方面,如下圖所示,最常用的前三種大模型分別是ChatGPT、Codex和CodeT5。后兩種是專門在多種編程語言的代碼語料庫上訓練得到的大模型,能夠根據自然語言描述生成完整的代碼片段,因此非常適合涉及源代碼的測試任務,如測試用例生成、缺陷修復。

此外,雖然已經有14個研究使用GPT-4(排名第四),但是GPT-4作為一種多模態大模型,研究人員表示尚未發現相關研究探索軟件測試任務中利用其圖像相關功能(例如UI截圖、編程演示),這值得在未來研究中探索。

圖片

在如何調整大模型行為以勝任軟件測試任務方面,主要有預訓練或微調和提示工程兩種技術手段。

如下圖所示,有38項研究使用了預訓練或微調模式以微調大模型的行為,而64項研究則使用了提示工程來引導大模型達到預期的結果。

提示工程技術的主要優勢在于無需更新模型權重也能讓大模型適應特定領域和任務,并強化大模型的理解和推理能力,目前已經采用的技術包括零樣本或少樣本學習、自我一致性、思維鏈、自動提示等技術。

圖片

此外,研究人員發現有35項研究在運用大模型之上,還結合了傳統測試技術,包括變異測試、差分測試、程序分析、統計分析等,以取得更好的測試有效性和覆蓋率。

雖然大模型在各種任務中表現出巨大的潛力,但仍然存在一些局限性,如難以理解和處理復雜的程序結構。

因此,將大模型與其他技術結合起來,以最大程度地發揮它們的優勢和避免劣勢,從而在特定情況下實現更好的結果,例如生成更多樣化和復雜的代碼,更好地模擬真實場景。

圖片

用大模型找Bug還有哪些挑戰?

過去兩年中,利用大模型進行軟件測試已經有了很多成功的實踐。然而,研究人員指出它仍處于早期發展階段,還有許多挑戰和未解決問題需要探索。

挑戰1:實現高覆蓋率的挑戰

探索被測試軟件的多樣行為以實現高覆蓋率始終是軟件測試的重要關注點。大模型直接實現所需的多樣性仍然具有很大挑戰,例如單元測試用例生成中,在SF110數據集上,行覆蓋率僅為2%,分支覆蓋率僅為1%。

在系統測試輸入生成方面,對于面向深度學習庫的模糊測試,TensorFlow的API覆蓋率為66%(2215/3316)。已有工作通常將變異測試與大模型結合使用,以生成更多樣化的輸出。

其他潛在的研究方向涉及利用測試相關的數據來訓練或微調能夠理解測試特性的專用大模型,可以理解測試要求,自主地生成多樣化的輸出。

挑戰2:測試預言的挑戰

測試預言問題一直是各種測試應用面臨的挑戰,已有工作常見做法是將其轉化為更容易獲取的形式,通常通過差分測試來實現或僅關注容易自動識別的測試預言(例如崩潰類錯誤),雖然取得了不錯效果,但僅適用于少數情況。

探索利用大模型解決其他類型的測試預言問題是非常有價值的。

例如,蛻變測試也是常用的緩解測試預言問題的技術,可以探索結合人機交互或領域知識自動產生蛻變關系,還可探索大模型自動生成基于蛻變關系的測試用例,覆蓋各類輸入。進一步的,像GPT-4這樣的多模態大模型也為檢測用戶界面相關缺陷并輔助推導測試預言提供了可能性。

挑戰3:精準評估性能的挑戰

圖片
△該圖由GPT-4 AI生成

缺乏基準數據集和基于大模型技術潛在的數據泄漏問題給進行嚴格和全面的性能評估帶來了挑戰。研究人員通過檢查訓練大模型的數據源CodeSearchNet和BigQuery,發現Defect4J基準數據集中使用的四個代碼庫同時包含在CodeSearchNet中,并且整個Defects4J代碼庫都包含在BigQuery中。

因此,大模型在預訓練過程中已經見過現有的程序修復基準數據集,存在嚴重的數據泄露問題。所以,需要構建更專門和多樣化的基準數據集,并采取措施防止數據泄漏。

挑戰4:用于現實項目的挑戰

由于對數據隱私的關注,在考慮實際應用時,大多數軟件組織傾向于避免使用商用大模型,更愿意采用開源的大模型,并使用組織特定的數據進行訓練或微調。

此外,一些公司還考慮到計算能力的限制或關注能源消耗等,傾向于采用中等規模的模型。在這樣的現實條件下,要達到與已有研究工作中報告的類似性能是非常具有挑戰的。例如,在廣泛使用的QuixBugs數據集中,40個Python錯誤中有39個能夠自動修復,40個Java錯誤中有34個能夠自動修復。

然而,當涉及到從Stack Overflow收集的深度學習程序(代表實際的編碼實踐)時,72個Python錯誤中僅有16個能夠自動修復。如何更關注現實需求研發相應的技術才能更利于技術落地和實際應用。

大模型也帶來了研究機遇

利用大模型進行軟件測試也帶來了許多研究機遇,對于軟件測試領域的發展大有益處。

機遇1:利用大模型進行更多樣化的軟件測試任務和階段

在測試任務的初期階段,大模型目前還未得到有效應用。主要原因有兩方面:一是早期測試任務的主觀性,需要專家進行評估;二是早期階段缺乏開放數據資源,這限制了大模型的性能表現。

此外,如下圖所示,雖然大模型在單元測試和系統測試方面得到了廣泛應用,但在集成測試和驗收測試方面的應用相對較少。總之,如何充分利用大模型進行更多樣化的軟件測試任務和測試階段是一個值得深入研究的新方向。例如,在驗收測試方面,大模型可以與人類測試人員協同工作,以自動生成測試用例并評估測試覆蓋率。

圖片

機遇2:將大模型應用于更廣泛的測試類型和軟件

一方面,雖然大模型在功能測試方面得到了廣泛應用,但在性能測試和可用性測試等其他方面應用較少,這可能是因為這些測試已有一些專門且讓人滿意的模型和工具。

但將大模型與這些工具相結合仍不失為一個潛在的研究方向,例如利用大模型整合性能測試工具,并模擬真實用戶行為來產生不同類型的工作負載。另

一方面,如下圖所示,已經有研究在多種類型的軟件測試中成功應用了大模型,例如移動應用,深度學習庫、自動駕駛系統等。不僅能將現有技術遷移到其他類型的軟件上,也可以針對某類軟件的特性,研發針對性的技術。

圖片

機遇3:整合先進的提示工程技術

現有研究尚未充分挖掘大模型的潛力,如下圖所示,僅使用了五種最常見的提示工程技術。未來的研究應該探索更高級的提示工程技術(如圖中的思維樹、多模態思維鏈等),以更充分地發揮或增強大模型的理解和推理能力。

圖片

機遇4:和傳統技術結合

目前關于大模型在解決軟件測試問題方面的能力還沒有明確的共識,有研究將大模型與傳統軟件測試技術相結合取得了很好的效果,這可能意味著大模型并非解決軟件測試問題的唯一靈丹妙藥。

考慮到已有許多成熟的軟件工程相關技術和工具,可以探索將大模型與傳統技術相結合(例如形式化驗證等尚未在已有研究中探索過的)、探索其他更先進的結合方式、以及與工具集成更好地發掘已有工具的潛力。

論文Arxiv鏈接:https://arxiv.org/abs/2307.07221。
GitHub鏈接:https://github.com/LLM-Testing/LLM4SoftwareTesting。

責任編輯:姜華 來源: 量子位
相關推薦

2010-05-14 10:09:21

中科院LED無線上網

2025-09-22 09:25:08

2017-05-15 15:07:36

納米材料農藥

2019-01-16 15:21:12

中科院大數據數據庫

2024-03-07 12:31:29

AI技術

2009-09-18 09:40:57

浪潮中科院合肥

2021-11-15 09:34:47

深度學習神經網絡人工智能

2010-11-22 13:28:55

2019-12-26 09:25:48

量子芯片網絡

2013-09-27 17:56:19

銳捷SDN

2014-03-26 10:20:35

SDN軟件定義網絡SDN解決方

2014-08-25 15:02:18

中科院海洋所浪潮

2013-09-02 10:21:31

曙光核高基中科院

2016-04-19 12:51:26

2009-10-11 01:04:43

曙光中科院計算中心

2020-01-16 15:20:48

編程語言PythonJava

2009-07-21 09:47:59

龍芯中科院

2017-10-29 22:36:41

程序員

2024-03-07 14:55:18

模型論文

2023-05-15 12:14:02

ChatGPT語音模型
點贊
收藏

51CTO技術棧公眾號

国产91在线播放| 精品伊人久久97| www插插插无码免费视频网站| 99国产精品久久久久久久成人 | 久久免费看少妇高潮v片特黄| 久久综合偷偷噜噜噜色| 亚洲高清免费观看| 日韩精品最新在线观看| 国产伦子伦对白视频| 在线视频亚洲| 久久精彩免费视频| 岛国精品一区二区三区| 3d欧美精品动漫xxxx无尽| 日韩一区中文字幕| 欧美极品色图| 亚洲成人一二三区| 日韩成人一级大片| 欧美福利视频在线| eeuss中文字幕| 亚洲美女久久| 精品免费日韩av| 污色网站在线观看| 久久久男人天堂| 亚洲精品一卡二卡| 亚洲成人午夜在线| 色中色在线视频| 国内精品久久久久影院色| 欧美亚洲免费电影| 国产一级一片免费播放放a| 欧美精品一区二区久久| 日韩精品视频在线观看免费| 中文字幕在线观看视频www| 成人黄页网站视频| 色噜噜偷拍精品综合在线| 男人天堂av片| 永久免费网站在线| 自拍偷拍亚洲激情| 性刺激综合网| 国产免费a∨片在线观看不卡| 成人免费视频视频在线观看免费| 成人看片人aa| 国产成人av免费| 免费日韩精品中文字幕视频在线| 久久久久久久久久久国产| 黄色a级片在线观看| 久久综合成人| 日韩中文字幕网| 九一在线免费观看| 日韩精品久久久久久久电影99爱| 亚洲美女av黄| 尤物视频最新网址| 国产日产一区| 一本一道久久a久久精品逆3p| 粉嫩av蜜桃av蜜臀av| 国产精品视屏| 亚洲精品电影网| 国产精品久久AV无码| 老牛精品亚洲成av人片| 亚洲韩国日本中文字幕| 黄色网址在线视频| 亚洲第一福利社区| 亚洲人精选亚洲人成在线| 久久久久久久久久久久久久久| 伊人久久大香线蕉综合网站| 亚洲视频在线观看免费| 制服 丝袜 综合 日韩 欧美| 欧美综合一区| www国产亚洲精品久久网站| 永久免费看mv网站入口| 亚洲综合色站| 欧美激情图片区| 亚洲黄色一区二区| 日日夜夜一区二区| 国产精品色婷婷视频| 91午夜交换视频| 国产成人久久精品77777最新版本 国产成人鲁色资源国产91色综 | 欧美日韩在线观看首页| 色哟哟日韩精品| 中文字幕第17页| 香蕉大人久久国产成人av| 亚洲二区中文字幕| 少妇光屁股影院| 日产精品一区二区| 色综合视频一区中文字幕| 国产精品第一页在线观看| 亚洲欧美日韩国产一区二区| 国产精品久久久久久久久免费| 91片黄在线观看喷潮| 成人晚上爱看视频| 日本欧美色综合网站免费| 黄色片网站在线观看| 亚洲成人黄色影院| 性欧美极品xxxx欧美一区二区| 不卡一区视频| 亚洲精品视频久久| 日本少妇高清视频| 香蕉成人久久| 亚洲japanese制服美女| 少妇激情av一区二区| 国产精品毛片大码女人| heyzo亚洲| 在线免费观看亚洲| 亚洲欧美日韩综合| 久久久久久久久97| 日本女优在线视频一区二区| 国产精品国产三级国产专区53| 国产福利在线视频| 亚洲福利国产精品| 免费在线观看污网站| 美日韩中文字幕| 欧美精品少妇videofree| 影音先锋在线国产| 国产 欧美在线| 亚洲精蜜桃久在线| 欧美男男激情videos| 欧美一区二区三区思思人| 人妻无码一区二区三区| 欧美日韩三区| 91精品国产自产在线老师啪| 欧美套图亚洲一区| 亚洲va欧美va人人爽午夜| 手机av在线网站| 四季av在线一区二区三区 | 午夜毛片在线观看| 国产成人av一区二区三区在线 | 91黄色免费看| 欧洲一级黄色片| 一区在线观看| 不卡视频一区二区| 精品无人乱码| 欧美日韩一区二区在线| 亚洲日本精品| 久久国产色av免费观看| 日韩在线观看一区二区三区| 中文字幕视频在线免费欧美日韩综合在线看 | 免费成人在线视频网站| 亚洲精品观看| 久久99亚洲热视| 国产ts人妖调教重口男| 日韩理论片网站| 久久久久久久久久久久久久久国产| 黑丝美女一区二区| 国产成人精品av| 免费人成在线观看网站| 欧美性猛交xxxx久久久| 菠萝菠萝蜜网站| 午夜亚洲福利在线老司机| 国模精品娜娜一二三区| 牛牛精品在线| 精品少妇一区二区三区在线播放| 久久久精品国产sm调教网站| 国产成人在线看| 亚洲理论电影在线观看| 国产精品超碰| 4p变态网欧美系列| 免费毛片在线| 欧美专区亚洲专区| 国产精品综合激情| 九九在线精品视频| 天堂v在线视频| 久久久久毛片免费观看| 欧美高清视频在线播放| 国产综合无码一区二区色蜜蜜| 一区二区高清免费观看影视大全| 秘密基地免费观看完整版中文| 在线日韩av| 欧美一区二区三区四区五区六区| 欧美在线va视频| 精品国产一区二区在线| 国产成人免费看一级大黄| 亚洲第一成人在线| 亚洲精品成人无码| 国产最新精品免费| 日本手机在线视频| 国产欧美日韩在线观看视频| 国产日韩在线观看av| 日本电影在线观看| 日韩精品在线免费播放| 一级黄色片视频| 亚洲国产成人porn| 波多野结衣av在线观看| 国产乱码精品一区二区三区av| 热99这里只有精品| 不卡一区2区| 亚洲一区中文字幕| 成人免费直播| 久久久精品2019中文字幕神马| 亚洲女人18毛片水真多| 日本福利一区二区| 永久久久久久久| 久久午夜色播影院免费高清| 污视频网址在线观看| 亚洲国产精品一区| 正在播放91九色| 全国精品免费看| 91精品在线国产| 亚洲精品中文字幕| 久久久精品国产一区二区| 青青草av免费在线观看| 欧美一区二区三区人| 五月婷婷视频在线| 亚洲美女视频在线| 亚洲天堂岛国片| 成熟亚洲日本毛茸茸凸凹| 国产福利一区视频| 欧美精品大片| 久久精品一区二区三区不卡免费视频| 成人激情综合| 久久91精品国产91久久久| 天堂成人在线视频| 欧美一区二区三区在线看| 狠狠人妻久久久久久综合| 国产精品成人免费在线| 亚洲精品乱码久久久久久久| 国产精品一区久久久久| 亚洲五月天综合| aⅴ色国产欧美| 日韩精品一区二区免费| 99久久.com| 亚洲v欧美v另类v综合v日韩v| 欧美亚洲国产日韩| 国产精品国产亚洲精品看不卡15| 成人永久在线| 国产日韩欧美日韩大片| 电影亚洲精品噜噜在线观看| 久久久噜噜噜久久| 欧美人体视频xxxxx| 久久视频在线直播| 黄色av电影在线观看| 在线不卡国产精品| 国产三级电影在线观看| 亚洲人成电影网站色www| 无码精品视频一区二区三区| 精品成人私密视频| www.精品视频| 欧美嫩在线观看| 亚洲精品无码久久久久| 欧日韩精品视频| 成人免费一区二区三区| 在线视频你懂得一区二区三区| 国产一级做a爱片久久毛片a| 午夜精品一区二区三区免费视频 | 岛国在线大片| 国产一级揄自揄精品视频| 久久精品a一级国产免视看成人| 日韩精品在线视频| 国产黄色片在线观看| 一区国产精品视频| 亚洲乱亚洲乱妇| 久久五月情影视| 成人影院在线看| 欧美xxxx18性欧美| 久久大胆人体| 91成人天堂久久成人| 欧美久久天堂| 国产精品mp4| 国产精品久久久久久久久久齐齐| 国产精品久久久久久影视| 成人看片毛片免费播放器| 国产精品夜色7777狼人| 91丨精品丨国产| 国产成人一区二区三区免费看| 国产精品巨作av| 欧洲亚洲一区二区| 国产精品精品| 日韩av中文字幕第一页| 日韩精品一区第一页| 岛国毛片在线播放| 高清国产一区二区三区| 五月天激情小说| 欧美韩国日本不卡| 国产午夜手机精彩视频| 精品国产户外野外| 免费在线不卡av| 欧美成人三级在线| 男男电影完整版在线观看| www.精品av.com| 狠狠操一区二区三区| 国产精品久久久久久一区二区 | 久久久综合亚洲91久久98| 欧美精品一区二区三区精品| 日本xxx免费| 免费亚洲网站| 91蝌蚪视频在线| 久久综合狠狠综合久久激情| 人人干在线观看| 午夜国产精品一区| 91麻豆国产视频| 日韩高清有码在线| 国产黄网站在线观看| 欧美一级高清免费| 成人在线啊v| 欧美三日本三级少妇三99| 婷婷综合亚洲| 国产精品宾馆在线精品酒店| 久久精品免费观看| 中文字幕在线观看网址| 一区在线播放视频| 亚洲 欧美 日韩 综合| 欧美高清视频不卡网| 日韩成人黄色| 欧美激情一级二级| 成人豆花视频| 日韩精品一线二线三线| 在线一区免费观看| 香蕉视频在线观看黄| 亚洲国产成人在线| www.国产高清| 亚洲成人精品av| av免费在线观| 国产精品网站大全| 亚洲欧美tv| 东北少妇不带套对白| 国产一区二区福利| 999福利视频| 欧美性色xo影院| 亚洲精品久久久久久动漫器材一区 | 欧洲亚洲免费视频| 成人在线tv视频| 男人的天堂成人| 青娱乐精品在线视频| 97香蕉碰碰人妻国产欧美 | 秋霞影院一区| 手机福利在线视频| 美女视频黄 久久| xxx在线播放| 日韩欧美中文免费| 日本精品一二区| 欧美国产日产韩国视频| 成人动漫视频在线观看| 伊人精品久久久久7777| 人人狠狠综合久久亚洲| 亚洲av无码一区二区三区人 | www.黄色av| 精品国产一区二区三区久久久狼| 欧美三区四区| 神马影院我不卡| 日韩在线一二三区| av网在线播放| 欧洲一区二区三区在线| 国产免费av高清在线| 国产精品三级在线| 国产精品88久久久久久| 超碰人人草人人| 亚洲欧美视频在线观看| 999免费视频| 欧美日韩福利在线观看| 51社区在线成人免费视频| 欧美久久在线观看| av高清不卡在线| 亚洲一区欧美在线| 亚洲人成网站在线播| 一二区成人影院电影网| 一区二区三区不卡在线| 韩日精品视频一区| 午夜写真片福利电影网| 精品国产一区二区三区av性色| 欧美videosex性极品hd| 精品国产乱码久久久久| 久久精品盗摄| youjizz亚洲女人| 日韩一区二区免费高清| hd国产人妖ts另类视频| 欧美日韩无遮挡| 久久国产福利国产秒拍| 精品97人妻无码中文永久在线| 欧美精品一区二区在线播放| 中文字幕乱码中文乱码51精品| 日韩中文字幕av在线| 国产一区二区视频在线| 日本三级视频在线| 国产亚洲欧洲高清| 精品久久国产一区| 日韩精品 欧美| 国产精品久久久久四虎| 成人1区2区3区| 欧洲日韩成人av| 亚洲天堂免费| 欧美深性狂猛ⅹxxx深喉| 欧美四级电影网| 免费在线观看av电影| 欧美性天天影院| 国产精一区二区三区| 国产一级18片视频| 久久久精品日本| 天堂av一区二区三区在线播放| 182午夜在线观看| 婷婷综合在线观看| 免费av网站在线观看| 精品国产一区二区三区四区精华 | 亚洲精品免费网站| 一本一道久久综合狠狠老精东影业| 怡红院一区二区三区| 日韩精品中文字幕一区| 粉嫩一区二区三区| 免费看欧美黑人毛片| 亚洲欧美综合色| 欧美挠脚心网站| http;//www.99re视频| 蜜臀av一级做a爰片久久|