精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無需OpenAI數據,躋身代碼大模型榜單!UIUC發布StarCoder-15B-Instruct

人工智能 新聞
通過StarCoder2-15B生成數千個指令-響應對,直接對StarCoder-15B基座模型進行微調,無需依賴昂貴的人工標注數據,也無需從GPT4等商業大模型中獲取數據,StarCoder2-15B-Instruct成功擠進HumanEval榜單。

在軟件技術的前沿,UIUC張令明組攜手BigCode組織的研究者,近日公布了StarCoder2-15B-Instruct代碼大模型。

這一創新成果在代碼生成任務取得了顯著突破,成功超越CodeLlama-70B-Instruct,登上代碼生成性能榜單之巔。

StarCoder2-15B-Instruct的獨特之處在于其純自對齊策略,整個訓練流程公開透明,且完全自主可控。

該模型通過StarCoder2-15B生成數千個指令-響應對,直接對StarCoder-15B基座模型進行微調,無需依賴昂貴的人工標注數據,也無需從GPT4等商業大模型中獲取數據,避免了潛在的版權問題。

在HumanEval測試中,StarCoder2-15B-Instruct以72.6%的Pass@1成績脫穎而出,較CodeLlama-70B-Instruct的72.0%有所提升。

更為令人矚目的是,在LiveCodeBench數據集的評估中,這一自對齊模型的表現甚至超越了基于GPT-4生成數據訓練的同類模型。這一成果證明了,通過自身分布內的數據,大模型同樣能夠有效地學習如何與人類偏好對齊,而無需依賴外部教師大模型的偏移分布。

該項目的成功實施得到了美國東北大學Arjun Guha課題組、加州大學伯克利分校、ServiceNow和Hugging Face等機構的鼎力支持。

技術揭秘

StarCoder2-Instruct的數據生成流程主要包括三個核心步驟:

1. 種子代碼片段的采集:團隊從The Stack v1中篩選出高質量、多樣化的種子函數,這些函數來自海量的獲得許可的源代碼語料庫。通過嚴格的過濾和篩選,確保了種子代碼的質量和多樣性;

2. 多樣化指令的生成:基于種子函數中的不同編程概念,StarCoder2-15B-Instruct能夠創建出多樣化且真實的代碼指令。這些指令涵蓋了從數據反序列化到列表連接、遞歸等豐富的編程場景;

3. 高質量響應的生成:對于每個指令,模型采用編譯運行引導的自我驗證方式,確保生成的響應是準確且高質量的。

每個步驟的具體操作如下:

精選種子代碼片段的過程

為了提升代碼模型在遵循指令方面的能力,模型需要廣泛接觸和學習不同的編程原理與實際操作。StarCoder2-15B-Instruct受到OSS-Instruct的啟發,從開源代碼片段中汲取靈感,尤其是The Stack V1中那些格式規范、結構清晰的Python種子函數。

在構建其基礎數據集時,StarCoder2-15B-Instruct對The Stack V1進行了深度挖掘,選取了所有配備文檔說明的Python函數,并借助autoimport功能自動分析并推斷了這些函數所需的依賴項。

為了確保數據集的純凈性和高質量,StarCoder2-15B-Instruct對所有選取的函數進行了精細的過濾和篩選。

首先,通過Pyright類型檢查器進行嚴格的類型檢查,排除了所有可能產生靜態錯誤的函數,從而保證了數據的準確性和可靠性。

接著,通過精確的字符串匹配技術,識別和剔除了與評估數據集存在潛在關聯的代碼和提示,以避免數據污染。在文檔質量方面,StarCoder2-15B-Instruct更是采用了獨特的篩選機制。

它利用自身的評估能力,通過向模型展示7個樣本提示,讓模型自行判斷每個函數的文檔質量是否達標,從而決定是否將其納入最終的數據集。

這種基于模型自我判斷的方法,不僅提高了數據篩選的效率和準確性,也確保了數據集的高質量和一致性。

最后,為了避免數據冗余和重復,StarCoder2-15B-Instruct采用了MinHash和局部敏感哈希算法,對數據集中的函數進行了去重處理。通過設定0.5的Jaccard相似度閾值,有效去除了相似度較高的重復函數,確保了數據集的獨特性和多樣性。

經過這一系列的精細篩選和過濾,StarCoder2-15B-Instruct最終從500萬個帶有文檔的Python函數中,精選出了25萬個高質量的函數作為其種子數據集。這一方法深受MultiPL-T數據收集流程的啟發。

多樣化指令的生成

當StarCoder2-15B-Instruct完成了種子函數的收集后,它運用了Self-OSS-Instruct技術來創造多樣化的編程指令。這一技術的核心在于通過上下文學習,讓StarCoder2-15B基座模型能夠自主地為給定的種子代碼片段生成相應的指令。

為實現這一目標,StarCoder2-15B-Instruct精心設計了16個范例,每個范例都遵循(代碼片段,概念,指令)的結構。指令的生成過程被細分為兩個階段:

代碼概念識別:在這一階段,StarCoder2-15B會針對每一個種子函數進行深入分析,并生成一個包含該函數中關鍵代碼概念的列表。這些概念廣泛涵蓋了編程領域的基本原理和技術,如模式匹配、數據類型轉換等,這些對于開發者而言具有極高的實用價值。

指令創建:基于識別出的代碼概念,StarCoder2-15B會進一步生成與之對應的編碼任務指令。這一過程旨在確保生成的指令能夠準確地反映代碼片段的核心功能和要求。

通過上述流程,StarCoder2-15B-Instruct最終成功生成了高達238k個指令,極大地豐富了其訓練數據集,并為其在編程任務中的表現提供了強有力的支持。

響應的自我驗證機制

在獲取Self-OSS-Instruct生成的指令后,StarCoder2-15B-Instruct的關鍵任務是為每個指令匹配高質量的響應。

傳統上,人們傾向于依賴如GPT-4等更強大的教師模型來獲取這些響應,但這種方式不僅可能面臨版權許可的難題,而且外部模型并非總是觸手可及或準確無誤。更重要的是,依賴外部模型可能引入教師與學生之間的分布差異,這可能會影響到最終結果的準確性。

為了克服這些挑戰,StarCoder2-15B-Instruct引入了一種自我驗證機制。這一機制的核心思想是,讓StarCoder2-15B模型在生成自然語言響應后,自行創建對應的測試用例。這一過程類似于開發人員編寫代碼后的自測流程。

具體而言,對于每一個指令,StarCoder2-15B會生成10個包含自然語言響應和對應測試用例的樣本。隨后,StarCoder2-15B-Instruct會在一個沙盒環境中執行這些測試用例,以驗證響應的有效性。任何在執行測試中失敗的樣本都會被過濾掉。

經過這一嚴格的篩選過程,StarCoder2-15B-Instruct會從每個指令的通過測試的響應中隨機選取一個,加入最終的SFT數據集。整個過程中,StarCoder2-15B-Instruct為238k個指令生成了總計240萬個響應樣本(每個指令10個樣本)。在采用0.7的采樣策略后,有50萬個樣本成功通過了執行測試。

為了確保數據集的多樣性和質量,StarCoder2-15B-Instruct還進行了去重處理。最終,剩下5萬個指令,每個指令都配有一個隨機選取的、經過測試驗證的高質量響應。這些響應構成了StarCoder2-15B-Instruct最終的SFT數據集,為模型的后續訓練和應用提供了堅實的基礎。

StarCoder2-15B-Instruct的卓越表現與全面評估

在備受矚目的EvalPlus基準測試中,StarCoder2-15B-Instruct憑借其規模化優勢,成功脫穎而出,成為表現最出色的自主可控大型模型。

它不僅超越了規模更大的Grok-1 Command-R+和DBRX,還與Snowflake Arctic 480B和Mixtral-8x22B-Instruct等業界翹楚性能相當。

值得一提的是,StarCoder2-15B-Instruct是首個在HumanEval基準上達到70+得分的自主代碼大模型,其訓練過程完全透明,數據和方法的使用均符合法律法規。

在自主可控代碼大模型領域,StarCoder2-15B-Instruct顯著超越了之前的佼佼者OctoCoder,證明了其在該領域的領先地位。

即便與擁有限制性許可的大型強力模型如Gemini Pro和Mistral Large相比,StarCoder2-15B-Instruct依然展現出卓越的性能,并與CodeLlama-70B-Instruct平分秋色。更令人矚目的是,StarCoder2-15B-Instruct完全依賴于自生成數據進行訓練,其性能卻能與基于GPT-3.5/4數據微調的OpenCodeInterpreter-SC2-15B相媲美。

除了EvalPlus基準測試,StarCoder2-15B-Instruct在LiveCodeBench和DS-1000等評估平臺上也展現出了強大的實力。

LiveCodeBench專注于評估2023年9月1日之后出現的編碼挑戰,而StarCoder2-15B-Instruct在該基準測試中取得了最優成績,并且始終領先于使用GPT-4數據進行微調的OpenCodeInterpreter-SC2-15B

盡管DS-1000專注于數據科學任務,StarCoder2-15B-Instruct在訓練數據中涉及的數據科學問題相對較少,但其在該基準測試中的表現依然強勁,顯示出廣泛的適應性和競爭力。

StarCoder2-15B-Instruct-v0.1的突破與啟示

StarCoder2-15B-Instruct-v0.1的發布,標志著研究者們在代碼模型自我調優領域邁出了重要一步。這款模型的成功實踐,打破了以往必須依賴如GPT-4等強大外部教師模型的限制,展示了通過自我調優同樣能夠構建出性能卓越的代碼模型。

StarCoder2-15B-Instruct-v0.1的核心在于其自我對齊策略在代碼學習領域的成功應用。這一策略不僅提升了模型的性能,更重要的是,它賦予了模型更高的透明度和可解釋性。這一點與Snowflake-Arctic、Grok-1、Mixtral-8x22B、DBRX和CommandR+等其他大型模型形成了鮮明對比,這些模型雖然強大,但往往因缺乏透明度而限制了其應用范圍和可信賴度。

更令人欣喜的是,StarCoder2-15B-Instruct-v0.1已經將其數據集和整個訓練流程——包括數據收集和訓練過程——完全開源。這一舉措不僅彰顯了研究者的開放精神,也為未來該領域的研究和發展奠定了堅實的基礎。

有理由相信,StarCoder2-15B-Instruct-v0.1的成功實踐將激發更多研究者投入到代碼模型自我調優領域的研究中,推動該領域的技術進步和應用拓展。同時,也期待這一領域的更多創新成果能夠不斷涌現,為人類社會的智能化發展注入新的動力。

作者簡介

UIUC的張令明老師是一位在軟件工程、程序語言和機器學習交叉領域具有深厚造詣的學者。他領導的課題組長期致力于基于AI大模型的自動軟件合成、修復和驗證研究,以及機器學習系統的可靠性提升。

近期,團隊發布了多個創新性的代碼大模型和測試基準數據集,并率先提出了一系列基于大模型的軟件測試和修復技術。同時,在多個真實軟件系統中成功挖掘出上千個新缺陷和漏洞,為提升軟件質量做出了顯著貢獻。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-03-29 12:43:15

精度代碼模型

2024-10-24 14:30:00

模型數據

2023-12-19 13:18:36

AI數據

2023-06-07 12:28:47

開源數據

2024-01-16 12:10:33

模型數據

2025-05-16 09:10:00

2025-04-22 09:06:00

強化學習工具AI

2025-06-13 08:11:11

2024-01-29 09:40:00

AI訓練

2024-09-13 10:06:21

2025-09-08 08:50:00

AI模型訓練

2023-05-16 20:47:38

2025-08-07 14:05:40

OpenAI大模型開源

2010-01-15 09:43:20

IT企業騰訊

2024-02-29 16:35:01

StarCoder2大型語言模型人工智能

2023-05-17 10:05:56

點贊
收藏

51CTO技術棧公眾號

在线观看亚洲精品视频| 99热精品国产| 久久影院在线观看| 亚洲妇女无套内射精| 久久久男人天堂| 国产蜜臀97一区二区三区| 亚洲a中文字幕| 亚洲GV成人无码久久精品| 日韩电影免费网址| 亚洲福利视频免费观看| 日本久久久久久久久久久久| а√天堂8资源在线官网| 成人av在线播放网址| 国产精品久久久久久中文字| 日韩女优一区二区| 伊人久久大香线蕉| 日韩一区二区高清| 不要播放器的av网站| 91网在线看| 国产日韩欧美麻豆| 国产91视觉| 中文字幕人妻一区二区在线视频 | 免费人成在线观看| 欧美日一区二区| 精品1区2区在线观看| 国产成人手机视频| 国产剧情av在线播放| 亚洲人123区| 天堂资源在线亚洲视频| 涩涩视频免费看| 国产一区二区三区视频在线播放| 欧美在线视频a| 久久久久久国产精品视频| 日产精品一区二区| 亚洲精品视频播放| 日本在线不卡一区二区| 国产精品成人**免费视频| 色婷婷综合久久久久中文 | 久久av一区| 久久久之久亚州精品露出| 美国黄色片视频| 黑丝美女一区二区| 亚洲男女性事视频| 精品一区二区视频在线观看| 日韩高清一区| 91麻豆精品国产91久久久久久久久| 免费裸体美女网站| 永久免费毛片在线播放| 亚洲国产毛片aaaaa无费看 | 91在线观看免费| 中文字幕在线观看高清| 天堂精品中文字幕在线| 全球成人中文在线| 最新中文字幕一区| 另类天堂av| 欧美一级淫片aaaaaaa视频| 日本熟女一区二区| 9色精品在线| 久久青草福利网站| 日本天堂在线视频| 在线一区免费观看| 日本成人在线视频网址| 日本久久综合网| 日韩国产在线观看| 国产精品啪视频| 亚洲天堂avav| 国产自产高清不卡| 成人动漫视频在线观看免费| 国产高清免费av| 丁香天五香天堂综合| 国产日韩亚洲精品| 欧美扣逼视频| 欧美国产一区二区在线观看| 亚洲自拍三区| 最新国产露脸在线观看| 亚洲国产日韩一级| 国产免费观看高清视频| 欧美三区四区| 欧美久久一二区| 韩国一区二区三区四区| 国产精品中文字幕制服诱惑| 亚洲美女精品久久| 国产白丝一区二区三区| 欧美日韩国产欧| 97视频在线观看成人| 无码视频一区二区三区| 麻豆精品视频在线| av一本久道久久波多野结衣| 午夜视频在线免费播放| 日本一区二区免费在线| 日韩精品一区二区三区电影| av剧情在线观看| 一本大道久久a久久综合婷婷| 污视频免费在线观看网站| 999精品嫩草久久久久久99| 精品国产免费一区二区三区香蕉| 国产精品三级在线观看无码| 国内精品久久久久久久久电影网 | 男女在线视频| 色综合久久久久久久| 国产一区二区在线观看免费视频| 动漫av一区| 日韩中文字幕在线| 日干夜干天天干| 久久精品国产精品青草| 国产经典一区二区三区| 黄色片在线免费观看| 亚洲欧美日韩系列| 久久黄色免费看| 日韩三级网址| 中文字幕精品在线视频| 日韩福利片在线观看| 麻豆视频观看网址久久| 国产综合精品一区二区三区| 麻豆视频在线免费观看| 日韩欧美一区二区三区久久| 国产黑丝在线视频| 狠狠色狠狠色综合婷婷tag| 久久久久国产精品www| 在线免费观看中文字幕| 成人蜜臀av电影| 国产高清免费在线| 亚洲成av在线| 日韩激情片免费| 久久久一二三区| 九一久久久久久| 日韩理论片在线观看| 日韩影院在线| 亚洲激情第一页| 欧美成人精品一区二区免费看片 | 日韩免费观看视频| 女人18毛片一区二区三区| 亚洲视频一区二区在线| www.xxx亚洲| 亚洲人挤奶视频| 97人人爽人人喊人人模波多| 性猛交富婆╳xxx乱大交天津| 国产精品成人免费在线| 亚洲精品视频导航| 狠狠综合久久av一区二区蜜桃| 国内免费久久久久久久久久久| 国产哺乳奶水91在线播放| 中文字幕中文字幕一区二区| 爱情岛论坛成人| 国产一区二区三区天码| 日韩**中文字幕毛片| 三级毛片在线免费看| 婷婷丁香激情综合| 亚洲熟女一区二区| 亚洲人成在线影院| 国产一区不卡在线观看| 99热99re6国产在线播放| 日韩精品自拍偷拍| 国产性70yerg老太| 成人激情免费电影网址| 2018国产在线| 亲子伦视频一区二区三区| 97视频网站入口| 日本v片在线免费观看| 欧美性黄网官网| 3d动漫精品啪啪一区二区下载 | 国产欧美一区二区三区精品观看| 欧美诱惑福利视频| 久蕉依人在线视频| 欧美性猛交xxxxxx富婆| 欧美一级特黄高清视频| 国产另类ts人妖一区二区| 真人做人试看60分钟免费| 一区二区三区四区精品视频| 久久免费国产精品1| 手机在线不卡av| 色婷婷av久久久久久久| 永久免费观看片现看| 国产在线视频一区二区| 成人av在线不卡| 天天躁日日躁狠狠躁欧美巨大小说| 热门国产精品亚洲第一区在线| 国产视频网站在线| 欧美精品久久99久久在免费线| 欧美国产在线看| 99视频在线观看一区三区| www.色就是色| 国产精品mv在线观看| 久精品国产欧美| 狂野欧美性猛交xxxx| 久久91亚洲精品中文字幕| 日韩a在线观看| 欧美日韩高清影院| 日本免费观看视| 国产精品毛片无遮挡高清| 国产精品19p| 久久国产一二区| 成人在线观看www| 天堂成人娱乐在线视频免费播放网站 | 亚久久调教视频| 国产成年人在线观看| 狼人天天伊人久久| 国产精品亚洲片夜色在线| 先锋影音在线资源站91| 亚洲男人av在线| www.好吊色| 欧美中文字幕一区| 久久网一区二区| 国产精品乱码人人做人人爱 | 欧美成人性生活| 欧美性孕妇孕交| 日韩精品中文字幕一区二区三区| 神马久久久久久久| 一区二区三区在线视频播放| 免费看黄色的视频| 懂色av一区二区夜夜嗨| 亚洲 欧美 另类人妖| 在线精品亚洲| 中文字幕乱码免费| 欧美一级淫片| 久久精品99久久| 伊人久久亚洲| 国产欧美日韩中文字幕| 亚洲欧美韩国| 韩国美女主播一区| 色黄网站在线观看| 日韩最新在线视频| 成人三级黄色免费网站| 日韩av中文字幕在线播放| 一级全黄裸体免费视频| 性久久久久久久| 欧美毛片在线观看| 国产精品亲子乱子伦xxxx裸| 偷拍女澡堂一区二区三区| 风间由美性色一区二区三区 | 成人精品视频一区二区三区尤物| 中文字幕国产免费| 日本一不卡视频| 亚洲成熟丰满熟妇高潮xxxxx| 亚洲性图久久| 99er在线视频| 欧美在线资源| 国产在线拍揄自揄拍无码| 日韩欧美1区| 亚洲国产精品www| 成人精品天堂一区二区三区| 欧美日韩亚洲一区二区三区在线观看| 加勒比色综合久久久久久久久| 欧美少妇另类| 亚洲丝袜自拍清纯另类| 天美传媒免费在线观看| 国产亚洲精品福利| 伊人网在线视频观看| 久久这里都是精品| wwwwww日本| 久久影院视频免费| 国精产品一区一区三区免费视频| 99re热视频这里只精品 | 国产91综合网| 麻豆免费在线观看视频| 丰满亚洲少妇av| 波多野结衣有码| 91小视频在线| 小早川怜子久久精品中文字幕| 国产亚洲精品超碰| 日本黄色激情视频| 亚洲视频一区二区免费在线观看| 一级性生活免费视频| 亚洲久草在线视频| 久久久久久久久久91| 亚洲午夜久久久久久久久久久| 在线看成人av| 一本到高清视频免费精品| а中文在线天堂| 91精品国产色综合久久| 亚洲乱色熟女一区二区三区| 亚洲成人教育av| 免费毛片在线| 日韩在线视频中文字幕| 性欧美ⅴideo另类hd| 97久久国产精品| 国产精品久久久久77777丨| 95av在线视频| 日韩福利视频一区| 亚洲精品乱码视频| 欧美激情1区2区3区| 五月丁香综合缴情六月小说| 日韩不卡免费视频| 久久久久久无码精品人妻一区二区| 国产成人三级在线观看| 99久久久无码国产精品性| 国产精品白丝在线| 久久夜靖品2区| 欧美中文字幕一区二区三区| 精品国产18久久久久久| 亚洲免费视频在线观看| 黄色网在线播放| 91超碰caoporn97人人| 国产91在线播放精品| 99视频免费观看| 狠狠操综合网| 久久av综合网| 老汉av免费一区二区三区| 自拍视频一区二区| 最新欧美精品一区二区三区| 九九热在线视频播放| 在线播放视频一区| 欧洲天堂在线观看| 欧美美最猛性xxxxxx| 日韩在线影院| 国外成人在线视频网站| 色777狠狠狠综合伊人| 久久黄色片视频| 国产在线播精品第三| www.中文字幕av| 亚洲图片欧美视频| 91福利免费视频| 亚洲免费福利视频| 538在线视频| 91九色视频在线观看| 人人狠狠综合久久亚洲婷| 精品少妇人妻av免费久久洗澡| 精品亚洲国内自在自线福利| 久久精品国产亚洲av麻豆| 亚洲高清免费观看 | 精品在线视频一区| 精品人妻互换一区二区三区| 亚洲r级在线视频| 国产露脸国语对白在线| 一区二区三欧美| 中文字幕21页在线看| 国产另类自拍| 国内久久视频| 亚洲国产综合av| 亚洲男人天堂av网| 国产精品无码在线播放| 中文字幕日韩在线视频| 黄色亚洲网站| 欧美高清视频一区二区三区在线观看| 亚洲日韩视频| 在线精品视频播放| 亚洲午夜一二三区视频| www.xxx国产| 欧美精品手机在线| 麻豆一二三区精品蜜桃| 亚洲小说欧美另类激情| 九一久久久久久| 午夜国产福利一区二区| 欧美一区二区在线观看| 久久五月精品| 91亚洲精华国产精华| 亚洲国产成人精品女人| 国产精品久久久久久9999| 自拍偷在线精品自拍偷无码专区 | 欧美久久久久久一卡四| 国产精品久久国产愉拍| 成人手机在线免费视频| 欧美日韩在线视频观看| 欧美在线一卡| 国产精品高潮呻吟久久av无限| 欧美亚洲在线日韩| 亚洲另类第一页| 亚洲精品视频在线观看网站| 国产成人精品一区二三区四区五区| 久久成人免费视频| 2023国产精华国产精品| 久久国产精品网| 久久先锋影音av| 久久久999久久久| 日韩三级影视基地| 999久久久精品一区二区| 妞干网在线观看视频| 久久综合一区二区| 亚洲在线视频播放| 欧美久久久精品| 亚洲区小说区图片区qvod按摩| 国产超碰在线播放| 亚洲欧美日韩在线| 天堂中文在线看| 国产成人一区二区三区| 香蕉综合视频| 免费观看污网站| 色婷婷精品久久二区二区蜜臂av| 91av资源在线| 91精品综合久久| 久久一区二区三区超碰国产精品| 99久久99久久精品免费| 日韩欧美一级二级| 超碰超碰人人人人精品| 一区二区三区四区在线视频| 国产成人免费av在线| 一级片在线观看免费| 久久国产加勒比精品无码| 牛牛影视久久网| 国产免费中文字幕| 亚洲图片欧美色图| 日本高清视频在线播放| 国产麻豆一区二区三区在线观看| 久久久久久一区二区| 国产波霸爆乳一区二区| 一本色道久久综合狠狠躁篇的优点 | 国产精品欧美一区二区| 亚洲国产精品第一区二区| 黄色三级生活片| 亚洲第一av网|