精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布 原創

發布于 2024-12-2 09:45
瀏覽
0收藏

出品 | 51CTO技術棧(微信號:blog51cto)

最近,快手Kwaipilot 團隊正式宣布開源 OASIS(Optimized Augmentation Strategy for Improved code Search)Code Embedding模型。快手 Kwaipilot 團隊在代碼表征領域實現了突破性進展,僅僅使用 5M Tokens數據大幅領先 OpenAI,在多個 Code Search benchmark 中顯著超越現有最佳水平。

1.什么是代碼表征?

隨著代碼庫規模的持續擴大,開發者越來越依賴高效的代碼檢索系統來提升開發效率。傳統的關鍵詞匹配方法已經無法滿足現代軟件開發的需求。代碼表征(Code Embedding)技術通過將代碼片段轉化為向量表示,使機器能夠深入理解代碼語義,從而實現更智能的代碼檢索。Code Embedding模型在代碼檢索、倉庫級代碼問答,代碼補全等場景中發揮不可或缺的作用。

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區圖 1. 代碼表征搜索[1]


2.OASIS用了哪些黑科技?

OASIS 的訓練只使用了 5M Tokens的數據,遠低于 SOTA 模型的訓練樣本數,通過結合程序分析技術與創新設計的損失函數,以極低的成本就在多個測試集上超越了現有的 SOTA 模型。

具體來說,OASIS 模型采用了多項創新技術:

  • 倉庫級程序分析:傳統方法僅關注單個代碼片段,缺少代碼的上下文信息,結合南方科技大學Arise實驗室技術,OASIS 引入了倉庫級別的程序分析技術。通過分析函數調用關系和依賴結構,模型能夠更好地理解代碼在更大上下文中的語義,相比于孤立地使用函數的 docstring,程序分析技術可以引入額外的上下文信息構建高質量樣本對。
  • OASIS-instruct 數據合成算法:我們開發的專有數據增強策略能夠自動生成高質量的訓練樣本。這些樣本包含代碼和自然語言的對應關系,使模型能夠學習到更細膩的語義差異。
  • 融合式損失函數:創新性地將多目標優化策略應用于模型訓練,確保模型在保持傳統Code Embedding模型能力的情況下,既能準確區分相似樣本,又能識別細微的語義差異,在優化目標的角度添加了新的訓練維度。

3.OASIS到底有多強?

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區

在權威的代碼檢索基準測試中,OASIS 展現出了令人矚目的性能:

OASIS在訓練過程中并不包含測試集提供的訓練集的情況下,在 CSN、CoSQA、AdvTest 等主流評測集上,性能優越。平均檢索準確率優于現有所有同尺寸的Code Embedding模型,具體來說,以5M數據訓練在三個不同的代碼檢索數據集全面超越OpenAI-Ada-002,在模型尺寸僅為三分之一的情況下在平均檢索成功率超越CodeFuse-CGE-Small,多個數據集領先明顯。

CodeSearchNet (CSN)數據集

該數據集包含超過200萬個代碼-文檔對,涵蓋Python、Java、JavaScript等六種主流編程語言。數據主要來源于函數級別的代碼及其對應的文檔字符串(docstring),使用自然語言的docstring作為查詢(query)。

CoSQA 數據集

CoSQA數據集是一個包含20,000+對自然語言查詢和代碼的標注數據集,每個數據對都至少由3名人類標注者進行標注。CoSQA數據集中的查詢來源于真實的網絡搜索,反映了開發者在日常工作中遇到的具體需求,而代碼片段則從不同的數據集中精心篩選,以確保多樣性和質量。

AdvTest 數據集

AdvTest數據集專門用于測試代碼搜索任務的難度。它通過規范化函數名和變量名來增加挑戰性,并從原始數據中過濾出高質量的樣本。該數據集包含近2萬的測試樣本,旨在評估模型在代碼理解和搜索方面的性能。

OASIS模型僅使用了5M的訓練數據,以1.3B的參數量在CSN,CoSQA,AdvTest數據集了超過SOTA模型,性能表現遠超OpenAI-Embedding-Ada-002。

4.OASIS有哪些應用場景呢?

OASIS 的應用場景廣泛:

在智能代碼檢索方面,OASIS能準確理解開發者的查詢意圖,從海量代碼庫中精準定位最佳實踐代碼片段。當開發者輸入具體需求描述時,模型能從海量代碼庫中精準定位最佳實踐代碼片段,并優先推薦與當前項目技術棧相匹配的示例。

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區圖 2. IDE代碼檢索

在代碼推薦領域,OASIS突破了傳統代碼補全工具的局限。基于對代碼語義的深度理解,模型能預測開發者的編碼意圖,主動推薦API調用序列和完整的功能實現方案,提升Kwaipilot代碼補全在私域代碼方言中的補全質量。

在智能CR場景,OASIS能夠精確識別功能相似但實現細節不同的代碼片段。這一能力在Code Review 功能中作用顯著,可以幫助模型識別代碼中的可能錯誤。

僅用5M數據超過 OpenAI?快手最新 Code Embedding 模型 OASIS(綠洲)發布-AI.x社區圖 3. Kwaipilot代碼審查

在代碼語義理解方面,模型應用于Kwaipilot RepoChat功能,模型能夠自動提取遺留系統或第三方庫中的關鍵程序邏輯,生成準確的功能描述和調用關系圖譜,幫助開發者快速熟悉上手倉庫,顯著降低團隊的代碼理解成本。

5.開源與未來展望

為推動代碼智能領域的發展,我們決定將 OASIS 完整開源。開發者可以直接通過 Hugging Face 使用模型,也可以基于我們的代碼進行進一步的改進和定制。

Huggingface 地址:https://huggingface.co/Kwaipilot/OASIS-code-1.3B

未來,Kwaipilot 團隊將持續投入代碼智能領域的研究,計劃:

  • 發布性能更強的Code Embedding模型
  • 開源詳細的技術報告和研究成果
  • 拓展模型在更多場景下的應用

OASIS 不僅是一個代碼表征模型,更是 Kwaipilot 團隊對代碼智能未來的探索。我們期待與開發者社區一起,繼續推動這項技術的發展,為軟件開發效率的提升貢獻力量。

讓我們一起,在代碼智能的綠洲中開啟新的篇章。

Reference

[1] Gu X, Zhang H, Kim S. Deep code search[C]//Proceedings of the 40th International Conference on Software Engineering. 2018: 933-944.

本文轉載自??51CTO技術棧??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-12-2 09:46:33修改
收藏
回復
舉報
回復
相關推薦
成人在线视频中文字幕| 91精品国产91久久久久游泳池| 亚洲视频碰碰| 亚洲欧洲成视频免费观看| 久久撸在线视频| 在线观看三级视频| 久久综合色8888| 96pao国产成视频永久免费| 日韩成人在线免费视频| 日韩精品久久久久久久电影99爱| 日韩精品专区在线影院观看| 777久久久精品一区二区三区| 91精品国产综合久久久久久豆腐| 波多野结衣视频一区| 国产欧美一区二区三区在线| 精品视频一区二区在线观看| 成人a'v在线播放| 亚洲精品在线免费观看视频| 三级a三级三级三级a十八发禁止| 激情网站在线| 国产精品三级在线观看| 激情欧美一区二区三区中文字幕| 在线观看免费观看在线| 国产日韩欧美三级| 欧美成人精品激情在线观看| 熟女俱乐部一区二区| 日韩黄色av| 欧美日韩国产高清一区| 99精品在线免费视频| av在线free| 中文字幕免费不卡在线| 免费亚洲一区二区| 国产刺激高潮av| 狠狠色狠狠色合久久伊人| 日韩av电影在线免费播放| 欧美成人精品欧美一| 93在线视频精品免费观看| 亚洲九九九在线观看| 成人做爰69片免费| 日韩一级淫片| 欧美一区日韩一区| 91 视频免费观看| 欧美一区二区三区婷婷| 在线视频国产一区| 国产女女做受ⅹxx高潮| 黄色在线免费观看网站| 亚洲午夜日本在线观看| 激情成人开心网| 女囚岛在线观看| 伊人一区二区三区| 国产午夜精品视频一区二区三区| 黄a在线观看| 亚洲欧洲性图库| 一区二区三区四区五区视频| 成人不用播放器| 国产欧美一区二区精品性| 欧美日本韩国一区二区三区| 色吊丝在线永久观看最新版本| 97久久超碰国产精品| 精品久久中出| 国产人成在线视频| 国产精品丝袜91| 国产精品jizz在线观看老狼| 国产91在线视频蝌蚪| 亚洲欧美一区二区三区孕妇| 黄色网址在线免费看| 日本h片在线观看| 五月天网站亚洲| 国产精品欧美激情在线观看| 超碰这里只有精品| 欧美情侣在线播放| 少妇愉情理伦片bd| 成人av地址| 亚洲欧洲在线免费| 美女av免费看| 欧美激情麻豆| 97精品伊人久久久大香线蕉 | 亚洲免费视频网| 成人av网在线| 日韩av图片| 中文字幕在线三区| 高跟丝袜欧美一区| 亚洲综合日韩欧美| av不卡一区二区| 亚洲欧美激情另类校园| 北条麻妃在线观看视频| 好看的日韩av电影| 国产成人精品免费久久久久| 国产一区二区麻豆| 99国产精品视频免费观看| 色播五月综合| 亚洲无线看天堂av| 日本高清不卡aⅴ免费网站| 性生活一级大片| 经典一区二区| 欧美国产亚洲视频| 波多野结衣激情视频| 国产成a人无v码亚洲福利| 日本不卡一二三区| 欧美黑人猛交| 欧美三级电影在线看| 亚洲第一黄色网址| 91精品啪在线观看国产81旧版| 97热精品视频官网| 一区二区三区免费观看视频| 99免费精品在线观看| 中文字幕一区二区三区四区五区| 高端美女服务在线视频播放| 91精品在线免费| 日本激情小视频| 欧美精品自拍| 国产精品永久免费在线| 亚洲AV成人无码一二三区在线| 中文字幕一区二区三区乱码在线 | 国产美女视频91| 久久久免费看| 欧美人与禽性xxxxx杂性| 在线观看欧美日本| 亚洲乱码国产乱码精品精大量| 欧美精选一区| 91丝袜美腿美女视频网站| 久久电影视频| 激情成人中文字幕| 伊人影院在线观看视频| 久久久久久久久久久久久久| 国产99视频精品免视看7| 西西人体44www大胆无码| 亚洲狠狠丁香婷婷综合久久久| 男女男精品视频站| 综合亚洲色图| 91成人福利在线| 欧美一级淫片免费视频魅影视频| 亚洲精品成人在线| www.偷拍.com| 综合激情网站| 亚洲xxxx做受欧美| 久操视频在线观看| 欧美日韩激情一区| 日本美女xxx| 日韩一区精品视频| 日本电影一区二区三区| 在线亚洲人成| 日韩电影中文字幕一区| 亚洲激情视频一区| 不卡av免费在线观看| 国产成人在线小视频| 亚洲欧美日本国产| 欧美精品18videos性欧| 黄色一级a毛片| 亚洲国产欧美日韩另类综合 | 国产欧美日韩亚州综合 | 日韩毛片在线视频| caoporn国产精品| 熟女少妇在线视频播放| 亚洲理论电影| 国产精品一区二区三| 免费观看成人高潮| 在线电影院国产精品| 国产激情无码一区二区三区| 精品亚洲国产成人av制服丝袜 | 亚洲深夜av| 免费精品视频一区二区三区| 日韩不卡在线| 欧美成人黄色小视频| 国产成人三级在线观看视频| 天天操天天色综合| 亚洲区自拍偷拍| 久久精品av麻豆的观看方式| 7777在线视频| 美国一区二区| 国产精品91一区| 国产黄网站在线观看| 精品国产乱码久久久久久图片 | 一区二区三区四区五区| 国产一区二区三区在线观看免费| 激情六月天婷婷| 日韩理论电影中文字幕| 国产精品久久久久久久久久久新郎 | 久久美女高清视频| 91亚洲免费视频| 欧美日韩国产欧| 欧美亚洲精品日韩| 99久久这里有精品| 88国产精品欧美一区二区三区| 国产免费av高清在线| 欧美一级专区免费大片| 西西44rtwww国产精品| 国产精品久久久久久久久快鸭| 三上悠亚 电影| 久久午夜精品| 337p亚洲精品色噜噜狠狠p| 亚洲人亚洲人色久| 91久久精品国产91久久| 亚洲永久av| 美乳少妇欧美精品| 国产成人天天5g影院在线观看| 日韩女优毛片在线| 免费视频网站在线观看入口| 一区二区三区小说| 欧美大波大乳巨大乳| 国产凹凸在线观看一区二区 | 国产精品亚洲专一区二区三区 | 欧美日韩福利在线| 日韩欧美一区免费| 欧美精品123| 欧美在线在线| 国产精品高潮呻吟久久av黑人| 亚洲夜夜综合| 精品激情国产视频| 国产在线超碰| 亚洲精品久久久久久下一站| 99精品在线看| 欧美肥胖老妇做爰| 精品成人无码久久久久久| 午夜精品影院在线观看| 日本黄色小说视频| 国产精品视频你懂的| 亚洲精品视频久久久| 成人av在线播放网址| 毛片毛片毛片毛片毛| 久久精品国产精品亚洲精品 | 极品少妇一区二区| 亚洲人成无码www久久久| 亚洲性感美女99在线| 欧美 国产 精品| 99视频精品视频高清免费| 日本午夜精品电影| 亚洲人成精品久久久| 久久精品国产第一区二区三区最新章节| 欧美经典一区| 91久久综合亚洲鲁鲁五月天| 97成人超碰| 国产精品自拍小视频| 成人日韩精品| 国产精品久久久亚洲| 超薄肉色丝袜脚交一区二区| 日韩av成人在线观看| 桃花岛成人影院| 国产成人一区二区三区| 欧美xx视频| 国产成人精品999| 日韩精品免费观看视频| 国产精品美女视频网站| 台湾成人免费视频| 国产女人18毛片水18精品| 欧美美女福利视频| 91影视免费在线观看| 国产一区一区| 俄罗斯精品一区二区| a级日韩大片| 精品久久久久久一区二区里番| 日韩精品免费一区二区夜夜嗨| 免费日韩电影在线观看| 欧美禁忌电影| 亚洲国产欧美不卡在线观看 | 欧美成人免费全部| 成人性生交大片免费看在线播放| 国内精品伊人久久| 天堂电影一区| 国产精品成人久久久久| 亚洲国产伊人| 91av免费看| 欧美午夜18电影| 日本一区二区在线视频| 四季av一区二区三区免费观看| 最新欧美日韩亚洲| 黑人一区二区三区四区五区| 妞干网在线视频观看| 久久久久久夜| 亚洲欧美日本一区二区| 成人免费观看视频| 欧美熟妇一区二区| 亚洲欧洲成人av每日更新| 久久久精品国产sm调教网站| 欧美日韩性生活视频| 中文字幕黄色av| 日韩欧美一区二区免费| 视频午夜在线| 日韩视频在线观看免费| 成人黄色动漫| 国产精品网站入口| 国产精品一区二区中文字幕| 欧美日韩精品免费观看视一区二区| 日韩欧美午夜| 欧美日韩性生活片| 久久99精品国产麻豆婷婷洗澡| 亚洲一区和二区| 国产欧美精品一区aⅴ影院| 中文字幕影音先锋| 色综合久久天天| 99久久久久久久| 亚洲日韩中文字幕在线播放| 麻豆影院在线观看| 欧美在线影院在线视频| 精品午夜视频| 热re99久久精品国99热蜜月| 狠久久av成人天堂| 日韩一级理论片| 成人av在线一区二区三区| 999精品在线视频| 日韩欧美在线一区| 丰满岳乱妇国产精品一区| 在线观看国产成人av片| 超碰中文在线| 91在线直播亚洲| 欧美日韩水蜜桃| 日韩精品视频久久| 国产成人免费视频| 91免费公开视频| 在线观看视频欧美| 亚州视频一区二区三区| 欧美精品一区二区三区国产精品| 日韩不卡视频在线观看| 免费一区二区三区在在线视频| 欧美一区91| 在线黄色免费看| 日本一区二区三区dvd视频在线| 亚洲男人第一av| 欧美mv和日韩mv国产网站| 成人av福利| 成人国内精品久久久久一区| 久久婷婷蜜乳一本欲蜜臀| 欧美精品aaaa| 久久综合九色综合97_久久久| 日本在线视频免费| 精品国产1区二区| 亚洲91av| 91嫩草在线| 欧美精品色网| 91福利视频免费观看| 亚洲欧美偷拍卡通变态| 国产精品爽爽久久久久久| 色妞久久福利网| 99久久亚洲国产日韩美女| 日本视频精品一区| 日韩国产精品久久久久久亚洲| 日韩人妻一区二区三区 | 国产精品久久久久久免费| 伊人久久综合97精品| 粉嫩一区二区三区| 日韩av电影免费在线观看| 日本特黄久久久高潮| 人妻aⅴ无码一区二区三区| 91激情五月电影| 大胆av不用播放器在线播放 | 国产精品久久综合| 亚洲图片欧美在线| 在线亚洲欧美视频| 久久婷婷五月综合色丁香| 宅男噜噜99国产精品观看免费| 久久国产成人午夜av影院| 亚洲av无一区二区三区| 3751色影院一区二区三区| 成人午夜在线影视| 不卡的av一区| 日韩天堂av| 中文字幕一区二区三区人妻电影| 在线亚洲精品福利网址导航| 国产三级视频在线看| 成人欧美一区二区三区黑人孕妇| 女人香蕉久久**毛片精品| 国产又粗又猛又色| 91豆麻精品91久久久久久| 1769在线观看| 亚洲一区亚洲二区亚洲三区| 怡红院精品视频在线观看极品| 国产精品无码在线| 欧美在线一二三| 青草影视电视剧免费播放在线观看| 国产欧美综合精品一区二区| 欧美亚洲在线| 疯狂撞击丝袜人妻| 亚洲成人黄色在线| 97成人超碰| 国产男女免费视频| 国产色婷婷亚洲99精品小说| 91丨九色丨丰满| 91精品国产91久久久久久久久| 成人精品久久| 在线播放第一页| 欧美性做爰猛烈叫床潮| 日韩精品卡一| 日本精品视频一区| 国产老肥熟一区二区三区| 日本午夜视频在线观看| 中文字幕在线精品| 久久婷婷国产| 在线观看国产一级片| 亚洲午夜私人影院| 在线观看av黄网站永久| 国产精品成人观看视频免费| 日韩在线播放一区二区| 久久综合激情网| 中文字幕久久精品| 欧美成人午夜77777| 午夜啪啪小视频| 色诱亚洲精品久久久久久| 羞羞电影在线观看www| 日韩精品极品视频在线观看免费| 高清在线不卡av|