精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

150億參數、一次通過率超60%,華為代碼能力超GPT3.5的大模型來了

人工智能 新聞
這次,華為代碼生成大模型盤古 Coder2 采用了一種類似于 RLHF(基于人類反饋的強化學習)的框架,相較前代實現了更高的一次生成通過率。

隨著大模型成為 AI 開發新范式,將大語言模型集成至編程領域、完成代碼生成與補全任務成為重要趨勢之一。業界出現了一些引人矚目的代碼大模型,比如 OpenAI 的 CodeX、谷歌 DeepMind 的 AlphaCode、HuggingFace 的 StarCoder 等等。

在國內,去年 7 月底,華為諾亞方舟實驗室語音語義實驗室聯合華為云 PaaS 技術創新實驗室推出了其代碼大模型 PanGu-Coder。與 Codex 和 AlphaCode 相比,該模型在代碼生成的一次通過率(PASS@1)指標上大幅超越同等參數規模的模型,甚至優于規模更大的模型。除了英文外,PanGu-Coder 在中文上表現出色。

圖片

PanGu-Coder 模型大小和配置。

根據對 PanGu-Coder 的相關內測表現,它不僅熟悉常見算法,而且能熟練地使用各種 API,求解高等數學問題也不在話下。

一年過去了,PanGu-Coder2 終于來了,論文已在 arXiv 上提交。此次華為云、中國科學院和北京大學的研究者聯合帶來了更強大的代碼生成大模型。

圖片

論文地址:https://arxiv.org/pdf/2307.14936.pdf

為了增強預訓練代碼大模型的生成性能,各種各樣的方法被提出并應用,比如監督微調、指令調整、增強學習(RL)等。在本文中,針對現有基于 RL 方法所存在的問題并進一步挖掘代碼大模型的潛力,研究者提出了一種全新的 RRTF 框架,它的全稱為 Rank Responses to align Test&Teacher Feedback,成功地在代碼大模型上應用自然語言 LLM 對齊技術

就其思路而言,RRTF 框架有別于以往的 CodeRL 和 RLTF,而是遵循了 RLHF(基于人類反饋的強化學習)的思路,使用排序響應(代替獎勵模型的絕對值)作為反饋,實現了更簡單和高效的訓練方法。

研究者將 RRTF 應用于開源的 StarCoder 15B 上,并推出了一個在所有已發布代碼大模型中實現最佳性能的 PanGu-Coder2。該模型在 OpenAI HumanEval 基準上實現了 62.20% 的 pass@1 指標,相較 PanGu-Coder 3 億參數版本的 17.07% 有了顯著提升

圖片

不僅如此,在 CoderEval 和 LeetCode 基準上的廣泛評估結果表明,PanGu-Coder2 超越了以往所有的代碼大模型

方法概覽

RRTF 框架

研究者們提出了一個更簡單但是功能強大的框架 RRTF,它將幾種前沿技術無縫結合,包括指令調優、Evol-Instruct 方法以及強化學習。本次方法的核心理念是:利用測試信號和人類偏好共同作為反饋,對響應進行排序,從而引導模型生成更高質量的代碼。

因此,受最近大型自然語言模型與指令微調取得的進展啟發,研究者提出了這一新的訓練范式,即 RRTF 框架。框架概覽如下圖所示。

圖 1:RRTF 框架概覽

RRTF 包括以下三個步驟:采樣、排序和訓練。

  • 采樣階段:通過 Evol-Instruct 生成的 prompt 對響應性進行采樣。
  • 排序階段:根據單元測試和啟發式偏好對不同來源的響應進行排序。
  • 訓練階段:使用 prompt 三元組和被選用 / 被拒絕響應的相應分數來訓練代碼大模型。

模型架構

基于具有 Multi-Query-AttentionShazeer 的 decoder-only Transformer,研究者訓練出一個 15B 參數的 PanGu-Coder2。同時利用 FlashAttention 來減少計算量和內存占用。因此,該模型的最大長度可以擴展到 8192。下表 1 顯示了該模型的詳細超參數。

圖片

訓練語料庫

由于手動收集高質量語料庫耗時耗力,研究者遵循 Evol-Instruct 技術來構建其訓練語料庫。具體來講,他們基于 Alpaca 20K 數據集,并迭代進化該數據集中的編程問題,從而獲得新的編程問題。prompt 如下圖 2 所示。

圖片

針對這些問題,研究者從不同模型中采樣了答案。總的來說,他們收集了一個包含 100K 個有答案編程問題的原始語料庫,并把它稱為指令和解答方案對(instruction and solution pairs)。然后利用一些手動定義的規則在原始語料庫上進行數據預處理,將其規模縮小至 68K。

更重要的,為了防止數據泄露,研究者花大力氣調查了其 68K 數據集與 HumanEval 基準之間的潛在重疊。經過細致的調查,他們確信其實驗中無數據泄露,進一步驗證了 PanGu-Coder2 的有效性。

實現細節

研究者選擇 StarCoder 15B 作為基礎模型,并以 512 的全局批大小對其進行 6 epoch 訓練。圖 3 展示了單個訓練樣本的格式。除了在 prompt 中添加一對三引號外,研究者只使用從響應中提取的代碼片段進行訓練。

圖片

實驗及評估

研究團隊進行了一系列的實驗來評估 PanGu-Coder2 的性能。

性能

該研究將 PanGu-Coder2 與現有的代碼大模型在 Python 代碼生成方面進行了性能比較。下表 2 顯示了在 HumanEval 基準上的比較結果。

在所有閉源模型中,PanGu-Coder2 排名第二。與 PaLM-Coder 和 LaMDA 等大模型相比,PanGu-Coder2 雖然規模較小,但性能卻更好。值得注意的是,PanGu-Coder2 的表現優于 OpenAI 的 GPT-3.5,但與 GPT-4 仍有差距。

圖片

表 3 展示了貪婪解碼的比較結果。在所有基準測試中,PanGuCoder2 都取得了最好的成績。值得注意的是,PanGu-Coder2 不僅在 HumanEval 上超過了 WizardCoder 和 StarCoder,而且在 CoderEval 和 LeetCode 上也超過了這兩個模型。

圖片

表 2 和表 3 的實驗結果可以得出以下結論:

  • 在開源模型中,PanGu-Coder2 在 HumanEval 上以 61.64% pass@1 達到了 SOTA。
  • 盡管 PanGu-Coder2 的規模較小,但其性能卻優于 PaLM-Coder 和 LaMDA 等更大規模的模型。
  • PanGu-Coder2 是實驗中唯一同時在 HumanEval、CoderEval 和 LeetCode 上都達到最佳性能的模型。

如下圖 4 所示,整體準確率隨著數據集大小的增加而增加:

圖片

在訓練計算量方面,無論數據集大小如何,準確率可能會在訓練開始時急劇下降或持平。大約 2 個 epoch 后,訓練曲線變得更加穩定,準確率隨著損失的減少而持續上升。3 個 epoch 后,準確率達到最佳,而 4 個 epoch 后,準確率變得更加穩定,顯示出收斂的跡象。這表明,PanGu-Coder2 模型大約需要 3-4 個 epoch 才能完全捕捉到數據集中的知識,而之后的訓練步驟對提高模型能力的幫助可能微乎其微。

用例研究

為了對模型進行實證研究并分析未來的工作方向,該研究比較和分析了三個模型的成功和失敗案例:基礎模型 StarCoder、指令調整模型 WizardCoder 和 PanGu-Coder2 模型。下圖 5 顯示了三種模型在貪婪解碼(greedy decoding)和核采樣(nucleus sampling)方面的異同:

圖片

圖 5 還表明 PanGu-Coder2 和 WizardCoder 可以互補:雖然 PanGu-Coder2 解決了大部分問題,并且其中一些問題是 WizardCoder 無法解決的,但也有一些問題只能通過 WizardCoder 解決。此外,還有一些問題即使采樣 200 次,這三個模型也都無法解決。

該研究選擇 StarCoder、WizardCoder 和 PanGu-Coder2 生成的幾個具有代表性的示例代碼作為案例進行研究,以對 PanGu-Coder2 的優缺點進行評估。

如下圖 6 所示,PanGu-Coder2 能夠熟練地理解編程問題的邏輯,而 WizardCoder 和 StarCoder 在這方面有所欠缺。這一觀察結果表明,PanGu-Coder2 通過該研究提出的排名反饋,有效地在編程問題陳述和代碼解決方案之間建立了細致的映射。

圖片

如下圖 7 所示,在某些情況下,PanGu-Coder2 和 StarCoder 的性能差于 WizardCoder,WizardCoder 可能受益于使用大量豐富注釋代碼指令進行訓練。在某種程度上,這一觀察表明,引入注釋數據可能會在訓練過程中產生積極效果。

圖片

此外,下圖 8 給出了一個復雜的編程挑戰,StarCoder、WizardCoder 和 PanGu-Coder2 都給出了錯誤的代碼解決方案。這一觀察結果表明,目前代碼大模型在處理復雜編程要求方面仍達不到人類的熟練程度,還有一些改進的空間。

圖片

推理優化

GPU 內存消耗和推理速度是模型實際部署和使用的關鍵因素,因此該研究使用 CTranslate2 和 GPTQ 兩種量化技術來進行實驗,研究模型推理的優化策略。下表 4 展示了使用不同量化技術優化的模型的 GPU 內存消耗、推理速度和 HumanEval 性能。

圖片


責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-09-01 21:12:13

GPT3.5模型微調

2023-08-27 14:08:17

開源代碼Meta大模型

2024-02-04 12:22:47

AI數據

2024-03-28 11:15:36

開源AI

2023-02-16 13:48:56

模型論文

2023-09-18 16:24:33

數據研究

2023-08-23 13:27:00

SQLCoder開源開發

2024-02-06 17:55:10

2023-01-04 12:49:28

GPT-3.5

2012-05-08 09:47:08

Google PlayAndroid應用程序

2023-09-25 07:31:19

算力AI框架

2023-06-27 09:14:52

微軟LLM AI 模型

2015-11-02 10:55:29

Android專利微軟

2023-03-10 13:56:42

ChatGPT

2023-04-23 10:28:01

2017-02-28 11:13:36

華為

2023-03-17 21:59:37

2023-06-21 13:37:41

模型研究

2024-04-14 19:53:44

2024-07-08 08:38:00

模型推理
點贊
收藏

51CTO技術棧公眾號

亚洲成a人片在线不卡一二三区 | 毛片免费看不卡网站| 成人激情免费电影网址| 国产成人高潮免费观看精品| 任我爽在线视频| 天堂va欧美ⅴa亚洲va一国产| 亚洲成人自拍网| 亚洲国产精品123| 男人天堂一区二区| 麻豆freexxxx性91精品| 91chinesevideo永久地址| 国产馆在线观看| 日韩三级av| 日韩丝袜情趣美女图片| 久久久久狠狠高潮亚洲精品| 中文av资源在线| 国产亚洲成aⅴ人片在线观看| 亚洲一区二区在线| 欧美一级黄视频| 亚洲激情偷拍| 欧美日韩第一页| 日本黄区免费视频观看| 天堂在线精品| 精品国产网站在线观看| 中文字幕有码av| 伊人网在线播放| 一个色妞综合视频在线观看| 亚洲人成网站在线播放2019| 女人偷人在线视频| 99久久婷婷国产综合精品 | 国产日产亚洲系列最新| 玖玖在线精品| 欧美在线观看网站| 日韩精品视频播放| 狠狠综合久久| 欧美大片网站在线观看| 日韩精品一区二区三区在线视频| 国产亚洲一区二区三区不卡| 日韩精品999| 亚洲激情 欧美| 6080亚洲理论片在线观看| 欧美精品1区2区3区| av网站在线不卡| 日韩av超清在线观看| 色狠狠av一区二区三区| 欧美精品一区免费| 天堂√中文最新版在线| 亚洲成人av电影在线| 丁香婷婷综合激情| 日韩精品分区| 亚洲国产精品影院| 欧美日韩福利在线| 91九色美女在线视频| 一区二区三区精品在线观看| 青青草综合视频| av电影免费在线观看| 亚洲免费视频中文字幕| 国产在线无码精品| а√天堂8资源在线官网| 亚洲美女视频一区| 国产日韩亚洲欧美在线| 女人高潮被爽到呻吟在线观看 | 欧美成人自拍视频| 欧美黄色免费观看| 亚洲国产国产亚洲一二三| 久久久久久久久久亚洲| 日韩精品一区二区av| 亚洲欧美日本国产专区一区| 欧美主播福利视频| 凹凸精品一区二区三区| 久久99精品久久久久久动态图| 成人激情电影一区二区| 国产福利资源在线| 不卡视频一二三四| 欧洲精品码一区二区三区免费看| 成人亚洲综合天堂| 亚洲另类一区二区| 国产日韩欧美精品在线观看| 中文av在线全新| 欧美日韩一区二区在线观看视频| а 天堂 在线| 欧美变态挠脚心| 中文字幕久久久av一区| 青青草原免费观看| 亚洲男人影院| 成人在线免费观看视视频| 黄色av小说在线观看| 26uuu精品一区二区| 亚洲美女搞黄| 2019中文字幕在线电影免费| 一本色道久久综合狠狠躁的推荐| 深夜黄色小视频| 66精品视频在线观看| 国产午夜精品美女视频明星a级| 亚洲区一区二区三| 一本色道久久综合一区| 成人h猎奇视频网站| 欧美一区二区三区激情| 国产精品美女久久久久久久久| 欧美狂野激情性xxxx在线观| 91福利精品在线观看| 精品国产自在久精品国产| japanese中文字幕| 亚洲视频中文| 成人激情视频在线| 神马精品久久| 亚洲永久免费视频| 亚洲 激情 在线| 天堂成人娱乐在线视频免费播放网站 | 一级做a爱视频| 中文字幕av一区二区三区人| 久久国产精品久久久久久| 黄色一级视频免费看| 国产麻豆视频精品| 婷婷精品国产一区二区三区日韩 | 青青操视频在线| 伊人色综合久久天天人手人婷| 免费男同深夜夜行网站| 国产精品chinese在线观看| 少妇高潮 亚洲精品| 亚洲欧美综合另类| 国产精品99久久久久| 日韩精品久久久毛片一区二区| xxxx另类黑人| 日韩一区二区三| 日本爱爱小视频| 日韩精品成人一区二区在线| 久久99精品久久久久久久久久| 亚洲小说区图片区都市| 欧美精品vⅰdeose4hd| 久久久久久成人网| 手机精品视频在线观看| 久久国产一区| 电影在线观看一区| 亚洲第一精品电影| 精品少妇一二三区| 国产成人av电影| 法国空姐在线观看免费| 欧美伊人亚洲伊人色综合动图| 亚洲欧洲偷拍精品| 综合激情网五月| 99久久免费国产| 男人日女人下面视频| 日韩av网站在线免费观看| 久久久久久美女| 亚洲国产精彩视频| 亚洲成年人网站在线观看| 91人人澡人人爽| 黄色在线成人| 亚洲一区二区三区香蕉| 污污影院在线观看| 精品国产免费一区二区三区四区| 久久久久久久久久综合| 国产精品99久久久久久宅男| 99re6这里有精品热视频| 国产va免费精品观看精品| 超碰精品一区二区三区乱码| 国产人妖一区二区| 亚洲高清不卡在线观看| 亚洲久久久久久| 模特精品在线| 先锋影音日韩| 亚洲欧洲一二区| 欧美激情免费观看| 全色精品综合影院| 91福利视频在线| 黄色香蕉视频在线观看| 风间由美性色一区二区三区| 欧美精品自拍视频| 国内精品久久久久久久影视简单| 国产精品久久久久秋霞鲁丝 | 亚洲色图制服诱惑| 韩国av中国字幕| 性感少妇一区| 一区二区视频在线播放| 综合激情久久| 欧美在线国产精品| 日本网站在线免费观看视频| 日韩免费观看高清完整版在线观看| 日本亚洲欧美在线| 中文字幕欧美激情| 911亚洲精选| 日韩电影在线免费看| 97超碰人人爱| 视频小说一区二区| 国产一区二区丝袜高跟鞋图片| 美女日批视频在线观看| 亚洲人成绝费网站色www| 国产又粗又猛又黄又爽| 午夜精品久久久久久久99水蜜桃| 日本人亚洲人jjzzjjz| 国产黄人亚洲片| 欧美精品第三页| 欧美三区视频| 四虎永久国产精品| 国产一区二区三区亚洲| 国产精品网址在线| 国产精品电影| 久久国产精品久久久久久久久久 | 色一情一乱一伦一区二区三区日本| 亚洲91中文字幕无线码三区| 九九99玖玖| 日韩高清一区| 国产精品久久久久久亚洲调教 | 在线免费观看黄色| 亚洲福利在线观看| 国产精品羞羞答答在线| 色综合天天性综合| 国产污片在线观看| 综合激情成人伊人| 91久久免费视频| 成人一级黄色片| 亚洲精品中文字幕乱码无线| 日韩av网站在线观看| 3d动漫一区二区三区| 中文字幕午夜精品一区二区三区| 日韩高清av电影| 视频小说一区二区| 国产日韩欧美精品| 亚洲精品影片| 亚洲一区二区三区久久| 激情久久一区二区| 国产精品成人aaaaa网站| www在线观看黄色| 欧美激情欧美狂野欧美精品| av在线免费播放| 久久精品视频免费播放| av在线播放免费| 亚洲男人的天堂在线播放| 天天操天天干天天舔| 日韩美女在线视频| 国产福利第一视频| 日韩欧美成人激情| av在线资源观看| 日韩一区二区影院| 国产美女主播在线观看| 欧美精品aⅴ在线视频| 亚洲综合网av| 欧美乱熟臀69xxxxxx| 一级黄色大片免费| 欧美视频一区二| 一级做a爱片性色毛片| 欧美日韩免费高清一区色橹橹| 亚洲高清视频免费观看| 在线观看一区二区视频| 国产精品午夜一区二区| 欧美性受xxxx黑人xyx| 艳妇乳肉豪妇荡乳av无码福利| 精品视频一区二区不卡| 伊人网站在线观看| 91精品国产综合久久久蜜臀图片| 一级片视频播放| 日韩一区二区三区在线| 性生活三级视频| 亚洲国产精品人人爽夜夜爽| 人人妻人人澡人人爽人人欧美一区 | 91精品国产乱码久久久久久| 波多野结衣三级在线| 中文字幕一区二区三区久久网站| 国产911在线观看| 亚洲精品少妇| 国产成人久久婷婷精品流白浆| 玖玖在线精品| 亚洲黄色片免费| 国产成人在线视频免费播放| 无码一区二区精品| 久久久噜噜噜久噜久久综合| 中文字幕伦理片| 亚洲精品成人悠悠色影视| 日本三级视频在线| 色综合久久综合网| 国产精品久久久久久久久久久久久久久久久久 | 欧美性xxxxxx| 在线观看xxxx| 精品播放一区二区| 久久伊伊香蕉| 久久综合久久八八| 黄频免费在线观看| 国产精品欧美一区二区| 三级欧美日韩| 欧美日韩亚洲一区二区三区四区| 日韩在线观看| 久久国产精品视频在线观看| 日韩黄色免费电影| 天堂va欧美va亚洲va老司机| 久久久久久久久免费| 午夜爱爱毛片xxxx视频免费看| 精品福利一区二区| 亚洲网站在线免费观看| 亚洲第一视频在线观看| 成年网站在线| 性色av一区二区三区| 成人国产在线| 精品无人乱码一区二区三区的优势 | 色8久久影院午夜场| 91久久精品www人人做人人爽| 亚洲婷婷丁香| 黄色一级片黄色| 久久av老司机精品网站导航| 中文字幕免费在线播放| 中文字幕在线观看不卡视频| 欧美三级午夜理伦| 日韩一区国产二区欧美三区| 九色国产在线观看| 欧美激情啊啊啊| 欧美激情啪啪| 欧美日韩中文国产一区发布| 亚洲视频综合| 中文字幕亚洲影院| 欧美激情一区二区三区| 久久狠狠高潮亚洲精品| 欧美一卡2卡3卡4卡| a√在线中文网新版址在线| 91精品国产色综合久久不卡98口| 精品一区二区三区视频在线播放 | 亚洲自拍偷拍色片视频| 欧美日韩激情在线一区二区三区| 拔插拔插海外华人免费| 国产乱人伦精品一区二区在线观看 | 国产喷水吹潮视频www| 亚洲午夜精品视频| 九色porny丨入口在线| 国产传媒一区| 欧美日韩网站| 日本成人xxx| 中文字幕在线不卡| 亚洲午夜无码久久久久| 亚洲男人天堂手机在线| 无遮挡爽大片在线观看视频| 国产亚洲一区在线播放| 欧美精品1区| 亚洲一级片免费观看| 成人免费在线观看入口| 在线观看亚洲一区二区| 这里只有精品在线播放| 色8久久影院午夜场| 日韩欧美亚洲日产国| 日韩精品电影在线| 国产在线综合视频| 欧美在线小视频| av在线中文| 国产有码在线一区二区视频| 久久精品高清| www.色就是色.com| 亚洲丝袜另类动漫二区| 国产美女三级无套内谢| 欧美成人精品在线播放| 亚洲精品午夜| aa在线观看视频| 久久久精品tv| 怡红院男人天堂| 久久精视频免费在线久久完整在线看| 亚洲一区二区三区久久久| 国产人妻互换一区二区| 国产69精品久久久久777| 欧美成人aaaaⅴ片在线看| 日韩av在线不卡| 国产在线|日韩| 欧美aaa在线观看| 国产不卡视频在线观看| 国产精品不卡av| 国产视频自拍一区| 成人福利片在线| 人妻无码一区二区三区四区| 成人午夜免费av| 久久99国产综合精品免费| 在线观看中文字幕亚洲| 24小时成人在线视频| 精品少妇人欧美激情在线观看| 久久伊99综合婷婷久久伊| 又骚又黄的视频| 欧美激情精品久久久久久| 亚洲激情播播| 在线观看国产一级片| 一区二区三区高清不卡| 日av在线播放| 成人深夜直播免费观看| 亚洲香蕉网站| 蜜桃无码一区二区三区| 欧美一级免费大片| 一二三四视频在线中文| 日本不卡一区二区三区四区| 懂色一区二区三区免费观看| 精品一区二区无码| 欧美精品在线观看| 国产99精品| 亚洲少妇一区二区| 色噜噜狠狠成人网p站| 在线观看wwwxxxx| 欧美日韩成人一区二区三区| 国产一区二区中文字幕| 国产乱国产乱老熟| 美女视频黄免费的亚洲男人天堂| 欧美理论电影在线精品| 午夜av中文字幕| 色哟哟亚洲精品| av大片在线| 一区二区三区四区欧美日韩| 99国产麻豆精品| 国产精品无码久久久久成人app|