精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT技術國產化嘗試

人工智能
ChatGPT 是一個通用功能型助手。2022 年 12 月 5 日,OpenAI 首席執行官 Sam Altman 在社交媒體上發文稱,ChatGPT 推出五天,已突破 100 萬用戶。AI 聊天機器人 ChatGPT 爆火出圈,已成為一個標志性事件。微軟正洽談 100 億美元增持股份,并很快將其整合到微軟云中。

本次分享題目為 ChatGPT 技術、國產化嘗試和開源模型。分享包含三大部分的內容,第一部分總體介紹 ChatGPT 相關的技術:ChatGPT 技術的演進、目前存在什么樣的問題、ChatGPT 技術學習的三個階段、數據組織和效果評估;第二部分分享我們在 ChatGPT 技術國產化方面進行的嘗試,包含實驗過程中我們遇到的問題、進行的思考以及模型的效果和應用;第三部分介紹我們已經發布的中文開源大模型,使用自有數據訓練出本地模型如何進行操作,在實驗過程中可能遇到的問題,和開源的先進模型相比存在的差距以及如何進一步提升模型的效果。

一、ChatGPT 相關技術

ChatGPT 是一個通用功能型助手。2022 年 12 月 5 日,OpenAI 首席執行官 Sam Altman 在社交媒體上發文稱,ChatGPT 推出五天,已突破 100 萬用戶。AI 聊天機器人 ChatGPT 爆火出圈,已成為一個標志性事件。微軟正洽談 100 億美元增持股份,并很快將其整合到微軟云中。

圖片

上圖中展示了兩個例子,展現出了驚人的效果。

ChatGPT 之所以這么受歡迎,一方面是由于其理解用戶意圖的能力和生成的效果比較好;另一方面,通過對話機器人的形式,使得人人都能使用。

下面將從模型演進、最初模型存在的問題、ChatGPT 模型學習的三個階段、訓練 ChatGPT 模型的數據組織和效果幾個方面進行介紹。

1、模型演進

ChatGPT 技術也經過了幾代模型的演進,最初的 GPT 模型是在 2018 年提出的,模型參數只有 1.17 億;2019 年的時候 GPT-2 模型參數是 15 億;到了 2020 年 GPT-3 模型參數達到了 1750 億;通過幾代的模型更新迭代,到 2022 年出現了 ChatGPT 模型。

圖片

2、之前的模型存在什么樣的問題

在 ChatGPT 模型出來之前的模型存在什么樣的問題呢?通過分析發現存在的一個比較顯著的問題是對齊問題,雖然大模型的生成能力比較強,但是生成的答案有時候不符合用戶意圖。通過研究發現造成對齊問題出現的主要原因是語言模型訓練的訓練目標是預測下一個詞,而不是按照用戶意圖來生成。為了解決對齊問題,在訓練 ChatGPT 模型過程中加入了基于人類反饋的強化學習(Reinforcement Learning from Human Feedback,RLHF)過程。

3、學習三階段

ChatGPT 模型的訓練過程是按照三步驟走的形式進行的。

第一步是在 GPT 模型基礎上使用真實用戶的輸入進行監督學習,在這個過程中數據來自真實用戶,數據質量比較高也比較寶貴。

第二步是訓練一個獎勵模型,對于一個 query 通過不同模型會產生不同的輸出結果,標記者對所有模型的輸出結果進行一個排序,用這些排序后的數據訓練獎勵模型。

第三步是把模型生成的初步答案輸入到獎勵模型當中,獎勵模型會對這個答案進行一個評價,如果生成的答案符合用戶的意圖就給一個正向的反饋,否則就給一個負向的反饋,從而把模型調教的越來越好,這就是引入強化學習的目的,使得生成的結果更符合人類的需要。訓練 ChatGPT 模型過程中三步走的過程如下圖所示。

圖片

4、數據組織和效果評估

在訓練模型之前我們需要準備好所用的數據集,在這個過程中就會遇到數據冷啟動的問題可以通過以下三個方面來解決

(1)搜集舊系統用戶使用的數據集

(2)讓標注人員根據之前真實用戶輸入的問題標注一些相似的 prompt 和輸出

(3)數據標注人員從問答、寫故事、生成等自己想的一些 prompt。

訓練 ChatGPT 模型的數據包含三部分數據集(77k 真實數據):

(1)基于真實用戶 prompt 的監督學習數據,用戶 prompt,模型 response,數據量有 13k。

(2)用于訓練獎勵模型的數據集,這部分數據對于一個 prompt 對應多個response 的排序,數據量有 33k。

(3)基于獎勵模型使用強化學習技術進行模型訓練的數據集,只需要用戶prompt,數據量有 31k,對質量要求較高。

完成 ChatGPT 模型訓練后,對于模型的評價也是比較充分的,主要從以下幾個方面來評價:

(1)模型生成的結果是否符合用戶的意圖

(2)生成的結果能不能滿足用戶提到的約束

(3)模型在客服領域能否有好的效果

通過和 GPT 基礎模型進行對比的詳細實驗結果如下圖所示。

二、ChatGPT 技術國產化

下面將從背景與問題、解決思路、效果與實踐三個方面介紹我們進行 ChatGPT 技術國產化的內容。

1、背景與問題

為什么要進行國產化,主要考慮了以下幾個方面:

(1)ChatGPT 技術本身是比較先進的,在許多任務上效果比較好,但是不對中國大陸提供服務。

(2)可能不能滿足國內企業級客戶的需求,無法提供本地化技術支持和服務。

(3)價格是以歐美為主要市場的美元進行計價的,價格比較昂貴,國內多數用戶可能承受不起。通過測試發現對于每條數據約需要花費 0.5 元人民幣,對于擁有大量數據的客戶無法進行商業化。

由于以上三個問題,我們嘗試了 ChatGPT 技術國產化。

2、解決思路

我們在進行 ChatGPT 技術國產化過程中,采用了分布走的策略。

首先訓練了一個具有百億參數的中文預訓練模型;其次在億級別任務數據上使用 Prompt 的形式進行任務監督學習;然后把模型對話化,即以對話或人機交互的形式和人進行交互;最后我們再引入獎勵模型和用戶反饋的強化學習 RLHF 技術。

Prompt 多任務學習模型(PromptCLUE)是一個支持全中文任務零樣本學習的模型。該模型實現了三大統一:統一模型、統一數據形式(所有任務都轉化為 prompt 形式)、統一使用方式(零樣本的形式進行使用)。該模型是基于 1000 億中文字詞級別 token 進行無監督學習,在億級下游任務數據上進行訓練,累積學習了 1.5 萬億中文字詞級別 token。支持 20 多種任務上的零樣本使用(文本理解類、抽取類、生成類任務)。

圖片

如何把模型進行對話化,即轉化為人機交互形式的模型,我們主要做了如下幾方面的工作:

首先為了使模型具有比較好的生成效果,我們移除了文本理解類和抽取類的任務,這樣就加強了問答、對話和生成類任務的學習;其次,轉變成對話模型后,生成結果會受到上下文的干擾,針對這個問題,我們加入了抗干擾數據,使得模型可以在必要時忽略無關的上下文;最后,我們基于真實用戶的反饋數據加入了學習過程,使得模型能夠更好地理解用戶的意圖。下圖是和模型進行單輪和多輪測試的形式。

圖片

3、效果與實踐

下面是針對模型進行測試的效果,通過比較當前與 ChatGPT 模型相比還有1~2 年的差距,不過這種差距是可以逐步彌補的,目前我們進行了一些有益的嘗試,也有了一定的效果,目前可以進行一些對話、問答、寫作等交互。下圖展示了測試結果。

三、國產開源大模型

1、中文開源模型

我們最近剛發布的元語功能型對話大模型(ChatYuan)參數量有 7.7 億,線上的版本是具有 100 億參數量的模型,已經上線了多個平臺,包括 Huggingface、ModelScope、Github、paddlepaddle 都可以使用。模型可以下載到本地,根據自己的用戶數據集進行微調。它是基于 PromptCLUE-large 結合數億條功能對話多輪對話數據進一步訓練得到。

圖片

圖片

上面以 Huggingface 平臺為例,展示了模型本地使用方法。在平臺搜索ChatYuan,加載模型,進行簡單的包裝。使用中有一些比較重要的參數,比如是否采樣 sample,如果需要生成的比較多樣就需要采樣。

2、基于自有數據訓練本地模型

首先需要將數據組織成統一的形式,由兩部分構成:輸入(Input)和輸出(Output)。對于單輪問答或生成輸入(Input):任務描述+輸入文本(如:“用戶:你好\n小元:”),輸出(Output)是指系統需要預測的文本(如:“您好!我是元語AI...”)。對于多輪對話輸入(Input):任務描述+上文+輸入文本,輸出是指系統需要預測的文本,如下圖中"小元"后的內容。

圖片

下圖展示了基于自有數據進行訓練本地模型的一個示例。這一示例涵蓋了整個過程,從數據的準備,到開源數據的下載、轉化,還包括模型的訓練、預測和評估。其基礎使用的是 pCLUE 多任務數據集。用戶可以使用自己的數據進行訓練,也可以使用 pCLUE 進行初步的訓練,來測試效果。

圖片

3、可能的問題、差距和如何進一步提升效果

ChatYuan 和 ChatGPT 都是通用型功能型對話大模型,都能夠在閑聊或法律、醫療等專業領域進行問答、交互和生成。通過和 ChatGPT 模型相比較,目前還有一定的差距,主要體現在是以下幾個方面:

  • 模型大小方面,ChatGPT 參數量是千億級別的,ChatYuan 是百億級別的;
  • 學習到的數據量方面也存在很大差距,ChatYuan 模型還在學習過程中;
  • 在強化學習方面,ChatGPT 模型已經引入了基于用戶反饋的強化學習,我們的模型還在引入過程中。

在使用模型過程中可能遇到生成效果和文本長度方面的問題,取決于數據格式是否正確,在生成過程中是否采樣 sample,輸出結果的長度控制 max_length 等。

要進一步提升模型效果,可以從如下幾個方面入手:

(1)結合行業數據進行進一步訓練,包括無監督預訓,以及使用大量高質量的數據進行有監督學習。

(2)使用真實用戶反饋數據的學習可以彌補分布差異。

(3)引入強化學習,對齊用戶意圖。

(4)選用更大的模型,一般來說模型越大,模型能力越強。

ChatGPT 帶來的新技術和使用場景,讓人們看到了 AI 的巨大潛力。更多應用都將得到升級,也為一些新應用創造了可能。

元語智能,作為大模型 Model-as-a-Service 服務商,在這一領域也在不斷探索中。歡迎感興趣的伙伴關注我們的網站和公眾號。

今天的分享就到這里,謝謝大家。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2014-05-07 16:18:21

高端存儲

2023-10-09 07:31:11

2016-08-22 09:34:52

PowerRedPOWERIBM

2015-12-07 09:56:08

初志科技云存儲

2015-08-27 16:35:56

開源開源國產化OpenStack

2015-11-20 14:57:58

初志科技云存儲

2014-04-23 15:52:50

浪潮王恩東主機

2022-10-09 16:03:04

大數據平臺

2015-07-09 14:48:08

2015-07-03 10:04:07

東方通國產化替代

2015-01-26 17:12:55

浪潮K1廊坊工信局

2022-10-17 09:03:52

2015-12-24 10:06:16

曙光國產化

2015-12-18 14:32:12

寶德國產化

2015-08-27 09:41:58

天璣科技

2023-06-13 23:17:53

騰訊云數據庫金融行業

2021-02-01 10:20:29

Windows虛擬技術ISO文件
點贊
收藏

51CTO技術棧公眾號

性娇小13――14欧美| www.四虎成人| 香蕉在线观看视频| 午夜福利理论片在线观看| 国产最新精品| 香蕉影视欧美成人| 久久艳片www.17c.com| av免费看网址| 国产农村老头老太视频| 欧美美女在线| 五月婷婷综合在线| 欧美日韩在线观看一区| 久久久综合久久| 日韩福利在线观看| 26uuu另类欧美亚洲曰本| 久久久91精品国产| 在线观看免费成人av| 在线免费一级片| 九九亚洲视频| 91精品国产综合久久香蕉的特点 | 综合在线影院| 丁香啪啪综合成人亚洲小说| 久久精品视频网站| 成人无码www在线看免费| 视频在线观看入口黄最新永久免费国产| 国产一区日韩| 欧美tickling挠脚心丨vk| 一区精品视频| 一区二区三区麻豆| 日韩av大片| 欧美性猛交一区二区三区精品| 玖玖玖精品中文字幕| 国产精品美女久久久久av爽| 欧美激情影院| 色综合久久久久综合| 国产午夜精品一区| 久久综合色综合| 日韩国产一区| 亚洲欧美色图片| 色一情一乱一伦一区二区三区日本 | 91社区在线| 七七婷婷婷婷精品国产| 国产亚洲精品美女久久久| 欧美女人性生活视频| 奇米影视888狠狠狠777不卡| 亚洲资源av| 久久久久久久影院| 91av在线免费| y111111国产精品久久久| 亚洲成人免费视频| 久久人人九九| 一级片免费在线播放| 精品视频网站| 日韩欧美电影一二三| 2018国产在线| 日本动漫同人动漫在线观看| 北条麻妃一区二区三区| 97精品一区二区视频在线观看| 99久久免费看精品国产一区| 欧美黑人疯狂性受xxxxx野外| 亚洲电影一级黄| 久久艹国产精品| 六十路在线观看| 国产综合色精品一区二区三区| 欧美另类99xxxxx| 中文字幕一区二区人妻电影丶| 日本免费精品| 一本大道久久a久久综合| 成人av一级片| 毛片无码国产| 亚洲狼人国产精品| 久久青青草原一区二区| 日本在线视频1区| 久久久午夜精品理论片中文字幕| 91精品在线影院| 可以在线观看av的网站| 亚洲一区视频| 国产精品美女久久久久久免费| 激情综合五月网| 四虎影视精品| 欧美一级艳片视频免费观看| 久久黄色免费看| 欧美日韩在线精品一区二区三区激情综合| 一区二区三区.www| 亚洲国产成人不卡| 亚洲av成人无码久久精品老人| 97se狠狠狠综合亚洲狠狠| 成人性生交大片免费看视频直播| 欧美在线观看不卡| 欧美日韩精品| 亚洲最新av网址| 一本加勒比波多野结衣| 免费精品一区二区三区在线观看| 欧洲精品在线观看| 欧美激情 国产精品| 成人免费在线| 国产精品少妇自拍| 欧美大陆一区二区| 91短视频版在线观看www免费| 亚洲免费伊人电影| 欧美v在线观看| 中文字幕成人| 欧美三级视频在线| 亚洲爆乳无码专区| 精精国产xxxx视频在线播放| 一区二区三区精品久久久| 欧美大片在线播放| 999精品视频在线观看| 亚洲第一国产精品| 95视频在线观看| 久久爱www.| 国产丝袜视频一区| 亚洲 欧美 日韩在线| 国产一区二区三区不卡视频网站| 久久av红桃一区二区小说| 精品免费囯产一区二区三区 | 热99精品里视频精品| 国产一二三四在线| 男女男精品网站| 国产精品久久一区| 男人天堂一区二区| 成人高清免费观看| 在线视频亚洲自拍| 免费电影日韩网站| 亚洲国产精品va在线看黑人| 天堂网中文在线观看| jvid福利在线一区二区| 欧美激情亚洲另类| 国产视频手机在线| 中日韩免费视频中文字幕| 日韩久久不卡| 自拍视频在线| 一本大道av伊人久久综合| 妖精视频在线观看| 91精品国产乱码久久久竹菊| 欧美sm美女调教| 亚洲欧美精品久久| 综合天堂久久久久久久| 欧美成人精品一区| 日本熟妇毛茸茸丰满| 9色国产精品| 欧美洲成人男女午夜视频| 亚洲成人一级片| 99re66热这里只有精品3直播 | 国产高清一区二区三区视频 | 97在线免费观看| 丰满人妻一区二区| 91免费在线播放| 黄色成人在线看| 精品自拍偷拍| 伊人久久久久久久久久| 一级黄色在线视频| 国产婷婷精品av在线| 伊人色综合影院| 成人免费黄色| 欧美成人高清电影在线| 五月天婷婷色综合| 国产精品日本| 国产精品嫩草视频| аⅴ资源新版在线天堂| 亚洲激情在线播放| 日韩中文字幕组| 国产区精品区| 国产精品久久久久久久7电影| 99热这里只有精品在线| 久久久亚洲精品一区二区三区 | sm在线播放| 亚洲国产精品小视频| 国产精品酒店视频| 亚洲午夜黄色| 国产欧美一区二区三区四区| 国产哺乳奶水91在线播放| 一区二区在线观看免费视频播放 | 久久久久久97三级| 美女网站免费观看视频| 97精品视频在线看| 91av视频导航| 国产wwwwwww| 亚洲国产视频在线| 亚洲77777| 久久久久久影院| 国产成人一区三区| 日本高清视频在线| 日韩欧美在线视频观看| 国产精品果冻传媒| 国产情侣一区| 亚洲日本精品| 偷拍精品精品一区二区三区| 中文字幕亚洲精品| 五月天综合激情网| 国产精品日韩成人| 成人啪啪18免费游戏链接| 一本久久知道综合久久| 午夜精品一区二区三区在线观看 | 91久久夜色精品国产按摩| 亚洲伊人久久综合| 97电影在线看视频| 日韩欧美国产不卡| 69av视频在线观看| 2欧美一区二区三区在线观看视频| 日韩精品你懂的| 亚洲天堂久久| 亚洲一卡二卡三卡| 久久男人av| 成人午夜两性视频| 超碰aⅴ人人做人人爽欧美| 日韩一区二区精品视频| 国产精品无码粉嫩小泬| 亚洲激情校园春色| 色www亚洲国产阿娇yao| 99精品在线免费| 亚洲天堂av一区二区三区| 日韩三级在线| 国产综合欧美在线看| 国产精品毛片aⅴ一区二区三区| 日韩中文字幕免费看| 日韩一级免费毛片| 欧美日本在线播放| 韩国一级黄色录像| 91网站在线观看视频| 欧美激情第四页| 欧美激情精品久久久六区热门| 亚洲一区二区久久久久久| 在线观看爽视频| 亚洲欧美在线一区| 欧美国产一级片| 亚洲大片在线观看| 国产女人被狂躁到高潮小说| 国产成人av电影| 精品成在人线av无码免费看| 国产精品久久久久久久| 91久久国产自产拍夜夜嗨| 欧美人与禽猛交乱配| 正在播放欧美一区| 国内av一区二区三区| 欧美无人高清视频在线观看| 日韩av在线播放观看| 亚洲一线二线三线视频| 2018天天弄| 中文字幕一区二区三| 亚洲精品在线网址| 蜜臀va亚洲va欧美va天堂| 免费日韩中文字幕| 亚洲一区欧美激情| 欧洲黄色一级视频| 国产日韩欧美一区| 亚洲 欧美 日韩 国产综合 在线 | 国产精品网站在线播放| 成年人免费观看视频网站| 日本三级亚洲精品| 国产精品免费成人| 久久男女视频| 伊人情人网综合| 天天天综合网| 免费观看黄色大片| 久久夜色电影| 精品国产区在线| 日韩毛片免费看| 国产区亚洲区欧美区| 欧美天堂一区二区| 欧美夫妻性生活视频| 男人av在线| 亚洲色图15p| 国产对白叫床清晰在线播放| 日韩一级完整毛片| 成人免费视频国产免费| 在线免费观看日本欧美| 中文字幕无线码一区| 亚洲一区在线视频观看| 国产在线免费视频| 国产精品久久久久一区| 二区三区四区视频| 一区二区三区不卡视频| 成年人免费看毛片| 亚洲色图制服丝袜| 在线免费观看成年人视频| 国产一区二区伦理| 亚洲AV成人精品| 99re这里只有精品首页| 先锋影音av在线| 91亚洲精品久久久蜜桃网站 | 国产成人a人亚洲精品无码| 欧美成人官网二区| 毛片在线播放网址| www.亚洲一区| 春色校园综合激情亚洲| 国产精品扒开腿做爽爽爽的视频| 四虎国产精品免费久久5151| 国产成人精品福利一区二区三区| h1515四虎成人| 97免费资源站| 亚洲区小说区图片区qvod| 99在线热播| 国产午夜亚洲精品一级在线| 国产另类自拍| 欧美高清一级片| 蜜桃av色综合| 天天天综合网| 成人免费观看视频在线观看| 国产综合色视频| 国产精品815.cc红桃| 亚洲欧美国产77777| 国产午夜性春猛交ⅹxxx| 制服丝袜av成人在线看| 日本v片在线免费观看| 欧美成人国产va精品日本一级| 亚洲性受xxx喷奶水| 91在线视频精品| 欧美精品久久久久久| 可以看毛片的网址| 蜜桃在线一区二区三区| wwwxxx色| 国产精品超碰97尤物18| 久久久免费高清视频| 精品国产乱码久久久久久蜜臀 | 一区二区三区偷拍| 一区二区三区福利| 日本黄色一级网站| 国产欧美1区2区3区| 91l九色lporny| 亚洲午夜电影网| 国产乱淫av免费| 欧美一卡在线观看| 番号在线播放| 欧美有码在线观看视频| 欧美成人ⅴideosxxxxx| 国产精品sss| 亚洲视频电影在线| jizz18女人| 国产精品一区二区三区四区| 美女日批在线观看| 中文字幕亚洲综合久久菠萝蜜| 无码人妻丰满熟妇奶水区码| 亚洲激情视频网| caoporn-草棚在线视频最| 26uuu亚洲伊人春色| 伊人久久亚洲| 黄色网络在线观看| 亚洲黄页一区| 色一情一乱一伦一区二区三区日本 | 亚洲国产成人91porn| www.蜜臀av.com| 日韩精品在线观看视频| 成人超碰在线| 日韩免费在线播放| 亚洲欧美在线综合| 日本一区二区免费看| 91精品国产乱码久久久久久久 | 大桥未久一区二区三区| 久久精品国产成人一区二区三区 | 在线观看视频一区二区三区| 午夜久久久久久久久久久| 精品一二线国产| 精品国产一区在线| 亚洲超碰97人人做人人爱| 少妇无码一区二区三区| 在线亚洲午夜片av大片| 国产一区一一区高清不卡| 日韩精品无码一区二区三区| 日韩成人免费看| 成年女人免费视频| 亚洲免费观看在线观看| 精品国精品国产自在久不卡| 欧美激情一二区| 乱亲女h秽乱长久久久| 国产淫片免费看| 国产性天天综合网| 伊人网中文字幕| 美女久久久久久久| 亚洲一区二区三区四区电影 | 国产农村妇女精品一区| 欧美日韩国产123区| 国产在线看片| 欧美有码在线观看视频| 精品国产视频| www.久久久久久久久久久| 久久综合99re88久久爱| 麻豆91精品91久久久| 精品嫩草影院久久| 伊人成综合网站| 亚洲成人一区二区三区| 国产一区二区在线观看视频| 国产网址在线观看| 亚洲人成电影网站色www| 天天综合91| 日韩国产欧美亚洲| 亚洲国产成人午夜在线一区| av免费在线观看不卡| 69视频在线播放| 999精品在线| 青青草成人免费视频| 欧美日韩1区2区| 五月天av在线| 日韩人妻精品一区二区三区| youjizz国产精品| 6—12呦国产精品| 中文字幕亚洲精品| 国产suv精品一区| 人人妻人人澡人人爽欧美一区| 精品一区二区久久久|