精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

輕松打造家用版GPT-4!微軟開源微調指令集:效果不輸原版,中英雙語都能用

人工智能 新聞
缺數據不是問題,直接用GPT-4生成的指令就夠了,標注員恐怕要失業了!

「指令」(Instruction)是ChatGPT模型取得突破性進展的關鍵因素,可以讓語言模型的輸出更符合「人類的偏好」。

但指令的標注工作需要耗費大量的人力,即便有了開源的語言模型,資金不足的學術機構、小公司也很難訓練出自己ChatGPT.

最近微軟的研究人員利用之前提出的Self-Instruct技術首次嘗試使用GPT-4模型來自動生成語言模型所需的微調指令數據

圖片

論文鏈接:https://arxiv.org/pdf/2304.03277.pdf

代碼鏈接:https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM

在基于Meta開源的LLaMA模型上的實驗結果表明,由 GPT-4生成的5.2萬條英語和漢語instruction-following數據在新任務中的表現優于以前最先進的模型生成的指令數據,研究人員還從GPT-4中收集反饋和比較數據,以便進行全面的評估和獎勵模式訓練。

訓練數據

數據收集

研究人員重用了斯坦福大學發布的Alpaca模型用到的5.2萬條指令,其中每條指令都描述了模型應該執行的任務,并遵循與Alpaca相同的prompting策略,同時考慮有輸入和無輸入的情況,作為任務的可選上下文或輸入;使用大型語言模型對指令輸出答案。

圖片

在Alpaca 數據集中,輸出是使用GPT-3.5(text-davinci-003)生成的,但在這篇論文中,研究人員選擇使用GPT-4來生成數據,具體包括以下四個數據集:

1. 英文Instruction-Following Data:對于在Alpaca中收集的5.2萬條指令,為每一條指令都提供一個英文GPT-4答案。

圖片

未來的工作為遵循迭代的過程,使用GPT-4和self-instruct構建一個全新的數據集。

2. 中文Instruction-Following Data:使用ChatGPT將5.2萬條指令翻譯成中文,并要求GPT-4用中文回答這些指令,并以此建立一個基于LLaMA的中文instruction-following模型,并研究指令調優的跨語言泛化能力。

3. 對比數據(Comparison Data):要求GPT-4對自己的回復提供從1到10的評分,并對GPT-4, GPT-3.5和OPT-IML這三個模型的回復進行評分,以訓練獎勵模型。

圖片

4. 非自然指令的答案:GPT-4的答案是在6.8萬條(指令,輸入,輸出)三元組的數據集上解碼的,使用該子集來量化GPT-4和指令調優后的模型在規模上的差距。

數據統計

研究人員對比了GPT-4和GPT-3.5的英語輸出回復集合:對于每個輸出,都提取了根動詞(root verb)和直接賓語名詞(direct-object noun),在每個輸出集上計算了獨特的動詞-名詞對的頻率。

圖片

頻率高于10的動詞-名詞對

圖片

頻率最高的25對動詞-名詞

圖片

輸出序列長度的頻率分布對比

可以看到,GPT-4傾向于生成比GPT-3.5更長的序列,Alpaca中GPT-3.5數據的長尾現象比GPT-4的輸出分布更明顯,可能是因為Alpaca數據集涉及到一個迭代的數據收集過程,在每次迭代中去除相似的指令實例,在目前的一次性數據生成中是沒有的。

盡管這個過程很簡單,但GPT-4生成的instruction-following數據表現出更強大的對齊性能。

指令調優語言模型

Self-Instruct 調優

研究人員基于LLaMA 7B checkpoint有監督微調后訓練得到了兩個模型:LLaMA-GPT4是在GPT-4生成的5.2萬條英文instruction-following數據上訓練的;LLaMA-GPT4-CN是在GPT-4的5.2萬條中文instruction-following數據上訓練的。

兩個模型被用來研究GPT-4的數據質量以及在一種語言中進行指令調優的LLMs時的跨語言泛化特性。

獎勵模型

從人類反饋中進行強化學習(Reinforcement Learning from Human Feedback,RLHF)旨在使LLM行為與人類的偏好相一致,以使語言模型的輸出對人類更加有用。

RLHF的一個關鍵組成部分是獎勵建模,其問題可以被表述為一個回歸任務,以預測給定提示和回復的獎勵評分,該方法通常需要大規模的比較數據,即對同一提示的兩個模型反應進行比較。

現有的開源模型,如Alpaca、Vicuna和Dolly,由于標注對比數據的成本很高,所以沒有用到RLHF,并且最近的研究表明,GPT-4能夠識別和修復自己的錯誤,并準確判斷回復的質量。

圖片

為了促進對RLHF的研究,研究人員使用GPT-4創建了對比數據;為了評估數據質量,研究人員訓練一個基于OPT 1.3B的獎勵模型,以對不同的回復進行評分:對一個提示和K個回復,GPT-4為每個回復提供一個1到10之間的評分。

實驗結果

在 GPT-4數據上評估以前從未見過的任務的self-instruct調優模型的性能仍然是一項困難的任務。

由于主要目標是評估模型理解和遵守各種任務指示的能力,為了實現這一點,研究人員利用三種類型的評估,并通過研究結果證實,「利用 GPT-4生成數據」相比其他機器自動生成的數據來說是一種有效的大型語言模型指令調優方法。

人類評估

為了評估該指令調優后的大型語言模型對齊質量,研究人員遵循之前提出的對齊標準:如果一個助手是有幫助的、誠實的和無害的(HHH),那它就是與人類評估標準對齊的,這些標準也被廣泛用于評估人工智能系統與人類價值觀的一致性程度。

幫助性(helpfulness):是否能幫助人類實現他們的目標,一個能夠準確回答問題的模型是有幫助的。

誠實性(honesty):是否提供真實信息,并在必要時表達其不確定性以避免誤導人類用戶,一個提供虛假信息的模型是不誠實的。

無害性(harmlessness):是否不會對人類造成傷害,一個產生仇恨言論或提倡暴力的模型不是無害的。

基于HHH對齊標準,研究人員使用眾包平臺Amazon Mechanical Turk對模型生成結果進行人工評估。

圖片

文中提出的兩個模型分別在GPT-4和GPT-3生成的數據上進行了微調,可以看到LLaMA-GPT4以51.2%的占比在幫助性上要大大優于在GPT-3上微調的Alpaca(19.74%),而在誠實性和 無害性標準下,則基本處于平局狀態,GPT-3要略勝一籌。

圖片

在和原版GPT-4對比時,可以發現二者在三個標準上也是相當一致的,即GPT-4指令調優后的LLaMA表現與原始的GPT-4類似。

GPT-4自動評估

受 Vicuna 的啟發,研究人員也選擇用GPT-4來評估不同聊天機器人模型對80個未見過的問題所生成回答的質量,從 LLaMA-GPT-4(7B)和 GPT-4模型中收集回復,并從以前的研究中獲得其他模型的答案,然后要求GPT-4對兩個模型之間的回復質量進行評分,評分范圍從1到10,并將結果與其他強競爭模型(ChatGPT 和 GPT-4)進行比較。

圖片

評估結果顯示,反饋數據和獎勵模型對提高 LLaMA 的性能是有效的;用GPT-4對LLaMA進行指令調優,往往比用text-davinci-003調優(即Alpaca)和不調優(即LLaMA)的性能更高;7B LLaMA GPT4的性能超過了13B Alpaca和LLaMA,但和GPT-4等大型商業聊天機器人相比,仍有差距。

圖片

進一步研究中文聊天機器人的性能時,首先使用GPT-4將聊天機器人的問題也從英文翻譯成中文,用GPT-4獲得答案,可以得到兩個有趣的觀察結果:

1. 可以發現GPT-4評價的相對分數指標是相當一致的,無論是在不同的對手模型(即ChatGPT或GPT-4)和語言(即英語或中文)方面。

2. 僅就GPT-4的結果而言,翻譯后的回復比中文生成的回復表現得更好,可能是因為GPT-4是在比中文更豐富的英文語料庫中訓練的,所以具有更強的英文instruction-following能力。

非自然指令評估(Unnatural Instruction Evaluation)

圖片

從平均ROUGE-L得分來看,Alpaca優于LLaMA-GPT 4和GPT-4,可以注意到,LLaMA-GPT4和GPT4在ground truth回復長度增加時逐漸表現得更好,最終在長度超過4時表現出更高的性能,意味著當場景更具創造性時,可以更好地遵循指令。

在不同的子集中,LLaMA-GPT4跟GPT-4的行為相差無幾;當序列長度較短時,LLaMA-GPT4和GPT-4都能生成包含簡單的基本事實答案的回復,但會增加額外的詞語,使回復更像聊天,可能會導致ROUGE-L得分降低。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-08-15 10:33:06

微軟必應人工智能

2023-04-10 09:23:36

模型AI

2023-05-29 09:29:52

GPT-4語言模型

2024-08-16 11:49:56

2023-06-19 08:19:50

2023-12-26 08:17:23

微軟GPT-4

2023-07-19 21:57:25

Office版微軟企業版

2023-03-28 08:23:38

2025-04-16 09:35:03

2023-09-06 16:44:03

2023-04-11 14:13:23

阿里AI

2023-06-08 11:27:10

模型AI

2023-12-17 22:04:04

微軟GPT-4

2025-05-30 07:40:56

2023-07-19 11:43:59

AIGPT-4

2023-12-27 13:56:00

2024-06-03 10:54:04

2023-08-27 14:44:04

代碼編程語言

2023-03-20 21:44:10

微軟GPT-4AI

2024-01-19 12:51:00

AI數據
點贊
收藏

51CTO技術棧公眾號

日韩视频在线你懂得| 国产福利一区二区三区在线视频| 亚洲精品日韩久久久| 老熟妇仑乱视频一区二区| 午夜在线播放| 成人免费毛片高清视频| 国产成人精品电影| 2025国产精品自拍| 日韩精品福利一区二区三区| 欧美三级资源在线| 欧洲精品在线播放| 欧洲亚洲在线| 国产黄人亚洲片| 国产97色在线| 妺妺窝人体色www聚色窝仙踪| 网友自拍区视频精品| 欧美福利视频导航| 国产1区2区在线| a黄色片在线观看| 26uuu国产在线精品一区二区| 成人在线一区二区| 五月婷婷亚洲综合| 欧美一区在线看| 国产一区二区三区日韩欧美| 国产午夜在线一区二区三区| 久久影视精品| 色综合 综合色| h无码动漫在线观看| 午夜在线播放| 久久久精品国产免费观看同学| 91免费版黄色| 亚洲最大成人av| 久久久水蜜桃av免费网站| 色综合久久久久久中文网| 天天摸日日摸狠狠添| 天堂俺去俺来也www久久婷婷 | 中文字幕av一区| 污污免费在线观看| 日韩在线成人| 91麻豆精品国产91久久久| av五月天在线| 日韩电影网站| 欧美性猛交xxxx偷拍洗澡| 妞干网视频在线观看| 午夜dj在线观看高清视频完整版 | 国产99久久久国产精品免费看| 国产精品午夜国产小视频| 国产亚洲欧美在线精品| 亚洲影院免费| 欧美一性一乱一交一视频| 日本熟女一区二区| 一道本一区二区| 97视频网站入口| 成年人午夜视频| 亚洲三级国产| 欧美一级大片视频| 香蕉影院在线观看| 日韩电影免费一区| 国产精品video| 中文字幕乱码人妻二区三区| 日本欧美久久久久免费播放网| 国产不卡精品视男人的天堂 | 欧美一区二区三区视频在线观看| 蜜臀一区二区三区精品免费视频| 欧美xxxx性| 6080日韩午夜伦伦午夜伦| 视频区 图片区 小说区| 国内精品视频| 精品成人佐山爱一区二区| 亚洲av无码一区二区三区网址| 全球av集中精品导航福利| 亚洲男人第一av网站| 免费看黄色三级| 欧美大片aaaa| 欧美精品亚州精品| 国产精品999久久久| 亚洲免费在线| 国产精品视频999| 亚洲在线视频播放| 国产成人av福利| 欧美国产综合视频| 国产美女视频一区二区三区| 国产精品久久久久aaaa| 精品无码av无码免费专区| 欧美aa在线| 欧美日韩在线播放三区四区| 色黄视频免费看| 青草久久视频| 久久精品成人欧美大片古装| 欧美人妻精品一区二区三区| 久久精品人人| 91丝袜美腿美女视频网站| 日本黄色大片视频| 欧美激情在线一区二区三区| 国产精品啪啪啪视频| 天堂网在线最新版www中文网| 欧美视频一区二区| 香蕉视频污视频| 欧美日韩性在线观看| 久久99热精品这里久久精品| 国产精品免费精品一区| 精品一区二区三区免费观看| 久久精品人人做人人爽电影| 天堂а√在线资源在线| 欧美日韩免费一区| 日韩欧美色视频| 欧美日韩精品在线一区| 久久久人成影片一区二区三区观看| 成人一级免费视频| 成人午夜激情影院| 在线观看成人av电影| 国产高潮在线| 日韩无一区二区| 国产真实乱人偷精品人妻| 欧美三区视频| 国产在线高清精品| 黄色片免费在线| 亚洲一区二区欧美日韩| 中文字幕天天干| 亚洲丝袜啪啪| 午夜精品在线观看| 国产草草影院ccyycom| 日本一区二区免费在线| 午夜免费福利小电影| 久久国际精品| 日韩视频免费在线| 亚洲婷婷久久综合| 久久久精品免费网站| 成人中文字幕在线播放| 在线播放一区二区精品视频| 日韩一级黄色av| 丰满人妻一区二区三区四区| 91在线观看污| 日韩中文字幕在线免费| 亚洲天堂av资源在线观看| 久久精品视频播放| 亚洲资源在线播放| 国产精品私人影院| 欧美午夜性生活| 九九精品久久| 日本国产一区二区三区| 婷婷色在线视频| 图片区小说区区亚洲影院| 国产亚洲精品成人a| 欧美在线高清| 99porn视频在线| 欧美人与牲禽动交com | 国产精品国产福利国产秒拍| 国产在线高清| 91成人国产精品| 国产伦精品一区二区三区视频女| 日韩精品一区第一页| 日本一区免费看| 免费观看成人性生生活片| 日韩乱码在线视频| 一级一片免费看| 国产日本欧美一区二区| 少妇一级淫免费放| 91亚洲自偷观看高清| 成人国产精品免费视频| 超碰在线最新| 亚洲第一区在线观看| 欧美啪啪小视频| 波多野结衣中文一区| 亚洲熟妇av日韩熟妇在线| 一个色免费成人影院| 国产精品福利在线| 巨大荫蒂视频欧美另类大| 日韩一区二区在线免费观看| 久久免费小视频| 91首页免费视频| 亚洲一区二区蜜桃| 91精品一区国产高清在线gif| 91文字幕巨乱亚洲香蕉| 欧美aa在线观看| www.久久久久| 人妻无码一区二区三区久久99| 欧美日韩国内自拍| 日本美女bbw| 国产成人小视频| 欧美女人性生活视频| 三上亚洲一区二区| 91超碰在线电影| 成人直播视频| 不卡av在线播放| 色网站在线免费观看| 欧美三级在线看| 久久免费公开视频| 国产婷婷一区二区| 麻豆传媒在线看| 久久午夜av| 性生活免费观看视频| 欧美一区二区三区红桃小说| 国产噜噜噜噜久久久久久久久| 日本无删减在线| 中文字幕av日韩| 天堂在线资源8| 欧美日韩二区三区| 日韩字幕在线观看| 亚洲日穴在线视频| 午夜理伦三级做爰电影| 国产精品综合一区二区三区| 999香蕉视频| 亚洲婷婷在线| 国产精品jizz在线观看老狼| 丝袜美腿一区二区三区动态图| 国产中文字幕亚洲| 麻豆mv在线看| 九九精品在线播放| 91吃瓜网在线观看| 日韩高清av一区二区三区| 国产精品高潮呻吟AV无码| 欧美日韩精品二区| 劲爆欧美第一页| 国产精品三级电影| 91精品人妻一区二区三区| 成熟亚洲日本毛茸茸凸凹| 潘金莲激情呻吟欲求不满视频| 国产精品日韩| 男女猛烈激情xx00免费视频| 久久久9色精品国产一区二区三区| 免费一区二区三区| 久久精品色综合| av成人观看| 久久三级中文| 成人h猎奇视频网站| 第四色男人最爱上成人网| 97免费视频在线播放| 神马午夜伦理不卡 | 欧美少妇精品| 韩国精品久久久999| 日本三级在线观看网站| 久久综合国产精品台湾中文娱乐网| 精品美女视频在线观看免费软件 | 久久久无码人妻精品一区| 成人精品国产免费网站| 91视频免费入口| 国内一区二区在线| 小早川怜子一区二区三区| 麻豆精品视频在线观看| 国产日韩欧美久久| 日本va欧美va欧美va精品| wwwwxxxx日韩| 日本不卡视频在线| 午夜在线观看av| 久久99精品久久只有精品| 手机看片一级片| 久久97超碰色| 一级网站在线观看| 国产精品一区二区果冻传媒| 免费不卡av网站| 国产99久久久国产精品潘金| 制服丝袜在线第一页| 97国产一区二区| 免费观看av网站| 国产日韩精品一区二区三区在线| 精品人伦一区二区三电影| 国产嫩草影院久久久久| 后入内射无码人妻一区| 亚洲欧美一区二区在线观看| 少妇aaaaa| 亚洲国产精品一区二区久久恐怖片 | 国产99久久九九精品无码免费| 日韩一区二区在线免费观看| 亚洲国产视频一区二区三区| 欧美精品一区视频| 视频在线不卡| 中文字幕免费精品一区| av免费在线免费| 国模精品系列视频| 日韩高清成人| 91亚洲国产成人精品性色| 亚洲免费一区三区| 欧美日韩无遮挡| 99热国内精品| 日韩人妻无码精品久久久不卡| 亚洲欧美视频| 三日本三级少妇三级99| 成年人午夜久久久| 在线看片中文字幕| 亚洲精品一二三| 国产中文字幕视频| 91精品国产综合久久蜜臀| 天天操天天操天天干| 中文字幕国产精品| 欧美videosex性欧美黑吊| 69精品小视频| a一区二区三区亚洲| 国产精品区一区| 欧美高清视频在线观看mv| www.欧美黄色| 美国三级日本三级久久99| 男人网站在线观看| 国产精品久99| 五月天综合激情网| 欧美一级生活片| 美女做暖暖视频免费在线观看全部网址91| 日韩一二三在线视频播| 竹内纱里奈兽皇系列在线观看| 国产有码在线一区二区视频| 欧美激情极品| 久久久久久久久影视| 久久天堂成人| 日本五十肥熟交尾| 中文字幕一区二区不卡| 一区二区三区在线观看av| 精品国产91乱码一区二区三区| 国产大学生校花援交在线播放| 午夜精品久久久99热福利| 四虎视频在线精品免费网址| 欧美精品尤物在线| 亚洲黄色成人| 亚洲成人福利视频| 国产精品盗摄一区二区三区| 99re这里只有精品在线| 亚洲国产成人一区| 污污视频在线| 成人性生交大片免费看小说| 成人看的视频| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 不卡av在线网| 国产在线观看免费av| 欧美一区二区视频在线观看2022| gogogo高清在线观看免费完整版| 欧美性做爰毛片| 日本成人7777| www在线观看免费| 成人免费高清在线| 精品亚洲永久免费| 精品电影一区二区| 久久香蕉一区| 国产精品12| 黄色欧美成人| 亚洲精品久久一区二区三区777| 亚洲黄色免费网站| 99久久久久久久| 免费91麻豆精品国产自产在线观看| 日韩毛片免费看| 国产精品jizz在线观看老狼| 激情综合网最新| caoporn91| 日韩视频免费直播| 一色桃子av在线| 国产福利久久精品| 亚洲东热激情| www.男人天堂| 精品成人乱色一区二区| 国产 日韩 欧美 精品| 久久全球大尺度高清视频| 亚洲三级av| 91国视频在线| 久久伊人蜜桃av一区二区| 国产视频1区2区| 亚洲女人天堂av| 91电影在线播放| 亚洲一区二区三区毛片| 国产精品久久久久久久| 色偷偷中文字幕| 一区二区三区在线观看国产| 免费av网站观看| 欧美精品videossex88| 国产精品久久久久久久久久久久久久久| 亚洲高清资源综合久久精品| 99综合在线| 日本道中文字幕| 亚洲制服丝袜一区| 天天干视频在线| 国内精品免费午夜毛片| 日韩啪啪网站| 国产精品人人妻人人爽人人牛| 国产精品久久久久久久久久免费看| 一级片免费网站| 欧美精品激情视频| 天堂一区二区三区四区| 色婷婷.com| 一区二区激情视频| 欧美少妇另类| 国产精品亚洲欧美导航| 国产精品v亚洲精品v日韩精品| 性久久久久久久久久久| 午夜久久久久久久久| av播放在线观看| 亚洲xxx自由成熟| 免费永久网站黄欧美| 黄色裸体一级片| 亚洲国产另类 国产精品国产免费| 性国裸体高清亚洲| 欧美 日韩 国产 在线观看| 国产成人精品www牛牛影视| 国产一级淫片a视频免费观看| 最近2019中文字幕在线高清| 亚洲视频自拍| 男人天堂网视频| 亚洲日本在线天堂| 欧美日韩在线精品一区二区三区激情综| 国产啪精品视频网站| 亚洲理伦在线| 国产中文字幕久久| 日韩精品www| 国产精品1区在线|