精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「模仿學習」只會套話?解釋微調+130億參數Orca:推理能力打平ChatGPT

人工智能 新聞
用GPT-4輔助訓練小模型,想會推理還得用「解釋微調」。

自ChatGPT API開放后,大量的研究都選擇利用ChatGPT和GPT-4等大型基礎模型(LFM)的輸出作為訓練數據,然后通過模仿學習來提升小模型的能力。

但由于模仿信號流于表面、訓練數據量不夠大、缺乏嚴格的評估標準等問題,小模型的實際性能被高估了。

從效果上來看,小模型更傾向于模仿LFM的輸出風格,而非推理過程。

圖片

論文鏈接:https://arxiv.org/pdf/2306.02707.pdf

為了應對這些挑戰,微軟最近發布了一篇長達51頁論文,提出了一個130億參數的Orca模型,可以學習模仿LFMs的推理過程。

研究人員為大模型設計了豐富的訓練信號,使得Orca可以從GPT-4中學習到解釋痕跡、逐步的思維過程、復雜的指令等,并由ChatGPT的教師協助指導;并通過采樣和選擇來挖掘大規模且多樣化的模仿數據,可以進一步提升漸進式學習效果。

在實驗評估中,Orca超過了其他SOTA指令微調模型,在BigBench Hard(BBH)等復雜的零樣本推理基準中實現了比Vicuna-13B翻倍的性能表現,在AGIEval上也實現了42%的性能提升。

圖片

此外,Orca在BBH基準上還實現了與ChatGPT持平的性能,在SAT、LSAT、GRE和GMAT等專業和學術考試中只有4%的性能差距,并且都是在沒有思維鏈的零樣本設置下測量的。

圖片

研究結果表明,讓模型從分步解釋中學習,無論這些解釋是由人類還是更高級的人工智能模型產生的,都是提高模型能力和技能的一個有前景的研究方向。

解釋微調(Explanation Tuning)

數據集構造

在訓練數據中,每個實例都包括三部分,即系統消息、用戶查詢和LFM回復。

系統消息(system message)放置在提示中開頭的部分,提供給LFM基本的上下文、引導以及其他相關的細節。

系統消息可以用來改變回復的長度、描述AI助手的性格、建立可接受和不可接受的LFM行為,并確定AI模型的回復結構。

研究人員手工制作了16條系統信息來設計LFM不同類型的回復,可以生成創造性的內容以及解決信息查詢問題,最重要的是能夠根據提示生成解釋和逐步推理的答案。

圖片

用戶查詢(user query)定義了希望LFM執行的實際任務。

為了獲得大量的、多樣化的用戶查詢,研究人員利用FLAN-v2集合,從中抽取500萬個用戶查詢(FLAN-5M),并收集ChatGPT的回復;然后進一步從500萬條指令中抽出100萬條指令(FLAN-1M),收集GPT-4的回復。

FLAN-v2集合由五個子集合組成,即CoT、NiV2、T0、Flan 2021和Dialogue,其中每個子集包含多個任務,每個任務都是一個查詢的集合。

每個子集合都與多個學術數據集相關,并且每個數據集都有一個或多個任務,主要關注零樣本和少樣本的查詢。

在這項工作中,研究人員只取樣訓練Orca的零樣本查詢,并且沒有從Dialogue子集中取樣,因為這些查詢往往缺乏背景,無法從ChatGPT中獲得有用的回復。

讓ChatGPT扮演Teaching Assistant

首先在FLAN-5M數據上訓練Orca(ChatGPT增強),隨后在FLAN-1M上進行第二階段的訓練(GPT-4增強)。

將ChatGPT作為中間的教師助手主要有兩個原因:

1. 能力差距

雖然GPT-4的參數量沒有公開,但130億參數的Orca肯定比GPT-4要小很多倍,而ChatGPT和Orca之間的能力差距更小,更適合作為中間教師,并且這種方式已經被證明可以提高更小的學生模型在知識蒸餾中的模仿學習性能。

這種方式也可以看作是一種漸進式學習或課程學習,學生首先從較容易的例子中學習,然后再學習較難的例子,假定了較長的回復會比較短的回復更難模仿,可以從更大規模的教師模型中改進推理和逐步解釋能力。

2. 成本和時間

從Azure OpenAI API進行大規模數據收集時會受到一些限制,包括每分鐘請求的速率限制,防止流量過大;由于服務延遲問題,每分鐘可用的token數量有限;提示長度和token補全的金錢成本。

圖片

相比之下,ChatGPT API比GPT-4終端更快、更便宜,所以從ChatGPT上收集了比GPT-4多5倍的數據。

圖片

從ChatGPT和GPT-4對應于不同系統消息的回復長度分布中可以觀察到,GPT-4的回復平均比ChatGPT長1.5倍,使得Orca能夠逐步從教師解釋的復雜性中學習,并通過消融實驗證明了教師幫助的影響。

訓練

在分詞階段,研究人員利用LLaMA的字節對編碼(BPE)分詞器來處理輸入的樣本,其中多位數字會被分割成多個單數字,并回落到字節來分解未知的UTF-8字符。

為了處理可變長度的序列,在LLaMA分詞器的詞匯表中引入了一個填充詞[[PAD]],最終的詞匯表包含32001個token

為了優化訓練過程并有效利用可用的計算資源,研究人員利用了packing技術,將多個輸入實例串聯成一個序列后再訓練模型。

在packing的過程中,串聯序列的總長度不超過max_len=2048 tokens,對輸入的樣本進行隨機打亂后將分成幾組,每組串聯序列的長度最多為max_len

考慮到訓練數據中增強指令的長度分布,每個序列的打包系數為2.7

為了訓練Orca,研究人員選擇只計算教師模型生成token的損失,也就是說學習生成以系統信息和任務指令為條件的回復,可以確保模型專注于從最相關和最有信息的token中學習,提高了訓練過程的整體效率和效果。

最后在20個裝有80GB內存的NVIDIA A100 GPU上訓練Orca,先在FLAN-5M(ChatGPT增強)上訓練4個epoch,花了160個小時;然后在FLAN-1M(GPT-4增強)上繼續訓練4個epoch

由于流量限制、終端負載以及回復的長度問題,從GPT-3.5-turbo(ChatGPT)和GPT-4的多個終端收集數據分別用了2周和3周的時間。

實驗部分

研究人員主要驗證了Orca在推理上的能力。

圖片

在AGIEval的實驗中可以看到,Orca的表現與Text-da-Vinci-003相當,并實現了ChatGPT 88%的性能表現,不過明顯落后于GPT-4

對于分析和推理任務,Vicuna的表現明顯更差,只保留了62%的ChatGPT質量,表明這種開源語言模型的推理能力很差。

雖然Orca與Text-da-Vinci-003的表現相當,但仍然比ChatGPT低5分,Orca在與數學有關的任務(在SAT、GRE、GMAT中)上與ChatGPT表現出較大的差距。

與Vicuna相比,Orca顯示出更強的性能,在每個類別上都超過了Vicuna,平均有42%的相對提高。

GPT-4的性能遠遠超過了所有其他模型,但在這個基準中仍有很大的提升空間,目前所有模型的性能都明顯低于人類的得分。

圖片

Orca的性能根據系統信息的類型有很大的不同,對于訓練的模型來說,空的系統消息往往效果很好。

圖片

Orca在不同任務的325個樣本中超越了ChatGPT(Orca-beats-ChatGPT例子),其中大部分來自LogiQA(29%),而其他LSAT任務和SAT-英語任務各占不到10%

在Big-Bench Hard Results數據集上的推理評估結果顯示,Orca在所有任務中的綜合表現上略好于ChatGPT,但明顯落后于GPT-4;比Vicuna性能高出113%

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-03-31 13:55:00

模型智能

2024-12-03 15:51:45

2023-10-28 13:36:48

模型ChatGPT

2023-11-07 14:07:51

GPT-4大語言模型

2023-07-19 15:01:14

GPT-4LaMA2參數

2025-11-07 09:28:08

2023-07-18 15:00:00

AI代碼

2023-10-31 12:29:25

模型訓練

2024-07-04 15:32:13

2023-12-03 08:49:38

微軟開源

2025-04-30 09:19:32

2023-08-25 09:34:24

模型訓練

2023-10-23 15:27:09

OpenAIChatGPT

2025-07-16 10:42:32

2023-06-06 07:03:02

2023-04-23 09:43:22

2025-06-23 09:09:00

2023-04-26 13:56:17

模型ChatGPT

2023-04-07 09:28:31

模型訓練

2023-04-04 13:17:00

GPUCMU開源
點贊
收藏

51CTO技術棧公眾號

2019最新中文字幕| 日韩国产欧美精品在线| 国产激情在线看| 天天综合天天综合| 美女网站色91| 98精品在线视频| 五月激情四射婷婷| 成人爽a毛片| 欧美日韩日日摸| av网站手机在线观看| 国产福利电影在线| 国产精品一二三区| 国产成人涩涩涩视频在线观看 | 欧美成人精品在线观看| 大桥未久恸哭の女教师| 成人毛片免费| 天天色综合天天| 在线成人性视频| 九一国产在线| 不卡视频在线观看| 国产一区私人高清影院| 亚洲欧美综合另类| 狠狠入ady亚洲精品| 中文字幕欧美国内| 日韩精品卡通动漫网站| 视频一区国产| 欧美精品乱人伦久久久久久| 国产婷婷一区二区三区| 好操啊在线观看免费视频| 久久久无码精品亚洲日韩按摩| 成人h视频在线观看| 一级黄色短视频| 老司机精品视频网站| 九九精品在线观看| 亚洲熟女少妇一区二区| 精品国内自产拍在线观看视频 | 午夜伦全在线观看| 久久精品一区八戒影视| 国产精品一区二区三区观看| 999av视频| 精品亚洲免费视频| 国产日韩精品视频| 在线观看中文字幕网站| 丝袜美腿亚洲综合| 国产97色在线|日韩| 久久99精品波多结衣一区| 亚洲三级国产| 7777kkkk成人观看| 精品91久久久| 夜夜嗨一区二区| 91av在线免费观看视频| aaa人片在线| 免费在线播放第一区高清av| 91av视频在线| www.国产com| gogogo高清免费观看在线视频| 黄色一级片在线观看| 成人免费小视频| 成人手机视频在线| av在线影院| 亚洲夂夂婷婷色拍ww47 | 亚洲精品影视| 91超碰caoporn97人人| 亚洲欧美偷拍视频| 日韩成人一级片| 国产精品成人免费电影| 一级黄色大片免费观看| 激情亚洲综合在线| a级国产乱理论片在线观看99| 韩国中文字幕hd久久精品| 不卡视频免费播放| 欧美精品亚洲| 在线观看免费版| 亚洲女子a中天字幕| 黄色一级片黄色| 玖玖在线播放| 欧美日韩一区高清| 在线观看视频你懂得| 精品国产18久久久久久洗澡| 亚洲美女久久久| 肉色超薄丝袜脚交69xx图片| 欧美激情五月| 亲爱的老师9免费观看全集电视剧| 在线观看你懂的网站| 久久草av在线| 国产精品裸体一区二区三区| 精品福利视频导航大全| 国产精品美女久久久久久 | 永久免费看mv网站入口78| 成人久久久久| 久久久久久久久久av| 国产黄色免费观看| 国产在线精品一区在线观看麻豆| 国产精品免费一区二区三区在线观看 | 亚洲天堂第二页| 希岛爱理中文字幕| 国产精品久久久久毛片大屁完整版 | 国产精品白浆一区二小说| 久色成人在线| 99在线看视频| 永久免费在线观看视频| 午夜欧美大尺度福利影院在线看| wwww.国产| 成人在线视频你懂的| 伊是香蕉大人久久| 日韩精品一区二区不卡| 久久成人久久鬼色| 欧美日韩精品久久| 亚洲wwwww| 欧美性色黄大片手机版| 成人免费看片载| 日韩精品不卡一区二区| 97在线免费观看| 国产高清免费av| 亚洲国产精品国自产拍av| 九一国产精品视频| 久久av网站| 中文字幕日韩在线播放| av大片免费观看| 国产成人精品亚洲日本在线桃色| 亚洲欧美国产不卡| 成人性生活视频| 精品播放一区二区| 农村妇女精品一区二区| 美女任你摸久久| 日本一区二区三区视频在线播放| 日韩专区av| 6080日韩午夜伦伦午夜伦| 女女互磨互喷水高潮les呻吟| 1024精品一区二区三区| 99re视频在线| 色综合999| 欧美成人高清电影在线| 国产精品嫩草影院俄罗斯| 日本中文字幕不卡| 日韩高清国产一区在线观看| 依依综合在线| 亚洲人成网在线播放| 超碰超碰超碰超碰| 久久亚洲二区三区| 干日本少妇首页| 国产精品香蕉| 久久久av毛片精品| 精品一区二区三区国产| 精品欧美乱码久久久久久1区2区| 精品无码国产一区二区三区51安| 欧美一区二区三区免费看| 国产精品爽黄69| 高清av电影在线观看| 91国偷自产一区二区开放时间| 亚洲专区区免费| 久久精品欧洲| 视频一区视频二区视频三区高| 第84页国产精品| 国产午夜精品全部视频播放| 黄色一级视频免费看| 久久精品人人做| 国产又粗又长又大的视频| 欧美一区2区| 91精品美女在线| 久草中文在线观看| 欧美一区午夜视频在线观看| 成年人一级黄色片| 国产91丝袜在线播放九色| 久青草视频在线播放| 久久动漫网址| 日本精品免费观看| 91电影在线播放| 宅男在线国产精品| 国产香蕉在线视频| 91一区二区在线| 国产极品美女高潮无套久久久| 国产成人av| 成人久久久久爱| 久久www人成免费看片中文| 日韩av在线免费观看| 五月天婷婷久久| 国产精品久久三区| 亚洲美女高潮久久久| 亚洲欧美日韩在线观看a三区| 日日骚一区二区网站| 国产精品一区三区在线观看| 久久久久久久久国产| 国产中文字幕在线| 欧美一级欧美三级在线观看| 日本三级视频在线| 国产日韩欧美综合在线| 三区视频在线观看| 在线精品一区| 亚洲三区在线| 美女午夜精品| 国产在线观看一区二区三区| 国产第一页在线视频| 亚洲天堂网在线观看| 国产成人毛毛毛片| 色婷婷久久久综合中文字幕| 国产精品99久久久久久成人| 久久午夜老司机| 亚洲精品乱码久久久久久动漫| 亚洲区欧美区| 这里只有精品66| 亚洲另类春色校园小说| 亚洲一区二区在线播放| 成人天堂yy6080亚洲高清| 久久av.com| 电影在线高清| 亚洲精品成人免费| 99精品人妻无码专区在线视频区| 欧美性69xxxx肥| 免费中文字幕在线观看| 国产精品色哟哟网站| 鲁大师私人影院在线观看| 激情图片小说一区| 一级特黄性色生活片| 日韩视频二区| 国产精品av免费观看| 欧洲三级视频| 久久久综合香蕉尹人综合网| 中文字幕av一区二区三区四区| 国产在线视频2019最新视频| 久久uomeier| 久久久影视精品| 图片区小说区亚洲| 精品国产一区av| 国产专区在线| 亚洲男人第一网站| 婷婷视频在线观看| 亚洲福利在线播放| 亚洲国产精品成人久久蜜臀| 91精品国产综合久久久久久久| 在线永久看片免费的视频| 精品欧美激情精品一区| 日韩成人免费在线观看| 一区二区三区资源| 加勒比婷婷色综合久久| 国产精品欧美经典| 91狠狠综合久久久久久| 国产日韩综合av| 无码少妇一区二区| 国产欧美视频一区二区| 亚洲最大的黄色网| 99精品欧美一区| 中文字幕5566| 2020国产精品| 色欲AV无码精品一区二区久久| 久久久美女毛片| 男女做爰猛烈刺激| 国产精品私人自拍| 又嫩又硬又黄又爽的视频| 亚洲国产精品ⅴa在线观看| 受虐m奴xxx在线观看| 国产欧美一区二区在线观看| 免费看污片的网站| 国产精品久久久久桃色tv| 四虎884aa成人精品| 亚洲精品成a人| 国产在线视频你懂的| 天涯成人国产亚洲精品一区av| 在线观看精品国产| 欧美性猛交xxxx黑人| 五月婷婷激情视频| 欧美亚洲日本一区| 亚洲综合精品在线| 日韩一区二区三区视频在线观看| 亚洲AV无码成人片在线观看| 亚洲国产精品yw在线观看| 日韩av资源| 在线日韩精品视频| 麻豆免费在线视频| 欧美精品18videosex性欧美| 日本三级一区| 国产精品海角社区在线观看| 亚洲成人精品综合在线| 99久久精品无码一区二区毛片| 欧美18免费视频| 日本在线观看一区二区三区| 欧美成人直播| 99色这里只有精品| 快she精品国产999| 天堂av手机在线| 99热99精品| а天堂中文在线资源| 一区二区三区日韩精品视频| 日本熟妇毛耸耸xxxxxx| 在线精品国精品国产尤物884a| 国产区精品在线| 日韩av影院在线观看| 老司机午夜在线视频| 韩国三级电影久久久久久| 日本高清不卡一区二区三区视频| 成人欧美在线观看| 同性恋视频一区| 大地资源第二页在线观看高清版| 国产日韩欧美三区| 99国产精品久久久久久| 97国产一区二区| 人成免费在线视频| 午夜精品久久久久久久99樱桃| 在线观看毛片av| 日韩成人在线电影网| 美女隐私在线观看| 日韩美女在线看| 久久久精品区| 日韩欧美99| 国产欧美一区二区色老头 | 欧美一区二区三区爽爽爽| 欧美日韩性视频| 国产哺乳奶水91在线播放| 亚洲免费电影一区| 欧美家庭影院| 国产啪精品视频网站| 亚洲成人一品| 国产91沈先生在线播放| 精品亚洲aⅴ乱码一区二区三区| 色天使在线视频| 亚洲尤物视频在线| 97人人爽人人爽人人爽| 国产一区二区黄| 国产网站在线| 成人黄动漫网站免费| 97国产精品| 日本激情综合网| 国产亚洲女人久久久久毛片| 久久狠狠高潮亚洲精品| 精品日韩一区二区| 成人免费看片| 91精品国产自产在线观看永久| 一呦二呦三呦国产精品| 欧美精品一区二区三区三州| 国产乱对白刺激视频不卡| 性生交大片免费全黄| 欧美午夜精品一区| 国产女主播在线直播| 人人爽久久涩噜噜噜网站| 久久精品国产亚洲5555| 国产精品一色哟哟| 国产成人综合视频| 久久久久久久9999| 日韩写真欧美这视频| 国产色在线观看| 91亚洲精品在线| 亚洲乱码精品| 男生和女生一起差差差视频| 亚洲天堂av老司机| 99久久精品国产成人一区二区| 久久亚洲精品一区二区| 成人午夜888| 加勒比海盗1在线观看免费国语版| 激情六月婷婷综合| 日韩视频中文字幕在线观看| 91精品国产福利| 污网站在线免费看| 国产精品综合久久久久久| 亚洲激情黄色| 色天使在线视频| 在线观看av一区二区| 9191在线| 99免费在线观看视频| 亚洲激情二区| 久久精品无码一区| 欧美私人免费视频| 超碰porn在线| 国产精品一 二 三| 久久都是精品| 亚洲欧美日韩第一页| 3atv在线一区二区三区| 欧美性受ⅹ╳╳╳黑人a性爽| 国产精品夜夜夜一区二区三区尤| 亚洲在线国产日韩欧美| 影音先锋制服丝袜| 欧美一区二区在线播放| 国产高清在线a视频大全| 欧美h视频在线| 日本va欧美va欧美va精品| 国产精品免费人成网站酒店| 日韩av在线免播放器| 欧美xxxx网站| 欧美男女爱爱视频| 国产日韩在线不卡| 午夜精品久久久久久久爽| 91精品国产高清久久久久久91 | 91农村精品一区二区在线| 中文字幕第99页| 久久69精品久久久久久久电影好 | 国产精品亚洲d| 黄色一级片网址| 91欧美激情一区二区三区成人| 一区二区三区播放| 69久久夜色精品国产7777| 色中色综合网| 亚洲成人av免费在线观看| 欧美日韩国产小视频在线观看| 超碰在线中文字幕| 日韩片电影在线免费观看| 国产成人精品免费视频网站| 无码人妻精品一区二区50| 久久69精品久久久久久久电影好| 视频精品在线观看| 野花视频免费在线观看| 在线观看不卡视频|