精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

詳解“小而優”的大語言模型Zephyr 7B

譯文
人工智能
Zephyr 7B是由Hugging Face H4團隊創建的一個模型,主要目的是創建一個更小的語言模型,與用戶意圖保持一致,但性能勝過更大的模型。

Zephyr是Hugging Face發布的一系列大語言模型,使用蒸餾監督微調(dSFT)在更龐大的模型上進行訓練,顯著提高了任務準確性。

2023年是屬于大語言模型(LLM)和開源的一年。許多初創公司和企業開放了模型和權重的源代碼,以應對ChatGPT和Claude等專有LLM。2023年的一些重要公司和模型(開源)包括:

  • Meta(Llama和LLamav2)
  • TII(Falcon 7B、40B和180B)
  • Mistral(Mistral 7B和Mixtral8x7B)

然而,部署相對容易和便宜的7B模型無法與70B等更龐大的模型相提并論。最強大的開源模型是Mistral 7B,它勝過許多更龐大的模型。

圖1. Mistral-7B與各大模型的比較

可見,這些小模型仍然不能很好地響應自然提示,需要良好的提示工程。

引言

Zephyr 7B是由Hugging Face H4團隊創建的一個模型,主要目的是創建一個更小的語言模型,與用戶意圖保持一致,但性能勝過更大的模型。

Zephyr是Mistral-7B的校準版本,主要借助蒸餾的優點創建而成,在學術和對話衡量基準方面與70B型號不相上下。

圖2. Zephyr-7B的性能比較

關鍵特性

Zephyr性能出色的原因是H4團隊使用了這幾項關鍵技術。

  • 自我指導數據創建和DSFT(蒸餾監督微調)
  • 反饋收集
  • DSFT模型的DDPO(蒸餾直接偏好優化)

自我指導數據創建和DSFT

傳統上,監督微調(SFT)通過高質量的指令完成針對大語言模型的數據創建。這些數據的構建成本很高,需要人工監督。

其中一個值得關注的方法是使用Teacher模型(已經過訓練的LLM)來生成指令和響應。這項蒸餾技術首先用于Alpaca,證明了借助蒸餾監督微調,小模型的性能可以勝過大模型。

圖3. 自我指導管道

H4團隊使用Zephyr構建用于執行DSFT的高質量監督(指令和完成)數據集。根據生成的指令/完成訓練模型是一種蒸餾形式,名為DSFT(蒸餾監督微調)。

反饋收集

大語言模型通常借助人類反饋強化學習(RLHF)進行對齊。Zephyr則是使用來自更好的教師模型(比如GPT-4)的反饋來對齊模型的偏好,遵循超級反饋(Ultra Feedback)方法。

圖4. 超級反饋構建過程

其工作方式是,來自SFT的每個監督提示被傳遞給4個模型(Claude、Llama和Falcon等),針對單個提示的4個響應中每一個都借助GPT-4來評分。現在我們有了一個數據集,包括輸入(x)、最高評分完成(yw)和表示為低評分完成的隨機提示(yl),即我們有一個三元組(x、yw和yl)。

偏好優化

最后這一步的目標是最大化模型的偏好,偏向yw(最高評分完成)而非yl(低評分完成)。這是使用DPO(直接偏好優化)來完成的。使用DPO比使用普通RLHF來得簡單,直觀上性能優于RLHF。本例中的方法被之所以稱為dDPO,是由于它使用借助教師模型生成的蒸餾數據集。

圖5. DPO vs RLHF

整個算法看起來有點像這樣:

可以轉換成以下步驟:

  • 從dSFT模型(僅向前)計算(x, yw)和(x, yl)的概率。
  • 從dDPO模型計算(x, yw)和(x, yl)的概率。
  • 計算Eq 1,反向傳播以更新。重復步驟。

訓練細節

Zephyr使用的基本型號是Mistral-7B,它在發布時是最先進的開源模型。他們使用TRL庫進行微調和對齊。Deep-Speed Zero 3和Flash-Attention 2用來優化和加速訓練,充分利用GPU。模型使用AdamW優化器進行訓練,不使用權值衰減。所有實驗都在16臺A100s上運行,使用bfloat16精度,通常需要2-4小時才能完成。可以參閱原論文(https://arxiv.org/pdf/2310.16944.pdf),深入了解Zephyr訓練程序的細節。

結果

Zephyr團隊結合了最好的技術來訓練大語言模型,它只需70億個參數就可以媲美400億參數模型的性能,可以媲美700億個參數的聊天模型。

表2:Zephyr與其他LLM的比較

圖6. Zephyr與其他LLM的比較

使用

Zephyr模型在Hugging Face上免費可用,可以像其他語言模型一樣使用。

import torch
from transformers import pipeline
pipe = pipeline("text-generation",
model="HuggingFaceH4/zephyr-7b-alpha", # can also use the beta model
torch_dtype=torch.bfloat16,
device_map="auto")
# We use the tokenizer's chat template to format each message - see 
https://huggingface.co/docs/transformers/main/en/chat_templating
messages = [
{
"role": "system",
"content": "You are a friendly chatbot who always responds in the style of a 
pirate",
},
{"role": "user", "content": "How many helicopters can a human eat in one 
sitting?"},
]
prompt = pipe.tokenizer.apply_chat_template(messages, tokenize=False, 
add_generation_prompt=True)
outputs = pipe(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, 
top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

輸出:

<|system|>
You are a friendly chatbot who always responds in the style of a pirate.
<|user|>
How many helicopters can a human eat in one sitting?
<|assistant|>
Ah, me hearty matey! But yer question be a puzzler! A human cannot eat a 
helicopter in one sitting, as helicopters are not edible. They be made of metal, 
plastic, and other materials, not food!

結論

Zephyr-7B是一個小模型,展示了LLM提煉成小模型的能力。由此生成的模型Zephyr-7B基于Mistral-7B,為70億參數聊天模型奠定了新的先進記錄,甚至在MT-Bench上的性能勝過Llama2-Chat-70B。

參考資料:

  • Zephyr:語言模型對齊直接蒸餾(https://arxiv.org/abs/2310.16944)
  • HuggingFace Zephyr博文(https://huggingface.co/blog/Isamu136/understanding-zephyr)
  • 自我指導:https://arxiv.org/abs/2212.10560
  • 超級反饋:https://arxiv.org/abs/2310.01377

原文標題:Exploring the Zephyr 7B: A Comprehensive Guide to the Latest Large Language Model,作者:Ahmad Anis

鏈接:https://www.kdnuggets.com/exploring-the-zephyr-7b-a-comprehensive-guide-to-the-latest-large-language-model。

責任編輯:姜華 來源: 51CTO
相關推薦

2024-06-03 10:43:34

2024-04-02 09:17:50

AI數據開源

2024-03-25 08:00:00

2025-08-01 14:32:35

AI模型訓練

2024-07-22 09:00:00

2023-04-21 10:37:40

語言模型

2024-09-05 14:25:00

訓練代碼

2023-10-13 19:58:33

Mistral7B模型

2024-06-11 14:30:18

2024-05-09 08:33:33

2024-08-13 15:40:00

2024-03-18 07:01:42

2025-03-11 13:07:58

2023-12-17 13:07:11

訓練數據

2024-07-17 13:40:01

2024-07-17 12:13:11

2023-08-28 00:50:14

模型開源

2024-03-08 12:35:41

模型數據

2025-06-25 08:54:03

模型訓練AI
點贊
收藏

51CTO技術棧公眾號

久久电影一区二区| 亚洲高清免费观看高清完整版在线观看 | 伦理中文字幕亚洲| 国产又黄又嫩又滑又白| а√在线天堂官网| 国产日韩欧美高清| 亚洲在线观看视频网站| 国产一级做a爱片久久毛片a| 国产影视精品一区二区三区| 欧美精品aⅴ在线视频| www.夜夜爱| 国产对白叫床清晰在线播放| 国产一区二区三区四区五区入口| 高清欧美性猛交| 亚洲一二三四五六区| 国产香蕉精品| 欧美在线999| 国产资源在线视频| 国产婷婷视频在线 | 国产欧美亚洲日本| 一区二区久久精品66国产精品 | 国模精品视频一区二区| 国产精品理论在线| 久久久久久毛片免费看| 91精品综合久久久久久| 男女av免费观看| 国产蜜臀一区二区打屁股调教| 中文字幕欧美日韩一区| 精品亚洲一区二区三区四区五区高| 在线免费a视频| 亚洲综合激情| 久久久免费精品| wwwav国产| 国产精品久久久久无码av| 亚洲精品一区在线观看香蕉| 亚洲熟妇一区二区| 伊人久久大香伊蕉在人线观看热v| 欧美日韩一区二区免费视频| 日本wwwcom| 伊人影院蕉久影院在线播放| 1000部国产精品成人观看| 欧美少妇一区| 日本成人一区二区三区| 99久久精品99国产精品| 国产91亚洲精品一区二区三区| 91成人一区二区三区| 水野朝阳av一区二区三区| 91精品国产成人www| 久久久夜色精品| 欧美一区激情| 欧美成人亚洲成人| 国产精品老熟女一区二区| 先锋资源久久| 久久成人精品一区二区三区| 美女网站视频色| 久久看人人摘| www国产91| 久久精品一区二区三区四区五区| 色天天久久综合婷婷女18| 色香阁99久久精品久久久| 欧美成人久久久免费播放| 日韩大片在线播放| 久久久久www| 欧美日韩在线视频免费| 欧美激情第二页| 九九视频直播综合网| 免费无码毛片一区二区app| 欧美高清日韩| 韩国精品久久久999| 欧美不卡视频在线观看| 国产精品美女久久久| 国产精品444| 91一区二区视频| 国产成人av自拍| 久久riav| av在线播放网| 亚洲卡通欧美制服中文| 国产精品自拍片| 国产精品亚洲d| 欧美一区中文字幕| 天堂www中文在线资源| 亚洲警察之高压线| 日日狠狠久久偷偷四色综合免费| 日本天堂中文字幕| 亚洲深夜福利| 成人久久久久久久| 熟妇人妻一区二区三区四区| 久久精品人人做人人综合 | 99在线影院| 婷婷视频在线观看| 欧美国产一区视频在线观看| 中文字幕中文字幕在线中心一区 | 亚洲黄色在线播放| 久久一二三国产| 小说区视频区图片区| 黄色小说在线播放| 91福利视频网站| 成年人性生活视频| 国产一区二区三区电影在线观看 | 国内精品在线播放| 精品欧美日韩| 久草资源在线| 日韩欧美国产成人| a级大片免费看| 欧美人与物videos另类xxxxx| 久久视频在线直播| 午夜影院免费在线观看| 极品美女销魂一区二区三区| 精品久久中出| 成年人黄视频在线观看| 色婷婷精品大视频在线蜜桃视频| 国产精品自在自线| 亚洲区小说区图片区qvod按摩| xxxx欧美18另类的高清| 国产小视频在线免费观看| 精一区二区三区| 欧美精品一区二区三区在线看午夜 | 国产日本亚洲高清| 丰满少妇大力进入| 粉嫩av国产一区二区三区| 亚洲人在线视频| 亚洲国产精品午夜在线观看| 久久99精品久久久久久久久久久久| 国产偷国产偷亚洲高清97cao| 欧美日本一道| 欧美最猛性xxxxx直播| 亚洲第一黄色网址| 欧美日韩成人| 91久久国产婷婷一区二区| 激情小视频在线观看| 亚洲大片一区二区三区| 人妻少妇偷人精品久久久任期| 国产精品欧美在线观看| 性欧美长视频免费观看不卡| www.亚洲黄色| 亚洲色图在线看| 久久久久久久久久一区| sdde在线播放一区二区| 欧美一区二三区| 丰满大乳国产精品| 亚洲制服丝袜av| 在线一区二区不卡| 91精品秘密在线观看| 国产啪精品视频| 三区四区电影在线观看| 欧美日韩视频一区二区| 黑人と日本人の交わりビデオ| 久久久亚洲人| 任我爽在线视频精品一| 中文字幕一区久| 亚洲乱码一区av黑人高潮| 国产精品suv一区二区三区| 成人福利在线看| av免费观看国产| 高潮按摩久久久久久av免费| 国内精品久久久久影院 日本资源| www.好吊色| 洋洋av久久久久久久一区| 黑人巨大猛交丰满少妇| 欧美色123| 国产在线一区二| 亚洲妇女成熟| 亚洲欧美中文字幕在线一区| 亚洲欧美一二三区| 国产精品乱码人人做人人爱 | 亚洲天堂日韩av| www激情久久| 超碰在线97免费| 我不卡影院28| 91香蕉视频在线下载| 女人黄色免费在线观看| 亚洲精品第一页| 亚洲 日本 欧美 中文幕| 国产拍欧美日韩视频二区| 亚洲黄色小视频在线观看| 91精品天堂福利在线观看 | 国产成人自拍一区| 欧美日韩一二三四五区| 综合 欧美 亚洲日本| 国产精品一区在线观看你懂的| 黄色一级片国产| 日本欧美三级| 国产精品一区久久久| 超碰porn在线| 国产视频在线观看一区二区| 国产情侣免费视频| 亚洲精品国久久99热| 亚洲最大的黄色网| 久久国产成人午夜av影院| 亚洲精品天堂成人片av在线播放| 久久久伦理片| 国产欧美va欧美va香蕉在线| 牛牛电影国产一区二区| 亚洲精品一区二区久| 国产美女自慰在线观看| 欧美视频专区一二在线观看| 国产在线观看免费视频软件| 成人av在线资源网站| 亚欧在线免费观看| 黄色日韩精品| 亚洲欧洲日韩综合二区| 久久人人爽人人爽人人片av不| 国产精品视频免费在线观看| 激情图片在线观看高清国产| 伊人伊成久久人综合网小说| 亚洲精品成人电影| 欧美日韩三级一区| 日本一级一片免费视频| 中文字幕字幕中文在线中不卡视频| 中文字幕在线视频播放| 久久福利资源站| 国产偷人视频免费| 国内精品久久久久久久97牛牛 | 红桃视频亚洲| 天堂精品一区二区三区| 精品国产一区二区三区不卡蜜臂| 国产精品视频色| 日韩伦理在线一区| 九九热视频这里只有精品| 草碰在线视频| 亚洲欧美精品一区| 农村少妇久久久久久久| 欧美疯狂性受xxxxx喷水图片| 麻豆成人免费视频| 午夜精品一区二区三区电影天堂| av最新在线观看| 久久久久99精品国产片| 精品人妻一区二区免费视频| 国产一区二区三区蝌蚪| 色综合天天色综合| 视频精品一区二区| 亚洲熟妇av一区二区三区漫画| 欧美aa国产视频| 在线成人性视频| 日韩精品不卡一区二区| 日韩资源av在线| 精品中文一区| 久久综合九色欧美狠狠| 久久资源综合| 国产精品一区二区在线观看 | 欧美喷潮久久久xxxxx| 亚洲成熟少妇视频在线观看| 欧美日韩国产精品一区二区三区四区| 欧美精品xxxxx| 亚洲精品福利视频网站| 一区二区成人免费视频| 综合自拍亚洲综合图不卡区| 午夜激情福利电影| 国产精品日日摸夜夜摸av| 丁香激情五月少妇| 中文字幕成人av| 黄色免费一级视频| 自拍av一区二区三区| 天堂网avav| 一区二区三区四区五区视频在线观看 | 久久综合久久色| 石原莉奈在线亚洲三区| 91精品无人成人www| 捆绑调教一区二区三区| 黄色小视频免费网站| 裸体在线国模精品偷拍| 中文字幕12页| 国产传媒欧美日韩成人| 无码人妻一区二区三区精品视频| 成人午夜av在线| 免费看黄色aaaaaa 片| 久久久久国产精品麻豆| 午夜国产福利视频| 亚洲美女在线国产| 日本三级理论片| 色综合天天综合网天天狠天天 | 日韩一区二区三区四区五区六区| www.香蕉视频| 日韩久久午夜影院| 色哟哟免费在线观看| 欧美精品一区三区| 正在播放日韩精品| 国产精品欧美一区二区三区奶水| 亚洲狼人在线| 国产视频一区二区不卡| 在线日韩网站| dy888午夜| 亚洲一区二区三区高清| 在线观看国产一级片| 国产很黄免费观看久久| 免费a在线观看播放| 中文字幕第一区综合| 久久久精品人妻一区二区三区四 | 97人人澡人人爽91综合色| 精品久久久久久一区二区里番| 国产在视频线精品视频www666| 手机看片日韩国产| 一区二区三区国产在线| 91女神在线观看| 成人午夜在线视频| 99在线视频免费| 亚洲国产精品久久不卡毛片| 欧美超碰在线观看| 欧美成人在线直播| 成人在线免费公开观看视频| 欧美国产中文字幕| 国产经典一区| 国产一区二区三区四区hd| 日韩在线第七页| 精品国产一区三区| 精品一区二区三区视频 | ...xxx性欧美| 激情视频网站在线观看| 日韩欧美电影一二三| 国产黄在线观看免费观看不卡| 欧美巨大黑人极品精男| 精品日韩视频| 国产一区二区三区色淫影院| 一本精品一区二区三区| 91av在线免费播放| 成人av在线播放网站| 在线观看黄网址| 欧美网站一区二区| 欧美黄色小说| 97精品免费视频| 亚洲1区在线观看| 日本成人性视频| 日韩av中文字幕一区二区三区| 怡红院一区二区| 亚洲精品videosex极品| 亚洲高清在线看| 国产婷婷色综合av蜜臀av| 男女在线观看视频| av一区二区三区免费| 9191国语精品高清在线| 久热精品在线播放| 久久久91精品国产一区二区三区| 激情五月色婷婷| 精品日韩在线一区| 日韩另类在线| 99re在线观看| 亚洲特色特黄| 国产ts在线观看| 亚洲激情网站免费观看| 国产巨乳在线观看| 欧美成人第一页| 不卡一区视频| 男女激烈动态图| 国产精品一区在线观看你懂的| 老司机成人免费视频| 欧美日韩免费观看一区三区| 国产成人天天5g影院在线观看| 国产精品h在线观看| 国产探花一区在线观看| 青青草av网站| 国产色一区二区| 中文字幕乱码在线观看| 日韩中文综合网| 国产一区二区三区国产精品| 艳母动漫在线免费观看| 国产在线视频一区二区三区| 午夜爽爽爽男女免费观看| 日韩欧美123| 91破解版在线观看| 精品国产中文字幕| 丝袜亚洲精品中文字幕一区| 日韩欧美视频免费观看| 欧美另类变人与禽xxxxx| 大地资源网3页在线观看| 91久久大香伊蕉在人线| 伊人久久综合| 国产一二三四五区| 欧美日韩精品欧美日韩精品一综合| 男人的天堂在线视频免费观看| 亚洲自拍欧美色图| 99精品国产福利在线观看免费| 少妇毛片一区二区三区| 欧美最新大片在线看| www在线免费观看视频| 国产精品青青草| 可以看av的网站久久看| 极品色av影院| 亚洲福利小视频| 日本一区二区电影| 男人日女人的bb| 久久影院视频免费| 国产精品主播一区二区| 久久久久久亚洲精品中文字幕| 免费欧美一区| 涩涩网站在线看| 精品久久中文字幕久久av| 国产二区在线播放| 国产精品加勒比| 热久久免费视频| 欧美性猛交xxxxx少妇| 国产视频精品va久久久久久| 久久婷婷五月综合色丁香| 国产av熟女一区二区三区| 久久久.com| 老司机午夜福利视频| 国产精品视频999| 亚洲美女91| 999精品在线视频| 亚洲欧美国产视频| 波多野结衣欧美|