精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最好7B模型再易主!打敗700億LLaMA2,蘋果電腦就能跑

人工智能 新聞
H4團隊推出二代Zephyr-7B-beta。他們補充道,探索了從GPT-4、Claude 2中提取對齊性,然后將其注入小模型中的想法,開發出了將蒸餾直接偏好優化(dDPO)用于小模型的方法。

花500刀“調教”的70億參數模型,打敗700億參數的Llama 2!

且筆記本就能輕松跑,效果媲美ChatGPT。

重點:免費、不要錢。

HuggingFace H4團隊打造的開源模型Zephyr-7B,鯊瘋了。

圖片

其底層模型是前段時間爆火、由有著“歐洲OpenAI”之稱的Mistral AI打造的開源大模型Mistral-7B。

圖片

要知道,Mistral-7B發布不到2周,各種微調版本相繼現世,大有Llama剛發布時迅速出現各種“羊駝”之風。

而Zephyr能夠在各變種中脫穎而出,關鍵是團隊在Mistral的基礎上,使用直接偏好優化(DPO)在公開數據集上微調了模型。

團隊還發現,刪除數據集的內置對齊,可以進一步提高MT Bench性能。初代Zephyr-7B-alpha的MT-Bench平均得分7.09 ,超越Llama2-70B-Chat。

圖片
△MT-Bench是評估模型處理多輪對話能力的基準測試,問題集涵蓋寫作、角色扮演、提取等8個類別。

關鍵是,它接著又升級了!

H4團隊推出二代Zephyr-7B-beta。他們補充道,探索了從GPT-4、Claude 2中提取對齊性,然后將其注入小模型中的想法,開發出了將蒸餾直接偏好優化(dDPO)用于小模型的方法。

二代Zephyr,MT-Bench平均得分升高至7.34。

圖片

在AlpacaEval上,Zephyr勝率為90.6%,優于ChatGPT(3.5):

圖片

趕來的網友們對Zephyr給予了一致好評,lmsys團隊還亮出了Zephyr-7b-beta的Elo評分,目前已飆升得很高??:

內部的Arena排行榜上已超過13B模型。

圖片

甚至有人表示:

在實際應用中看到DPO方法表現很好,可能是今年大語言模型發展中最令人興奮的事情。

圖片

更多網友紛紛上手測試Zephyr效果,結果都出奇的好。

Mistral這個單詞在法語里代表一種干燥、寒冷且強勁的風,而Zephyr意思則是溫和、宜人的西風。

Llama那邊是動物園,這邊是氣象局無疑了。

最好的7B模型再易主

先來說運行Zephyr對電腦配置的要求。網友實測后表示“泰褲辣”!,筆記本(Apple M1 Pro)就夠用,“結果非常好”。

圖片

效果方面,Llama Index(此前名為GPT Index)團隊也進行了測試。

圖片

結果發現,Zephyr是目前唯一一個在高級RAG/agentic任務上表現良好的開源7B模型。

數據也顯示,Zephyr高級RAG任務效果可以和GPT-3.5、Claude 2相抗衡。

他們還繼續補充道,Zephyr不僅在RAG上效果突出,而且在路由、查詢規劃、檢索復雜SQL語句、結構化數據提取方面也表現良好。

圖片

官方也給出了測試結果,在MT-Bench上,Zephyr-7B-beta與Llama2-Chat-70B等較大的模型相比具有強大的性能。

圖片

但在編碼和數學等更復雜的任務上,Zephyr-7B-beta落后于專有模型,需要更多的研究來縮小差距。

舍棄強化學習

大家都在紛紛測試Zephyr的效果,開發人員卻表示,最有趣的不是各項指標,而是模型的訓練方式。

亮點總結如下:

  • 微調最好的小型開源預訓練模型:Mistral 7B
  • 大規模偏好數據集的用法:UltraFeedback
  • 不用強化學習,使用直接偏好優化(DPO)
  • 意料之外的是,偏好數據集的過擬合會產生更好的效果

展開來說,正如開頭所提到的,Zephyr的效果之所以能夠超越70B的Llama 2,主要是因為使用了特殊的微調方法。

與傳統的PPO強化學習方法不同,研究團隊使用了斯坦福大學和CZ Biohub不久前合作提出DPO方法。

圖片

研究人員表示:

DPO要比PPO穩定得多。

DPO簡單來講可以這樣解釋:

要想使模型的輸出更加符合人類偏好,一直以來傳統方法是用一個獎勵模型來微調目標模型。輸出得好給獎勵,輸出不好不給獎勵。

而DPO的方法繞過了建模獎勵函數,相當于直接在偏好數據上優化模型。

總的來說,DPO解決了人類反饋的強化學習訓練難、訓練成本高的問題。

具體到Zephyr的訓練上,研究團隊最初是在UltraChat數據集精簡后的變種上對Zephyr-7B-alpha進行了微調,這個數據集包含了ChatGPT生成的160萬個對話(精簡后剩下約20萬個)。

(之所以要精簡過濾,是因為團隊發現Zephyr有時大小寫寫不對,比如“Hi. how are you?”;有時會以“I don’t have personal X”為開頭進行回應。)

之后,他們又通過TRL的DPO Trainer方法,用公開的openbmb/UltraFeedback數據集進一步對齊了該模型。

數據集中包含了64000個來自各種模型的提示-響應對。每個響應都由GPT-4根據有用性等標準進行排名,并賦予一個得分,從中推出AI偏好。

一個有趣的發現是,在用DPO的方法時,隨著訓練時間增加,過擬合后,效果居然更好了。研究人員認為這類似于SFT中的過擬合。

圖片

值得一提的是,研究團隊還介紹,用這種方法微調模型,成本只需500美元,也就是在16個A100上跑8小時。

圖片

在升級Zephyr為beta版本時,團隊又繼續解釋了他們的方法。

他們思考了大模型所用的蒸餾監督微調(dSFT),但用這種方法模型是不對齊的,不能很好地生成符合用戶意圖的輸出。

圖片

所以團隊嘗試使用來自AI反饋(AI Feedback,AIF)的偏好數據,用一個“教師模型”對輸出進行排名,形成一個數據集,然后應用蒸餾直接偏好優化(dDPO)來訓練一個與用戶意圖對齊的模型,且在微調期間不需要任何額外的抽樣。

研究人員還測試了不用SFT時的效果,結果性能大大降低,說明dSFT步驟至關重要。

圖片

目前模型除了已開源可商用,還有Demo可試玩,我們這就上手簡單體驗了一把。

Demo試玩體驗

首先就不得不搬出“弱智吧”問題來考一考了。

在“爸媽結婚不帶我”這個問題上,Zephyr總體回答較為準確。

圖片

ChatGPT在這道題目上,屬實打不過。

圖片

在測試中我們還發現Zephyr對OpenAI發布GPT-4等近期的事也知道:

圖片

這其實與其底層模型有關,Mistral官方雖然沒有具體說明訓練數據截止日期。

但之前就有網友測試過,今年三月份的事它也知道。

圖片

相比之下Llama 2的預訓練數據截止到2022年9月,只有部分微調數據最多到2023年6月。

此外,Zephyr的響應速度也非常快,寫代碼、編故事都不在話下。:

圖片

值得一提的是,Zephyr更擅長用英文回答問題,也會出現“幻覺”這一模型通病。

研究人員也有提到幻覺問題,輸入框的下方也標有一行小字,指明該模型生成的內容可能不準確或錯誤。

圖片

關鍵是因為Zephyr沒有用到人類反饋強化學習這樣的方法與人類偏好對齊,也沒有采用ChatGPT的回應過濾方式。

emmm魚和熊掌總要選一個。

Zephyr只有70B參數就能做到這樣的效果,讓《100頁的機器學習書》作者Andriy Burkov也很吃驚,甚至表示:

Zephyr-7B戰勝Llama 2-70B,用的基礎模型是上下文窗口為8k token的Mistral-7B,理論上它的注意力范圍可高達128K tokens。

如果Zephyr是一個70B模型會怎樣呢?它會勝過GPT-4嗎?看起來很可能。

圖片

如果你對Zephyr-7B感興趣,可在huggingface試玩。

https://huggingface.co/spaces/HuggingFaceH4/zephyr-chat

論文鏈接:https://arxiv.org/abs/2310.16944

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-09-04 12:58:05

2023-09-04 19:09:00

訓練模型數據

2023-10-13 19:58:33

Mistral7B模型

2024-02-22 10:09:00

開源模型

2023-10-09 12:36:58

2025-05-22 13:43:40

DeepSeek模型編程

2023-10-04 07:59:41

大型語言模型人工智能

2023-07-19 15:01:14

GPT-4LaMA2參數

2023-12-13 12:55:39

模型數據

2023-12-07 11:46:00

蘋果芯片開源

2023-08-21 10:36:23

2025-03-11 13:07:58

2024-03-25 08:00:00

2024-06-03 10:43:34

2024-09-13 09:14:32

2024-10-25 10:57:11

2024-07-22 09:00:00

2024-04-19 07:55:57

Llama 3模型人工智能開源
點贊
收藏

51CTO技術棧公眾號

99久久99久久精品国产| 欧美日韩精品区别| 涩爱av在线播放一区二区| 久久国产免费| 久久成人精品一区二区三区| 天堂www中文在线资源| 日韩国产激情| 亚洲免费毛片网站| 欧美性bbwbbwbbwhd| 国产精品一区二区三区在线免费观看| 亚洲高清在线| 色黄久久久久久| 中文字幕一区二区久久人妻网站 | 美女毛片在线看| 精品午夜久久福利影院| 欧美亚洲日本黄色| 午夜激情福利网| 红桃视频在线观看一区二区| 日韩久久免费av| 午夜精品在线免费观看| 超碰在线最新网址| 中文字幕在线观看不卡视频| 久久久久久久久一区二区| 国产美女裸体无遮挡免费视频| 国产日韩一区| 美日韩在线视频| 亚洲AV无码成人精品区明星换面| av成人资源网| 91麻豆精品国产91久久久久久久久 | 韩国成人在线视频| 国产精品白丝jk喷水视频一区 | 亚洲高潮女人毛茸茸| 精品国产影院| 日韩欧美一二区| 国产欧美一区二| 日韩在线电影| 91福利视频网站| 国产偷人视频免费| 午夜av不卡| 香蕉加勒比综合久久| 日本男女交配视频| 在线欧美三级| 亚洲色图欧美激情| 在线观看欧美激情| 91啦中文在线| 国产精品第五页| 亚洲国产精品www| freemovies性欧美| 日本一区二区在线不卡| 欧洲在线视频一区| 精品99又大又爽又硬少妇毛片| 成人网男人的天堂| 国产精品yjizz| 亚洲精品无码专区| 成人免费毛片高清视频| 国产精品10p综合二区| 高潮毛片7777777毛片| 国产激情视频一区二区在线观看 | 国产精品美女午夜av| 亚洲大尺度在线观看| 三级在线观看一区二区| 国产成人精品免高潮在线观看| 亚洲GV成人无码久久精品| 欧美在线综合| 国产精品成熟老女人| 久草视频在线免费| 久久99精品国产麻豆婷婷洗澡| 国产日本欧美一区二区三区在线 | 国产毛片精品视频| www国产亚洲精品| 熟妇人妻中文av无码| 26uuu亚洲| 亚洲高清123| 麻豆视频在线播放| 又紧又大又爽精品一区二区| 青草网在线观看| 日韩av影片| 欧美丝袜自拍制服另类| 久久精品一卡二卡| 成人av综合网| 国产一区二区三区直播精品电影| 黄色av片三级三级三级免费看| 91精品动漫在线观看| 久久久免费观看视频| 国产a∨精品一区二区三区仙踪林| 香蕉久久国产| 91精品在线国产| 少妇一级淫片免费看| 久久综合色之久久综合| 亚洲一区高清| 福利小视频在线| 欧洲av一区二区嗯嗯嗯啊| 91av免费观看| 欧美精品系列| 久久99热这里只有精品国产| 日韩精品久久久久久免费| 国产麻豆视频精品| 久久婷婷开心| 91网址在线观看| 日韩欧美在线观看| 69久久精品无码一区二区| 亚洲素人在线| 欧美人成在线视频| 免费一级a毛片| 成人少妇影院yyyy| 一本一道久久a久久精品综合 | 亚洲91中文字幕无线码三区| 国产91|九色| 国产人妖在线播放| 欧美国产国产综合| 男人用嘴添女人下身免费视频| 欧美黄页在线免费观看| 精品五月天久久| 久久网一区二区| 久久成人麻豆午夜电影| 欧美在线视频一区二区三区| 欧美理论电影| 欧美精品乱码久久久久久| theav精尽人亡av| 亚洲一级影院| 97netav| 日本美女在线中文版| 欧美网站在线观看| 中文字幕在线播放一区| 影音先锋日韩精品| 国产日韩精品在线| 成年人在线观看| 色吊一区二区三区 | 国产精品欧美经典| 99热成人精品热久久66| 噜噜噜天天躁狠狠躁夜夜精品| 久久综合伊人77777| 一区二区日韩在线观看| 国产欧美日韩综合| 毛片一区二区三区四区| 秋霞蜜臀av久久电影网免费| 久久久久久12| 亚洲不卡免费视频| 一区二区三区不卡视频在线观看| 91亚洲精品久久久蜜桃借种| 欧美在线电影| 国产精品美女无圣光视频| 国产粉嫩一区二区三区在线观看 | av手机免费看| 亚洲嫩草精品久久| 国内精品国产三级国产aⅴ久| 欧美aaaaaaaaaaaa| 国产一区视频在线播放| 免费高清在线观看| 69久久99精品久久久久婷婷| 登山的目的在线| 韩国毛片一区二区三区| 九九久久九九久久| 6080亚洲理论片在线观看| 九九热在线精品视频| 精品黑人一区二区三区在线观看| 亚洲精品乱码久久久久久| 久久久精品人妻一区二区三区| 好看的av在线不卡观看| 久久99久久99精品蜜柚传媒| 校园春色亚洲| 在线观看久久久久久| 91极品身材尤物theporn| 一区二区三区中文在线| 人妻巨大乳一二三区| 精品动漫3d一区二区三区免费版| 精品国产一区二区三区四区vr| 亚洲v.com| 中文字幕视频在线免费欧美日韩综合在线看 | 久久综合一区| 成人综合网站| 成年无码av片在线| 日本美女一级片| 色视频一区二区| 久久噜噜色综合一区二区| 国产乱码精品一区二区三区忘忧草| 久久久天堂国产精品| 女同另类激情重口| 国产成人免费av电影| 日本免费中文字幕在线| 日韩欧美国产1| 99久久久无码国产精品免费蜜柚 | 国产一区二区看久久| 韩日视频在线观看| 精品久久精品| 成人av电影免费| 久久青青视频| 欧美刺激性大交免费视频| 性xxxx18| 91精品国产免费久久综合| 亚洲国产综合久久| 中文一区在线播放| 亚洲精品在线视频免费观看| 蜜桃一区二区三区在线| 精品视频在线观看一区二区| 国产欧美高清视频在线| 波多野结衣精品久久| 婷婷激情一区| 国产69精品99久久久久久宅男| 国产资源在线播放| 精品欧美乱码久久久久久| 亚洲av人无码激艳猛片服务器| 一区二区三区中文在线观看| 亚洲AV无码成人精品区明星换面| 国产成人精品免费看| 超碰在线97免费| 亚洲精品极品| av 日韩 人妻 黑人 综合 无码| 国产精品嫩草影院在线看| 波多野结衣一区二区三区在线观看 | 久久久pmvav| 精品久久人人做人人爰| 91精品国产乱码久久久久| 日本精品一级二级| 日韩美女视频网站| 亚洲人成亚洲人成在线观看图片 | 洋洋成人永久网站入口| 在线观看天堂av| 久久精品欧美一区二区三区麻豆| 稀缺呦国内精品呦| 国产精品一区二区在线观看不卡 | 福利一区二区在线| 亚洲综合婷婷久久| 视频在线观看一区| 波多野结衣乳巨码无在线| 欧美日一区二区在线观看 | 日本一区二区三区www| 国产精品毛片视频| 99久久精品无码一区二区毛片 | 精品一区二区免费| 天天影视综合色| 天堂久久久久va久久久久| 9久久9毛片又大又硬又粗| 狠狠入ady亚洲精品| avove在线观看| 亚洲精品二区三区| 亚洲视频在线观看日本a| 欧美日韩黑人| 视频在线精品一区| 日韩精品一区二区久久| 图片区小说区区亚洲五月| 奇米色欧美一区二区三区| 免费在线国产精品| 在线一级成人| 欧美一区二区三区精美影视| 免费一区二区三区视频导航| 免费99视频| 精品国产1区| 亚洲精品国产一区| 欧美亚洲激情| 在线视频欧美一区| 99久久亚洲精品蜜臀| 一区精品在线| 亚洲欧美色图| 国产成人亚洲综合无码| 亚洲高清不卡| 欧美日韩国产精品激情在线播放| 亚洲欧美日本国产专区一区| 已婚少妇美妙人妻系列| 老司机免费视频一区二区| 日韩欧美亚洲另类| 国产高清视频一区| 日韩精品人妻中文字幕有码| 91免费在线播放| 成人黄色a级片| 亚洲色欲色欲www| 欧美日韩国产精品一区二区三区| 亚洲一区二区偷拍精品| 天堂网av手机版| 欧美调教femdomvk| 国产白浆在线观看| 亚洲福利影片在线| 国产精品秘入口| 美日韩精品视频免费看| 国产剧情av在线播放| 国产精品99导航| 日韩最新av| 精品国产电影| 手机在线电影一区| 无码熟妇人妻av在线电影| 亚洲欧美高清| 中文字幕在线视频一区二区| 北岛玲一区二区三区四区| 亚洲av综合一区二区| 亚洲同性同志一二三专区| 久久狠狠高潮亚洲精品| 欧美天堂亚洲电影院在线播放| 国产99久久九九精品无码免费| 亚洲成人精品视频| av在线天堂播放| 隔壁老王国产在线精品| 日韩免费大片| 精品欧美一区二区在线观看视频 | 国产精品呻吟久久| 日韩久久免费视频| 在线中文字幕电影| 国产精品久久9| 中文无码日韩欧| 亚洲国产精品久久久久婷婷老年| 伊人成人在线| 亚洲第一区第二区第三区| 久久夜色精品一区| 免费看一级一片| 欧美日韩国产精选| 嫩草在线播放| 久久久久久国产精品| 外国成人毛片| 免费精品视频一区二区三区| 欧美三区在线| 日韩av在线中文| 久久久久久久久一| 五月天婷婷网站| 777欧美精品| 成年人视频网站在线| 日本国产欧美一区二区三区| 亚洲一区电影| 欧美日韩一级在线| 麻豆成人综合网| jizz中文字幕| 日韩欧美国产网站| 欧美 日韩 国产 在线| 久久久国产一区二区| 青青热久免费精品视频在线18| 精品久久久久久乱码天堂| 欧美福利在线| 最新免费av网址| 国产精品人成在线观看免费| 亚洲中文一区二区| 亚洲裸体xxxx| 亚洲一区资源| 免费在线观看91| 欧美资源在线| 精品无码在线视频| 午夜精品久久久久久| 黄色av免费观看| 海角国产乱辈乱精品视频| 日本少妇精品亚洲第一区| 艳母动漫在线观看| 国产麻豆午夜三级精品| 性色av无码久久一区二区三区| 欧美酷刑日本凌虐凌虐| 成人动漫在线免费观看| 国产精品久久久久久久电影| 精品国产不卡| 我要看一级黄色大片| 欧美激情一区二区三区四区| 中文字幕有码无码人妻av蜜桃| 在线视频国产日韩| 91九色综合| 国产高清精品软男同| 狠狠色狠狠色综合| 丰满少妇高潮久久三区| 精品精品国产高清a毛片牛牛 | 欧美午夜性色大片在线观看| 亚洲欧洲国产综合| 日本亚洲精品在线观看| 成人直播大秀| 波多野结衣国产精品| 一区二区三区在线视频免费 | 国产精品亚洲四区在线观看| 先锋影音男人资源| 成人综合激情网| 国产精品7777777| 一区二区欧美日韩视频| 色综合视频一区二区三区日韩| 精品一区二区成人免费视频| 国产激情一区二区三区| 日本在线播放视频| 亚洲三级av在线| 香蕉久久一区| 欧美视频在线观看视频| 国产午夜精品久久久久久免费视| 亚洲图片欧美在线| 操日韩av在线电影| 天海翼亚洲一区二区三区| 亚洲黄色av网址| 亚洲国产日韩一区二区| 国内av一区二区三区| 2019国产精品视频| 免费在线亚洲欧美| 黄色精品视频在线观看| 日韩精品免费一线在线观看| yiren22亚洲综合| 日韩黄色片在线| 国产日韩亚洲欧美综合| 亚洲av无码乱码国产精品| 日韩免费中文字幕| 中文字幕一区二区三区欧美日韩| 亚洲色图14p| 在线播放中文一区| 无遮挡爽大片在线观看视频 | youjizz亚洲女人| 精品久久久久av影院| 国产亚洲人成a在线v网站| 日韩中文字幕在线免费观看| 宅男噜噜99国产精品观看免费| 国产黄色小视频在线| 欧美一区二区影院| 在线电影一区二区| 中文幕无线码中文字蜜桃|