精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最強大模型 Llama 3.1-405B 架構設計剖析 原創(chuàng)

發(fā)布于 2024-7-25 13:55
瀏覽
0收藏

1、最強大模型 Llama 3.1-405B 簡介

在歷經(jīng)了兩天的提前“泄露風波”后,Llama 3.1 終于正式揭開面紗,由官方對外公布。

新版 Llama 3.1 將其上下文處理能力擴展至 128K,推出了 8B、70B 及 405B 三個不同規(guī)模的版本,再次單槍匹馬地提升了大規(guī)模模型領域的競爭門檻。

對于 AI 大模型領域而言,Llama 3.1 405B 版本具有劃時代的意義,它刷新了開源基礎模型性能的極限。據(jù) Meta 官方透露,該大模型在眾多任務中的表現(xiàn)足以匹敵當前最優(yōu)的閉源模型。

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

Llama3.1 405B數(shù)據(jù)集評測結果

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

Llama3.1 405B人工評估


2、Llama 3.1-405B 架構設計剖析

Llama 3.1共開源了8B、70B、405B三種參數(shù)量的模型,其中 405B 除了FP16精度,還有FP8量化版模型,針對8B額外開源了經(jīng)過內(nèi)容安全分類微調的Llama-Guard-3-8B。

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

架構設計主要看點總結如下:

1. Llama3.1 405B 依然使用 decoder-only 結構的 transformer,沒有使用混合專家。

2. 上下文長度增加到 128K。

3. 在語言模型后訓練階段,405B 通過監(jiān)督微調和直接偏好優(yōu)化等,進一步提升了模型的性能和適應性。監(jiān)督微調使用大量的人工標注數(shù)據(jù)來微調模型,使其能夠更好地遵循人類的指令和偏好;直接偏好優(yōu)化則通過學習人類的偏好來優(yōu)化模型的輸出,使其更加符合人類的期望。

4. 對于小參數(shù)量模型,Meta 使用 405B 模型去提升小參數(shù)量模型的效果。

3、Llama 3.1 預訓練過程剖析

Llama 3.1 的預訓練過程分為三個關鍵階段:1、初始預訓練階段;2、長文本上下文預訓練;3、退火過程??傮w來看,這一流程與現(xiàn)有的一些開源模型訓練方法相似,但技術報告中透露了眾多精細的技術細節(jié)。以下是各階段的詳細描述:

初始預訓練階段:這一階段遵循標準的預訓練流程,訓練初期采用較小的批量大小以保障訓練穩(wěn)定性,隨后逐漸增大批量大小以提高訓練效率,直至達到每批 16M 個token。為了增強模型在多語言和數(shù)學推理方面的能力,特別增加了非英語內(nèi)容和數(shù)學數(shù)據(jù)的比重。

長文本上下文預訓練階段:在預訓練的后半程,使用長文本數(shù)據(jù)進行訓練,以支持高達 128K 個token的上下文窗口。在這一階段,采取了逐步擴展上下文窗口的策略,對于 Llama 3 405B 模型,從最初的 8K token 上下文窗口開始,逐步擴展,最終達到 128K token 的窗口大小。此階段消耗了大約 800B 個token的訓練數(shù)據(jù)。

退火過程:在預訓練的最后 4000 萬個token期間,采取了線性降低學習率至零的策略,同時保持 128K 個token的上下文長度。在這一退火階段,對數(shù)據(jù)混合比例進行了調整,增加了如數(shù)學、代碼、邏輯等高質量數(shù)據(jù)的影響。最終,通過取退火期間多個模型檢查點的平均值,形成了最終的預訓練模型。在訓練后期對高質量數(shù)據(jù)進行上采樣,這一做法在當前也是較為普遍的做法。

4、Llama 3.1 的 Post-Traning 剖析

當前,大型語言模型(LLM)的后訓練主要采用兩種策略,第一種是借鑒自ChatGPT的 SFT+RM+PPO 模式,該模式運用了強化學習,涉及眾多需要調整的超參數(shù),過程較為復雜,不易實現(xiàn);另一種策略是 SFT+DPO 模式,省略了PPO 強化學習部分,簡化了流程,更易于操作。

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

LLaMA 3.1 在后訓練階段主要采用了 SFT+DPO 模式,并加入了一些獨特的設計。上圖展示了 LLaMA 3.1 整個后訓練流程。起初,使用人工標注數(shù)據(jù)訓練RM 模型,以評估<Prompt, answer>數(shù)據(jù)的質量,隨后利用 RM 進行拒絕采樣。

具體來說,針對一個給定的人工 Prompt,模型生成多個回答,RM 對這些回答進行質量評分,選取評分最高的作為 SFT 數(shù)據(jù),其余則棄用。這樣篩選出的SFT 數(shù)據(jù),結合專門用于提升代碼、數(shù)學、邏輯能力的 SFT 數(shù)據(jù),共同用于微調模型,得到 SFT 模型。

接著,利用人工標注數(shù)據(jù)通過 DPO 模型調整LLM參數(shù),DPO 實質上是一個二分類任務,它從<Prompt,Good Answer,Bad Answer>的三元數(shù)據(jù)中學習,調整模型參數(shù)以促使模型輸出 Good Answer,避免輸出 Bad Answer。這樣就完成了一個后訓練迭代周期。上述過程會多次重復,每次流程相同,不同之處在于,在下一輪拒絕采樣階段生成回答的 LLM 模型,將選擇上一輪流程中產(chǎn)生的若干不同 DPO 模型(具有不同超參數(shù)等)中表現(xiàn)最佳的一個。顯然,隨著迭代的進行,DPO 模型性能不斷提升,因此拒絕采樣中選出的最佳答案質量也逐步提高,進而使得 SFT 模型更加優(yōu)秀,形成了一個正向反饋循環(huán)。可以看出,盡管 RLHF 和 DPO 兩種模式都運用了 RM,但應用場景不同,RLHF 將 RM 評分用于 PPO 強化學習階段,而 LLaMA 3.1 則利用 RM 篩選高質量的 SFT 數(shù)據(jù)。并且,由于拒絕采樣的回答是由 LLM 生成的,這意味著在此過程中大量使用了合成數(shù)據(jù)來訓練 SFT 模型。

5、LLama 3.1 405B 為何不用 MOE 架構?

大模型的 MOE 結構是否能夠提升模型性能?答案并非必然。

早在 ChatGPT 流行之前,研究就已經(jīng)得出結論,從模型性能影響的角度來看,MOE 結構相較于密集型(Dense)模型并不會帶來額外的優(yōu)勢,有時甚至可能存在劣勢。

MOE 架構的主要優(yōu)點在于降低訓練和推理的成本,但這需要以訓練穩(wěn)定性降低和推理時需要更多內(nèi)存來存儲增加的參數(shù)為代價。在用戶數(shù)量龐大、請求頻繁的情況下,推理成本占據(jù)的比重更大,此時 MOE 結構在推理方面更為友好,這也是為什么模型規(guī)模達到一定程度后,其結構會從 Dense 轉向 MOE 的主要原因——這一轉變更多是基于成本和效率的考量,而非性能。

我曾見過一些聲稱MOE結構性能更優(yōu)的說法,但這些觀點缺乏實證支持。Llama 3.1 405B 未采用 MOE 結構,技術報告指出,這是由于考慮到密集型模型在訓練上更為穩(wěn)定,因此選擇了 Dense 結構。與 GPT 4 的 1.8T MOE 模型相比,405B 的 Dense 模型在性能上不相上下,甚至可能更勝一籌(當然,也不排除 GPT 4 可能已經(jīng)是一個經(jīng)過蒸餾的較小模型)。


本文轉載自公眾號玄姐聊AGI  作者:玄姐

原文鏈接:??https://mp.weixin.qq.com/s/rBTL-bePocCctKA8LgYTnw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
欧美一二三四区在线| 国产精品入口麻豆九色| 久久久中文字幕| 内射中出日韩无国产剧情| 中文字幕成在线观看| 久久久久久久免费视频了| 国产精品日韩欧美| 久久久夜色精品| 妖精一区二区三区精品视频 | 亚洲欧洲一区二区| 精品人妻av一区二区三区| 国产亚洲午夜| 中文字幕欧美日韩| 最新国产精品自拍| 欧美自拍电影| 一区二区三区蜜桃网| 欧美精品欧美精品| 国产婷婷一区二区三区久久| 午夜在线a亚洲v天堂网2018| 日日摸夜夜添一区| 免费不卡的av| 91精品在线免费视频| 成人免费在线网址| 日韩精品久久一区| 亚洲AV无码乱码国产精品牛牛| 99亚洲视频| 久久精品国产一区二区电影| 日本黄色网址大全| 88久久精品| 欧美精品日韩一区| 欧美牲交a欧美牲交aⅴ免费下载| 污污的视频在线观看| 欧美激情在线看| 精品一区二区三区视频日产| 国产三级视频在线播放| 日韩中文字幕亚洲一区二区va在线 | 久久免费午夜影院| 成人在线视频电影| 国产精品热久久| 日韩高清在线一区| 69久久夜色精品国产69乱青草| 希岛爱理中文字幕| 久久中文视频| 国产一区二区欧美日韩| 538国产视频| 国产极品模特精品一二| 在线91免费看| 在线观看免费污视频| 欧美成人h版| 欧美性xxxxxxxxx| 久久久性生活视频| 黑人精品视频| 亚洲午夜私人影院| 欧美中文字幕在线观看视频| а√中文在线8| 综合色天天鬼久久鬼色| 亚洲精品一区二区三| 国产www.大片在线| 国产性色一区二区| 日韩性感在线| 国产高清免费在线播放| 国产亚洲一区二区三区在线观看| 久久青青草综合| 日韩av地址| 久久久久久久综合色一本| 免费精品视频一区| 国产人成在线视频| 欧美国产1区2区| 亚洲一二区在线| 欧美性猛交xxx乱大交3蜜桃| 中文字幕在线一区免费| 裸体大乳女做爰69| av中文字幕在线观看| 亚洲一区二区三区四区不卡| 老子影院午夜伦不卡大全| ririsao久久精品一区| 婷婷国产在线综合| 激情综合在线观看| 日本在线精品| 91精品国产综合久久久蜜臀图片| 青娱乐国产精品视频| 风间由美性色一区二区三区四区 | 日本美女视频网站| 欧美福利在线播放网址导航| 亚洲欧美日韩天堂| 潮喷失禁大喷水aⅴ无码| 91精品国产乱码久久久久久 | 亚洲国产毛片完整版| 添女人荫蒂视频| 成人av动漫在线观看| 久久精品亚洲精品| 天天操天天射天天爽| 亚洲女人av| 国产精品高潮呻吟久久av野狼| 91丨九色丨海角社区| 极品少妇xxxx偷拍精品少妇| ts人妖另类在线| 熟妇人妻中文av无码| 国产欧美一区二区精品仙草咪 | aaaaa一级片| 日韩电影免费在线观看| 超在线视频97| 欧美国产成人精品一区二区三区| 视频在线观看国产精品| 99精彩视频| 国产日本在线| 香蕉av福利精品导航| 性生活免费在线观看| 日韩免费一级| 国产亚洲欧美日韩美女| 免费无码毛片一区二区app| 亚洲免费网址| 国产aⅴ精品一区二区三区黄| 巨骚激情综合| 一片黄亚洲嫩模| 99草草国产熟女视频在线| 精品91福利视频| 亚洲午夜精品视频| 国产主播在线观看| 久久se精品一区二区| 麻豆久久久av免费| 欧美videosex性欧美黑吊| 欧美最猛黑人xxxxx猛交| 挪威xxxx性hd极品| 五月婷婷六月综合| 国产不卡在线观看| 日本高清视频在线| 一区二区三区中文在线观看| 91小视频网站| 嫩草影视亚洲| 午夜伦理精品一区| www.色播.com| 中文字幕人成不卡一区| 不要播放器的av网站| 菁菁伊人国产精品| 欧美高清性猛交| 国产又黄又爽视频| 中文字幕精品一区二区精品绿巨人 | 日本a级在线| 欧美午夜电影一区| 国产精品密蕾丝袜| 久久精品一本| 欧美 日韩 国产在线| 日韩精品极品| 日韩精品www| 天海翼一区二区| 成人永久看片免费视频天堂| 免费看黄色a级片| 精品中文字幕一区二区三区| 久久精品小视频| 国产免费黄色录像| 亚洲欧美偷拍卡通变态| 在线观看免费av网址| 日韩激情图片| 成人免费午夜电影| 超鹏97在线| 日韩欧美不卡在线观看视频| 欧美激情一区二区视频| 国产精品一区一区三区| 超碰97在线看| 国产一区二区三区亚洲综合| 欧美成人剧情片在线观看| 国产av无码专区亚洲av麻豆| 亚洲综合在线五月| 91精品又粗又猛又爽| 亚洲高清毛片| 欧美日韩国产综合视频在线| 九色成人搞黄网站| 中文字幕欧美视频在线| 国产又大又黄又爽| 亚洲在线视频一区| 人妻少妇精品视频一区二区三区| 亚洲一区图片| 日韩高清国产精品| av国产精品| 久久久亚洲国产天美传媒修理工| 少妇高潮一区二区三区69| 日韩欧美aaa| 我想看黄色大片| 韩国成人在线视频| 国产无限制自拍| 午夜欧洲一区| 国产精选久久久久久| 18av在线播放| 亚洲美女性视频| 一区二区久久精品66国产精品| 亚洲男人的天堂av| 中国av免费看| 美腿丝袜亚洲综合| 国产精品久久久久久久乖乖| 欧美激情在线精品一区二区三区| 国产精品一区=区| 女囚岛在线观看| 国产亚洲美女久久| 亚洲第一成人av| 色菇凉天天综合网| 天天天天天天天天操| 91在线视频18| 久久6免费视频| 国产精品亚洲产品| 亚洲第一精品区| 日韩大胆成人| 91在线国产电影| 日韩电影av| 久久99亚洲精品| chinese偷拍一区二区三区| 日韩你懂的在线播放| 免费精品一区二区| 一区二区免费视频| 黄免费在线观看| 成人avav在线| 亚洲五月激情网| 久久精品网址| 国产aaa免费视频| 99久久亚洲精品蜜臀| 乱一区二区三区在线播放| 国产一区二区三区精品在线观看| 欧美一区亚洲一区| 日本欧美电影在线观看| 综合国产在线观看| 天堂中文在线资| 欧美mv日韩mv国产网站| 伊人免费在线观看| 色8久久人人97超碰香蕉987| 久久久久性色av无码一区二区| 国产精品欧美精品| 国产精品无码久久久久久| 国产成人啪免费观看软件 | 成人国产激情在线| 2019中文字幕免费视频| 欧美性受ⅹ╳╳╳黑人a性爽| 色天天综合狠狠色| 爱久久·www| 亚洲欧美国产精品久久久久久久| 亚洲免费不卡视频| 91麻豆精品国产91久久久久久久久| 欧美黄色一级大片| 精品国产老师黑色丝袜高跟鞋| 激情五月婷婷小说| 亚洲伦理在线精品| 暗呦丨小u女国产精品| 国产精品乱人伦| 亚洲成人黄色av| 久久美女艺术照精彩视频福利播放| 国产伦精品一区三区精东| 懂色av一区二区夜夜嗨| 香蕉视频xxxx| 国产在线视频一区二区三区| www.cao超碰| 久久超碰97中文字幕| 亚洲午夜精品一区| 精品系列免费在线观看| 中文字幕资源在线观看| 国产另类ts人妖一区二区| 性生活一级大片| 国产成人免费视频网站高清观看视频| 久久综合在线观看| 国产精品一区二区视频| 国产又粗又猛又爽又黄| 国产99久久久国产精品| 91人人澡人人爽| www.欧美日韩| 99久久久无码国产精品性| 欧美国产欧美综合| 黄色香蕉视频在线观看| 亚洲最新视频在线观看| 九九热国产视频| 色婷婷一区二区三区四区| 91丨九色丨海角社区| 欧美高清视频不卡网| 亚洲精品一区二区三区四区| 日韩av中文字幕在线免费观看| 免费成人av电影| 日韩亚洲欧美成人| 天使と恶魔の榨精在线播放| 91国内在线视频| www.久久.com| 99久久国产免费免费| 亚洲精华一区二区三区| 亚洲乱码一区二区三区三上悠亚 | 久久在线免费视频| 国精一区二区三区| 日韩av电影免费观看高清| 99只有精品| 国产精品大全| 欧美人妖在线| 五月天在线免费视频| 最新成人av网站| 亚洲成人av免费看| 国产精品538一区二区在线| 北岛玲一区二区| 成人欧美一区二区三区1314| 国产精品第九页| 欧美日韩一区视频| 日本美女一级视频| 日韩一区二区欧美| 国产在线观看www| 国产精品网站大全| 一区二区中文字幕在线观看| 91影院未满十八岁禁止入内| 久久精品福利| 亚洲成人网上| 激情欧美丁香| 99久久国产宗和精品1上映 | 精品伦一区二区三区| 91丨porny丨在线| 人妻久久一区二区| 欧美日韩中文字幕在线| 亚洲欧美日韩一区二区三区四区| 亚洲福利视频在线| 成人免费在线电影| 7m第一福利500精品视频| jvid一区二区三区| 国产美女精品久久久| 外国成人免费视频| 日本一本二本在线观看| 国产一区不卡视频| 韩国三级hd中文字幕| 一区二区三区在线视频播放| 欧美性受xxx黑人xyx性爽| 欧美变态口味重另类| 国产毛片在线| 5278欧美一区二区三区| 日韩高清在线观看一区二区| 欧美亚洲丝袜| 一本色道久久综合一区| 欧美在线a视频| www.亚洲色图| 欧美日韩国产精品综合| 欧美少妇一区二区| 成年人视频在线看| 91福利视频在线观看| 成人av集中营| 日韩不卡av| 亚洲美女少妇无套啪啪呻吟| 在线观看一区二区三区视频| 中文字幕av一区二区三区高| 免费毛片一区二区三区| 日韩视频中午一区| 日韩欧美小视频| 91精品国产色综合| 日韩电影不卡一区| 欧美日韩不卡在线视频| 成人性生交大片免费看中文| 黄视频网站免费看| 日韩欧中文字幕| 久草视频视频在线播放| 8050国产精品久久久久久| 久久九九热re6这里有精品| 久久视频免费在线| 久久国产三级精品| 精品国产大片大片大片| 欧美中文字幕一区| yw193.com尤物在线| 日产精品久久久一区二区福利| 日韩欧美国产大片| 韩国日本在线视频| 91色视频在线| 无码任你躁久久久久久久| 亚洲女人天堂色在线7777| 五月天国产在线| 日本电影一区二区三区| 久久久人人人| 欧美福利第一页| 欧美性生活大片视频| 9色在线视频| 2019国产精品视频| 欧美天天视频| 久久人人妻人人人人妻性色av| 精品久久久久久久大神国产| 日本高清视频www| 欧美有码在线视频| 香蕉国产成人午夜av影院| 成人3d动漫一区二区三区| 久久久91精品国产一区二区三区| 中文字幕777| 色偷偷综合社区| 亚洲精品观看| 美女日批免费视频| 久久久久久综合| 国产精品欧美综合亚洲| 欧美激情精品久久久久久变态| 秋霞影视一区二区三区| www.四虎成人| 亚洲免费av网站| 国模无码一区二区三区| 久久久亚洲欧洲日产国码aⅴ| 少妇精品久久久一区二区| 免费涩涩18网站入口| 亚洲午夜久久久久久久久电影院| 亚洲色图 校园春色| 国产日韩视频在线观看| 国产在线日韩| 免费观看av网站| 91精品国产欧美一区二区| heyzo在线播放| 亚洲精品乱码视频| 国产成人午夜片在线观看高清观看| 影音先锋在线国产| xxxxxxxxx欧美|