精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Llama 4訓(xùn)練已開啟!Meta科學(xué)家最新采訪,揭秘Llama 3.1是如何煉成的

人工智能 新聞
最近,Latent Space發(fā)布的播客節(jié)目中請(qǐng)來了Meta的AI科學(xué)家Thomas Scialom。他在節(jié)目中揭秘了Llama 3.1的一些研發(fā)思路,并透露了后續(xù)Llama 4的更新方向。

剛剛發(fā)布的開源「巨無霸」Llama 3.1雖然自帶論文,但依舊激起了廣大網(wǎng)友強(qiáng)烈的好奇心和求知欲。

Llama 3.1都使用了哪些數(shù)據(jù)?其中有多少合成數(shù)據(jù)?為什么不使用MoE架構(gòu)?

后訓(xùn)練與RLHF流程是如何進(jìn)行的?模型評(píng)估是如何進(jìn)行的?

我們什么時(shí)候可以見到Llama 4?Meta是否會(huì)發(fā)展agent?

恰逢Llama 3.1剛剛發(fā)布,Meta科學(xué)家就現(xiàn)身播客節(jié)目Latent Space,秉持著開源分享的精神,對(duì)以上問題都作出了清晰的回答。

圖片

受訪者Thomas Scialom現(xiàn)任Meta的人工智能研究科學(xué)家,領(lǐng)導(dǎo)了Llama 2和Llama 3的后訓(xùn)練,并參加了CodeLlama、Toolformer、Bloom、GAIA等多個(gè)項(xiàng)目。

圖片

以下是采訪內(nèi)容的節(jié)選。

Llama 3.1研發(fā)思路

如何決定參數(shù)規(guī)模

其實(shí)LLM的參數(shù)規(guī)模的選擇需要考慮多種因素,包括scaling law、訓(xùn)練時(shí)間、GPU和硬件的約束等等。

而且,不能只考慮Meta所用的硬件,還有整個(gè)AI社區(qū),并不是每個(gè)人都在使用H100,還有很多不同的GPU型號(hào)和顯存大小。

再加上,目前廣泛應(yīng)用于推理階段的量化技術(shù),比如可以用FP16或FP8精度,這會(huì)改變推理和訓(xùn)練/微調(diào)成本的比重。

以上這些限制因素,都讓模型規(guī)模的選擇成為一個(gè)非常具有挑戰(zhàn)性的問題。

總體而言,著重考慮的是目前已有的算力,在Scaling Law和訓(xùn)練token總量的限制內(nèi),我們進(jìn)行了一些權(quán)衡,找到了一個(gè)有合適推理效率的平衡點(diǎn)。

之所以做到405B這么大規(guī)模,其實(shí)原因很簡單——我們想做出最好的模型,一個(gè)真正與GPT-4比肩的開源模型。(現(xiàn)在是GPT-4o了)雖然目前還沒有完全達(dá)到目標(biāo),但差距正在逐漸縮小。

正如小扎之前宣布的,Meta囤積了越來越多的GPU,因此下一代模型將繼續(xù)擴(kuò)展。

對(duì)于網(wǎng)友們所說的,無法在家里運(yùn)行Llama 3.1,這很有可能是事實(shí)。但如果進(jìn)行FP8量化,依舊可以用128k的上下文窗口在單節(jié)點(diǎn)上運(yùn)行。

從另一個(gè)角度來看,我們還是要寄希望于開源社區(qū)的力量。Llama 1和Llama 2剛剛發(fā)布時(shí),大家同樣認(rèn)為模型太大了,但兩周后它就能在樹莓派上運(yùn)行了。

雖然不能確定Llama 3.1也會(huì)和以前一樣,但通過將模型開源,我們希望可以看到類似的趨勢。

圖片

重新審視Scaling Law

我們所熟知的Scaling Law主要關(guān)注兩個(gè)維度,即模型權(quán)重和訓(xùn)練量,包括訓(xùn)練時(shí)的step、epoch和token總量等等。

基本上,論文的發(fā)現(xiàn)就是,模型規(guī)模是重要因素。因此,GPT-3犯了一個(gè)錯(cuò)誤——模型參數(shù)量遠(yuǎn)遠(yuǎn)超出了token總量的要求。

圖片

論文地址:https://arxiv.org/pdf/2001.08361

這也正是之后的Chinchilla所發(fā)現(xiàn)和強(qiáng)調(diào)的,相比最初的Scaling Law,他們更強(qiáng)調(diào)了訓(xùn)練數(shù)據(jù)token總量的重要性。

圖片

論文地址:https://arxiv.org/pdf/2203.15556

Chinchilla論文想要找到「算力最優(yōu)化」的訓(xùn)練方式,認(rèn)為在有限算力的前提下,存在一個(gè)模型參數(shù)量和訓(xùn)練token數(shù)的最佳比率。

如果你希望在論文的基準(zhǔn)測試中得到最優(yōu)模型,那么Chinchilla本身沒有問題;但Meta要發(fā)布的旗艦?zāi)P瓦€需要更高的推理效率。

因此,我們選擇增加訓(xùn)練的token數(shù),并增加訓(xùn)練時(shí)長,讓模型達(dá)到「過度訓(xùn)練」的狀態(tài)。

這不符合Chinchilla定律,也會(huì)付出額外的算力,但我們希望讓模型有更好的推理表現(xiàn),從而更多地應(yīng)用于開源社區(qū),因此需要做出一些超越Chinchilla定律的選擇。

事實(shí)上,這也是Llama 1的研發(fā)人員所做的事情。我所說的「不要陷入Chinchilla陷阱」就是這個(gè)意思。

圖片

模型架構(gòu)

相比Llama 2, Llama 3的架構(gòu)沒有太多變化,但是在擴(kuò)展數(shù)據(jù)的規(guī)模和質(zhì)量方面,我們作出了很多努力,數(shù)據(jù)集從2T token增加到15T token。

架構(gòu)方面,我認(rèn)為將來會(huì)有更多改進(jìn),甚至不僅僅局限于Transformer。

目前的Tranformer架構(gòu)仍然缺少靈活性,比如,我認(rèn)為對(duì)每個(gè)token使用等量的算力是沒有意義的,因此還有很多研究的空間。

關(guān)于「為什么不使用MoE架構(gòu)」,這個(gè)是我經(jīng)常聽到的質(zhì)疑,其中的原因有多個(gè)方面。

我認(rèn)為,稠密模型只是MoE的一個(gè)特定變體,你可以把它看作只有一個(gè)專家的MoE,因此這只是一個(gè)還沒有優(yōu)化的超參數(shù)而已。

但我們目前正在進(jìn)行一些工作,未來可能會(huì)在這個(gè)超參數(shù)上繼續(xù)探索。

關(guān)于合成數(shù)據(jù)

關(guān)于數(shù)據(jù),我的直覺是,公開互聯(lián)網(wǎng)上充斥著過多文本垃圾,用這些token訓(xùn)練模型是對(duì)算力的浪費(fèi)。

在為Llama 2抓取數(shù)據(jù)時(shí),我們就使用Llama作為分類器,用于過濾出高質(zhì)量的token,并打上主題標(biāo)簽,比如這段文本是和數(shù)學(xué)、法律還是政治有關(guān),這樣可以實(shí)現(xiàn)主題的均衡和多樣性。

Llama 3的后訓(xùn)練過程完全沒有使用人工書寫的答案,僅依靠從Llama 2獲得的合成數(shù)據(jù)。

我非常看好合成數(shù)據(jù),而且隨著模型性能提升,情況也會(huì)變得更好。

LLM的評(píng)估與改進(jìn)

目前的模型研發(fā)有一個(gè)趨勢,就是針對(duì)基準(zhǔn)分?jǐn)?shù)進(jìn)行模型的后訓(xùn)練改進(jìn)。

模型評(píng)估是一個(gè)開放的研究問題,目前還沒有很好的答案,尤其是面對(duì)同一個(gè)模型有如此多的功能。

當(dāng)你試圖提升模型在某個(gè)基準(zhǔn)上的分?jǐn)?shù)時(shí),這就不再是一個(gè)好的基準(zhǔn)了,因?yàn)榭赡軙?huì)存在過擬合,分?jǐn)?shù)提升未必可以遷移成為相似的能力。

因此,語言模型的評(píng)估,尤其是訓(xùn)練后評(píng)估,是一個(gè)非常困難的問題。我們嘗試過很多方法,包括用獎(jiǎng)勵(lì)模型,model-as-a-judge、使用多樣化的提示、多樣化的基準(zhǔn)測試……

我感覺為Llama 2進(jìn)行評(píng)估要比今天容易多了,當(dāng)時(shí)的模型性能比現(xiàn)在相差很多。現(xiàn)在的模型變得如此好,以至于很難找到能擊潰模型的合適prompt,進(jìn)行性能比較并查看邊界情況。

比較模型的其中一個(gè)好辦法就是進(jìn)行多輪RLHF。每次上傳新模型時(shí),只需在所有帶標(biāo)注的prompt上進(jìn)行采樣,讓新舊模型分別回答,再自動(dòng)計(jì)算勝率。

Llama 4與Agent

Meta已經(jīng)在6月開始訓(xùn)練Llama 4模型,而且重點(diǎn)可能圍繞agent技術(shù),并且已經(jīng)在Toolformer等agent工具上進(jìn)行了一些工作。

圖片

論文地址:https://arxiv.org/pdf/2302.04761

但同時(shí)也要意識(shí)到,如果沒有一個(gè)優(yōu)秀的指令模型,Toolformer擴(kuò)展和未來能力也會(huì)大大受限,因此我們研發(fā)了Llama 2和Llama 3。

此外,Meta也曾在一年前發(fā)布GAIA基準(zhǔn),用于評(píng)估模型解決現(xiàn)實(shí)世界問題的能力。

在這個(gè)基準(zhǔn)的排行榜上,基于GPT-3的agent系統(tǒng)得分幾乎接近于零,但GPT-4驅(qū)動(dòng)的系統(tǒng)就有很好的成績,比如30%~40%,這其中就體現(xiàn)出模型的智力差距。

在我看來,agent的各種能力,比如函數(shù)調(diào)用、遵循復(fù)雜指令、預(yù)先規(guī)劃、多步驟推理等等,和模型的這種智力差距是類似的。

圖片

論文地址:https://arxiv.org/pdf/2311.12983

現(xiàn)在有了足夠強(qiáng)大的Llama 3,我將重新專注于agent的構(gòu)建。如果能實(shí)現(xiàn)良好的模型互聯(lián),形成一個(gè)復(fù)雜的agnent系統(tǒng),將獲得幾個(gè)數(shù)量級(jí)的擴(kuò)展,從而實(shí)現(xiàn)規(guī)劃、回溯、網(wǎng)頁導(dǎo)航、代碼執(zhí)行等多種功能。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-07-30 13:48:37

2025-10-10 00:00:10

大語言模型LLM智能

2024-07-24 13:18:17

2012-12-06 15:36:55

CIO

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2024-07-25 13:36:32

2023-05-23 09:34:16

科學(xué)家AI

2023-07-22 13:24:36

分析模型

2023-07-27 14:11:32

模型開源

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2023-12-28 15:18:37

MetaOpenAI

2024-05-27 09:01:42

Llama 3大型語言模型人工智能

2013-12-18 13:19:43

多核計(jì)算

2023-07-24 14:26:58

OpenAIGPT-4Karpathy

2025-04-08 02:26:00

2015-06-11 10:27:29

數(shù)據(jù)科學(xué)家

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2022-11-03 14:13:24

騰訊科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲a一区二区| 99久久久国产精品| 九九热在线精品视频| 亚洲区 欧美区| 亚洲黄色中文字幕| 专区另类欧美日韩| 久久精品国产一区二区三区日韩| 91麻豆精品在线| 国产精品99一区二区| 亚洲午夜精品久久久久久久久久久久 | 第一视频专区在线| 国产v综合v亚洲欧| 国产精品高潮视频| 日本在线视频免费| 久久久久久久久久久妇女| 日韩国产中文字幕| 免费欧美一级片| 欧美与亚洲与日本直播| 亚洲大片免费看| 最新中文字幕久久| 激情小说 在线视频| 成人污视频在线观看| 国产在线精品播放| 区一区二在线观看| 影音先锋久久久| 久久艹在线视频| 中文字幕第24页| 日韩深夜影院| 精品成人私密视频| 一二三级黄色片| 69堂精品视频在线播放| 婷婷国产v国产偷v亚洲高清| 正在播放国产精品| av在线播放免费| 91网址在线看| 国产亚洲精品美女久久久m| 精品国产九九九| 激情综合五月婷婷| 国产欧美日韩中文字幕| 成人毛片一区二区三区| 在线亚洲观看| 欧美亚洲成人免费| 午夜毛片在线观看| 亚洲黄页一区| 欧美精品999| 免费中文字幕在线| 一区二区三区午夜探花| 日韩中文字幕网站| 女同久久另类69精品国产| 日韩精品第一区| 在线观看精品自拍私拍| 蜜桃久久精品成人无码av| 久久99国产成人小视频| 亚洲偷欧美偷国内偷| 中文字幕高清视频| 国产成人精品三级高清久久91| 日韩av网站电影| 亚洲做受高潮无遮挡| 伊人久久大香线蕉综合网蜜芽| 日韩精品在线看| 天天躁日日躁aaaxxⅹ| 亚州av日韩av| 一本色道久久88精品综合| 亚洲av成人无码久久精品| 欧美手机视频| 日韩在线视频导航| 我要看黄色一级片| 欧美日本不卡| 性色av香蕉一区二区| 亚洲另类在线观看| 蜜桃91丨九色丨蝌蚪91桃色| 国产日韩中文字幕| va视频在线观看| 成人黄页毛片网站| 久久精品日产第一区二区三区| 欧美少妇另类| 中文字幕乱码久久午夜不卡| 手机成人av在线| 欧美videos另类精品| 午夜精品一区二区三区电影天堂| 欧美日韩在线一| 欧美日韩尤物久久| 69成人精品免费视频| 特黄特色免费视频| 伊人久久大香线蕉综合网蜜芽| 中文字幕精品一区二区精品| 精品国产精品国产精品| 日韩视频二区| 成人妇女免费播放久久久| 性欧美18一19性猛交| 91影院在线观看| 手机成人av在线| 啊啊啊久久久| 欧美日韩视频在线观看一区二区三区 | 91九色在线播放| 在线视频中文字幕一区二区| 国产高清999| 婷婷亚洲精品| 久久综合伊人77777| av大片在线免费观看| 久久99精品久久久久久久久久久久| 国产精品国产亚洲精品看不卡15| 黄色软件在线观看| 亚洲综合免费观看高清完整版在线| 日韩黄色片视频| 激情综合五月| 国产一区二区三区精品久久久| 欧美日韩国产精品综合| 青娱乐精品视频| 国产在线精品二区| 黄色网在线看| 在线观看av一区| 91丝袜在线观看| 自拍偷拍欧美| 国产福利精品在线| 天堂av2024| 亚洲精品第1页| 欧美三级理论片| 日韩激情啪啪| 久久久久国产一区二区三区| 亚洲综合五月天婷婷丁香| 92精品国产成人观看免费| 特色特色大片在线| 国产成人免费| 亚洲欧洲在线免费| 日韩三级视频在线| 国产黄色成人av| 正在播放一区| 香蕉久久一区| 中国china体内裑精亚洲片| 国产在线观看黄色| 成人毛片视频在线观看| 肉大捧一出免费观看网站在线播放 | 久青青在线观看视频国产| 亚洲午夜久久久久| 91福利视频免费观看| 91精品电影| 成人精品一区二区三区| av在线之家电影网站| 色妞www精品视频| 粉嫩av蜜桃av蜜臀av| 亚洲一区二区三区免费在线观看 | 精品国产aⅴ| 日本高清久久天堂| 能在线看的av| 色哟哟一区二区三区| www.久久av| 性xx色xx综合久久久xx| 欧美xxxx黑人又粗又长密月| 日本在线高清| 亚洲精品中文字幕女同| 国产精品suv一区| 久久久久国产精品人| 欧美 国产 日本| 精品视频黄色| 国产又爽又黄的激情精品视频 | 一区二区导航| 国产精品高清在线| 97在线观看免费观看高清 | 国产精品久久久久久麻豆一区软件 | 91精品国产色综合久久不卡粉嫩| 日韩一区二区av| 国产wwwwwww| 亚洲国产毛片aaaaa无费看| www.555国产精品免费| 99日韩精品| 日韩欧美精品一区二区| 欧美成人一二区| 久久999免费视频| 污污的视频网站在线观看| 色综合色综合色综合色综合色综合 | 国产精品国产三级国产aⅴ中文 | bt欧美亚洲午夜电影天堂| 自拍日韩亚洲一区在线| 欧美极品在线观看| 91精品综合视频| 国精一区二区三区| 日韩精品视频在线观看网址| 中文字幕在线视频第一页| 1024成人网| 亚洲精品乱码久久久久久久| 日本在线不卡一区| 亚洲国产一二三精品无码| 欧美丝袜足交| 国产欧美一区二区| 55av亚洲| 久久亚洲私人国产精品va| 日本黄色三级视频| 欧美性受极品xxxx喷水| 老女人性淫交视频| 久久蜜桃av一区精品变态类天堂| 嫩草视频免费在线观看| 999在线观看精品免费不卡网站| 热re99久久精品国99热蜜月| 亚洲**毛片| 国产91在线播放| 天天色天天射天天综合网| 亚洲情综合五月天| 成人毛片在线精品国产| 欧美天堂一区二区三区| 日本少妇xxxx动漫| ...av二区三区久久精品| 亚洲中文字幕一区| 韩国欧美国产1区| 一本久道中文无码字幕av| 欧美高清日韩| 亚洲一区二区三区免费观看| 香蕉视频一区| 国产高清不卡av| 国产精品成人**免费视频| 国产99久久精品一区二区 夜夜躁日日躁 | 久久久亚洲网站| 日本黄色片在线观看| 亚洲精选中文字幕| 成人午夜免费在线观看| 综合激情网五月| 亚洲美女免费在线| 国产jizz18女人高潮| 久久色在线视频| 精品国产一区在线| 激情国产一区二区| 8x8x最新地址| 日韩电影免费在线看| 2022亚洲天堂| 亚洲电影成人| 91网站在线观看免费| 国产精品久久久久久麻豆一区软件| 茄子视频成人在线观看| 欧美久久精品| 国产伦精品一区二区三区视频免费 | 午夜精品婷婷| 国产精品12p| 欧美第一精品| 在线观看国产一区| 久久免费大视频| 亚洲精品国产精品国自产| 精品高清久久| 日本一区二区三区四区高清视频| 校花撩起jk露出白色内裤国产精品| 国产精品.com| 激情视频极品美女日韩| 国内精品国语自产拍在线观看| 999在线精品| 国产精品免费在线播放| 99国产精品免费网站| 电影午夜精品一区二区三区| 榴莲视频成人app| 91精品国产高清久久久久久91裸体| 豆花视频一区| 99久久精品免费看国产一区二区三区| 精品久久免费| 国产成人亚洲欧美| 美女扒开腿让男人桶爽久久动漫| 精品国产免费久久久久久尖叫| 牛牛精品成人免费视频| 欧美连裤袜在线视频| 九九热精品视频在线观看| 日韩电影大全在线观看| 日本不卡免费一区| 一区二区三区一级片| 亚洲天天影视网| 东北少妇不带套对白| 国产精品入口| 中文字幕网av| 国产成人精品亚洲午夜麻豆| 老熟女高潮一区二区三区| 99在线热播精品免费| 四虎永久免费在线观看| 国产精品卡一卡二卡三| 免看一级a毛片一片成人不卡| 亚洲国产综合91精品麻豆| 丰满少妇xoxoxo视频| 欧美影院一区二区三区| 国产乱淫av免费| 精品国产123| 福利视频在线看| 欧美另类高清videos| 悠悠资源网亚洲青| 91深夜福利视频| 欧美深夜视频| 在线视频福利一区| 亚洲另类视频| 可以看污的网站| 成人精品gif动图一区| 日韩视频在线观看免费视频| 亚洲另类一区二区| chinese国产精品| 日韩欧美色综合| 青青视频在线观| 欧美成人精品不卡视频在线观看| 美女网站在线看| 亚洲综合中文字幕68页| 久久不见久久见国语| 大荫蒂性生交片| 日本不卡123| 中文字幕在线永久| 亚洲日本va在线观看| 天天干天天干天天操| 欧美一区二区在线不卡| 欧美日韩国产综合视频| 欧美肥婆姓交大片| 色成人综合网| 久久久久se| 欧美激情偷拍| 欧美特级aaa| 久久综合久久综合久久综合| 深夜福利影院在线观看| 91黄色免费看| 污视频在线免费观看| 欧美成人午夜激情在线| 粉嫩av一区二区三区四区五区 | 亚洲乱码国产乱码精品精软件| 亚洲小视频在线| 午夜伦理福利在线| av一本久道久久波多野结衣| 天天色综合色| 国产第一页视频| 91香蕉视频mp4| 国产精品suv一区二区| 欧美一区二区三区在线| 日韩av中文| 国产精品久久久久久久久久久久久| 女同一区二区三区| 欧美精品卡一卡二| 狠狠久久亚洲欧美| 男人天堂资源网| 欧美综合一区二区| 你懂的在线视频| 欧美在线视频网站| 美国一区二区| 男人和女人啪啪网站| 成人网页在线观看| 91国在线精品国内播放| 国产77777| 欧美另类xxx| 欧美影院视频| 777久久精品一区二区三区无码 | 在线观看三级视频| 成人免费福利在线| 国产精品7m凸凹视频分类| 污网站免费在线| 国产精品久久久久影院亚瑟| 又骚又黄的视频| 久久精品国产成人精品| 全球中文成人在线| 久久精品国产精品亚洲精品色| 蜜臀久久99精品久久久久宅男| 欧美人妻一区二区三区 | 国产白浆在线观看| 欧美另类暴力丝袜| 麻豆精品99| 免费观看成人网| 中文字幕欧美日本乱码一线二线| 中文天堂在线资源| 日韩中文字幕精品视频| 91成人福利社区| 国产一级做a爰片久久毛片男| 成人精品亚洲人成在线| 日本三级片在线观看| 日韩黄色av网站| 日本一区免费网站| 欧美性视频在线播放| 成人在线视频一区| 成人在线免费看视频| 这里只有精品视频| 日韩欧美激情电影| 337p粉嫩大胆噜噜噜鲁| 国产亚洲成aⅴ人片在线观看| 一区二区视频在线免费观看| 久久精品国产亚洲| 国产毛片精品| 欧美三级午夜理伦三级富婆| 亚洲精品视频在线观看免费 | 国产亚洲美女精品久久久| 欧洲午夜精品| 日本a视频在线观看| 久久女同互慰一区二区三区| 在线播放成人av| 欧美精品国产精品日韩精品| 丝袜久久网站| 一区二区三区四区毛片| 夜夜揉揉日日人人青青一国产精品 | 88xx成人永久免费观看| 国产又粗又爽又黄的视频| 成人爱爱电影网址| 一区二区三区黄| 高清一区二区三区日本久| 精品国产一区二区三区噜噜噜| 亚洲成人av免费观看| 一本到不卡免费一区二区| 国产91在线视频蝌蚪| 久久久久久久免费| 国产精品一区在线观看乱码| 国产精品一区二区三区四| 久久精品视频亚洲| 国产探花一区在线观看| 美女伦理水蜜桃4| 欧美乱妇15p| 桃色av一区二区| 一本大道东京热无码aⅴ|