精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+ 精華

發(fā)布于 2024-5-21 09:23
瀏覽
0收藏

讓大神Andrej Karpathy一鍵三連??(點(diǎn)贊+轉(zhuǎn)發(fā)+評(píng)論),一個(gè)教你從頭開始實(shí)現(xiàn)Llama3的代碼庫(kù)爆火。


X上轉(zhuǎn)贊收藏量超6.8k,GitHub攬星2k+。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

火就火在,它教你從頭用Meta開源的權(quán)重進(jìn)行推理,詳細(xì)解釋和展開了注意力機(jī)制中多個(gè)頭的矩陣乘法、位置編碼以及所有中間層


換句話說,他解釋了每行代碼都在干啥。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

Karpathy看后直呼打造者Nishant Aklecha(后文暫稱“納哥”)是個(gè)有品的人:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

完全展開后,比起模塊相互嵌套和調(diào)用時(shí),更容易理解每一步具體在做什么。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

網(wǎng)友們對(duì)其也是贊不絕口,紛紛致敬:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

話不多說,一起來看納哥是如何手把手教的。


(量子位在不改變?cè)獾幕A(chǔ)上,進(jìn)行了編譯整理)

從頭實(shí)現(xiàn)llama3

在運(yùn)行納哥提供的文件前,大伙兒需要預(yù)先下載Meta官方提供的Llama3模型權(quán)重。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

納哥表示自己沒搞分詞器,推薦用Karpathy的現(xiàn)成簡(jiǎn)潔版BPE代碼。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

PS:

“字節(jié)級(jí)(byte-level)”BPE算法,在UTF-8編碼的字符串上運(yùn)行,廣泛應(yīng)用于大模型分詞。Karpathy提供的這個(gè)代碼庫(kù)包含兩個(gè)分詞器,都能在給定文本上訓(xùn)練分詞器的詞匯表和合并規(guī)則、將文本編碼為token、將token解碼為文本。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

讀取模型文件的方式通常取決于model classes的編寫方式以及class中變量的命名。但由于納哥是從頭開始實(shí)現(xiàn)Llama3,所以將逐個(gè)張量地讀取文件內(nèi)容。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

通過此配置可以推斷出模型的結(jié)構(gòu)和參數(shù)信息,例如模型包含的Transformer層數(shù)、多頭注意力塊中的頭數(shù),以及詞匯表的大小等細(xì)節(jié)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

將文本轉(zhuǎn)換為token時(shí),納哥使用tiktoken作為分詞器。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來,納哥展示了在代碼中將token轉(zhuǎn)換為高維的嵌入表示。這是代碼庫(kù)中唯一使用內(nèi)置神經(jīng)網(wǎng)絡(luò)模塊的部分。


[17x1]的token矩陣變成了[17x4096]的嵌入矩陣。也就是說,每個(gè)token被轉(zhuǎn)換為一個(gè)長(zhǎng)度為4096的嵌入向量,總共有17個(gè)這樣的嵌入向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后,納哥對(duì)嵌入進(jìn)行RMS歸一化。經(jīng)過這一步后,嵌入的形狀不會(huì)改變,只有數(shù)值被歸一化了。納哥強(qiáng)調(diào)需要一個(gè)norm_eps,避免意外將RMS值設(shè)為0導(dǎo)致除以0的錯(cuò)誤。


以下是公式:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

構(gòu)建Transformer的第一層,進(jìn)行歸一化處理,從模型字典中訪問layer.0(即第一層)。歸一化之后,張量的形狀仍然是[17x4096],與嵌入時(shí)相同,但數(shù)值已被歸一化。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

跟著納哥從頭實(shí)現(xiàn)注意力機(jī)制,加載Transformer第一層的注意力頭。


從模型中加載query、key、value和output向量時(shí),它們的形狀分別是 [4096x4096]、[1024x4096]、[1024x4096] 和 [4096x4096]。


納哥表示乍一看有點(diǎn)奇怪,因?yàn)槔硐肭闆r是每個(gè)注意力頭的q、k、v和o向量是獨(dú)立的。而代碼作者將它們捆綁在一起,是為了方便并行計(jì)算注意力頭的矩陣乘法。


把所有這些向量解包開來:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

下一步,納哥將從多個(gè)注意力頭中解包query,解包后的形狀是[32x128x4096],32是Llama3中的注意力頭數(shù)量,128是query向量的大小,4096是token嵌入的大小。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

在這里,納哥訪問了第一層第一個(gè)注意力頭的query權(quán)重矩陣,query權(quán)重矩陣的大小是[128x4096]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

將query權(quán)重矩陣與token嵌入相乘,獲得每個(gè)token的query向量。結(jié)果的形狀為[17x128],有17個(gè)token,每個(gè)token對(duì)應(yīng)一個(gè)長(zhǎng)度為128的query向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來需要位置編碼。


現(xiàn)在已經(jīng)為prompt中的每個(gè)token生成了query向量,但每個(gè)單獨(dú)的query向量并不知道它在prompt中的具體位置。


例如,query:“the answer to the ultimate question of life, the universe, and everything is ”(生命、宇宙和一切的終極問題的答案是)。


在這個(gè)prompt中,使用了三次”the”,需要根據(jù)它們?cè)趐rompt中的位置,使這三個(gè)”the”token的query向量有所不同(每個(gè)向量的大小為[1x128])。


通過使用RoPE(旋轉(zhuǎn)位置嵌入)來進(jìn)行這些旋轉(zhuǎn)操作。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

上一步中,納哥將query向量分成對(duì),并對(duì)每一對(duì)應(yīng)用一個(gè)旋轉(zhuǎn)角度偏移。


由此,得到的向量大小為 [17x64x2],這是將長(zhǎng)度為128的query向量對(duì)每個(gè)prompt中的token分成64對(duì)。這64對(duì)中的每一對(duì)都會(huì)根據(jù)m*(theta) 進(jìn)行旋轉(zhuǎn),其中m是要旋轉(zhuǎn)query的token的位置。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

使用復(fù)數(shù)的點(diǎn)積來旋轉(zhuǎn)一個(gè)向量:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在每個(gè)token的query元素都有一個(gè)復(fù)數(shù)(角度變化向量),可以將query向量(之前分成的對(duì))轉(zhuǎn)換為復(fù)數(shù),然后通過點(diǎn)積根據(jù)位置旋轉(zhuǎn)query向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

獲得旋轉(zhuǎn)后的向量后,可以通過將復(fù)數(shù)重新視為實(shí)數(shù)來得到成對(duì)的query向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

旋轉(zhuǎn)后的對(duì)現(xiàn)在已經(jīng)合并,有一個(gè)新的query向量(旋轉(zhuǎn)后的query向量),其形狀為[17x128],其中17是token的數(shù)量,128是query向量的維度。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

key與query幾乎相同。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

納哥表示自己不會(huì)詳細(xì)講解key的數(shù)學(xué)原理,只需要記住以下幾點(diǎn):


key生成的key向量維度也是128;key的權(quán)重只有query的四分之一,這是因?yàn)閗ey的權(quán)重在同一時(shí)間內(nèi)被4個(gè)頭共享,來減少計(jì)算量;key也會(huì)旋轉(zhuǎn)添加位置信息,原因與query相同。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

此時(shí),納哥已經(jīng)為每個(gè)token獲得了旋轉(zhuǎn)后的query和key。每個(gè)query和key現(xiàn)在的形狀都是[17x128]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

下一步,納哥將對(duì)query矩陣和key矩陣進(jìn)行相乘操作。這樣做會(huì)生成一個(gè)評(píng)分矩陣,將每個(gè)token關(guān)聯(lián)起來。這些評(píng)分描述了每個(gè)token的query與每個(gè)token的key之間的相關(guān)性,這就是自注意力機(jī)制。


注意力評(píng)分矩陣(qk_per_token)的形狀為[17x17],其中17是prompt中的token數(shù)量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來需要對(duì)query key評(píng)分進(jìn)行掩碼處理。在Llama3的訓(xùn)練過程中,未來token的qk評(píng)分是被掩碼的,只通過過去的token來預(yù)測(cè)token。


因此,在推理時(shí),要將未來的token評(píng)分設(shè)置為0。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來是value,接近注意力機(jī)制的最后一步。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

這些評(píng)分(0-1)用于確定每個(gè)token使用多少value矩陣。

和key一樣,value的權(quán)重也在每4個(gè)注意力頭之間共享,所以下面value權(quán)重矩陣的形狀是[8x128x4096]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

第一層,第一個(gè)注意力頭的value權(quán)重矩陣如下所示:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后是value向量。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

使用value權(quán)重來獲取每個(gè)token的注意力值,矩陣的大小是[17x128],其中17是prompt中的token數(shù)量,128是每個(gè)token的value向量的維度。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

注意力:與每個(gè)token的value相乘后得到的注意力向量的形狀為[17x128]。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在有了第一層第一個(gè)頭的注意力value。然后納哥運(yùn)行一個(gè)循環(huán),對(duì)第一層的每個(gè)頭執(zhí)行與上面的計(jì)算完全相同的數(shù)學(xué)運(yùn)算。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后得到了第一層所有32個(gè)頭的qkv_attention矩陣,接下來將所有注意力得分合并成一個(gè)大小為[17x4096]的大矩陣。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

對(duì)于第0層注意力機(jī)制的最后步驟,其一是將注意力得分矩陣與權(quán)重矩陣相乘。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

這是一個(gè)簡(jiǎn)單的線性層,所以只需進(jìn)行矩陣乘法。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在得到了注意力機(jī)制后的嵌入value變化,應(yīng)該被添加到原始的token嵌入中。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

對(duì)嵌入增量進(jìn)行歸一化處理,然后通過嵌入增量運(yùn)行一個(gè)前饋神經(jīng)網(wǎng)絡(luò)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

在Llama3中,加載前饋權(quán)重并實(shí)現(xiàn)前饋網(wǎng)絡(luò)。使用了一種名為SwiGLU的前饋網(wǎng)絡(luò),這種網(wǎng)絡(luò)結(jié)構(gòu)在模型需要的時(shí)候,能夠有效地增加非線性。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

現(xiàn)在完成了第一層之后每個(gè)token的新嵌入。現(xiàn)在只剩下31層了,只需通過一個(gè)循環(huán)來完成。


納哥表示可以將這個(gè)編輯后的嵌入想象成包含了第一層中所有查詢信息的嵌入。隨著層數(shù)的增加,每一層都會(huì)對(duì)輸入的信息進(jìn)行越來越復(fù)雜的處理,直到最終得到一個(gè)能夠全面了解下一個(gè)需要預(yù)測(cè)的token的嵌入。


從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

之前做的所有事情,對(duì)每一層都重復(fù)一次。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

然后得到了最終的嵌入,這是模型對(duì)下一個(gè)token的最優(yōu)預(yù)測(cè)。這個(gè)嵌入的形狀與常規(guī)的token嵌入相同,為[17x4096],其中17是token的數(shù)量,4096是嵌入的維度。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

最后,將嵌入解碼成token值。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

使用輸出解碼器將最終的嵌入轉(zhuǎn)換成一個(gè)token。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

接下來看納哥使用最后一個(gè)token的嵌入來預(yù)測(cè)下一個(gè)value,希望預(yù)測(cè)的結(jié)果是42。


因?yàn)楦鶕?jù)《銀河系漫游指南》一書中的說法,42是“生命、宇宙及一切的終極問題的答案”。大多數(shù)LLM在這里都會(huì)回答42,這將驗(yàn)證整個(gè)代碼的正確性。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

模型預(yù)測(cè)下一個(gè)token的編號(hào)為2983。這個(gè)編號(hào)對(duì)應(yīng)數(shù)字42嗎?

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

OK,結(jié)束。

“讓研究變得更加觸手可及”

簡(jiǎn)單介紹一下Nishant Aklecha。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

Nishant Aklecha是構(gòu)建和改進(jìn)定制語言模型平臺(tái)Glaive AI的研究員,曾任職于摩根士丹利,負(fù)責(zé)訓(xùn)練和微調(diào)大語言模型。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

此外,他還和朋友一同創(chuàng)立了一個(gè)研究實(shí)驗(yàn)室,名為A10(AAAAAAAAAA)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

他們的目標(biāo)可以總結(jié)成一句話:讓研究變得更加觸手可及。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

除了放出這個(gè)代碼庫(kù),Nishant Aklecha可謂好人做到底。


網(wǎng)友想更好地理解這個(gè)代碼庫(kù)的內(nèi)容,Nishant直接一個(gè)YouTube視頻甩了過來:

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

之前Nishant Aklecha還曾寫過一篇Blog,詳解了潛在一致性模型(LCM),同樣收獲了不少好評(píng)。

從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火,大神Kapathy一鍵三連,GitHub狂攬2k+-AI.x社區(qū)

啥也不說了,感興趣的家人們趕緊碼住吧。


GitHub鏈接:https://github.com/naklecha/llama3-from-scratch


本文轉(zhuǎn)自 量子位 ,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/z2lvKwZYSzi_35YOeVWWjw??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
久久精品久久精品| 国产精品免费99久久久| 一区二区三区精密机械公司| 俄罗斯精品一区二区| 日韩三级免费看| 欧美日韩第一| 欧美videossexotv100| 国产亚洲天堂网| 免费黄色在线观看| 成人av在线电影| 国产精品91免费在线| 老司机成人免费视频| 欧美变态网站| 4438亚洲最大| 日韩无套无码精品| 男女视频在线| 国产精品福利一区| 久久久一本精品99久久精品| 国产乱人乱偷精品视频| 国产精品毛片| 久99久在线视频| 99精品全国免费观看| 国产成人tv| 欧美巨大另类极品videosbest | 欧美精品乱码久久久久久| 缅甸午夜性猛交xxxx| xxxxx日韩| 91麻豆国产精品久久| 99在线国产| 亚洲熟妇无码久久精品| 99视频一区| 欧美精品videosex极品1| 日韩三级在线免费观看| 国产伦精品一区二区三区四区免费| 少妇一级淫片日本| 国产欧美日韩一级| 欧美激情在线有限公司| 中文字幕亚洲欧美日韩| 欧美综合视频| 这里只有视频精品| 中文字幕人妻一区二区三区在线视频| 国产伦乱精品| 精品粉嫩超白一线天av| 妖精视频在线观看| 999精品嫩草久久久久久99| 欧美性猛交xxxx乱大交退制版| 日本中文字幕网址| sm在线播放| 亚洲韩国精品一区| 日韩一级性生活片| 久色国产在线| 午夜视频在线观看一区二区 | yellow91字幕网在线| 国产精品毛片大码女人| 日韩精品极品视频在线观看免费| 精品一二三区视频| 久久久99精品免费观看| 欧美18视频| 欧美日韩国产中文字幕在线| 91网站视频在线观看| 久草一区二区| 男女视频在线观看免费| 久久久久成人黄色影片| 日本一区二区精品| av在线播放av| 亚洲欧美另类小说| 日本成人在线不卡| caoporn视频在线| 狠狠躁夜夜躁人人爽超碰91| 日本在线观看a| 九九九伊在线综合永久| 欧美视频一区在线| 污污视频在线免费| 久久99偷拍| 亚洲图中文字幕| 久久精品国产亚洲AV成人婷婷| 手机在线电影一区| 欧美激情第三页| 久久久精品免费看| 男人操女人的视频在线观看欧美| 99视频超级精品| 国产最新精品视频| av中文在线播放| 日本欧美在线观看| 亚洲专区在线视频| 四虎电影院在线观看| 国产日韩欧美一区二区三区综合| 亚洲欧洲精品在线观看| 天堂8中文在线| 日韩欧美一区视频| 亚洲精品免费一区亚洲精品免费精品一区| 综合伊人久久| 亚洲天天在线日亚洲洲精| 精品国产国产综合精品| 18成人免费观看视频| 国产精品pans私拍| 国产福利第一视频| 久久久久国产精品麻豆| 欧美a级黄色大片| 在线观看网站免费入口在线观看国内| 欧美日韩国产首页| 亚洲激情 欧美| 91亚洲国产高清| 97激碰免费视频| 91在线视频国产| 91最新地址在线播放| 中文字幕在线亚洲精品| 亚洲人成在线网站| 日韩一区二区在线观看视频播放| 国产成人无码一区二区在线观看| 91精品综合| 欧美与欧洲交xxxx免费观看| 国产乱码精品一区二区| 国产午夜亚洲精品午夜鲁丝片 | 熟女少妇一区二区三区| 91成人影院| 日韩暖暖在线视频| 丰满肥臀噗嗤啊x99av| 中文字幕亚洲欧美在线不卡| 成年人视频网站免费观看| 蜜桃精品视频| 日韩在线视频播放| 国产精品一区无码| 99re热视频精品| 黄色一级片国产| 99热这里有精品| 国产亚洲欧洲高清| 亚洲第一精品在线观看| 黄视频在线观看网站| 成人一区二区视频| 公共露出暴露狂另类av| 99热播精品免费| 亚洲人永久免费| 日韩精品在线免费视频| av高清不卡在线| 国产a级片网站| xvideos.蜜桃一区二区| 操人视频在线观看欧美| 亚洲自拍偷拍另类| 欧美激情一区二区在线| 欧美丰满熟妇xxxxx| 天堂成人娱乐在线视频免费播放网站 | 亚洲国产精品久久不卡毛片| 精品国产乱码久久久久久1区二区| 久久av影视| 国产不卡av在线免费观看| 婷婷久久久久久| 红桃视频成人在线观看| 亚洲 欧美 日韩在线| 国产精品videossex久久发布| 亚洲精品欧美日韩| 污污视频在线| 精品久久久久久久人人人人传媒| 欧美成人黄色网| 粉嫩久久99精品久久久久久夜| 欧美做暖暖视频| 在线日韩成人| 久久久久久久久网站| 黑人乱码一区二区三区av| 亚洲一区二区影院| 中文在线观看免费视频| 亚洲人妖在线| 明星裸体视频一区二区| 视频在线日韩| xvideos亚洲| jlzzjlzz亚洲女人18| 一区二区三区国产精品| 国产日韩视频一区| 国产视频欧美| 亚洲成人自拍视频| 国产一区二区三区| 91精品国产高清久久久久久| 青青草娱乐在线| 欧美三级一区二区| 一区二区成人免费视频| 99精品欧美一区二区三区小说| 日韩 欧美 高清| 国产精品久久观看| 国产精品白丝jk白祙| 97超碰人人看| 欧美6一10sex性hd| 精品亚洲aⅴ在线观看| 波多野结衣不卡| 中文字幕一区三区| 人妻av一区二区| 水野朝阳av一区二区三区| 中文字幕久久综合| 欧美xxxx在线| 91色视频在线观看| 色网在线免费观看| 久久精品视频在线播放| 欧美 日韩 国产 成人 在线| 日韩欧美主播在线| 国产一二三区精品| 26uuu国产一区二区三区| 91热视频在线观看| 亚洲一区欧美二区| 今天免费高清在线观看国语| 婷婷综合福利| 99久久免费国| 国产资源一区| 国产91精品久久久| 色a资源在线| 中文字幕在线日韩| 香港三日本三级少妇66| 欧美精品在线一区二区| 91美女免费看| 亚洲国产一区二区三区| 美国一级黄色录像| 91伊人久久大香线蕉| 伊人国产精品视频| 日韩1区2区日韩1区2区| 性欧美大战久久久久久久| 欧美疯狂party性派对| 六月婷婷久久| 国产调教精品| 97超碰人人模人人爽人人看| 亚洲天堂1区| 欧美一区二区.| gogo久久| 欧美国产日韩一区二区在线观看 | 精品无码一区二区三区在线| 婷婷色综合网| 艳色歌舞团一区二区三区| 香蕉视频一区二区三区| 国产福利久久精品| 这里视频有精品| 亚洲xxxx18| 亚洲色图综合| 国产精品一区二区久久精品 | 色婷婷精品大视频在线蜜桃视频| 精品99在线观看| 亚洲美女淫视频| 国产成人自拍视频在线观看| 人妻偷人精品一区二区三区| 91精品国产综合久久精品app| 伊人22222| 欧美午夜精品久久久久久超碰 | 午夜在线一区二区| 亚洲熟妇av一区二区三区漫画| 国产精品激情| 91视频 - 88av| 欧美理论在线| www.国产在线视频| 亚洲国产三级| 精品中文字幕av| 日韩视频三区| 成人综合视频在线| 久久久综合网| 日本在线观看免费视频| 免费看精品久久片| 亚洲男人天堂视频| 久久久久久久久久网站| 亚洲欧美国产三级| 久久黄色小视频| 亚洲国产成人tv| 日韩特黄一级片| 欧美性20hd另类| 97人妻精品视频一区| 欧美精品aⅴ在线视频| 国产精品美女一区| 日韩欧美国产一二三区| 男人天堂一区二区| 日韩精品在线影院| 国产日本在线视频| 日韩一级裸体免费视频| 国产高清一区二区三区视频| 精品中文字幕乱| 成人三级高清视频在线看| 欧美亚洲日本网站| 亚洲成人av观看| 亚洲最大激情中文字幕| gogo人体一区| 日韩偷拍一区二区| 一区二区三区午夜视频| www..com日韩| 欧美aⅴ一区二区三区视频| 尤物网站在线看| 99这里只有久久精品视频| 美国黄色特级片| 一区二区三区不卡视频| 国产精品免费精品一区| 国产69精品久久久久久久久久| 日本久久精品电影| 国产视频手机在线观看| 日韩av中文字幕在线| 99视频在线观看地址| 欧美国产极速在线| 精品成人av| 国产传媒一区二区| 精品国产乱码久久久久久果冻传媒 | 亚洲高清不卡在线观看| 久久精品视频5| 欧美一二区视频| 成人影院免费观看| 午夜精品理论片| 日韩电影精品| 欧美高清性xxxxhd| 海角社区69精品视频| 少妇激情一区二区三区| 国产a区久久久| 又嫩又硬又黄又爽的视频| 亚洲妇女屁股眼交7| 国产乡下妇女三片| 欧美精品一区二| 精品美女在线观看视频在线观看| 66m—66摸成人免费视频| 国产区一区二| 视频一区国产精品| 亚洲日韩视频| gogo亚洲国模私拍人体| 亚洲国产精品黑人久久久| av黄色在线看| 精品国产乱码久久久久久牛牛 | 亚洲午夜激情影院| 久久久美女毛片| 日产精品久久久久| 日韩一级黄色大片| 日日夜夜精品一区| 国产99久久久欧美黑人| 免费看久久久| 亚洲第一成人在线| 欧美日韩在线视频播放| 精品处破学生在线二十三| 国产高清一区二区三区视频| 国产精品一区二区性色av| 久久综合色占| 日本精品www| 91啦中文在线观看| 日韩av在线天堂| 精品国产91乱码一区二区三区| 九七久久人人| 成人精品在线观看| 欧美大人香蕉在线| 久久久久国产一区| 日本一区二区免费在线观看视频 | 日韩欧美视频第二区| 国产麻豆综合| 野外性满足hd| 欧美丝袜一区二区| 亚洲欧美综合在线观看| 91精品国产高清久久久久久| 国产精品黄网站| 男的插女的下面视频| 成人深夜在线观看| 五月天婷婷丁香| 亚洲高清在线观看| 欧美久久天堂| 欧美一二三区| 日本女人一区二区三区| 日本美女bbw| 久久这里只精品最新地址| 亚洲国产另类久久久精品极度| 一区视频在线| 欧美 变态 另类 人妖| 福利视频导航一区| 九九在线视频| 国产玖玖精品视频| 图片区亚洲欧美小说区| 9191在线视频| 亚洲va天堂va国产va久| 青青草视频在线观看| 国产精品69久久久久| 99精品在线观看| 免费看91视频| 精品magnet| 国产小视频在线| 国产日韩欧美中文在线播放| 91精品国产91久久久久久密臀| 性猛交╳xxx乱大交| 欧美性xxxx极品高清hd直播| 国产高清一级毛片在线不卡| 国产日韩欧美中文| 亚洲大胆视频| 亚洲精品国产精品国自产网站| 欧美日高清视频| 黄色美女视频在线观看| 久久亚洲精品欧美| 久久99国产精品麻豆| 九九视频免费看| 亚洲欧美国产精品va在线观看| 国产精品.xx视频.xxtv| 国产在线无码精品| 久久女同性恋中文字幕| 夜夜嗨aⅴ一区二区三区| 欧美大片免费看| 国产一区二区三区四区二区| 999久久久精品视频| 精品成人av一区| 精品黄色免费中文电影在线播放| 国产一区二区三区高清视频| 日本中文一区二区三区| 久操免费在线视频| 亚洲天堂一区二区三区| 亚洲日本视频在线| 免费看污黄网站| 亚洲国产精品一区二区www| 91se在线| 久久国产精品一区二区三区四区| 经典三级在线一区|