精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

被作者刪庫的Llama 3-V原文再現!效果匹敵GPT4-V,區區不到500 美元,如何做到的 原創

發布于 2024-6-4 13:05
瀏覽
0收藏

編譯 | 言征

作者 | Aksh Garg

備注:發稿前作者已經刪掉原文

出品 | 51CTO技術棧(微信號:blog51cto)

近日,一款Llama3V最近被“先紅后黑”的出了圈。作為全球頂尖研究學府的團隊,身陷“抄襲”中國大模型的泥潭后,火速刪稿刪庫,實屬LLM史上一大“軼事”。

那么這款“Llama3V”究竟長什么樣子,實際基準效果究竟如何?

不得不說,看完作者對于該模型的介紹,大家對于如何訓練出堪比GPT4-o的多模態大模型,心中會多一些干貨。【本篇文章的作者Aksh Garg,是斯坦福大學、Point72 和 Jump 的機器學習研究員。曾就職于特斯拉、SpaceX、DE Shaw。】

1.Llama3V:成本只有500美元效果堪比100倍閉源大模型

Llama3 風靡全球,在幾乎所有基準測試中都優于 GPT3.5,在多個基準測試中也優于 GPT4。隨后,GPT4o 應運而生,憑借其多模態精細度奪回王位。今天,我們發布了一些可以改變這一現狀的東西:Llama3-V,這是有史以來第一個基于 Llama3 構建的多模態模型。作為獎勵,我們的所有訓練費用不到 500 美元。

你可能會問基準如何?我們讓表格說明一切。與 Llava(當前 SOTA 和最受歡迎的多模態理解模型)相比,我們的模型提升了 10-20%。此外,除了 MMMU 之外,我們在所有指標上的表現都與大小為其 100 倍的閉源模型非常相似。

被作者刪庫的Llama 3-V原文再現!效果匹敵GPT4-V,區區不到500 美元,如何做到的-AI.x社區圖片

請查看地址:

???:https://huggingface.co/mustafaaljadery/llama3v/

?Github:https://github.com/mustafaaljadery/llama3v

【當然,作者已經刪庫了】

被作者刪庫的Llama 3-V原文再現!效果匹敵GPT4-V,區區不到500 美元,如何做到的-AI.x社區

2.模型架構及工作原理

我們的大部分工程工作都是為了使 Llama3 理解視覺信息。為此,我們使用 SigLIP 模型獲取輸入圖像并將其嵌入到一系列塊嵌入中。然后,這些嵌入通過投影塊與文本標記對齊,投影塊應用兩個自注意力塊將文本和視覺嵌入放在同一平面上。最后,將投影塊中的視覺標記添加到文本標記前面,并將聯合表示傳遞到 Llama3,就像通常一樣。

被作者刪庫的Llama 3-V原文再現!效果匹敵GPT4-V,區區不到500 美元,如何做到的-AI.x社區圖片

Llama3-V 架構:我們使用 SigLIP 將輸入圖像嵌入到補丁中。然后我們用兩個自注意力塊訓練一個投影塊,以對齊我們的文本和視覺標記。

上圖從高層次說明了一切的工作原理。現在,讓我們詳細了解每個階段。

SigLIP:SigLIP(用于語言圖像預訓練的 Sigmoid 損失)是一種與 CLIP 類似的圖像嵌入模型,如下圖所示。但是,與使用對比損失和 softmax 正則化的 CLIP 不同,SigLIP 采用成對 Sigmoid 損失,這允許模型獨立地對每個圖像-文本對進行操作,而無需對批次中的所有對進行全局查看。在高層次上,SigLIP 的視覺編碼器將圖像分割成一系列不重疊的圖像塊,并將它們投影到低維線性嵌入空間中,從而產生一系列塊嵌入。然后,這些塊嵌入經過視覺編碼器,該編碼器應用自注意力來捕獲長距離依賴關系并提取更高級的視覺特征。為了我們的目的,我們直接使用由 Google DeepMind 訓練的原始 SigLIP 模型。

被作者刪庫的Llama 3-V原文再現!效果匹敵GPT4-V,區區不到500 美元,如何做到的-AI.x社區圖片

SigLIP 嵌入的工作原理說明。我們同時訓練圖像和文本解碼器,但在我們的例子中,文本編碼模塊保持不變。與 CLIP 不同,我們最小化 Sigmoid 損失而不是 Softmax 損失,但大多數其他事情保持不變。

與文本嵌入對齊:為了節省計算資源,我們保持 SigLIP 不變。但是,為了將輸出圖像嵌入與 Llama3 中使用的文本嵌入對齊,我們使用了一個額外的投影模塊。與將單個線性層應用于原始圖像嵌入的 Llava 不同,我們改為訓練兩個自注意力塊以更好地捕獲輸入嵌入中的模式,從而生成最終的圖像嵌入向量。

前置圖像標記:對于文本輸入,我們首先使用字節對編碼 (BPE) 詞匯表對文本進行標記,從而生成一系列文本標記。我們通過將這些標記括在特殊的 <text> 和 </text> 標簽中來劃分這些標記。對于來自投影塊的圖像嵌入,我們將每個向量視為單獨的“視覺標記”,并使用 <image> 和 </image> 標簽劃分它們。最后,我們將視覺標記序列前置到文本標記序列,形成傳遞到 Llama3 進行處理的聯合輸入表示。

3.成本是如何打下來的?推理優化

訓練這些模型的成本很高。為了優化計算資源,我們進行了兩項重大優化。第一項是簡單的緩存機制,第二項是在 MPS/MLX 前端。

緩存:SigLIP 模型比 Llama3 小得多。因此,如果我們按順序運行所有內容,則在 SigLIP 運行時,GPU 利用率非常低。此外,我們無法通過增加 SigLIP 上的批處理大小來提高利用率,因為 Llama 會遇到 OOM 錯誤。相反,我們發現我們的 SigLIP 模型保持不變,而是預先計算圖像嵌入。然后,對于預訓練和 SFT,我們直接傳入這些預先計算的圖像嵌入,而不是重新運行 SigLIP 模塊。這不僅使我們能夠增加批處理大小并最大限度地利用我們的 GPU 來運行 SigLIP 模塊,還為我們節省了訓練/推理時間,因為管道的兩個部分可以單獨進行。

MPS/MLX 優化:我們的第二次優化再次源于 SigLIP 相對于 Llama 的較小尺寸。具體來說,由于 SigLIP 適合我們的 Macbook,我們在 MPS 優化的 SigLIP 模型上進行了推理,這使我們能夠實現每秒 32 張圖像的吞吐量 - 讓我們的緩存步驟相對快速地完成。

4.它是如何訓練的

從 SigLIP 預計算嵌入:現在讓我們深入研究預訓練過程的第一步:通過 SigLIP 預計算圖像嵌入。在此步驟中,我們的目標是將圖像傳入 SigLIP 嵌入模型,以獲得圖像的矢量表示或嵌入。

一個技術細節:由于分辨率較高,我們遵循 LLaVA-UHD 采用的方法并執行圖像分割。圖像分割的目的是將圖像分成可變大小的塊或片段,以實現更高效的編碼。這些分割圖像會同時批量處理。

現在讓我們深入了解如何使用 SigLIP 嵌入。我們首先加載 SigLIP 模型和處理器/標記器。然后我們使用處理器預處理提供的輸入圖像。然后我們將預處理后的圖像傳遞給模型。之后,模型輸出圖像-文本對的對數。我們現在繼續將 S 型激活函數應用于對數以獲得概率。我們現在看到圖像嵌入包含在這些概率中。到目前為止,此嵌入捕獲了圖像中的視覺信息。

通過 SigLIP 計算圖像嵌入之后,我們現在開始學習投影矩陣——你也可以將其視為投影層,它通常是線性或前饋層。如上文成分部分所述,投影層將視覺嵌入從其原始空間映射到聯合多模態嵌入空間。具體而言,投影層將學習到的權重矩陣 W_v 應用于視覺嵌入 v 以獲得投影的多模態視覺嵌入 W_v * v。因此,在這個投影步驟之后,視覺和文本嵌入基本上被對齊到一個共同的多模態嵌入空間,允許它們的表示進行交互并組合以用于多模態建模任務,如視覺問答、圖像字幕等。更具體地說,投影層的結果是生成的“潛在信息”。

計算出潛在值后,我們將其作為圖像標記添加到文本標記之前。之所以添加在前面,是因為將圖像放在文本之前,可以讓模型在預訓練期間更容易學習。可以將其想象為具有表示實際圖像的標記,然后具有表示文本中圖像內容的標記:幾乎就像與圖像配對的標題。我們的架構與 LLaVA-UHD 的架構幾乎相同(他們選擇 CLIP-ViT,而我們使用 SigLIP,并且他們與 Vicuna-13B 配合使用),因此我們在下面提供了它們的圖示作為參考:

被作者刪庫的Llama 3-V原文再現!效果匹敵GPT4-V,區區不到500 美元,如何做到的-AI.x社區圖片

現在我們已經確定了預訓練所需的數據,我們可以深入了解它實際上是什么樣子。在預訓練中,我們使用 600,000 個將圖像添加到文本的示例。在此步驟中,我們保持 Llama-3 架構的主要權重不變。

關鍵是我們只想更新投影矩陣的梯度。至關重要的是,我們保持其余權重不變。至此,我們完成了預訓練步驟的流程。這里的關鍵是將嵌入圖像(潛在圖像)與其文本以聯合表示形式對齊,然后預訓練 LLaMA-3 以專注于根據遇到的示例更新投影矩陣。

5.監督微調

在預訓練之后,我們進行監督微調以增強模型的性能。在此步驟中,我們將凍結計算出的嵌入(來自投影層),并將除視覺和投影矩陣之外的所有內容保持凍結狀態。換句話說,如果您查看下圖,紅色組件未凍結,而藍色組件凍結。這旨在用作“指令”微調 - 換句話說,使模型更適合多模態文本輸出。在此階段,我們使用 1M 個示例(7M 個分割圖像)。

被作者刪庫的Llama 3-V原文再現!效果匹敵GPT4-V,區區不到500 美元,如何做到的-AI.x社區圖片

6.總結

  • 我們為 Llama3 8B 添加了視覺編碼器
  • 與當前開源 SOTA 視覺語言模型 Llava 相比,我們的模型性能提高了 10-20%。
  • 我們提供與 GPT4v、Gemini Ultra 和 Claude Opus 等尺寸接近 100 倍* 的模型相當的視覺能力。
  • 我們描述了一種高效的流程,用于在不到 500 美元的時間內對模型進行預訓練和指令微調。

【后記】距離ChatGPT發布,一年多已過去,大模型研究者們,再次身處于LLM浪潮的風暴眼中,隨著開源大模型的出現,我們開始看到前所未有的研究速度和成果涌現,也開始看到在這個新領域中伴生著始料未及的“魔幻”劇情。

本文無意于探討開源AI模型的“套殼”、“抄襲”的界定,更多在于討論讓大模型從文本走向視覺多模態,究竟需要哪些步驟、訓練和推理成本都有哪些降低的技巧、需要怎樣的技術活?這些也許是大家更需要的。

本文轉載自??51CTO技術棧??,作者:言征

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-6-4 13:13:49修改
收藏
回復
舉報
回復
相關推薦
欧美极品色图| 69国产精品成人在线播放| 三区视频在线观看| 国产91在线视频蝌蚪| 国产成a人亚洲精| 5278欧美一区二区三区| 欧美黄色高清视频| 日韩精品中文字幕一区二区| 精品露脸国产偷人在视频| 日韩亚洲一区在线播放| 国产99久一区二区三区a片 | 精品在线播放午夜| 欧美精品久久久久| 国产免费嫩草影院| 欧美日韩一区二区三区在线电影| 欧美日韩一区二区在线观看视频 | 国产欧美一级| 久久精品视频在线| 中文字幕一区二区人妻在线不卡| 亚洲资源在线| 色婷婷国产精品久久包臀| 91xxx视频| 欧洲成人av| 国产成人99久久亚洲综合精品| 国产精品精品一区二区三区午夜版| 可以直接看的黄色网址| 天堂99x99es久久精品免费| 在线播放中文一区| 少妇激情一区二区三区| av老司机免费在线| 一区二区三区中文字幕电影 | 青青草精品在线| 午夜精品成人av| 亚洲国产乱码最新视频| 最新视频 - x88av| 中文字幕日本在线观看| 成人aaaa免费全部观看| 亚洲精品免费网站| 在线观看中文字幕码| 久热国产精品| 欧美影院在线播放| 国产成人精品亚洲男人的天堂| 久久国产精品亚洲人一区二区三区 | www.国产黄色| 激情六月婷婷综合| 国产精品极品美女粉嫩高清在线| 亚洲午夜18毛片在线看| 亚洲毛片一区| 性欧美激情精品| 久久久久久av无码免费网站| 综合国产精品| 蜜臀久久99精品久久久久久宅男 | 国产精品91在线| 国产一区二区三区四区五区| 国产精品电影一区二区三区| 日韩.欧美.亚洲| 奇米影视888狠狠狠777不卡| 久久色中文字幕| 欧美精品123| 噜噜噜在线观看播放视频| 久久综合九色综合欧美亚洲| 久久另类ts人妖一区二区| 天天干天天摸天天操| 不卡免费追剧大全电视剧网站| 国产精品对白刺激久久久| 国精产品一品二品国精品69xx| 福利91精品一区二区三区| 国产成人亚洲欧美| 欧美一级特黄aaaaaa大片在线观看 | 国产区在线观看成人精品| 日韩av电影免费播放| 91吃瓜网在线观看| 亚洲图片你懂的| 四虎4hu永久免费入口| 毛片网站在线看| 黑人精品xxx一区| 99热手机在线| www久久久| 精品999久久久| 日本黄色网址大全| 奇米影视亚洲| 欧美剧在线观看| 国产成人无码一区二区三区在线| 美女国产精品| 91精品国产综合久久香蕉| 精品欧美一区二区精品少妇| 成人在线综合网站| 欧美亚洲另类久久综合| 米奇777四色精品人人爽| 伊人一区二区三区| 日韩黄色片视频| 色999韩欧美国产综合俺来也| 日韩精品一区在线| 中文字幕在线免费看线人| 日韩欧美自拍| 性金发美女69hd大尺寸| 中文字幕在线观看高清| 国产乱色国产精品免费视频| 久久久久久久久四区三区| 在线播放毛片| 亚洲成人www| www欧美激情| 精品国产一区二区三区不卡蜜臂| 在线视频日韩精品| 国产一级二级三级视频| 日韩一区精品视频| 国产98在线|日韩| wwwww在线观看免费视频| 亚洲一级在线观看| 婷婷六月天在线| 国产精品男女| 久久激情视频免费观看| 国产乱国产乱老熟| 国产xxx精品视频大全| 深夜福利成人| 超碰在线视屏| 欧美日韩不卡一区二区| 亚洲一区二区乱码| 综合一区在线| 国产精品va在线| 神马午夜在线观看| 亚洲免费观看高清| 亚洲熟妇无码一区二区三区| 婷婷激情成人| 一区二区欧美亚洲| 秋霞精品一区二区三区| 国产不卡高清在线观看视频| 亚洲一二三区精品| 欧美电影免费看| 亚洲精品不卡在线| 强乱中文字幕av一区乱码| 蜜桃视频一区二区三区 | 成久久久网站| 欧美性在线视频| 蜜臀久久久久久999| 亚洲精品一二三| 蜜臀一区二区三区精品免费视频 | 日韩成人在线视频观看| 欧美激情一区二区视频| 国产一区二区网址| 一区二区冒白浆视频| 69堂免费精品视频在线播放| 亚洲精品美女免费| 日韩欧美高清在线观看| 白白色 亚洲乱淫| 亚洲中文字幕无码av永久| 中文字幕亚洲在线观看 | 欧美momandson| 精品在线欧美视频| 免费观看一区二区三区毛片| aaa欧美日韩| 欧美一级视频免费看| 福利在线一区| 91精品国产91久久久久久久久| 人妻与黑人一区二区三区| 亚洲国产日产av| 欧美肉大捧一进一出免费视频| 影音国产精品| 精品国产一区二区三| 在线视频cao| 亚洲欧洲日韩国产| 羞羞色院91蜜桃| 国产精品高潮呻吟久久| 手机在线视频一区| 欧美视频四区| 久久66热这里只有精品| 都市激情亚洲综合| 在线观看久久av| 国产一区二区三区三州| 亚洲乱码国产乱码精品精可以看| 麻豆tv在线观看| 国产精品外国| 日本10禁啪啪无遮挡免费一区二区| 色香欲www7777综合网| 中文字幕成人精品久久不卡| 国产精品无码久久av| 一区二区欧美在线观看| 西西大胆午夜视频| 日韩av一区二区三区四区| 综合操久久久| 国产精品115| 日韩av电影在线网| 日韩在线资源| 精品动漫一区二区三区在线观看| 日韩不卡在线播放| 亚洲国产精品成人综合| 欧美污在线观看| 国产精品久久久一区二区| 日本在线观看一区二区三区| 国产精品白丝久久av网站| 久久噜噜噜精品国产亚洲综合| 青青青草原在线| 这里只有精品电影| 羞羞影院体验区| 国产精品短视频| 日本japanese极品少妇| 麻豆91在线播放免费| 日韩欧美精品免费| 精品久久一区| 国产精品久久久久久久久久直播| 日韩精品99| 欧美国产第二页| av网站在线播放| 日韩av在线影院| 国产偷拍一区二区| 色94色欧美sute亚洲13| 免费在线视频一区二区| 欧美激情综合网| 制服丝袜在线第一页| 麻豆免费看一区二区三区| 日韩精品 欧美| 久久久久亚洲| 色姑娘综合av| 亚洲精品**不卡在线播he| 亚洲综合小说区| 国产精品天堂蜜av在线播放| 91成人在线视频| 日韩欧美一起| 日韩亚洲第一页| 成年人在线免费观看| 日韩成人网免费视频| 国产农村妇女毛片精品| 91成人免费在线视频| 国产在线综合网| 亚洲欧美偷拍卡通变态| 四虎地址8848| 欧美国产国产综合| 在线免费观看日韩av| www.激情成人| 野战少妇38p| 国产精品一二三区在线| 99九九99九九九99九他书对| 日韩黄色免费电影| 四虎永久在线精品无码视频| 日韩午夜激情| 国产成人永久免费视频| 欧美在线视屏| 国产精品一区在线免费观看| 国产精品久久久乱弄| 亚洲永久激情精品| 精品一区二区三区中文字幕老牛| 精品一区久久| 国产 日韩 欧美 综合 一区| 国产99视频精品免费视频36| 亚洲精品国产九九九| 成人免费福利在线| 91精品网站在线观看| 91香蕉亚洲精品| 亚洲精品伦理| 成人精品久久av网站| 亚洲国产一区二区久久| 成人免费激情视频| 国产一区二区三区国产精品| 91九色在线观看| 亚洲精品a区| www日韩av| 久久久久久毛片免费看| 精品免费日产一区一区三区免费| 久久人人爽人人爽人人片av不| 国产免费一区二区三区| 日韩电影不卡一区| 区一区二区三区中文字幕| 青青草91久久久久久久久| 中文字幕一区二区三区四区五区六区| 国产精品久久占久久| 国产经典久久久| 狠狠综合久久| av网站在线观看不卡| 日本不卡视频在线| 中文字幕视频三区| 国产99久久久久久免费看农村| 亚洲少妇18p| 国产亚洲精品福利| 亚洲一二三在线观看| 亚洲一区二区高清| 五月天激情国产综合婷婷婷| 欧美亚洲国产一卡| 性生活黄色大片| 精品亚洲精品福利线在观看| eeuss影院在线观看| 精品精品国产国产自在线| 国产嫩草在线视频| 国产成人精品在线播放| 91亚洲精品在看在线观看高清| 岛国视频一区免费观看| 天堂资源在线亚洲| 亚洲一区尤物| 最新国产拍偷乱拍精品 | 国产精品一二三在| 久久国产精品无码一级毛片| 国产精品免费aⅴ片在线观看| 欧美日韩中文字幕在线观看| 色综合夜色一区| 国产农村老头老太视频| 亚洲毛片在线看| 国产精品剧情| 欧美在线一级va免费观看| 高清一区二区| 欧美精品中文字幕一区二区| 亚洲无中文字幕| 日本日本19xxxⅹhd乱影响| 久久成人免费电影| 国产精品揄拍100视频| 亚洲美女少妇撒尿| 中文字幕精品无码一区二区| 欧美刺激午夜性久久久久久久| 久久这里精品| 久久久视频在线| 国产成人久久精品一区二区三区| 欧美日韩精品不卡| 欧美三区不卡| 91热视频在线观看| 久久久精品免费免费| 日韩黄色在线视频| 欧美裸体一区二区三区| 每日更新在线观看av| 欧美国产在线视频| 高清不卡一区| 亚洲精品8mav| 天堂精品中文字幕在线| 中文字幕人妻一区二区三区| 亚洲精品午夜久久久| 亚洲免费视频二区| 亚洲精品一区中文| 成人国产电影在线观看| 亚洲淫片在线视频| 久久在线视频免费观看| av动漫免费看| 99精品欧美一区二区三区综合在线| 国产一区二区视频在线观看免费| 欧美午夜精品久久久| 精品电影在线| 欧美一级在线播放| 久久久免费毛片| 欧美 日韩 亚洲 一区| 国产91精品一区二区麻豆亚洲| 波多野结衣家庭教师| 91麻豆精品国产91久久久使用方法 | 中文字幕资源网| 国产亚洲激情在线| 亚洲成人人体| 欧美色欧美亚洲另类七区| 先锋影音久久久| 六月婷婷七月丁香| 色综合欧美在线| 国产尤物视频在线| 日本精品视频在线| 久久99高清| 99免费视频观看| 国产午夜亚洲精品理论片色戒 | 在线播放中文字幕一区| 中文字幕在线播放| 成人一区二区电影| 亚洲老妇激情| 日本精品一二三| 亚洲第一在线综合网站| 天堂国产一区二区三区| 98视频在线噜噜噜国产| 亚洲精品亚洲人成在线| 爱情岛论坛成人| 国产精品久久久久9999吃药| 91久久精品无码一区二区| 久久伊人色综合| 9l亚洲国产成人精品一区二三| 欧美又粗又长又爽做受| 91污在线观看| 在线观看污污网站| 日韩视频中文字幕| 日韩免费一级| 黄色免费视频大全| 中文字幕av一区二区三区| 一级黄色片网站| 久久久久亚洲精品国产| 亚洲欧洲av| 特级西西444www| 福利视频第一区| 欧美三级理伦电影| 国产精品国产精品国产专区蜜臀ah | 少妇高清精品毛片在线视频| 国产欧美久久久精品影院| 国产精品久久久久久无人区| 国语自产在线不卡| 精品国产一区二区三区小蝌蚪| 怡红院亚洲色图| 亚洲国产精品人人做人人爽| 精品视频三区| av日韩免费电影| 久久久蜜桃一区二区人| 国产精品99久久久久久成人| 亚洲第一区中文99精品| 韩国成人在线| bt天堂新版中文在线地址| 久久婷婷成人综合色| 国产欧美综合视频| 5252色成人免费视频| 亚洲国产一成人久久精品| 最近日本中文字幕| 9191国产精品| 香蕉视频亚洲一级| 少妇大叫太大太粗太爽了a片小说|