精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video)) 原創

發布于 2025-1-9 16:03
瀏覽
0收藏

LLaVA

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

模型架構目標是結合預訓練LLM和視覺模型的能力,llava使用Vicuna作為的LLM (語言解碼器),CLIP作為視覺編碼器。

  1. 視覺編碼器:使用預訓練的CLIP視覺編碼器ViT-L/14來提取圖像特征。該編碼器提供視覺特征 。
  2. 線性層:使用一個簡單的線性層將圖像特征轉換為語言嵌入空間。應用一個可訓練的投影矩陣 W 將 Zv轉換為語言嵌入標記 Hv,其維度與語言模型中的詞嵌入空間相同:
  3. 序列生成:通過這種方式,得到了一個視覺標記序列 Hv。該投影方案是輕量級的。
  4. 指令跟隨:對于每個圖像 Xv,生成多輪對話數據,其中 T 是總輪數。將它們組織成一個序列,所有答案被視為助手的響應,第 t 輪的指令 Xtinstruct為:

    LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

  5. 訓練目標:訓練的目標是最大似然概率,就是每一步token預測的最大概率乘積,Xa是答案、Xv是圖像、Xinstruct是指令,θ是每個階段可訓練的參數。:

    LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

訓練過程分兩階段:

  1. 階段1:特征對齊預訓練:從CC3M中篩選出595K圖像-文本對。這些對通過簡單的擴展方法轉換為指令跟隨數據。每個樣本可以被視為單輪對話。在訓練中,保持視覺編碼器和LLM權重凍結,并最大化訓練目標中的似然,其中可訓練參數 θ=W(投影矩陣)。
  2. 階段2:端到端微調始終保持視覺編碼器權重凍結,并繼續更新LLaVA中的投影層和LLM的預訓練權重;即可訓練參數為 θ = { W, ? }。使用對話、詳細描述和復雜推理數據。

LLaVA 1.5

LLaVA1.5是LLaVA改進版本,主要在網絡結構、數據集規模上進行改進。

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

LLaVA 1.5模型結構還是之前的llava模型結構,但是做了一些小修改:

  1. 將視覺-語言連接器由線性投影修改成一個兩層的mlp(前期文章的NVLM-D也是兩層的mlp鏈接視覺-語言模型);
  2. 將224分辨率的視覺編碼器修改為336pix的視覺編碼器(帶有MLP投影的CLIP-ViT-L-336px)。其余還是llava的模型結構。

另外,LLaVA 1.5在sft數據、相應格式上做了些改進,有興趣看看原文。LLaVA 1.5還引入了高分辨率輸入,這種方法允許模型擴展到任意分辨率,同時保持數據效率。

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

LLaVA-1.5-HD。通過將圖像分割成網格并獨立編碼,對LLaVA-1.5進行更高分辨率的縮放。這使得模型能夠縮放到任何分辨率,而無需對ViT執行位置嵌入插值。還拼接下采樣圖像的特征,以向LLM提供全局上下文。

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

當將圖像分辨率擴展到448×448時,LLaVA-1.5-HD在所有基準測試上的整體性能進一步提高,特別是在需要圖像細節感知任務上。

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

LLaVA 1.5 致力于解決的主要問題為:怎樣在受控的環境下設計多模態大模型(MLLM),以及如何在 LLaVA 框架內進行視覺指令的調優工作。確切而言,其研究重點聚焦于通過簡易的調整來優化 LLaVA 的性能表現,進而令其在多項基準測試中取得最先進的成果。

LLaVA-NeXT(LLaVA-1.6)

與LLaVA-1.5相比,LLaVA-NeXT有幾個改進:

  1. 將輸入圖像分辨率提高到 4 倍像素。這使其能夠掌握更多視覺細節。它支持三種寬高比,最高分辨率為 672x672、336x1344、1344x336。
  2. 通過改進的視覺指令調整數據混合,實現更好的視覺推理和 OCR 能力。
  3. 更好的視覺對話,適用于更多場景,涵蓋不同的應用。更好的世界知識和邏輯推理。
  4. 使用SGLang進行高效部署和推理。
  5. 語言模型側:使用更大更強的LLM來提升多模態能力:基于最新的LLaMA3 8B、Qwen-1.5 72B 和Qwen-1.5 110B,LLaVA-NeXT可以繼承更好的視覺世界知識和邏輯推理能力。

LLaVA-NeXT(Video)

相比LLaVA-NeXT改進點:

1.使用 AnyRes 實現零樣本視頻表示能力: AnyRes 技術可以自然地將高分辨率圖像表示為經過預先訓練的 VIT 能夠消化的多個圖像,并將它們形成一個串聯序列。該技術可以自然推廣到表示視頻(由多個幀組成),從而使僅經過圖像訓練的 LLaVA-Next 模型在視頻任務上表現出色。值得注意的是,這是 LMM 首次展示出強大的零樣本模態遷移能力。
AnyRes:從多塊到多幀:LLaVA-NeXT 中引入的AnyRes算法在處理任何高分辨率圖像時實現了性能效率和操作成本之間的最佳平衡。它將圖像分割成具有各種配置的子圖像網格,例如 {2x2, 1x{2,3,4}, {2,3,4}x1}。

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

說明 AnyRes 將一組圖像消化為一系列連接的視覺標記,從而實現統一的圖像和視頻輸入,這自然支持從多圖像到多幀的演變只需進行細微調整,LLaVA-NeXT 便可以處理以 {1xN} 網格排列的N 個視頻幀。假設每幀包含 24x24 個標記,則視頻的總標記數將為 24x24xN。但是,考慮到 LLM 的“max_token_length”限制為 4096,確保 24x24xN + 文本標記數 < 4096 以避免無意義的輸出至關重要。這需要在每幀的標記數和總幀數之間進行仔細的平衡。例如,應用步幅為 2 的空間池化可將每幀的標記數從 24x24 減少到 12x12,最多可容納 16 幀。我們的研究結果表明,在 16 幀中配置 12x12 個標記可獲得最佳性能。但是,16 幀可能不足以捕捉大多數視頻的精髓。接下來,我們重點關注如何讓 LLaVA-NeXT 處理更多幀。

2.具有長度泛化的推理可改善較長視頻的性能。線性縮放技術可實現長度泛化,從而使 LLaVA-NeXT 能夠有效處理超出 LLM 的“max_token_length”限制的長視頻。
長度泛化:從多幀到長視頻:受到 LLM 中處理長序列的最新進展的啟發,例如在旋轉位置嵌入 (RoPE) 中實現線性縮放,我們在 LLaVA-NeXT 中應用了類似的縮放方法。例如,通過引入縮放因子 2,我們有效地將模型的“max_token_length”容量翻倍,使其能夠處理最多 8192 個 token 的序列。借助這種技術,LLaVA-NeXT 可以處理最多 56 幀,每幀 token 數為 12x12,大大擴展了模型在分析較長視頻序列方面的適用性。

LLaVA系列算法架構演進:LLaVA(1.0->1.5->Next(1.6)->NeXT(Video))-AI.x社區

長度泛化的說明,用于處理具有更多幀的長序列,其中推理中的序列長度可能比訓練中的序列長度更長。這種線性縮放的調整不僅有利于處理更多幀,而且為 LLaVA-NeXT 在綜合視頻分析中的應用開辟了新的途徑,為該領域的未來研究樹立了先例。

3.強大的視頻理解能力。(1)LLaVA-Next-Image結合了上述兩種技術,與針對視頻進行調整的開源 LMM 相比,其零樣本性能更出色。(2)LLaVA-Next-Video是對視頻數據進行進一步監督微調 (SFT) 的 LLaVA-Next-Image,與 LLaVA-Next-Image 相比,其視頻理解能力更佳。(3)LLaVA-Next-Video-DPO使用直接偏好優化 (DPO) 將模型響應與 AI 反饋對齊,性能顯著提升。
LLaVA-Next-Video-DPO(AI反饋直接偏好優化):基于 人類反饋的強化學習 (RLHF) 的最新進展有效地指導LLMs生成更誠實、有用且無害的內容。它們在多式聯運環境中的有效性仍然有限。關鍵的障礙在于(1)開發一個強大的獎勵系統,能夠區分偏好的響應和不太偏好的響應,以及(2)從人類那里獲取高質量的偏好數據既昂貴又費力,特別是對于多幀的視頻輸入。作為一種經濟高效的替代方案,我們最近的研究 LLaVA-Hound考慮了使用LLM獎勵的人工智能反饋。DPO 用于基于LLM生成的偏好數據來訓練 LMM,其中視頻以其詳細的字幕作為支持證據。按照相同的方法,基于更強的 SFT LMM LLaVA-NeXT-Video 探索 DPO,從而形成最終模型 LLaVA-NeXT-Video-DPO。

4.使用SGLang進行高效部署和推理。它使視頻任務的推理速度提高了 5 倍,從而實現了更具可擴展性的服務,例如百萬級視頻重新字幕。

參考文獻

  • Visual Instruction Tuning,https://arxiv.org/pdf/2304.08485
  • Improved Baselines with Visual Instruction Tuning,https://arxiv.org/pdf/2310.03744
  • LLaVA-NeXT: Improved reasoning, OCR, and world knowledge,https://llava-vl.github.io/blog/2024-01-30-llava-next
  • A Strong Zero-shot Video Understanding Model,https://llava-vl.github.io/blog/2024-04-30-llava-next-video


本文轉載自公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/QwPwsw03d1yTpI607ligiw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
日韩女优人人人人射在线视频| 欧美影视资讯| 免费萌白酱国产一区二区三区| 久久久亚洲综合| www.欧美精品| 5月婷婷6月丁香| 五月天av网站| 在线观看爽视频| 国产精品资源站在线| 亚洲女人天堂网| 少妇大叫太大太粗太爽了a片小说| 波多野结衣电车痴汉| 久久99精品国产自在现线| 亚洲欧美成人一区二区三区| 国产精品久久久久久久久久久不卡| 农村末发育av片一区二区| 成年人在线免费观看| 91免费精品国偷自产在线在线| 欧美高清在线视频| 欧美做受高潮电影o| 国产二级一片内射视频播放 | 日韩中文字幕不卡| 亚洲黄在线观看| 日本中文字幕亚洲| 黄频在线免费观看| 欧美.www| 精品人在线二区三区| 日本a级片在线播放| 国产99999| 欧美人成在线| 精品久久久久久久久久久久久久久 | 成年人看片网站| 国产亚洲精品精品国产亚洲综合| 国产日韩精品一区| 国产精品电影网| 日本学生初尝黑人巨免费视频| 99香蕉久久| 337p亚洲精品色噜噜| 美国av在线播放| 国产精品嫩草影院精东| 国产精品91一区二区三区| 欧美日韩视频第一区| 亚洲欧美日韩在线综合| 国产一区二区三区黄片| 一本一本久久a久久综合精品| 欧美日韩高清一区二区三区| 国产欧美自拍视频| 国产 欧美 精品| 国产资源在线一区| 欧美精品做受xxx性少妇| 亚洲天堂一区二区在线观看| 成人三级小说| 91理论电影在线观看| 国产精品久久久久一区二区| 在线免费看av网站| 66精品视频在线观看| 一本一道久久a久久精品综合蜜臀| 欧美精品一区在线| 在线观看中文字幕av| 91精品推荐| 亚洲国产欧美精品| av黄色一级片| 日本中文字幕在线一区| 亚洲国产高清福利视频| 狠狠热免费视频| 成人免费在线| 91尤物视频在线观看| 国产精品美女无圣光视频| 中文字幕精品无| 综合久久99| 欧美另类高清videos| 亚洲成人网在线播放| avtt久久| 色94色欧美sute亚洲13| 91网站在线观看免费| 成人短视频在线观看| 亚洲精品乱码久久久久久| 国产伦精品一区二区三区照片91 | youjizz在线播放| 国产精品乱码一区二三区小蝌蚪| 91在线无精精品一区二区| 超碰超碰超碰超碰| 午夜影院欧美| 欧美俄罗斯乱妇| 国产精品国产三级国产专业不| 久久99成人| 91黄视频在线| 天天操狠狠操夜夜操| 成人性生交大片免费观看网站| 亚洲婷婷国产精品电影人久久| 欧美成人dvd在线视频| www.超碰在线.com| 久久国产精品99精品国产| 欧美专区在线视频| 中文字幕人妻互换av久久| 国产亚洲毛片| 欧美极品第一页| 国产av无码专区亚洲av毛网站| 激情久久中文字幕| 久久高清视频免费| 亚洲精品视频在线观看免费视频| 亚洲精品网址| 98精品国产高清在线xxxx天堂| 日本成人免费在线观看| 亚洲免费专区| 亚洲精品网站在线播放gif| 亚洲成年人在线观看| 一区二区三区四区高清视频| 亚洲欧美日韩直播| 青娱乐91视频| 国内成人在线| 久久91精品国产| 伊人久久久久久久久久久久 | 日韩欧美成人网| 日韩人妻无码精品久久久不卡| 怡红院在线播放| 亚洲你懂的在线视频| 一本久道综合色婷婷五月| 午夜不卡影院| 日韩一区二区三区观看| 性生活一级大片| 狠狠色丁香婷婷综合影院| 亚洲色图第三页| 天天躁日日躁aaaxxⅹ | 夜夜添无码一区二区三区| 国产成人福利夜色影视| 欧美中文字幕一二三区视频| 九色porny91| 国产成人精品123区免费视频| 欧美怡红院视频| 超碰成人在线播放| 国产在视频线精品视频www666| 欧美激情免费在线| 国产情侣自拍小视频| 国产精品综合av一区二区国产馆| 日本一区二区三区四区高清视频 | 欧美超级免费视 在线| 青娱乐在线免费视频| 26uuu久久天堂性欧美| 波多野结衣之无限发射| 奇米777日韩| 欧美日韩一本到| brazzers精品成人一区| 性色一区二区| 国产又爽又黄的激情精品视频| 91亚洲国产成人精品一区| 91影院在线免费观看| 和岳每晚弄的高潮嗷嗷叫视频| 亚洲精品一二三**| 欧美黑人性生活视频| 精品人妻一区二区三区日产乱码| 亚洲欧美色一区| 天天爽夜夜爽视频| 国产精品第十页| 国产精品国产亚洲精品看不卡15| 欧美xxxxhdvideosex| 欧美性猛交xxxx乱大交蜜桃| 中文字幕一区三区久久女搜查官| 欧美综合在线视频观看| 欧美成人午夜激情| 99久久精品国产一区色| 亚洲激情六月丁香| 香蕉在线观看视频| 亚洲巨乳在线| 91久久久久久久久| 日韩一区av| 亚洲男人的天堂在线aⅴ视频| 黄色小视频免费网站| 自拍偷拍欧美专区| 国产精品theporn88| h视频在线免费| 欧美日韩一区二区三区免费看| 国产在线免费看| 久久久天天操| 国产成人精品自拍| 日韩脚交footjobhdboots| 91精品久久久久久久99蜜桃 | 蜜芽tv福利在线视频| 亚洲精品视频在线| 国产一线在线观看| 亚洲精品国产偷自在线观看| 99视频免费观看| 98在线视频| 高跟丝袜欧美一区| 性一交一黄一片| 99久久www免费| 成人性色av| 在线观看精品| 欧美成人中文字幕| 欧洲一级在线观看| 91精品国产aⅴ一区二区| 狠狠人妻久久久久久综合蜜桃| 91av精品| 国精产品99永久一区一区| 色操视频在线| 91精品国产91综合久久蜜臀| 中文字幕在线字幕中文| 国产精品美女久久久久久2018| 人妻av一区二区三区| 人人狠狠综合久久亚洲| 欧洲精品一区色| 国产中文欧美日韩在线| 日韩亚洲欧美成人| 欧美 日韩 国产 成人 在线| 亚洲精品国产精品乱码不99| 少妇精品一区二区| 精品无码三级在线观看视频| 在线丝袜欧美日韩制服| 免费一区二区三区四区| 国内成人精品视频| 日本国产在线观看| 欧美亚州韩日在线看免费版国语版| 久草综合在线视频| 国产视频一区在线观看| 久久久久久久穴| 久久99精品国产麻豆婷婷| 日本www在线播放| 国产99久久| 国产精品久久999| a√中文在线观看| 日韩午夜在线影院| 中文字幕人妻一区二区三区视频| 天天操天天色综合| 熟女少妇一区二区三区| 国产日韩一区| 中文字幕中文字幕在线中心一区| 秋霞在线一区| 91在线免费观看网站| 成人在线不卡| 国产精品九九久久久久久久| 裤袜国产欧美精品一区| 5566成人精品视频免费| 青青草免费在线| 精品国产一区二区三区四区四 | 亚洲理论在线| av日韩在线看| 综合五月婷婷| ijzzijzzij亚洲大全| 日韩中文在线电影| 91久久精品国产| 国产成人免费精品| 国产精品视频网址| 2019年精品视频自拍| 国产精品久久久久久av| 日韩精品影片| 国产精品电影在线观看| 日韩中文视频| 国产精品久久久久高潮| 国产精品xxx| 成人免费观看a| 91福利在线免费| 欧美极品xxxx| 涩涩视频网站在线观看| 欧美有码在线观看| 日韩欧美少妇| 国产日韩欧美在线| 国产精一区二区| 91麻豆蜜桃| 国产精品第一国产精品| 国产精品视频地址| 婷婷成人av| 欧美中文字幕第一页| 亚洲黄色中文字幕| 国产精品国产自产拍高清av水多| 国产电影一区二区三区爱妃记| 国产精品中文久久久久久久| 黄在线观看免费网站ktv| 中日韩午夜理伦电影免费| 91av久久久| 欧美一级国产精品| 国产成人精品一区二三区四区五区| 日韩欧美一级二级| 一级片视频免费| 91精品国产综合久久小美女| 亚洲国产精品国自产拍久久| 欧美日韩国产影片| 国产人妖一区二区三区| 精品国产精品一区二区夜夜嗨| 亚洲av成人精品毛片| 欧美一区二区三区男人的天堂| 精品久久国产视频| 日韩精品视频在线观看网址| 99精品免费观看| 日韩高清免费在线| 视频免费一区| 一区二区三区视频在线| 视频福利在线| 欧美大片在线观看一区二区| 日韩国产福利| 久久九九亚洲综合| 亚洲s色大片| 欧美黄色片免费观看| a欧美人片人妖| 亚洲精品欧美极品| 精品中文字幕一区二区三区av| 久久免费看毛片| 国产亚洲精品自拍| 四虎1515hh.com| 久久蜜桃一区二区| 国产精品jizz| 亚洲激情男女视频| 国产三级理论片| 欧洲国内综合视频| 亚洲国产精彩视频| 中文字幕久久久| 日韩激情电影免费看| 亚洲自拍另类欧美丝袜| 国产伦精品一区二区三区千人斩| 乱熟女高潮一区二区在线| 日本免费在线视频不卡一不卡二| 逼特逼视频在线观看| 一区在线观看视频| 欧美人禽zoz0强交| 色婷婷综合久久久久中文| 午夜精品久久久久久久爽| 一区二区欧美久久| 欧洲一区精品| 国产精品三区www17con| 午夜激情久久| 中文字幕第21页| 久久久综合激的五月天| 国产精品自拍视频一区| 日韩小视频在线观看专区| 欧美尤物美女在线| 不卡毛片在线看| 蜜臀av国内免费精品久久久夜夜| 国产精品亚洲自拍| 国产探花一区二区| 日本一本二本在线观看| 日本网站在线观看一区二区三区| 国产不卡一二三| 亚洲午夜视频在线观看| 五月婷婷视频在线| 亚洲精品一区二区三区99| 性欧美高清come| 亚洲一区二区三| 婷婷丁香综合| 欧美视频亚洲图片| 成人97人人超碰人人99| 中文字幕一二三四区| 性做久久久久久久免费看| 最新中文字幕在线观看视频| 日韩精品中文字幕在线| 男人天堂视频在线观看| 精品国产_亚洲人成在线| 欧美另类69xxxxx| av免费网站观看| 久久精品一区八戒影视| 久久久久女人精品毛片九一| 日韩成人在线免费观看| 亚洲精品一区| 日韩av在线电影观看| 欧美+亚洲+精品+三区| 亚洲妇熟xx妇色黄蜜桃| 99re成人精品视频| 日韩人妻无码一区二区三区99| 亚洲国产精久久久久久 | xxxx黄色片| 欧美色道久久88综合亚洲精品| 青春有你2免费观看完整版在线播放高清| 91福利视频在线观看| 国产亚洲电影| 免费一区二区三区在线观看| 成人午夜在线视频| 91视频免费看片| 欧美疯狂性受xxxxx喷水图片| 懂色av一区二区三区四区| 久久久这里只有精品视频| 色婷婷狠狠五月综合天色拍| 干日本少妇视频| 国产精品一品二品| 日韩av无码中文字幕| 亚洲欧美在线免费| 欧美男女视频| 免费网站在线观看视频| 久久老女人爱爱| 国产一区二区三区四区视频 | 二区三区不卡| 亚洲午夜精品一区二区三区| 国产毛片久久| 老司机福利在线观看| 日韩亚洲欧美一区二区三区| 一二三四视频在线中文| 亚洲三区在线观看| 国产高清在线观看免费不卡| 日本不卡一区视频| 日韩欧美成人午夜| 厕沟全景美女厕沟精品| 婷婷五月色综合| 美女精品在线观看| 亚洲性图第一页| 日韩欧美亚洲综合| 成人短视频在线| 日本三级中国三级99人妇网站| 激情久久五月天| 久久黄色精品视频| 精品成人佐山爱一区二区| 台湾佬成人网| 成人国产一区二区三区| 久久久高清一区二区三区|