精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Florence-VL來了!使用生成式視覺編碼器,重新定義多模態(tài)大語言模型視覺信息

人工智能 新聞
Florence-VL 提出了使用生成式視覺編碼器 Florence-2 作為多模態(tài)模型的視覺信息輸入,克服了傳統(tǒng)視覺編碼器(如 CLIP)僅提供單一視覺表征而往往忽略圖片中關(guān)鍵的局部信息。

本文由馬里蘭大學(xué),微軟研究院聯(lián)合完成。作者包括馬里蘭大學(xué)博士生陳玖海,主要研究方向?yàn)檎Z言模型,多模態(tài)模型。通訊作者為 Bin Xiao, 主要研究方向?yàn)橛?jì)算機(jī)視覺,深度學(xué)習(xí)和多模態(tài)模型。其他作者包括馬里蘭大學(xué)助理教授Tianyi Zhou , 微軟研究院研究員 Jianwei Yang , Haiping Wu, Jianfeng Gao 。

圖片

  • 論文:https://arxiv.org/pdf/2412.04424
  • 開源代碼:https://github.com/JiuhaiChen/Florence-VL
  • 項(xiàng)目主頁:https://jiuhaichen.github.io/florence-vl.github.io/
  • 在線 Demo:https://huggingface.co/spaces/jiuhai/Florence-VL-8B
  • 模型下載:https://huggingface.co/jiuhai/florence-vl-8b-sft

Florence-VL 提出了使用生成式視覺編碼器 Florence-2 作為多模態(tài)模型的視覺信息輸入,克服了傳統(tǒng)視覺編碼器(如 CLIP)僅提供單一視覺表征而往往忽略圖片中關(guān)鍵的局部信息。 然而 Florence-2 通過生成式預(yù)訓(xùn)練,將多種視覺任務(wù)(如圖像描述、目標(biāo)檢測(cè)、文字識(shí)別和對(duì)象定位)統(tǒng)一為 sequence-to-sequence 結(jié)構(gòu),并通過 prompt 來完成多樣化的視覺任務(wù)。在 Florence- VL 中,我們僅使用一個(gè)視覺編碼器 Florence-2,但采用多個(gè)不同的 prompt,分別注重 caption,OCR 和 grounding,來獲得不同層次的視覺表征。通過融合這些不同深度的特征,F(xiàn)lorence-VL 實(shí)現(xiàn)了更全面的視覺理解。

圖片


圖片

引言

隨著大規(guī)模語言模型(LLM)的快速發(fā)展,多模態(tài)大語言模型(MLLMs)成為視覺與語言任務(wù)的主流解決方案。然而,現(xiàn)有的視覺編碼器(如 CLIP 和 SigLIP)雖然在整體語義提取方面表現(xiàn)出色,但存在明顯不足:

  1. 缺乏細(xì)粒度理解:僅捕獲圖像的整體語義,忽略像素級(jí)和局部區(qū)域的細(xì)節(jié)。
  2. 任務(wù)泛化能力有限:難以適配 OCR、物體定位等需要特定視覺特征的任務(wù)。

Florence-VL 正是針對(duì)這一問題提出的解決方案。通過引入生成式視覺基礎(chǔ)模型 Florence-2,F(xiàn)lorence-VL 在保持高效訓(xùn)練的同時(shí),能夠靈活適配不同任務(wù),彌補(bǔ)傳統(tǒng)視覺編碼器的缺陷。

在接下來的部分,我們將詳細(xì)介紹 Florence-2 背后的技術(shù)原,F(xiàn)lorence-VL 如何利用多任務(wù)視覺特征,以及我們提出的深度 - 廣度融合策略如何實(shí)現(xiàn)視覺信息的高效整合。

背景介紹:Florence-2

傳統(tǒng)視覺編碼器如 CLIP 和 SigLIP 主要依賴對(duì)比學(xué)習(xí)來預(yù)訓(xùn)練,雖然能在跨模態(tài)任務(wù)中取得不錯(cuò)效果,但其輸出的圖像特征通常是單一的全局語義表示,難以捕獲細(xì)粒度信息。這一缺陷使得這些模型在 OCR 文本提取、對(duì)象定位等任務(wù)上表現(xiàn)不佳。

Florence-2 則采用了生成式預(yù)訓(xùn)練的方式,將多種視覺任務(wù)統(tǒng)一到一個(gè)編碼 - 解碼框架中,能夠根據(jù)不同任務(wù)提示生成多樣化的視覺特征。

Florence-2 的主要流程包括:

  1. 視覺編碼器 DaViT:將輸入圖像轉(zhuǎn)換為基礎(chǔ)視覺特征。
  2. 任務(wù)提示機(jī)制:通過不同的文本提示調(diào)整生成目標(biāo),從而提取任務(wù)特定的視覺信息。
  3. 編碼 - 解碼框架:結(jié)合視覺和文本特征,輸出滿足不同任務(wù)需求的結(jié)果。

通過這一架構(gòu),F(xiàn)lorence-2 實(shí)現(xiàn)了全局語義到局部細(xì)節(jié)的視覺特征生成,為多模態(tài)任務(wù)提供了更全面的視覺表示。接下來我們將介紹如何使用 Florence-2 來構(gòu)建 Florence-VL。

方法:深度與廣度融合 (DBFusion)

Florence-VL 的核心創(chuàng)新在于我們提出的深度 - 廣度融合(Depth-Breadth Fusion)策略,它充分挖掘 Florence-2 的生成式特性,將多任務(wù)提示和多層級(jí)特征有效結(jié)合,形成更豐富的視覺表征。

1. 廣度:通過任務(wù)提示擴(kuò)展視覺表征

不同的視覺任務(wù)需要不同的視覺信息。例如:

  • Captioning:用于理解圖像整體語義,生成描述性文本。
  • OCR:提取圖像中的文本內(nèi)容,尤其適用于帶有文字的圖像。
  • Grounding:用于定位物體,捕捉物體之間的關(guān)系。

Florence-2 通過不同的任務(wù)提示,生成針對(duì)性強(qiáng)的視覺特征,從而實(shí)現(xiàn)視覺特征的 “廣度” 擴(kuò)展。

2. 深度:整合多層級(jí)的視覺特征

Florence-2 的不同深度層能夠捕獲從 low- level 到 high-level 的視覺特征,這種多層級(jí)特征的結(jié)合,保證了視覺編碼器既能關(guān)注細(xì)節(jié),又能捕獲整體信息。

3. 融合策略:通道拼接實(shí)現(xiàn)高效整合

為了將多任務(wù)和多層級(jí)的特征高效融合,我們?cè)O(shè)計(jì)了通道拼接(Channel Integration)策略。具體做法是將不同特征按通道維度拼接,并通過 MLP 映射到語言模型的輸入空間。這一策略的優(yōu)勢(shì)在于:避免了增加訓(xùn)練與推理時(shí)的序列長(zhǎng)度以及最大程度保留了視覺特征的多樣性與完整性。

圖片

分析:多種視覺編碼器的對(duì)比

為探討不同視覺編碼器(如 CLIP、SigLIP、DINOv2 和 Florence-2)和大語言模型的對(duì)齊能力,我們采用了實(shí)驗(yàn)來定量評(píng)估不同視覺編碼器與語言模型的跨模態(tài)對(duì)齊質(zhì)量。具體方法如下:對(duì)于每組圖文配對(duì) (image- caption pair),視覺編碼器生成視覺特征,語言模型生成文本特征,我們通過可訓(xùn)練投影對(duì)視覺特征和文本特征進(jìn)行維度對(duì)齊,并且通過對(duì)齊損失函數(shù)來評(píng)估視覺編碼器和語言模型的對(duì)齊能力。實(shí)驗(yàn)結(jié)果表明,F(xiàn)lorence-2 相較于其他視覺編碼器顯示出更優(yōu)的跨模態(tài)對(duì)齊能力。

圖片

實(shí)驗(yàn)驗(yàn)證

為了全面評(píng)估 Florence-VL 的性能,我們?cè)O(shè)計(jì)了一系列實(shí)驗(yàn),涵蓋通用視覺問答、OCR、知識(shí)理解等多模態(tài)任務(wù)。

1. 實(shí)驗(yàn)任務(wù)與數(shù)據(jù)

  • 通用視覺問答:如 VQAv2、GQA 等。
  • OCR 與圖表任務(wù):如 TextVQA 和 ChartQA,側(cè)重文本提取與圖表分析。
  • 視覺主導(dǎo)任務(wù):如 CV-bench 和 MMVP, 側(cè)重視覺信息理解。
  • 知識(shí)密集型任務(wù):如 AI2D、MathVista 等,測(cè)試模型對(duì)基本知識(shí)的理解能力。

我們使用了經(jīng)過篩選的 15M 圖像描述數(shù)據(jù) (detailed caption)與 10M 高質(zhì)量指令微調(diào)數(shù)據(jù)進(jìn)行訓(xùn)練,以確保數(shù)據(jù)的多樣性和高質(zhì)量。

圖片

2. 實(shí)驗(yàn)結(jié)果

在實(shí)驗(yàn)結(jié)果中,F(xiàn)lorence-VL 在多個(gè)多模態(tài)基準(zhǔn)任務(wù)上展現(xiàn)出卓越的性能優(yōu)勢(shì)。特別是在 TextVQA 和 OCR-Bench 等文本提取任務(wù)上,得益于 Florence-2 生成式視覺編碼器提供的細(xì)粒度 OCR 特征。此外,在通用視覺問答任務(wù),視覺主導(dǎo)任務(wù),知識(shí)密集型任務(wù)中,F(xiàn)lorence-VL 通過深度 - 廣度融合策略有效結(jié)合了多層級(jí)、多任務(wù)視覺特征,使得整體準(zhǔn)確率相比傳統(tǒng) CLIP-based 方法有所提升。

3. 消融實(shí)驗(yàn)

為了證明采用 Florence-2 作為視覺編碼器的優(yōu)越性,我們使用 llava 1.5 的預(yù)訓(xùn)練和指令微調(diào)數(shù)據(jù),并且采用和 llava 1.5 相同的訓(xùn)練策略。我們發(fā)現(xiàn) florence-VL 顯著優(yōu)于 llava 1.5,  Florence-VL 在 TextVQA 和 OCR-Bench 等任務(wù)中表現(xiàn)突出,顯示出生成式視覺特征在提取圖像文字信息中的優(yōu)勢(shì)。

圖片

總結(jié)

在本文中,我們提出了 Florence-VL,一種基于生成式視覺編碼器 Florence-2 的多模態(tài)大語言模型。與傳統(tǒng)依賴對(duì)比學(xué)習(xí)的視覺編碼器(如 CLIP)相比,F(xiàn)lorence-2 通過生成式預(yù)訓(xùn)練能夠捕捉更豐富的視覺特征,提供多層次、多角度的圖像表征。我們?cè)O(shè)計(jì)了創(chuàng)新的深廣融合(Depth-Breadth Fusion)策略,通過整合不同深度層次和任務(wù)提示生成的視覺特征,將視覺信息全面映射到語言模型輸入空間。通過廣泛的實(shí)驗(yàn),我們驗(yàn)證了 Florence-VL 在多種任務(wù)中的卓越表現(xiàn),包括通用視覺問答、OCR、圖表理解和知識(shí)密集型任務(wù)等。在未來,我們將進(jìn)一步探索:例如自適應(yīng)融合策略:根據(jù)任務(wù)動(dòng)態(tài)調(diào)整深度與廣度特征的平衡等。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-07-16 13:18:36

2025-09-16 09:08:00

2025-05-15 08:30:00

2022-07-28 12:18:40

視覺語言模型

2025-04-28 02:03:00

多模態(tài)大模型EVEv2

2024-06-20 14:12:53

2025-02-28 10:15:00

3D模型編碼器

2024-12-18 18:57:58

2025-04-07 04:30:00

2025-04-11 02:00:00

模態(tài)編碼器ALIGN視覺語言模型

2025-04-17 14:11:10

視覺AI模型

2024-10-22 13:33:48

2025-01-09 09:56:34

視覺模型圖像生成

2025-08-07 02:00:00

2024-08-30 15:19:22

2024-07-23 10:34:57

2024-11-13 09:39:13

2025-05-27 15:35:02

大模型技術(shù)AI

2024-10-21 08:24:29

Florence-2視覺語言模型VLM

2025-08-07 16:24:19

小紅書開源dots.vlm1
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩制服诱惑| 成人不用播放器| 亚洲国产激情| 国产一区二区动漫| 亚洲综合日韩欧美| 欧美草逼视频| 日本久久成人网| 色婷婷av一区二区| 女人床在线观看| 你懂的免费在线观看视频网站| 久久91精品久久久久久秒播 | 韩国中文字幕在线| 99久久婷婷国产精品综合| 国产精品爽黄69| 四虎成人精品永久免费av| 国产欧美日韩在线观看视频| 欧美一区二区三区公司| 久久无码高潮喷水| 日本性爱视频在线观看| 国产日韩欧美麻豆| 亚洲xxx视频| 69av视频在线观看| 亚洲精品护士| 欧美巨乳美女视频| 中文天堂资源在线| 亚洲人成网站77777在线观看| 51久久夜色精品国产麻豆| 无码人妻h动漫| 国产丝袜在线播放| 亚洲欧洲制服丝袜| 亚洲韩国在线| 国产免费av高清在线| 成人av网在线| 99精彩视频| 国产精品永久久久久久久久久| 中国女人久久久| 欧美疯狂性受xxxxx另类| 中文字幕91视频| 狠狠做六月爱婷婷综合aⅴ| 亚洲精品久久久久久下一站| 黑人巨大猛交丰满少妇| 欧美日韩五区| 日本国产一区二区| 妞干网在线免费视频| www视频在线观看| 一区二区三区色| 男人草女人视频| 精品51国产黑色丝袜高跟鞋| 国产精品欧美久久久久无广告| 欧美一区二区.| 国产在线欧美在线| 黑人一区二区| 日韩av在线网| 中文字幕在线播放视频| 国产精东传媒成人av电影| 日韩欧美一区二区在线视频| 超碰在线免费av| 精品视频国内| 日韩欧美成人午夜| 在线播放第一页| 老司机精品视频在线播放| 亚洲精品wwww| 精品无码国产污污污免费网站| 亚洲精品无吗| 亚洲天堂av高清| av黄色免费在线观看| 亚洲女同中文字幕| 欧美激情二区三区| 日韩精品视频免费看| 欧美亚洲免费| 国产精品丝袜久久久久久不卡| 91国内精品视频| 国产精品一区久久久久| 国产成人精品免费视频大全最热 | 欧美v在线观看| 神马久久资源| 欧美高清性hdvideosex| 国产sm在线观看| 青青草这里只有精品| 一区二区三区久久精品| 登山的目的在线| 亚洲欧洲综合| 国产精品自拍网| 国产a级免费视频| 91在线视频免费91| 日韩高清dvd| 国产在线观看免费麻豆| 婷婷综合另类小说色区| 欧美午夜性生活| 欧美2区3区4区| 亚洲精品一区二区久| 久久精品亚洲a| 夜夜嗨网站十八久久| 国产精品亚洲片夜色在线| 午夜久久久久久久久久| 久久久午夜精品| 国产在线无码精品| 日本久久免费| 精品剧情在线观看| 99精品欧美一区二区| 亚洲激情精品| 国产欧美日韩亚洲精品| 天天爽夜夜爽夜夜爽| 国产精品久久久久精k8| 国产欧美日韩网站| 亚洲我射av| 亚洲色图13p| 精品99在线观看| 免费成人性网站| 久久久com| 天堂成人av| 欧美精品在线视频| 中文字幕被公侵犯的漂亮人妻| 中文字幕一区二区三区乱码图片 | 欧美大片在线看免费观看| 亚洲第一网站在线观看| 成人激情黄色小说| 韩国黄色一级大片| 福利视频亚洲| 亚洲欧美视频在线| 国产第100页| 国产乱妇无码大片在线观看| 日韩中文字幕一区| 天堂中文av在线资源库| 精品国产成人在线影院| 日本一级片免费| 轻轻草成人在线| 日本不卡一区二区三区视频| 高清在线视频不卡| 精品国产免费一区二区三区四区 | 一区二区三区在线观看免费| 国产精品美腿一区在线看| 天天操天天干天天爱| 一区二区三区国产| 中文国产在线观看| 91精品天堂福利在线观看| 国产精品一区二区久久久久| 精品久久久久一区二区三区| 欧美色videos| 人妻在线日韩免费视频| 亚洲区一区二| 精品国产乱码久久久久久久软件| 色女人在线视频| 欧美成人精品二区三区99精品| 国产探花在线免费观看| 国产在线精品一区二区三区不卡| 一区二区三区久久网| 外国电影一区二区| 色悠悠国产精品| 中文字幕+乱码+中文| 欧美国产精品劲爆| 亚洲欧美自偷自拍另类| 99久久久久| 91精品在线观| 天堂va在线| 亚洲福利视频二区| 97人人澡人人爽人人模亚洲| 97久久超碰国产精品| 国产精品网站免费| 欧美热在线视频精品999| 国产精品99久久久久久人 | 久久99亚洲精品| 国产 日韩 欧美 精品| 亚州成人在线电影| 国精产品一区一区三区免费视频 | 午夜国产精品一区| 亚洲AV无码国产精品| 日韩精品乱码免费| 亚洲午夜精品久久| 婷婷综合国产| 97视频免费在线看| 欧美一区二区三区少妇| 欧美网站一区二区| 亚洲国产美女视频| av在线一区二区| 别急慢慢来1978如如2| 91欧美在线| 国产精品国产亚洲精品看不卡15| 亚洲精品动漫| 日韩在线观看你懂的| 亚洲xxxx天美| 色综合久久久久网| 欧美黄色aaa| www成人在线观看| 日韩av加勒比| 国产农村妇女精品一区二区| 中文字幕一区二区三区5566| 七七成人影院| 日韩久久免费视频| 国产精品久久久久久久久久久久久久久久久久 | 成人在线免费视频观看| 91久久国产精品91久久性色| 91www在线| 亚洲色无码播放| www.欧美国产| 91黄色在线观看| 久久久全国免费视频| 国产亚洲欧美日韩在线一区| 青娱乐国产精品视频| 亚洲激情亚洲| 麻豆md0077饥渴少妇| 神马影视一区二区| 999国产在线| 久久精品xxxxx| 2018日韩中文字幕| 日本h片在线| 中文字幕日韩av| 瑟瑟在线观看| 精品久久久久99| 国产精品久久免费| 欧美亚洲国产bt| 在线观看中文字幕视频| 亚洲视频在线观看一区| 国产1区2区在线观看| caoporn国产精品| 熟妇无码乱子成人精品| 美女视频网站久久| 日韩视频第二页| 亚洲高清久久| 久久精品无码中文字幕| 久久久久久久久久久久久久久久久久 | 国产女人18毛片18精品| 在线视频欧美精品| 国产www在线| 亚洲第一综合色| 精品国产欧美日韩不卡在线观看| 欧美激情一二三区| 国产肥白大熟妇bbbb视频| 97精品视频在线观看自产线路二| 不许穿内裤随时挨c调教h苏绵| 国模大尺度一区二区三区| 欧美三级理论片| 手机精品视频在线观看| 国产美女三级视频| 一本一本久久| 欧美a v在线播放| 国产伦理一区| 日本在线观看a| 美女诱惑黄网站一区| 国产精品丝袜久久久久久消防器材| 国一区二区在线观看| 日本一级黄视频| 欧美三级乱码| 日韩av新片网| 亚洲理论在线| 成人免费毛片网| 天堂久久久久va久久久久| www.com毛片| 视频在线观看国产精品| 人妻熟女一二三区夜夜爱| 久久一区精品| 色悠悠久久综合网| 国模大尺度一区二区三区| 国内精品国产三级国产aⅴ久| 国产精品一区二区91| 精品无码人妻少妇久久久久久| 国v精品久久久网| 丰满岳乱妇一区二区| 91论坛在线播放| 欧美丰满老妇熟乱xxxxyyy| 国产精品每日更新| 丰满少妇高潮久久三区| 婷婷一区二区三区| 69国产精品视频免费观看| 欧美伊人精品成人久久综合97| 国产日韩在线免费观看| 7777精品伊人久久久大香线蕉完整版 | 天天干在线播放| 欧美中文字幕久久| 国产精品女同一区二区| 精品国产乱码久久久久久久久| 亚洲欧美日本在线观看| 在线日韩av观看| 97超碰资源站在线观看| 亚洲91精品在线观看| 神马电影网我不卡| 亚洲最大福利网| 欧美电影在线观看免费| 翔田千里亚洲一二三区| 亚洲欧美亚洲| 又粗又黑又大的吊av| 日本午夜精品一区二区三区电影| 天堂av2020| 91免费视频大全| 中文字幕求饶的少妇| 亚洲大片免费看| 伊人网视频在线| 亚洲第一区在线观看| 幼a在线观看| 国语自产精品视频在线看抢先版图片| 成人激情综合| 国产欧美一区二区视频| 日韩精品欧美| 国产青青在线视频| 国产伦精品一区二区三区免费迷| 亚洲一区二区三区无码久久| 最新国产の精品合集bt伙计| 日韩伦人妻无码| 91精品国产色综合久久| 你懂的在线观看视频网站| 九九热在线精品视频| 成人不卡视频| 久久艳妇乳肉豪妇荡乳av| 亚洲国产老妈| 狠狠躁狠狠躁视频专区| 不卡av在线免费观看| 男人av资源站| 欧美性色欧美a在线播放| 亚州视频一区二区三区| 欧美国产日韩一区二区三区| 国产国产一区| 欧美亚洲丝袜| 国产欧美丝祙| 中国极品少妇xxxx| 亚洲精品国久久99热| 亚洲最大成人av| 亚洲色图25p| 免费高潮视频95在线观看网站| 欧美激情一二三| 欧美91在线|欧美| 日韩av电影免费播放| 亚洲综合好骚| 久久久久麻豆v国产精华液好用吗| 亚洲老妇xxxxxx| 国产伦精品一区二区三区免.费| 国产一区二区三区在线播放免费观看| 川上优av中文字幕一区二区| 97中文在线| 欧美激情1区2区3区| 在线免费黄色网| 18欧美乱大交hd1984| 亚洲中文字幕一区二区| 中文字幕亚洲欧美日韩2019| 二吊插入一穴一区二区| 欧洲一区二区日韩在线视频观看免费| 99热这里只有精品8| 午夜不卡久久精品无码免费| 亚洲一区二区三区精品在线| 国产黄频在线观看| 欧美大片免费观看| 99re8这里有精品热视频8在线| 99re6这里有精品热视频| 国产精品一区在线| 精品在线视频免费观看| 亚洲成avwww人| 麻豆mv在线看| 热re99久久精品国产99热| 日韩va亚洲va欧美va久久| 免费看日本黄色片| 欧美日韩一区二区在线观看| 色三级在线观看| 亚洲一区二区三区毛片 | 欧美美最猛性xxxxxx| 香蕉成人app| 人人干视频在线| 久久久综合视频| 中文字幕乱码无码人妻系列蜜桃| 影音先锋欧美精品| www.久久久久爱免| 男女日批视频在线观看| 久久亚洲免费视频| 日本三级一区二区三区| 日韩日本欧美亚洲| 中文字幕日韩在线| 青青艹视频在线| 欧美国产一区视频在线观看| 国产毛片一区二区三区va在线| 久久国产精品久久精品| 久久动漫网址| 91在线视频观看免费| 《视频一区视频二区| 丰满人妻一区二区三区免费视频| 性欧美xxxx| jizzjizz欧美69巨大| 两女双腿交缠激烈磨豆腐| 午夜精品福利久久久| h视频在线观看免费| 超碰97国产在线| 六月天综合网| 免费在线视频观看| 亚洲精品视频在线播放| 精品一区二区三区四区五区 | 国产aⅴ精品一区二区三区色成熟| 国产成人无码精品久久久久| 少妇av一区二区三区| 国产欧美一区二区三区米奇| 日本999视频| 亚洲成人一区在线| 最新97超碰在线| 国产亚洲一区在线播放| 毛片不卡一区二区| 中文在线观看免费网站| 在线成人一区二区| 国产无遮挡裸体免费久久| a在线观看免费视频| 亚洲国产aⅴ成人精品无吗| 日本中文字幕在线看| 久久精品二区| 国产福利一区在线| 在线免费观看日韩视频|