精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

阿里7B多模態文檔理解大模型拿下新SOTA

人工智能 新聞
本文從最近發布的7B最強多模態文檔理解大模型mPLUG-DocOwl 1.5出發,總結了不依賴OCR的情況下,進行多模態文檔理解的關鍵四個關鍵挑戰和阿里巴巴mPLUG團隊給出的解決方案。

多模態文檔理解能力新SOTA!

阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl 1.5,針對高分辨率圖片文字識別、通用文檔結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。

話不多說,先來看效果。

復雜結構的圖表一鍵識別轉換為Markdown格式:

不同樣式的圖表都可以:

圖片

更細節的文字識別和定位也能輕松搞定:

還能對文檔理解給出詳細解釋:

要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有很多輔助文檔閱讀的產品,有的主要通過OCR系統進行文字識別,配合LLM進行文字理解可以達到不錯的文檔理解能力。

不過,由于文檔圖片類別多樣、文字豐富且排版復雜,難以實現圖表、信息圖、網頁等結構復雜圖片的通用理解。

當前爆火的多模態大模型QwenVL-Max、Gemini, Claude3、GPT4V都具備很強的文檔圖片理解能力,然而開源模型在這個方向上的進展緩慢。

而阿里新研究mPLUG-DocOwl 1.5在10個文檔理解基準上拿下SOTA,5個數據集上提升超過10個點,部分數據集上超過智譜17.3B的CogAgent,在DocVQA上達到82.2的效果。

除了具備基準上簡單回答的能力,通過少量“詳細解釋”(reasoning)數據的微調,DocOwl 1.5-Chat也能具備多模態文檔領域詳細解釋的能力,具有很大的應用潛力。

阿里mPLUG團隊從2023年7月份開始投入多模態文檔理解的研究,陸續發布了mPLUG-DocOwl、 UReader、mPLUG-PaperOwl、mPLUG-DocOwl 1.5,開源了一系列文檔理解大模型和訓練數據。

本文從最新工作mPLUG-DocOwl 1.5出發,剖析“多模態文檔理解”領域的關鍵挑戰和有效解決方案。

挑戰一:高分辨率圖片文字識別

區分于一般圖片,文檔圖片的特點在于形狀大小多樣化,其可以包括A4大小的文檔圖、短而寬的表格圖、長而窄的手機網頁截圖以及隨手拍攝的場景圖等等,分辨率的分布十分廣泛。

主流的多模態大模型編碼圖片時,往往直接縮放圖片的大小,例如mPLUG-Owl2和QwenVL縮放到448x448,LLaVA 1.5縮放到336x336。

簡單的縮放文檔圖片會導致圖片中的文字模糊形變從而不可辨認。

為了處理文檔圖片,mPLUG-DocOwl 1.5延續了其前序工作UReader的切圖做法,模型結構如圖1所示:

△圖1:DocOwl 1.5模型結構圖

UReader最早提出在已有多模態大模型的基礎上,通過無參數的形狀適應切圖模塊(Shape-adaptive Cropping Module)得到一系列子圖,每張子圖通過低分辨率編碼器進行編碼,最后通過語言模型關聯子圖直接的語義。

該切圖策略可以最大程度利用已有通用視覺編碼器(例如CLIP ViT-14/L)的能力進行文檔理解,大大減少重新訓練高分辨率視覺編碼器的代價。形狀適應的切圖模塊如圖2所示:

圖片
△圖2:形狀適應的切圖模塊。

挑戰二:通用文檔結構理解

對于不依賴OCR系統的文檔理解來說,識別文字是基本能力,要實現文檔內容的語義理解、結構理解十分重要,例如理解表格內容需要理解表頭和行列的對應關系,理解圖表需要理解線圖、柱狀圖、餅圖等多樣化結構,理解合同需要理解日期署名等多樣化的鍵值對。

mPLUG-DocOwl 1.5著力于解決通用文檔等結構理解能力,通過模型結構的優化和訓練任務的增強實現了顯著更強的通用文檔理解能力。

結構方面,如圖1所示,mPLUG-DocOwl 1.5放棄了mPLUG-Owl/mPLUG-Owl2中Abstractor的視覺語言連接模塊,采用基于“卷積+全連接層”的H-Reducer進行特征聚合以及特征對齊

相比于基于learnable queries的Abstractor,H-Reducer保留了視覺特征之間的相對位置關系,更好的將文檔結構信息傳遞給語言模型。

相比于保留視覺序列長度的MLP,H-Reducer通過卷積大幅縮減了視覺特征數量,使得LLM可以更高效地理解高分辨率文檔圖片。

考慮到大部分文檔圖片中文字優先水平排布,水平方向的文字語義具有連貫性,H-Reducer中采用1x4的卷積形狀和步長。論文中,作者通過充分的對比實驗證明了H-Reducer在結構理解方面的優越性以及1x4是更通用的聚合形狀。

訓練任務方面,mPLUG-DocOwl 1.5為所有類型的圖片設計了統一結構學習(Unified Structure Learning)任務,如圖3所示。

△圖3:統一結構學習

Unified Structure Learning既包括了全局的圖片文字解析,又包含了多粒度的文字識別和定位。

在全局圖片文字解析任務中,對于文檔圖片和網頁圖片,采用空格和換行的形式可以最通用地表示文字的結構;對于表格,作者在Markdown語法的基礎上引入表示多行多列的特殊字符,兼顧了表格表示的簡潔性和通用性;對于圖表,考慮到圖表是表格數據的可視化呈現,作者同樣采用Markdown形式的表格作為圖表的解析目標;對于自然圖,語義描述和場景文字同等重要,因此采用圖片描述拼接場景文字的形式作為解析目標。

在“文字識別和定位”任務中,為了更貼合文檔圖片理解,作者設計了單詞、詞組、行、塊四種粒度的文字識別和定位,bounding box采用離散化的整數數字表示,范圍0-999。

為了支持統一的結構學習,作者構建了一個全面的訓練集DocStruct4M,涵蓋了文檔/網頁、表格、圖表、自然圖等不同類型的圖片。

經過統一結構學習,DocOwl 1.5具備多領域文檔圖片的結構化解析和文字定位能力。

圖片

△圖4: 結構化文字解析

如圖4和圖5所示:

圖片

△圖5: 多粒度文字識別和定位

挑戰三:指令遵循

“指令遵循”(Instruction Following)要求模型基于基礎的文檔理解能力,根據用戶的指令執行不同的任務,例如信息抽取、問答、圖片描述等。

延續mPLUG-DocOwl的做法,DocOwl 1.5將多個下游任務統一為指令問答的形式,在統一的結構學習之后,通過多任務聯合訓練的形式得到一個文檔領域的通用模型(generalist)

此外,為了使得模型具備詳細解釋的能力,mPLUG-DocOwl曾嘗試引入純文本指令微調數據進行聯合訓練,有一定效果但并不理想。

在DocOwl 1.5中,作者基于下游任務的問題,通過GPT3.5以及GPT4V構建了少量的詳細解釋數據(DocReason25K)

通過聯合文檔下游任務和DocReason25K進行訓練,DocOwl 1.5-Chat既可以在基準上實現更優的效果:

圖片

△圖6:文檔理解Benchmark評測

又能給出詳細的解釋:

圖片

△圖7:文檔理解詳細解釋

挑戰四:外部知識引入

文檔圖片由于信息的豐富性,進行理解的時候往往需要額外的知識引入,例如特殊領域的專業名詞及其含義等等。

為了研究如何引入外部知識進行更好的文檔理解,mPLUG團隊著手于論文領域提出了mPLUG-PaperOwl,構建了一個高質量論文圖表分析數據集M-Paper,涉及447k的高清論文圖表。

該數據中為論文中的圖表提供了上下文作為外部知識來源,并且設計了“要點”(outline)作為圖表分析的控制信號,幫助模型更好地把握用戶的意圖。

基于UReader,作者在M-Paper上微調得到mPLUG-PaperOwl,展現了初步的論文圖表分析能力,如圖8所示。

圖片

△圖8:論文圖表分析

mPLUG-PaperOwl目前只是引入外部知識進文檔理解的初步嘗試,仍然面臨著領域局限性、知識來源單一等問題需要進一步解決。

總的來說,本文從最近發布的7B最強多模態文檔理解大模型mPLUG-DocOwl 1.5出發,總結了不依賴OCR的情況下,進行多模態文檔理解的關鍵四個關鍵挑戰(“高分辨率圖片文字識別”,“通用文檔結構理解”,“指令遵循”, “外部知識引入” )和阿里巴巴mPLUG團隊給出的解決方案。

盡管mPLUG-DocOwl 1.5大幅提升了開源模型的文檔理解表現,其距離閉源大模型以及現實需求仍然有較大差距,在自然場景中文字識別、數學計算、通用型等方面仍然有進步空間。

mPLUG團隊會進一步優化DocOwl的性能并進行開源,歡迎大家持續關注和友好討論!

GitHub鏈接:https://github.com/X-PLUG/mPLUG-DocOwl
論文鏈接:https://arxiv.org/abs/2403.12895

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-25 12:40:19

訓練模型

2024-09-14 08:54:38

2024-05-09 08:33:33

2025-05-27 15:35:02

大模型技術AI

2024-06-03 10:43:34

2025-07-21 09:07:00

模型訓練視頻

2025-05-20 13:02:23

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2025-04-28 14:13:43

開源SOTA多模態

2025-01-08 08:21:16

2025-06-17 09:07:24

2024-11-08 10:00:00

AI模型

2023-06-28 21:47:54

2025-03-11 13:07:58

2024-12-20 12:30:00

模型AI數據

2023-06-28 13:55:30

模型AI

2025-11-05 08:51:33

2025-10-31 08:50:00

AI模型開源

2023-07-17 11:02:36

模型開源

2024-03-25 08:00:00

點贊
收藏

51CTO技術棧公眾號

欧美精品一区免费| 成人激情电影一区二区| fc2成人免费视频| 僵尸再翻生在线观看| 久久亚洲一级片| 国产一区二区香蕉| 国产一级特黄aaa大片| 亚洲另类春色校园小说| 欧美美女一区二区在线观看| 国产香蕉一区二区三区| 亚洲人妻一区二区| 久久99精品国产91久久来源| 欧美黄色免费网站| 免费在线观看a视频| 97青娱国产盛宴精品视频| 日韩欧美视频一区二区三区| 色一情一乱一乱一区91| 欧洲毛片在线| 国产精品一区二区三区四区| 琪琪第一精品导航| 丝袜 亚洲 另类 欧美 重口| 日韩美女毛片| 日韩一级免费一区| 国产情侣av自拍| 日本动漫理论片在线观看网站| 久久色.com| 成人免费在线看片| 亚洲av综合一区| 亚洲裸体俱乐部裸体舞表演av| 中文字幕亚洲第一| 一女三黑人理论片在线 | 午夜精品99久久免费| av在线播放中文字幕| 日韩精品福利一区二区三区| 日韩你懂的在线播放| 手机看片一级片| 中文在线最新版地址| 亚洲久草在线视频| 先锋影音网一区| 同心难改在线观看| 丁香亚洲综合激情啪啪综合| 91九色单男在线观看| 久久影视中文字幕| 日韩一级大片| 欧美成人中文字幕在线| 国产精品综合激情| 沈樵精品国产成av片| 精品视频在线导航| 精品熟女一区二区三区| 136福利精品导航| 91麻豆精品国产91| 色天使在线观看| 欧美暴力调教| 91搞黄在线观看| 六月丁香婷婷在线| 另类激情视频| 欧美日韩免费在线| 黄色国产一级视频| 黄色视屏在线免费观看| 亚洲第一狼人社区| 欧美日韩性生活片| 九色porny自拍视频在线观看| 亚洲成人自拍网| 色综合久久久久无码专区| av岛国在线| 欧美日韩精品在线| aaa毛片在线观看| 日韩免费福利视频| 在线免费观看成人短视频| 成人精品视频一区二区| 欧美性xxx| 在线看国产一区| 人人干人人干人人| 24小时成人在线视频| 欧美一区二区国产| 亚洲精品第二页| 日本福利一区| 一区二区三区四区视频| 国产破处视频在线观看| 91国语精品自产拍| 久久男人av资源网站| 日韩av在线播| 久久九九精品| 国产精品一区二区三区久久| 国产裸体永久免费无遮挡| 国产成人精品亚洲777人妖| 亚洲综合大片69999| 亚洲欧美黄色片| 91色视频在线| 在线精品日韩| 欧美午夜大胆人体| 一本在线高清不卡dvd| 日日噜噜夜夜狠狠| 91九色鹿精品国产综合久久香蕉| 亚洲国产精品大全| 极品蜜桃臀肥臀-x88av| 最新国产精品久久久| 91av国产在线| 在线观看视频二区| 成人看片黄a免费看在线| 欧美精品一区二区三区四区五区 | 最近2019年好看中文字幕视频| 欧美性生交大片| 在线不卡视频| 国产精品亚洲综合天堂夜夜| 亚洲大尺度视频| 久久女同性恋中文字幕| 亚洲精品偷拍视频| 伊人色综合一区二区三区影院视频| 欧美日韩国产大片| av黄色一级片| 亚洲啊v在线观看| 日本欧美在线视频| 性一交一乱一色一视频麻豆| 久久精品人人做人人综合| 欧美精品久久96人妻无码| 一区二区电影免费观看| 欧美一区二区三区在线观看| 无码一区二区三区在线| 欧美欧美全黄| 国产精品久久视频| 日本成人动漫在线观看| 亚洲欧美欧美一区二区三区| 国产91在线视频观看| 日韩第一区第二区| 日韩一二三在线视频播| 亚洲s码欧洲m码国产av| 成人精品国产免费网站| 二级片在线观看| 日韩高清在线| 日韩精品有码在线观看| 久青草免费视频| 韩国av一区二区| 亚洲高清视频一区| 亚洲精品成人图区| 亚洲激情视频在线播放| 欧美成人一二三区| 精品中文av资源站在线观看| 欧美中文娱乐网| 最新欧美色图| 亚洲乱码国产乱码精品精天堂| 久草视频在线资源| 国产精品一二二区| 久久久一二三四| 日韩免费大片| 日韩视频在线一区| 一区二区视频免费| 国产精品理论片在线观看| 五月天婷婷激情视频| 久久99免费视频| 热门国产精品亚洲第一区在线| 污视频软件在线观看| 亚洲成人一区二区| 中文字幕无码人妻少妇免费| 精品动漫3d一区二区三区免费| 肥熟一91porny丨九色丨| 亚洲婷婷噜噜| 欧美本精品男人aⅴ天堂| 九九热国产在线| 国产白丝精品91爽爽久久| 超级碰在线观看| 97久久超碰| 88xx成人精品| 国产乱子伦三级在线播放| 91福利资源站| 国产白丝一区二区三区| 久久99国产精品久久99果冻传媒| 亚洲成人18| 成人豆花视频| 欧美精品九九久久| 网站黄在线观看| 一本一道久久a久久精品综合蜜臀| 插吧插吧综合网| 日韩二区三区在线观看| 亚洲国产欧美日韩| 亚洲一区av| 欧美精品久久久久a| 无码精品视频一区二区三区 | 91麻豆免费看片| 国产精品无码av无码| 欧美日一区二区| 成人免费视频a| 96av在线| 在线精品国产成人综合| 国产草草影院ccyycom| 偷拍与自拍一区| www久久久久久久| 国产精品一区免费在线观看| 国产黄页在线观看| 日韩一区电影| 亚洲专区国产精品| 亚洲女色av| 精品国产欧美一区二区五十路| 精品国精品国产自在久不卡| 福利一区视频在线观看| 青青青视频在线播放| 国产成人免费视频网站高清观看视频| 日韩免费视频播放| 日韩欧美电影| 国产亚洲欧美另类一区二区三区| 欧美不卡高清一区二区三区| 欧美成人国产va精品日本一级| 神马午夜在线观看| 欧美精品在线视频| 日韩高清免费av| 中文字幕中文字幕一区| 国产精品成人99一区无码| 麻豆一区二区在线| 国产精品999视频| 日韩中文在线电影| 精品日本一区二区三区在线观看| 国产在视频一区二区三区吞精| 国模极品一区二区三区| 色网站在线看| 日韩国产一区三区| 国产熟女精品视频| 欧美影片第一页| 在线观看免费国产视频| 亚洲免费观看在线视频| 欧美日韩高清丝袜| jizz一区二区| 五月天国产视频| 人禽交欧美网站| av动漫在线看| 黄色日韩在线| 桥本有菜av在线| 成人精品影院| 免费日韩电影在线观看| caoporn成人免费视频在线| 国产精品自拍小视频| 亚洲黄色免费看| 亚州av一区二区| 日本在线视频www鲁啊鲁| 色婷婷综合久久久久| 国产中文在线视频| 亚洲精品久久久久久久久久久| 国产99对白在线播放| 欧美日本乱大交xxxxx| 天天干,天天干| 色婷婷综合久久久久中文一区二区 | 日批视频免费观看| 色综合天天综合| 少妇一级淫片免费放中国 | 法国空姐在线观看免费| 久久免费大视频| 日韩精品一线二线三线| 天堂俺去俺来也www久久婷婷 | 97av在线影院| 白浆在线视频| 国内精品视频一区| eeuss鲁一区二区三区| 欧美国产激情18| 麻豆av在线免费观看| 欧美激情中文字幕在线| 激情影院在线| 欧美肥臀大乳一区二区免费视频| yellow91字幕网在线| 久久久久99精品久久久久| 蜜桃视频在线观看www社区| 日韩中文字幕在线| 成人免费网站在线观看视频| 免费91在线视频| 污污影院在线观看| 久久久久久久国产精品视频| 免费男女羞羞的视频网站在线观看 | 亚洲影院污污.| 久久99精品久久久野外观看| 亚洲自拍偷拍第一页| 亚洲精品在线a| 国产精品一国产精品最新章节| 大型av综合网站| 欧美日韩国产综合在线| 成人同人动漫免费观看 | 色嗨嗨av一区二区三区| 国产精品自拍第一页| 欧美美女激情18p| 精品国产黄色片| 亚洲精品成人久久电影| 久草视频视频在线播放| 在线播放亚洲激情| а√天堂8资源在线官网| 久久久久久久一区二区| xx欧美视频| 成人黄色午夜影院| 好吊妞视频这里有精品| 欧美精品一区二区三区久久| 欧美激情另类| 超碰成人免费在线| 久久亚洲不卡| 久久人人爽人人片| 97精品国产97久久久久久久久久久久| 波多野结衣a v在线| 亚洲欧美怡红院| 国产无遮挡又黄又爽又色| 91极品视觉盛宴| 国产黄频在线观看| 亚洲欧美999| 国产区在线看| 91精品国产色综合久久不卡98| 亚洲精品粉嫩美女一区| 91文字幕巨乱亚洲香蕉| 要久久电视剧全集免费| 中国 免费 av| 久久九九国产| 国产av一区二区三区传媒| 国产丝袜欧美中文另类| 久久久精品人妻一区二区三区四 | 久久亚洲综合色| 久久久久亚洲AV成人| 色噜噜久久综合| 成人精品在线播放| 中文字幕亚洲一区| 一根才成人网| 国产另类自拍| 永久91嫩草亚洲精品人人| 老头吃奶性行交视频| 成人av资源站| 日本中文字幕免费在线观看| 在线亚洲高清视频| 女人18毛片一区二区三区| 日韩在线中文字| 欧美韩国亚洲| 久久99久久精品国产| 欧美日韩精品免费观看视频完整| 国产又粗又长又大的视频| 91亚洲资源网| 国产一级在线免费观看| 7777女厕盗摄久久久| yourporn在线观看中文站| 国产91精品高潮白浆喷水| 成人影院中文字幕| 91免费版看片| 精久久久久久久久久久| 亚洲一级理论片| 日本久久电影网| 亚洲人视频在线观看| 97国产精品人人爽人人做| 影音先锋欧美激情| 热这里只有精品| 久久 天天综合| 国产又粗又猛又爽又黄的视频四季| 欧美特级www| 亚洲欧美自偷自拍| 97国产suv精品一区二区62| 9l亚洲国产成人精品一区二三 | 亚洲精品社区| 中文字幕视频观看| 亚洲综合激情网| 午夜久久久久久久久久| 免费99精品国产自在在线| 麻豆精品国产| 黄色一级大片免费| 国产精品资源站在线| 黄色一级片中国| 欧美一级电影网站| 亚洲图区一区| 国产精华一区二区三区| 亚洲成人直播| 日本黄色录像片| 欧美性高潮床叫视频| 日本国产在线| 国产成人久久精品| 色综合狠狠操| 在线观看免费看片| 亚洲国产日日夜夜| 丝袜视频国产在线播放| 欧美一区二区三区精品电影| 欧美精品momsxxx| 国产 porn| 亚洲美女免费在线| 丰满少妇在线观看bd| 欧美亚洲视频在线观看| 精品国产一区二区三区久久久樱花 | 在线成人h网| 91精品国产自产| 欧美丝袜自拍制服另类| 黄色网页在线免费看| 成人激情直播| 久久久久久黄| 色婷婷粉嫩av| 精品久久久三级丝袜| 一二三四视频在线中文| 亚洲国产一区二区在线| 国产乱人伦偷精品视频免下载| 久久精品国产亚洲AV无码麻豆| 精品无人国产偷自产在线| 91精品国产66| 国产 欧美 日韩 一区| 久久免费的精品国产v∧| 亚洲综合精品在线| 欧美—级高清免费播放| 国产精品日韩精品中文字幕| www激情五月| 亚洲.国产.中文慕字在线| 91看片在线观看| 成人欧美一区二区三区黑人免费| 久久精品一本| 免费在线一级片| 亚洲色在线视频| 亚洲精品a区|