精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通用文檔理解新SOTA,多模態大模型TextMonkey來了

人工智能 新聞
TextMonkey 是一個專注于文本相關任務(包括文檔問答和場景文本問答)的多模態大模型(LMM)。

最近,華中科技大學和金山的研究人員在多模態大模型 Monkey [1](Li et al., CVPR2024)工作的基礎上提出 TextMonkey。在多個場景文本和文檔的測試基準中,TextMonkey 處于國際領先地位,有潛力帶來辦公自動化、智慧教育、智慧金融等行業應用領域的技術變革。


  • 論文鏈接:https://arxiv.org/abs/2403.04473
  • 代碼地址:https://github.com/Yuliang-Liu/Monkey

TextMonkey 是一個專注于文本相關任務(包括文檔問答和場景文本問答)的多模態大模型(LMM)。相比于 Monkey,TextMonkey 在多個方面進行改進:通過采用零初始化的 Shifted Window Attention,TextMonkey 實現了更高輸入分辨率下的窗口間信息交互;通過使用相似性來過濾出重要的圖像特征,TextMonkey 不僅能夠簡化輸入,還可以提高模型的性能。

此外,通過擴展多個文本相關任務并將位置信息納入回答,TextMonkey 增強了可解釋性并減少了幻覺。與此同時,TextMonkey 在微調之后還可以具備 APP Agent 中理解用戶指令并點擊相應位置的能力,展現了其下游應用的巨大潛力。

例如,TextMonkey 展現出強大的視覺定位與理解能力,不僅能夠定位圖像中的所有文本,還能在視覺問答時給出答案及其所在位置,增加了可解釋性并減少了幻覺。

圖片

圖片

即使在文字相當密集的情況下,TextMonkey 也可以讀取輸入圖片中的所有文字并且給出圖片中文本的坐標。

圖片

圖片


圖片

TextMonkey 還能幫助我們結構化圖表,表格以及文檔數據,通過將圖像內容轉化為 Json 格式的信息,方便記錄和提取。

圖片


圖片

實驗結果表明,TextMonkey 在各種基準數據集上的性能得到了顯著提升,在以場景文本為中心的視覺問答、文檔 VQA 和關鍵信息抽取任務中分別取得了 5.2%、6.9% 和 2.8% 的準確率增長,特別是在 OCRBench [2] 上獲得了 561 的得分,超越此前所有已開源的多模態大模型。

方法介紹

TextMonkey 的成功核心在于它模擬人類視覺認知的方法,這使它能自然而然地識別高清文檔圖像中各部分的相互關聯,并靈敏地鑒別出圖像內的關鍵要素。更進一步,基于對用戶多樣化需求的深入理解,TextMonkey 通過文本定位技術強化了答案的準確性,提升了模型的解釋性,減少了幻覺,有效提高了在處理各類文檔任務上的表現。


圖片圖 1 TextMonkey 整體架構

1.Shifted Window Attention

現有的多模態大模型,如 Monkey 和 LLaVA1.6,通過將圖像切分為小塊來提高輸入分辨率。然而這種裁剪策略可能會無意中分割相關單詞,導致語義不連貫。此外,這種分裂造成的空間分離也使得處理與文本位置相關的任務(如文本檢測)變得具有挑戰性。TextMonkey 在繼承 Monkey 高效的圖像分辨率縮放功能的同時,采用滑動窗口注意力機制建立了塊與塊之間的上下文聯系。

2.Token Resampler

目前的多模態大模型面臨著圖像 token 數目隨著輸入分辨率的增加而增加的挑戰。由于語言模型的輸入長度和訓練時間的限制,減少 token 的數量是很有必要的。

在自然語言中,語言元素會存在一些冗余信息。那么可以自然的猜測在擴大圖像分辨率之后,視覺部分的 token 也會存在冗余。本文根據以往確定語言元素相似性的方法,對已經映射到語言空間的圖像 token 的相似性進行了度量:在圖像 Resampler 之后隨機選取 20 個有序特征,利用余弦相似性成對比較這些特征的相似性,得到的結果如圖 2 所示。顏色越深代表相似性越高,實驗發現每個圖片的 token 都有一個到幾個類似的 token,圖片特征中存在冗余。

同時,本文還觀察到某些 token 是高度獨特的,并且缺乏其他相似的 token,如圖中的第四個 token,這表明這個 token 是更為重要的。因此本文選用相似度來度量并識別獨特的視覺 token。并提出 Token Resampler 來壓縮冗余視覺 token。通過計算每個 token 與其他 token 的相似度,過濾得到最重要(相似度最低)的 K 個 token。同時,為了避免直接丟棄其他 token 造成的信息丟失,這里還會利用過濾得到的 K 個 token 作為查詢,并采用交叉注意力機制進一步融合所有特征。

圖片

圖 2 圖像 token 相似性比較

3. 多任務訓練

TextMonkey 支持讀出所有文本,文本檢測識別,輸出給定文本坐標,文本問答,具有位置感知的文本問答,圖像結構化等多個任務。TextMonkey 在進行問答時不僅看可以給出答案,還能給出答案所在位置,進一步增強了模型的可解釋性。與此同時,在經過微調之后,TextMonkey 還可以具備 APP Agent 中理解用戶指令并點擊相應位置的能力。

實驗分析

1.TextMonkey 與現有的多模態大模型相比,表現出了優越的性能。

圖片

2. 為了進一步驗證 TextMonkey 的有效性,本文還在更多數據集上進行了測試。(其中 Deepform 和 KLC 使用 F1-score 作為評估指標,WTQ 使用 accuracy, ChartQA 使用 relaxed accuracy, DocVQA 使用 ANLS。)

圖片

3.TextMonkey 在 Text Spotting 數據集上相比于傳統 OCR 模型也取得了極具競爭力的效果。

圖片

4. 表 7 的消融實驗表明 Shifted Window Attention 和 Token Resampler 兩個模塊的有效性。

圖片

5. 表 9 的消融實驗證明:由于分辨率的提高導致冗余 token 的顯著增加,使得找到關鍵信息變得更加困難,在不壓縮 Token 的情況下直接增加分辨率實際上會導致一致的性能損失,如在表中第一行和第四行,在不壓縮 Token 時,分辨率由 896 增加到 1344 會導致模型在四個數據集上的指標均有所下降,這說明了沒有策略地一味增加模型的分辨率反而會帶來負面影響,如何合理地增加分辨率,將會是一個需要集中解決的問題。不僅如此,表 9 中還說明,當選取不同的壓縮 Token 數量時,對模型性能的影響也是顯著的,選取一個合適的值來作為壓縮 Token 的數量,可以使得模型的性能進一步提升。

圖片

可視化結果展示

TextMonkey 在場景圖像和文檔圖像中都能準確定位和識別文本。此外,(a) 中的自然圖像、(b) 中的文檔、(c) 中的圖表和 (d) 中的表格都展示了 TextMonkey 在多種場景下識別、理解和定位文本信息的能力。

圖片

本文還探索了 TextMonkey 作為智能手機應用程序的 Agent 代理方面的可行性。使用來自 Rico 數據集的 15k 用戶點擊數據上進行微調之后,TextMonkey 能夠理解用戶意圖并點擊相應的圖標,這表明了 TextMonkey 在微調之后作為 App Agent 的巨大潛力。

圖片

總結

TextMonkey 在 Monkey 的基礎上增強了其圖像間的跨窗口交互,在擴大分辨率的基礎上增強了視覺信息的語義連續性,有效緩解了視覺信息碎片化的問題;并通過提出過濾融合策略減少圖像特征長度,從而減少輸入到大語言模型中冗余的視覺 token 數量。論文的實驗說明,分辨率不是越大越好,不合理的提高模型分辨率策略有時會給模型帶來負面影響,如何合理地擴大分辨率才是一個更值得去思考的問題。

此外,通過在問答中引入位置信息,TextMonkey 增強了可解釋性并減少了幻覺。TextMonkey 在多個文本相關的測試基準中處于國際領先,在 OCRBench 中超越其他開源多模態大模型。TextMonkey 的到來為通用文檔理解帶來曙光,這有潛力促進辦公自動化、智慧教育、智慧金融等行業的技術變革。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-02 09:17:50

AI數據開源

2025-05-27 15:35:02

大模型技術AI

2025-04-28 14:13:43

開源SOTA多模態

2025-01-08 08:21:16

2025-05-20 13:02:23

2025-11-05 08:51:33

2023-07-17 11:02:36

模型開源

2023-06-28 13:55:30

模型AI

2025-09-19 09:05:18

AI模型訓練

2025-05-07 01:00:00

多模態大模型AI

2023-12-30 13:31:30

模型數據信息

2024-09-10 12:11:18

2024-12-12 00:25:09

2025-01-07 09:11:07

2024-06-17 00:00:00

MiCo模態人腦

2023-10-07 09:29:09

2025-09-16 09:35:52

2024-04-25 14:53:59

模型視覺

2025-08-07 16:24:19

小紅書開源dots.vlm1
點贊
收藏

51CTO技術棧公眾號

中文字幕一区二区日韩精品绯色| 91日韩视频| 色综合久久久久| 日本高清不卡一区二区三| 精品国产乱子伦| 日韩精品免费一区二区三区| 8v天堂国产在线一区二区| 91网站在线观看免费| 神马一区二区三区| 欧美a级理论片| 欧美激情二区三区| 精品人妻互换一区二区三区| 999精品嫩草久久久久久99| 夜夜揉揉日日人人青青一国产精品| 精品久久中出| 91tv国产成人福利| 中国女人久久久| 伦伦影院午夜日韩欧美限制| 野外性满足hd| 精品国模一区二区三区欧美 | 日韩国产欧美视频| 九九九久久久久久| 337人体粉嫩噜噜噜| 国产精品17p| 欧美肥妇毛茸茸| 欧美日韩亚洲一二三| 中文字幕有码在线观看| 国产视频一区在线观看| 国产精品久久精品国产| 91福利在线观看视频| 国产精品入口66mio| 欧美另类69精品久久久久9999| 色综合久久综合中文综合网| 国产免费一区二区三区在线能观看| 精品肉丝脚一区二区三区| 欧美午夜精品一区二区三区电影| 亚洲成人三级在线| 一本之道在线视频| 日韩电影精品| 欧美天堂亚洲电影院在线播放| 18禁免费观看网站| 久久大胆人体| 亚洲男人的天堂在线观看| 亚洲精品9999| 国产精品天堂| 久久影院午夜论| 国产伦理久久久| 亚洲第一精品网站| 国产高清成人在线| 91精品国产91久久久久青草| 亚洲一区二区色| 日本少妇一区二区| 国产成人精品久久二区二区| 亚洲 欧美 中文字幕| 在线综合欧美| 热99精品里视频精品| 欧美啪啪小视频| 欧美一级网站| 欧美中文字幕视频| 日日夜夜狠狠操| 亚洲av人无码激艳猛片服务器| 国产成人澳门| 亚洲成人网av| 无码人妻aⅴ一区二区三区| 秋霞影视一区二区三区| 精品视频—区二区三区免费| 中文字幕国产综合| 亚洲区小说区| 一本色道久久88亚洲综合88| 久久久久亚洲AV成人无在| 青青草国产免费一区二区下载| 国产一区二区三区在线免费观看 | 久久国产精品久久久久| 成年人二级毛片| 欧美午夜影院| 国语自产在线不卡| www.中文字幕在线观看| 久久综合狠狠| 成人激情视频在线| 亚洲黄色小说网| 99国产精品国产精品毛片| 农村寡妇一区二区三区| 91高清在线视频| 国产精品国产成人国产三级 | 欧美精品一级二级| 搡的我好爽在线观看免费视频| 国产在线视频欧美一区| 亚洲国产精品999| 欧美丰满美乳xxⅹ高潮www| 天天影视天天精品| 久久久免费在线观看| 黄色在线免费观看| 极品少妇xxxx精品少妇偷拍| 国产精品日韩一区二区| 久久这里精品| 亚洲精品日韩一| 丰满人妻中伦妇伦精品app| 日本免费在线一区| 亚洲国产精品小视频| 美国黄色特级片| 欧美色123| 国产精自产拍久久久久久| 性猛交富婆╳xxx乱大交天津| www国产成人| 黄色小视频大全| 免费成人直播| 精品剧情v国产在线观看在线| 亚洲精品国产91| 欧美日韩一视频区二区| 国产精品美女免费视频| 蜜桃视频污在线观看| 国产精品系列在线| 国产女大学生av| 精品久久亚洲| 国产亚洲成av人片在线观看桃| 欧美偷拍第一页| 日韩电影一区二区三区| 国产一区二区黄色| av网站导航在线观看免费| 91久久免费观看| 亚洲美女精品视频| 99热精品久久| 国产精品九九久久久久久久| 黄色片网站免费在线观看| 日韩美女精品在线| 成人一区二区三| 韩国精品福利一区二区三区| 久久天天躁夜夜躁狠狠躁2022| 国产精品黄色网| 国产一区二区在线观看视频| 手机看片福利永久国产日韩| 大香伊人久久| 日韩精品一区二| 懂色av蜜臀av粉嫩av永久| 美女日韩在线中文字幕| 国产精品免费一区二区三区在线观看 | 日韩精品欧美专区| 国产自产自拍视频在线观看| 日韩一区二区在线看| 91香蕉视频污在线观看| 视频在线观看国产精品| 免费一区二区三区在在线视频| 碰碰在线视频| 亚洲国产成人91精品| 精品无码人妻一区二区三| 国产精品一区专区| 免费观看国产视频在线| 57pao成人永久免费| 日韩中文字幕免费看| 久久国产香蕉视频| 中文在线资源观看网站视频免费不卡 | 污污视频网站在线免费观看| 日韩激情av在线| 欧洲精品在线一区| 色综合一本到久久亚洲91| 亚洲精品资源美女情侣酒店| 国产精品第5页| 久久久影视传媒| 久久久久久久久久久免费视频| 日韩母乳在线| 日本三级久久久| 国产福利小视频在线| 欧美图区在线视频| 正在播放国产对白害羞| 久久国产精品第一页| 日韩视频在线观看视频| 国产麻豆一区二区三区| 美女精品久久久| 丰满熟妇乱又伦| 精品久久久久久久久中文字幕| 中文字幕在线免费看线人| 免费看黄裸体一级大秀欧美| 日韩在线电影一区| 成人看片毛片免费播放器| 爱福利视频一区| 亚洲爱情岛论坛永久| 午夜激情综合网| 亚洲无人区码一码二码三码的含义| 琪琪一区二区三区| 99亚洲国产精品| 国产精品国产| 国产成人精品在线观看| 男人天堂久久久| 精品精品国产高清a毛片牛牛 | 国产毛片欧美毛片久久久| 免费日本视频一区| 激情五月六月婷婷| 欧美热在线视频精品999| 国产乱肥老妇国产一区二| 91蜜桃在线视频| 日韩电影在线观看永久视频免费网站| 91porny九色| 亚洲精品成人悠悠色影视| 欧美成人三级伦在线观看| 另类小说综合欧美亚洲| 成人国产在线看| 国产中文精品久高清在线不| 成人免费淫片aa视频免费| 98色花堂精品视频在线观看| 在线免费观看羞羞视频一区二区| www.成人在线观看| 欧美影院一区二区| 国产精品成人国产乱| 中文字幕av一区 二区| 制服丝袜av在线| 美国一区二区三区在线播放 | 在线观看精品国产| 日韩一区日韩二区| 人妻在线日韩免费视频| 精品一区二区三区视频| 91国视频在线| 欧美在线资源| 亚洲免费视频一区| 外国成人在线视频| 91久久精品www人人做人人爽| 成人福利av| 久久久久久999| 日本精品在线| 亚洲网在线观看| 亚洲色欧美另类| 91精品国产综合久久久久| 99成人精品视频| 亚洲444eee在线观看| 中文字幕在线观看2018| 欧美激情一区在线| 99久久国产精| 丰满亚洲少妇av| 337p粉嫩大胆噜噜噜噜噜91av | 欧美成人女星排行榜| 国产美女www| 精品久久久久久中文字幕一区奶水 | 九九精品久久久| 美女精品在线| 日本精品免费在线观看| 一区精品久久| 日本福利视频在线观看| 欧美mv日韩| 亚洲一区二区三区午夜| 免费看av成人| 蜜桃视频日韩| 免费成人高清在线视频theav| 好看的日韩精品| 久久午夜影院| 国产一区二区无遮挡| 一区二区三区视频免费视频观看网站| 成人综合网网址| 99久久久成人国产精品| 成人黄色在线免费| 亚洲欧美在线人成swag| 国产欧美亚洲视频| 久久亚洲精品中文字幕| 国产精品一区久久| 性欧美video另类hd尤物| 日韩美女视频免费看| sese综合| 国产精品xxxxx| 亚洲电影有码| 国产精品影片在线观看| 久久久久久久性潮| 91视频国产一区| 亚洲午夜免费| 国产精品theporn88| 精品精品国产毛片在线看| 久久av二区| 国产精品一区高清| 视频一区国产精品| 午夜久久一区| av在线观看地址| 国产一区二区三区久久久久久久久 | 久久动漫亚洲| 五月婷婷之综合激情| 精品一二三四区| 国产无套精品一区二区三区| 成人午夜视频网站| 日韩av一二区| 国产精品美女久久福利网站| 成人免费精品动漫网站| 亚洲国产一区视频| 日韩欧美在线观看免费| 欧美丝袜丝交足nylons| 国产高清第一页| 亚洲国产精品国自产拍av秋霞 | 国产精品天美传媒| 亚洲熟女www一区二区三区| 亚洲成a人片在线不卡一二三区| 五月天婷婷激情| 欧美高清视频一二三区 | 欧美大片免费观看| 蜜桃视频在线观看免费视频| 国产精品永久免费视频| 136福利精品导航| 日本一区二区三区四区在线观看 | 97久久综合精品久久久综合| 久久久久久国产精品mv| 日韩三级在线| 99色这里只有精品| 麻豆国产欧美日韩综合精品二区| 久久aaaa片一区二区| 久久综合久久综合九色| 三级黄色录像视频| 欧美日韩国产精品专区| 丁香社区五月天| 精品日本一线二线三线不卡| 国产尤物视频在线| 久久99视频精品| 91成人抖音| 国产日韩一区欧美| 911久久香蕉国产线看观看| 日本三级免费观看| 国产白丝网站精品污在线入口| 九九热免费在线| 午夜影院久久久| 国产视频一二三四区| 亚洲人精品午夜在线观看| 欧洲一区二区三区| 国产专区精品视频| 免费黄色成人| www.com毛片| www.亚洲人| 国产亚洲精品久久777777| 欧美日韩久久一区| 国内av一区二区三区| 亚洲91精品在线观看| 日韩影片在线观看| 一区不卡字幕| 日产国产高清一区二区三区| 偷拍女澡堂一区二区三区| 亚洲最大的成人av| 国产女人18毛片18精品| 中文字幕日韩专区| 色婷婷综合久久久中字幕精品久久| 国产福利一区二区三区在线观看| 国产精品久久久久9999赢消| 超碰影院在线观看| 91亚洲男人天堂| 国产在线拍揄自揄拍| 91麻豆精品国产| 欧美精品电影| 成人综合网网址| 天天做综合网| 婷婷激情5月天| 综合av第一页| 国产青青草视频| 久久综合亚洲社区| 国产麻豆精品| 青青在线视频免费观看| 国产麻豆精品一区二区| 三级影片在线看| 91麻豆精品国产91久久久久久| 国产黄色小视频在线| 91久久国产婷婷一区二区| 亚洲天堂免费| 亚洲少妇中文字幕| 五月综合激情日本mⅴ| 性xxxx视频| 茄子视频成人在线| 欧美综合一区| 欧美激情国内自拍| 樱花影视一区二区| 老牛影视av牛牛影视av| 韩国19禁主播vip福利视频| 黄色网一区二区| 久久美女福利视频| 国产蜜臀97一区二区三区| 亚洲无码精品在线观看| 麻豆国产va免费精品高清在线| 日韩中文字幕在线一区| 亚洲熟妇无码一区二区三区| 91免费国产在线| www.亚洲激情| 久久高清视频免费| 福利片在线一区二区| 春日野结衣av| 中文字幕不卡在线播放| 午夜久久久久久久久久| 欧美一区二区三区免费视| 欧美综合视频| 99riav国产精品视频| 色拍拍在线精品视频8848| 免费a级在线播放| 国产精品国产一区二区| 美女网站久久| 波多野结衣亚洲一区二区| 日韩精品在线免费播放| 欧美日韩破处视频| 无码人妻少妇伦在线电影| 久久精品视频一区二区| japanese国产| 人人做人人澡人人爽欧美| 欧美国产偷国产精品三区| 欧美做受高潮中文字幕| 在线亚洲一区二区| 亚洲大胆人体大胆做受1| 欧美日韩一区二区视频在线观看| 韩国精品一区二区| 国产精品午夜影院| 久久久国产一区二区三区| 欧美交a欧美精品喷水| 午夜精品免费看| 欧美性猛交xxxx免费看久久久|