精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通用端到端OCR模型開源,拒絕多模態大模型降維打擊

人工智能
要想引入新OCR feature如支持一項新語言,不是SFT一下就能訓進模型的,得打開vision encoder做pre-training或者post-training,這都是相當耗資源的。

在AI-2.0時代,OCR模型的研究難道到頭了嗎!?
(OCR:一種將圖像中的文字轉換為可編輯和可搜索文本的技術)

Vary作者團隊開源了第一個邁向OCR-2.0的通用端到端模型GOT

用實驗結果向人們證明:No~No~No~

圖片圖片

GOT模型效果如何?

話不多說,直接上效果圖:

最常用的PDF image轉markdown能力最常用的PDF image轉markdown能力

 

圖片

△ 雙欄文本感知能力

圖片圖片

△ 自然場景以及細粒度OCR能力

動態分辨率OCR能力動態分辨率OCR能力

多頁OCR能力多頁OCR能力

更多符號的OCR能力更多符號的OCR能力


研究團隊稱,盡管GOT模型表現不錯,但也存在一些局限,如更多的語言支持,更復雜的幾何圖,chart上的OCR性能。

他們說OCR-2.0的研究還遠的很,GOT也還有不小提升空間(該項目在數據和算力資源上都是非常受限的)。

正是因為深知GOT以及OCR-2.0的潛力,我們希望通過開源GOT吸引更多的人,放棄VQA,再次投向強感知。都說純OCR容易背鍋,但也正好說明做的不夠work,不是嗎?

GOT: Towards OCR-2.0

通用OCR模型須要夠通用,體現在輸入輸出都要通用上。

GOT的通用具體表現為:在輸入方面,模型支持Scene Text OCR、Document OCR、Fine-grained OCR、More General OCR等任務。

圖片圖片

△ 通用OCR模型須“通用”

輸出方面,模型同時支持plain texts輸出以及可讀性強、可編輯的formatted文本輸出,如markdown等。

模型的結構和訓練方法,采用vision encoder+input embedding layer+decoder的pipeline。

Encoder主體采用帶local attention的VITDet架構,不會讓CLIP方案的全程global attention在高分辨率下激活太大,炸顯存。

Encoder后兩層采用Vary的雙卷積設計方案。整個Encoder將1024×1024×3的圖像壓縮為256×1024的image tokens,足以做好A4紙級別的dense OCR。

圖片圖片

△ GOT結構與訓練流程圖

研究團隊將整個訓練過程分為三個步驟,沒有一個階段鎖LLM,過程中沒有存在圖像到文本的對齊階段,進而導致損害image token的文字壓縮率。

三個訓練階段分別為:

第一階段:高效預訓練encoder,GOT在整個訓練過程中,沒有A100級別的卡,為了節省資源,該階段使用小型OPT-125M作為decoder為encoder提供優化方向,快速灌入大量數據。

第二階段:聯合訓練encoder-decoder,該階段GOT的基本結構搭建完成,為上一階段預訓練好的encoder,以及Qwen團隊預訓練好的Qwen0.5B。

研究團隊稍稍加大了decoder的大小,因為該階段需要喂入大量OCR-2.0的知識,而不少數據(如化學式的OCR)其實也是帶點reasoning的,不過更小的decoder他們未敢嘗試。

第三階段:鎖住encoder,加強decoder以適配更多的OCR應用場景,如支持坐標或者顏色引導的細粒度OCR(點讀筆可能會用到),支持動態分辨率OCR技術(超大分辨率圖可能會用到),多頁OCR技術。

該feature主要是為了后續follower能更好地訓練Arxiv這種數據,我們的設想是多頁PDF直接訓練,無須再對.tex斷頁而苦惱!

面對整個GOT模型設計中最困難的數據工程環節。研究團隊為了構造各種各樣的數據,還學習了眾多數據渲染工具,包括Latex,Mathpix-markdown-it,Matplotlib,Tikz,Verovio, Pyecharts等等。

圖片圖片

△ GOT使用到的數據渲染工具

OCR的研究才剛剛開始

關于為什么在大模型相互梭哈的時代繼續研究OCR?

研究團隊有他們自己的理由:

OCR一直是離落地最近的研究方向之一,是AI-1.0時代的技術結晶。


到了以LLM(LVLM)為核心的AI-2.0時代,OCR成了多模大模型的一項基本能力,各家模型甚至有梭哈之勢。


多模態大模型作為通用模型,總有種降維打擊OCR模型的感覺。


那么純OCR的研究真的到頭了嗎?我們想說:當然沒有!沒準才剛剛開始。


首先盤一下AI-1.0 OCR系統和LVLM OCR的缺點:


首先是AI-1.0流水線式的OCR系統,缺點不用多說,各個模塊比較獨立,局部最優,維護成本也大。


最重要的是不通用,不同OCR任務需路由不同模型,不太方便。


那么多模態大模型在pure OCR任務上有什么缺陷呢?我們認為有以下兩點:


1、為Reasoning讓路必然導致image token數量過多,進而導致在純OCR任務上存在bottle-neck。


Reasoning(VQA-like)能力來自LLM(decoder),要想獲得更好的VQA能力(至少在刷點上),就要充分利用起LLM來,那么image token就得越像text token(至少高維上,這樣就會讓LLM更舒服)。


試想一下,100個text token在LLM詞表上能編碼多少文字?那么一頁PDF的文字,又需要多少token呢?不難發現,保VQA就會導致在做OCR任務上,尤其是dense OCR任務上,模型搞得比較丑陋。


例如,一頁PDF圖片只有A4紙大小,很多LVLM要都需要切圖做OCR,切出幾千個image token。單張都要切圖,拿出多頁PDF拼接圖,閣下又當如何應對?


我們認為對于OCR模型這么多token大可不必。


2、非常直觀的一點就是模型太大,迭代困難


要想引入新OCR feature如支持一項新語言,不是SFT一下就能訓進模型的,得打開vision encoder做pre-training或者post-training,這都是相當耗資源的。

對于OCR需求來說太浪費了。


有人會說,小模型能同時做好這么多OCR任務嗎?


我們的答案是肯定的,而且甚至還能更好

論文地址:https://arxiv.org/pdf/2409.01704

項目地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-01-08 08:21:16

2024-03-25 12:40:19

訓練模型

2025-01-16 10:11:58

2025-09-16 09:35:52

2025-07-02 09:46:30

2024-10-14 14:10:00

大模型AI開源

2024-03-25 12:30:18

AI訓練開源

2023-12-25 13:24:00

模型OCR頁面

2024-12-12 00:25:09

2024-01-22 13:59:00

模型訓練

2025-09-23 09:20:05

2024-12-30 00:01:00

多模態大模型Python

2024-05-27 07:21:43

2025-03-19 09:30:00

2025-04-07 03:00:00

自動駕駛
點贊
收藏

51CTO技術棧公眾號

91最新在线免费观看| 亚洲精品久久久久久久久| 最新欧美日韩亚洲| 亚洲av少妇一区二区在线观看| 欧美成人国产| 亚洲精品久久久一区二区三区 | 91丝袜脚交足在线播放| 亚洲视频免费播放| 欧美电影免费| 亚洲国产精品999| 午夜免费看视频| 2021中文字幕在线| 中文字幕免费在线观看视频一区| 亚洲一区二区三区四区视频 | 欧美精品乱码久久久久久按摩| 黄网站色视频免费观看| 国产三级视频在线| 国产99久久久国产精品| 国产福利视频一区| 久久久久久久9999| 91中文字幕精品永久在线| 亚洲国产精品va在线观看黑人| 亚洲36d大奶网| 手机在线观看av| 一区二区三区鲁丝不卡| 五月天久久综合网| 天堂国产一区二区三区| 国产精品一区三区| 国产欧美日韩中文| 无码任你躁久久久久久久| 亚洲视屏一区| 久久国产精品久久精品| 国产精品久久久视频| 色婷婷综合久久久久久| 精品av综合导航| 日本一本在线视频| 只有精品亚洲| 欧美日韩一卡二卡三卡 | 中文字幕成在线观看| 一区二区三区精品久久久| 正在播放亚洲| 在线观看h片| 国产欧美日韩不卡免费| 蜜桃av噜噜一区二区三区| 亚洲av无码乱码国产麻豆 | 日本japanese极品少妇| 99精品国产一区二区三区2021 | 国产97免费视| 黄色片视频免费| 久久国产精品毛片| 青青青国产精品一区二区| 黄色一级片免费看| 999在线观看精品免费不卡网站| 欧美激情图片区| 久久午夜无码鲁丝片| 欧美精品午夜| 欧美精品久久久久久久免费观看| 免费视频网站www| 国内视频精品| 欧美巨乳在线观看| 欧美日韩大片在线观看| 一区在线免费观看| 欧美中在线观看| 无码人妻精品一区二区蜜桃色欲| 日日夜夜精品免费视频| 国产精品专区第二| 精品国产伦一区二区三区| 国产精品伊人色| 国内精品久久国产| 精品av中文字幕在线毛片| 久久精品亚洲一区二区三区浴池| 色噜噜狠狠色综合网| 午夜激情视频在线观看| 伊人色综合久久天天| 国产精品国产亚洲精品看不卡| 91破解版在线观看| 色婷婷香蕉在线一区二区| 中文字幕国内自拍| 精品入口麻豆88视频| 精品国精品国产| 国产男男chinese网站| 日本久久综合| 欧美激情精品久久久久久黑人| 天天操天天干视频| 久久天堂精品| 91老司机精品视频| 五月激情六月婷婷| 国产精品色婷婷久久58| 4444在线观看| 午夜欧美巨大性欧美巨大 | 欧美性一区二区三区| 国产精品sm调教免费专区| 国产精品夜夜嗨| 久久伊人一区| 中文字幕中文字幕在线十八区| 五月婷婷久久综合| 亚洲va综合va国产va中文| 91大神精品| 中文字幕亚洲欧美日韩在线不卡 | 欧美视频在线看| 亚洲黄色av片| 台湾佬综合网| 欧美精品生活片| 天堂av免费在线观看| 风间由美性色一区二区三区| 日韩在线三区| 草草在线观看| 3d动漫精品啪啪1区2区免费| 毛茸茸多毛bbb毛多视频| 91久久电影| 国产成人精品久久亚洲高清不卡| a在线观看视频| 欧美激情一二三区| 99热亚洲精品| 国产精品成人**免费视频| 亚洲精品视频免费在线观看| 亚洲国产精品免费在线观看| 日韩av电影天堂| 免费精品视频一区| 女子免费在线观看视频www| 欧美日韩一区精品| 亚洲一区二区三区蜜桃| 亚洲黄色影片| 成人综合电影| 最新黄网在线观看| 在线成人免费视频| 中文天堂资源在线| 日韩精品国产欧美| 麻豆一区区三区四区产品精品蜜桃| v片在线观看| 欧美精品日韩一区| 国产精品综合激情| 奇米影视一区二区三区小说| 久热国产精品视频一区二区三区| 51漫画成人app入口| 精品成人a区在线观看| 日日骚一区二区三区| 国产一区二区三区日韩| 中文一区一区三区免费| 久久亚洲人体| 丝袜一区二区三区| 91极品身材尤物theporn| 国产午夜亚洲精品理论片色戒| 精品少妇人妻av免费久久洗澡| 伊人久久影院| 久久久久久久91| 人妻少妇精品无码专区| 亚洲成人在线免费| 白嫩情侣偷拍呻吟刺激| 国产综合久久| 国产精品免费视频一区二区| 国产探花在线观看| 亚洲黄色有码视频| 亚洲熟女综合色一区二区三区| 91污片在线观看| 18禁男女爽爽爽午夜网站免费 | 国产在线精品免费av| gogogo免费高清日本写真| 国产精品一区二区精品| 欧美日韩成人在线视频| 国产成人手机在线| 高跟丝袜欧美一区| 老熟妇一区二区| 六月婷婷色综合| 热这里只有精品| 岛国成人av| 日本韩国在线不卡| 在线看黄色av| 精品少妇一区二区三区视频免付费 | 日韩欧美在线免费观看| 中国极品少妇videossexhd | 久久久伊人日本| 婷婷国产在线| 欧美丝袜自拍制服另类| 天堂网avav| av不卡一区二区三区| 密臀av一区二区三区| 91精品观看| 老牛影视免费一区二区| 欧美日韩卡一| 欧美精品久久久久久久久久| 理论视频在线| 91精品国产麻豆国产自产在线 | 国产毛片久久久久久久| 久久66热偷产精品| 日韩欧美不卡在线| 日韩欧美国产精品综合嫩v| 91视频8mav| 波多视频一区| 欧美精品一本久久男人的天堂| 天天躁日日躁狠狠躁喷水| 欧美日韩一区二区三区视频| 国产一卡二卡在线播放| 国产欧美一区二区精品忘忧草| 日韩av影视大全| 国产亚洲激情| 一本—道久久a久久精品蜜桃| 菁菁伊人国产精品| 国产在线精品一区免费香蕉| 成人bbav| 久久久精品网站| 国模精品一区二区| 精品少妇一区二区三区在线播放 | 国产精品白丝喷水在线观看| 99精品欧美一区二区三区小说 | 社区色欧美激情 | 特黄视频在线观看| 91精品国产综合久久精品麻豆 | 欧美一区二区不卡视频| caoporn国产| 一区二区三区四区在线免费观看| 亚洲av毛片基地| 91麻豆视频网站| 中文字幕在线观看91| 老鸭窝一区二区久久精品| 97国产在线播放| 欧美三级免费| 国产三级中文字幕| 久久国产电影| 亚州欧美一区三区三区在线| 日韩欧美在线精品| 风间由美一区二区三区| 日本免费精品| 91精品久久久久久综合乱菊| 欧美片第一页| 欧洲亚洲在线视频| 麻豆理论在线观看| 韩国精品美女www爽爽爽视频| 免费在线观看av网站| 中文字幕日韩精品在线| 久色视频在线| 亚洲欧美日韩中文在线| 日韩在线免费看| 亚洲国产精彩中文乱码av在线播放| 国产福利资源在线| 91精品国产91久久久久久一区二区| 中文字幕亚洲乱码熟女1区2区| 粉嫩老牛aⅴ一区二区三区| 日本午夜精品理论片a级app发布| 一区二区理论电影在线观看| 2021亚洲天堂| 一区二区三区不卡视频| 强乱中文字幕av一区乱码| 亚洲免费三区一区二区| 国产成人综合在线视频| 亚洲欧美日韩综合aⅴ视频| chinese全程对白| 自拍偷拍欧美精品| 国产一区二区播放| 亚洲老司机在线| 欧美久久久久久久久久久久| 亚洲午夜精品久久久久久久久| 久久在线视频精品| 午夜精品久久久久久久99水蜜桃 | 最近中文字幕免费视频| 国产午夜精品久久久久久免费视| 国产ts在线播放| 中文子幕无线码一区tr| 男人晚上看的视频| 亚洲男人的天堂一区二区 | 亚洲国产二区| 国产肥臀一区二区福利视频| 久久亚洲色图| 天天干天天玩天天操| 国产精品综合一区二区三区| 国内自拍偷拍视频| 91欧美激情一区二区三区成人| 黄色aaa视频| 一区视频在线播放| 国产亚洲第一页| 欧美性猛交xxxx乱大交3| 波多野结衣视频观看| 欧美老女人第四色| 亚洲精品一级片| 亚洲男人天堂2024| 欧美高清视频| 欧美日韩国产成人高清视频| 涩涩涩在线视频| 成人黄色午夜影院| 欧美三级自拍| 亚洲图片都市激情| 亚洲人www| 天天天干夜夜夜操| 国产精品自拍在线| 欧美黑人欧美精品刺激| 亚洲天堂网中文字| 日韩少妇裸体做爰视频| 色老汉一区二区三区| 精品欧美一区二区精品少妇| 日韩精品在线免费播放| 精品51国产黑色丝袜高跟鞋| 97激碰免费视频| 久久久久黄色| 久久国产精品免费一区| 亚洲国产老妈| 国产精品久久久久9999小说| 国产a久久麻豆| 男人天堂资源网| 婷婷激情综合网| 国产精品嫩草影院精东| 亚洲欧美综合图区| 美女网站视频在线| 国产专区精品视频| 亚洲宅男一区| www插插插无码免费视频网站| 日韩精品免费专区| 国产激情视频网站| 亚洲男同性恋视频| 亚洲一线在线观看| 亚洲美女自拍视频| 不卡的av影片| 亚洲最大福利网| 日韩中文在线电影| 91av在线免费播放| 99国产精品久久久久| 26uuu成人网| 欧美色视频一区| 日韩一区二区三区中文字幕| 久久欧美在线电影| 亚洲成人偷拍| 公共露出暴露狂另类av| 蜜桃视频一区二区| 真实乱视频国产免费观看| 亚洲v日本v欧美v久久精品| 99精品免费观看| 日韩专区在线播放| www.国产精品| 日韩成人在线资源| 日韩黄色一级片| 在线观看福利片| 日韩欧美在线观看| 欧洲一区av| 欧美重口另类videos人妖| 丝袜连裤袜欧美激情日韩| 欧美在线一区视频| 不卡视频在线观看| 免费观看一级视频| 欧美va亚洲va| 国产在线拍揄自揄拍视频| 成人看片视频| 亚洲图片在线| 四虎永久免费观看| 亚洲第一在线综合网站| 黄色三级网站在线观看| 久久久亚洲网站| 日韩美脚连裤袜丝袜在线| www黄色日本| 久久久久久久综合| 91porny九色| 在线观看欧美日韩国产| 国产电影一区二区三区爱妃记| 日韩欧美三级一区二区| 免费成人在线观看| 人人澡人人澡人人看| 日韩一区二区三区在线| 蜜臀av在线| 美脚丝袜一区二区三区在线观看| 噜噜爱69成人精品| 国产不卡在线观看视频| 欧美日韩国产一区| 国产三级在线播放| yy111111少妇影院日韩夜片| 在线看片一区| 五级黄高潮片90分钟视频| 欧洲精品一区二区| 麻豆av在线免费看| 国产精品视频在线免费观看| 伊人天天综合| 青娱乐国产视频| 欧美一级日韩免费不卡| 岛国毛片av在线| 日本一区二区在线视频| 精久久久久久久久久久| 国产无套内射又大又猛又粗又爽| 日韩精品欧美激情| 岛国一区二区| 国产资源在线免费观看| 久久综合99re88久久爱| 91久久久久国产一区二区| 欧美—级a级欧美特级ar全黄| 国产99久久精品一区二区300| jizz大全欧美jizzcom| 亚洲一区精品在线| 福利视频在线播放| 国产精品露出视频| 蜜桃一区二区三区在线观看| 久久久精品视频在线| 国产亚洲精品久久久久久牛牛| 国产麻豆精品| 十八禁视频网站在线观看| 亚洲乱码精品一二三四区日韩在线| 无码国产精品一区二区免费16 | 豆花视频一区二区| 噼里啪啦国语在线观看免费版高清版| 亚洲精品欧美专区| 国产视频精品久久| 精品国产乱码久久久久久郑州公司| 日韩成人一区二区三区在线观看| 麻豆亚洲av成人无码久久精品| 国产亚洲精品久久|