精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小紅書hi lab開源多語言文檔布局解析模型dots.ocr,1.7B小模型實現SOTA性能

人工智能
dots.ocr 是一款功能強大、支持多語言的文檔解析模型,它在單一的視覺語言模型中統一了布局檢測和內容識別,同時能保持良好的閱讀順序。

dots.ocr 是一款功能強大、支持多語言的文檔解析模型,它在單一的視覺語言模型中統一了布局檢測和內容識別,同時能保持良好的閱讀順序。盡管其基礎模型是一個17億參數的“小模型”,但它依然實現了業界領先(SOTA)的性能。dots.ocr對多語言識別的良好性能彌補了開源社區的空白,不錯的檢測、識別能力也為多模態和大模型社區提供了寶貴的基礎。

01、簡介

dots.ocr 是一款功能強大、支持多語言的文檔解析模型,它在單一的視覺語言模型中統一了布局檢測和內容識別,同時能保持良好的閱讀順序。盡管其基礎僅是一個17億參數的”小模型“,但依然在多個benchmark上獲得了匹配超大參數量閉源模型的業界領先(SOTA)性能。

  • 性能強大dots.ocr 在 OmniDocBench 基準測試上,針對文本、表格和閱讀順序三方面均取得了業界領先(SOTA)的性能,同時其公式識別效果可與豆包-1.5(Doubao-1.5)和 gemini2.5-pro 等更大規模的模型相媲美。
  • 多語言支持dots.ocr 在小語種上展現出強大的解析能力,在我們內部的多語言文檔基準測試中,無論是在布局檢測還是內容識別方面,都取得了顯著的優勢。
  • 統一且簡潔的架構:通過利用單一的視覺語言模型,dots.ocr 提供了一個比依賴復雜多模型流水線的方法更為精簡的架構。任務切換僅需通過更改輸入提示詞(prompt)即可完成,證明了視覺語言模型(VLM)同樣可以取得與 DocLayout-YOLO 等傳統檢測模型相媲美的檢測效果。
  • 高效與快速dots.ocr 基于一個17億參數的大語言模型構建,因此其推理速度優于多種更大規模的 VLM 方案。

github:

https://github.com/rednote-hilab/dots.ocr

hugginface:

https://huggingface.co/rednote-hilab/dots.ocr

demo:

https://dotsocr.xiaohongshu.com

多語種端到端識別性能對比

注:英文(EN)和中文(ZH)的指標是 OmniDocBench的端到端指標,多語言(Multilingual)的指標是dots.ocr-bench的端到端指標。

02、樣例展示

2.1 公式解析樣例

<左右滑動查看更多>

2.2 表格解析樣例

<左右滑動查看更多>

2.3 多語言解析樣例


<左右滑動查看更多>


<左右滑動查看更多>

2.4 閱讀順序樣例

2.5 局部解析樣例

03、評測指標

3.1 OmniDocBench

不同任務的端到端指標

9種PDF類型的文本識別指標

3.2 dots.ocr-bench

不同任務的端到端指標

Layout檢測指標

注: parse all和detection only分別使用“全量解析”和“檢測only”的prompt。

3.3 olmOCR-bench

04、方法

4.1 預訓練

我們通過一個三階段的訓練過程,開發了一個基座視覺語言模型(VLM):

  • 階段一:視覺編碼器預訓練
    我們基于一個規模龐大且內容豐富的圖文對數據集,從零開始訓練了一個12億參數的視覺編碼器。
  • 階段二:視覺編碼器持續預訓練
    我們采用NaViT動態分辨率架構支持高達1100萬像素的高分辨率輸入,同時加入了OCR、視頻、定位數據(grounding data)等額外的視覺數據,我們將該視覺編碼器與Qwen2.5-1.5B語言模型進行對齊,并在這些多樣的視覺數據上訓練,最終產出了我們的通用視覺編碼器 dots.vit。
  • 階段三:VLM訓練 
    我們使用純OCR數據集訓練。為提升訓練效率,我們首先在凍結VE參數的情況下,訓練一定量的tokens;隨后,我們放開全部參數繼續訓練了1/5的token量,最終產出了我們的OCR基座模型 dots.ocr.base。

4.2 監督微調

SFT階段采用了以下關鍵策略:

  • 多樣化的SFT數據集:我們構建了一個包含數十萬樣本的數據集,該數據集整合了我們內部的人工標注數據、合成數據(表格、公式、多語言OCR)以及開源數據集。
  • 迭代式數據飛輪:我們采用反饋循環機制,構建了一個包含1.5萬樣本的內部多語言結構化layout數據集。這個過程經過了三次迭代,包含以下步驟:
  1. 根據模型表現,篩選出“壞樣本”(bad cases)。
  2. 對這些樣本進行人工標注。
  3. 將它們重新加入訓練集。
  • 閱讀順序:我們采用“大模型排序 + 規則后驗”的方法修正了所有版面布局(layout)數據中元素框的順序。我們發現,在數據質量和多樣性足夠的情況下,將元素列表按閱讀順序排列后進行訓練,即可獲得出色的效果。
  • 質量與魯棒性:我們構建了一個多專家系統,用于數據清洗和蒸餾,并應用了數據增強(如縮放、旋轉、加噪聲)來提升模型的魯棒性。
  • 多任務訓練:我們利用單一的結構化布局數據源,構造不同提示詞(prompts)的SFT數據。這種方法使得模型能根據提供的特定提示詞,執行不同的任務,例如檢測和識別。

最終得到的 dots.ocr 模型,其性能可與參數量遠超于它的模型相媲美。

05、局限性和未來工作

雖然有不錯的性能,但模型仍存在一些局限性和未來可改進之處:

  • 復雜的文檔元素:

     a.表格與公式:對于高復雜度的表格和公式提取,dots.ocr 的表現尚不完美。

     b.圖片:目前模型還無法解析文檔中的圖片信息。

  • 解析失敗: 在特定條件下,模型可能會解析失敗:

     a.當字符與像素的比率過高時。建議嘗試放大圖片或提高PDF解析的DPI(推薦設置為200)。但請注意,模型在分辨率低于11,289,600像素的圖像上表現最佳。

     b.連續的特殊字符,如省略號(...)和下劃線(_),可能會導致預測輸出無限重復。在這種情況下,可以考慮使用其他提示詞,詳見github倉庫。

  • 性能瓶頸:

      a.盡管dots.ocr基于17億參數的LLM開發,但相對于PDF文件龐大的規模而言,它的效率仍然不夠高。

未來,我們將進一步提升模型對表格和公式解析能力,并增強模型在不同場景的泛化能力,打造一個更強大、更高效的模型。此外,我們正考慮基于單視覺語言模型(VLM)完成更通用和廣泛的感知任務,包括通用檢測、圖像描述和OCR任務等。解析文檔中圖片的內容也是我們未來工作的重點之一。

06、作者簡介

Contributors

簡米

小紅書hi lab團隊算法工程師,主要研究方向是多模態大模型

李雨萌

小紅書hi lab團隊算法實習生,現就讀于北京航空航天大學,主要研究方向為多模態理解和生成

王泊文

小紅書 hi lab團隊算法實習生,現就讀于美國賓夕法尼亞大學工程學院,主要研究方向為大語言模型對齊、多模態對齊

Project Leader

燕青

小紅書hi lab團隊算法工程師,主要研究方向是多模態大模型

Advisor

柯雄(colin zhang)

小紅書 hi lab 多模方向研發負責人

責任編輯:龐桂玉 來源: 小紅書技術REDtech
相關推薦

2025-08-07 02:00:00

2025-08-07 16:24:19

小紅書開源dots.vlm1

2025-06-10 03:30:00

2025-06-25 09:53:59

2024-10-12 10:57:39

2024-03-04 14:15:16

OpenAI語言嵌入模型

2024-09-29 13:10:08

2009-08-25 10:44:50

C#實現多語言

2011-08-05 17:54:33

Cocoa Touch 多語言

2012-04-19 11:40:21

Titanium

2025-06-10 05:00:00

2025-07-02 14:39:29

開源模型AI

2023-10-18 15:21:23

2021-06-29 21:48:32

開源語言架構

2025-06-06 14:32:20

阿里開源Qwen3

2025-06-09 09:41:25

2025-02-10 08:30:00

2025-11-20 08:35:59

2023-05-23 14:14:14

技術模型

2024-04-02 09:17:50

AI數據開源
點贊
收藏

51CTO技術棧公眾號

最新国产精品视频| 成人av福利| 玖玖玖国产精品| 国产一区二区三区在线播放免费观看| 97成人在线观看视频| 五月天激情开心网| 三级亚洲高清视频| 亚洲欧美日韩视频一区| 日本在线一二三区| 羞羞视频在线免费国产| av一本久道久久综合久久鬼色| 4438全国亚洲精品在线观看视频| 国产成人无码精品久久二区三| 韩日一区二区| 一区二区三区在线高清| 精品久久久久亚洲| 久久精品视频5| 999精品在线| 亚洲激情视频网站| 黄色影院一级片| 日本高清视频在线观看| 成人三级在线视频| 国产精品成人在线| 麻豆changesxxx国产| 一区二区三区四区在线看 | 免费看黄色的视频| 麻豆精品久久| 欧美性色视频在线| 日本成人性视频| 天堂中文在线8| 激情五月婷婷综合网| 欧美亚洲日本网站| 久久久久亚洲av片无码| 亚洲激情播播| 日韩精品一区二区三区四区| 天堂在线资源视频| xxx.xxx欧美| 亚洲视频在线观看一区| 欧美日韩国产精品一卡| 国产高清视频免费观看| 日本午夜精品视频在线观看| 高清欧美电影在线| 九九热久久免费视频| 日本亚洲不卡| 日韩精品在线看片z| 亚洲天堂国产视频| 亚洲妇女成熟| 午夜一区二区三区视频| 伊人久久av导航| 国产一级片在线播放| av一区二区三区黑人| 亚洲最大av在线| 中文字幕久久网| 欧美专区在线| 久久99亚洲热视| 欧美日韩综合一区二区| 天天射综合网视频| 一本一本久久a久久精品综合小说| wwwxx日本| 亚洲三级av| 日韩免费视频一区二区| 亚洲欧美日韩一二三区| 国产成人免费| 欧美午夜精品电影| 999精品视频在线| 日本免费一区二区六区| 一区二区三区不卡视频在线观看 | 色噜噜狠狠一区二区三区狼国成人| 69久成人做爰电影| 狠狠躁夜夜躁人人爽天天天天97| 成年人视频网站免费| 性欧美videoshd高清| 综合久久一区二区三区| 亚洲砖区区免费| 日本视频在线播放| 国产精品卡一卡二| 伊人情人网综合| 成人在线影视| 亚洲在线一区二区三区| 搞av.com| 欧美艳星kaydenkross| 狠狠干狠狠久久| av网址在线观看免费| 伊人久久视频| 欧美性videosxxxxx| 亚洲国产高清av| 国产麻豆一区二区三区| 日韩美女一区二区三区四区| 日韩高清一二三区| 欧美a级网站| 亚洲男人av电影| 黑人と日本人の交わりビデオ| 日韩精品一区二区三区免费观影| 日韩中文综合网| 久久国产露脸精品国产| 99精品欧美| 国产精品久久久久久久av电影 | 自拍偷拍你懂的| 亚洲不卡av不卡一区二区| 欧美激情a在线| 中文字幕一区二区三区手机版| 在线亚洲激情| 国产精品视频久久久久| 国产ts人妖调教重口男| 成人a免费在线看| 欧美一区二区高清在线观看| 日本不卡三区| 亚洲午夜成aⅴ人片| 欧美日韩在线不卡视频| 四虎在线精品| 亚洲国产精品电影在线观看| 摸摸摸bbb毛毛毛片| 亚洲午夜精品一区二区国产| 亚州精品天堂中文字幕| 亚洲网站在线免费观看| 成人综合激情网| 日本精品国语自产拍在线观看| jizz性欧美| 日韩欧美精品网站| 中文字幕在线视频精品| 日韩mv欧美mv国产网站| 久久精品国产亚洲精品| 国产情侣自拍av| 国内精品久久久久影院薰衣草 | www.这里只有精品| 99久久香蕉| 亚洲视频在线观看| 久久久久久久极品内射| 美日韩一区二区| 久久99九九| 国产在线观看av| 色综合天天性综合| 欧美做受高潮中文字幕| 国产一区二区三区四区五区| 欧美理论片在线观看| 最新中文字幕免费| 99久久777色| 日本一道在线观看| 成人免费在线观看视频| 精品亚洲夜色av98在线观看| 青青草手机视频在线观看| 久久国产精品99国产| 国产精品sss| 99自拍视频在线观看| 欧美三级在线看| 波多野结衣办公室33分钟| 欧美日韩蜜桃| 亚洲已满18点击进入在线看片| 高清美女视频一区| 亚洲第一福利视频在线| 国产黄色一区二区三区| 日韩理论在线| 国产精品高精视频免费| 国产私拍精品| 欧美性猛交xxxx富婆| 在线观看亚洲免费视频| 中文字幕免费一区二区| 91久久综合亚洲鲁鲁五月天| 在线观看av黄网站永久| 在线观看日产精品| 久久久久久久久免费看无码| 99成人在线| 国产伦精品一区二区三区照片91| 羞羞网站在线免费观看| 欧美一级片在线观看| 一区二区国产精品精华液| 国产乱子轮精品视频| 青青视频免费在线观看| 亚洲**毛片| 色综合老司机第九色激情| 国产高潮在线观看| 一区2区3区在线看| 国产婷婷在线观看| 最新亚洲一区| 国产精品xxx在线观看www| 黄色大片在线| 亚洲国产成人精品电影| 99精品视频99| 久久影院视频免费| 日韩福利视频在线| 国产在视频线精品视频www666| 97人人爽人人喊人人模波多| 日本一区高清| 欧美系列日韩一区| 久草手机视频在线观看| 国产做a爰片久久毛片| 国产人妻人伦精品| 国产精品chinese在线观看| 高清欧美性猛交xxxx| 天堂在线视频免费| 91久久精品一区二区二区| 国产视频不卡在线| 国产麻豆午夜三级精品| 欧美一级欧美一级| 日韩极品在线| 国产精品影片在线观看| 性欧美高清come| 亚洲精品中文字幕女同| 中文 欧美 日韩| 一区二区三区日本| 30一40一50老女人毛片| 老司机免费视频一区二区三区| 麻豆映画在线观看| 校园春色另类视频| 国产在线98福利播放视频| 男女在线观看视频| 亚洲欧美精品伊人久久| 91中文字幕在线播放| 亚洲图片欧美一区| 亚洲调教欧美在线| 久久精品久久99精品久久| 男人添女荫道口图片| 日本道不卡免费一区| 波多野结衣久草一区| 亚洲综合在线电影| 日韩一区二区三区国产| 深夜影院在线观看| 欧美一区二区视频在线观看| 色屁屁影院www国产高清麻豆| 亚洲欧洲国产专区| 国产在线不卡av| 免费成人在线影院| 看av免费毛片手机播放| 欧美99久久| 视频在线观看成人| 亚洲精品一区二区三区中文字幕| 国产成人综合精品在线| 91九色在线播放| 久久综合网hezyo| 成人网视频在线观看| 亚洲高清av在线| 国产精品无码在线播放| 五月天久久比比资源色| 神马午夜精品91| 国产精品污www在线观看| 中文字幕天堂av| 韩国女主播成人在线| 久久国产色av免费观看| 一本综合精品| 国产精品啪啪啪视频| 日韩久久电影| 欧美一区激情视频在线观看| 东京久久高清| 成人在线看片| 7777精品| 97人人模人人爽人人少妇| 成人在线不卡| 国产精品高潮视频| 国产日韩电影| 2019最新中文字幕| 嗯~啊~轻一点视频日本在线观看| 久久精品国产99国产精品澳门 | 日本一区二区不卡在线| 亚洲精品日日夜夜| 91麻豆精品成人一区二区| 国产精品久久看| 瑟瑟视频在线观看| 久久久高清一区二区三区| 国产精品扒开腿做爽爽| 91麻豆6部合集magnet| 一级黄色片毛片| 成人av一区二区三区| 国产高潮失禁喷水爽到抽搐| 久久国内精品视频| 天堂av在线8| 激情综合网激情| 亚洲天堂网2018| 国产专区欧美精品| 三级网站免费看| 国产91精品精华液一区二区三区 | www.男人天堂网| 亚洲欧洲一区二区天堂久久| 黄色一级视频在线播放| 亚洲视频播放| 国产偷人视频免费| 日韩av一区二区在线影视| xxxx一级片| 国产美女一区二区| 中文字幕乱码在线人视频| 国产91高潮流白浆在线麻豆| 国产黑丝一区二区| 久久久不卡网国产精品一区| 91视频免费看片| 亚洲精品免费在线播放| 国产一级片播放| 欧美日韩在线第一页| www.久久视频| 678五月天丁香亚洲综合网| www.国产欧美| 亚洲国产精品字幕| 最新国产在线观看| 欧美激情亚洲视频| 国产激情久久| 国产一区二区三区无遮挡 | 这里只有精品999| 精品久久久三级丝袜| 国产区av在线| 国内揄拍国内精品| av一级久久| 日韩av不卡播放| 好看不卡的中文字幕| 我看黄色一级片| av在线这里只有精品| 亚洲欧美精品aaaaaa片| 91成人在线观看喷潮| 刘亦菲久久免费一区二区| 在线精品国产欧美| 久久男人天堂| 99在线观看视频网站| 日韩欧美中文| 国产l精品国产亚洲区久久| 国产福利一区在线观看| 欧美一区二区三区粗大| 色综合天天天天做夜夜夜夜做| 可以免费看毛片的网站| 欧美成人激情视频免费观看| 久久亚洲人体| 色综合久久88色综合天天提莫| 夜久久久久久| yjizz视频| 亚洲国产成人tv| h片在线免费看| 久久精品91久久久久久再现| 成人日韩精品| 日韩欧美视频第二区| 久久激情久久| 少妇大叫太粗太大爽一区二区| 亚洲国产日韩一级| 亚洲国产999| 久久亚洲精品成人| 婷婷久久综合九色综合99蜜桃| 日韩欧美亚洲精品| 日韩精品久久久久久| 女尊高h男高潮呻吟| 黄色一区二区三区| 涩涩视频免费看| 国内精品久久久久久久| 久久亚洲道色| 99久久国产综合精品五月天喷水| 国产91在线|亚洲| 五月天婷婷丁香| 亚洲精品在线免费播放| 国产理论电影在线| 成人自拍爱视频| 亚洲激情综合| 9.1成人看片免费版| 欧美视频在线观看免费网址| 伦理片一区二区三区| 国产成人欧美在线观看| 欧美色图国产精品| 午夜宅男在线视频| 国产精品久久久久久久久免费樱桃| 亚洲一级片免费看| 久久国产精品影视| 哺乳一区二区三区中文视频| 成人黄色av片| 国产亚洲成aⅴ人片在线观看| 免费在线不卡av| 精品国偷自产在线视频99| 精品一区二区三区亚洲| 欧美成人高潮一二区在线看| 久久综合国产精品| 中文字幕乱码人妻二区三区| 精品国产一区二区三区四区在线观看 | 亚洲成人免费观看| 奇米影视888狠狠狠777不卡| 国产精品美女www| 亚洲综合专区| 久久久久国产精品无码免费看| 色综合激情久久| 一级毛片视频在线| 电影午夜精品一区二区三区| 国产精品一卡| 国产破处视频在线观看| 日韩欧美高清一区| 天堂中文在线播放| 亚洲一区二区不卡视频| 国产v综合v亚洲欧| 国产91精品一区| 久久久91精品国产| 国产乱人伦精品一区| 日韩精品免费播放| 亚洲精品成人在线| 免费在线黄色网址| 亚洲精品日产aⅴ| 亚洲制服少妇| 国产精品久久久久久久精| 亚洲免费小视频| 日本一区二区三区播放| 久久久久久久久久久久久国产精品| 亚洲图片你懂的| 免费看男男www网站入口在线| 91在线视频导航| 美女视频一区免费观看| 亚洲国产美女视频| 国产亚洲欧洲在线| 韩国女主播一区二区三区| 色综合色综合色综合色综合| 精品福利在线看| av色综合久久天堂av色综合在|