精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法 原創

發布于 2025-10-21 10:00
瀏覽
0收藏

DeepSeek-OCR是一個端到端的多模態文檔解析模型,是Vary、GOT-OCR2.0的后續,前期也有詳細介紹《??【多模態&文檔智能】OCR-free感知多模態大模型技術鏈路及訓練數據細節??》。其核心目標是用極少的視覺 token(vision tokens)解碼出大量文本 token(text tokens)。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

視覺token壓縮比和性能比較

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

VLMs中的典型視覺編碼?:處理長文本時視覺 token 過多、激活內存大的問題

多模態文檔解析相關就不再過多介紹了,詳細可以看專欄《???文檔智能??》。

模型架構

如下圖,DeepSeek-OCR的架構由編碼器(DeepEncoder)和解碼器(DeepSeek3B-MoE-A570M)組成。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

DeepSeek-OCR的架構

DeepEncoder

DeepEncoder設計

DeepEncoder是DeepSeek-OCR的最核心部分(高分辨率下的輕量視覺壓縮器),專門解決現有VLMs視覺編碼器(如Vary、InternVL2.0)的痛點:高分辨率輸入時token過多、激活內存大、不支持多分辨率。包含三個組件:

  • 模塊1:視覺感知(窗口注意力主導)
    采用SAM-base(Segment Anything Model,80M參數),輸入圖像被分割為16×16的patch(如1024×1024圖像生成4096個patch token)。這個在vary和got中均使用。
    作用:通過窗口注意力(局部注意力)捕捉圖像細節(如文本位置、字體),避免全局注意力的高內存消耗。
  • 模塊2:16×卷積壓縮器
    位于SAM和CLIP之間,由2層卷積構成(核大小3×3,步長2,通道數從256→1024),實現視覺token的16倍下采樣。
    作用:將SAM輸出的4096個token壓縮為256個(1024×1024輸入場景),大幅減少后續全局注意力模塊的計算量,控制激活內存。
  • 模塊3:視覺知識(全局注意力主導)
    采用CLIP-large(300M參數),但移除第一層patch嵌入層(輸入改為壓縮后的token)。
    作用:通過全局注意力整合壓縮后的token,提煉圖像全局語義(如文檔布局、文本邏輯),為解碼提供結構化視覺知識。
多分辨率支持:適配不同壓縮比需求

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

DeepEncoder的多分辨率支持。為了研究和應用目的,設計了具有多種原生分辨率和動態分辨率模式的DeepEncoder

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

Base/Large模式通過“ padding 保留寬高比”,有效token數按公式下面公式計算(避免無效token浪費)。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

MoE解碼器

解碼器使用的是DeepSeek3B-MoE,由3B參數的MoE模型,包含64個routed experts和2個shared experts。推理時僅激活6個routed experts+2個shared experts,實際激活參數約570M(僅為3B模型的19%)。這樣做既保留3B模型的文本生成能力,又將推理速度提升至“500M小模型”級別,適合大規模部署。

數據

1. OCR 1.0數據

OCR 1.0數據和前面的vary、got-ocr數據構建相似,主要用于訓練模型識別傳統OCR場景(文檔、自然場景文本)。 構成如下:

  • 文檔數據:30M頁多語言PDF(100種語言,中英占25M頁),含“粗標注”(fitz工具提取,教模型識別文本)和“細標注”(2M頁中英,用PP-DocLayout+MinerU2.0標注布局+文本,教模型理解排版);
  • 自然場景數據:20M頁圖像(LAION+Wukong數據集,用PaddleOCR標注,支持中英場景文本識別);
  • Word數據:3M頁,無布局干擾,優化公式、HTML表格的識別。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

OCR 1.0示例:將真實值格式化為交錯布局和文本格式,其中每段文本前都附有其在原始圖像中的坐標和標簽。所有坐標都歸一化到1000個區間內。

2. OCR 2.0數據

支持圖表、化學公式、幾何圖形的結構化解析。

  • 圖表數據:10M張(線圖、柱狀圖等),標注為HTML表格(而非字典格式,節省token);
  • 化學公式:5M對圖像-文本(SMILES格式數據源,RDKit工具渲染圖像);
  • 平面幾何:1M張(Slow Perception方法生成,標注線段、端點坐標,支持幾何結構重建)。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

示例

3. 通用視覺數據

避免模型僅適配OCR場景,保留VLMs的通用視覺能力(如圖像描述、目標檢測)。數據構成參考DeepSeek-VL2,生成圖像描述、目標檢測、視覺定位任務數據,占總數據20%。

4. 純文本數據

目的是提升解碼器的文本流暢度,避免“視覺-文本”映射導致語言能力退化。 10%的內部純文本數據,統一處理為8192 token長度(與模型序列長度一致)。

訓練流程

訓練分兩階段進行,先優化編碼器質量,再訓練端到端模型。

1. 階段1:獨立訓練DeepEncoder

與vary相似,讓編碼器學會“高分辨率輸入→壓縮視覺token”的映射,保證token質量。使用上述所有OCR 1.0和2.0數據,以及從LAION數據集中抽取的1億條通用數據。

2. 階段2:訓練端到端DeepSeek-OCR

聯合優化“編碼器→解碼器”的映射,提升OCR精度與泛化性。采用流水線并行(PP=4),DeepEncoder占2段(SAM+壓縮器凍結,CLIP解凍),解碼器占2段(12層MoE分6層/段);

Gundam-M模式微調適配超高清文檔(如報紙),但避免與其他模式共訓拖慢速度。在預訓練好的DeepSeek-OCR上,用6M采樣數據繼續訓練Gundam-M模式(1024×1024局部+1280×1280全局)。

實驗

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

視覺-文本壓縮比

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

OmniDocBench評測

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

OmniDocBench中不同類別文檔的編輯距離

參考文獻:DeepSeek-OCR: Contexts Optical Compression,https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf
權重地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR

本文轉載自??大模型自然語言處理??   作者:老余

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-10-21 10:01:37修改
收藏
回復
舉報
回復
相關推薦
欧美综合另类| 欧美13videosex性极品| 国内久久精品视频| 欧美黑人极品猛少妇色xxxxx| 亚洲av熟女高潮一区二区| 九色porny视频在线观看| 91l九色lporny| 久久男人av资源站| 国产精品丝袜黑色高跟| 999热视频在线观看| 天堂网中文字幕| 亚洲一区欧美| 亚洲人成在线观| 中文字幕乱妇无码av在线| 在线观看福利电影| 亚洲激情自拍视频| 日本在线视频一区| 亚洲AV无码乱码国产精品牛牛| 久久尤物视频| 欧美极品xxxx| 三级黄色在线观看| 国产成人手机高清在线观看网站| 日韩欧美一区在线观看| 成人午夜激情av| 国产伦子伦对白在线播放观看| 日韩高清欧美激情| 91精品国产色综合久久不卡98口 | www.日本在线播放| 五月婷婷在线观看| 久久久久国产精品麻豆| 国产精品一区二区三区免费| 国产精品热久久| 日本va欧美va欧美va精品| 91精品国产高清久久久久久久久| 全网免费在线播放视频入口| 日韩中文在线电影| 中文字幕精品av| 国产精品高清无码在线观看| 欧美人与动xxxxz0oz| 亚洲成人av片| 四虎国产精品免费| 精品国产亚洲日本| 91精品国产丝袜白色高跟鞋| 欧美女同在线观看| 人人鲁人人莫人人爱精品| 久久九九国产| 91成人国产在线观看| 九九免费精品视频| 欧美精品18| 欧美成人h版在线观看| 激情高潮到大叫狂喷水| 成人精品电影| 中文字幕av日韩| 一级片久久久久| 日本高清免费电影一区| 一区二区三区日韩在线| 欧美黄色激情视频| 国产一区二区三区不卡视频网站 | 少妇无码一区二区三区| 成人激情免费电影网址| 国产日韩精品推荐| 三级在线观看网站| 91网站视频在线观看| 欧美日韩国产综合在线| 国产黄色片在线观看| 国产日韩精品一区| 亚洲欧美日韩综合一区| 麻豆视频在线| 一区二区三区日韩精品| 国产精品久久国产| 欧美aaaaa性bbbbb小妇| 在线中文字幕不卡| 一区二区三区视频网| www.久久草.com| 精品粉嫩aⅴ一区二区三区四区| 最新版天堂资源在线| 黄色欧美在线| 伊人男人综合视频网| 丰满少妇被猛烈进入一区二区| 欧美成人一品| 欧美亚洲国产另类| 国产99久久久久久免费看| 精品一区精品二区高清| 国产超碰91| 国内三级在线观看| 中文字幕亚洲在| 18禁裸男晨勃露j毛免费观看| 在线男人天堂| 91麻豆精品久久久久蜜臀| 大尺度在线观看| 凹凸成人精品亚洲精品密奴| 色综合久久中文字幕综合网小说| 日韩精品手机在线| 久国产精品韩国三级视频| 国产一区二区在线网站| 99riav在线| 洋洋成人永久网站入口| 国产一线二线三线在线观看| 亚洲一区二区三区日本久久九| 日韩高清av一区二区三区| 国产探花在线视频| 亚洲专区欧美专区| 91色中文字幕| 好男人免费精品视频| 亚洲午夜在线电影| 福利视频999| 日韩高清影视在线观看| 久热精品在线视频| 91青青草视频| 不卡电影免费在线播放一区| 一区二区三区不卡在线| xxxxxx欧美| 日韩精品一区二区三区三区免费| 我想看黄色大片| 亚洲天堂偷拍| 成人美女免费网站视频| 视频二区在线| 亚洲一区av在线| 中文字幕国产免费| 久久99久久人婷婷精品综合 | 国产精品主播直播| 色涩成人影视在线播放| 国产自产自拍视频在线观看| 日韩一区二区三| 日本黄色录像视频| 秋霞成人午夜伦在线观看| 国产一区二区久久久| 日本天码aⅴ片在线电影网站| 欧美麻豆精品久久久久久| 欧美特级黄色录像| 男女精品网站| 精品国产免费一区二区三区 | 亚洲精品成人天堂一二三| 国产 porn| 国产一区二区观看| 青青草原成人在线视频| 亚欧在线观看视频| 亚洲成a人v欧美综合天堂| 佐山爱在线视频| 一区二区在线| 91亚洲精品久久久| 黄色成人在线观看| 欧美一区二区在线看| 青花影视在线观看免费高清| 久久精品99国产精品日本| 色阁综合av| 成人午夜毛片| 正在播放欧美视频| 中文字幕乱码视频| 国产精品理论片在线观看| 国产理论在线播放| 成人免费在线观看av| 国产美女久久精品| 免费在线观看黄| 欧美精品久久99久久在免费线 | 91精品国产三级| 性欧美69xoxoxoxo| 成人黄色免费网站在线观看| 美女免费久久| 精品少妇一区二区三区免费观看 | 好吊一区二区三区| 国产欧美韩日| 丝袜美腿一区| 深夜福利日韩在线看| 国产精品久久久久久久久久久久久久久久| 国产精品美女久久久久aⅴ| 蜜臀一区二区三区精品免费视频| 色综合久久一区二区三区| 成人性生交大片免费看小说| 欧美色图天堂| 亚洲美女在线视频| 中文无码av一区二区三区| 亚洲欧美日韩在线| 国产白袜脚足j棉袜在线观看| 亚洲欧美清纯在线制服| 亚洲第一综合| 日韩精品成人在线观看| 91精品国产色综合| aⅴ在线视频男人的天堂 | 全色精品综合影院| 欧美午夜电影一区| 国产高清在线免费观看| a级精品国产片在线观看| 久久久久国产精品熟女影院| 亚洲h色精品| 精品免费国产| 日韩欧国产精品一区综合无码| 欧美日韩第一视频| 日本天堂影院在线视频| 欧美精品丝袜久久久中文字幕| 精品少妇theporn| 国产亚洲1区2区3区| 日韩精品在线播放视频| 日韩香蕉视频| 中文字幕黄色大片| 亚洲永久精品唐人导航网址| 91亚洲va在线va天堂va国| 美女100%一区| 欧美俄罗斯性视频| 中文字幕在线播放| 日韩精品中文字幕有码专区| 国产www免费观看| 色呦呦国产精品| 久久精品这里只有精品| 国产日产欧美一区| 一区二区免费在线观看视频| 捆绑调教一区二区三区| 免费av网址在线| 欧美精品麻豆| 亚洲天堂电影网| 天堂av一区二区三区在线播放| 91在线视频免费| 国产精品字幕| 欧美性视频在线| 性欧美videos高清hd4k| 日韩视频在线免费观看| 极品白浆推特女神在线观看 | 成人a在线视频| 亚洲精品永久免费视频| 久久久亚洲成人| 国产激情小视频在线| 中文字幕国产日韩| 国产精品一区二区三区四区色| 亚洲成人精品视频在线观看| 99在线无码精品入口| 欧美日韩的一区二区| 欧美一区二区三区网站| 天天操天天色综合| 欧美成人综合色| 亚洲欧美日韩国产成人精品影院 | 国产成人精品电影久久久| www.综合网.com| 欧美美女操人视频| 日本美女高清在线观看免费| 亚洲人a成www在线影院| 天天av综合网| 亚洲精品理论电影| 日本韩国在线观看| 精品国产91洋老外米糕| 亚洲AV无码乱码国产精品牛牛| 欧美一区二区在线观看| 国产毛片毛片毛片毛片| 91精品国产综合久久精品麻豆 | 亚洲电影观看| 欧洲成人在线观看| 亚洲免费福利| 国产福利精品在线| 朝桐光一区二区| 国产精品青青在线观看爽香蕉| 91成人抖音| 国产精品手机播放| 91精品一区| 99在线视频播放| 精品伊人久久久| 久久一区免费| 国产一区网站| 亚洲在线不卡| 午夜国产欧美理论在线播放| 人人妻人人澡人人爽欧美一区| 亚洲激情女人| 男女av免费观看| 日本不卡免费在线视频| 午夜精品免费看| 国产福利一区在线| 青青草视频网站| 久久久久九九视频| 少妇视频一区二区| 亚洲在线视频免费观看| 国产精品久免费的黄网站| 欧美亚洲禁片免费| av网站在线免费看| 亚洲精品97久久| 欧美精品少妇| 久久久精品中文字幕| 免费在线观看的电影网站| 8x海外华人永久免费日韩内陆视频| 午夜精品成人av| 成人字幕网zmw| 久久黄色影视| 亚洲一区综合| 99精品视频免费观看| 爆乳熟妇一区二区三区霸乳| 国产一区啦啦啦在线观看| 怡红院一区二区| 国产欧美精品一区二区三区四区 | 亚洲国产精品狼友在线观看| 久久久久一区二区三区四区| 97精品在线播放| 欧美日韩国产中字| 亚洲熟妇无码久久精品| 精品成人a区在线观看| melody高清在线观看| 久久久这里只有精品视频| 电影天堂国产精品| 国产精品亚洲一区| 成人女性视频| 波多野结衣家庭教师在线| 精品午夜一区二区三区在线观看| 中文字幕三级电影| 最新国产精品久久精品| 欧美三级一区二区三区| 欧美老年两性高潮| 精品推荐蜜桃传媒| 欧美极品少妇xxxxⅹ喷水| 国产一区二区三区朝在线观看| eeuss一区二区三区| 国产一区二区精品久| 人妻av中文系列| 国产伦精品一区二区三区在线观看| av在线网站观看| 亚洲国产精品久久一线不卡| 亚洲综合网av| 亚洲香蕉在线观看| av岛国在线| 99三级在线| 亚洲精品国产偷自在线观看| 欧在线一二三四区| 99久久久国产精品| 深夜福利影院在线观看| 欧美日韩一区二区在线视频| 黄色视屏网站在线免费观看| 韩国精品久久久999| 国产一区二区三区黄网站| 亚洲国产精品综合| 玖玖视频精品| a级在线观看视频| 午夜天堂影视香蕉久久| 亚洲成人黄色片| 欧美另类老女人| 日韩高清在线观看一区二区| 咪咪色在线视频| 国产在线一区二区综合免费视频| 国产真人做爰视频免费| 91成人在线精品| 内衣办公室在线| 热草久综合在线| 国产欧美高清视频在线| 国产免费一区二区三区视频| 99riav久久精品riav| 日韩av大片在线观看| 亚洲国产精品小视频| av影院在线| 国产亚洲一区二区三区在线播放| 韩国精品一区二区三区| 又大又长粗又爽又黄少妇视频| 一区二区三区欧美激情| 午夜老司机福利| 久久久久久成人精品| 久久视频在线观看| 黑人糟蹋人妻hd中文字幕| 久久蜜桃av一区二区天堂| 久久亚洲精品石原莉奈 | 91精品国产91久久久久久青草| 91精品中文在线| 欧美福利一区| 无码人妻一区二区三区免费n鬼沢 久久久无码人妻精品无码 | www.久久国产| 在线观看一区二区视频| 香蕉视频在线免费看| 成人天堂噜噜噜| 午夜精品电影| 艳妇乳肉豪妇荡乳xxx| 欧美日韩中文字幕在线| 成人精品一区二区| 国产一区二区在线免费| 综合一区av| 少妇饥渴放荡91麻豆| 色老汉av一区二区三区| 91社区在线观看| 亚洲最大av在线| 亚洲一区观看| 免费成人深夜天涯网站| 欧美一区二区美女| 波多野结衣乳巨码无在线观看| 久久久久久久久久久久久久一区| 日韩精品每日更新| 免费国产羞羞网站美图| 亚洲精品www| 97人人做人人爽香蕉精品| 裸体裸乳免费看| av亚洲精华国产精华| 色老头一区二区| 欧美成人精品影院| 日韩人体视频| 黄色一级片免费播放| 五月激情综合色| 77777影视视频在线观看| 成人18视频| 人人超碰91尤物精品国产| 久一视频在线观看| 亚洲免费成人av电影| 国产精品久久久久久久久久辛辛| 久久久久久www| 国产精品久久午夜| 亚洲免费一级片| 国产日韩欧美夫妻视频在线观看 | 99蜜桃臀久久久欧美精品网站| 最好看的中文字幕久久| 深夜福利在线看| 3d动漫啪啪精品一区二区免费|