精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源) 原創(chuàng)

發(fā)布于 2025-10-24 09:57
瀏覽
0收藏

olmOCR 2相關(guān)對比:

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

持?jǐn)?shù)據(jù)、模型和代碼完全開源

olmOCR 2 是一套面向文檔 OCR 的端到端解決方案,其核心方法圍繞RLVR,通過 “合成數(shù)據(jù)規(guī)模化 - 單元測試定獎勵 - RL 訓(xùn)練提性能” 的閉環(huán),解決傳統(tǒng) OCR 系統(tǒng)在復(fù)雜場景(數(shù)學(xué)公式、表格、多列布局)中的痛點(diǎn)。

現(xiàn)有問題

傳統(tǒng)OCR系統(tǒng)的性能評估依賴編輯距離 ,計(jì)算模型輸出與Ground Truth的字符級差異(插入、刪除、替換次數(shù))。

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

圖1:傳統(tǒng)編輯距離的局限性:閱讀順序問題

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

圖2:傳統(tǒng)編輯距離的局限性:公式識別問題

為解決上述問題,設(shè)計(jì)了下面6類可驗(yàn)證的二進(jìn)制單元測試(結(jié)果僅“通過(PASS)”或“失敗(FAIL)”),覆蓋文檔OCR的需求:

測試類型

核心功能

文本存在性

驗(yàn)證特定短語(如關(guān)鍵句子、公式)是否精確出現(xiàn)在輸出中

文本不存在性

驗(yàn)證無關(guān)內(nèi)容(如頁眉、頁腳、頁碼)是否未出現(xiàn)在輸出中

自然閱讀順序

驗(yàn)證句子/段落的順序是否符合人類閱讀習(xí)慣(如圖1中“綠色→黃色”不被紅色打斷)

表格準(zhǔn)確性

驗(yàn)證表格單元格的相對位置與數(shù)值是否正確(如“Model”在“GPT-4-turbo”上方)

數(shù)學(xué)公式準(zhǔn)確性

用KaTeX渲染模型輸出與參考公式,驗(yàn)證視覺結(jié)構(gòu)是否一致(如圖2)

基線魯棒性

驗(yàn)證無長重復(fù)n-gram、無非目標(biāo)語言字符(避免模型幻覺)

這些測試的優(yōu)勢在于:

  1. 公平處理浮動元素:對圖注、表格等位置靈活的元素,只要核心邏輯正確(如表格單元格關(guān)系、閱讀順序),均判定為通過,避免編輯距離的“過度懲罰”;
  2. 精準(zhǔn)反映實(shí)際正確性:聚焦“用戶是否能用”(如公式能否正確渲染、表格能否正確讀取),而非“字符是否完全匹配”。

數(shù)據(jù)

手動為每個文檔設(shè)計(jì)單元測試耗時(shí)極長(原文提到“需數(shù)小時(shí)/文檔”),無法支撐RL訓(xùn)練的大規(guī)模數(shù)據(jù)需求。因此,文章開發(fā)了全自動合成數(shù)據(jù)生成 pipeline,實(shí)現(xiàn)“文檔→HTML→單元測試”的端到端規(guī)模化,核心流程分三步:

1. 步驟1:挑選“難處理場景”PDF數(shù)據(jù)源

為確保合成數(shù)據(jù)的挑戰(zhàn)性(覆蓋真實(shí)OCR痛點(diǎn),避免“模板化數(shù)據(jù)”,確保數(shù)據(jù)多樣性,與真實(shí)世界OCR需求對齊。),文章選擇高難度文檔樣本: 數(shù)據(jù)來源arXiv數(shù)學(xué)論文(含復(fù)雜公式)、舊掃描件(低分辨率)、多列布局文檔、含復(fù)雜表格的文檔。

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

olmOCR 2 合成數(shù)據(jù)流水線的 HTML 頁面生成。從真實(shí)文檔中采樣一個頁面(左圖),并提示通用 視覺語言模型(VLM)生成一個高度相似的 HTML 頁面(右圖)。渲染后的 HTML 頁面圖像與原始 HTML 配對,作 為專用于 OCR 的 VLM 的監(jiān)督信號。

2. 步驟2:PDF→HTML的三階段轉(zhuǎn)換(生成“帶Ground Truth的結(jié)構(gòu)化文檔”)

HTML是生成單元測試的關(guān)鍵:其語義標(biāo)簽(如??<header>???、??<footer>???、??<table>??、KaTeX公式)可直接用于自動提取測試用例。轉(zhuǎn)換過程依賴通用VLM(Claude-sonnet-4-20250514) ,分三階段迭代優(yōu)化:

階段

核心任務(wù)

輸入

輸出

1. 布局分析

讓VLM識別文檔結(jié)構(gòu):列數(shù)、圖像/表格位置、頁眉/頁腳區(qū)域、公式位置等

原始PDF頁面圖像

布局結(jié)構(gòu)描述(如“2列,右上角有表格”)

2. 內(nèi)容渲染

讓VLM基于布局分析,生成與原始PDF尺寸一致的語義HTML

原始圖像+布局描述

初始HTML(含文本、KaTeX公式、HTML表格)

3. 輸出優(yōu)化

渲染初始HTML為圖像,與原始PDF對比,讓VLM修正差異(如字體、間距、公式格式)

原始圖像+初始HTML+渲染圖像

優(yōu)化后的最終HTML

3. 步驟3:基于HTML自動生成單元測試

利用HTML的結(jié)構(gòu)化信息,程序化提取單元測試用例,無需人工干預(yù):

  • 文本不存在性測試:從??<header>??/??<footer>??標(biāo)簽提取頁眉/頁腳,生成“這些內(nèi)容不應(yīng)出現(xiàn)”的測試;
  • 數(shù)學(xué)公式測試:從KaTeX標(biāo)簽提取公式,生成“渲染后與參考一致”的測試;
  • 表格測試:從??<table>??標(biāo)簽隨機(jī)采樣單元格,生成“單元格相對位置正確”的測試;
  • 閱讀順序測試:基于HTML中段落的先后順序,生成“段落順序符合HTML結(jié)構(gòu)”的測試。

最終生成的合成數(shù)據(jù)集 olmOCR2-synthmix-1025 包含:2186個PDF頁面 → 30381個單元測試用例,為RL訓(xùn)練提供充足數(shù)據(jù)。

訓(xùn)練流程:SFT→RLVR→模型融合,端到端優(yōu)化

olmOCR 2的訓(xùn)練分為監(jiān)督微調(diào)(SFT) 和強(qiáng)化學(xué)習(xí)(RLVR) 兩階段,結(jié)合模型融合(Souping)進(jìn)一步提升性能:

1. 階段1:sft

讓模型掌握基礎(chǔ)的文檔解析能力(文本提取、公式識別、表格結(jié)構(gòu)感知),為后續(xù)RL優(yōu)化打基礎(chǔ)。選擇Qwen2.5-VL-7B-Instruct,使用改進(jìn)后的監(jiān)督數(shù)據(jù)集 olmOCR-mix-1025(267962頁,來自10萬+PDF),相比舊版(olmOCR-mix-0225)的改進(jìn):

  • 用GPT-4.1替代GPT-4o處理數(shù)據(jù),減少幻覺;
  • 統(tǒng)一公式格式(塊級公式用??\[??,行內(nèi)公式用??\(??);
  • 表格用HTML格式存儲(而非純文本);
  • 為圖像添加基礎(chǔ)alt文本;

2. 階段2:強(qiáng)化學(xué)習(xí)(RLVR)

核心是用合成數(shù)據(jù)的單元測試作為獎勵信號,通過GRPO算法優(yōu)化模型,解決SFT階段未覆蓋的復(fù)雜場景(如多列、公式、表格)。

  • 訓(xùn)練數(shù)據(jù):olmOCR2-synthmix-1025的合成文檔(帶單元測試);
  • 采樣策略:每個文檔生成28個不同的模型輸出(completions),確保覆蓋足夠多的候選結(jié)果;

獎勵函數(shù)設(shè)計(jì)

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

olmOCR 2 的 RLVR 訓(xùn)練的單元測試獎勵。給定一個生成的 HTML 頁面及其單元測試(左側(cè)),可以 根據(jù)這些單元測試輕松地對生成的 Markdown 頁面(右側(cè))進(jìn)行評分。每個測試貢獻(xiàn)一個二元獎勵,這些獎勵在頁面級 別匯總為通過率。例如,6 個測試中有 4 個通過,則頁面級別的獎勵為 0.67。

獎勵總分為三部分,取值均為0~1,確保模型同時(shí)優(yōu)化“內(nèi)容正確性”和“輸出格式合規(guī)性”:

獎勵類型

計(jì)算方式

作用

主獎勵:單元測試通過率

(通過的單元測試數(shù)量)/(總單元測試數(shù)量)

核心:優(yōu)化內(nèi)容正確性(公式、表格等)

輔助獎勵1:EOS token

若輸出以EOS(結(jié)束符)結(jié)尾則為1,否則為0

避免模型無限重復(fù)(解決“重復(fù)循環(huán)”)

輔助獎勵2:元數(shù)據(jù)位置

若文檔元數(shù)據(jù)(語言、旋轉(zhuǎn)校正系數(shù))在輸出頂部則為1,否則按位置遞減

確保輸出結(jié)構(gòu)規(guī)范,便于下游處理

3. 階段3:模型融合(Souping)

為避免單一模型的隨機(jī)性,文章采用模型權(quán)重平均(Souping) 策略:訓(xùn)練6個不同隨機(jī)種子的RL模型(3個用token級重要性采樣,3個用序列級重要性采樣);對6個模型的權(quán)重進(jìn)行平均,得到最終的olmOCR-2-7B-1025模型;

實(shí)驗(yàn)性能

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

OCR 模型性能對比

參考文獻(xiàn): olmOCR 2 Unit Test Rewards for Document OCR,https://arxiv.org/pdf/2510.19817v1
repo:https://github.com/allenai/olmocr

本文轉(zhuǎn)載自???大模型自然語言處理???   作者:老余

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
午夜精品短视频| 国产视频精品免费播放| 国产精品免费一区二区三区观看| 日韩av在线看免费观看| caoporm免费视频在线| 亚洲另类自拍| 欧美一卡二卡在线| 亚洲欧美日产图| 在线观看免费国产视频| 国产精品一区二区三区av | 最新av免费在线观看| 亚洲欧美另类日韩| 91精品亚洲| 欧美性猛交xxxx黑人交| 久久青青草综合| 久久久久久久久精| 99精品视频在线免费播放| 久久男人中文字幕资源站| 欧美精品18videosex性欧美| 国产永久免费网站| av播放在线| 青草国产精品久久久久久| 亚洲天堂网站在线观看视频| 久久网站免费视频| 色视频在线观看| 99视频在线精品国自产拍免费观看| 在线综合亚洲欧美在线视频 | av资源久久| 欧美怡红院视频| 日本不卡一区二区三区视频| 色网站在线播放| 噜噜噜狠狠夜夜躁精品仙踪林| 亚洲欧美一区二区久久 | 狂野欧美xxxx韩国少妇| 国产农村妇女毛片精品久久麻豆 | 亚洲五月六月| 中文字幕日韩第一页| blacked蜜桃精品一区| 色综合色综合色综合| 久久综合入口| 偷偷操不一样的久久| 亚州av一区| 亚洲国产精品一区二区久久 | 欧美巨大黑人极品精男| 国产又大又黄又猛| 国产黄色在线| 丝袜亚洲另类丝袜在线| 中文字幕免费国产精品| 亚洲一级免费在线观看| av小片在线| 久久精品国产免费看久久精品| 日韩资源在线观看| 国产成人美女视频| 2021久久国产精品不只是精品| 国产成人午夜高潮毛片| 久久成人这里只有精品| 99视频在线观看视频| 日本成人网址| 日本不卡视频一二三区| 久久韩剧网电视剧| 国产欧美视频一区| 成人美女黄网站| 亚洲国产岛国毛片在线| 97se亚洲综合| 欧美精品韩国精品| 香港欧美日韩三级黄色一级电影网站| 日韩欧美中文字幕制服| 欧美 日韩 激情| 最新国产在线观看| 成人午夜电影小说| 国产成人精品久久亚洲高清不卡| 亚洲精品91在线| 精品国产伦一区二区三区观看说明| 亚洲v日本v欧美v久久精品| 欧美aaaaa喷水| 在线观看亚洲一区二区| 影音先锋日韩资源| 亚洲午夜精品久久久久久久久久久久| 久久久久久久久久久久91| 欧美天天影院| 99精品黄色片免费大全| 国产精品久久久久久久7电影| 国产黄色录像视频| 99tv成人影院| 一区二区三区精密机械公司| 欧美高清视频一区二区三区在线观看| 国产又粗又猛又爽又黄91| 亚洲美女视频在线免费观看| 上原亚衣av一区二区三区| 五月天六月丁香| 日韩大片欧美大片| 亚洲成人av福利| 日韩高清国产精品| 老司机午夜福利视频| 日韩av一二三| 91成人在线观看国产| 欧美日韩在线观看成人| sdde在线播放一区二区| 欧美大黄免费观看| 午夜免费看毛片| 大菠萝精品导航| 亚洲视频中文字幕| 亚洲欧美日韩精品在线| 免费福利在线视频| 99久久久国产精品免费蜜臀| 97久久精品午夜一区二区| 中文字幕资源网| 视频在线观看一区| 情事1991在线| 一级片中文字幕| 亚洲午夜极品| 九九热精品视频国产| a一级免费视频| 爽成人777777婷婷| 日韩有码在线播放| 天堂网中文在线观看| 欧洲激情综合| 日韩在线视频导航| 日本伦理一区二区三区| 成人无号精品一区二区三区| 中国人与牲禽动交精品| 亚欧精品视频一区二区三区| 成人一二三区| 日韩一区二区三区xxxx| 亚洲天堂黄色片| 欧美激情91| 久久琪琪电影院| 亚洲免费在线观看av| 亚洲免费网址| 国产成人一区二区三区电影| 波多野结衣电车| 美女精品一区二区| 91色中文字幕| 国产 欧美 精品| 99re成人精品视频| 欧美日韩三区四区| 成人h小游戏| 国产精品久久精品日日| 午夜探花在线观看| 毛片在线网址| 欧美性极品xxxx娇小| 欧美在线观看视频网站| 人人玩人人添人人澡欧美| 7777精品伊人久久久大香线蕉的| 韩国一区二区三区四区| 日韩av资源网| 国产一区二区三区久久精品| 特一级黄色录像| 亚洲小说欧美另类社区| 欧美一二三视频| 中文字幕在线2018| 国产成人av自拍| 免费看成人午夜电影| av黄色在线观看| 亚洲香蕉伊在人在线观| 99色精品视频| 综合久久av| 亚洲精品大尺度| 人与嘼交av免费| 欧美日韩久久| 国产精品久久久久久久久久免费 | 日本www在线观看视频| 亚洲精品国产无天堂网2021 | 神马影院午夜我不卡| 国产人成网在线播放va免费| 亚洲国产精品一区二区久久 | 日本一区二区免费电影| 久久99精品久久久久久动态图 | 欧美在线国产精品| 97超碰资源站| 久久久久久9999| 亚洲av综合色区| 日韩av超清在线观看| 精品女同一区二区| 毛片久久久久久| 一区二区三区高清视频在线观看| 国产欧美日韩视频| 五月天激情婷婷| 亚洲精品日韩综合观看成人91| 人妻有码中文字幕| 精品嫩草影院| 久久影院免费观看| 一级久久久久久| 9久草视频在线视频精品| 中文有码久久| 日韩精品影片| 亚洲国产成人久久综合一区| 多男操一女视频| 久久久青草婷婷精品综合日韩| 999日本视频| a√在线中文网新版址在线| 欧美日韩国产综合视频在线观看中文| 欧美在线a视频| 成人嫩草影院| 国产精品高潮呻吟久久av无限 | 亚洲欧美精品在线| 激情综合网五月婷婷| 国产乱对白刺激视频不卡| 视频在线一区二区三区| 国产不卡网站| 精品网站999www| 久热这里只有精品6| 成人一级黄色片| 日韩精品手机在线观看| 爱情电影网av一区二区| 深夜精品寂寞黄网站在线观看| 久操视频在线免费观看| 久久久精品国产免大香伊| 日本www在线视频| 风间由美性色一区二区三区四区| 久久99久国产精品黄毛片入口| 一区二区三区午夜| 中文字幕一区二区不卡| 伊人国产在线视频| 成人在线国产| 国产综合香蕉五月婷在线| 视频一区二区三区不卡| 欧美日韩精品欧美日韩精品一 | 精品福利樱桃av导航| 性高潮免费视频| 亚洲高清自拍| 国产视频在线观看一区| 福利影院在线看| 日韩av一卡二卡| 丰满人妻老熟妇伦人精品| 2020国产精品| 人妻丰满熟妇av无码区app| 国产免费久久| 国产精品揄拍500视频| 嫩草在线视频| 日韩免费视频线观看| 国产中文字幕免费| 久久五月婷婷丁香社区| 男人女人黄一级| 国产精品黑丝在线播放| 97人人模人人爽人人少妇| a级片在线免费| 精品亚洲国产视频| 在线观看你懂的网站| 中文字幕一区二区三区四区不卡 | 亚洲视频一区在线播放| **性色生活片久久毛片| 国内自拍偷拍视频| 99精品免费| 亚洲v国产v| 亚洲五码在线| 欧美在线日韩在线| 免费黄色网页在线观看| 精品国产乱码久久久久久免费| 国产欧美日韩另类| 亚洲国产成人自拍| 亚洲少妇一区二区| 亚洲综合二区| 欧美性受黑人性爽| 欧美亚视频在线中文字幕免费| 国产精品久久77777| 在线视频观看国产| 亚洲欧美在线免费观看| 国产又粗又猛又黄| 午夜久久久久久久久久一区二区| 亚洲人成人无码网www国产 | 精品久久久久久久久久久久久久| 色一情一交一乱一区二区三区 | 小毛片在线观看| 理论片日本一区| 波多野结衣之无限发射| 久久久久av| 欧美1o一11sex性hdhd| 精品视频一区二区三区在线观看| 8090成年在线看片午夜| 黄色在线播放网站| 亚洲跨种族黑人xxx| 国产激情视频在线播放| 欧美色网在线| 亚洲少妇视频| 色妞欧美日韩在线| 天堂在线资源库| 欧美日韩国产一二三| a v视频在线观看| 亚洲日本va午夜在线影院| 六月婷婷七月丁香| 国产成人午夜高潮毛片| 色天使在线观看| 亚洲精品国产欧美在线观看| 日韩毛片精品高清免费| 亚洲精品在线视频免费观看| 久久 天天综合| 苍井空浴缸大战猛男120分钟| 黄色综合网站| 黑人巨大国产9丨视频| 日韩久久综合| 日韩精品伦理第一区| 五月天亚洲一区| 国产98在线|日韩| 国产成人久久精品一区二区三区| 国产成人久久久| 欧美日韩在线观看首页| 隔壁老王国产在线精品| 9191在线播放| 久久久www成人免费精品张筱雨| 大胆av不用播放器在线播放| 日韩久久精品电影| 手机看片一区二区| 欧美白人最猛性xxxxx69交| 99国产揄拍国产精品| 欧美日韩不卡一区| 综合久久中文字幕| 91国模大尺度私拍在线视频| 亚洲婷婷综合网| 欧美午夜久久久| 午夜毛片在线观看| 黄色91在线观看| 久久精品国产成人av| 午夜精品福利一区二区蜜股av| 日韩福利片在线观看| 亚洲成a人v欧美综合天堂| 国产极品美女高潮无套嗷嗷叫酒店| 一区二区在线观看免费| 国内偷拍精品视频| 亚洲美女精品一区| 欧美国产在线看| 亚洲精品高清在线| 久久久99精品| 亚洲国产精品久久久久婷婷884 | 日日噜噜夜夜狠狠| 美女视频网站黄色亚洲| av中文字幕网址| 国产精品99久| 日韩少妇一区二区| 91浏览器在线视频| x88av在线| 国产精品福利一区二区| 国产性生活大片| 亚洲福中文字幕伊人影院| 91蜜桃视频在线观看| 欧美日韩中文字幕综合视频| 国产免费av一区| 在线观看免费成人| 国产三级视频在线播放| 日韩欧美黄色影院| 天天干天天爽天天操| 亚洲毛片在线看| 成人在线观看网站| 欧美另类在线观看| av成人 com a| 日韩美女免费观看| 懂色av色香蕉一区二区蜜桃| 成人国产一区二区| 亚洲综合图色| 亚洲一区二区三区精品在线观看 | 日本999视频| 国产另类ts人妖一区二区| 韩国三级在线看| 2023国产精品| wwwav国产| 色综合天天综合在线视频| 羞羞色院91蜜桃| 精品国产乱码久久久久久图片| 韩国三级av在线免费观看| 久久亚洲精品中文字幕冲田杏梨| 国产精品13p| 国产精品视频一区国模私拍| 免费看日产一区二区三区| 欧美lavv| 国产综合自拍| 免费看a级黄色片| 国产成a人亚洲精品| 在线小视频你懂的| 亚洲精品视频观看| 波多野结衣在线观看一区| 日韩欧美激情在线| 9色在线视频网站| 97**国产露脸精品国产| 国产亚洲亚洲国产一二区| 六十路精品视频| 欧美1级日本1级| 亚洲一区在线不卡| 26uuu精品一区二区在线观看| 欧美肥妇bbwbbw| 色悠久久久久综合欧美99| 丰满少妇高潮在线观看| 色av中文字幕一区| 亚洲美女炮图| 国产伦精品一区二区三区四区免费| 成人影视亚洲图片在线| av动漫在线观看| 国产成人精品一区二| 成年人免费视频播放| 色综合久久88色综合天天免费| 亚洲精品综合久久| 久久久99久久精品女同性| 成人高清一区| 日本一区二区在线视频观看| 日韩香蕉视频| 亚洲av综合色区无码另类小说| 国产精品高潮呻吟| 一级特黄免费视频| 亚洲精品一区二区三区不| h片在线观看视频免费免费| 亚洲一区二区免费|