精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路原創

大模型自然語言處理

發布于 2025-7-28 09:54

瀏覽

0收藏

多模態大模型在“看不清”文字時瞎編答案，稱為“OCR幻覺”，如下圖，主要有幾點：（1）預訓練階段缺乏相關數據：關鍵信息提取（KIE）數據以及退化視覺場景的清晰標注顯著不足，限制了模型處理復雜視覺輸入的能力。指令微調階段忽視退化場景：現有研究通常假設 OCR 任務輸入為非退化圖像，導致模型缺乏處理真實世界退化文檔（如模糊、遮擋、低對比度）所需的推理能力。

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

Qwen2.5-VL-7B（左）與 GPT-4o（右）在解讀退化文本圖像中的表現。Qwen2.5-VL-7B模型可能出現幻覺，識別出圖像中不存在的數值，而 GPT-4o 模型則因部分文本遮擋而難以識別退化。

下面來看看一個思路。

數據集

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

KIE-HVQA數據集中三類數據的可視化展示。[Q] 代表問題，[G] 表示真實值，[P] 則是由 Qwen2.5-VL 模型在 zero-shot 提示下生成的預測。這些數據呈現出不同程度的退化，如模糊或損壞，影響了模型的預測準確率。

數據生成方法

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

數據生成pipline

主要思路如下：

數據生成方法分三步走，目的是構造一個專門用于訓練模型“看清模糊文字、不亂編答案”的冷啟動數據集，核心邏輯是：用現有模型生成“人類式思考”的鏈式推理（CoT）數據，再與圖像配對，形成多模態訓練樣本。流程如下：

Step 1：圖像→文本描述（借助GPT-4o）

輸入一張退化文檔圖像（如模糊的發票）+ 問題（如“這張發票的總金額是多少？”），用GPT-4o將圖像內容轉為純文本描述（包括文字內容、退化情況、空間位置等）。目的是把多模態信息“翻譯”成語言模型能理解的文本。

例如：GPT-4o會描述“圖像中‘總金額’一欄的數字‘100’被污漬遮擋，僅能看到‘1’和‘00’的輪廓”。

Step 2：文本→鏈式推理（借助DeepSeek-R1）

輸入Step 1中生成的純文本描述 + 問題，用推理模型DeepSeek-R1生成人類式的思考鏈（CoT），模擬人如何一步步判斷，讓模型學會“看不清時不硬猜”，而是用邏輯推理標記不確定部分。

示例CoT：“觀察到‘總金額’欄的數字有污漬遮擋，但‘1’的豎線清晰，‘00’的輪廓部分可見，結合上下文‘人民幣符號￥’，推斷金額為‘100元’，但需標記‘00’為不確定區域。”

Step 3：合成多模態數據

輸入原始圖像（帶退化）和Step 2生成的CoT文本（含推理和不確定標記），輸出一個完整的多模態訓練樣本（圖像+問題+CoT答案）。

數據增強：

對圖像隨機添加退化（模糊、遮擋、低對比度）。
用OCR模型（如Qwen2.5-VL-72B）驗證退化后的字符是否仍可見，確保標注準確。

最終效果生成的數據集覆蓋身份證、發票、處方等場景。每個樣本都附帶：

像素級退化標注（哪些字符被遮擋）
OCR可靠性得分（模型對字符可見性的置信度）
CoT推理鏈（如何從不確定信息中得出結論）

方法

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

基于GRPO強化學習+多目標獎勵函數的框架，解決OCR幻覺問題。

獎勵函數設計

帶OCR獎勵的強化學習：設計基于規則的三級獎勵函數，強制模型根據視覺可見性輸出答案，避免幻覺。

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

獎勵函數設計：

將字符按可見性分為三類，不同處理策略：

清晰字符（如“B, a, u”）：必須準確識別，獎勵高。
部分遮擋字符（如“e”被污漬蓋住30%）：需標記為異常（如“e[部分可見]”），保留但提示不確定。
完全不可見字符（如“t, i”被完全遮擋）：必須輸出空格，避免幻覺。

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

了單詞“Beautiful”中每個字母的退化標準。字母“B, a, u, f, u, l”清晰可見；字母“e”部分被遮擋；字母“t, i”則完全不可見

獎勵計算流程：

對模型預測和真實值計算編輯距離，生成三個指標：

??clear_metric??：清晰字符的準確率
??not_clear_metric??：模糊/遮擋字符的處理合理性
??final_metric??：最終答案與真實值的匹配度

復合獎勵：

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

其中c?, c?, c?為權重，確保模型優先視覺忠實度，而非盲目追求字符準確率。

訓練階段

冷啟動SFT：用前文生成的CoT數據微調Qwen2.5-VL-7B，學習“退化場景下的推理范式”。

GRPO強化學習：

輸入退化圖像（如模糊處方），模型生成多個候選答案。
獎勵函數評估每個答案是否“不幻覺”（如遮擋區域是否輸出空格）。
通過GRPO優化策略，使模型逐漸學會“無法識別時拒絕回答”。

實驗性能

GRPO強化學習緩解多模態大模型OCR任務的幻覺思路及數據生成思路-AI.x社區

參考文獻：Seeing is Believing? Mitigating OCR Hallucinations in Multimodal Large Language Models，https://arxiv.org/pdf/2506.20168v1

?

本文轉載自??大模型自然語言處理??? 作者：余俊暉

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

從具身智能再談強化學習，為什么需要強化學習，以及強化學習的應用場景

AI探索時代 ? 4806瀏覽 ? 0回復
詳解大規模基礎模型中的幻覺問題（幻覺檢測、緩解、任務、數據集和評估指標）

angel ? 7398瀏覽 ? 0回復
一文匯總：推薦系統中多任務學習的優化思路

海因斯DK ? 4245瀏覽 ? 0回復
詳解大規模基礎模型中的幻覺問題（幻覺檢測、緩解、任務、數據集和評估指標）

angel ? 7398瀏覽 ? 0回復
OCR-free感知多模態大模型技術鏈路及訓練數據細節

大模型自然語言處理 ? 4709瀏覽 ? 0回復
基于多模態深度強化學習的投資組合優化

靈度智能 ? 5371瀏覽 ? 0回復
用強化學習重塑多模態AI：解讀Kimi k1.5的突破與創新

Halo咯咯 ? 4849瀏覽 ? 0回復
強化學習與軟件工程：開源軟件獎勵演化的強化學習

AI研究前瞻 ? 3673瀏覽 ? 0回復
白話DeepSeek R1的GRPO強化學習算法：原理、圖解、視頻

后向傳播 ? 9074瀏覽 ? 0回復
MM-Eureka：大規模強化學習觸發多模態模型能力涌現

angel ? 3038瀏覽 ? 0回復
DeepSeek-R1的方法遷移到多模態大模型-開源Vision-R1實現方法思路

大模型自然語言處理 ? 3855瀏覽 ? 0回復
GRPO訓練布局感知的強化學習多模態文檔解析框架-Infinity-Parser

大模型自然語言處理 ? 2383瀏覽 ? 0回復
GRPO強化多模態大模型目標檢測能力獎勵函數代碼設計

大模型自然語言處理 ? 2382瀏覽 ? 0回復
聊聊理解&生成多模態大模型的「技術難點」和「技術突破」思路

十一月雨_55 ? 2493瀏覽 ? 0回復
多模態大模型統一布局生成方法微調數據集設計及模型架構統一訓練思路

大模型自然語言處理 ? 1937瀏覽 ? 0回復
高質量多模態訓練數據生成思路-SynthVLM

大模型自然語言處理 ? 2468瀏覽 ? 0回復
多模態大模型OCR幻覺緩解思路：DianJin-OCR-R1通過“再看一眼”圖像減輕幻覺

大模型自然語言處理 ? 2629瀏覽 ? 0回復
智能體強化學習綜述；強化學習原生GUI智能體；多輪工具交互強化學習；模塊化多輪工具強化學習

AI研究前瞻 ? 4199瀏覽 ? 0回復
通過強化學習讓多模態大模型自主決策圖像token壓縮的新思路-VisionThink實現思路及獎勵函數設計

大模型自然語言處理 ? 2359瀏覽 ? 0回復

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

多模態文檔智能解析-MonkeyOCR v1.5框架、數據構造及特點 6天前發布
股票研究報告生成-基于LLM的多智能體框架FinRpt-Gen數據構建、方法框架 2025-11-12 08:20:30發布

熱門推薦

用 Cognee 構建端到端知識圖譜，實現當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

8%價格，2倍速度！國產MiniMax M2暴打Claude Sonnet 4.5？我們實測后發現堪稱性價比之王！ 0回復

上一篇：大模型在知識圖譜問答上的核心算法詳細思路及實踐

下一篇： LLM+KG+Agent的Text2SPARQL多語言KBQA智能體框架—mKGQAgent

社區精華內容

目錄

日韩欧美第一区| 国产午夜一区二区三区| 欧美日韩电影在线观看| 中文字幕一区二区三区乱码不卡| 成人观看网址| 国产欧美视频一区二区三区| 91久久精品国产91性色| 久久精品国产亚洲av高清色欲| 精品久久ai| 在线观看成人小视频| 91麻豆天美传媒在线| 少妇一区二区三区四区| 日韩av一级片| 欧美精品videos另类日本| 深爱五月激情网| 国产日韩一区二区三免费高清| 性做久久久久久免费观看欧美| 日韩高清av| 亚洲狼人综合网| 麻豆成人久久精品二区三区红 | 国产黄色免费在线观看| 国产乱码精品一区二区三区av | 成人看片毛片免费播放器| 樱桃视频在线观看一区| 午夜一区二区三区| 手机在线观看毛片| 国产一区二区三区精品欧美日韩一区二区三区 | 最新日本在线观看| 久久亚洲春色中文字幕久久久| 成人在线视频网站| 日韩国产欧美| 1024日韩| 欧美成人免费小视频| 特级西西www444人体聚色| av毛片精品| 日韩午夜精品视频| 国产精品久久久毛片| 久久久久久久| 欧美日韩国产色视频| a级片一区二区| 激情影院在线观看| 日本一区二区视频在线| 久久综合九色综合久99| 丁香六月天婷婷| 国产精品资源网站| 成人免费视频网| 国产精品午夜一区二区| 午夜在线视频一区二区区别| 韩国三级日本三级少妇99| 欧美日韩免费一区二区| 国产国产精品| 日韩亚洲一区二区| 久久视频一区二区三区| 精品国产一级毛片| 亚洲男人7777| 久久只有这里有精品| 中国av一区| 亚洲人成在线观| 欧美偷拍一区二区三区| 国产欧美日韩在线一区二区| 亚洲毛片在线免费观看| 亚洲午夜久久久久久久久红桃| 日本欧美韩国国产| 亚洲国产天堂久久综合| 丰满少妇一区二区三区| 亚洲精品一级二级三级| 亚洲欧美成人一区二区在线电影| 中文幕无线码中文字蜜桃| 一道本一区二区三区| 亚洲天堂成人在线视频| 亚洲一级理论片| 91成人影院| 欧美国产日本在线| 国产污片在线观看| 国产一区二区三区的电影| 日韩av大片免费看| 最新国产中文字幕| 国产在线一区观看| 国产精品久久久久久久久婷婷| 日韩中文字幕观看| 久久免费偷拍视频| 在线看视频不卡| 欧美寡妇性猛交xxx免费| 亚洲成人免费看| 99视频精品免费| av久久网站| 日韩欧美国产综合一区 | 久久这里有精品| 日本一区二区免费在线观看| 免费精品视频| 成人国产亚洲精品a区天堂华泰| 国产乱淫片视频| av在线一区二区| 亚洲精品免费在线看| 性欧美1819sex性高清大胸| 狠狠爱在线视频一区| 中文字幕免费高清在线| 成人春色在线观看免费网站| 亚洲人成电影在线观看天堂色| 精品无码一区二区三区蜜臀| 在线观看不卡| 国产欧美久久一区二区| 亚洲老妇色熟女老太| 国产喷白浆一区二区三区| www婷婷av久久久影片| 牛牛精品一区二区| 91麻豆精品91久久久久同性| 欧美精品黑人猛交高潮| 国产精品不卡| 日韩av快播网址| 亚洲欧美国产高清va在线播放| 国产亚洲精品7777| www.av91| 久久一级大片| 一区三区二区视频| 日产精品久久久久| 国产一区二区在线观看视频| 免费久久一级欧美特大黄| 色综合999| 精品视频1区2区| 久久久久久久久免费看无码| 合欧美一区二区三区| 国产欧美一区二区三区久久| 亚洲区小说区图片区| 一区二区不卡在线播放| 天天干天天操天天做| 校花撩起jk露出白色内裤国产精品| 欧美成在线视频| 亚洲天堂999| 久久嫩草精品久久久精品一| 香港三级韩国三级日本三级| 99re热精品视频| 久久久精品久久久| 中文字幕一区二区三区波野结| 久久综合五月天婷婷伊人| 久艹在线免费观看| 日韩一二三区| 欧美猛少妇色xxxxx| 一级黄色免费片| 国产精品乱码人人做人人爱| 免费看污黄网站| 国内亚洲精品| 国产不卡av在线免费观看| 日韩三级电影网| 偷偷要91色婷婷| yy1111111| 亚洲精品1区| 国产精品一区二区免费| 福利网站在线观看| 精品国产一区二区精华| 精品处破女学生| 成人小视频免费观看| 日本阿v视频在线观看| 波多野结衣在线一区二区| 欧美区在线播放| 性生活三级视频| 亚洲最大成人综合| 国内精品免费视频| 亚洲毛片视频| 久久国产精品精品国产色婷婷| 亚洲小少妇裸体bbw| 亚洲美女喷白浆| 国产午夜无码视频在线观看| 国产精品视频免费| 在线观看免费的av| 中文字幕一区二区三三| 97人摸人人澡人人人超一碰| 成全电影大全在线观看| 日韩av一区在线观看| 中文字幕高清在线免费播放| 国产女主播一区| 伊人网在线综合| 欧美久久99| 精品一区久久| 国产第一精品| 欧美日本黄视频| 天天干,夜夜操| 欧美日韩一本到| 午夜少妇久久久久久久久| 国产suv精品一区二区6| 免费黄色福利视频| 色小子综合网| 高清视频一区| 三上悠亚一区二区| 久久精品99久久香蕉国产色戒| 亚洲欧美黄色片| 欧美午夜视频网站| 欧美精品久久久久性色| 91视频精品在这里| 高清av免费看| 亚洲麻豆av| 一区二区三区四区视频在线观看| 日韩视频一二区| 国产成一区二区| 污视频免费在线观看| 亚洲欧美在线x视频| 91精品人妻一区二区三区果冻| 亚洲一区二区三区在线| 69精品无码成人久久久久久| 国产成人在线免费| 无码内射中文字幕岛国片| 最新欧美人z0oozo0| 欧美成人综合一区| 久久69av| 国产精品久久久久av免费| 日韩激情美女| 最近2019中文字幕一页二页| 日本精品一二区| 在线观看91av| 看黄色一级大片| 亚洲va中文字幕| 小向美奈子av| 久久久久88色偷偷免费| 95视频在线观看| 久久精品国产亚洲高清剧情介绍 | 婷婷社区五月天| 91美女在线视频| 95视频在线观看| 国产一区二区三区香蕉| 网站一区二区三区| 性色一区二区| av在线播放亚洲| 亚洲视频电影在线| 亚洲高清视频一区二区| 亚洲免费福利一区| 国产伦精品一区二区三区在线| 四虎影视国产精品| 国产精品va在线| 日本在线啊啊| 91高清视频在线免费观看| 在线观看a级片| 久久精品国产成人| 大胆av不用播放器在线播放| 日韩av在线最新| 日本黄色不卡视频| 欧美成人女星排行榜| jizz中国女人| 欧美一二区视频| 国产片在线播放| 91精品欧美综合在线观看最新| 亚洲图片欧美在线| 欧美日韩一区不卡| 中文字幕理论片| 欧美午夜精品久久久久久超碰| 欧美日韩精品| 日韩欧美国产激情| 欧美在线观看不卡| 欧美午夜激情视频| 午夜婷婷在线观看| 色狠狠色噜噜噜综合网| 免费无码国产精品| 欧美亚洲国产怡红院影院| 无码视频一区二区三区| 色综合天天性综合| 免费av中文字幕| 欧美视频你懂的| 伊人精品在线视频| 欧美久久免费观看| 国产免费黄色片| 日韩午夜小视频| 日韩一区免费视频| 亚洲欧美成人网| av在线电影院| 超碰91人人草人人干| 免费毛片在线看片免费丝瓜视频 | 国产精品专区免费| 国产精品成人v| 最新亚洲国产| 国产91免费视频| 久久93精品国产91久久综合| 水蜜桃亚洲一二三四在线| 欧美第十八页| 男人天堂av片| 久久久xxx| www.污污视频| 成人手机电影网| 麻豆av免费观看| 一区在线中文字幕| 久一视频在线观看| 91久久精品午夜一区二区| 国产一区二区三区成人| 精品毛片乱码1区2区3区| 日本午夜在线视频| 日韩视频中文字幕| 丁香花在线观看完整版电影| 日本免费一区二区三区视频观看| 国产亚洲人成a在线v网站| 99精品99久久久久久宅男| 秋霞影视一区二区三区| 樱花www成人免费视频| 激情婷婷久久| 超碰在线播放91| www.亚洲国产| 久草手机视频在线观看| 欧美日韩免费看| 国产精品国产精品国产专区| 亚洲国产精品久久91精品| avtt在线播放| 午夜免费在线观看精品视频| 黑人一区二区三区| 国产免费一区二区三区| 久久国产成人精品| 国产在线播放观看| 久久99久久精品| 熟女俱乐部一区二区| 亚洲蜜臀av乱码久久精品蜜桃| 精品久久久久久久久久久久久久久久| 欧美一区二区网站| 猫咪在线永久网站| 欧美精品videossex88| 伊人久久大香伊蕉在人线观看热v| 精品一区在线播放| 欧美激情1区2区| 污色网站在线观看| 91色porny| 国产精品1000| 91精品国产91综合久久蜜臀| 福利成人在线观看| 隔壁老王国产在线精品| 不卡的国产精品| 欧美一区二视频在线免费观看| 国产精品地址| 欧美精品性生活| 久久久九九九九| 国产精品第9页| 亚洲大胆人体av| 欧美卡一卡二| 亚洲综合一区二区不卡| 国产精品99视频| mm131国产精品| 国产午夜精品在线观看| www.com国产| 日韩成人免费视频| a级大胆欧美人体大胆666| 91久色国产| 欧美va亚洲va日韩∨a综合色| 亚洲天堂国产视频| 国产精品久久久久久久久久免费看 | 欧美mv日韩| 午夜免费看视频| 中文字幕电影一区| 伊人免费在线观看高清版| 亚洲人成网站免费播放| 日本免费久久| 日韩国产欧美精品| 日韩精品一二三| 美女被到爽高潮视频| 色天天综合久久久久综合片| 色视频在线看| 国产精品99久久久久久白浆小说 | 福利一区二区免费视频| 日韩精品国内| 六月丁香婷婷久久| 男人天堂资源网| 欧美美女一区二区在线观看| 国产精品va在线观看视色| 91免费看片在线| 欧美xxx在线观看| av av在线| 欧美特黄级在线| 国产亚洲依依| 国产精品主播视频| 五月精品视频| 超级砰砰砰97免费观看最新一期| 亚洲精品免费在线| 后进极品白嫩翘臀在线视频| 1769国产精品| 国产尤物久久久| 中文字幕1234区| 亚洲图片有声小说| 午夜性色福利影院| 国产精品高精视频免费| 久久久久久久久久久久久久| 91人人澡人人爽| 日韩欧美在线免费观看| 91涩漫在线观看| ts人妖另类在线| 国产精品日韩欧美一区| 长河落日免费高清观看| 欧美成人a视频| 成人性生活视频| 日韩人妻精品一区二区三区| 成人一区二区三区视频| 无码人妻av免费一区二区三区| 日韩最新av在线| 精品亚洲自拍| 依人在线免费视频| 亚洲成人动漫在线观看| 99re热久久这里只有精品34| 超碰在线观看97| 日本视频中文字幕一区二区三区| 麻豆明星ai换脸视频| 国产视频一区在线| 99久久久国产| 国产精品99久久免费黑人人妻| 亚洲伦理在线精品| 欧美色综合一区二区三区| 亚洲qvod图片区电影| 另类亚洲自拍| 久久久久久福利|