精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力 原創

發布于 2025-4-2 07:35
瀏覽
0收藏

公式識別是文檔智能解析中的重要一環,本文筆者將介紹筆者自己的工作,供參考。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

問題陳述與動機

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

核心問題:當前的數學表達式識別(MER)模型難以處理復雜公式中的層次結構和細粒度細節。

數學公式是邏輯的建筑藍圖——它們在求和符號中嵌套分數,在行文中堆疊矩陣,并分支為條件分段函數。然而,盡管數學公式具有復雜的結構,當前的數學表達式識別(MER)模型甚至難以可靠解析中等復雜度的表達式。試想:當公式的視覺密度增加時,其渲染圖像會擴大以保持清晰度。但問題在于——模型會將所有輸入嚴格調整為224×224像素等固定尺寸。圖1中的負號在原始高分辨率圖像中清晰可辨,但經過壓縮后,它會坍縮成一個與分數線模糊融合的兩像素污點。這種壓縮會引發連鎖故障:下標與基準字符粘連,括號等定界符失去方向感,層級關系消解為視覺噪聲。

數學表達式識別挑戰

復雜公式帶來了三個關鍵挑戰。首先,層次嵌套(如分數內的矩陣)需要精確解析。其次,不同LaTeX代碼可能渲染出相同圖像,導致歧義問題。第三,現有數據集規模小且缺乏結構多樣性。

為應對這些挑戰,我們提出三項貢獻,重新定義數學表達式識別領域:

  1. HDR數據集——MER研究的重大突破。不同于局限于簡單方程的現有數據集,HDR包含超過10億個公式,精心組織為HDR-100M訓練集和覆蓋12個復雜度層級的專項測試集。從基礎分數到嵌套矩陣求和,再到多分支分段函數,該資源完整捕捉了真實科學符號的多樣性。每個公式包含多標簽注釋和替代性語法表示,使模型能夠學習不同LaTeX格式的等價表達。
  2. HDNet架構——帶有顛覆性層次子公式模塊的編解碼架構。其動態裁剪機制可分離求和界限、矩陣括號、分數線等關鍵子組件,在分層融合特征前對每個組件進行最優分辨率處理。
  3. 公平評估協議——針對MER評估體系性缺陷的解決方案。現有指標將有效LaTeX變體誤判為錯誤,混淆語法偏好與真實錯誤。我們的評估協議為數學等價表達式建立等價類標準。

1. HDR數據集

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

首先是HDR數據集。我們在表1中的分析展示了HDR-Test如何系統地按層次級別和線條數對公式進行分類。HDR數據集涵蓋八個類別的公式,其復雜度分別由層次級別和線條數計算得出。

分層如下:

  • 0級:獨立字符

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

  • 1級:字符+位置關系
  • 公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

  • 2級:構造結構

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

  • 3級:多層
  • 公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

首先是HDR數據集。為標準化公式復雜度的表示,我們在此解釋層次級別的含義:

在0級,我們定義原子元素——獨立字符如"a"或數字,它們是構成公式的基礎單元。當這些元素與上標、下標等操作符結合時,復雜度上升至1級。

2級引入結構性復雜度——分數、積分或求和符號。此時空間關系決定了語義。但真正的挑戰出現在更高層級,公式呈現俄羅斯套娃式嵌套結構:例如包裹矩陣的分段函數,這類表達式要求跨多層精確匹配開閉定界符。

通過在復雜度梯度上訓練模型,我們迫使它們掌握LaTeX的結構語法——不僅識別符號,更要理解其嵌套依賴關系。這種層次劃分不僅是理論概念,更是解析真實公式的關鍵。

HDR-1億數據集提供了前所未有的規模和多樣性,涵蓋了從數學到計算機科學領域的arXiv論文中的公式。HDR測試集包含多標簽注釋,以涵蓋有效的LaTeX變體。如圖3所示,HDR在復雜性方面超越了先前的數據集,能夠支持強大的模型訓練和評估。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

2. HDNet架構

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

Encoder-Decoder: ViT encoder + Transformer decoder

HDNet將視覺Transformer編碼器與Transformer解碼器相結合。其關鍵創新點在于特征融合:將主公式的全局上下文信息與子公式的局部細節信息相融合。損失函數通過參數α來平衡主公式損失和子公式損失。這種雙重關注確保了對公式結構和細節的準確解析。

在訓練過程中,如圖2的左側所示,公式會根據其標簽進行分層解析。每個公式會被拆分、渲染并調整大小成為子公式。主公式也會進行渲染和調整大小。主公式和子公式都會被輸入到編碼器中以提取特征。然后,子公式的特征會通過加權聚合的方式與主公式的特征相融合,以提供額外的視覺細節信息。經過加權的特征會被傳遞到解碼器,以預測主公式的結果。此外,每個子公式的特征會被單獨傳遞到解碼器,以預測子公式的結果。該模型的優化目標包括主公式的損失以及子公式損失的總和。

loss如下:

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

公平評估策略

評估的公平性至關重要。傳統的評估方法局限于字符層面,當數學公式圖像可以用多種有效方式進行解釋時,這些方法往往無法公平地評估模型。由于具有功能等效性的LaTeX命令,預測結果和真實標簽在字符層面可能會有所不同,但作為圖像渲染出來時卻是相同的。例如,一些LaTeX公式在功能上是相同的,但在文本表達上存在差異。

為了克服這一問題,如圖所示,我們提出了一種簡單而高效的評估策略,該策略考慮了功能等效表達式的所有有效解析選項。我們的方法在進行字符層面的評估之前,會用等效表達式來替換標簽和模型預測結果。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

這種方法能夠涵蓋更廣泛的有效表達式,確保在識別和解析復雜公式時,對模型性能進行更可靠、更公平的評估。通過處理基于LaTeX的公式生成過程中的可變性,我們的策略提高了字符層面評估的準確性和公平性。

評價指標:Edit distance, BLEU, character recall

實驗評測

我們將HDNet與一些基線模型進行了比較,結果見表。HDNet的表現優于所有基線模型,實現了最高的字符召回率(0.968)、最低的平均編輯距離,以及最高的BLEU分數。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

跨數據集泛化

我們還對現有的公式識別數據集進行了比較,HDNet同樣取得了最佳結果。值得一提的是,HDNet在參數數量方面也具有優勢,如圖4所示,子公式模塊并未增加額外的參數。

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

消融實驗

為了驗證我們的分層子公式模塊,我們進行了四種配置下的消融實驗:不裁剪、隨機裁剪、子公式裁剪,以及子公式和隨機裁剪相結合。

實驗結果總結在表IV中,結果表明“子公式 + 隨機裁剪”的配置取得了最佳性能,公平字符召回率(Fair-CR)得分達到了0.968。然而,僅使用子公式裁剪時,得分降至0.837。這是為什么呢?

公式識別:利用分層且聚焦細節的網絡提升復雜公式識別能力-AI.x社區

子公式裁剪在訓練過程中依賴標簽來提取子公式,但在測試階段這些標簽是不可用的。這就導致了訓練階段和測試階段之間的不匹配。通過將子公式裁剪與隨機裁剪相結合(在訓練和測試中都一致應用),我們消除了這種差距,確保了模型的穩健性能。

這個實驗強調了使訓練條件和推理條件保持一致的重要性,尤其是對于像數學表達式識別(MER)這樣對細節敏感的任務來說。

總結與展望

我們的工作解決了數學表達式識別(MER)領域的兩個根本性局限:一是缺乏能夠涵蓋復雜層次結構的數據集,二是現有模型無法解析復雜公式中的細粒度細節。

首先,HDR數據集為MER研究樹立了新的標桿。它擁有一億個訓練樣本,并且有一個涵蓋多個不同學科領域的多標簽測試集。這促使模型去處理嵌套結構、多行公式以及功能等效的解釋。通過納入從簡單字符到深度嵌套矩陣的不同層次,HDR彌合了理論研究與實際應用之間的差距。

其次,HDNet重新定義了模型處理復雜公式的方式。它的分層子公式模塊將表達式分解為高分辨率的子組件,從而實現對細節的精確識別。通過融合主公式及其子公式的特征,HDNet在面對尺度變化和復雜的符號排列時表現出很強的穩健性。雙重損失函數進一步確保了平衡優化,既重視全局結構,又注重局部的準確性。

我們的實驗表明,HDNet優于現有的MER模型,在編輯距離和字符召回率等指標上均取得了最佳性能。至關重要的是,我們引入了一個公平的評估框架,該框架考慮了公式的多種有效解釋,這是對以往嚴格的字符層面比較的一種范式轉變。

展望未來,我們設想HDNet將成為科學文獻分析、教育技術以及多語言公式識別的基礎工具。未來的工作將擴展HDR數據集,使其包含手寫表達式,并針對實時應用對HDNet進行優化。

總之,HDR數據集和HDNet架構解決了數學表達式識別(MER)領域的關鍵缺陷。未來的工作將包括將其擴展到手寫表達式識別以及多語言環境中。


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/jqanDf9Vk_IXJx5XEJkw3w??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-2 07:35:30修改
收藏
回復
舉報
回復
相關推薦
中文字幕第一页亚洲| 国产99久久久欧美黑人| 69亚洲乱人伦| 成人直播视频| 国产精品美女久久久久高潮| 亚洲xxxx视频| 亚洲国产av一区二区三区| 日本成人小视频| 日韩欧美激情在线| 激情五月开心婷婷| 欧美人与牲禽动交com| 99国产精品国产精品毛片| 日本国产一区二区三区| 成人涩涩小片视频日本| 免费看久久久| 91精品国产欧美一区二区成人| 18禁免费观看网站| 黄页视频在线播放| 久久九九99视频| 91免费版网站入口| 中文字幕国产在线观看| 欧美成人久久| 中文字幕亚洲国产| 中文字幕制服丝袜| 香蕉久久一区| 91久久久免费一区二区| 国产精品无码免费专区午夜| yourporn在线观看中文站| 成人免费福利片| 国产日韩欧美视频在线| 毛片视频网站在线观看| 欧美国产先锋| 久久精品国产成人| www.av欧美| 国产精品高潮呻吟久久久久| 7777精品伊人久久久大香线蕉经典版下载| 欧美日本视频在线观看| 欧美videos另类精品| 1区2区3区精品视频| 色姑娘综合网| 免费理论片在线观看播放老| 成人毛片老司机大片| 91最新国产视频| 中文字幕一区二区三区波野结| 国产视频一区三区| 97精品国产97久久久久久| 久久久全国免费视频| 亚洲无中文字幕| 久久九九国产精品怡红院| 日韩视频在线观看免费视频| 精品一区二区三区在线观看视频| 欧美日韩视频在线观看一区二区三区 | 天天干天天插天天射| 国产精品久久久久久久免费软件| 欧美激情中文字幕在线| 青青草国产在线观看| 亚洲国产一区二区在线观看| 精品国模在线视频| 国产精品夜夜夜爽阿娇| 99久久精品费精品国产| 日韩视频在线一区| 中文字幕无码日韩专区免费 | 成人黄色毛片| 欧美性生活久久| 色哟哟精品视频| 国产成人免费精品| 欧美精品在线视频| 青娱乐精品在线| 91麻豆精品国产91久久久久推荐资源| 日韩欧美123| 中文字幕在线观看91| 国产乱人伦丫前精品视频| 亚洲成人性视频| 亚洲av无码一区二区三区观看| 日韩极品少妇| 亚洲一区二区福利| 日韩av手机在线免费观看| 亚洲国产日韩欧美在线| 欧美黑人xxxx| 五月天激情四射| 日本系列欧美系列| 91深夜福利视频| 成人午夜视频一区二区播放| av在线不卡免费看| 色女孩综合网| 亚洲综合影视| 精品美女久久久久久免费| 激情婷婷综合网| **国产精品| 亚洲国产精品久久| 亚洲欧洲久久久| 亚洲精品久久| 欧美一区二粉嫩精品国产一线天| 日韩三级一区二区| 国产一区二区三区视频在线播放| 国产高清不卡av| 国产香蕉视频在线看| 一区在线播放视频| 尤物av无码色av无码| 日本综合视频| 精品美女一区二区| 亚洲自拍偷拍图| 午夜久久tv| 日韩美女福利视频| 亚洲国产精品18久久久久久| 久久你懂得1024| 天堂av在线中文| 625成人欧美午夜电影| 91精品国产综合久久精品| fc2成人免费视频| 91视频综合| 91sa在线看| 国产视频一二三四区| 久久综合色播五月| 男人c女人视频| a屁视频一区二区三区四区| 欧美精品一区二| 免费成年人视频在线观看| 久久久久一区| 爱情岛论坛亚洲入口| 亚洲成a人v欧美综合天堂麻豆| 夜夜嗨av一区二区三区中文字幕| 天美星空大象mv在线观看视频| 91成人入口| 久久久999精品| 天堂网视频在线| 成人性生交大片免费看中文网站| 伊人色综合久久天天五月婷| 小早川怜子影音先锋在线观看| 日韩三级在线免费观看| 一二三四在线观看视频| 国产精品丝袜xxxxxxx| 99热在线播放| 国产精品久久久久久福利| 欧美性生交xxxxx久久久| 少妇伦子伦精品无吗| 国产精品久久久久9999赢消| 国产精品96久久久久久又黄又硬 | 亚洲日本成人网| 国产成人免费观看视频| 粉嫩av亚洲一区二区图片| 三年中国中文在线观看免费播放| 成人黄色图片网站| 亚洲人成免费电影| 欧美一级片免费在线观看| 成人免费电影视频| 欧美视频在线观看视频| 18国产精品| 欧美激情第99页| 国产美女免费视频| 中文字幕一区二区三区在线观看 | 最新日韩三级| 亚洲欧美制服综合另类| 亚洲GV成人无码久久精品| 2021久久国产精品不只是精品| 欧美一级片免费播放| 国产精品x8x8一区二区| 性色av香蕉一区二区| 色婷婷在线视频| 黄色成人av网| 人妻丰满熟妇av无码久久洗澡| 夜夜嗨网站十八久久| 久久精品国产美女| 精品欧美一区二区精品久久| 精品人妻少妇嫩草av无码专区| 中文字幕一区日韩精品欧美| 国产资源中文字幕| 欧美激情一级片一区二区| 97久久夜色精品国产九色| 最新日本在线观看| 欧美成人a∨高清免费观看| 久久午夜无码鲁丝片| av男人天堂一区| 国产精品亚洲a| 大色综合视频网站在线播放| 国产综合在线观看视频| 午夜羞羞小视频在线观看| 欧美精品一区二区三区蜜臀| 国产三级av片| 亚洲国产精品激情在线观看| 亚洲一区精品视频在线观看| 欧美.日韩.国产.一区.二区| 国产精品日韩欧美一区二区三区| 三妻四妾的电影电视剧在线观看| 亚洲一二三在线| 国产又粗又大又黄| 亚洲不卡av一区二区三区| 亚洲自拍偷拍一区二区| 另类调教123区 | 国产有码一区二区| 欧美韩日亚洲| 亚洲人精品午夜在线观看| 国产精品探花视频| 午夜电影一区二区三区| 神马久久久久久久久久久| 国产成人一区在线| 六月激情综合网| 无需播放器亚洲| 精品蜜桃传媒| 国产精久久一区二区| 午夜精品在线观看| 色三级在线观看| 亚洲国产又黄又爽女人高潮的| 亚洲图片中文字幕| 午夜精品福利视频网站| 欧美一级特黄高清视频| 91亚洲国产成人精品一区二区三 | 国产无码精品一区二区| 国产日韩欧美精品电影三级在线| 中文字幕第六页| 日韩精品福利网| 拔插拔插海外华人免费| 成人网18免费网站| 久久草.com| 韩国三级成人在线| 国产精品wwwwww| av漫画网站在线观看| 日韩有码视频在线| 国产在线播放av| 亚洲国产成人久久| 99精品人妻无码专区在线视频区| 韩曰欧美视频免费观看| 国产一区二区视频在线观看免费| 国产日韩欧美制服另类| 欧美大喷水吹潮合集在线观看| 久久99热99| 欧美性猛交久久久乱大交小说| 国产精品xvideos88| 欧美一级免费在线观看| 国产欧美日韩在线观看视频| 精品日本一区二区三区| eeuss鲁片一区二区三区| 成人精品视频久久久久| 国产成人精品123区免费视频| 97视频国产在线| 免费不卡av| 九九热这里只有精品6| 欧美性天天影视| 最新中文字幕亚洲| www.在线播放| 一区二区三区亚洲| 国产亚洲依依| 亚洲欧美第一页| 嫩草在线播放| 精品视频在线播放免| 外国精品视频在线观看| 亚洲精品国产品国语在线| 成 人 黄 色 片 在线播放| 91精品国产色综合久久久蜜香臀| 一级黄色大片网站| 欧美老女人在线| 国产免费av电影| 欧美一区二区视频在线观看2020 | 久久一二三四| 99re在线视频免费观看| 久久天天综合| 超碰在线97免费| 久久99日本精品| 成人免费黄色av| 粉嫩久久99精品久久久久久夜| 性折磨bdsm欧美激情另类| 国产ts人妖一区二区| 在线看黄色的网站| 91在线视频观看| 亚洲色成人网站www永久四虎| 国产亚洲精品bt天堂精选| 国产精品无码无卡无需播放器| 欧美国产日韩a欧美在线观看| av在线播放中文字幕| 《视频一区视频二区| 青青草免费av| 亚洲国产成人91porn| 中文字幕超碰在线| 在线观看国产日韩| 91精品中文字幕| 日韩欧美国产不卡| 五月婷婷六月激情| 国产一区二区三区精品久久久| 色网站免费在线观看| 欧美成人精品在线观看| 国产精品xx| 国产精品激情自拍| 日本免费精品| 精品一区在线播放| 欧美电影一区| 欧美一区二区激情| 日产国产高清一区二区三区| 人人爽人人爽av| 不卡一区二区在线| 毛片aaaaaa| 亚洲一区二区视频| 亚洲精品国产精品国自产网站按摩| 欧美精品1区2区| 日韩在线一区二区三区四区| 亚洲人成网站777色婷婷| 成人福利片网站| 97成人超碰免| 亚洲男人在线| 看欧美日韩国产| 一区二区电影在线观看| 日韩avxxx| 国产一区二区三区在线观看免费视频 | 成人做爰视频www网站小优视频| 亚洲一区二区久久久久久久| 色哟哟精品丝袜一区二区| 天堂v在线视频| 欧美一级久久| 久久黄色一级视频| 中文字幕精品—区二区四季| 亚欧洲精品在线视频| 精品视频999| 日韩电影免费| 久久69精品久久久久久久电影好| 3d性欧美动漫精品xxxx软件| 97久久天天综合色天天综合色hd| 热久久天天拍国产| 日本wwww视频| 国产不卡免费视频| av黄色免费在线观看| 欧美日韩精品在线| 丰满大乳国产精品| 久久黄色av网站| 一呦二呦三呦精品国产| 久久偷看各类wc女厕嘘嘘偷窃 | 免费毛片网站在线观看| 国内精品视频666| 日本乱子伦xxxx| 疯狂做受xxxx欧美肥白少妇| 性色av蜜臀av| 日韩视频在线观看免费| 国产福利亚洲| 日本中文不卡| 久久久噜噜噜| 国产三级视频网站| 欧美日韩国产精品一区| 亚洲国产精品久久人人爱潘金莲| 久久精品视频在线播放| 久久电影天堂| 亚洲国产高清国产精品| 日韩激情在线观看| 波多野结衣福利| 偷拍与自拍一区| 欧美综合视频在线| 久久久久久久国产| 97久久综合精品久久久综合| www国产免费| 国产成人亚洲综合a∨婷婷 | 欧美在线黄色| 一级片免费在线观看视频| 日韩毛片一二三区| 在线观看毛片视频| 自拍偷拍免费精品| 欧美一区=区三区| 欧美一级免费在线观看| 国产一区二区看久久| 麻豆视频在线免费看| 日韩亚洲欧美综合| 青青草视频在线免费直播| 国产精品久久久久久久久久直播| 国产一区二区中文| 中国特级黄色大片| 欧美日韩国产在线| 国产视频第一区| 国产精品视频最多的网站| 天天操综合网| 亚洲熟妇一区二区| 天天亚洲美女在线视频| 免费国产在线观看| 国产欧美一区二区三区在线| 中文字幕一区二区精品区| 人妻精油按摩bd高清中文字幕| 性感美女极品91精品| 青梅竹马是消防员在线| 国产精品视频资源| 欧美视频成人| 亚洲第九十七页| 欧美亚洲一区二区在线| 黄色片网站在线| 国内一区二区三区在线视频| 久久精品卡一| 91视频最新网址| 精品欧美黑人一区二区三区| 美女搞黄视频在线观看| 亚洲一区3d动漫同人无遮挡| 国产高清不卡二三区| 亚洲 欧美 成人| 最近2019年日本中文免费字幕| 136福利精品导航| 北条麻妃av高潮尖叫在线观看| 亚洲图片激情小说| 午夜视频福利在线| 国产日韩中文在线| 99热在线精品观看| 亚洲aaa视频| 亚洲精品wwwww| 99视频有精品高清视频| 九色在线视频观看| 亚洲精品欧美二区三区中文字幕| 好吊视频一二三区| 国产中文欧美精品|