精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

圖表代碼生成,ChartIR;視頻與文本統一多模態模型

發布于 2025-6-23 06:24
瀏覽
0收藏

Improved Iterative Refinement for Chart-to-Code Generation via Structured Instruction

2025-06-15|SJTU, Shanghai Inno, Lehigh U, BIG AI, BIGAI|??8

??http://arxiv.org/abs/2506.14837v1???
???https://huggingface.co/papers/2506.14837??

研究背景與意義

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 問題定義與現狀概述

多模態大語言模型(MLLMs)在視覺理解領域表現卓越,但在圖表到代碼生成任務中仍存在明顯不足。該任務不僅要求模型精準理解高密度、多維度的圖表信息,還需將其準確轉化為結構化且可執行的代碼。直接利用MLLMs進行此類復雜任務常常效果不佳,暴露出視覺理解與代碼翻譯兩大核心挑戰。

  1. 挑戰與目標闡明

當前主流方法存在訓練依賴、單一指標優化、優化過程不平衡等問題,限制了模型在圖表代碼生成上的表現。本文旨在提出一種無訓練、模型無關的迭代細化框架ChartIR,通過結構化指令顯著提升MLLMs的圖表理解與代碼生成能力,實現更高的視覺與結構一致性。

研究方法與創新

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 技術框架設計

ChartIR采用兩階段策略:初始代碼生成與迭代細化。初始階段通過多維度的結構化圖表描述,輔助模型理解圖表的文本、顏色、布局和類型等關鍵視覺特征。細化階段則基于生成圖表與參考圖表的差異描述,指導模型逐步修正代碼,提升生成圖表的整體質量。

  1. 創新點詳解
  • 結構化圖表描述機制:區別于傳統單一視覺輸入,ChartIR引入描述與差異兩類指令,將復雜視覺信息轉化為模型易理解的語言表示,顯著增強模型的視覺語義理解能力。
  • 迭代差異驅動的代碼細化:通過多維度差異分析,模型能針對具體視覺和結構缺陷進行精準修正,避免了以往單指標優化帶來的局部最優問題,實現全方位的圖表質量提升。
  • 訓練自由與模型無關性:無需額外訓練即可適配開源與閉源模型(如Qwen2-VL和GPT-4o),保證方法的通用性和實用性。
  1. 理論基礎與優勢ChartIR基于視覺-語言轉換和迭代優化理論,利用中間結構化表示橋接視覺感知與代碼生成的模態鴻溝。相較于現有方法,其多維度描述和綜合差異反饋機制使得模型能更全面地理解和修正圖表細節,提升了代碼生成的準確性和可執行性。

實驗設計與結果分析

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 實驗設置

采用Plot2Code和ChartMimic兩個公開基準數據集,分別評測開源模型Qwen2-VL和閉源模型GPT-4o。對比基線包括直接生成(Direct Generation)和最新的迭代多代理方法METAL。評價指標涵蓋GPT-4o主觀打分、文本、布局、類型、顏色等低層次視覺指標,以及PSNR、SSIM等傳統圖像相似性指標。

  1. 結果表現
  • ChartIR在所有指標上均優于基線,GPT-4o模型上GPT-4oScore提升達17%,表明生成圖表在視覺和結構上更接近參考圖。
  • 開源模型Qwen2-VL同樣受益顯著,尤其在傳統圖像質量指標和低層視覺指標上提升明顯,驗證了結構化描述對增強模型視覺理解的有效性。
  • 消融實驗顯示,描述和差異兩大模塊均為性能提升關鍵,缺一不可,且二者協同作用最為顯著。
  1. 多場景適用性實驗涵蓋多種圖表類型和復雜布局,ChartIR在多樣化場景中均展現出穩定且優越的性能,體現出良好的泛化能力和實用價值。

結論與展望

  1. 研究貢獻總結

本文提出的ChartIR框架通過結構化多維描述結合迭代差異細化,有效解決了圖表視覺理解與代碼翻譯的雙重難題,實現了無訓練、模型無關的高質量圖表代碼生成。實驗驗證了其在開源和閉源模型上的廣泛適用性和領先性能。

  1. 局限性分析
  • 計算資源需求較高,尤其在迭代細化階段,盡管查詢次數減少,但整體計算成本仍需優化。
  • 對閉源模型的提升空間有限,因其本身已具備較強的圖表理解能力,結構化指令的增益相對有限。
  1. 未來研究方向
  • 探索更高效的迭代策略和差異描述生成模型,以降低計算開銷。
  • 針對閉源模型,設計更具針對性的結構化指令或輔助模塊,進一步挖掘其潛力。
  • 擴展至更多復雜圖表類型及其他視覺到代碼轉換任務,推動多模態理解與生成技術的發展。

Show-o2: Improved Native Unified Multimodal Models

2025-06-18|NUS, ByteDance, NUS Show Lab|??6

??http://arxiv.org/abs/2506.15564v1???
???https://huggingface.co/papers/2506.15564???
???https://github.com/showlab/Show-o??

研究背景與意義

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 研究背景

隨著大型語言模型(LLMs)和大型多模態模型(LMMs)的迅猛發展,統一多模態模型(UMMs)成為整合文本、圖像及視頻理解與生成的關鍵方向。現有研究多聚焦于文本與圖像的融合,尚缺乏對視頻模態的高效統一處理。

  1. 研究意義

本文提出的Show-o2模型,基于3D因果變分自編碼器(VAE)空間,通過空間-時間融合機制構建統一視覺表示,突破了以往模型在多模態融合上的局限,實現了文本、圖像和視頻的原生統一理解與生成,推動多模態模型向更廣泛應用場景邁進。

  1. 挑戰與目標

現有多模態模型往往依賴大規模文本語料,且多模態理解與生成能力分離,難以兼顧高效擴展與性能。Show-o2旨在通過雙路徑融合及兩階段訓練策略,既保留語言知識,又提升視覺生成能力,實現統一、高效且可擴展的多模態模型設計。

研究方法與創新

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 統一視覺表示設計

采用3D因果VAE編碼器提取圖像和視頻潛變量,設計雙路徑架構:語義層(Semantic Layers)提取高層語義信息,投影器(Projector)保留低層細節,兩者通過空間-時間融合機制結合,生成統一視覺表示,兼顧多模態理解和生成需求。

  1. 原生統一多模態建模

結合預訓練語言模型,構建包含語言頭和流頭(Flow Head)的雙頭架構。語言頭負責文本的自回歸建模,流頭通過流匹配(Flow Matching)實現圖像和視頻的生成,二者原生集成于單一模型,避免了以往多模型組裝的復雜性。

  1. 兩階段訓練策略
  • 第一階段:針對流頭和視覺融合模塊進行訓練,利用66M圖文對及視頻文本數據,專注視覺生成能力的培養。
  • 第二階段:微調整個模型,結合高質量多模態理解指令和視覺生成數據,確保語言理解與視覺生成能力的協同提升。該策略有效避免了對大規模文本語料的過度依賴,保持語言模型的知識完整性。
  1. 技術優勢與創新點
  • 原生支持文本、圖像和視頻三模態,提升模型的通用性和擴展性。
  • 雙路徑融合機制兼顧語義與細節信息,增強多模態理解與生成效果。
  • 流匹配結合自回歸建模,創新地融合了兩種主流生成范式。
  • 兩階段訓練方案兼顧效率與效果,降低訓練成本,提升大規模模型訓練的可行性。
  1. 對比現有方法

相較于Chameleon、Transfusion和Show-o等模型,Show-o2不僅擴展到了視頻模態,還通過原生統一的模型架構和雙路徑融合機制,顯著提升了多模態任務的性能和生成質量。

實驗設計與結果分析

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

圖表代碼生成,ChartIR;視頻與文本統一多模態模型-AI.x社區

  1. 實驗設計
  • 數據集:采用66M圖文對、視頻文本對及高質量多模態指令數據,涵蓋豐富場景。
  • 模型規模:測試1.5B和7B參數兩種版本,驗證模型的可擴展性。
  • 評測指標:覆蓋多模態理解(MME、GQA、SEED-Bench等)和視覺生成(GenEval、DPG-Bench、VBench)多個權威基準。
  1. 多模態理解性能

Show-o2在多項理解指標中表現優異,1.5B版本在MME-p和MMU-val等指標領先同參數模型,7B版本超越多款7B及更大參數模型,證明統一視覺表示和融合機制的有效性。

  1. 視覺生成效果

Show-o2在圖像生成任務中,憑借僅66M圖文對訓練數據,達到甚至超越了依賴百億級數據訓練的競品模型。視頻生成方面,Show-o2以2B參數規模實現了對比更大模型的競爭力表現,生成視頻在語義連貫性和視覺質量上均表現優異。

  1. 混合模態生成能力

模型支持交錯文本與圖像的生成,能夠連貫敘述故事,展示了強大的多模態交互能力和生成一致性。

  1. 消融實驗
  • 空間-時間融合機制顯著提升了理解和生成指標。
  • 分類器無關引導(CFG)和推理步數調整對生成質量有積極影響。
  • 兩階段訓練策略對于最終性能提升至關重要。

結論與展望

  1. 總結貢獻

Show-o2提出了一種原生統一的多模態模型架構,通過雙路徑空間-時間融合和結合自回歸與流匹配的生成機制,實現了文本、圖像和視頻的統一理解與生成。兩階段訓練策略有效平衡了語言知識保留與視覺生成能力,模型在多項多模態理解和生成基準上均取得領先成績。

  1. 局限性

當前模型在圖像中文字渲染方面表現不足,存在一定的細節生成缺陷,提示未來需要加強視覺細節的表達能力。

  1. 未來展望
  • 引入更高分辨率視覺編碼與生成技術,提升細節表現。
  • 探索更高效的訓練與推理機制,降低計算資源需求。
  • 擴展更多模態融合,如音頻與三維數據,推動多模態模型向更廣泛應用拓展。
  • 加強模型在跨語言、多文化背景下的泛化能力,提升實用性與公平性。

本文轉載自??AI研究前瞻??,作者:胡耀淇

已于2025-6-23 10:50:16修改
收藏
回復
舉報
回復
相關推薦
亚洲精品中文字幕| 天天操天天操天天操| 欧美成人一品| 日韩av在线电影网| 在线观看的毛片| 在线观看三级视频| 久久精品一区二区三区av| 91在线播放国产| 国产 日韩 欧美 在线| 日韩在线二区| 亚洲国产一区二区三区四区| 日韩av手机版| 91探花在线观看| 中文字幕一区二区三区精华液| 欧美肥老妇视频| 日本少妇色视频| 99久久99九九99九九九| 成人欧美一区二区三区黑人麻豆| 国产精品欧美激情| 国产真实夫妇交换视频| 欧美韩国日本在线观看| 日韩精品免费观看| 一级黄色片在线免费观看| 国产精欧美一区二区三区蓝颜男同| 成人福利视频在线| 国产精品一区二区3区| 国产精品1234区| 亚洲香蕉av| 色吧影院999| 免费观看av网站| 波多野结衣一区二区三区免费视频| 一区二区三区四区激情| 亚洲综合国产精品| 中文字幕男人天堂| 久久久久久网| 午夜精品一区二区三区在线| 天天做夜夜爱爱爱| 欧美另类中文字幕| 欧美日韩免费视频| 无码人妻丰满熟妇区五十路百度| 成人亚洲综合天堂| 99久久精品国产精品久久| 欧美中文在线免费| 日本熟妇一区二区| 一区精品久久| 九九热精品在线| 久久久精品视频免费观看| 亚洲视频一起| 欧美丝袜第一区| 精品久久久久久无码中文野结衣| 免费在线黄色电影| 91在线观看视频| 久草精品电影| 一区二区精品视频在线观看| 久久久噜噜噜久久狠狠50岁| 91精品国产99| 亚洲精品午夜国产va久久成人| 久久中文视频| 神马久久桃色视频| 亚洲色偷偷综合亚洲av伊人| 成人资源在线| 亚洲变态欧美另类捆绑| 在线观看欧美一区二区| 午夜视频在线观看精品中文| 欧美va在线播放| 熟女少妇精品一区二区| 成人涩涩视频| 欧美精品日韩精品| 天堂在线精品视频| 东京久久高清| 日韩极品精品视频免费观看| 国产伦理片在线观看| 成人羞羞网站入口免费| 精品国产一区久久久| 超碰caoprom| 一区二区三区韩国免费中文网站| 欧美色视频一区| 国产色视频在线播放| 黄色成人影院| 亚洲曰韩产成在线| 精品这里只有精品| 高清毛片在线看| 国产精品伦一区| 日韩国产小视频| aaa在线观看| 国产在线不卡一区| 国产精品一国产精品最新章节| 日韩 国产 欧美| 毛片不卡一区二区| 国产精品视频免费观看| 亚洲aaa在线观看| 国产精品日日摸夜夜摸av| 国产精品12p| 亚洲欧美小说色综合小说一区| 久久色在线观看| 这里只有精品66| 国产色a在线| 国产成人鲁色资源国产91色综| 日韩av电影手机在线| 正在播放亚洲精品| 成人一区在线看| 日韩激情久久| a级片在线免费| 欧美日韩精品免费观看视频| 日本中文字幕有码| 日韩一区精品| 精品乱人伦一区二区三区| 性欧美一区二区| 亚洲综合福利| 欧美日韩国产二区| 波多野结衣影片| 国v精品久久久网| 91系列在线播放| 美国成人毛片| 国产乱人伦偷精品视频不卡| 久久久久综合一区二区三区| 精品国产丝袜高跟鞋| 在线视频综合导航| 中文字幕一区二区三区乱码不卡| 综合伊人久久| 色爱精品视频一区| 欧美性猛交xxxx乱大交hd| 粉嫩一区二区三区在线看| 伊人久久av导航| 成人18在线| 国产日韩欧美精品一区| 亚洲成人一区二区三区| heyzo高清中文字幕在线| 91精品婷婷国产综合久久性色| 做a视频在线观看| 国产精品一在线观看| 亚洲欧美国产精品| 国产在线精品观看| 国产成人精品aa毛片| 中文字幕在线亚洲精品| av免费在线一区| 亚洲天堂免费在线| 精品人妻一区二区三区香蕉| 韩国欧美一区| 亚洲自拍中文字幕| 亚洲wwwww| 欧美一区二区播放| 欧洲第一无人区观看| 国产综合久久久久久鬼色 | 婷婷成人激情在线网| 在线观看日本www| 天天做天天爱天天综合网| 欧美激情一区二区三区成人 | 国产超碰在线播放| 亚洲宅男一区| 国产福利视频一区二区| 免费a在线观看| 一区二区三区不卡视频在线观看 | 久草福利资源在线| 美女脱光内衣内裤视频久久网站| 成人av蜜桃| 欧洲一区二区三区| 在线观看日韩av先锋影音电影院| 欧洲在线免费视频| 欧美搞黄网站| 精品国产一区二区三区麻豆小说| 亚洲麻豆精品| 7777精品伊人久久久大香线蕉经典版下载 | 黑人巨大精品欧美| 韩国自拍一区| 久久精品一二三区| 卡通欧美亚洲| 亚洲国产三级网| 亚洲国产成人无码av在线| 国产亚洲精品超碰| 黄色一级视频片| 日韩成人久久| 久久久噜噜噜久噜久久| 深夜福利视频网站| 亚洲一区二区综合| 国产精品无码在线| 秋霞电影网一区二区| 中文字幕中文字幕在线中心一区| 欧美性猛交xxx高清大费中文| 精品国产露脸精彩对白| 国产一级18片视频| 亚洲国产成人自拍| 三大队在线观看| 天堂一区二区在线免费观看| 亚洲欧美久久234| 91在线一区| 欧美激情亚洲激情| 可以在线观看的av| 91精品国产综合久久小美女| 免费毛片一区二区三区| 国产福利91精品| 黄色片视频在线免费观看| 国产精品国内免费一区二区三区| 国产精品永久免费在线| 国内老司机av在线| 最新69国产成人精品视频免费| 在线免费观看国产精品| 亚洲欧美日韩一区二区三区在线观看| 日韩av片专区| 亚洲三级免费| 中文字幕不卡每日更新1区2区| 日韩欧美激情| 国产69精品久久久久久| 宅男网站在线免费观看| 欧美成人一区二区三区片免费| 成人在线观看小视频| 久久综合成人精品亚洲另类欧美 | 精品国产髙清在线看国产毛片| 强行糟蹋人妻hd中文| 久久久精品免费免费| 黑人巨大猛交丰满少妇| 日本视频在线一区| 一区二区三区视频在线播放| 久久夜色精品国产噜噜av小说| 3344国产精品免费看| 国产黄a三级三级三级av在线看 | 国产精品久久久| 大香伊人久久| 蜜臀久久99精品久久久无需会员 | 韩国精品在线观看| 好男人www社区| 欧美激情777| 免费一区二区三区| 成人av综合网| 亚洲影院高清在线| 欧美久久天堂| 欧美激情精品久久久| 精品美女在线观看视频在线观看| 欧美变态tickle挠乳网站| 91美女免费看| 亚洲午夜免费福利视频| 美国黄色小视频| 中文字幕一区二区三中文字幕| 无码人妻一区二区三区免费n鬼沢| 一道本一区二区| 久久这里只有精品18| 在线看片不卡| 中国老女人av| 911精品美国片911久久久| 国产传媒一区| 伊人久久大香线蕉av超碰| 91中文在线视频| 国产视频一区二区在线播放| 91精品国产乱码久久久久久蜜臀| www.中文字幕久久久| 亚洲天堂网在线观看| 福利成人在线观看| 中文在线不卡视频| 亚洲av电影一区| 欧美不卡123| 日本黄色三级视频| 亚洲电影中文字幕| 亚洲欧美丝袜中文综合| 国产视频久久久久| www.欧美国产| 欧美成人激情免费网| 日本人妻丰满熟妇久久久久久| 精品视频999| 一级黄色录像大片| 91精品国产综合久久香蕉的特点| 亚洲av无码不卡| 欧美在线免费观看视频| 国产无遮挡又黄又爽在线观看| 国产精品萝li| 日本激情小视频| 欧美国产精品劲爆| 成人自拍小视频| 亚洲在线中文字幕| 天天看片中文字幕| 亚洲电影第三页| 国产三级精品三级在线观看| 在线精品亚洲一区二区不卡| 在线观看国产一区二区三区| 欧美一级视频精品观看| 免费观看a视频| 国产亚洲视频在线| 国产在线高潮| 2019中文字幕在线免费观看| av一区在线| 亚洲xxx自由成熟| 亚洲另类av| 日本女人高潮视频| 一本不卡影院| 日本黄色的视频| av中文字幕不卡| 香蕉久久久久久久| 亚洲综合免费观看高清完整版| 中文字幕av免费在线观看| 婷婷开心激情综合| 一区二区日韩视频| 日韩国产一区三区| av网站在线看| 国产成人久久久精品一区| 免费一级欧美片在线观看网站| 91精品国产综合久久久久久久久 | 无码国产69精品久久久久同性| 91亚洲精品久久久蜜桃| 日本激情视频一区二区三区| 午夜国产精品影院在线观看| 中文字幕乱码中文字幕| 亚洲精品按摩视频| 性xxxx视频播放免费| 久久精品国产欧美亚洲人人爽| 久操视频在线免费播放| 91国内在线视频| 国产精品美女久久久久| 欧美一级日本a级v片| 黄色不卡一区| 国产精品久久久久9999爆乳| 美女视频黄 久久| 国产福利短视频| 一卡二卡欧美日韩| 一区二区国产欧美| 欧美mv日韩mv国产网站| av在线第一页| 欧美尤物巨大精品爽| 色播一区二区| 中文字幕在线亚洲三区| 日韩**一区毛片| v8888av| 亚洲电影第三页| 丁香六月天婷婷| 欧美成年人视频网站| 日韩成人精品一区二区三区| 日本不卡一区二区三区视频| 亚洲人成人一区二区三区| 奇米777在线视频| 中文字幕在线不卡视频| 久久免费播放视频| 69堂精品视频| 黄网站在线免费看| 成人免费在线视频网站| 色777狠狠狠综合伊人| 男女视频一区二区三区| 91蝌蚪国产九色| 午夜精品三级久久久有码| 亚洲第一福利网| 大桥未久在线播放| 国产精品美女诱惑| 国内综合精品午夜久久资源| 伊人影院在线观看视频| 亚洲精品国产高清久久伦理二区| 日韩三级免费看| 亚洲精品在线一区二区| 欧美xxxx视频| 国产精品国模大尺度私拍| 国产精品第十页| 欧美日韩人妻精品一区在线| 亚洲成人免费在线观看| 色噜噜在线播放| 国产91对白在线播放| 国产精品成人3p一区二区三区| 久久久久久国产精品mv| 99国产精品久久久久久久| 福利视频999| 亚洲欧美激情视频在线观看一区二区三区| 国产精品乱子伦| 亚洲人成电影网站色| 黄色欧美视频| 蜜臀av性久久久久蜜臀av| 国产精品影视在线| 福利一区二区三区四区| 日韩激情视频在线播放| 台湾成人免费视频| 亚洲永久一区二区三区在线| 亚洲少妇诱惑| 欧美另类z0zx974| 欧美军同video69gay| 国产裸舞福利在线视频合集| 国产精品精品视频| 久久久人成影片免费观看| 日本人dh亚洲人ⅹxx| 欧美日韩中文字幕| 亚洲欧美视频一区二区| www 成人av com| 久久福利影视| 免费成人深夜蜜桃视频| 在线区一区二视频| 蜜桃视频网站在线观看| 国产不卡一区二区三区在线观看| 久久精品亚洲人成影院 | 美女精品在线观看| 色偷偷男人天堂| 精品福利av导航| 99久久er| 国产高清av在线播放| 成人网在线播放| 成人免费一级片| 欧美高清在线视频观看不卡| 青青视频一区二区| 久久精品一卡二卡| 精品美女国产在线| 黄色免费在线网站| 欧美成人第一区| 国产精品一区在线观看你懂的| 免费人成年激情视频在线观看| 日韩欧美中文一区| 日韩网站中文字幕| 欧美午夜性视频| 自拍偷拍国产亚洲|