精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比OCR更強大的PPT圖片一鍵轉文檔重建技術

開發 開發工具
本文介紹了 QQ 研發中心自研的 PPT 重建技術,目前騰訊文檔在進行接入工作。當前主流辦公產品比如 office,wps,騰訊文檔會采用 AI 技術對圖片進行排版恢復還原為 doc 形式的文檔。通常針對以文字偏多,格式簡單的圖像效果比較好。

 本文介紹了 QQ 研發中心自研的 PPT 重建技術,目前騰訊文檔在進行接入工作。當前主流辦公產品比如 office,wps,騰訊文檔會采用 AI 技術對圖片進行排版恢復還原為 doc 形式的文檔。通常針對以文字偏多,格式簡單的圖像效果比較好。如果內容豐富,圖片并茂的內容圖像在轉為 doc 文檔時,由于圖像比例,文檔排版插入,對豐富背景還原度差等問題導致很多 ppt 形式的圖片無法很好還原為電子文檔。

目前越來越多的資源信息是以圖像形式存儲,然而很多用戶在獲取圖像后需要對圖片進行編輯或者電子文檔形式進行存儲。最主流的做法是直接進行 OCR 提取,但這種方法無法滿足用戶對排版的需求。當前主流辦公產品比如 office,wps,騰訊文檔等會采用一些技術對圖片進行排版恢復還原為 doc 形式的文檔,通常針對以文字偏多,格式簡單的圖像效果比較好,但如果內容豐富,圖片并茂的 ppt 內容圖像在轉為 doc 文檔時由于圖像比例,文檔排版插入限制以及文檔適應背景單一而豐富背景還原度差等問題會導致很多 ppt 形式的圖片無法很好還原為電子文檔。

QQ 研發團隊團隊在前期已經推出了基于深度學習的文檔重建,表格重建的技術文章。產品也已經在騰迅文檔,PCQQ,手機 QQ 上線,近期我們又增加了 PPT 重建功能。小程序在搭建中,其中添加里更多子功能,比如 OCR,文檔自動選框,去摩爾紋,圖片扭曲恢復等。歡迎大家通過 QQ 小程序體驗。

 

 

 

 

下面主要給大家介紹 PPT 的重建技術,產品流程如圖 1 所示,效果圖如圖 2 所示:

 

 

 

 

圖1 圖片轉PPT 產品流程

 

 

 

 

圖2 圖片轉PPT (左:原圖 右:PPT )

一、圖片轉 ppt 框架

項目的技術流程主要分為三大模塊:

預處理:包括文檔檢測和矯正,圖片去摩爾紋,文檔扭曲恢復,文檔旋轉,語義分割等,主要深度學習,模型部署在 GPU。

排版分析:對各實體的恢復,以及排版處理,邏輯流程部署在 CPU。

后處理: 生成導出 PPT 文件

圖3 項目技術模塊

下面給大家一一介紹我們主要模塊用到的技術細節。

二、AI 模塊

2.1 自動框選

用戶拍攝圖片一般不會是工整圖片,所以在進行提取前還需要做很多的預處理工作,其中最重要的一個模塊就是先框選出真正我們需要轉換的 PPT/文檔內容。

圖4 自動框選效果

對內容的框選現有很多技術,比如圖像處理的邊緣提取,但是效果不好需要特別多的后處理,隨著 AI 的發展,也有一些深度學習的方法對邊緣進行提取,比如 HED 網絡。前期同事也基于 hed 進行了模型訓練得到了不錯的檢測效果。使用的框架圖如下圖:

其中 Decoder1 分支的簡易圖如下:

經過 HED 處理后在工程的后處理還是需要很多規則判斷,特別在候選框選取時添加過多規則,如下圖。所以我們需要進一步對模型進行優化減免后處理的繁雜工作以及優化框選準確性。

圖5 框選后處理

通過 case 分析,我們預測的選框通常會多出背景區域,如果通過語義分析知道大致的文檔內容區域,再通過邊緣線條檢測準確的邊框信息,融合信息是否能得到更精確的選框。

所以在原有基礎上增加了一個分割分支,多任務學習,在 decoder 模塊分出兩個分支,一個分支學習圖像的邊緣信息,一個分支學習圖像的語義信息,如下圖所示。

 

圖6 多任務邊緣檢測網絡

 

圖7 網絡示意圖

兩個分支的 encoder 部分卷積層權重共享。

在邊緣檢測分支,我們還是分為多個 block 計算 loss,并通過 se 模塊融合分支。對于邊緣檢測,我們更多想得到全局信息,所以引入了 SEblock,如下圖,在 featrueMap 上做了一次 attention。


圖8 SEBlock

在語義分割分支,我們采用通過的 Unet 結構。最終加權兩個分支的 loss 進行訓練。

在訓練過程中,我們的數據來源于仿真和真實數據的標注,另一部分來源于半監督方式通過檢測分支的結果獲取到文檔內容從而得到分割 mask。在 infer 過程中,檢測分支獲取得到所有可能組成的四邊形,和分割分支的結果計算 Miou,選擇 miou 最大的檢測框作為最終框選對象。

圖9 檢測結合分割獲取最佳選框

通過對比可以發現,語義分割分支可以得到更精準的檢測框。

圖10 優化前后對比圖

通過驗證集驗證,hed 驗證集 miou=88.38,多任務網絡 miou=90.63,多任務訓練的方式 miou 可以提升 2 個點。

2.2 圖像矯正

檢測到 PPT 文檔內容后,我們還需要對圖像質量進行提升后再進行后續處理,希望轉換后的文件還原度更高。針對圖片矯正我們主要做了,去摩爾紋,文檔旋轉矯正和扭曲恢復。

2.2.1 去摩爾紋

對于屏幕拍攝圖片,摩爾紋很影響我們后續處理的圖像質量,所以檢測到圖片后我們首先通過小的分類模型判斷是否需要對摩爾紋進行處理,如果屬于屏幕拍攝場景會調用去摩爾紋模塊。

去除摩爾紋的網絡框架和效果圖如下:

圖11 去摩爾紋網絡

圖12 去摩爾紋效果(左:帶摩爾紋圖片 中:原圖 右:去摩爾紋效果)

2.2.2 扭曲恢復

檢測出四邊形后,通過投影變換可以對圖片進行一步矯正,但是對于扭曲圖像,僅僅通過圖像處理是不夠的,我們通過扭曲恢復模型,對圖片扭曲恢復。這一步驟對于紙質的 PPT 拍攝以及文檔拍攝圖片比較重要。

扭曲恢復的網絡框架和效果圖:

圖13 扭曲恢復效果

扭曲網絡借鑒了 Document Image Unwarping via A Stacked U-Net 論文思路,近期也做了比較大的優化,主要通過將曲線擬合算法結合到網絡結構解決了扭曲恢復后的文字在空間上存在細微抖動的問題,后續我們也會公開這塊的技術細節。

2.2.3 文本旋轉

OCR 也是我們重建的一個重要模塊,除了能夠提取圖片中的文字信息,還有一個作用是可以通過文本檢測框獲取到圖片中文本的旋轉角度。但是目前 OCR 對于角度的預測在-45---45 角度之間比較準確,對于 90 度,180 度的旋轉圖片,預判角度不太準確。

我們采用的方案是首先通過小的分類模型預測圖片的象限方向,分類類別為[0,90,180,270]。先把圖片旋轉到-45~45 之間。再通過 OCR 預測角度講圖片旋轉到 0 度。效果如下圖:

 

圖14 綜合分類模型和OCR 模型旋轉圖片

左圖為原圖,中圖為判斷需要旋轉 180 度,右圖為通過 OCR 預測角度旋轉后圖片。

2.3 實體提取

通過以上步驟,我們可以獲取到比較干凈工整的 PPT 內容圖片,這一步我們要通過語義分割,檢測到圖片的實體部分,方面后續生成 PPT。本模塊在圖片轉 word 和圖片轉 excel 中都需要的模塊。

對于 PPT 圖片,我們主要分割的類別為文本,圖片,表格,背景。下圖為標注的語義分割類別示意圖。

圖15 語義分割示意圖

對于主流框架和基礎網絡,我們使用 PPT 的分割數據做了一些實驗對比

圖15 語義分割主流框架實驗對比

從基礎網絡上看,shufflenet 速度更快,resnet 效果更好。網絡結構上從性能上分析 bisenet 性價比更好。

我們在項目中使用的是 Bisenet 框架,在學習特征時并行兩條支路,一條學習空間細節信息,一條支路學習高層語義信息,然后將學到的信息融合,能夠更好學習到全局信息和局部信息特征信息。

圖16 BiseNet網絡

2.4 實體恢復

在上一步我們已經知道圖片中哪塊區域是文本,圖片,表格,但是直接插入到 PPT 中會存在很多問題,比如圖片中還嵌有文本的處理,文本框直接插入的背景問題等。我們重要介紹文字和背景的恢復。

2.4.1 文本恢復

通過實體分割文本段以及 OCR 提取后,可以獲取到文本框信息。如圖 17,左圖為原圖,右圖紅框為我們獲取到的文本區域,但是無法直接獲取到字體顏色。

圖17 OCR框選文本框

得到文本框后,字體顏色恢復步驟為:

  • 截取文本框區域,如圖 18(a)
  • 對文本框區域自適應二值化得到前景背景,如圖 18(b)
  • 前景顏色區域計算均值得到前景和背景顏色值,如圖 18(b)上前景像素區域對應的 a 點像素值 rgb 計算均值,設置為字體顏色。
  • 圖 18(a)的文本塊區域,背景顏色為 RGB([73.,192.,179]);前景顏色 RGB ( [207, 255,255])
  • 圖 18(c)的文本塊區域,背景顏色為 RGB([229,250,245]);前景顏色 RGB ( [78,156,149])

 

圖18 獲取文本框前景

得到了字體大小和顏色恢復,結合之前的背景重建,我們可以得到最終的還原效果,字體幾乎完全還原,如圖 19 所示:

 

圖19 字體還原效果

2.4.2 背景恢復

通過語義分割模型后,我們可以獲取到前景所有實體,和剩下的背景區域。通過實體抽取直接在畫布上進行插入,效果如圖 20。

圖20 未對背景做處理插入效果

直接插入效果可以看出,在文本區域塊和周圍其他背景顏色差別太多,過度顯得特別突兀,而且如果插入文本框顏色和文字顏色一致會導致文本看不清。所以我們需要通過 inpainting 算法,對背景進行重建。重建背景,圖片,文字,表格,包括圖片上的文字后就可以生成 PPT 了。

2.5 生成 PPT

通過以上步驟我們得到了各個實體模塊,并且對每個模塊進行了恢復重建。通過語義分割模塊,可以獲取到各實體(表格,圖片,文本,背景)的相對坐標位置。通過重建模塊,可以獲取:

  • 表格:表格的樣式,行列數,單元格內文字內容
  • 圖片:圖片抹除文字區域后,通過 impainting 重建圖片內容
  • 文本:文本區域的字體顏色,字體大小
  • 背景:抹除前景區域后,通過 inpainting 重建背景內容

最后可以按照 office open xml 的格式在畫布上依次插入背景,表格,圖片,文字實體,得到最終的可編輯.ppt 格式。騰訊文檔通過 http 請求獲取到.ppt 格式文件后再轉化為騰訊文檔在線電子文檔形式展示。

 

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2021-07-21 08:59:10

requestsPython協程

2024-10-08 09:10:03

JDK通信并發

2012-11-09 10:16:22

ARM低功耗Intel

2022-01-24 16:17:26

htop工具Linux

2019-10-11 11:00:53

Nginx神器前端

2017-03-23 13:07:00

小程序DCloud

2020-04-23 18:30:25

AI人工智能芯片

2021-02-25 17:21:57

微軟Word 文檔PowerPoint

2023-08-21 12:10:08

算法AI

2015-02-09 15:25:52

換膚

2021-08-31 23:33:50

AndroidiOS功能

2023-03-30 11:08:49

AI模型訓練

2023-09-01 14:07:00

ChatGPTGPT數據分析

2023-05-07 07:45:31

2024-04-19 13:37:30

Rust開發編輯器

2024-04-08 14:07:51

Animagine開源

2021-05-25 09:10:54

工具代碼開發

2021-07-15 16:58:45

數據庫RDS Postgre阿里云

2015-07-30 11:13:24

LinuxShell

2025-02-11 07:42:50

DeepSeekPPT學術
點贊
收藏

51CTO技術棧公眾號

欧美国产精品专区| 99re6这里只有精品| 偷拍日韩校园综合在线| 久久天堂国产精品| 中文字幕 欧美激情| 91影院成人| 精品成人一区二区三区四区| 色欲av无码一区二区人妻| 成人精品一区二区| 国产精选一区二区三区| 97视频在线免费观看| 欧美三级视频网站| 一区二区三区四区视频免费观看| 色综合久久综合网| 色哟哟免费网站| 日漫免费在线观看网站| 精品一区二区免费在线观看| 91国产美女在线观看| 国产又粗又硬视频| 国产在线播放精品| 在线播放日韩导航| 日本精品www| 免费看电影在线| 中文字幕欧美日韩一区| 国产有色视频色综合| 97精品人妻一区二区三区在线| 国产精品社区| 欧美日韩国产成人高清视频| 美国黄色特级片| 亚洲婷婷伊人| 精品国产一二三| 亚洲欧美日本一区二区| 色综合一本到久久亚洲91| 亚洲国产欧美日韩另类综合| 香蕉视频在线网址| 二区在线视频| 久久美女艺术照精彩视频福利播放| 亚洲最大的免费| 亚洲视频一区在线播放| 香蕉精品999视频一区二区| 久久91精品国产91久久跳| 国产成人精品视频免费| 精品久久一区| 亚洲天堂av网| 中文字幕丰满孑伦无码专区| 国内精品偷拍| 精品免费国产一区二区三区四区| 五月天国产视频| 免费视频观看成人| 欧美性生交片4| 亚洲 中文字幕 日韩 无码| 中文字幕乱码在线播放| 精品久久久久久久久久久| 人妻无码久久一区二区三区免费| 超碰在线网址| 亚洲精选一二三| 色爽爽爽爽爽爽爽爽| 永久免费av在线| 中文字幕日本一区| 怡红院男人的天堂| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 精品综合久久久久久97| 一区二区三区日韩| 成人污污视频在线观看| 中文字幕在线1| 国产精品久久久久av免费| 一区二区在线观看视频在线观看| 99热在线成人| 成人午夜在线影视| 国产一级久久| 欧美一级淫片丝袜脚交| www.99re7.com| 污污视频网站在线| www日韩在线观看| 天堂av在线免费观看| 99久久777色| 国产日韩精品推荐| 香蕉视频黄色片| 91麻豆蜜桃一区二区三区| 精品在线一区| 国产精品二线| 国产精品美女久久久久久久网站| 一级二级三级欧美| 最爽无遮挡行房视频在线| 亚洲一区在线播放| 久久久999视频| 成人亚洲免费| 欧美刺激午夜性久久久久久久| av免费观看不卡| 国产成人调教视频在线观看| 日韩在线免费视频观看| 久久久久久激情| 欧美亚洲三级| 成人激情春色网| 亚洲欧美另类一区| 国产亚洲成av人在线观看导航| 亚洲在线视频一区二区| 成人影音在线| 欧美在线一区二区三区| 国产sm在线观看| 美日韩中文字幕| 欧美精品少妇videofree| 国产精品21p| 国产麻豆精品一区二区| 欧美日韩在线观看一区| 性爱视频在线播放| 欧美视频一区二区在线观看| 男人添女人荫蒂国产| 狠狠做六月爱婷婷综合aⅴ| 欧美国产日韩一区| 中文av免费观看| gogo大胆日本视频一区| 中文字幕一区综合| 户外露出一区二区三区| 欧美精品一区二区三区在线播放| 一级黄色录像毛片| av成人毛片| 欧美最猛性xxxxx免费| av免费观看在线| 国产色婷婷亚洲99精品小说| 国产精品www在线观看| 亚洲成人激情社区| 亚洲成人av在线| 成人免费精品动漫网站| 久久婷婷亚洲| 国产一区二区免费在线观看| 网友自拍视频在线| 色狠狠色狠狠综合| 亚洲欧美在线不卡| 欧美区亚洲区| 91九色综合久久| 成人免费一区二区三区视频网站| 亚洲国产视频一区| 日本网站在线看| 99久久精品费精品国产| 国产精品igao视频| 五月天婷婷在线播放| 亚洲一区二区三区爽爽爽爽爽 | 一区二区三区 欧美| 欧洲在线一区| 98精品在线视频| 免费观看的毛片| 一区二区三区**美女毛片| 亚洲黄色av网址| 亚洲精品国产精品粉嫩| 91av视频导航| 色视频在线看| 一本色道a无线码一区v| 久久亚洲AV成人无码国产野外 | 国产精品久久午夜夜伦鲁鲁| 日本成人中文字幕在线| 亚洲精品456| 欧美综合第一页| 国产中文字幕在线| 在线视频你懂得一区二区三区| 中文幕无线码中文字蜜桃| 免费一区视频| 三级三级久久三级久久18| 123成人网| 色噜噜狠狠狠综合曰曰曰| 国产一区二区在线视频观看| 国产精品盗摄一区二区三区| 拔插拔插华人永久免费| 伊人色**天天综合婷婷| 99re视频在线播放| 9999精品成人免费毛片在线看| 亚洲电影在线观看| 国产又黄又猛又粗又爽| 国产欧美日韩另类一区| 国产色视频在线播放| 亚洲成人日韩| 国产在线视频欧美一区二区三区| 不卡一二三区| 少妇av一区二区三区| 99在线观看精品视频| 亚洲不卡av一区二区三区| 国产ts丝袜人妖系列视频| 久久免费高清| 中文字幕乱码免费| 嫩草国产精品入口| 国产精品最新在线观看| 日本在线视频网址| 亚洲美女性视频| 97精品人妻一区二区三区香蕉| 亚洲国产婷婷综合在线精品| 90岁老太婆乱淫| 国内精品自线一区二区三区视频| 日韩xxxx视频| 日韩欧美伦理| 国产免费一区| 色成人综合网| 26uuu另类亚洲欧美日本一| 成人77777| 日韩欧美第一区| 久久精品五月天| 伊人婷婷欧美激情| 日本成人免费视频| 国产成人综合自拍| 亚欧在线免费观看| 精品9999| 亚洲午夜在线观看| 老牛影视av一区二区在线观看| 国产精品福利在线观看| 丰乳肥臀在线| 中文字幕亚洲综合久久| 夜夜嗨一区二区| 欧美日韩一区视频| 91香蕉一区二区三区在线观看| 不卡av在线免费观看| 男人的天堂最新网址| 亚洲在线电影| 免费cad大片在线观看| 国产乱码精品一区二区三区四区| av日韩免费电影| 国产精品亚洲成在人线| 午夜精品美女自拍福到在线| 日本高清视频在线观看| 亚洲精品午夜精品| 亚洲精品综合网| 欧美精品99久久久**| 无码人妻久久一区二区三区不卡| 亚洲一区二区三区美女| 成人在线观看高清| 欧美国产乱子伦| 91精品人妻一区二区三区蜜桃欧美| 国产精品99久久久久久宅男| 国产一级做a爰片久久| 国产日韩精品视频一区二区三区| 国产在线拍揄自揄拍无码| 日韩免费久久| 日韩一区国产在线观看| 久久不见久久见中文字幕免费| 国产无套精品一区二区| 136福利精品导航| 亚洲影影院av| 韩国精品视频在线观看| 日韩美女免费观看| 国产精品一区二区av影院萌芽| 高清欧美性猛交xxxx黑人猛交| 性欧美ⅴideo另类hd| 欧美日韩成人免费| av在线app| 美女黄色丝袜一区| 自拍亚洲图区| 不卡av日日日| 少女频道在线观看高清| 欧美日韩国产成人在线| 午夜影院免费在线| 欧美精品成人91久久久久久久| 在线看女人毛片| 欧美激情videoshd| 超碰在线中文字幕| 91精品国产91久久久久久最新| 98色花堂精品视频在线观看| 91产国在线观看动作片喷水| 中文字幕色婷婷在线视频| 国产成人在线精品| av成人亚洲| 91色p视频在线| 日韩中文字幕一区二区高清99| 成人女人免费毛片| 国产精品极品| 欧美乱偷一区二区三区在线| 欧美天天综合| 熟女视频一区二区三区| 欧美激情自拍| 亚洲熟妇av一区二区三区漫画| 鲁大师成人一区二区三区| www.日本xxxx| 国产曰批免费观看久久久| 男人的天堂免费| 99精品1区2区| a级黄色免费视频| 一区二区三区在线播放| 日韩av一二三区| 一本色道久久综合狠狠躁的推荐 | 欧美三区视频| youjizz.com在线观看| 在线亚洲精品| 中文字幕 91| 国产不卡视频一区| 欧美狂猛xxxxx乱大交3| 中文字幕亚洲精品在线观看| 久久国产在线视频| 色爱区综合激月婷婷| 中文字字幕在线观看| 日韩一区二区三区视频在线| 色综合888| 久热精品视频在线| 涩涩av在线| 91香蕉电影院| 免费av一区| 4444亚洲人成无码网在线观看| 亚洲一区日韩| 97超碰人人爽| 99re在线精品| 国产美女福利视频| 色婷婷av久久久久久久| 精品人妻一区二区三区换脸明星 | 91久久精品美女高潮| 欧美五码在线| 美女在线免费视频| 日韩精品成人一区二区三区| 日本人妻一区二区三区| 中文字幕免费不卡在线| 日本三级2019| 欧美精品在线视频| 日韩三级电影网| 欧美寡妇偷汉性猛交| 99re久久| 久久综合福利| 欧美久久99| 欧美在线aaa| 久久综合一区二区| 精品少妇一二三区| 5566中文字幕一区二区电影| 九色在线播放| 97视频在线观看网址| 日本一区二区乱| 亚洲在线播放电影| 视频一区二区中文字幕| 国产51自产区| 自拍偷拍国产精品| 亚洲一区二区色| 国产亚洲欧洲在线| 高清毛片在线观看| 91嫩草免费看| 亚洲破处大片| 欧美特黄aaa| 欧美国产乱子伦| 五月婷婷六月婷婷| 日韩电影中文字幕在线| 福利网站在线观看| 99久久精品免费看国产四区| 97精品中文字幕| 三级视频中文字幕| 日本一区二区高清| 怡红院av久久久久久久| 亚洲精品一二区| 性国裸体高清亚洲| 久久久久久国产精品mv| 亚洲精选91| av在线播放网址| 天天综合网天天综合色| 天天操天天干天天插| 国语自产精品视频在线看| 成人在线视频你懂的| www污在线观看| av男人天堂一区| 日韩免费一级片| 亚洲乱码av中文一区二区| 在线看片福利| 欧美日韩成人一区二区三区| 日韩激情视频网站| 夫妇交换中文字幕| 欧美色爱综合网| 欧美性天天影视| 444亚洲人体| 国产精品成人一区二区网站软件| 丰满人妻一区二区三区大胸| 一区二区三区不卡在线观看 | 国产一区二区三区免费| 成人免费毛片xxx| 精品卡一卡二卡三卡四在线| h片精品在线观看| 蜜桃999成人看片在线观看| 久久中文欧美| 夫妻性生活毛片| 亚洲精品在线电影| 91精品论坛| 亚洲亚洲精品三区日韩精品在线视频| 国产美女av一区二区三区| 国产在线免费视频| 亚洲欧美成人精品| 欧美一区二区三区婷婷| 4444在线观看| 99v久久综合狠狠综合久久| 中文字幕日本视频| 欧美精品在线免费播放| 久久久精品国产**网站| 激情视频综合网| 亚洲人成小说网站色在线| 欧美 日韩 国产 精品| 国产97在线视频| 亚洲国产精品成人| 亚洲国产果冻传媒av在线观看| 欧美亚洲一区三区| 欧美性受ⅹ╳╳╳黑人a性爽| 美脚丝袜一区二区三区在线观看| 老色鬼精品视频在线观看播放| 免费一级片在线观看| 亚洲人成电影在线| 午夜免费欧美电影| 91在线视频观看免费| 一区二区三区四区乱视频| 黄色在线免费观看大全| 亚洲一区二区三区成人在线视频精品| 亚洲深夜av| 亚洲色婷婷一区二区三区| 亚洲老司机av|