精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不做文盲畫家!谷歌魔改「文本編碼器」:一個小操作讓圖像生成模型學會「拼寫」

人工智能 新聞
圖像生成模型終于學會了拼寫單詞,秘訣竟是字符特征?

過去的一年里,隨著DALL-E 2,Stable Diffusion等圖像生成模型的發布,text-to-image模型生成的圖像在分辨率、質量、文本忠實度等方面都得到了飛躍性提升,極大促進了下游應用場景的開發,人人都成了AI畫家。

但相關研究表明,目前的生成模型技術仍然存在一個重大缺陷:無法在圖像中呈現出可靠的視覺文本。

有研究結果表明,DALL-E 2在圖片中生成連貫文本字符上非常不穩定,而最新發布的Stable Diffusion模型則是直接將「無法呈現可讀的文本」列為已知的限制。

圖片

字符拼寫錯誤:(1) California: All Dreams Welcome, (2) Canada: For Glowing Hearts, (3) Colorado: It’s Our Nature, (4) St. Louis: All Within Reach.

最近Google Research發布了一篇新論文,試圖了解并提高圖像生成模型渲染高質量視覺文本的能力。

圖片

論文鏈接:https://arxiv.org/abs/2212.10562

研究人員認為當下的text-to-image生成模型模型存在文本渲染缺陷的主要原因是缺乏字符級的輸入特征。

為了量化該輸入特征在模型生成中的影響,文章中設計了一系列控制實驗對是否包含文本輸入特征的文本編碼器(character-aware和character-blind)進行對比。

研究人員發現,在純文本領域,character-aware模型在一個新的拼寫任務(WikiSpell)上獲得了很大的性能收益。

將該經驗遷移到視覺領域后,研究人員訓練了一套圖像生成模型。實驗結果表明character-aware模型在一系列新的文本渲染任務(DrawText基準)中比character-blind更勝一籌。

并且character-aware模型在視覺拼寫方面達到了更高的技術水平,盡管訓練的樣例數量少得多,其在不常見的單詞上的準確率仍然比競爭模型高出30多個百分點。

Character-Aware模型

語言模型可分為直接訪問構成其文本輸入字符的character-aware模型和無法訪問的character-blind模型。

許多早期的神經語言模型直接在字符上進行操作,而不使用多字符的token作為標記。

后來的模型逐漸轉向基于詞匯表的tokenization,其中一些模型如ELMo仍然保留了character-aware,但其他模型如BERT則放棄了字符特征以支持更有效的預訓練。

目前,大多數廣泛使用的語言模型是character-blind的,依靠數據驅動的子詞(subword)分割算法,如字節對編碼(BPE)來生成子詞pieces作為詞匯表。

雖然這些方法對于不常見的序列可以退回到字符級表示,但它們在設計上仍然會將常見的字符序列壓縮成不可分割的單元。

這篇論文的主要目的是試圖了解并提高圖像生成模型渲染高質量視覺文本的能力。

為此,研究人員首先孤立地研究了當下文本編碼器的拼寫能力,從實驗結果可以發現,盡管character-blind文本編碼器很受歡迎,但它們沒有收到關于其輸入的字符級構成的直接信號,導致其拼寫能力有限。

圖片

研究人員還測試了不同規模、架構、輸入表示、語言和調整方法的文本編碼器的拼寫能力。

這篇論文首次記錄了character-blind模型通過網絡預訓練誘導出強大的拼寫知識(準確率>99%)的神奇能力,但實驗結果表明這項能力在英語之外的語言中并沒有得到很好的泛化,而且只有在超過100B參數的規模下才能實現,所以對于大多數應用場景是不可行的。

另一方面,character-aware的文本編碼器能夠在更小的尺度上實現強大的拼寫能力。

在將這些發現應用于圖像生成場景時,研究人員訓練了一系列character-aware的文本到圖像的模型,并證明它們在現有的和新的文本渲染的評估中明顯優于字符盲目的模型。

但對于純字符級模型來說,雖然文本渲染的性能提升了,但對于不涉及視覺文本的prompt,圖像-文本對齊度則會下降。

為了緩解這一問題,研究人員建議將字符級和token級的輸入表征結合起來,從而可以實現最佳的性能。

WikiSpell基準

由于文本到圖像的生成模型依賴于文本編碼器來產生用于解碼的表征,研究人員首先從Wiktionary中采樣一些單詞創建了WikiSpell基準,然后基于此數據集在一個純文本的拼寫評估任務來探索文本編碼器的能力。


圖片

對于WikiSpell中的每個樣例,模型的輸入是一個單詞,預期的輸出是它的具體拼寫(通過在每個Unicode字符之間插入空格來生成)。

圖片

由于該文章僅對研究一個詞的頻率和模型的拼寫能力之間的關系感興趣,所以研究人員根據單詞在mC4語料庫中出現的頻率,將Wiktionary中的詞分成五個互不重疊的桶:最頻繁的前1%的詞,最頻繁的1-10%的詞,10-20%的詞,20-30%的詞,以及最低的50%的詞(包括在語料庫中從未出現過的詞)。

然后從每個桶中均勻地抽取1000個詞來創建一個測試集(以及一個類似的開發集)。

最后通過結合兩部分建立了一個由10,000個詞組成的訓練集:5,000個從最底層的50%桶(最不常見的詞)中統一取樣,另外5,000個根據它們在mC4中的頻率按比例取樣(從而使這一半的訓練集偏向頻繁的詞)。

研究人員將任何被選入開發集或測試集的詞排除在訓練集之外,因此評估結果總是針對被排除的詞。

除了英語外,研究人員還對其他六種語言(阿拉伯語、漢語、芬蘭語、韓語、俄語、泰語)進行評估,選擇這些語言是為了涵蓋影響模型學習拼寫能力的各種特性,對每一種語言的評估都重復上述數據集構建過程。

文本生成實驗

研究人員使用WikiSpell基準來評估多種預訓練的純文本模型在不同規模上的表現,包括T5(一個在英語數據上預訓練的character-blind編碼解碼器模型);mT5(與T5類似,但在超過100種語言上預訓練);ByT5(mT5的character-aware版本,直接在UTF-8字節序列上操作);以及PaLM(一個規模更大的解碼模型,主要是在英語上預訓練的)。

圖片

在純英語和多語言的實驗結果中,可以發現character-blind模型T5和mT5在包含Top-1%最頻繁詞匯的桶上的表現要差很多。

這個結果似乎是反直覺的,因為模型通常在數據中頻繁出現的例子上表現最好,但是由于subword詞匯的訓練方式,頻繁出現的詞通常被表示為一個單一的原子標記(或少量的標記),事實上也是如此:在英語前1%的桶中,87%的詞被T5的詞匯表示為一個子詞標記。

因此,較低的拼寫準確性分數表明,T5的編碼器沒有保留足夠的關于其詞匯中subword的拼寫信息。

其次,對于character-blind模型,規模是影響拼寫能力的一個重要因素。T5和mT5都隨著規模的增加而逐漸變好,但即使在XXL規模下,這些模型也沒有表現出特別強的拼寫能力。

只有當character-blind模型達到PaLM的規模時,才開始看到近乎完美的拼寫能力:540B參數的PaLM模型在英語的所有頻率桶中都達到了>99%的準確率,盡管它在提示中只看到20個例子(而T5顯示的是1000個微調例子)。

圖片

然而,PaLM在其他語言上的表現較差,可能是由于這些語言的預訓練數據少得多。

對ByT5的實驗表明,character-aware模型表現出更強大的拼寫能力。ByT5在Base和Large尺寸下的表現僅略微落后于XL和XXL(盡管仍然至少在90%的范圍內),而且一個詞的頻率似乎對ByT5的拼寫能力沒有太大影響。

ByT5的拼寫性能遠遠超過了(m)T5的結果,甚至與參數多于100倍的PaLM的英語表現相當,并且超過了PaLM在其他語言上的表現。

從而可知ByT5編碼器保留了相當多的字符級信息,而且這些信息可以根據解碼任務的需要從這些凍結的參數中檢索出來。

DrawText基準

從2014年發布的COCO數據集到2022年的DrawBench基準,從FID, CLIP得分到人類偏好等指標,如何評估text-to-image模型一直是一個重要的研究課題。

但目前在文本渲染和拼寫評估方面一直缺乏相關工作。

為此,研究人員提出了一個新的基準DrawText,旨在全面衡量文本到圖像模型的文本渲染質量。

DrawText基準由兩部分組成,分別測量模型能力的不同維度:

1)DrawText Spell,通過大量的英語單詞集合的普通單詞渲染進行評估;

研究人員從英語WikiSpell頻率桶中各抽取100個單詞,并將它們插入一個標準模板中,總共構建了500個提示。

對于每個prompt,從候選模型中抽取4張圖片,并使用人類評分和基于光學字符識別(OCR)的指標對其進行評估。

2)DrawText Creative,通過視覺效果的文本渲染進行評估。

視覺文本并不局限于像街道標志那樣的常見場景,文字可以以多種形式出現,如潦草的、繪畫的、雕刻的、雕塑的,等等。

如果圖像生成模型支持靈活而準確的文本渲染,這將使設計師能夠使用這些模型來開發創造性的字體、標志、布局等等。

為了測試圖像生成模型支持這些用例的能力,研究人員與一位專業的圖形設計師合作,構建了175個不同的提示,要求在一系列創造性的風格和設置中渲染文本。

圖片

許多提示超出了當前模型的能力,最先進的模型會表現出拼寫錯誤、丟棄或重復的單詞。

圖像生成實驗

實驗結果顯示,用于對比的9個圖像生成模型中在DrawText Spell基準上的準確率中,character-aware模型(ByT5和Concat)無論模型尺寸大小都優于其他模型,特別是在不常見單詞上。

圖片

Imagen-AR顯示了避免cropping的好處,盡管訓練時間長了6.6倍,其仍然比字character-aware模型表現差。

模型之間的另一個明顯的區別在于它們是否在多個樣本中持續地拼錯一個給定的單詞。

圖片

在實驗結果中可以看出,無論抽取多少個樣本,T5模型都有很多單詞拼錯,研究人員認為這表明文本編碼器中缺少字符知識。

相比之下,ByT5模型基本只會出現零星的錯誤。

圖片

通過測量模型在所有四個圖像樣本中持續正確(4/4)或持續錯誤(0/4)的比率可以量化這一觀察結果。

圖片

可以看到一個鮮明的對比,特別是在常見的詞上(前1%),即ByT5模型從未持續錯誤,而T5模型在10%或更多的詞上持續錯誤。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-04-10 06:30:00

2021-12-17 10:09:47

編碼器語言模型DeepMind

2017-11-10 12:45:16

TensorFlowPython神經網絡

2025-04-07 03:30:00

2023-04-25 21:36:07

火山引擎

2012-06-11 16:43:46

jQuery

2025-07-11 09:02:00

2024-06-03 10:56:53

2022-07-28 12:18:40

視覺語言模型

2025-04-08 04:20:00

2024-10-16 10:41:36

2021-12-13 17:53:19

谷歌Transformer技術

2025-04-11 00:16:00

模態編碼器MAECLIP

2022-03-07 09:47:28

信息檢索編碼器

2021-03-22 10:52:13

人工智能深度學習自編碼器

2021-03-29 11:37:50

人工智能深度學習

2021-11-02 20:44:47

數字化

2025-10-13 08:14:48

2023-01-05 13:11:20

模型
點贊
收藏

51CTO技術棧公眾號

日本黄色a视频| 国产精品入口免费视| 无码国产精品一区二区免费式直播 | 免费成人av网站| 国产一级精品毛片| 欧美日本一区二区高清播放视频| 日韩国产精品一区| 亚洲天堂国产视频| 亚洲欧美一区二区三区| 中文字幕一区二区三区乱码在线| 国产精品一区二区av| 日本成人一级片| 亚洲小说欧美另类婷婷| 一区三区二区视频| 超碰caoprom| 青娱乐极品盛宴一区二区| 亚洲成精国产精品女| 亚洲国产午夜伦理片大全在线观看网站| 国产黄色一区二区| 免费成人av在线播放| 欧美激情在线视频二区| 欧美另类69xxxx| 日韩aaa久久蜜桃av| 欧美一区二区三区免费大片 | 成年人av电影| 国产一区二区区别| 亚洲第一精品福利| 国产精品二区视频| 成人影院网站ww555久久精品| 色综合视频在线观看| 亚洲理论电影在线观看| 黄色av网站在线播放| 久久久www成人免费无遮挡大片| 国产精品永久入口久久久| 国产精品伦理一区| 免费在线一区观看| 欧美在线激情视频| 日韩精品国产一区二区| 国产在线欧美| 久久成年人视频| 国产精品一区二区亚洲| 国产a久久精品一区二区三区| 亚洲成人精品久久久| 又大又长粗又爽又黄少妇视频| 日韩午夜视频在线| 欧美日韩一区小说| 亚洲 欧美 另类人妖| 日韩精品99| 色婷婷久久99综合精品jk白丝| 国产成人在线免费看| 手机在线免费观看av| 夜夜嗨av一区二区三区网页| 妞干网这里只有精品| 快射视频在线观看| 亚洲日本乱码在线观看| 欧美日韩亚洲国产成人| 黄黄的网站在线观看| 亚洲男人的天堂av| 蜜桃网站在线观看| 成年网站在线视频网站| 亚洲妇女屁股眼交7| 日韩五码在线观看| 男人av在线播放| 欧美性猛交xxxx乱大交| 久草资源站在线观看| 人人鲁人人莫人人爱精品| 色婷婷亚洲精品| 欧美成人福利在线观看| 国产精品18| 精品国产乱码久久久久久老虎| 国产十八熟妇av成人一区| 美日韩黄色大片| 亚洲欧洲黄色网| 国产精品麻豆免费版现看视频| 亚洲精品久久| 97精品在线视频| 无码人妻精品一区二区三区蜜桃91| 久久精品综合| 成人在线播放av| 亚洲第一天堂在线观看| 26uuu亚洲综合色欧美| 欧美在线视频二区| 黄色的网站在线观看| 亚洲二区视频在线| 99视频精品免费| 999精品视频在线观看| 精品国产a毛片| 国产sm调教视频| 国产精品传媒精东影业在线| 久久久亚洲影院| av一级在线观看| 国产一区二区福利视频| 精品综合久久| 午夜在线视频| 午夜精品久久久久| 午夜剧场在线免费观看| 成人av地址| 在线视频国产日韩| 久久一二三四区| 蜜臀av一级做a爰片久久| 99porn视频在线| 国产免费av在线| 亚洲一区视频在线| 精品亚洲一区二区三区四区| 国产精品18hdxxxⅹ在线| 影音先锋欧美精品| 亚洲精品77777| 激情综合五月婷婷| 日韩国产美国| 免费在线小视频| 日韩精品最新网址| 婷婷国产成人精品视频| 性欧美videos另类喷潮| 成人免费视频网站入口| 永久免费av在线| 色呦呦国产精品| 国产a级黄色片| 综合亚洲视频| 成人久久一区二区| 国产精品久久一区二区三区不卡 | 天干夜夜爽爽日日日日| 国产99久久久久| 7777在线视频| 美女视频一区| 国产亚洲日本欧美韩国| 97久久久久久久| 成人动漫一区二区| 欧美高清中文字幕| 奇米一区二区| 久久不射电影网| 99国产精品99| 中文字幕综合网| 亚洲最大天堂网| 三级电影一区| 国产日韩综合一区二区性色av| 国产综合在线观看| 色美美综合视频| 国产精品亚洲无码| 天使萌一区二区三区免费观看| 国产一区二区自拍| √8天堂资源地址中文在线| 精品欧美久久久| 免费中文字幕视频| 成人做爰69片免费看网站| 日韩不卡一二区| 91蜜桃臀久久一区二区| 欧美激情亚洲精品| 欧美 日韩 国产 成人 在线 91| 亚洲免费电影在线| 色黄视频免费看| 欧美国产精品| 国产二区一区| 草草在线视频| 亚洲精品有码在线| 波多野结衣mp4| 国产精品另类一区| 伊人免费视频二| 真实国产乱子伦精品一区二区三区| 亚洲一区二区三区777| 四虎影院观看视频在线观看| 精品国产电影一区二区| 国产一级精品视频| 日本一区二区三区高清不卡| 午夜两性免费视频| 自产国语精品视频| 精品久久精品久久| 四虎成人在线| 超碰精品一区二区三区乱码| 精品美女www爽爽爽视频| 午夜精品久久久久久久久久久 | 最好看的中文字幕久久| 永久免费看片在线观看| 99精品国产在热久久| 欧美亚洲爱爱另类综合| 欧洲午夜精品| 97碰在线观看| 色影视在线观看| 精品乱人伦小说| 亚洲成人第一网站| 亚洲欧洲在线观看av| www.美色吧.com| 久久一区精品| 成人在线免费高清视频| 亚洲区小说区| 91热精品视频| 欧美aa在线| 久久艳片www.17c.com| 天堂8在线视频| 欧美妇女性影城| 亚洲黄色三级视频| 最新国产の精品合集bt伙计| 国产免费一区二区三区最新6| 青青草伊人久久| 无码人妻少妇伦在线电影| 黑人操亚洲人| 国产精品久久久久免费| 成人黄色免费网站| 性欧美激情精品| 日韩子在线观看| 精品一区二区电影| www.四虎在线观看| 欧美丝袜丝交足nylons| 亚洲精品视频在线观看免费视频| 国产精品久久久久久久裸模 | 97久久综合区小说区图片区| 国产成人精品免费久久久久| 亚洲综合图区| 在线电影中文日韩| 三级理论午夜在线观看| 欧美一区二区国产| 又骚又黄的视频| 一本色道**综合亚洲精品蜜桃冫| 五月婷婷一区二区| 国产精品乱子久久久久| 黄色aaa视频| 成人精品一区二区三区中文字幕| 九九九九九九九九| 奇米一区二区三区| 久久精品香蕉视频| 亚洲激情成人| 国产精品国产三级国产专区51| 日韩中文在线电影| 日韩电影天堂视频一区二区| 卡通动漫精品一区二区三区| av蓝导航精品导航| 国产日本亚洲| 成人黄色免费看| 精品三级在线| 国产精品综合久久久| 精品成人av| 国产成人91久久精品| 在线日韩影院| 欧美一级电影久久| 美女av在线免费看| 韩国三级日本三级少妇99| 在线播放免费av| 久久不射热爱视频精品| 中文字幕在线观看播放| 久久久999成人| 国产激情在线视频| 不卡av在线网站| 在线观看中文| 欧美黑人性视频| av免费不卡国产观看| 国内精品小视频| 九色porny丨入口在线| 91av免费观看91av精品在线| 久久青草伊人| 日本久久久久久久久| 成人直播视频| 国产精品女主播视频| 国产在视频一区二区三区吞精| 国产精品欧美一区二区三区奶水 | 国产日产久久高清欧美一区| 成人黄色免费观看| 亚洲精品免费在线视频| 亚洲精品影片| 精品一区二区国产| 国产成人三级| 在线播放 亚洲| 一区在线播放| 亚洲人成色77777| 蜜臀a∨国产成人精品| 一女二男3p波多野结衣| 国产精品小仙女| 日韩www视频| 久久久高清一区二区三区| 肉色超薄丝袜脚交69xx图片| 亚洲精品美腿丝袜| 欧美a∨亚洲欧美亚洲| 欧美综合一区二区| 国产日韩在线观看一区| 精品福利av导航| 青青草超碰在线| www国产精品com| 91在线三级| 国产成人精品在线播放| 久久视频免费| 六月婷婷久久| 午夜片欧美伦| 自慰无码一区二区三区| 精品一区二区三区在线播放| 久久久久无码国产精品一区李宗瑞| 91在线视频免费观看| 精品在线观看一区| 五月开心婷婷久久| 夜夜狠狠擅视频| 亚洲国产天堂网精品网站| jizz在线观看| 欧美韩国理论所午夜片917电影| 亚洲一区站长工具| 亚洲一区二区久久久久久| 要久久电视剧全集免费| 在线观看17c| 日韩激情一二三区| 国产麻豆剧传媒精品国产| 国产日产欧美一区| 天天操天天射天天爽| 欧美人牲a欧美精品| 神宫寺奈绪一区二区三区| 久久精品国产99国产精品澳门| 亚洲欧洲高清| 俄罗斯精品一区二区三区| 精品国产91久久久久久浪潮蜜月| 国产一区 在线播放| 久久国产成人午夜av影院| 国产麻豆天美果冻无码视频| 亚洲乱码日产精品bd| 在线免费一区二区| 日韩精品在线视频| 国产盗摄精品一区二区酒店| 国产日韩精品一区二区| 国产精品嫩草影院在线看| www.日本少妇| 国产一区欧美二区| av黄色在线免费观看| 欧美日韩国产一区二区| 精品人妻一区二区三区四区不卡 | 精品一区二区三区免费毛片| 午夜免费一区| 91丨九色丨蝌蚪| 国产亚洲成年网址在线观看| 青青操免费在线视频| 欧美本精品男人aⅴ天堂| av在线下载| 成人免费直播live| 色中色综合网| 91精品无人成人www| 国产欧美精品一区二区色综合朱莉 | 性xxxx18| 韩国欧美亚洲国产| 鲁大师精品99久久久| 2022中文字幕| 国产精品18久久久久| 欧美精品成人久久| 日韩视频一区二区三区在线播放| 国内精品久久久久久野外| 成人疯狂猛交xxx| 天天射综合网视频| 想看黄色一级片| 亚洲女同一区二区| 国产三级第一页| 欧美国产亚洲精品久久久8v| heyzo欧美激情| 青青青免费在线| 91视频精品在这里| 无码人妻一区二区三区线| 亚洲香蕉成视频在线观看| 日日夜夜天天综合| 亚洲成人a**址| 久久 天天综合| 午夜精品一区二区三区视频| 日韩一区二区三区电影| 怡红院在线播放| 国产专区一区二区三区| 久久国产精品久久久久久电车 | 中文字幕视频一区二区三区久| 中文字幕日本人妻久久久免费| 最新日韩中文字幕| 国产精品xnxxcom| 日本aa在线观看| 97se亚洲国产综合自在线不卡| 国产黄网在线观看| 日韩视频免费大全中文字幕| 国产精品成人3p一区二区三区| 日韩不卡视频一区二区| av男人天堂一区| 中文字幕手机在线视频| 日韩三级成人av网| 一区二区三区四区精品视频| 精品少妇在线视频| 国产欧美日韩中文久久| 一区二区日韩视频| 久久久久久久久久久久久久久久久久av| 国内视频在线精品| 中文字幕欧美人妻精品一区| 亚洲三级在线免费观看| 欧美性受xxxx狂喷水| 国产精品91在线| 自拍欧美日韩| 久久久久亚洲av无码专区桃色| 欧美日韩一二三区| 免费看电影在线| 亚洲国产欧洲综合997久久| 成人性生交大片免费看视频在线 | 精灵使的剑舞无删减版在线观看| 久久99久久精品国产| 久久精品国产99国产精品| 日韩精品久久久久久久| 神马久久久久久| 女人抽搐喷水高潮国产精品| 国产又大又黄又猛| 亚洲不卡av一区二区三区| 91caoporn在线| 精品一区二区日本| 国产精品99久久久| 少妇又紧又色又爽又刺激视频 | 97人人做人人爽香蕉精品| 日本一本中文字幕| 国产精品国产三级国产普通话99|