精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成! 精華

發布于 2024-7-31 10:02
瀏覽
0收藏

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

文章鏈接:https://arxiv.org/pdf/2407.08683
github鏈接:https://github.com/TencentARC/SEED-Story

亮點直擊

  • SEED-Story,一種利用多模態大語言模型(MLLM)生成具有豐富敘述性文本和上下文相關圖像的多模態故事的新方法。
  • 提出了多模態注意力匯聚機制,以高效生成長度大于訓練時使用的序列長度的長故事。
  • 引入了StoryStream,這是一個專門為訓練和基準測試多模態故事生成而設計的大規模數據集。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

隨著圖像生成和開放形式文本生成的顯著進步,生成交織圖像-文本內容的領域變得越來越引人入勝。多模態故事生成,即生成敘述性文本和生動圖像交織在一起的內容,已成為一個具有廣泛應用的寶貴且實用的任務。然而,這一任務帶來了重大挑戰,因為它需要理解文本和圖像之間復雜的相互作用,并具備生成長序列連貫、上下文相關的文本和視覺效果的能力。


本文提出了SEED-Story,一種利用多模態大語言模型(MLLM)的新方法來生成擴展的多模態故事。本文的模型建立在MLLM強大的理解能力之上,預測文本tokens和視覺tokens,后者隨后通過改編的視覺去分詞器處理,以生成具有一致角色和風格的圖像。進一步提出多模態注意力匯聚機制,以在高度高效的自回歸方式下生成最多25個序列(訓練時僅10個序列)的故事。此外,本文還提出了一個名為StoryStream的大規模高分辨率數據集,用于訓練本文的模型并在各個方面定量評估多模態故事生成任務。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

方法

使用多模態大語言模型進行故事生成

視覺Tokenization和De-tokenization 本文的方法概述如下圖2所示。為了有效擴展視覺故事,本文的模型必須理解并生成圖像和文本。借鑒最近在統一圖像理解和生成的生成性多模態大語言模型(MLLM)方面的進展,研究者們開發了一種多模態故事生成模型。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

本文的模型使用預訓練的Vision Transformer(ViT)作為視覺分詞器,并使用預訓練的擴散模型作為視覺去分詞器,通過使用ViT的特征作為輸入來解碼圖像。具體而言,來自ViT分詞器的視覺embeddings被輸入到一個可學習模塊中,然后作為預訓練的SD-XL的U-Net的輸入。這個過程用視覺embeddings替代了原始的文本特征。在這一階段,參數使用開放世界的文本-圖像對數據以及故事數據進行優化,以增強模型的編碼-解碼能力。在這一訓練階段之后,期望視覺分詞器和去分詞器模塊能夠在特征空間中盡可能多地保留圖像信息。


故事指令調優 在故事生成指令調優過程中,每次迭代隨機抽取一個故事數據點的隨機長度子集。模型的任務是預測故事文本的下一張圖片和下一句句子。在MLLM中,所有圖像都使用預訓練的ViT分詞器轉換為圖像特征。對于目標文本tokens,進行下一個token預測,并使用交叉熵損失來訓練這個離散目標。對于目標圖像特征,模型使用一系列可學習的查詢作為輸入,并連續輸出一系列潛在embeddings。然后,計算MLLM輸出與目標圖像特征之間的余弦相似度損失。在這一階段,使用LoRA模塊微調SEED-Story模型。


去分詞器適應 在指令調優之后,SEED-Story MLLM有效地生成了語義正確的故事圖像,但缺乏風格一致性和細節。將這個問題歸因于MLLM輸出的潛在空間與圖像特征之間的不對齊。為了解決這個問題,對去分詞器進行了風格和紋理對齊的適應。在這個階段,僅訓練SD-XL圖像去分詞器。在MLLM輸出embeddings的條件下,期望SD-XL生成與真實圖像在像素級別對齊的圖像。去分詞器的單獨訓練有兩個主要優勢。首先,它避免了LLM與去分詞器之間的優化沖突。其次,它節省了內存,使得這一過程可以在內存有限的GPU上執行。

使用多模態注意力匯聚生成長故事

生成長篇視覺故事在教育和娛樂等各種應用中具有巨大的潛力。然而,用多模態大語言模型(MLLM)創建這些故事面臨重大挑戰。延長、交織故事的數據集不僅稀缺,而且由于其復雜性會阻礙訓練過程。為了解決這個問題,采用了“短期訓練,長期測試”的方法,在較短的敘事上訓練模型,并在推理過程中擴展到較長的生成。


此外,在推理過程中,生成比訓練數據顯著更長的故事常常導致模型退化,產生質量較低的圖像,如下圖10第一行所示。這個過程還需要大量的tokens使用來確保連續性和連貫性,這反過來增加了內存和計算需求。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

一個簡單的解決方案是使用滑動窗口技術,如下圖3右(b)所示。然而,這種方法會破壞Key-Value(KV)緩存中的tokens關系,導致生成結果不理想,如StreamingLLM所示。為了克服這一問題,StreamingLLM引入了一種注意力匯聚機制,可以保留初始tokens,從而在不損害質量的情況下高效處理長生成。雖然這種方法在語言模型中有效,但在多模態上下文中的效果減弱,如圖3右(c)所示。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

為了增強多模態長生成,重新審視了MLLM的注意力圖。在對各種模型和案例進行了大量實驗后,分析了不同層和頭部的注意力圖。分析表明,大多數查詢主要集中在四種類型的tokens上:

  • 起始tokens
  • 標點符號tokens
  • 圖像開始(BoI)tokens
  • 圖像結束(EoI)tokens

與僅限語言的模型不同,MLLM對特定的圖像tokens,尤其是BoI和EoI附近的圖像tokens給予了大量關注,如上圖3左所示。


基于這些見解,本文提出了一種新的MLLM擴展生成機制,稱為多模態注意力匯聚。在生成過程中,始終保留起始tokens和BoI及EoI相鄰的圖像tokens。盡管標點符號tokens接收到高關注值,但它們的潛在值規范最小,對最終輸出貢獻不大,因此不保留它們,如[13]所指出。本文提出的機制使本文的模型能夠在保持較低計算負擔的同時生成高質量的圖像。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

實驗

故事可視化

以往的故事生成方法主要利用擴散模型,側重于故事圖像的可視化。這些模型以前一張圖像和文本作為輸入,然后根據當前的文本提示生成下一張圖像。為了公平比較,研究者們將本文的模型調整為僅可視化格式。對于StoryGen,也對其進行訓練,使其使用前面的圖像和文本生成圖像。對于LDM,僅提供文本-圖像對。視覺結果如下圖5所示。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

與baseline相比,SEED-Story模型顯示了更好的風格和角色一致性以及更高的質量。下表2中進行了定量評估,以展示有效性。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

多模態故事生成

為了進行比較分析,現有的多模態故事生成方法相對較少。為了建立比較基準,在數據集上微調了最近開發的MM-interleaved模型。下圖6中詳細介紹了比較結果。使用FID評估生成圖像的視覺質量。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

此外,GPT-4V在多個維度上比較并選擇MM-interleaved和SEED-Story生成結果中的優選項:風格一致性,評估不同圖像之間的風格一致性;故事吸引力,衡量敘述吸引和保持觀眾興趣的能力;以及圖像-文本一致性,評估圖像與其伴隨文本之間的對齊和相關性。


為了進行定性展示,展示了SEED-Story如何有效地幫助用戶控制故事情節。下圖7顯示,使用相同的起始圖像但不同的初始文本,敘述分支成兩個不同的故事情節。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

下圖8和圖9中提供了更多案例,以證明本文多模態長故事生成的能力。SEED-Story可以生成帶有引人入勝的情節和生動圖像的長序列。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

長故事生成

為了驗證在長故事生成方面的有效性,本文進行了一項實驗,使用SEED-Story模型可視化一個長故事,但采用不同的注意力機制。將數據分成長度為10的故事,以考慮訓練效率。將窗口大小設置為與訓練長度相同。下圖10中的定性結果顯示,當推理長度超過訓練長度時,窗口注意力迅速崩潰。盡管密集注意力和注意力匯聚方法表現更好,但隨著推理序列的加長,仍未能生成有意義的圖像。相比之下,多模態注意力匯聚始終生成高質量的圖像。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

在效率方面,多模態注意力匯聚相較于密集注意力表現出顯著的改進,與窗口注意力和普通注意力匯聚相比,僅有適度的時間和內存成本增加。這些額外的成本來自在KV緩存中保留額外的圖像tokens。下表3中的定量結果證實了上述結論。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

結論

本文介紹了SEED-Story,這是一種利用多模態大語言模型生成具有豐富敘述文本和上下文相關圖像的多模態長故事的開創性方法。提出了一種多模態注意力匯聚機制,使本文的模型能夠高效地生成長序列。此外,還提出了一個名為StoryStream的高質量數據集,用于有效地訓練和基準測試多模態故事生成任務。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

本文轉自 AI生成未來 ,作者:Shuai Yang等


原文鏈接:??https://mp.weixin.qq.com/s/cmsXLXRx_5_D-VWuAl7-Hg??

收藏
回復
舉報
回復
相關推薦
日韩精品每日更新| 99蜜月精品久久91| av一二三不卡影片| 国产盗摄xxxx视频xxx69| 超碰人人干人人| 久久99成人| 色综合天天性综合| 看全色黄大色大片| 日韩一区二区三区中文字幕| 秋霞电影网一区二区| 欧美国产日韩免费| 国产小视频自拍| 91欧美日韩在线| 欧美在线观看视频一区二区 | 亚洲卡一卡二卡三| 久久成人在线| 欧美国产极速在线| 四虎国产成人精品免费一女五男| 精品国内亚洲2022精品成人| 欧美美女喷水视频| 日韩无套无码精品| 波多野结衣精品| 日韩美女视频19| 亚洲第一在线综合在线| 污视频软件在线观看| 国产精品一区在线观看你懂的| 日韩av男人的天堂| 精品一级少妇久久久久久久| 日韩一区欧美| 国产亚洲精品美女久久久| 天堂www中文在线资源| 国产麻豆精品| 欧美日韩成人综合| 色七七在线观看| 欧美18av| 欧美午夜片在线免费观看| 少妇人妻在线视频| av老司机在线观看| 亚洲在线视频一区| 黄网站色视频免费观看| 国产xxxxx视频| 日本电影一区二区在线观看| 国产91在线看| 亚洲在线一区二区| 91片黄在线观看喷潮| 日本美女一区二区| 国产精品久久久久高潮| 亚洲黄色免费观看| 老鸭窝亚洲一区二区三区| 97人人爽人人喊人人模波多 | 极品美乳网红视频免费在线观看| 成人黄色国产精品网站大全在线免费观看| 91免费的视频在线播放| 97精品人妻一区二区三区香蕉| 天堂va蜜桃一区二区三区漫画版| 91超碰caoporn97人人| 日本三级免费看| 亚洲欧洲午夜| 97不卡在线视频| 欧美三级韩国三级日本三斤在线观看| 亚洲第一黄色| 97视频com| 国产精品久久久久久一区二区| 国产精品99久久久久久成人| 亚洲国产一区二区在线观看| 欧美精品在线视频观看| 国产一级特黄毛片| 一区二区黄色| 国产成人亚洲综合青青| 中国女人真人一级毛片| 老色鬼精品视频在线观看播放| 国产专区欧美专区| 国产成人三级一区二区在线观看一| 久久99久久99| y111111国产精品久久婷婷| 亚洲精品国产一区二| 99在线精品观看| 神马影院我不卡午夜| 免费av在线网址| 亚洲图片欧美一区| 久久久久免费精品| 亚洲成人a级片| 欧美成人精品二区三区99精品| 亚洲天堂2024| 精品理论电影| 欧美精品亚州精品| 福利网址在线观看| 国产综合久久久久久久久久久久| 国产乱码精品一区二区三区中文 | 九色视频在线观看免费播放| 欧美激情在线一区二区三区| 日日噜噜夜夜狠狠久久丁香五月| 182在线视频观看| 日韩欧美高清在线视频| 想看黄色一级片| 首页亚洲中字| 久久这里只有精品99| 青青草av在线播放| 精东粉嫩av免费一区二区三区| 国产丝袜不卡| 美女写真理伦片在线看| 亚洲v日本v欧美v久久精品| 在线免费视频a| 白白在线精品| 最新亚洲国产精品| 亚洲久久在线观看| 国产一区二区不卡在线| 欧美在线一区二区三区四区| 先锋影音在线资源站91| 欧美在线观看你懂的| 久久精品女同亚洲女同13| 91视频综合| 日本欧美一级片| 欧美特级特黄aaaaaa在线看| 专区另类欧美日韩| 噼里啪啦国语在线观看免费版高清版| 国产精品白浆| 久久99国产综合精品女同| 日批视频免费观看| 久久综合网色—综合色88| 久久久久久久久久久久久国产| 日韩网站中文字幕| 日韩精品福利在线| 国产性猛交普通话对白| 国产在线一区二区综合免费视频| 亚欧洲精品在线视频免费观看| 日韩深夜视频| 18禁裸男晨勃露j毛免费观看| 性一交一乱一精一晶| 国产日韩三级在线| 日本大片免费看| 婷婷激情成人| 在线日韩第一页| 黄色片视频免费| 99精品在线观看视频| 中文字幕の友人北条麻妃| 欧美天堂一区二区| 国产一区二区动漫| 日韩免费av网站| 久久综合九色综合欧美亚洲| 久久国产精品视频在线观看| 777久久精品| 欧美国产亚洲精品久久久8v| 99国产精品99| 自拍av一区二区三区| 999久久久精品视频| 久久久久久免费视频| 91久久精品在线| 成人午夜在线影视| 337p亚洲精品色噜噜狠狠| 亚洲欧美另类日本| 激情成人综合网| 最新av在线免费观看| 国产精品欧美一区二区三区不卡| 久久天天躁狠狠躁夜夜躁 | 乱码第一页成人| 欧美高清性xxxxhd | 好吊一区二区三区| 国产精品久久精品视| gogo高清午夜人体在线| 亚洲精品电影在线| 五月天激情四射| 欧美激情一区二区三区蜜桃视频| 在线免费观看av的网站| 婷婷综合在线| 国产精品我不卡| 亚洲人体影院| 在线电影av不卡网址| 伊人网免费视频| 亚洲精选视频免费看| www.四虎精品| 香蕉成人久久| 亚洲国产精品综合| 亚洲免费资源| 亚洲91精品在线观看| 国产www.大片在线| 51精品视频一区二区三区| 东方av正在进入| 成人黄页毛片网站| 亚洲成人av免费看| 欧美福利视频| 欧美日韩国产精品一区二区| aa亚洲一区一区三区| 97在线看福利| 在线免费看黄网站| 亚洲成人黄色在线观看| 欧美三级网站在线观看| 亚洲女厕所小便bbb| 日韩网站在线播放| 国产自产高清不卡| 免费无码av片在线观看| 亚洲成av人电影| 美日韩精品免费| 国产精品一区三区在线观看| 欧美壮男野外gaytube| 国产高清一区二区三区视频| 亚洲精品第一页| 国产精品羞羞答答在线| 岛国精品视频在线播放| 亚洲天堂网av在线| 久久久综合九色合综国产精品| 欧美激情第一区| 久久黄色网页| 日韩在线视频在线| 日韩精品诱惑一区?区三区| 国产精品免费观看高清| 丁香婷婷久久| 青青草原一区二区| 丁香花在线电影小说观看| 亚洲欧美综合图区| 亚洲精品视频网| 欧美日韩国产大片| 一二三区免费视频| 精品久久在线播放| 久久久久亚洲天堂| 中文字幕人成不卡一区| 波多野结衣片子| av色综合久久天堂av综合| 超碰91在线播放| 久久精品国产秦先生| 久久久久狠狠高潮亚洲精品| 在线观看日韩av电影| 日日噜噜夜夜狠狠久久丁香五月| 精品香蕉视频| 久久久久国产精品视频| 国产精品视屏| 国产一区二区三区四区hd| 玖玖玖电影综合影院| 成人做爰www免费看视频网站| 成人av色网站| 国产精品69久久久久| www.com.cn成人| 66m—66摸成人免费视频| 国产精品探花在线| 欧美国产日韩在线| 免费毛片在线看片免费丝瓜视频 | 日产欧产va高清| 一区二区三区四区激情| 东方av正在进入| 亚洲免费三区一区二区| 亚洲天堂网av在线| 亚洲另类中文字| 人妻久久一区二区| 一区二区三区四区不卡视频 | 色综合久久66| 99久久久久久久久| 在线视频欧美精品| 中文在线字幕av| 欧美视频中文一区二区三区在线观看| 免费在线不卡av| 欧美日韩在线精品一区二区三区激情| 亚洲大尺度在线观看| 欧美亚州韩日在线看免费版国语版| 国产午夜无码视频在线观看| 欧美亚洲国产一区在线观看网站 | 亚洲国产精品123| 97久久夜色精品国产| 中文字幕中文字幕一区三区| 国产精品二区不卡| 国产91在线亚洲| 亚洲激情黄色| 91av俱乐部| 久久爱www久久做| 免费在线观看日韩av| 99久久精品免费精品国产| 草草影院第一页| 中文字幕免费观看一区| 99自拍视频在线| 亚洲国产成人91porn| 日韩精品一区二区亚洲av| 欧美日韩在线一区二区| 国产精品视频在线观看免费| 欧美成人精品二区三区99精品| 午夜视频福利在线| 中文字幕日韩av电影| 草莓福利社区在线| 69**夜色精品国产69乱| 99久久婷婷国产综合精品首页| 92国产精品久久久久首页 | 国产麻豆精品久久一二三| 亚洲成年人在线观看| 国产校园另类小说区| 2025国产精品自拍| 欧美性极品xxxx娇小| 在线观看免费中文字幕| 精品嫩草影院久久| 国产精品久久久久久久龚玥菲 | 在线观看免费国产视频| 欧美日韩精品二区第二页| 亚洲精品一区二区口爆| 亚洲色图校园春色| 日韩激情av| 国产精品美女www爽爽爽视频| 51精品国产| 中国成人在线视频| 国产精品毛片在线| 色婷婷综合在线观看| 久久久久久电影| 免费三片在线播放| 欧美午夜视频网站| 日韩中文字幕免费观看| 色阁综合伊人av| 亚洲精品中文字幕| 国产精品国模大尺度私拍| 99久久婷婷国产综合精品电影√| 日本在线xxx| 国产99一区视频免费| 呻吟揉丰满对白91乃国产区| 天天av天天翘天天综合网色鬼国产| 一级特黄aaa| 亚洲视频欧美视频| 高清在线视频不卡| 5566av亚洲| 日韩av在线播放网址| 夫妻免费无码v看片| 成人亚洲一区二区一| 日韩一卡二卡在线观看| 色婷婷激情久久| 日本免费不卡视频| 欧美极品少妇xxxxⅹ裸体艺术| 人人精品久久| 亚州欧美一区三区三区在线| 久久久夜夜夜| 天堂久久久久久| 亚洲一区二区美女| 精品人妻少妇嫩草av无码专区| 在线视频中文亚洲| 三上悠亚亚洲一区| 久久久久久高清| 亚洲欧洲日本mm| 黄色免费看视频| 亚洲国产成人av| 女人18毛片一区二区三区| 欧美老少配视频| 亚洲日本va中文字幕| 中文字幕一区二区三区四区五区人| 另类的小说在线视频另类成人小视频在线 | 国产成人免费在线| 18岁成人毛片| 日韩欧美国产系列| 日韩另类在线| 国产一区不卡在线观看| 在线视频精品| 中文精品在线观看| 日韩欧美一区视频| 韩国三级在线观看久| 国产成人精品久久二区二区| 国产精品免费大片| 男女啪啪网站视频| 国产精品国产三级国产aⅴ原创| 在线免费a视频| 久久久国产精彩视频美女艺术照福利| 伊人久久综合网另类网站| 精品国产无码在线| 国产高清一区日本| 亚洲欧美在线观看视频| 亚洲欧美国产va在线影院| 精品日韩视频| 宅男av一区二区三区| 国产福利一区在线观看| 亚洲国产综合久久| 亚洲码在线观看| 激情中国色综合| 毛片在线视频观看| 99国产精品久久久久久久久久久| www.毛片.com| 中文精品99久久国产香蕉| 麻豆久久一区| 日韩av三级在线| 国产精品三级视频| 亚洲AV无码精品国产| 欧美一区二区三区……| 日韩精品一卡| 中文字幕人妻一区| 色偷偷久久人人79超碰人人澡| 国产原厂视频在线观看| 含羞草久久爱69一区| 蜜臀a∨国产成人精品| 久久久久免费看| 国产一区二区三区精品久久久| 啪啪av大全导航福利综合导航| 中文字幕精品在线播放| a亚洲天堂av| 亚洲一级片免费看| 98精品国产自产在线观看| 日韩精品看片| 一级特黄a大片免费| 欧美日韩中文精品| www视频在线观看| 一区二区不卡在线观看| 99精品一区二区三区| 国产丝袜视频在线观看| 欧美亚洲在线播放| 欧美激情成人在线| 精品国产成人亚洲午夜福利| 精品欧美一区二区在线观看| 99久久婷婷国产综合精品首页 | 成人网在线播放| 久久久久久av无码免费看大片| 国内精品视频一区|