精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!

發(fā)布于 2024-5-28 11:49
瀏覽
0收藏

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

文章鏈接:https://arxiv.org/pdf/2405.11190

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

基于指令的圖像編輯專注于使生成模型能夠遵循人類書寫的編輯圖像指令。當(dāng)前的方法通常能夠理解明確且具體的指令。然而,它們往往在執(zhí)行所需的主動推理能力上表現(xiàn)不足,無法很好地理解隱含或定義不足的指令。為了增強(qiáng)主動推理能力并賦予編輯模型智能性,本文引入了ReasonPix2Pix,一個綜合性的推理注意指令編輯數(shù)據(jù)集。


該數(shù)據(jù)集的特點(diǎn)是:

  • 包含推理指令
  • 來自細(xì)粒度類別的更真實(shí)的圖像
  • 輸入和編輯圖像之間的更大差異


在監(jiān)督條件下使用該數(shù)據(jù)集進(jìn)行微調(diào)時,該模型在指令編輯任務(wù)中表現(xiàn)出優(yōu)越的性能,無論這些任務(wù)是否需要推理。

介紹

基于指令的圖像編輯旨在使生成模型具備遵循人類書寫的編輯圖像指令的能力,這對于促進(jìn)AI生成內(nèi)容(AIGC)系統(tǒng)理解人類意圖至關(guān)重要。


現(xiàn)有的基于指令的圖像編輯框架通常能夠理解明確且具體的指令,例如“將水果換成蛋糕”。不幸的是,這些模型在主動推理能力上表現(xiàn)不足,即理解指令的含義而不僅僅是從中提取詞語。如下圖2所示,一個典型的基于指令的圖像編輯框架InstructPix2Pix未能實(shí)現(xiàn)“她更喜歡口罩而不是太陽鏡”,卻給女人添加了太陽鏡,這是不合理的。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

同時,該模型缺乏理解給定圖像的能力。例如,對于一個簡單明確的指令“讓它變成50年后”,對于各種給定的圖像,編輯結(jié)果應(yīng)該是不同的。但是在下圖3中,以前的方法只是簡單地將人變老,甚至未能編輯圖像,這是完全不正確的。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

另一方面,這些方法也缺乏理解隱含或定義不足的指令的能力。這需要人工干預(yù),將隱含指令變?yōu)槊鞔_指令,或?qū)⒅噶罘纸鉃槎鄠€明確、具體的指令,以符合這些模型的能力。

例如,指令“讓房間整潔”需要手動分解為各種步驟,如“將散落的衣物整齊折疊”,“移除地上的垃圾”,以及“整理床單”等。同樣,隱含指令“她是這場表演的明星”需要人為干預(yù),將其明確為“在圖像中添加一些閃光和聚光燈效果”。因此,增強(qiáng)自我推理能力不僅對用戶更友好,而且是下一代智能AIGC系統(tǒng)發(fā)展的關(guān)鍵。


借助多模態(tài)大模型(MLLM)的生成模型在推理感知指令編輯方面的潛力是巨大的。然而,現(xiàn)有的用于指令編輯的數(shù)據(jù)集未能充分發(fā)揮和利用模型的內(nèi)在推理能力。


因此,本文研究者們開發(fā)了一個綜合性的推理注意指令編輯數(shù)據(jù)集ReasonPix2Pix,該數(shù)據(jù)集包含圖像對及其相應(yīng)的推理指令。ReasonPix2Pix的特點(diǎn)包括:


  • 隱含指令以進(jìn)一步增強(qiáng)模型的推理能力
  • 來自細(xì)粒度類別的大量真實(shí)圖像
  • 輸入圖像和編輯后圖像之間在幾何層面上的顯著差異。


在下表1中與之前的數(shù)據(jù)集進(jìn)行了比較。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

此外,將多模態(tài)大模型(MLLM)引入圖像編輯模型,并在數(shù)據(jù)集上進(jìn)行微調(diào),從而增強(qiáng)圖像編輯的推理能力,并顯著提升指令編輯的質(zhì)量。


貢獻(xiàn)可以總結(jié)如下:

  • 提出了基于指令推理的圖像編輯任務(wù),這是一項(xiàng)有趣的任務(wù),旨在增強(qiáng)模型理解人類意圖的智能。
  • 開發(fā)了一個綜合性的推理注意指令編輯數(shù)據(jù)集ReasonPix2Pix,該數(shù)據(jù)集包含圖像對及其相應(yīng)的推理指令。
  • 在數(shù)據(jù)集上微調(diào)了一個簡單的框架。即使在沒有繁雜操作的情況下,該模型不僅在不需要推理的指令編輯任務(wù)中表現(xiàn)出色,而且在需要推理的任務(wù)中也表現(xiàn)良好。

相關(guān)工作

圖像編輯 圖像編輯是一個基礎(chǔ)的計(jì)算機(jī)視覺任務(wù),也可以看作是圖像到圖像的轉(zhuǎn)換。在生成對抗網(wǎng)絡(luò)(GAN)提出后,許多工作[13, 14, 19, 29, 35]被發(fā)明來解決這一任務(wù)。一類方法[1–3, 7, 10, 41, 50]將原始圖像插入潛在空間,然后進(jìn)行操作。這些方法被證明在轉(zhuǎn)換圖像風(fēng)格、添加和移動圖像中的對象方面是有效的。


最近,隨著多模態(tài)學(xué)習(xí)的爆炸性發(fā)展,文本信息可以通過諸如CLIP之類的模型嵌入,然后作為圖像編輯的指導(dǎo)。這些方法使模型能夠根據(jù)給定的文本編輯圖像。


擴(kuò)散模型 擴(kuò)散模型是最受歡迎的生成模型之一,在圖像合成方面表現(xiàn)出色。通過擴(kuò)散過程學(xué)習(xí)給定數(shù)據(jù)集的概率分布。最近,文本到圖像的擴(kuò)散模型,如Stable Diffusion,在將文本轉(zhuǎn)換為高質(zhì)量圖像方面取得了巨大成功。


圖像編輯的擴(kuò)散模型一些擴(kuò)散模型天生具備編輯圖像的能力。然而,在實(shí)際應(yīng)用中,這些模型顯示出穩(wěn)定性較差的問題(即在給定類似文本時生成類似的圖像)。通過Prompt-to-Prompt在模型上施加約束,這個問題得到了緩解。與以往處理生成圖像的方法不同,SDEdit通過加噪和去噪過程編輯真實(shí)圖像。


圖像修復(fù)可以看作是更精細(xì)的圖像編輯。它通過從一小組訓(xùn)練樣本中學(xué)習(xí),將文本輸入和用戶繪制的masks轉(zhuǎn)換為特定類別或風(fēng)格的圖像。InstructPix2Pix簡化了生成過程,僅需要一個輸入圖像和一個指令來編輯圖像,而不需要任何訓(xùn)練。它提出了一個大規(guī)模數(shù)據(jù)集,包含配對的圖像和相應(yīng)的指令。然而,它僅包含簡單明了的指令,限制了其在復(fù)雜的現(xiàn)實(shí)場景中的應(yīng)用。因此,本文構(gòu)建了一個指令推理數(shù)據(jù)集,以改善圖像編輯。


多模態(tài)大語言模型隨著大語言模型(LLM)的快速發(fā)展,它們被擴(kuò)展到更多的模態(tài)(如視覺),形成多模態(tài)大語言模型。BLIP-2和mPLUG-OWL引入了視覺編碼器來嵌入圖像,然后將它們與文本embeddings結(jié)合起來。Instruct-tuning被廣泛采用,將LLM的能力轉(zhuǎn)移到視覺領(lǐng)域。另一類工作使用提示工程,犧牲了端到端訓(xùn)練。多模態(tài)大語言模型在視覺任務(wù)中的應(yīng)用被證明在基于視覺的任務(wù)和目標(biāo)檢測方面是有效的。

方法

本文的目標(biāo)是根據(jù)人類指令進(jìn)行圖像編輯,特別強(qiáng)調(diào)推理指令。給定一個輸入圖像和一個人類指令,模型旨在理解人類的顯性或隱性意圖,并隨后生成與提供的指令一致的輸出圖像。為了實(shí)現(xiàn)這一目標(biāo),本文引入了ReasonPix2Pix,一個專門針對基于指令的圖像編輯并關(guān)注推理能力的數(shù)據(jù)集。以該數(shù)據(jù)集為基礎(chǔ)訓(xùn)練數(shù)據(jù),微調(diào)了一個包含多模態(tài)大語言模型與擴(kuò)散模型的簡單框架。

預(yù)備知識

InstructPix2Pix數(shù)據(jù)集 InstructPix2Pix生成了一個重要的大規(guī)模配對數(shù)據(jù)集,以實(shí)現(xiàn)基于指令的圖像編輯。具體地,如下圖4所示

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

它包含:

  • 輸入圖像t和輸入標(biāo)題
  • 編輯后的圖像和編輯后的標(biāo)題
  • 文本指令。

V3Det數(shù)據(jù)集 V3Det是一個龐大的檢測數(shù)據(jù)集,包含13,204個類別,超過240,000張圖像。圖像看起來真實(shí)且復(fù)雜,開發(fā)了一個更通用的視覺感知系統(tǒng)。

ReasonPix2Pix

為了將推理能力注入圖像編輯模型,研究者們構(gòu)建了一個綜合性的推理注意指令編輯數(shù)據(jù)集。根據(jù)生成過程,生成數(shù)據(jù)集可以分為三個部分。如表2所示:

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

  • Part I:使用InstructPix2Pix中的原始圖像對,并生成指令以實(shí)現(xiàn)指令推理。
  • Part II:從InstructPix2Pix的輸入圖像開始,生成自己的編輯圖像和指令。
  • Part III:從V3Det中獲取更真實(shí)的圖像,生成編輯后的圖像和指令。

?

數(shù)據(jù)過濾盡管在基于指令的圖像編輯中取得了巨大成功,InstructPix2Pix模型仍存在各種失敗案例。一個典型的失敗案例是模型傾向于輸出原始圖像,即不進(jìn)行任何編輯。深入研究數(shù)據(jù)集,發(fā)現(xiàn)部分編輯后的圖像與輸入圖像非常相似。因此,需要首先過濾這部分?jǐn)?shù)據(jù),通過以下方法區(qū)分它們:

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

如下圖5所示,將InstructPix2Pix數(shù)據(jù)集中的輸入標(biāo)題、編輯標(biāo)題和原始指令輸入GPT-3.5,并要求GPT-3.5生成候選指令。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

然后,再次要求GPT-3.5從中區(qū)分出最佳指令。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

Part II & III:圖像編輯和推理指令生成為了進(jìn)一步提高模型的能力,研究者們擴(kuò)展了數(shù)據(jù)集,加入了其他兩部分?jǐn)?shù)據(jù)。這些數(shù)據(jù)不僅增強(qiáng)了模型的推理能力,還旨在提升模型處理更真實(shí)的細(xì)粒度類別圖像和輸入與編輯圖像之間更大差異的能力。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

標(biāo)題傳遞給Spacy模型S,這是一個先進(jìn)的自然語言處理(NLP)模型,用于識別句子中的實(shí)體。在這里利用它來提取候選類別。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

Spacy模型提取了i個候選類別。例如,在上面圖6中,Spacy提取了i = 2個類別,即蝴蝶和花朵。


通過這些類別,可以使用Grounding DINO在圖像中定位相應(yīng)的物體。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

然后將標(biāo)題和候選類別注入到GPT-3.5中。在這里,設(shè)計(jì)了另一個提示,要求GPT-3.5輸出

  1. 一個被選中的類別
  2. 需要用其替換的目標(biāo)類別
  3. 推理指令。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

在這里展示了數(shù)據(jù)集的一些樣本。從下圖7可以看出,數(shù)據(jù)集具有復(fù)雜的推理指令(例如,“一家公司計(jì)劃在清潔能源上開展新項(xiàng)目”),輸入和編輯圖像之間的變化更多,特別是在幾何水平上,而且圖像更加真實(shí)。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

數(shù)據(jù)集利用

利用廣泛模型來增強(qiáng)編輯模型的主動推理能力。具體來說,設(shè)計(jì)了一個簡單的框架,將一個多模態(tài)大語言模型(MLLM)整合到擴(kuò)散模型中,如下圖8所示。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

與以往僅通過文本理解人類意圖的方法不同,MLLM通過結(jié)合指令和輸入圖像來增強(qiáng)理解能力。形式上,具有人類意圖的指令特征h可以被公式化為

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

其中,F(xiàn)是MLLM。h是F的輸出,包含了我們指令的多模態(tài)理解。


然后,可以無縫地將h注入到編輯模型中。圖像生成模型可以在h的監(jiān)督下編輯輸入圖像。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

考慮到LLM中的大量參數(shù),在對模型進(jìn)行微調(diào)時將其固定。利用ReasonPix2Pix數(shù)據(jù)集,模型進(jìn)行端到端的微調(diào)。

實(shí)驗(yàn)

實(shí)施細(xì)節(jié)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

利用V3Det的測試數(shù)據(jù)構(gòu)建了一個基準(zhǔn)測試集,具體流程見前面圖6,共有1000張圖像。同時,記錄了所選類別和目標(biāo)新類別,因此可以通過多種模板制定簡單的指令,例如“將A轉(zhuǎn)換為B”。


因此,測試數(shù)據(jù)包括輸入圖像及其標(biāo)題、真實(shí)編輯后的圖像及其標(biāo)題,以及直觀指令和推理指令。分別在這些數(shù)據(jù)上評估了ReasonPix2Pix以及之前的方法。

定性結(jié)果

圖像質(zhì)量 這里將本文的方法與之前的方法在簡單指令下的表現(xiàn)進(jìn)行了比較。如下圖9所示,InstructPix2Pix未能將圖像中的刺猬變成兔子。而ReasonPix2Pix能夠轉(zhuǎn)換這些復(fù)雜的類別,生成更生動的結(jié)果。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

推理能力 為了比較推理能力,首先我們從相對簡單的指令開始。如下圖10所示,當(dāng)指令是“去除顏色”時。之前的方法在一定程度上能夠理解指令,但生成的結(jié)果不準(zhǔn)確。

InstructPix2Pix遵循指令將圖像轉(zhuǎn)換為黑白,但也移除了背景。相反,ReasonPix2Pix理解了指令并給出了充分的結(jié)果。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

然后我們轉(zhuǎn)移到更復(fù)雜的指令。如下圖11所示,對于間接指令“他有一個正式會議要參加”,之前的InstructPix2Pix無法處理,輸出了原始圖像而沒有進(jìn)行任何編輯。ReasonPix2Pix能夠理解指令,并讓他穿著正式服裝參加會議。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

定量結(jié)果

除了上述的定性結(jié)果之外,還將定量指標(biāo)與之前的方法進(jìn)行了比較,如下表3所示,分別使用直接指令和推理指令。我們報(bào)告了生成圖像與真實(shí)圖像之間的L1和L2距離,以及它們的CLIP和DINO嵌入之間的余弦距離。此外,還報(bào)告了CLIP-T,即目標(biāo)標(biāo)題的CLIP特征與生成圖像之間的余弦相似度。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

在傳統(tǒng)的直接指令下,ReasonPix2Pix在之前的方法中取得了競爭性的表現(xiàn),證明了生成的圖像的質(zhì)量。當(dāng)涉及需要理解的推理指令時,之前的方法表現(xiàn)下降,但ReasonPix2Pix的結(jié)果遠(yuǎn)遠(yuǎn)高于其他方法。


同時,研究者們還進(jìn)行了用戶研究,以比較ReasonPix2Pix與之前的方法。分別隨機(jī)抽取了由不同模型生成的100個樣本,并請5名工作者對它們進(jìn)行評估(每人20個)。工作者被要求在4個候選項(xiàng)中選擇最佳圖像。從下表4中可以看出,在直接指令下,ReasonPix2Pix略優(yōu)于之前的方法。當(dāng)指令變?yōu)橥评碇噶顣r,ReasonPix2Pix與之前的方法之間的差距變得更大。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

分析

定性結(jié)果評估了數(shù)據(jù)集的三個部分的有效性。下圖12展示了當(dāng)僅使用Part I、Part I和Part II、以及整個數(shù)據(jù)集進(jìn)行訓(xùn)練時的結(jié)果。可以觀察到,當(dāng)面對需要推理的指令時,之前的方法如InstructPix2Pix往往會編輯為空或產(chǎn)生不合理的編輯結(jié)果。使用Part I數(shù)據(jù)時,模型似乎理解了指令,但仍然很難提供編輯后的圖像。這與本文提出的觀點(diǎn)一致,即僅使用InstructPix2Pix數(shù)據(jù)集中的圖像時,模型的編輯能力仍然有限。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

另一方面,當(dāng)逐步引入Part II和Part III數(shù)據(jù)時,編輯結(jié)果變得越來越好。有了數(shù)據(jù)集中的所有數(shù)據(jù),模型能夠理解指令并產(chǎn)生相應(yīng)的結(jié)果。


在我們的簡單框架中,將多模態(tài)大語言模型集成到圖像編輯模型中,它自然具有推理能力。在這里,比較了InstructPix2Pix的結(jié)果,添加了未經(jīng)微調(diào)的MLLM,以及在ReasonPix2Pix上進(jìn)行了微調(diào)的我們的模型。下圖13顯示,未經(jīng)微調(diào)時,圖像編輯模型很難接受MLLM的輸出。當(dāng)在我們的數(shù)據(jù)集上進(jìn)行微調(diào)時,模型能夠理解和編輯。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

定量結(jié)果在下圖15a中,比較了定量結(jié)果。當(dāng)添加Part I、II和III數(shù)據(jù)時,CLIP-I上升。因此,數(shù)據(jù)集的三個部分都是必不可少的。同時,如下圖15b所示,MLLM帶來了輕微的改進(jìn),而數(shù)據(jù)集顯然提升了模型的性能。定量結(jié)果與定性結(jié)果一致。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

綜合理解最后,讓我們回到前面的案例,“使其晚50年”。以前的方法無法處理一些情況,例如水果。同時,理解指令不是一個單一模態(tài)的問題,一個男人的雕像在50年后不會變成老人。通過我們的框架和數(shù)據(jù)集,模型考慮了圖像和指令。因此,它根據(jù)不同的輸入提供了合理的結(jié)果。50年后,一個年輕美麗的女人變成了一個老女人,蘋果變成了腐爛的,雕像變成了一個帶著塵土的破碎的雕像。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

限制

由于 API 成本的限制,數(shù)據(jù)集大小仍然有限。本文已經(jīng)制定了一個清晰的數(shù)據(jù)生成流程。如果需要,研究人員可以將數(shù)據(jù)集擴(kuò)展到超過 400,000 個樣本。

結(jié)論

本文旨在增強(qiáng)編輯模型的推理能力,使其更加智能化。具體地,引入了 ReasonPix2Pix,一個專門用于注入推理能力到圖像編輯中的推理指令編輯數(shù)據(jù)集。在提出的數(shù)據(jù)集上微調(diào)了一個簡單的框架。廣泛的實(shí)驗(yàn)結(jié)果證明,ReasonPix2Pix在不管指令是否需要推理的情況下都取得了競爭性的結(jié)果。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)


本文轉(zhuǎn)自 AI生成未來 ,作者:Ying Jin等


原文鏈接:??https://mp.weixin.qq.com/s/kf3cRjJDxukpG_xH0IvRdg??

標(biāo)簽
已于2024-5-28 11:49:36修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
乱人伦xxxx国语对白| 国产精品永久免费视频| 中文字幕在线视频一区二区| 91在线看片| 日本sm残虐另类| 中文字幕欧美精品在线| 手机av在线网| 性欧美video高清bbw| 成人国产一区二区三区精品| 午夜精品视频在线| 草草地址线路①屁屁影院成人| 一二三四视频在线中文| 国产三级欧美三级日产三级99| 国产精品国语对白| www.av成人| 亚洲国产aⅴ精品一区二区| 亚洲精品免费看| 国产日韩欧美综合精品| 91视频在线视频| 欧美激情在线精品一区二区三区| 欧洲一区二区av| 伊甸园精品99久久久久久| 99国产精品一区二区三区 | 日韩理论片在线观看| 一区二区三区免费在线| 国产精品www994| 日韩国产欧美精品在线| 污视频网站观看| 日本电影在线观看| 亚洲国产精品精华液2区45| 国产一区红桃视频| 国产日韩欧美在线观看视频| 亚洲一区二区三区四区电影| 好吊成人免视频| 日本女人高潮视频| 欧美高清电影在线| 国产精品综合视频| 国产成人aa精品一区在线播放| 国产一二三av| 亚洲婷婷伊人| 欧美一级久久久久久久大片| 国产黄色特级片| 色yeye免费人成网站在线观看| 91麻豆免费在线观看| 成人欧美一区二区三区在线| 亚洲 欧美 日韩 综合| 日本欧美国产| 亚洲美女av黄| 丰满人妻一区二区三区免费视频棣 | 98色花堂精品视频在线观看| 国产精品视频观看| 乱一区二区三区在线播放| 国产精品欧美亚洲| 久久伊人亚洲| 韩国国内大量揄拍精品视频| 国产免费一区二区三区四区| 久久悠悠精品综合网| 555夜色666亚洲国产免| 亚洲 中文字幕 日韩 无码| 欧美videosex性欧美黑吊| 国产精品美女视频| 日韩欧美三级电影| 欧美欧美欧美| 久久蜜臀精品av| 国产精品免费视频一区二区| 国产深喉视频一区二区| 激情国产一区二区| 国产日本欧美一区| 老熟妇一区二区三区啪啪| 最新亚洲视频| 97视频色精品| 久久久久久久久久久97| 忘忧草精品久久久久久久高清| 在线观看欧美日韩国产| 中文字幕第4页| 亚洲丝袜啪啪| 亚洲欧美日韩天堂| 少妇大叫太粗太大爽一区二区| 99久久香蕉| 亚洲成人精品在线| 成年人小视频在线观看| 99久久婷婷国产综合精品青牛牛| 精品日韩一区二区三区免费视频| 两女双腿交缠激烈磨豆腐| 精品国产乱码一区二区三区| 欧美一区二区三区影视| 国产成人强伦免费视频网站| 亚洲**毛片| 日韩欧美精品在线| aaa黄色大片| 黄色成人美女网站| 日韩av在线免费看| 播金莲一级淫片aaaaaaa| 午夜先锋成人动漫在线| 怡红院精品视频| www久久久久久久| 99精品在线| 欧美福利视频网站| 九九热在线视频播放| 久久xxxx| 成人精品一区二区三区电影免费| 成人激情四射网| 99久久777色| 日本不卡二区| a级片国产精品自在拍在线播放| 一区二区三区资源| 波多野结衣乳巨码无在线| 欧美日韩免费看片| 欧美精选午夜久久久乱码6080| 中文字幕乱妇无码av在线| 日韩美脚连裤袜丝袜在线| 尤物九九久久国产精品的分类| 国内偷拍精品视频| av不卡在线| 国产乱肥老妇国产一区二| www.亚洲黄色| 久久蜜桃一区二区| 超碰10000| 丝袜美腿诱惑一区二区三区| 欧美精品高清视频| 四虎精品一区二区| 色婷婷av一区二区三区丝袜美腿| 在线精品视频视频中文字幕| 全程偷拍露脸中年夫妇| 国产精品日韩精品欧美精品| 国产精品色婷婷视频| 国产 日韩 欧美 精品| 91亚洲资源网| 欧美日韩中文字幕在线播放 | 午夜电影一区| 亚洲欧美精品中文字幕在线| 日韩欧美国产成人精品免费| 国产精品夜夜夜| 91久久中文字幕| 天堂中文在线8| 国产精品免费网站在线观看| 久操网在线观看| 3d动漫一区二区三区在线观看| 亚洲精品自拍第一页| 天天干中文字幕| 麻豆成人免费电影| 久久av一区二区三区亚洲| 国产乱色在线观看| 91高清在线观看| 亚洲一区二区在线免费| 88国产精品视频一区二区三区| 日本视频久久久| 国产情侣在线播放| 中文字幕乱码日本亚洲一区二区 | 精品资源在线| 久久影院模特热| 人妻中文字幕一区二区三区| 91网站视频在线观看| 樱空桃在线播放| 亚洲精品69| 日韩在线视频二区| 亚洲高清视频免费观看| 91麻豆成人久久精品二区三区| 国产曰肥老太婆无遮挡| 精品国产亚洲一区二区在线观看 | 无码av免费一区二区三区试看| 蜜臀久久99精品久久久酒店新书| 欧美调教在线| 97精品国产97久久久久久春色| 精品国产伦一区二区三区| 综合在线观看色| 亚洲欧美aaa| 亚洲人成亚洲精品| 欧美亚洲视频在线看网址| 亚洲精品一区二区三区区别| 亚洲天堂福利av| 五月天av在线播放| 欧美成人milf| 国产在线拍偷自揄拍精品| 97人人在线| 欧美色图片你懂的| 亚洲熟女毛茸茸| 经典一区二区三区| 中文字幕超清在线免费观看| 国产aa精品| 免费不卡在线观看av| 国产美女明星三级做爰| 亚洲激情自拍视频| 中文字幕永久免费| 亚洲国内精品| 久久精品第九区免费观看| 色偷偷色偷偷色偷偷在线视频| 日韩av在线导航| 日韩手机在线视频| 欧美高清在线精品一区| 欧美国产日韩另类 | wwww在线观看免费视频| 亚洲国产91色在线| 日韩精品1区2区| 国产日韩欧美高清在线| 国产福利影院在线观看| 国产精品久久久久久麻豆一区软件 | 免费看国产黄色片| 亚洲成人三区| 国内精品久久国产| 欧美xxx视频| 久久久国产精品视频| 国产不卡av在线播放| 午夜国产精品一区| 林心如三级全黄裸体| 国产高清亚洲一区| 日本三级免费观看| 日韩电影二区| 国产精品区一区二区三在线播放| 综合日韩av| 久久在精品线影院精品国产| 人妻91麻豆一区二区三区| 欧美视频专区一二在线观看| 国产毛片欧美毛片久久久| 日韩精品福利网| 91亚洲精品国产| 嫩草影视亚洲| 亚洲一区二区三区视频| 悠悠资源网亚洲青| 久久久精品999| 色综合久久网女同蕾丝边| 在线不卡一区二区| 97久久久久久久| 亚洲蜜臀av乱码久久精品蜜桃| 超碰caoprom| 美女网站视频久久| 欧美日韩一道本| 一本到12不卡视频在线dvd| 欧美日韩一区在线播放| 日韩护士脚交太爽了| 26uuu国产精品视频| 国产精品久久麻豆| 亚洲欧洲xxxx| 国产精品久久久久久免费 | 日韩激情视频一区二区| 精品美女久久| 国产伦精品一区| 亚洲男人在线| 国产97在线|日韩| 55av亚洲| 久久久久久av| 黄色精品在线观看| 亚洲色图13p| 五月婷婷免费视频| 91精品国产乱码久久蜜臀| 中文字幕精品视频在线观看| 亚洲va欧美va人人爽| 人妻久久一区二区| 久久久久久亚洲综合影院红桃| 国产吃瓜黑料一区二区| 国产在线精品国自产拍免费| 成年人在线观看视频免费| 国产情侣一区| 国产美女在线一区| 亚洲视频观看| 91视频 - 88av| 97精品国产一区二区三区| 日本成人三级| 九九亚洲视频| 欧美1o一11sex性hdhd| 成人激情自拍| 国产精品久久一区二区三区| 亚洲高清在线一区| 国产噜噜噜噜噜久久久久久久久| 日韩欧美2区| 国产精品久久久久久久美男 | 97免费视频在线| 97超碰免费在线| 97热精品视频官网| 日韩av影片| 欧美在线视频观看| 久久毛片亚洲| 国产精品69av| 久久日本片精品aaaaa国产| 国产精品美乳一区二区免费| 亚洲www啪成人一区二区| 国产精品h在线观看| 免费在线成人激情电影| 欧美精品第一页在线播放| 天堂av在线电影| 久久人人爽人人| 国产探花视频在线观看| 2019中文在线观看| 欧亚一区二区| 成人影片在线播放| 国产精品午夜一区二区三区| 久久精品国产精品亚洲精品色| 亚洲日本免费| 亚洲色图偷拍视频| 99精品热视频| 日韩激情综合网| 色综合天天天天做夜夜夜夜做| 国产免费黄色录像| 亚洲美女av黄| 亚洲wwwww| 国产精品电影一区| 加勒比色综合久久久久久久久| 性欧美.com| 99精品热6080yy久久| www.99r| 久久久一区二区三区| 国产女片a归国片aa| 欧美最猛黑人xxxxx猛交| 肥臀熟女一区二区三区| 色偷偷91综合久久噜噜| 青青青免费在线视频| 91免费版黄色| 精品欧美久久| 色欲色香天天天综合网www| 精品一区二区三区在线视频| 9.1成人看片| 亚洲午夜精品久久久久久久久| 中文字幕久久久久| 亚洲欧美日韩网| av中文在线资源库| 91免费看片网站| 欧美手机在线| 国产精品欧美激情在线观看| 高清在线观看日韩| 成人免费黄色小视频| 欧美婷婷六月丁香综合色| 天堂中文在线资| 91精品国产自产91精品| 亚洲精品v亚洲精品v日韩精品| 天天成人综合网| 另类人妖一区二区av| 黄色片在线观看免费| 欧美午夜美女看片| 天天干视频在线| 欧美激情成人在线视频| 成人日韩视频| 欧美 另类 交| 国模娜娜一区二区三区| 日本黄区免费视频观看| 在线免费观看不卡av| 国产综合视频一区二区三区免费| 992tv成人免费影院| 波多野结衣欧美| 久久福利一区二区| 国产精品1区2区3区| 美女福利视频在线观看| 欧美一区二区播放| 1024在线播放| 99re在线观看| 欧美日韩免费| 最新国产精品自拍| 亚洲国产日韩综合久久精品| wwwav在线播放| 久久免费福利视频| 久久草在线视频| 欧美 日韩 国产在线观看| 99久久99久久免费精品蜜臀| 久久久久久91亚洲精品中文字幕| 欧美精品一区视频| 小h片在线观看| 热舞福利精品大尺度视频| 日韩av电影一区| 亚洲怡红院在线观看| 欧美一区二区久久| 黄污视频在线观看| 久久综合一区| 免费精品99久久国产综合精品| 黑人狂躁日本娇小| 日韩精品一区二区三区四区视频 | 亚洲男人天堂一区| www.成人在线观看| 性色av香蕉一区二区| 亚洲人成网站77777在线观看| 中文久久久久久| 日韩毛片在线免费观看| 亚洲国产一二三区| 欧美亚洲国产精品| 久久国产成人精品| 91精品人妻一区二区三区四区| 午夜视频一区二区三区| 国产小视频在线播放| 国产日韩在线看片| 激情丁香综合| 一级黄色录像毛片| 日韩免费视频一区二区| 中文在线最新版地址| 亚洲自拍偷拍二区| 成人免费视频视频在线观看免费| 欧美日韩乱国产| 中文字幕一区二区精品| 91成人在线精品视频| 久久久国产欧美| 亚洲一区二区不卡免费| 精品亚洲综合| 亚洲自拍av在线| 麻豆九一精品爱看视频在线观看免费| 久久一级免费视频| 国产丝袜精品第一页| 91久久青草| 大j8黑人w巨大888a片| 国产精品白丝在线| 亚洲色图21p| 91原创国产| 免费观看30秒视频久久| 日韩av女优在线观看|