精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OpenAI沒說的秘密,Meta全揭了?華人一作GPT-4o同款技術(shù),爆打擴(kuò)散王者

人工智能 新聞
自回歸模型,首次生成2048×2048分辨率圖像!來自Meta、西北大學(xué)、新加坡國立大學(xué)等機(jī)構(gòu)的研究人員,專門為多模態(tài)大語言模型(MLLMs)設(shè)計(jì)的TokenShuffle,顯著減少了計(jì)算中的視覺Token數(shù)量,提升效率并支持高分辨率圖像合成。

圖片

GPT-4o生成的第一視角機(jī)器人打字圖

這次,來自Meta等機(jī)構(gòu)的研究者,發(fā)現(xiàn)在多模態(tài)大語言模型(MLLMs)中,視覺詞表存在維度冗余:視覺編碼器輸出的低維視覺特征,被直接映射到高維語言詞表空間。

研究者提出了一種簡單而新穎的Transformer圖像token壓縮方法:Token-Shuffle。

他們設(shè)計(jì)了兩項(xiàng)關(guān)鍵操作:

  1. token混洗(token-shuffle):沿通道維度合并空間局部token,用來減少輸入token數(shù);
  2. token解混(token-unshuffle):在Transformer塊后解構(gòu)推斷token,用來恢復(fù)輸出空間結(jié)構(gòu)。

在輸入準(zhǔn)備階段,通過一個(gè)MLP模塊將空間上相鄰的token進(jìn)行融合,形成一個(gè)壓縮后的token,同時(shí)保留局部的關(guān)鍵信息。

對于打亂窗口大小為s的情況,token數(shù)量會按s的平方減少,從而大幅降低Transformer的運(yùn)算量。

圖片

圖3:視覺詞匯維度冗余的示意圖。左側(cè):通過兩個(gè)MLP操作將視覺token的秩降低r倍。右側(cè):不同r值下的預(yù)訓(xùn)練損失(對數(shù)刻度困惑度)

在經(jīng)過Transformer層處理后,token-unshuffle操作重新還原出原本的空間排列過程。這一階段同樣借助了輕量級的MLP模塊。

本質(zhì)上,新方法在訓(xùn)練和推理過程中并未真正減少序列長度,而是在Transformer計(jì)算過程中,有效減少了token數(shù)量,從而加速計(jì)算。

圖4直觀地展示了新方法在效率上的提升。

圖片

圖4:Token-Shuffle能夠?qū)崿F(xiàn)計(jì)算效率的二次提升

通過在Transformer計(jì)算期間壓縮token序列,Token-Shuffle實(shí)現(xiàn)了高效的高分辨率圖像生成,包括支持2048×2048分辨率的圖像。

重要的是,這種方法無需對Transformer架構(gòu)本身進(jìn)行修改,也不引入輔助損失函數(shù)或需要額外預(yù)訓(xùn)練的編碼器。

此外,該方法還集成了一個(gè)針對自回歸生成專門調(diào)整的無分類器引導(dǎo)(Classifier-Free Guidance,CFG)調(diào)度器

不同于傳統(tǒng)的固定引導(dǎo)強(qiáng)度,新的CFG調(diào)度器在推理過程中逐步調(diào)整引導(dǎo)力度,減少早期token生成的偽影問題,并進(jìn)一步提升文本與圖像的對齊效果。

研究者探索了幾種CFG調(diào)度策略,相關(guān)結(jié)果展示在圖5中。

根據(jù)視覺質(zhì)量和人類評估的反饋,默認(rèn)采用「半線性」(half-linear)調(diào)度器,以獲得更好的生成效果。

圖片

圖5:不同CFG調(diào)度器的比較,CFG尺度從1單調(diào)增加到7.5

右側(cè)結(jié)果顯示,相較于在所有視覺token上使用固定7.5的CFG值,采用CFG調(diào)度器能夠同時(shí)提升圖像的美學(xué)質(zhì)量和文本對齊效果。

圖片

不同無分類器引導(dǎo)(CFG)尺度下的生成圖像示例

自回歸的歷史性突破

該方法通過與文本提示聯(lián)合訓(xùn)練,無需額外預(yù)訓(xùn)練文本編碼器,就能讓MLLMs在下一個(gè)token預(yù)測框架下,支持超高分辨率圖像合成,同時(shí)保持高效訓(xùn)練推理。

這是自回歸模型首次實(shí)現(xiàn)2048×2048分辨率的文生圖。

在GenAI基準(zhǔn)測試中,27億參數(shù)Llama模型在困難提示下取得0.77綜合得分,較AR模型LlamaGen提升0.18,超越擴(kuò)散模型LDM達(dá)0.15。

大規(guī)模人工評估也證實(shí)新方法在文本對齊度、視覺缺陷率和美學(xué)質(zhì)量上的全面優(yōu)勢。

在MLLMs高效生成高分辨率圖像領(lǐng)域,Token-Shuffle有望成為基準(zhǔn)設(shè)計(jì)方案。

消融實(shí)驗(yàn)等更多內(nèi)容和細(xì)節(jié),參閱原論文。

模型訓(xùn)練:3步曲

實(shí)驗(yàn)使用2.7B Llama模型,維度為3072,由20個(gè)自回歸Transformer模塊組成。

模型的預(yù)訓(xùn)練被分為3個(gè)階段,從低分辨率到高分辨率圖像生成。

首先,研究者使用512×512分辨率的圖像進(jìn)行訓(xùn)練,在此階段不使用Token-Shuffle操作,因?yàn)榇藭r(shí)視覺token的數(shù)量并不大。在這一階段,他們訓(xùn)練了約50億個(gè)token,使用4K的序列長度、512的全局批量大小和總共211K步。

接下來,研究者將圖像分辨率提升到1024×1024,并引入Token-Shuffle操作,減少視覺token數(shù)量,提高計(jì)算效率。在這一階段,他們將訓(xùn)練token數(shù)量擴(kuò)展到2TB

最后,研究者使用之前訓(xùn)練的checkpoint,將分辨率進(jìn)一步提升至2048×2048,訓(xùn)練約300億個(gè)token,初始學(xué)習(xí)率設(shè)為4e?5。

他們引入了z-loss,用于穩(wěn)定高分辨率圖像生成的訓(xùn)練。

圖片

原文圖11:在2048×2048分辨率下訓(xùn)練時(shí)的平均損失(左)和梯度范數(shù)(右)。在大約20K次迭代后出現(xiàn)訓(xùn)練不穩(wěn)定現(xiàn)象

在不同階段,研究者對所有模型進(jìn)行了微調(diào),學(xué)習(xí)率為4e?6,使用1500張精選的高美學(xué)質(zhì)量圖像進(jìn)行展示。

默認(rèn)情況下,除非另有說明,可視化和評估是基于1024×1024分辨率和2大小的token-shuffle窗口的微調(diào)結(jié)果。

量化評估:又快又好

表1中的結(jié)果突顯了Token-Shuffle的強(qiáng)大性能。

與其他自回歸模型相比,新方法在「基本」(basic)提示上整體得分超越LlamaGen 0.14分,在「高難度」(hard)提示上超越0.18分。

與擴(kuò)散基準(zhǔn)相比,新方法在「高難度」提示上超越DALL-E 3 0.7分。

圖片

表1:在GenAI-Bench上的圖像生成VQAScore評估。「?」表示圖像是通過Llama3重寫提示生成的,保證訓(xùn)練與推理的一致性

除了表1中報(bào)告的VQAScore結(jié)果外,研究者還進(jìn)行了額外的自動評估GenEval,并在表2中報(bào)告了詳細(xì)的評估結(jié)果。

實(shí)驗(yàn)結(jié)果表明,除了高分辨率外,Token-Shuffle作為一個(gè)純自回歸模型,能夠呈現(xiàn)出令人滿意的生成質(zhì)量。

圖片

表2:在GenEval基準(zhǔn)測試上的評估。

人類評估

盡管自動化評估指標(biāo)提供了無偏的評估,但最近的研究所指出它們可能并不能完全捕捉到人類偏好。

為此,研究者還在GenAI-Bench提示集上進(jìn)行了大規(guī)模的人類評估,將新模型Token-Shuffle與LlamaGen、LuminamGPT和LDM進(jìn)行了比較,分別代表了自回歸模型、MLLM和擴(kuò)散模型。

在人類評估中,重點(diǎn)關(guān)注三個(gè)關(guān)鍵指標(biāo):

  1. 文本對齊,評估圖像與文本提示的匹配準(zhǔn)確度;
  2. 視覺缺陷,檢查邏輯一致性,避免出現(xiàn)不完整的身體或多余的肢體等問題;
  3. 視覺外觀,評估圖像的美學(xué)質(zhì)量。

圖片

存在視覺缺陷與結(jié)構(gòu)錯(cuò)誤的生成圖像示例(紅色圓圈標(biāo)記處)

圖6展示了結(jié)果,新模型在所有評估方面始終優(yōu)于基于自回歸的模型LlamaGen和LuminamGPT。

這表明,即使在大幅減少token數(shù)量以提高效率的情況下,Token-Shuffle也能有效地保留美學(xué)細(xì)節(jié),并且能夠緊密遵循文本引導(dǎo),前提是進(jìn)行了充分的訓(xùn)練。

在生成結(jié)果(無論是視覺外觀還是文本對齊)上,研究者展示了基于自回歸的多模態(tài)大語言模型(AR-based MLLMs)能夠與擴(kuò)散模型相媲美或更勝一籌。

然而,研究者觀察到,Token-Shuffle在視覺缺陷方面略遜于LDM。

圖片

圖6:人類評估結(jié)果|在文本對齊、視覺缺陷和視覺外觀方面等方面,比較了Token-Shuffle與無文本的自回歸模型LlamaGen、帶文本的自回歸模型Lumina-mGPT以及基于擴(kuò)散的模型LDM的表現(xiàn)

可視化示例

研究者將Token-Shuffle與其他模型進(jìn)行了視覺效果對比,包括兩種基于擴(kuò)散的模型LDM和Pixart-LCM,以及一種自回歸模型LlamaGen。

圖7展示了可視化例子。

雖然所有模型的生成效果都不錯(cuò),但Token-Shuffle在文本對齊方面表現(xiàn)得更加出色。

與自回歸模型LlamaGen相比,Token-Shuffle在相同推理開銷下實(shí)現(xiàn)了更高的分辨率,帶來了更好的視覺質(zhì)量和文本對齊效果。

與擴(kuò)散模型相比,自回歸模型Token-Shuffle在生成性能上表現(xiàn)出競爭力,同時(shí)還能支持高分辨率輸出。

圖片

圖7:與其他開源的基于擴(kuò)散模型和基于自回歸模型的視覺效果對比

一作簡介

馬旭(Xu Ma)

圖片

圖片

他是美國東北大學(xué)工程學(xué)院的博士研究生。

在此之前,他在美國德克薩斯大學(xué)北部分校計(jì)算機(jī)科學(xué)與工程系工作了兩年。

在南京林業(yè)大學(xué)信息科學(xué)與技術(shù)學(xué)院, 他獲得了學(xué)士和碩士學(xué)位。

他的研究興趣包括:模型效率、多模態(tài)大語言模型(LLM)、生成式人工智能(Generative AI)。

在博士學(xué)習(xí)期間,他獲得了一些獎項(xiàng),包括ICME'20最佳學(xué)生論文獎、SEC'19最佳論文獎、NeurIPS'22杰出審稿人獎和CVPR'23杰出審稿人獎。


責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-03-31 08:50:00

AI生成模型

2024-11-22 14:10:00

AI智能體

2025-04-08 02:26:00

2024-05-16 12:38:05

GPT-4o圖像方式

2025-04-07 00:00:00

OpenAIGPT-4o圖像

2024-05-21 12:23:17

2025-08-07 14:05:40

OpenAI大模型開源

2024-07-04 15:26:56

2024-06-05 08:29:35

2025-05-26 09:05:00

2024-06-21 09:51:17

2024-08-14 14:30:00

AI訓(xùn)練

2024-05-14 11:29:15

2024-05-24 13:32:59

2024-05-15 17:34:15

2024-08-08 14:27:29

2024-10-17 13:30:00

2024-07-22 15:13:24

2024-08-22 13:40:08

開發(fā)者GPT-4oepoch

2024-07-04 15:30:07

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

国产高清中文字幕| theav精尽人亡av| 成人ww免费完整版在线观看| 国产成人亚洲综合a∨猫咪| 91高清视频在线免费观看| 久久精品无码一区| 日韩精品亚洲专区在线观看| 精品久久中文字幕久久av| 亚洲电影一二三区| 日本高清视频在线| 美女爽到高潮91| 性视频1819p久久| 91久久久久久久久久久久久久| 国产精品xxxav免费视频| 欧洲国内综合视频| 欧美激情视频免费看| 137大胆人体在线观看| 波多野洁衣一区| 成人黄色在线观看| 天天爽夜夜爽人人爽| 在线免费高清一区二区三区| 色老头一区二区三区| 成人无码www在线看免费| www.久久久.com| 欧美视频精品在线观看| 奇米精品一区二区三区| 亚洲91av| 亚洲情趣在线观看| 日韩中文字幕av在线| 午夜福利视频一区二区| 国产福利不卡视频| 国产精品色婷婷视频| 欧美成人一区二区三区四区| 欧美午夜不卡| 伦伦影院午夜日韩欧美限制| 日本美女xxx| 国产在线观看91一区二区三区| 亚洲成人精品av| 无码人妻少妇色欲av一区二区| 韩国精品视频在线观看 | 在线亚洲男人天堂| 色婷婷在线影院| 日韩理论电影中文字幕| 精品国产成人系列| 精品久久久久久无码人妻| 激情久久免费视频| 制服丝袜日韩国产| 在线观看日本www| gogo大尺度成人免费视频| 欧美高清激情brazzers| 亚洲人视频在线| 超碰国产精品一区二页| 欧美日韩mp4| 中文字幕在线观看日| 在线欧美激情| 欧美一区二区三区播放老司机| 久久久精品高清| 欧美高清hd| 欧美成人一级视频| 波多野结衣一二三区| 噜噜噜狠狠夜夜躁精品仙踪林| 亚洲成色777777在线观看影院| 99国产精品免费视频| 懂色av一区二区| 亚洲国产成人久久综合一区| 国产黄色三级网站| 九一亚洲精品| 中文字幕欧美视频在线| 中文字幕观看av| 午夜久久美女| 欧美精品xxx| 婷婷激情五月网| 日韩成人午夜电影| 成人免费网视频| 黑人精品一区二区| 久久综合狠狠综合久久激情| 日本精品一区二区| 欧美性天天影视| 洋洋av久久久久久久一区| 国产一区二区三区乱码| 亚洲最大网站| 在线播放亚洲一区| 亚洲国产精品第一页| 亚州av一区| 久久精品青青大伊人av| 国产在线视频在线观看| 免费亚洲婷婷| 91久久久久久久久| 手机在线不卡av| 中文一区二区完整视频在线观看| 手机在线视频你懂的| 波多野结衣精品| 欧美在线免费视屏| 性猛交╳xxx乱大交| 少妇一区二区视频| 毛片精品免费在线观看| 一级片在线观看免费| 狠狠色丁香婷综合久久| 久久久久久久有限公司| 九色porny在线| 欧美日韩亚洲视频| 一级黄色高清视频| 精品国产91| 欧美激情国产精品| 亚洲一卡二卡在线观看| 丰满白嫩尤物一区二区| 亚洲资源在线网| 国产黄大片在线观看| 欧美日韩国产一级片| 美女黄色一级视频| 伊人久久大香线蕉精品组织观看| 欧美专区第一页| 隣の若妻さん波多野结衣| 中文字幕高清不卡| 欧美成人xxxxx| 爱爱精品视频| 久久综合88中文色鬼| 亚洲天堂男人av| 成人国产精品免费观看动漫| 一区二区视频在线观看| 国产精品一区二区av影院萌芽| 日韩欧美一级二级| 肉色超薄丝袜脚交69xx图片| 蜜乳av另类精品一区二区| 99热在线国产| jizzjizz亚洲| 91精品午夜视频| 一级黄色毛毛片| 日韩国产精品91| 欧美成人蜜桃| 天堂√8在线中文| 亚洲黄色成人网| 久久免费精彩视频| 国产传媒一区在线| 97精品国产97久久久久久粉红| 成人不卡视频| 中文字幕无线精品亚洲乱码一区 | 在线观看国产91| 丝袜美腿中文字幕| 在线综合亚洲| 久久久久一区二区三区| 欧美激情网站| 日韩精品免费在线播放| 精品国产乱码一区二区| 成人精品视频.| www..com日韩| 欧美一区自拍| 奇米4444一区二区三区| 欧美少妇另类| 色偷偷久久一区二区三区| 30一40一50老女人毛片| 久久精品一区二区国产| 欧美亚洲另类久久综合| 新片速递亚洲合集欧美合集| 国产亚洲精品日韩| 中文字幕第一页在线播放| 国产精品你懂的在线| wwwwwxxxx日本| 亚洲视频在线免费| 超碰在线观看97| 国产精品xx| 亚洲欧美中文另类| 中文在线a天堂| 亚洲人妖av一区二区| 手机看片国产精品| 亚洲精华国产欧美| 欧美日韩在线精品| 色婷婷成人网| 欧美激情欧美激情| 水中色av综合| 在线观看一区二区精品视频| 日本裸体美女视频| 国产v综合v亚洲欧| 日本一极黄色片| 久久免费精品视频在这里| 97超级碰碰| 蜜臀久久精品| 日韩在线视频导航| www.蜜桃av.com| 色综合欧美在线| 亚洲伦理一区二区三区| 成人h动漫精品| 黄色一级免费大片| 欧美日韩ab| 欧美自拍资源在线| 国产麻豆精品| 奇门遁甲1982国语版免费观看高清 | 激情欧美一区二区三区在线观看| 欧美激情亚洲天堂| 国产毛片精品| 国产精品网红福利| h片在线观看下载| 国产性猛交xxxx免费看久久| 国产成人三级一区二区在线观看一| 亚洲国产精品久久艾草纯爱| 欧美三级视频网站| 国产jizzjizz一区二区| 韩国日本美国免费毛片| 欧美激情四色| 视频一区二区综合| 狠狠一区二区三区| 国产日韩欧美中文在线播放| 韩国精品一区| 操日韩av在线电影| 福利在线观看| 亚洲国产福利在线| 精品久久久免费视频| 一本色道久久综合亚洲aⅴ蜜桃| 91在线播放观看| 国产欧美精品一区aⅴ影院 | 欧美大成色www永久网站婷| 亚洲av片在线观看| 日韩一级黄色片| 中文字幕乱码无码人妻系列蜜桃| 午夜在线成人av| 男人操女人的视频网站| 国产欧美日韩在线| 成人精品在线观看视频| 丰满少妇久久久久久久| 亚洲精品第三页| 日本亚洲欧美天堂免费| 国产老熟妇精品观看| 欧美大片一区| 女女同性女同一区二区三区按摩| 色天下一区二区三区| 国产乱码精品一区二区三区日韩精品 | 曰本三级日本三级日本三级| 美女诱惑一区二区| 黄色一级二级三级| 久久国产高清| 国产最新免费视频| 99在线|亚洲一区二区| 国产精品69久久久| 亚洲一级二级| 日本五级黄色片| 欧美日韩免费观看一区=区三区| 欧美少妇一级片| 93在线视频精品免费观看| 亚洲第一综合| 欧美xxav| 香蕉精品视频在线| 99久久久久国产精品| 亚洲精品影院| 97精品在线| 正在播放一区| 欧美一区国产在线| www婷婷av久久久影片| 欧美在线亚洲综合一区| 人妻激情另类乱人伦人妻| 欧美区一区二| 免费高清一区二区三区| 亚洲最黄网站| 农村妇女精品一二区| 久久国产精品毛片| 亚洲视频在线观看一区二区三区| 三级一区在线视频先锋| 三级在线视频观看| 九九国产精品视频| 久久无码人妻一区二区三区| 国产成人h网站| 亚洲少妇18p| 久久人人97超碰com| www.黄色在线| 亚洲欧美日韩国产综合| 久久97人妻无码一区二区三区| 亚洲第一久久影院| 中文字幕黄色片| 欧美剧情片在线观看| 精品毛片在线观看| 亚洲韩国青草视频| 懂色av中文在线| 免费av一区二区| 999精品网| 国产精品igao视频| 成人精品在线| 精品日韩电影| 日韩毛片视频| 无码粉嫩虎白一线天在线观看| 国产美女一区| 日本黄大片一区二区三区| 国产成人综合自拍| 九色porny自拍视频| 自拍偷自拍亚洲精品播放| 好吊操这里只有精品| 欧美午夜精品久久久久久孕妇| 国产精品久久久久久免费播放| 精品精品国产高清一毛片一天堂| 人成在线免费视频| 久久精视频免费在线久久完整在线看| 国产理论电影在线| 国产精品av在线| 成人福利一区| 亚洲欧美电影在线观看| 极品av少妇一区二区| jizz18女人| 成人午夜激情影院| 91视频免费看片| 欧美日韩国产一区二区| 国产片高清在线观看| 亚洲片av在线| 182在线视频观看| 国产精品一区二区三区毛片淫片| 99久久免费精品国产72精品九九| 日韩精品久久一区二区三区| 午夜天堂精品久久久久| 别急慢慢来1978如如2| 东方aⅴ免费观看久久av| 激情五月深爱五月| 福利一区福利二区微拍刺激| 国产麻豆91视频| 亚洲色图18p| 2019中文字幕在线电影免费| 亚洲a成v人在线观看| 国产在线观看91一区二区三区| www.xxx麻豆| 国产精品一二三区在线| 国产精品视频在| 色网综合在线观看| 亚洲欧洲精品视频| 久久久久女教师免费一区| 免费成人黄色网| 日韩精品一区二区三区外面| 亚洲青色在线| 丰满人妻一区二区三区免费视频棣| 亚洲欧洲精品一区二区三区 | 精品国产不卡一区二区三区| 黄色av电影在线观看| 国产精品羞羞答答| 欧美色女视频| www.99在线| 国产亚洲一本大道中文在线| 国产www在线| 日韩精品有码在线观看| 蜜桃在线视频| 久久久一本精品99久久精品66| 亚洲福利一区| 日本一级片在线播放| 亚洲第一福利一区| 日本免费网站在线观看| 欧美—级高清免费播放| 视频一区中文字幕精品| 天天综合五月天| 国产精品一区二区黑丝| 免费无码毛片一区二区app| 日韩视频永久免费| 色在线视频网| 国产精品一区二区三区不卡| 伊人久久亚洲美女图片| 亚洲麻豆一区二区三区| 亚洲成人av电影在线| 亚洲aaaaaaa| 日产精品99久久久久久| 韩日一区二区三区| jizz大全欧美jizzcom| 国产精品成人一区二区艾草 | 五月婷婷一区二区| 精品欧美乱码久久久久久1区2区| 国产高清在线a视频大全| 国产精品免费视频一区二区 | 97在线视频观看| 欧美丝袜美腿| 手机看片福利盒子久久| 国产精品亲子伦对白| 国产美女永久免费| 久久久视频在线| 亚洲毛片免费看| 天堂一区在线观看| 亚洲激情av在线| 亚洲av成人精品一区二区三区在线播放| 日本久久久久久久久| 成人在线免费观看视频| 91免费视频污| 欧美日韩性视频| 最近高清中文在线字幕在线观看| 亚洲自拍高清视频网站| 99亚洲伊人久久精品影院红桃| www.av天天| 欧美一区二区在线看| 黄毛片在线观看| 亚洲一二区在线| 国产不卡在线播放| 天天爱天天做天天爽| 久久成人精品一区二区三区| 欧美亚洲色图校园春色| www.99r| 精品动漫一区二区三区| 91视频在线观看| 国产一区二区三区四区hd| 免费av网站大全久久| 国产真人真事毛片| 中文字幕日韩av电影| 国产精品欧美大片| 亚洲第一狼人区| 天天综合天天做天天综合| 午夜在线观看视频| 精品无人区一区二区三区| 久久99国产精品免费网站| 久久久精品福利| 欧美激情精品久久久久久变态| 成人综合一区|