精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ETT:打破原生多模態(tài)學習視覺瓶頸,重塑視覺tokenizer優(yōu)化范式

人工智能 新聞
我們提出了 ETT(End-to-End Vision Tokenizer Tuning),一種全新的端到端視覺 tokenizer 調(diào)優(yōu)方法。

本文由北京智源研究院多模態(tài)大模型研究中心(團隊負責人王鑫龍,團隊代表作 EMU 系列、EVA 系列、Painter & SegGPT)、中科院自動化所和大連理工大學聯(lián)合完成。 

在多模態(tài)學習蓬勃發(fā)展的當下,視覺 tokenizer 作為連接視覺信息與下游任務的關鍵橋梁,其性能優(yōu)劣直接決定了多模態(tài)模型的表現(xiàn)。然而,傳統(tǒng)的視覺 tokenization 方法存在一個致命缺陷:視覺 tokenizer 的優(yōu)化與下游任務的訓練是相互割裂的。

這種分離式的訓練范式假設視覺 tokens 能夠在不同任務間無縫通用,但現(xiàn)實情況是,為低級重建任務優(yōu)化的視覺 tokenizer 往往難以滿足諸如圖像生成、視覺問答等需要豐富語義表示的下游任務需求,導致下游任務的性能受限。

針對這一亟待解決的問題,我們提出了 ETT(End-to-End Vision Tokenizer Tuning),一種全新的端到端視覺 tokenizer 調(diào)優(yōu)方法。

圖片

  • 論文標題:End-to-End Vision Tokenizer Tuning
  • arXiv 鏈接:https://arxiv.org/abs/2505.10562

ETT 創(chuàng)新性地實現(xiàn)了視覺 tokenization 與目標自回歸任務的聯(lián)合優(yōu)化,打破了傳統(tǒng)方法中視覺 tokenizer 一旦訓練完成便固定的常規(guī),充分釋放了視覺 tokenizer 在多模態(tài)學習中的潛力,為多模態(tài)任務帶來了顯著的性能提升。

傳統(tǒng)方法的局限與 ETT 的突破

在現(xiàn)有的多模態(tài)預訓練框架中,如 Emu3 等工作,雖然通過將圖像、文本等多模態(tài)數(shù)據(jù)編碼為離散 tokens 實現(xiàn)了統(tǒng)一的序列建模,但在實際操作中,這些方法僅僅利用了凍結(jié)的視覺 tokenizer 的離散索引,這不僅極大地浪費了視覺 tokenizer 的豐富特征表示能力,還阻礙了端到端訓練的實現(xiàn),使得視覺 tokenizer 無法根據(jù)下游任務的具體需求進行針對性優(yōu)化。

ETT 的出現(xiàn)徹底改變了這一局面。我們巧妙地引入視覺 tokenizer 的碼本嵌入,取代了以往僅使用離散索引的方式,并結(jié)合 token 級別的字幕損失函數(shù),對視覺 tokenizer 和下游任務進行聯(lián)合優(yōu)化。這樣一來,ETT 不僅能夠充分利用視覺 tokenizer 內(nèi)部的豐富特征表示,還能讓視覺 tokenizer 根據(jù)下游任務的反饋不斷調(diào)整自身參數(shù),從而更好地適應多模態(tài)理解與生成任務的需求。

圖片

ETT 的核心架構(gòu)與訓練策略

ETT 的核心架構(gòu)基于改進的 IBQ 框架。我們通過精心調(diào)整碼本大小至 131,072 并將特征維度設置為 256,成功構(gòu)建了一個高效的視覺 tokenizer。

在訓練初期,我們利用編碼器將輸入圖像映射到特征空間,經(jīng)量化器將特征映射到離散碼本后,再由解碼器重建圖像,這一過程奠定了視覺 tokenizer 的基礎重構(gòu)能力。我們還引入了多層感知機作為投影層,將視覺嵌入與預訓練大型語言模型的隱藏層維度相匹配,從而實現(xiàn)視覺信息到語言模型的有效映射。

ETT 的訓練策略層次分明且重點突出。前期對齊學習階段,我們在保持預訓練的大型語言模型和視覺 tokenizer 參數(shù)凍結(jié)的狀態(tài)下,僅訓練視覺投影層,利用圖像到文本的 caption 損失函數(shù),使語言模型能夠從視覺 tokenizer 中直接獲取視覺概念和實體,從而建立起視覺與語言模態(tài)之間的初步聯(lián)系。

緊接著,在語義學習階段,我們解凍大型語言模型、投影層以及視覺 tokenizer 的權(quán)重,通過聯(lián)合優(yōu)化 caption 損失函數(shù)和重建損失函數(shù),對它們進行端到端的訓練,使視覺 tokenizer 能夠在保持圖像重建能力的同時,學習到更強大的感知能力,以支持多模態(tài)理解和重建任務。

第二階段是 ETT 方法的核心創(chuàng)新,讓視覺 tokenizer 得以根據(jù)下游任務需求深度調(diào)優(yōu),大幅提升其感知和表征能力。最后是后訓練階段,我們進一步對兩個專業(yè)模型進行微調(diào),以增強其在特定多模態(tài)任務中的表現(xiàn)。

圖片

ETT 的卓越性能表現(xiàn)

多模態(tài)理解

ETT 在多模態(tài)理解任務中展現(xiàn)出了卓越的性能。在 GQA、TextVQA 等特定任務評估,以及 POPE、MME、MMBench、SEED-Bench、MMVet 等廣泛基準測試中均取得了優(yōu)異成績,與現(xiàn)有最先進的視覺語言模型相比,在模型參數(shù)和數(shù)據(jù)規(guī)模更小的情況下,依然能夠取得更好的或具有競爭力的結(jié)果。

例如,在 MMBench 多模態(tài)理解基準測試中,ETT 的性能表現(xiàn)與連續(xù)編碼器基礎的視覺語言模型相當,甚至在某些子任務上更勝一籌,而無需額外的復雜視覺編碼器。這表明 ETT 通過端到端的視覺 tokenization 訓練方法,在減少計算開銷的同時,簡化了模型架構(gòu),并有效提升了多模態(tài)理解能力。

圖片

多模態(tài)生成

在視覺生成任務中,ETT 同樣表現(xiàn)出色。在 GenEval 和 T2I-CompBench 等廣泛使用的文本到圖像生成基準數(shù)據(jù)集上,ETT 實現(xiàn)了與其他最先進的基于擴散模型和自回歸模型的方法相媲美的性能,同時在模型參數(shù)和訓練數(shù)據(jù)規(guī)模上更具優(yōu)勢。特別是在 T2I-CompBench 數(shù)據(jù)集的顏色、形狀和紋理模式等子任務上,ETT 取得了令人滿意的成績,充分證明了其在文本到圖像生成任務中的強大能力。

圖片

此外,ETT 在定性結(jié)果方面也展現(xiàn)出了其優(yōu)勢。通過生成的圖像樣本可以看出,ETT 能夠準確地遵循文本提示,生成風格多樣、細節(jié)豐富的視覺內(nèi)容,涵蓋了不同的藝術(shù)風格、主題和背景,并能夠適應不同的構(gòu)圖結(jié)構(gòu)和審美偏好。

圖片

視覺重構(gòu)

ETT 在視覺重構(gòu)任務中的表現(xiàn)同樣令人矚目。通過對比引入 ETT 前后的視覺重構(gòu)結(jié)果,我們可以看到,ETT 不僅保留了原始視覺 tokenizer 的豐富低級細節(jié)表示,還有效提升了高級語義表示能力。

圖片

如上圖所示,經(jīng)過 ETT 調(diào)優(yōu)后的視覺 tokenizer 在保留原始視覺細節(jié)的同時,顯著提升了特定方面的表現(xiàn),例如文本渲染效果更好。這表明 ETT 能夠在保持圖像重建質(zhì)量的同時,增強視覺 tokenizer 的語義表達能力,為進一步的多模態(tài)任務提供更優(yōu)質(zhì)的視覺表示。

ETT 的潛在局限與未來發(fā)展

盡管 ETT 在多模態(tài)任務中取得了顯著的性能提升,但我們也意識到當前方法存在一定的局限性。

首先,ETT 的端到端微調(diào)所使用的數(shù)據(jù)規(guī)模和模型容量仍有進一步擴大的潛力,以進一步提升視覺表示質(zhì)量和下游任務性能。其次,ETT 主要側(cè)重于利用大型語言模型的語義能力優(yōu)化現(xiàn)有視覺 tokenizer 的視覺特征,而非從頭開始設計一個同時適用于理解和生成的視覺 tokenizer。

未來,我們計劃探索從頭開始端到端訓練視覺 tokenizer,以創(chuàng)建一個更全面、更適應多模態(tài)任務的表示方法。此外,將 ETT 的方法擴展到圖像和文本之外的其他模態(tài),如視頻和音頻,也是一個令人興奮的研究方向。

總的來說,ETT 作為一種簡單而有效的端到端視覺 tokenizer 調(diào)優(yōu)方法,易于實現(xiàn)和集成,為原生多模態(tài)學習領域帶來了新的突破。通過優(yōu)化視覺 tokenizer 的特征表示,ETT 為提升多模態(tài)模型的性能提供了新的思路和方法,有望推動多模態(tài)基礎模型在更廣泛的領域的應用和發(fā)展。我們期待 ETT 的出現(xiàn)能夠激發(fā)更多關于視覺 tokenization 和多模態(tài)學習的研究,共同探索這一充滿潛力的領域。

作者介紹

王文軒,中科院自動化所-北京智源研究院聯(lián)培博士,研究方向為視覺語言模型、多模態(tài)理解生成等,在 ICLR、CVPR、ECCV、ACL 等頂級會議上發(fā)表過多篇論文; 

張帆、崔玉峰,智源研究院研究員,研究方向為原生多模態(tài)模型、視覺生成等,Emu 系列工作核心作者; 

刁海文,大連理工大學博士,研究方向包括大模型高效遷移、多模態(tài)基座大模型等,在 NeurIPS、ICLR、CVPR、ECCV 等頂級會議上發(fā)表過多篇論文; 

羅卓彥,清華大學碩士,研究方向為視覺生成等,在 NeurIPS、CVPR 等頂級會議上發(fā)表過論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-27 09:08:00

AI視覺模型

2024-11-13 09:39:13

2025-02-26 13:00:00

2024-10-22 13:33:48

2024-07-16 13:18:36

2024-03-01 12:19:00

接口性能優(yōu)化

2025-08-05 15:10:25

機器人視覺訓練

2024-07-23 10:34:57

2024-10-06 10:00:00

3D模型

2025-07-07 13:49:38

模型AI視覺

2024-12-13 14:30:00

AI模型數(shù)據(jù)

2024-08-08 13:04:28

2025-04-07 04:30:00

2025-06-26 09:13:22

2025-03-10 08:47:00

模型AI訓練

2024-12-18 14:50:00

AI訓練數(shù)據(jù)

2025-07-15 09:00:00

2025-10-16 09:00:00

2025-07-04 08:43:00

2025-02-27 09:51:04

點贊
收藏

51CTO技術(shù)棧公眾號

亚洲av无码一区东京热久久| 欧美一区二区高清在线观看| 2018天天弄| 97一区二区国产好的精华液| 五月天视频一区| 日日骚一区二区网站| 国产视频在线观看视频| 国内精品亚洲| 国产亚洲精品成人av久久ww| 国产精品久久久久久久av福利| 日韩伦理av| 久久久精品tv| y111111国产精品久久婷婷| 亚洲精品www久久久久久| 日本a口亚洲| 亚洲福利在线视频| 成人黄色一级大片| 亚洲黄色免费看| 亚洲欧美日韩在线不卡| 噜噜噜噜噜久久久久久91| 国产精品久久影视| 久久精品91| 欧美激情在线观看视频| 91精品国自产在线| 国内精品偷拍| 欧美一级高清片| 中文字幕亚洲精品| 国产区二精品视| 在线观看视频中文字幕| 在线视频日韩| 欧美二区在线播放| 免费成人深夜蜜桃视频| 亚洲宅男一区| 精品99999| 亚洲女人在线观看| yy6080久久伦理一区二区| 午夜电影一区二区三区| 玖玖精品在线视频| 又爽又大又黄a级毛片在线视频| 成人av免费观看| 亚洲淫片在线视频| 一区二区三区黄| 日韩精品福利网| 茄子视频成人在线| 91久久国产视频| 极品日韩av| 欧美精品成人在线| 欧美日韩激情在线观看| 99久久精品国产亚洲精品| 亚洲性av网站| 高清国产在线观看| 亚洲深夜福利在线观看| 精品香蕉在线观看视频一| wwwxxxx在线观看| 日本综合精品一区| 日韩一区二区三区在线| 欧美成人手机在线视频| 免费一级欧美片在线观看网站| 欧美日韩一区二区三区在线| 国产精品人人爽人人爽| 日本肉肉一区| 欧美视频你懂的| 午夜精品在线免费观看| 国产麻豆一区| 欧美精品tushy高清| 日本精品一区在线| 国产一区二区| 欧美α欧美αv大片| 性高潮免费视频| 成人直播在线观看| 日韩精品视频在线| 九九热这里有精品| 欧美日韩国产综合视频在线观看中文| 成年人视频网站免费| 国产资源中文字幕| 综合久久伊人| 91精品在线免费观看| 爽爽爽在线观看| 精品一级视频| 精品免费国产二区三区| 日本不卡视频一区| 理论片一区二区在线| 国产视频久久久久| 中文字幕av久久爽一区| 天天色综合色| 欧美精品激情在线观看| 日本三级一区二区| 日韩av中文在线观看| 国产精品久久久久久久久久| 国产精品毛片一区视频播| 国产精品一卡二| 国产精品二区三区四区| 欧美理论在线观看| 国产精品福利一区二区三区| 免费网站在线观看视频| 惠美惠精品网| 欧美一区二区视频在线观看2020| 高清中文字幕mv的电影| 欧洲乱码伦视频免费| 操人视频在线观看欧美| 天天干天天干天天干天天| 青青草国产成人av片免费| 97av影视网在线观看| 亚洲人妻一区二区| 亚洲欧美偷拍另类a∨色屁股| 国产一级爱c视频| 欧美大陆国产| 亚洲精品久久久久中文字幕欢迎你| 微拍福利一区二区| 欧美精品导航| 国产精品美女www| 成人午夜免费在线观看| 中文字幕成人av| 福利视频一二区| 成人激情久久| 亚洲一区999| 免费毛片一区二区三区| 九九国产精品视频| 欧美日韩高清免费| 91桃色在线| 91精品国产日韩91久久久久久| 人妻丰满熟妇aⅴ无码| 欧美一区二区三区久久精品茉莉花| 日本老师69xxx| 色呦呦视频在线| 亚洲精品欧美激情| 午夜免费看视频| 国产一区二区三区站长工具| 国产69精品久久久| 国产美女免费视频| 国产精品免费aⅴ片在线观看| 日韩激情免费视频| 97se亚洲国产一区二区三区| 色偷偷噜噜噜亚洲男人的天堂| 五月婷婷开心网| 成人丝袜18视频在线观看| 亚洲一区二区在线看| 欧美magnet| 精品无码久久久久久国产| 久久久久97国产| 国产麻豆日韩欧美久久| 亚洲一卡二卡| 国产欧美自拍| 中文字幕精品一区久久久久 | 伊人精品在线视频| 久久久不卡网国产精品一区| 亚洲午夜无码av毛片久久| 好吊妞国产欧美日韩免费观看网站 | 亚洲av综合色区无码另类小说| 欧美激情成人| 国产在线久久久| 黄色片网站在线观看| 欧美久久一区二区| 成人做爰视频网站| 精品一区二区日韩| 久久久成人精品一区二区三区| 亚洲精品无播放器在线播放| 久久精品国产免费观看| 国产三级小视频| 亚洲电影在线免费观看| 国产不卡一二三| 香蕉av777xxx色综合一区| 玛丽玛丽电影原版免费观看1977| 天堂中文av在线资源库| 亚洲精品一区二区在线| 成人免费视频国产免费| 欧美国产丝袜视频| 最新av免费在线观看| 欧美在线资源| 国产伦精品一区二区三区照片| 日本午夜大片a在线观看| 亚洲区免费影片| 艳妇乳肉豪妇荡乳av| 亚洲欧洲99久久| 国产精品成人99一区无码 | av免费在线不卡| 亚洲一区二区在线观看视频| 一本色道综合久久欧美日韩精品 | 日韩成人av免费| 欧美日韩综合| 欧美人与性禽动交精品| 四虎精品永久免费| 久久久久久久国产精品视频| 外国精品视频在线观看| 欧美亚洲国产怡红院影院| √天堂中文官网8在线| 成人精品免费视频| 狠狠热免费视频| 亚洲电影在线一区二区三区| 精品不卡一区二区三区| 日韩网站中文字幕| 欧美日韩国产二区| 韩日视频在线| 欧美成人欧美edvon| 无码人妻丰满熟妇区五十路| 亚洲视频免费在线| 在线免费观看黄色小视频| 久久99日本精品| 99爱视频在线| 欧美成人一品| 日韩精品欧美一区二区三区| 久久久久亚洲精品中文字幕| 欧美自拍视频在线观看| 黄色网页在线免费观看| 亚洲男人天堂久| 性欧美18一19性猛交| 在线观看视频一区二区欧美日韩| 麻豆亚洲av成人无码久久精品| 国产香蕉久久精品综合网| 永久免费看片在线观看| 免费人成网站在线观看欧美高清| 成年女人18级毛片毛片免费| 欧美电影免费播放| 欧美日韩免费高清| 国产精品色呦| 亚洲va欧美va国产综合剧情| 色婷婷综合久久久中字幕精品久久| 美日韩精品视频免费看| 成年人免费在线视频| 日韩第一页在线| 精品人妻一区二区三区日产乱码 | 爱豆国产剧免费观看大全剧苏畅| 久久亚洲电影| 黄色影院一级片| 亚洲精品资源| 人妻av无码专区| 中文字幕一区二区三三 | 98在线视频| 亚洲男人的天堂在线| 少妇喷水在线观看| 日韩免费视频一区| 99视频免费看| 日韩一区二区三区高清免费看看| 在线免费av网| 欧美日韩三级视频| 伊人成年综合网| 色成人在线视频| 成人免费毛片男人用品| 欧美午夜无遮挡| 国产成人免费看| 欧美三级xxx| 亚洲欧美综合另类| 欧美性少妇18aaaa视频| 国产免费av一区| 日韩欧美在线免费| 在线观看免费av片| 日韩欧美亚洲综合| 欧美一区二区三区不卡视频| 欧美午夜宅男影院在线观看| youjizz在线视频| 色婷婷综合久久久久中文一区二区| 国产精品黄色大片| 欧美性极品少妇精品网站| av大片在线免费观看| 色噜噜狠狠一区二区三区果冻| 成人免费毛片男人用品| 欧美最新大片在线看| 欧美三级网站在线观看| 欧美性大战久久久久久久蜜臀| 这里只有久久精品视频| 欧美丝袜丝交足nylons| 亚洲图片中文字幕| 91精品一区二区三区久久久久久| av在线资源观看| 欧美精品一区二区三区久久久 | 中文字幕最新精品| 久久日韩视频| 欧美美最猛性xxxxxx| 草美女在线观看| 欧美一级在线亚洲天堂| 国产成人77亚洲精品www| 91九色单男在线观看| 超碰成人在线观看| 欧美久久电影| 天天射综合网视频| 国产在线播放观看| 老牛嫩草一区二区三区日本 | 色噜噜亚洲精品中文字幕| 久草中文在线观看| 欧美极品在线播放| 性高爱久久久久久久久| 91久久久久久久久久久久久| 亚洲网一区二区三区| 欧美动漫一区二区| 一区二区三区中文| 无码人妻精品一区二区三区在线| 免费国产亚洲视频| 好吊操视频这里只有精品| 久久久久国产精品人| 成人欧美一区二区三区黑人一| 亚洲国产另类精品专区| 国产精品成人久久久| 欧美成人一区二区三区片免费| 青青草免费在线| 欧美成人性生活| 日本一道高清亚洲日美韩| 亚洲影视九九影院在线观看| 久久综合影院| avove在线观看| 久久午夜影视| 亚洲av无码一区东京热久久| 欧美国产一区视频在线观看| 香蕉免费毛片视频| 欧美日韩国产高清一区| 亚洲人视频在线观看| 欧美成人在线网站| 欧美aaa大片视频一二区| 精品久久久久亚洲| 欧美影院一区| 999在线免费视频| 成人动漫视频在线| 国产一二三区精品| 在线观看日韩电影| 偷拍自拍在线| 欧美激情极品视频| 国产精品3区| 亚洲精品中字| 日韩精品福利网| 久久亚洲AV成人无码国产野外| 亚洲精品日日夜夜| 91丨porny丨在线中文| 国产亚洲欧洲在线| 日本免费一区二区六区| 国产精品一区二区三区在线观| 91精品亚洲| 五月天婷婷亚洲| 欧美激情一区二区三区| 无码人妻丰满熟妇区五十路| 日韩精品欧美国产精品忘忧草| 青春草免费在线视频| 91久久中文字幕| 999久久久91| 国产一级片自拍| 国产精品久久久久影院色老大| 国产主播第一页| 亚洲人高潮女人毛茸茸| 中文在线最新版地址| 精品乱色一区二区中文字幕| 精品白丝av| 亚洲天堂2024| 亚洲成人动漫在线观看| 国产小视频一区| 久久久久久久国产| 麻豆成人入口| 91九色在线观看视频| 91免费小视频| 国产免费一级视频| 国产一区二区三区丝袜| 欧美日韩精品免费观看视完整| 青青草原成人| 日韩电影在线观看电影| 精品人体无码一区二区三区| 欧美日韩一区中文字幕| av网页在线| 国产综合久久久久| 最新国产精品| 精品一区二区三区四区五区六区| 午夜精品成人在线视频| 日本v片在线免费观看| 国产成人在线视频| 日本精品三区| 中文字幕55页| 午夜精品一区二区三区电影天堂| 网站黄在线观看| 国产精品第1页| 欧美/亚洲一区| 日韩 中文字幕| 91传媒视频在线播放| 日本视频在线播放| 成人高清在线观看| 日韩香蕉视频| 中文字幕黄色网址| 欧美一级高清大全免费观看| 国产桃色电影在线播放| 美脚丝袜一区二区三区在线观看| 青椒成人免费视频| 免费在线一级片| 亚洲色图15p| 国产在线视频欧美一区| 日韩黄色短视频| 国产午夜亚洲精品午夜鲁丝片| 91麻豆国产视频| 午夜精品一区二区三区视频免费看| 三级精品视频| 欧美视频亚洲图片| 欧美日韩激情网| 婷婷免费在线视频| 国产区一区二区三区| 青青国产91久久久久久| 久久中文字幕无码| 亚洲一级片在线看| 99re6热只有精品免费观看| 熟妇人妻无乱码中文字幕真矢织江| **欧美大码日韩| 日本精品专区| 成人h视频在线观看| 日韩高清电影一区| 国产一级片播放| www.日韩系列| 久久不见久久见免费视频7|