精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

國產(chǎn)SOTA新模型精準(zhǔn)get“畫(3+6)條命的動物” | 開源

人工智能 新聞
清華大學(xué)、騰訊ARC Lab、香港中文大學(xué)和香港大學(xué)聯(lián)手提出了一個新大模型——MindOmni,顯著增強了AI的“推理生成能力”。

生成圖像這件事,會推理的AI才是好AI。

舉個例子,以往要是給AI一句這樣的Prompt:

(3+6)條命的動物。

我們?nèi)祟惪隙ㄒ谎劬椭朗秦堖洌獳I的思考過程卻是這樣的:

圖片

△雖然生成了貓,但思考過程不對

思考的過程還是把“(3+6)”里的數(shù)字分開來處理,并沒有真正get到其背后“九條命的動物=貓”的本意。

以及像ChatGPT,還是執(zhí)著于在圖片里面展示數(shù)字:

圖片

究其原因,是因為當(dāng)前主流的基于文本進行圖像生成的方法往往依賴固定的文本編碼器,僅能處理“純文本”輸入,難以自然接入圖像、音頻等模態(tài)的信息。

同時,這類系統(tǒng)在應(yīng)對“復(fù)雜世界知識”和“多步驟邏輯推理”方面表現(xiàn)乏力。

但就在最近,清華大學(xué)、騰訊ARC Lab、香港中文大學(xué)和香港大學(xué)聯(lián)手提出了一個新大模型——MindOmni,顯著增強了AI的“推理生成能力”

圖片

它不僅能理解復(fù)雜指令,還能基于圖文內(nèi)容展開連貫而可信的“思維鏈”(Chain-of-Thought, CoT),生成具備邏輯性與語義一致性的圖像或文本輸出:

圖片
△推理圖像生成可視化結(jié)果對比
圖片

△對基于多模態(tài)用戶輸入的推理感知圖像生成可視化結(jié)果對比

那么MindOmni又是如何做到的呢?

深挖MindOmni模型架構(gòu)

MindOmni的架構(gòu)設(shè)計的目的比較清晰,就是為了高效融合視覺理解和生成能力。

其大模型部分基于Qwen2.5-VL構(gòu)建,這是一個先進的視覺語言模型,能夠處理圖像和文本輸入。

它通過預(yù)訓(xùn)練的ViT(Vision Transformer)提取圖像特征,并將文本編碼為離散的標(biāo)記序列。這種設(shè)計使得模型能夠理解圖像內(nèi)容并生成與之相關(guān)的文本描述。

擴散解碼器是MindOmni生成圖像的核心模塊。

它基于OmniGen構(gòu)建,通過去噪過程將潛在的噪聲信號逐步轉(zhuǎn)化為真實的圖像。與傳統(tǒng)的生成模型相比,OmniGen具有更高的靈活性和生成質(zhì)量。

在生成過程中,模型會將視覺和文本特征與噪聲標(biāo)記在序列維度進行合并,并通過多次去噪循環(huán)生成最終的圖像。

為了將視覺語言模型與生成模塊有效連接,MindOmni使用一個包含兩個標(biāo)準(zhǔn)Transformer層的連接器來連接兩個模塊,并用于對齊VLM輸出的特征與生成模塊的輸入維度。

圖片

△推理框架概述:MindOmni在統(tǒng)一的大型模型中完成視覺理解、多模態(tài)推理生成和視覺編輯任務(wù)

三階段訓(xùn)練流程:從理解到生成的飛躍

MindOmni采用了三階段訓(xùn)練策略,以逐步提升模型的性能和推理生成能力。

第一階段:基礎(chǔ)預(yù)訓(xùn)練

在預(yù)訓(xùn)練階段,MindOmni主要利用開源圖像-文本對和X2I數(shù)據(jù)對來訓(xùn)練連接器。這一階段的目標(biāo)是讓模型初步具備基本的文本到圖像生成能力。

通過擴散損失和基于KL散度的蒸餾損失作為優(yōu)化目標(biāo),模型能夠?qū)W習(xí)到圖像和文本之間的語義對齊關(guān)系。

具體來說,模型會通過采樣噪聲數(shù)據(jù)并計算擴散損失來優(yōu)化生成過程,同時利用KL散度來保持與教師模型的一致性。

圖片圖片

第二階段:CoT監(jiān)督微調(diào)

在第二階段,研究人員收集了不同粒度的描述性文本,構(gòu)建了推理生成指令數(shù)據(jù)。

這些數(shù)據(jù)包括粗粒度的描述作為答案內(nèi)容,以及細粒度的描述作為推理內(nèi)容。

通過監(jiān)督微調(diào),模型能夠?qū)W習(xí)到如何根據(jù)指令生成具有邏輯推理的文本內(nèi)容。

這一階段的訓(xùn)練數(shù)據(jù)還包括通過高性能文生圖模型生成的高質(zhì)量圖像,以提升模型的生成質(zhì)量。

第三階段:推理生成策略優(yōu)化(RGPO)

在第三階段,MindOmni引入了推理生成策略優(yōu)化(RGPO)算法。

這一算法的核心思想是通過強化學(xué)習(xí),讓模型能夠顯式地生成邏輯推理鏈。研究人員構(gòu)建了一個包含用戶指令、目標(biāo)提示和對應(yīng)解釋的純文本訓(xùn)練數(shù)據(jù)集,并設(shè)計了一個推理生成導(dǎo)向的系統(tǒng)提示,引導(dǎo)模型生成推理內(nèi)容。

RGPO強化學(xué)習(xí)算法

受DeepSeek-R1啟發(fā),研究人員提出了RGPO強化學(xué)習(xí)算法,通過明確生成邏輯思路鏈來增強模型的推理生成能力。

在部署過程中,策略模型 πΘ首先為每個請求q采樣G組結(jié)果{oi}Gi=1 ,每組結(jié)果包含一個推理鏈oiT和一個對應(yīng)的圖像oiI

為了提高生成推理過程的質(zhì)量,研究者引入了兩種獎勵函數(shù)來引導(dǎo)策略模型生成連貫有效的輸出:

  1. 格式獎勵評估思路鏈?zhǔn)欠穹项A(yù)期結(jié)構(gòu),如果內(nèi)容包含在對應(yīng)標(biāo)簽中,則返回1,否則返回0。
  2. 一致性獎勵使用來自CLIP圖像和文本編碼器的余弦相似度來衡量生成圖像與參考真實提示之間的語義對齊情況。然后,通過所有獎勵值計算第i個輸出的優(yōu)勢Ai,公式如下:

△訓(xùn)練流程概述:研究者提出了一個三階段訓(xùn)練框架,包括預(yù)訓(xùn)練、基于指令的監(jiān)督微調(diào)和基于RGPO的強化學(xué)習(xí)

在強化學(xué)習(xí)過程中,研究者引入了兩種基于KL散度的蒸餾策略:DTKL用于文本生成,DIKL用于圖像生成,以懲罰參考模型 πref與先前策略之間的較大偏差,從而促進更平滑的策略過渡,并降低遺忘先前學(xué)習(xí)知識的風(fēng)險。

研究人員計算了oi的兩個蒸餾函數(shù),如下所示:

最后,通過最小化目標(biāo)函數(shù) 來優(yōu)化策略模型,如下所示:

△RGPO中不同Metric的曲線:“Completion Length”表示策略模型在部署過程中的輸出長度;研究人員發(fā)現(xiàn)CoT長度和最終性能并不呈現(xiàn)正相關(guān)性

實驗結(jié)果: 各大基準(zhǔn)測試全面領(lǐng)先

視覺理解和生成任務(wù)

通過廣泛的實驗,MindOmni在多個多模態(tài)理解和生成基準(zhǔn)測試中表現(xiàn)出色。

在圖像理解方面,MindOmni在MMMU、MMBench和RealworldQA等基準(zhǔn)測試中取得了優(yōu)異成績。

與之前的統(tǒng)一模型相比,MindOmni在MMMU上比Janus-Pro提升了10.6%,在MMBench上比MetaMorph提升了9.8%。

這些結(jié)果表明,MindOmni在理解圖像內(nèi)容方面具有顯著優(yōu)勢。

在文本到圖像生成方面,MindOmni在GenEval基準(zhǔn)測試中取得了83%的總體分數(shù),超越了其他統(tǒng)一模型。

此外,在DPG-Bench測試中,MindOmni也表現(xiàn)出色,證明了其在生成任務(wù)中的強大能力。

△視覺理解基準(zhǔn)測試的性能比較:“Und.”和“Gen.”分別表示“理解”和“生成”

△在 GenEval 和 DPG-Bench 上的性能比較

推理生成能力

MindOmni在推理生成任務(wù)中的表現(xiàn)尤為突出。

在WISE基準(zhǔn)測試中,MindOmni在文化知識、時空推理和自然科學(xué)等多個子類別中均超越了現(xiàn)有方法,取得了0.71的總體分數(shù)。

與生成型模型(如FLUX和PixArt)以及統(tǒng)一模型(如MetaQuery-XL)相比,MindOmni在推理生成任務(wù)中展現(xiàn)了顯著的優(yōu)勢。這主要得益于其聯(lián)合理解-生成訓(xùn)練和基于CoT引導(dǎo)的強化學(xué)習(xí)。

△與WISE基準(zhǔn)上的最新模型進行比較

定性結(jié)果

研究人員通過可視化不同模型的結(jié)果來展現(xiàn)MindOmni在推理生成方面的性能。

例如,在生成“具有(3 + 6)條命的動物”圖像時,MindOmni能夠正確理解數(shù)學(xué)表達式,并生成與之相關(guān)的貓的圖像,體現(xiàn)了其推理生成能力。

此外,在生成“悉尼歌劇院在紐約中午時的場景”圖像時,MindOmni能夠考慮到悉尼和紐約的時差,并生成符合場景描述的圖像。

同時MindOmni在圖文多模態(tài)輸入場景下也表現(xiàn)出色。更多可視化結(jié)果請參考論文及附錄。

消融研究

為了驗證訓(xùn)練策略的有效性,研究人員進行了廣泛的消融實驗。

實驗結(jié)果表明,每個訓(xùn)練階段對模型的性能有重要貢獻。

例如,第一階段的預(yù)訓(xùn)練為模型提供了基本的生成能力;第二階段的監(jiān)督微調(diào)顯著提升了模型在WISE基準(zhǔn)測試中的表現(xiàn);而第三階段的RGPO算法則進一步優(yōu)化了模型的推理生成能力。

此外,消融實驗還驗證了不同連接器、KL系數(shù)、組數(shù)和獎勵策略對模型性能的影響。詳細結(jié)果請參考研究論文。

論文鏈接:

https://arxiv.org/pdf/2505.13031

代碼鏈接:
https://github.com/TencentARC/MindOmni

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-06-04 14:09:00

2025-11-06 09:03:00

2024-08-19 08:45:00

開源模型

2025-06-17 09:07:24

2025-08-05 09:02:00

2025-03-04 09:00:00

2025-02-10 08:30:00

2024-03-27 10:20:31

模型場景

2025-08-25 08:45:00

模型代碼開源

2025-01-26 11:00:00

2024-03-25 12:40:19

訓(xùn)練模型

2025-03-03 10:17:00

模型數(shù)據(jù)生成

2023-12-29 13:18:23

模型NeRFTICD

2023-05-17 10:05:56

2025-06-17 17:14:01

DeepSeekSOTA開源

2023-06-09 16:50:21

Tigerbo

2022-12-06 14:11:32

開源模型

2024-10-15 13:07:38

2015-12-15 15:07:06

2025-03-31 08:25:00

AI模型數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

午夜不卡影院| 99久久国产免费| 日本欧美视频| 视频成人永久免费视频| 日韩二区在线观看| 久久天天躁日日躁| 在线免费观看a级片| 国产精品高清乱码在线观看| 亚洲视频一区二区在线观看| 国产精品加勒比| 久久国产香蕉视频| 亚洲国产免费看| 中文字幕在线视频日韩| 中文字幕乱妇无码av在线| 成人av观看| 亚洲免费在线视频| 你懂的视频在线一区二区| 亚洲一区二区激情| 中文精品在线| 不卡av日日日| 亚洲精品国产精品国自| 激情亚洲另类图片区小说区| 欧美日韩成人一区二区| 国产午夜大地久久| 岛国中文字幕在线| 国产日韩v精品一区二区| 懂色一区二区三区av片| 亚洲一区中文字幕永久在线| 国产亚洲毛片| 色综合久久久久久中文网| 神马久久久久久久久久久| 国产成人av毛片| 欧美一三区三区四区免费在线看| 美女网站免费观看视频| 欧美办公室脚交xxxx| 亚洲精品日韩一| 在线视频亚洲自拍| 成年网站在线| 国产欧美一区二区三区在线看蜜臀| 国产日韩欧美二区| 精品国产va久久久久久久| 另类专区欧美蜜桃臀第一页| 欧美自拍大量在线观看| 久久国产精品二区| 欧美在线高清| 欧美成人国产va精品日本一级| 欧美a在线播放| 精品久久国产| 国产一区二区三区在线观看网站 | 久久亚洲AV无码| 亚洲国产精品综合久久久| 综合国产在线视频| 成人性视频免费看| 97精品视频在线看| 久久精品91久久久久久再现| 国产三级短视频| 99久久www免费| 久久久99久久精品女同性| 91无套直看片红桃在线观看| 国产精品成人av| 久久九九精品99国产精品| 无码人妻精品中文字幕| 国产精品久久久久无码av| 久久久www成人免费精品| 999精品在线视频| 中文字幕一区二区av | 亚洲国产小视频| 日韩无码精品一区二区| 国内精品免费| 亚洲免费电影一区| 中文字幕 自拍| 日韩理论片av| 欧美另类极品videosbest最新版本| 在线免费观看亚洲视频| 雨宫琴音一区二区在线| 欧美又大又硬又粗bbbbb| 天天干,天天干| 久久电影网站中文字幕| 91丝袜美腿美女视频网站| 国产黄色av网站| 99视频精品全部免费在线| 欧美日本韩国国产| 欧美一区二区三区在线观看免费| 亚洲黄一区二区三区| 日本中文字幕在线视频观看| 在线一区av| 欧美精品久久天天躁| 少妇性l交大片7724com| 欧美一级全黄| 丝袜美腿精品国产二区| 69精品久久久| 日韩av网站免费在线| 91在线观看网站| 欧美白人做受xxxx视频| 中文字幕一区二区三区四区不卡 | 国产一区自拍视频| 国产一级网站视频在线| 亚洲色图视频网站| 国产精品丝袜久久久久久消防器材| 精品123区| 欧美成人精品福利| jizz中文字幕| 在线观看一区视频| 国产原创欧美精品| 头脑特工队2在线播放| 国产精品国模大尺度视频| 国产欧美日韩网站| 欧美黄页免费| 精品无人区太爽高潮在线播放| 午夜三级在线观看| 可以看av的网站久久看| 成人午夜影院在线观看| 98在线视频| 精品久久久久久久久久久久| 日日干日日操日日射| 免费观看久久av| 久久久久久com| 国产美女三级无套内谢| 久久久噜噜噜久久人人看| 日韩国产成人无码av毛片| 成人福利片在线| 亚洲男人第一网站| 欧美精品亚洲精品日韩精品| 国产高清不卡二三区| 亚洲人体一区| 欧洲一区二区三区精品| 亚洲成年人影院在线| 日韩成人短视频| 日本亚洲天堂网| 欧洲国产精品| 老司机深夜福利在线观看| 日韩一区二区在线观看| 日韩av网站在线播放| 日本美女一区二区三区| 欧美一级爽aaaaa大片| 日韩av一卡| 亚洲精品黄网在线观看| 唐朝av高清盛宴| 国产一区不卡在线| 中文视频一区视频二区视频三区| 国产第一亚洲| 这里只有精品视频在线| 国产一卡二卡三卡| 久久久久久久久久美女| 欧美色图另类小说| 免费国产自久久久久三四区久久| 2019中文字幕在线| 日本一卡二卡四卡精品| 黄色精品一区二区| 国产精品久久AV无码| 亚洲日本激情| 激情小说综合区| 悠悠资源网亚洲青| 亚洲男人的天堂在线播放| 精品人妻一区二区三区免费看| 91香蕉视频mp4| 日本一极黄色片| 精品理论电影| 国产精品一区二区久久久久| 日本韩国在线视频爽| 在线电影国产精品| 欧美人妻一区二区| www.日本不卡| 日韩精品一区二区三区色欲av| 国产成人3p视频免费观看| 国产精品国产自产拍高清av水多| 国产精品秘入口| 欧美男人的天堂一二区| 日本一级二级视频| 成人h版在线观看| 免费大片在线观看| 色综合咪咪久久网| 91久久伊人青青碰碰婷婷| 97人人在线视频| 亚洲男人天堂古典| 在线观看国产精品入口男同| 亚洲欧洲美洲综合色网| 91精品人妻一区二区三区蜜桃2| 亚洲国产午夜| 日本一区二区三区精品视频| 伊人久久大香伊蕉在人线观看热v| 欧美猛少妇色xxxxx| 色婷婷激情五月| 91官网在线观看| 91视频免费在线看| 久久网站最新地址| 红桃视频 国产| 亚洲精品一级| 亚洲国产精品视频一区| 日韩av综合| 日韩av成人在线| 直接在线观看的三级网址| 日韩成人在线播放| 91精东传媒理伦片在线观看| 亚洲大片一区二区三区| 久久日免费视频| av一本久道久久综合久久鬼色| youjizzxxxx18| 精品999网站| 亚洲一二区在线| 久久综合另类图片小说| 91精品国产综合久久男男| а√天堂中文资源在线bt| 色噜噜亚洲精品中文字幕| 无码国产伦一区二区三区视频| 欧美日韩国产在线播放网站| 日本在线视频免费观看| 国产精品日韩成人| 亚洲久久久久久| 国产精品一区二区三区乱码| 日韩一级片播放| 亚洲精品123区| 男人的天堂成人| 经典一区二区| 国产精品一区二区三区不卡 | 久久艹中文字幕| 精品亚洲二区| 国产日韩在线观看av| 亚洲最大网站| 国产+人+亚洲| gogogogo高清视频在线| 尤物yw午夜国产精品视频明星| 四虎免费在线观看| 日韩丝袜情趣美女图片| 在线免费观看一区二区| 91福利在线观看| 特级做a爱片免费69| 亚洲福利视频一区| 久久精品波多野结衣| 国产精品成人免费精品自在线观看| 在线免费观看成年人视频| 成人黄色综合网站| 色婷婷狠狠18禁久久| 国产在线精品免费av| 色婷婷成人在线| 七七婷婷婷婷精品国产| 蜜臀久久99精品久久久酒店新书| a91a精品视频在线观看| 国产www免费| 激情文学一区| 成年人网站国产| 激情综合久久| 欧美乱大交xxxxx潮喷l头像| 国产精品sm| 青青草视频国产| 国产精品va| www.99热这里只有精品| 亚洲欧美成人| 日本熟妇人妻xxxxx| 日韩激情一二三区| 波多结衣在线观看| 免费观看久久久4p| 亚洲欧美日本一区二区三区| 老司机免费视频一区二区三区| 91小视频网站| 久久激情综合网| 午夜视频在线观| 粉嫩绯色av一区二区在线观看 | 男人日女人bb视频| 亚洲一区日韩在线| 乱子伦视频在线看| 日韩不卡一二三区| 羞羞的视频在线| 国产盗摄女厕一区二区三区| 婷婷五月精品中文字幕| 91免费观看在线| 国产在线免费av| 亚洲最新在线观看| 国产一级在线播放| 富二代精品短视频| 中文字幕一区2区3区| 91精品国产综合久久福利软件| www.com在线观看| 日韩国产一区三区| www.亚洲.com| 色与欲影视天天看综合网| 51av在线| 国产免费亚洲高清| 成人在线视频你懂的| 蜜桃av色综合| 久久久久免费av| 你懂的av在线| 久久99久久久欧美国产| 美女搡bbb又爽又猛又黄www| 久久久久久久免费视频了| 天堂网avav| 日韩欧美中文免费| 国产精品一区二区免费视频| 亚洲成人黄色在线观看| 成全电影播放在线观看国语| 欧美国产日韩二区| 欧美色网在线| 99热99热| 精品国产成人| 欧美一级视频在线播放| 免费av成人在线| 你懂得在线视频| 亚洲欧美日韩系列| 久久久蜜桃一区二区| 欧美一级爆毛片| 成年人视频在线观看免费| 久久久久久亚洲精品| 亚洲在线视频一区二区| 亚洲国产一区二区三区在线播放| 久久综合九色综合88i| 久久精品国产一区二区| 丰满大乳奶做爰ⅹxx视频| 亚洲欧美激情插 | 国产99午夜精品一区二区三区 | 榴莲视频成人app| 日韩精彩视频| 999亚洲国产精| 三大队在线观看| 国产精品每日更新| 4438国产精品一区二区| 欧美大片在线观看一区二区| 中文字幕在线播放| 欧美在线激情网| 粉嫩的18在线观看极品精品| 亚洲日本理论电影| 日韩国产精品91| 亚洲第九十七页| 午夜精品一区在线观看| va视频在线观看| www高清在线视频日韩欧美| 午夜日韩成人影院| 九色91国产| 99在线精品免费视频九九视| 亚洲911精品成人18网站| 中文字幕日韩一区| 中文字幕第一页在线播放| 亚洲码在线观看| 日本黄色免费在线| 久久大片网站| 国产欧美日韩亚洲一区二区三区| 国产人妖在线观看| 一区二区在线观看免费视频播放| 国产激情视频网站| 色无极亚洲影院| 国产v亚洲v天堂无码久久久| 99久久伊人网影院| 日本熟妇乱子伦xxxx| 精品国产精品一区二区夜夜嗨| 亚洲h片在线看| 97人人模人人爽人人喊38tv| 亚洲天天综合| 农村末发育av片一区二区 | 亚洲黄色www网站| 蜜桃成人365av| 国产精品久久久久免费| 激情久久久久久久| 网站免费在线观看| 欧美性xxxxxxxxx| 国产视频在线看| 国产日韩av在线| 亚洲高清资源在线观看| 超级砰砰砰97免费观看最新一期| 亚洲影院久久精品| 日本高清视频免费看| 欧美尤物巨大精品爽| 啪啪亚洲精品| 亚洲精品性视频| 一区二区在线观看免费| 日本xxxxwww| 2021久久精品国产99国产精品| 免费看日本一区二区| 成人亚洲精品777777大片| 国产精品卡一卡二| www.com在线观看| 青草热久免费精品视频| 全球成人免费直播| 中文字幕1区2区| 欧美色videos| 日本中文字幕电影在线免费观看 | 日本中文字幕久久| 欧美性感美女h网站在线观看免费| 青青草视频在线免费观看| 日本老师69xxx| 国产精品久久久久久麻豆一区软件| 曰本三级日本三级日本三级| 欧美日韩视频在线| 色三级在线观看| 国产精品香蕉视屏| 日本在线不卡视频一二三区| 日本福利片在线观看| 日韩黄色av网站| 日韩深夜福利网站| 蜜臀av无码一区二区三区| 久久精品一区二区三区不卡| 国产免费的av| 日本最新高清不卡中文字幕| 999国产精品永久免费视频app| 影音先锋资源av| 欧美丝袜自拍制服另类| 女同一区二区免费aⅴ| 日韩国产美国| 国产99久久久国产精品| 天天射天天干天天| 久久99久国产精品黄毛片入口| 国产乱码精品一区二区亚洲|