精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破 原創

發布于 2025-3-10 09:45
瀏覽
0收藏


編者按: 提到 DeepSeek,大家可能更熟悉 R1 模型 —— 這款以低成本、高性能和開源特性顛覆行業的語言模型,而今天這篇文章介紹的 DeepSeek Janus Pro,通過創新的架構設計,在性能上超越了同領域的眾多頂尖專用模型(Janus-Pro 7B 在圖像理解和圖像生成兩方面都超越了 LLaVA、Dalle 3 和 SD XL 這樣的主流選手)。

本文深入解析了 Janus Pro 的技術細節,從其核心設計原則到具體的圖像編碼器選擇,再到訓練過程的三個階段,全面展示了 Janus Pro 如何通過創新的架構設計和精細的訓練策略,實現了在多模態理解和生成任務上的卓越表現。

作者 | AI Papers Academy

編譯 | 岳揚

01 導言

業界仍在消化 DeepSeek 最近發布的震撼 AI 界的 DeepSeek-R1,但 R1 發布短短數日后,這家公司又祭出了另一款驚艷的開源多模態大模型 Janus Pro。這款對標國際頂尖多模態模型的新作,標志著 DeepSeek 在多模態領域的重大突破。

本文將深度解讀 Janus Pro 背后的研究論文《Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling》。要理解這篇論文,我們還需要首先解析 DeepSeek 的前一篇論文《JanusFlow: Harmonizing Autoregression and Rectified Flow for Unified Multimodal Understanding and Generation》中提出的 Janus 模型基礎架構。閱讀本文無需任何先驗知識,我們將系統闡釋兩代模型的演進邏輯:新論文建立在前一篇論文的基礎上,本文將對這兩篇論文進行全景式解析。

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

Janus-Pro 相關論文的標題和作者[1]

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

Janus-Pro 前一篇相關論文的標題和作者[2]

02 統一多模態理解與生成

兩篇論文都聚焦于"統一多模態理解與生成(unified multimodal understanding and generation)"這一核心命題。在深入剖析 Janus 模型的技術細節之前,我們有必要先厘清這一概念。

2.1 圖像理解任務解析

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

MLLM 實現的圖像理解案例

大語言模型(LLM)已在諸多領域展現出卓越能力。基于此,學界發展出多模態大語言模型(MLLM)技術路線,典型代表如 LLaVA。這類模型能同時處理文本指令與視覺輸入:如圖所示,當用戶輸入"我的貓在做什么?(what is my cat doing?)"并附上貓咪圖片時,模型可精準解析圖文信息,得出"貓咪試圖抓魚(the cat is trying to catch a fish)"的結論。

這種技術路線在圖像理解任務中成效顯著。以 Janus Pro 論文展示的案例為例:當用戶提供蛋糕圖片并詢問其相關背景信息時,Janus 不僅準確識別出蛋糕的主題元素是"貓和老鼠",更能調用其基座語言模型,延展輸出該經典 IP 的背景知識。這體現了 MLLM 系統的雙重優勢 —— 既具備跨模態理解能力,又可繼承 LLM 的通用知識儲備。

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

圖像理解任務案例展示[1]

2.2 圖像生成任務解析

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

圖像生成任務案例展示

當前主流的圖像生成模型(如 Stable Diffusion、DALL-E 3 等其他模型)主要基于擴散模型及其改進架構。如圖示案例所示,當輸入"可愛的貓咪(a cute cat)"文本指令時,系統能夠生成高質量視覺內容。

2.3 單個模型統一處理圖像理解和生成任務的優勢

現有技術路線中,圖像理解與生成通常分別由獨立的系統完成。將這些任務統一到一個模型中也有很大的好處:在實際應用場景中,單一模型可同步處理這兩類任務,避免多個模型切換帶來的計算資源浪費與系統復雜度提升。

Janus 模型通過對模型架構進行創新設計,將這兩種任務的處理整合于統一框架中。雖然將多任務的處理統一于單一模型并非全新概念,但在后文進行技術解析時將揭示其架構設計的精妙之處。

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

使用 Janus 統一處理理解和生成任務

03 Janus 與 Janus Pro 架構

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

Janus 和 Janus Pro 架構[1]

原始 Janus 模型與 Janus Pro 的架構設計相似,我們可以通過論文中的示意圖來理解。 Janus Pro 模型的核心是一個自回歸 Transformer 架構的大語言模型(LLM)。

3.1 Janus Pro 的核心設計原則

其他統一處理多模態理解和生成的模型通常采用單一圖像編碼器。但DeepSeek 的研究人員發現,理解與生成任務對圖像編碼的需求存在本質差異,單一編碼器會經常受到任務干擾的影響。因此 Janus 架構的核心設計原則是解耦多模態理解與生成的視覺編碼,通過為不同任務類型配置專用編碼器實現功能隔離。

3.2 Janus Pro 圖像編碼器

對于圖像理解任務,Janus 采用 SigLIP 進行圖像編碼。SigLIP 是 OpenAI CLIP 模型的改進版本,能夠從圖像中提取語義表征,使其非常適合圖像理解類任務。這些表征被線性映射到 LLM 的輸入嵌入空間。

對于圖像生成任務,Janus 使用了來自自回歸圖像生成模型 LlamaGen 的現有編碼器。這是一個 vector quantization (VQ) tokenizer,可將圖像轉換為 ID 序列(譯者注:類似于將一段語音信號轉換為文字(語音 → 離散的文字符號),此處是將連續圖像特征轉換為離散的符號(ID)。),每個 ID 都與預定義向量相關聯。然后通過一個訓練好的模塊,將這些預定義向量映射到 LLM 的輸入嵌入空間。

3.3 LLM 的處理過程與輸出

文本與圖像的嵌入向量被拼接形成 LLM 的輸入序列。對于圖像理解任務,直接調用 LLM 內置的文本預測頭輸出結果;對于圖像生成任務,則在 LLM 上添加一個圖像解碼頭,由其處理最終的隱藏狀態(Hidden State,包含輸入序列的語義信息)生成圖像。

3.4 Rectified Flow

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

逐步去除圖像噪聲示例[3]

圖像生成過程采用 Rectified Flow 方法。 本文不深入技術細節,但可通過對比擴散模型(Diffusion Models)直觀理解其優勢:從一張純噪聲圖像出發,通過多步驟迭代(如1000步)逐步去噪,最終生成清晰圖像(如貓咪圖片)。該技術通過路徑優化和噪聲抑制,顯著減少生成清晰圖像所需的步驟數量。

04 Janus Pro 訓練過程

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

Janus 訓練流程示意圖(源自原始 Janus 論文)[2]

上圖描述了 Janus 的訓練流程,該圖取自原始 Janus 論文。我們將在本文解釋 Janus Pro 的不同之處。Janus 和 Janus Pro 的訓練均分為三個階段。

4.1 第一階段 - Adaptation

本階段目的是讓新增組件與預訓練好的組件有效協作。 為此,大語言模型(LLM)和圖像編碼器的權重被凍結,僅訓練新引入的組件。這些組件包括將圖像編碼映射到 LLM 輸入嵌入空間的映射模塊,以及圖像生成頭(Image Generation Head)。該階段使用 ImageNet 數據進行訓練,使模型能根據圖像類別生成對應圖像。在 Janus Pro 模型中,本階段在 ImageNet 上的 training steps 有所增加。

4.2 第二階段 - Unified Pre-Training

此階段繼續訓練新組件,同時解凍 LLM 及其內置的文本預測頭,以增強對多模態嵌入序列的處理能力。 本階段訓練樣本類型包含多模態理解任務樣本、圖像生成任務樣本和純文本數據。Janus Pro 與原始 Janus 的主要區別在于移除了本階段的 ImageNet 數據。在 Janus Pro 訓練中直接使用 text-to-image 數據,而原始 Janus 模型則從 ImageNet 數據起步,逐步增加 text-to-image 數據的比例。

有一處值得強調,圖像編碼器的表征在訓練過程中與圖像生成的潛在輸出進行了對齊,以強化生成過程的語義一致性。

4.3 第三階段 - Supervised Fine-Tuning

第三階段使用指令調優數據進行監督式微調,數據包含對話樣本和高質量文生圖(text-to-image)樣本。 此階段開始訓練圖像理解編碼器,該流程在 Janus 和 Janus Pro 中保持一致。

相較于 Janus,Janus Pro 的其他主要改進包括:擴大訓練數據規模及模型規模。模型參數方面,使用的 LLM 從 15 億參數擴展至 70 億參數。

05 Janus Pro 的成果

5.1 多模態理解與生成能力的對比

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

Janus Pro 與頂尖多模態理解及圖像生成模型的比較[1]

上圖為 Janus Pro 與其他高性能模型的對比結果。

左圖展示了多模態理解任務的性能,橫軸為模型參數量級,縱軸為多個基準測試的平均準確率。值得注意的是,Janus-Pro-7B 的表現優于其他頂尖模型(如 LLaVA 系列)。更令人矚目的是,這一成績由統一模型實現(LLaVA 模型并非統一架構)。Janus Pro 還大大超越了以往的統一模型,并在參數量近乎 TokenFlow-XL 一半的情況下,準確率略微領先于該模型。

右圖展示了兩個基準測試的文生圖性能測評結果。Janus Pro 在生成質量上超越了 DALL-E 3、SD3-Medium 等頂級專用圖像生成模型,同時刷新了統一模型在圖像生成領域的最高紀錄(此圖未完整展示相關對比)。

5.2 Janus 與 Janus Pro 的生成質量對比

解析DeepSeek Janus Pro論文:多模態AI領域的革命性突破-AI.x社區

Janus 與 Janus Pro 的生成質量對比[1]

圖中直觀展現了 Janus Pro 相較于前代模型的生成質量提升。Janus Pro 生成的圖像在細節豐富度、語義一致性及視覺真實感上均有顯著優化。例如,復雜場景的構圖更精準,光影效果更自然,且文本描述中的隱含需求(如特定藝術風格)被更完整地實現。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the author

AI Papers Academy

At AI Papers Academy, we simplify AI research papers and concepts, making AI more accessible.
Our goal is to save you time by breaking down complex ideas into clear, digestible insights.

END

本期互動內容 ??

?如果您正在開發AI應用,DeepSeek Janus Pro 的哪些特性最吸引您考慮使用?

??文中鏈接??

[1]??https://github.com/deepseek-ai/Janus??

[2]??https://arxiv.org/abs/2411.07975??

[3]??https://developer.nvidia.com/blog/improving-diffusion-models-as-an-alternative-to-gans-part-1/??

本文經原作者授權,由 Baihai IDP 編譯。 如需轉載譯文,請聯系獲取授權。

原文鏈接:

??https://aipapersacademy.com/janus-pro/??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
日韩限制级电影在线观看| 国产成a人亚洲精v品在线观看| 91香蕉视频在线| 国产精品无码2021在线观看| 亚洲欧美日韩不卡一区二区三区| 一区二区三区在线视频观看58| 厕沟全景美女厕沟精品| 欧美又黄又嫩大片a级| 精品偷拍一区二区三区在线看| 久久久久蜜桃| 精品成人无码久久久久久| 福利视频一区二区三区| 国产精品你懂的在线欣赏| 五月天av在线| 亚洲成人av免费在线观看| 97国产在线视频| 成人91在线观看| 蜜桃麻豆av在线| 亚洲精品乱码久久久久久蜜桃欧美| 久久久精品电影| 精品在线播放午夜| 91在线视频| 自拍偷拍一区二区三区四区| 揄拍成人国产精品视频| 久久国产三级精品| 黄色av免费在线| 日本人妻一区二区三区| 午夜精品美女自拍福到在线| 91丨九色丨黑人外教| 中文字幕21页在线看| 手机看片日韩av| 91久久精品国产91久久| 裸体素人女欧美日韩| 成人午夜免费影院| 国产精品嫩草影院久久久| 中文字幕中文在线不卡住| 亚洲精品在线播放| av大片在线免费观看| 极品校花啪啪激情久久| 色av成人天堂桃色av| 91欧美在线| 五月婷婷综合久久| www.久久久久久久久久久| 91精品国产高清| 国产精品色哟哟| 日韩激情网站| 国产黄色一级大片| 五月婷婷深爱五月| 久久免费视频在线观看| 中文字幕中文字幕一区| 香蕉久久夜色精品国产更新时间| 影音先锋黄色网址| 亚洲熟妇av日韩熟妇在线| 日韩最新中文字幕电影免费看| 粉嫩一区二区三区性色av| 二吊插入一穴一区二区| 国产一级片毛片| 国产av第一区| 久久天堂电影网| 久久久精品影视| 日韩中出av| 天天插天天干天天操| 久久久久亚洲av无码网站| 国产色视频一区| 欧美视频中文字幕| 久久综合亚州| 亚洲精品555| 五月婷婷丁香在线| 欧美三级理论片| 热99在线视频| 91官网在线免费观看| 青青草国产成人99久久| 欧美风情在线视频| 国产男男gay体育生网站| 免费网站在线观看黄| 成人在线激情视频| 日韩视频一区二区在线观看| 韩国精品在线观看| 国产麻豆一区二区三区| av 一区二区三区| 免费看毛片的网站| 快播亚洲色图| 日韩在线观看网址| 一区二区三区高清| 午夜亚洲精品| 精品中文视频| 天堂网在线播放| 黄色av片三级三级三级免费看| 日韩成人av网站| 欧美国产在线视频| 日韩欧美在线观看视频| 国产美女主播视频一区| 丝袜久久网站| 日本孕妇大胆孕交无码| 天堂中文字幕在线观看| 亚洲精品成人在线播放| 久久精品国产精品国产精品污 | 成人污视频在线观看| 国产欧美日韩精品一区二区三区| 国产黄大片在线观看画质优化| 日韩欧美国产亚洲| 日韩av自拍偷拍| 免费看成人片| 久久久综合av| 欧美精品一区二区三区蜜桃 | 国产免费久久av| 亚洲精品二三区| 亚洲综合区在线| 国产成人免费视| 欧美精品偷拍| 亚洲图色一区二区三区| 久cao在线| 一级特黄aaa| 国产探花在线视频| 国产成人黄色网址| 伊人久久av导航| 国产精品欧美日韩久久| 这里只有精品丝袜| 欧美色综合天天久久综合精品| 26uuu另类欧美| 日本亚洲视频在线| 亚洲免费二区| 成人午夜大片| 欧亚一区二区| 97人妻精品一区二区三区动漫| 日韩精品欧美在线| 欧美风情在线观看| 精品国产欧美一区二区| 欧美日韩免费在线观看| 国产精品青草久久| 国产精选一区二区三区| 夜夜精品视频| 久久中文字幕av| 大奶在线精品| 婷婷激情成人| 激情黄产视频在线免费观看| 你懂的免费在线观看视频网站| 天天爱天天做天天爽| jizz18女人高潮| 久久久久亚洲AV成人网人人小说| 国产精品-区区久久久狼| 亚洲狠狠婷婷综合久久久| 高清免费日韩| 国产精品999| 97国产精品免费视频| 中文字幕精品视频| 国产婷婷成人久久av免费高清| 欧美日产国产精品| 色噜噜狠狠一区二区三区果冻| 日韩理论在线观看| 国产女人18毛片水真多成人如厕| 国内久久婷婷综合| 美国三级日本三级久久99| 日韩视频一区| 亚洲视频碰碰| 国产一区二区三区四区三区四| 日韩欧美网站| 国产欧美日韩| 精品理论电影在线| 综合综合综合综合综合网| 精品午夜电影| 成人性生交大片免费看中文视频| 日韩区一区二| 亚洲国产高清在线观看| 香蕉大人久久国产成人av| 日韩一二三区| 国产精品玖玖玖在线资源| 97久久超碰| 精品国产乱码久久久| 精品国产一区二区三区久久久樱花| 伊人成综合网伊人222| 日韩影视在线观看| 欧美一区电影| 亚洲国产一区二区在线观看| 91精品一区二区三区综合| 中国成人一区| 亚洲久色影视| 蜜臀精品一区二区三区在线观看| 黄色小说综合网站| 国产a区久久久| 久久久亚洲午夜电影| 一色屋精品亚洲香蕉网站| 亚洲自拍另类综合| 色偷偷88欧美精品久久久| 欧美卡1卡2卡| 精品爽片免费看久久| 中文字幕在线亚洲| 97超碰国产精品女人人人爽| 国产精品三级久久久久久电影| 亚洲一区二区三区视频| 奇米888一区二区三区| 中文字幕免费高| 久久综合伊人77777麻豆最新章节| 午夜激情av在线| 美女脱光内衣内裤| 男人与禽猛交狂配| 影音先锋黄色网址| 国产黄在线观看免费观看不卡| 欧美6一10sex性hd| 成人污污www网站免费丝瓜| 日韩美女毛片| av不卡在线看| 丁香六月久久综合狠狠色| 国产精品夫妻自拍| 欧美日韩成人在线| 中文字幕亚洲自拍| 国产高清视频一区三区| 日本一区二区在线视频| 69堂免费视频| 黑人巨大精品欧美| 国产又爽又黄的视频| 三级理论午夜在线观看| xxx性欧美| 伊人春色精品| 日本午夜精品一区二区三区电影| 久久久不卡网国产精品二区| 偷拍日韩校园综合在线| 亚洲美女在线观看| 国产精品av在线| 9999在线观看| 黑人性生活视频| 成年人免费高清视频| 人妻视频一区二区三区| 玛雅亚洲电影| 我不卡手机影院| 99在线热播精品免费| 色综合久久中文综合久久牛| 伊人伊人伊人久久| 91精品视频在线| 3d动漫一区二区三区| 一级黄色性视频| 亚洲狼人综合网| 老司机成人影院| 亚洲调教视频在线观看| 久久精品日产第一区二区三区高清版 | 1024av视频| 亚洲色图27p| 日本免费不卡视频| 日韩国产一二三区| 日韩视频不卡| 亚洲精品网站在线观看| 亚洲天堂网站在线观看视频| 97视频资源在线观看| 日本少妇高潮喷水视频| 18精品爽视频在线观看| a中文在线播放| 蜜桃一区二区三区| 成人激情综合网站| 欧美一区二区精品久久911| 国产精品免费视频久久久| 少妇无码av无码专区在线观看| 亚洲国产美女视频| 日本电影全部在线观看网站视频 | 天天操天天干天天综合网| 久久精品91久久香蕉加勒比| 日本一区二区三区视频免费看| 水蜜桃av无码| 日本啊v在线| 九九综合九九| 国产午夜精品久久久久久免费视 | 精品国产一区二区三区不卡| 91在线免费网站| 亚洲精品mv在线观看| 国产探花精品一区二区| 精品一级视频| ww亚洲ww在线观看国产| 亚洲美女喷白浆| 日日噜噜噜噜夜夜爽亚洲精品| 久久久久久成人网| 尤物在线视频| 欧美精品1区| 日韩欧美高清在线视频| 国产精品爱久久久久久久| 污视频免费在线观看网站| 国产乱码久久久久| 91成人精品在线| 中文字幕乱码亚洲精品一区| 久久九九全国免费精品观看| 亚洲国产精品无码观看久久| 亚洲s码欧洲m码国产av| 99亚洲伊人久久精品影院| 国产盗摄一区二区三区| 亚洲精品wwwww| 只有这里有精品| 久久一区二区三区视频| 国产一区二区av在线| 26uuu欧美日本| 欧美成人午夜剧场免费观看| 伊人网在线免费| 日本一区二区三区精品| 亚洲一区二区三区四区电影| 国产网站一区二区三区| 国外成人免费在线播放| 国产裸体免费无遮挡| 天天干视频在线观看| 久久一区二区中文字幕| 日韩欧美aaa| 国产丝袜不卡| 国产性生活网站| 四虎永久精品在线| 国产精品免费观看视频| 欧美亚洲一级片| 毛茸茸free性熟hd| 四虎影院观看视频在线观看| 另类欧美日韩国产在线| 亚洲最新av网址| 97在线免费公开视频| 日本在线视频1区| 亚洲深夜影院| 精品亚洲永久免费精品| 欧美一区二区三区爽大粗免费| 男人天堂一区二区| 国产精品久久久久毛片大屁完整版| 亚洲精品在线观| 成年人午夜视频在线观看| 日韩中文字幕免费观看| 亚洲欧美日本国产专区一区| 日韩精品视频观看| 99精品视频在线看| 理论片午午伦夜理片在线播放| 久久丁香综合五月国产三级网站| 久久久99久久精品女同性| 丰满人妻一区二区三区大胸 | av中文字幕不卡| 欧美亚洲在线播放| 免费看特级毛片| 国产精品主播在线观看| 日韩欧美在线一区| 亚洲天堂av免费在线观看| 免费观看成年人视频| 天堂蜜桃一区二区三区| 欧美日本黄视频| 熟女俱乐部一区二区视频在线| 国产高清视频一区二区| 黄色成人在线免费| 日本精品免费视频| 免费在线超碰| 岛国精品在线播放| 国产精品嫩草影院久久久| 亚洲欧美在线视频免费| 视频在线不卡免费观看| 亚洲欧美另类中文字幕| 少妇极品熟妇人妻无码| 99热播精品免费| 色悠悠久久综合| 国产91xxx| 欧美24videosex性欧美| 一区二区三区在线免费观看| 日韩欧美精品在线不卡| 免费在线视频你懂得| 成人一区二区视频| 鬼打鬼之黄金道士1992林正英| 中文字幕网址在线| 日本特黄久久久高潮| 欧美性在线视频| 久久久久久少妇| 国产视频一区三区| 91av视频在线免费观看| 久久网免费视频| 国产精品a级| 欧美精品福利在线| 国产精品6666| 夜夜嗨av一区二区三区网站四季av| 韩国日本不卡在线| 欧美成人aaaaⅴ片在线看| 成人盗摄视频| 色综合av在线| 国产精品999视频| 日本精品裸体写真集在线观看| 日韩欧美中文在线| 9l视频白拍9色9l视频| 高清国产一区二区三区四区五区| 在线91免费看| 欧美双性人妖o0| 少妇精品导航| 久久伊人精品天天| 国产网友自拍视频| 麻豆91精品视频| www.久久艹| 97超碰人人在线| 亚洲一二三专区| 亚洲精品一二三四五区| 国产情侣一区在线| 亚洲精品一区二区久| 在线免费观看亚洲视频| 99热在线精品观看| 国产自产女人91一区在线观看| 亚洲奶汁xxxx哺乳期| 国产日韩综合av| 国产欧美日韩小视频| 欧洲美女精品免费观看视频| 亚洲精品久久久久久久久久久久| 91视频免费在观看| 亚洲免费在线| 国产一级二级三级精品| 国产午夜精品久久久久免费视| 日本精品视频一区二区| 无码国产精品一区二区免费式直播| 久久网站免费观看| 国产精品99久久久久久www|