精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！精華

發(fā)布于 2025-4-17 09:43

瀏覽

0收藏

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

文章鏈接：https://arxiv.org/pdf/2504.11346 官方鏈接：https://team.doubao.com/tech/seedream3_0

亮點直擊

相比Seedream 2.0能力全面增強：在用戶偏好測試中表現(xiàn)出色，在圖文對齊、構圖結構、美學質量和文字渲染等關鍵能力方面有重大突破。
文本渲染性能提升顯著：在中英文小尺寸字符生成和高美學長文本排版方面表現(xiàn)優(yōu)異。小文本生成與美學排版難題的開創(chuàng)性方案，在圖文設計輸出上超越 Canva 等平臺的人設模板。
圖像美學提升：圖像美學質量顯著提升，在電影場景和人像寫實度方面表現(xiàn)卓越。
原生高分辨率輸出：支持 2K 分辨率的原生輸出，免除后處理需求，同時兼容更高分辨率并可適配多種長寬比。
推理成本高效：多項模型加速技術，3.0 秒內生成一張 1K 分辨率圖像（不含位置編碼），推理速度遠超其他商用模型。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

解決的問題

復雜提示詞對齊不佳：在處理多目標、多關系的復雜提示詞時，精確性和一致性不足。
精細文字生成能力弱：在生成小尺寸字體、多行排版、復雜文字排版方面存在明顯短板。
圖像美學與真實感不足：特別是在電影感畫面和人像肌理的生成方面表現(xiàn)欠佳。
原生分辨率限制：此前只能生成 512×512px 小圖，需要后處理進行超分辨率提升。

提出的方案

數(shù)據(jù)層改進：使用缺陷感知訓練機制和雙軸協(xié)同采樣框架，將數(shù)據(jù)集規(guī)模提升至原來的兩倍。
預訓練階段改進：引入四項關鍵訓練策略：

混合分辨率訓練（Mixed-Resolution Training）
跨模態(tài) RoPE（Cross-Modality Rotary Position Embedding）
表征對齊損失（Representation Alignment Loss）
分辨率感知時間步采樣（Resolution-Aware Timestep Sampling）

后訓練階段優(yōu)化：在 SFT 中引入多樣化審美描述，并利用基于視覺語言模型（VLM）的獎勵機制進行調優(yōu)。
推理加速策略：通過一致噪聲預期與重要性感知采樣策略，在保持畫質的同時實現(xiàn) 4-8 倍速度提升。

Seedream 3.0 已于 2025 年 4 月初集成進多個平臺，包括豆包和即夢。殷切希望 Seedream 3.0 能成為提升工作與生活各方面生產力的實用工具。

技術細節(jié)

數(shù)據(jù)

在 Seedream 2.0 中，采用了一種嚴格的數(shù)據(jù)過濾策略，系統(tǒng)性地剔除包含輕微缺陷（如水印、覆蓋文字、字幕、馬賽克等）的圖像數(shù)據(jù)。這種嚴格的過濾顯著限制了訓練所用數(shù)據(jù)量，尤其考慮到此類缺陷樣本約占原始數(shù)據(jù)集的 35%。為解決這一問題，Seedream 3.0 引入了一種創(chuàng)新的“缺陷感知訓練范式”。該范式包含一個專門訓練的缺陷檢測器，基于 15,000 張由主動學習引擎挑選并人工標注的樣本構建。該檢測器可通過邊界框預測精確定位缺陷區(qū)域。

當檢測出的缺陷區(qū)域總面積小于圖像空間的 20%（可配置閾值）時，我們保留這些此前被剔除的樣本，同時實施掩碼潛空間優(yōu)化。具體來說，在潛空間的擴散損失計算中，我們采用空間注意力掩碼機制，將來自缺陷區(qū)域的特征梯度排除在外。這種創(chuàng)新方法在保持模型穩(wěn)定性的同時，將有效訓練數(shù)據(jù)集擴展了 21.7%。

為優(yōu)化數(shù)據(jù)分布，我們提出了一種“雙軸協(xié)同數(shù)據(jù)采樣框架”，從視覺形態(tài)和語義分布兩個維度聯(lián)合優(yōu)化。在視覺模態(tài)方面，我們繼續(xù)采用分層聚類方法，確保不同視覺模式的平衡表達。在文本語義層面，我們通過詞頻-逆文檔頻率（TF-IDF）實現(xiàn)語義平衡，有效解決描述文本的長尾分布問題。為進一步增強數(shù)據(jù)生態(tài)的協(xié)同性，我們開發(fā)了一個跨模態(tài)檢索系統(tǒng)，為圖文對構建聯(lián)合嵌入空間。該系統(tǒng)在所有基準測試中均達到最先進水平。

該檢索增強框架通過以下方式動態(tài)優(yōu)化數(shù)據(jù)集：

通過目標概念檢索注入專家知識；
通過相似度加權采樣進行分布校準；
利用檢索到的鄰近對進行跨模態(tài)增強。

模型預訓練

模型架構

核心架構設計延續(xù)自 Seedream 2.0，該版本采用 MMDiT 處理圖像和文本 token，并捕捉兩種模態(tài)之間的關系。在 Seedream 3.0 中，擴大了基礎模型的總參數(shù)量，并引入了多項改進，從而提升了模型的可擴展性、泛化能力以及圖文對齊效果。

混合分辨率訓練。 Transformer原生支持可變長度 token 輸入，并已在基于 ViT 的視覺識別任務中被證實有效。在 Seedream 3.0 中，在每次訓練階段將不同長寬比和分辨率的圖像打包在一起進行混合分辨率訓練。具體來說，我們首先以平均分辨率為 2562（含多種長寬比）進行預訓練，然后在更高分辨率圖像（5122 到 20482）上進行微調。同時，引入尺寸嵌入作為附加條件，使模型感知目標分辨率?；旌戏直媛视柧氾@著提升了數(shù)據(jù)多樣性，提高了模型對未見分辨率的泛化能力。

跨模態(tài)旋轉位置編碼（RoPE）。 在 Seedream 2.0 中，引入了可縮放 RoPE，使模型更好地泛化至未訓練的長寬比與分辨率。在 Seedream 3.0 中，將該技術擴展為“跨模態(tài) RoPE”，進一步提升視覺-文本 token 的對齊效果。我們將文本 token 視為形狀為 [1, L] 的二維 token，并對其應用二維 RoPE [22]。文本 token 的列向位置 ID 被順序賦值于圖像 token 之后?？缒B(tài) RoPE 有效建模了模態(tài)內和模態(tài)間的關系，對提升圖文對齊與文本渲染精度至關重要。

模型訓練細節(jié)

訓練目標 在 Seedream 3.0 中，采用了 Flow Matching訓練目標，以及表示對齊損失（REPA）：

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

其中使用線性插值形式：

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

一般來說，在高分辨率訓練時，我們會將分布向低信噪比（SNR）方向偏移以增加其采樣概率。在訓練過程中，計算數(shù)據(jù)集??的平均分辨率以確定偏移后的時間步分布。在推理階段，根據(jù)目標分辨率和寬高比計算偏移因子。

模型后訓練

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

審美描述生成器（Aesthetic Caption）

為 CT 和 SFT 階段中的數(shù)據(jù)特別訓練了多個版本的描述生成模型。如圖 4 所示，這些描述模型在審美、風格和布局等專業(yè)領域提供了準確的描述。這確保了模型可以更有效地響應相關提示，從而提升模型的可控性以及經過提示詞工程處理后的表現(xiàn)。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

模型訓練細節(jié)

為了確保模型在不同分辨率下都能取得良好表現(xiàn)，在訓練過程中采用了一種分辨率平衡策略。這種方法確保了不同分辨率訓練數(shù)據(jù)的充分采樣，從而增強了模型在各種場景中跟隨提示的能力。

獎勵模型擴展

與之前 Seedream 2.0 使用 CLIP 作為獎勵模型不同，現(xiàn)在采用視覺-語言模型（VLMs）作為獎勵建模框架。這一改變利用了 VLM 更強大的基礎能力和獎勵擴展?jié)摿?。受大語言模型（LLMs）中生成式獎勵建模（RM）技術啟發(fā)，我們將指令明確地表述為查詢，并從“Yes”響應 token 的歸一化概率中導出獎勵。

這種方法有效地利用了預訓練 LLM 中的知識，并自然受益于 LLM 的擴展效應，從而提升了獎勵質量。我們系統(tǒng)性地將獎勵模型從 1B 參數(shù)規(guī)模擴展到超過 20B。實驗證明了獎勵模型擴展的顯著效果，表明增加獎勵模型容量能夠提升獎勵建模表現(xiàn)。

模型加速

本文加速框架建立在 Hyper-SD 和 RayFlow基礎上。重新思考了擴散過程，使得每個樣本可以遵循其自身自適應的生成軌跡，而不是強制所有樣本都經過一個共同路徑最終收斂到標準高斯先驗。在傳統(tǒng)的擴散模型中，所有樣本都會被逐步轉換為各向同性的高斯噪聲，導致在概率空間中的軌跡重疊。這種重疊增加了隨機性，降低了可控性，并在反向過程引入了不穩(wěn)定性。本文改為將每個數(shù)據(jù)點引導到特定的目標分布，從而實現(xiàn)每個樣本軌跡的個性化定制。這顯著減少了路徑沖突，并提升了生成穩(wěn)定性和樣本多樣性。

穩(wěn)定采樣的一致性噪聲期望

為了確保采樣過程中平滑且一致的過渡，引入了一個統(tǒng)一的噪聲期望向量，該向量從預訓練模型中估計得出。這個期望向量作為所有時間步的全局參考，使去噪過程在時間上保持一致。通過保持期望的一致性，我們能夠在不降低圖像質量的前提下壓縮采樣步數(shù)。理論分析進一步表明，我們的設計最大化了從數(shù)據(jù)到噪聲再返回的數(shù)據(jù)-噪聲正反路徑的概率，從而帶來了更穩(wěn)定的采樣和更可靠的重建效果。

學習關鍵時間步的采樣

除了重新設計生成路徑，還著力提升訓練效率。擴散模型的標準訓練過程通常對時間步進行均勻采樣，這會引入高方差損失，并在非關鍵信息步驟上浪費計算資源。

為了解決這一問題，引入了一個重要性采樣機制，學習聚焦于訓練中最關鍵的時間步。將隨機 Stein 偏差（SSD）與一個神經網絡相結合，該網絡學習一個依賴數(shù)據(jù)的時間步分布。該網絡預測哪些時間索引對減少訓練損失的貢獻最大，從而使我們在優(yōu)化過程中優(yōu)先考慮這些時間步。結果是更快的收斂速度和更高效的訓練資源利用。

本文框架支持在極少步驟下進行高效采樣，同時不犧牲生成質量。其遵循一個迭代去噪日程，采樣步驟遠少于未加速的基線方法。盡管步驟減少，本文方法在美學質量、文本-圖像對齊和結構保真度等關鍵方面達到了或超過了需要 50 次函數(shù)評估（NFE）才能實現(xiàn)的基線結果。這些結果表明，我們的軌跡設計與噪聲一致性機制在實現(xiàn)高質量合成與最小計算代價方面的有效性。對于其他加速方法，如量化，直接采用 Seedream 2.0 的方案。

模型性能

在一次公開進行的評測中，Seedream 3.0 在全球頂級文本生成圖像模型中排名第一，超越了 GPT-4o、Imagen 3、Midjourney v6.1、FLUX1.1 Pro、Ideogram 3.0 等模型。

還進行了嚴格的專家評估，包括人工評估和自動評估。結果顯示，Seedream 3.0 在所有關鍵性能指標上相較于前一版本均有顯著提升，并在與行業(yè)領先模型的比較中表現(xiàn)出色。

值得注意的是，Seedream 3.0 在兩個方面表現(xiàn)尤為卓越：密集文本渲染和逼真人像生成。此外，還在下面提供了與 GPT-4o的系統(tǒng)對比分析，探討兩個模型在不同領域的能力邊界?？傮w結果展示在圖 1 中。

Artificial Analysis 競技場

Artificial Analysis 是一個領先的 AI 模型評測平臺，專注于圖像和視頻生成。該平臺提供動態(tài)排行榜，基于關鍵指標如輸出質量、生成速度和成本，對模型進行評估，從而實現(xiàn)對最先進 AI 系統(tǒng)的客觀比較。

該平臺的文本生成圖像排行榜允許用戶匿名比較不同模型生成的圖像。為了保證公平性，用戶對相同提示下生成的圖像進行投票，且不知曉圖像來自哪個模型。模型的排名基于 ELO 評分系統(tǒng)，該系統(tǒng)在一定程度上反映了用戶的偏好。

Seedream 3.0 參與了 Artificial Analysis 的排名評測，并在整體評分中取得了第一名，擊敗了 GPT-4o，在 Recraft V3、HiDream、Reve Image、Imagen 3（v002）、FLUX1.1 Pro 和 Midjourney v6.1 等其他模型中建立了顯著優(yōu)勢。

此外，它還在多個子維度中表現(xiàn)最佳，包括以下風格類別：通用 & 寫實風、動漫、卡通 & 插畫、傳統(tǒng)藝術；以及以下主題類別：人物：肖像、人物：群體 & 活動、奇幻、未來主義和物理空間。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

綜合評估

人工評估

建立了一個更大規(guī)模的評測基準，以便在不同場景下對 Seedream 3.0 進行更全面的評估。該基準被命名為 Bench-377，由 377 個提示詞構成。除了考察文本到圖像對齊、結構合理性和審美感等基本維度外，提示詞的設計還考慮了使用場景。我們主要考慮了五大類場景：電影化、美術、娛樂、美學設計和實用設計。我們提出了“實用設計”這一類別，因為 Seedream 3.0 已被證明在輔助日常工作和學習方面具有顯著作用。例如，它可以在幻燈片中的圖標排布、手抄報插圖設計等任務中提供支持。

基于 Bench-377，文本到圖像模型的系統(tǒng)性人工專家評估是通過三個基本標準進行的：文本圖像對齊、結構正確性以及審美質量。圖 6 展示了五種使用場景的具體結果。Seedream 3.0 在文本圖像對齊和結構保真度方面顯著優(yōu)于 Seedream 2.0 和其他競品模型。值得注意的是，它在美學表現(xiàn)方面整體得分超過了 Midjourney。此外，在設計類場景中，其表現(xiàn)也明顯優(yōu)于 Midjourney，盡管在藝術類場景中略遜一籌。Imagen 3 在文本圖像對齊和結構方面也展現(xiàn)出較好的表現(xiàn)，但在美學評估中表現(xiàn)欠佳。Midjourney 雖然具有出色的審美能力，但在功能對齊和結構保真度方面表現(xiàn)有限。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

圖 7、8、9 和 10 展示了基礎能力提升如何促進多樣場景的生成。文本圖像對齊能力的提升使得用戶意圖能夠被更精準地表達。例如，對微表情的生動描繪提升了電影氛圍的表現(xiàn)力。對復雜描述和專業(yè)術語（如“三視圖”）的精準理解與表達，能更好地滿足用戶的設計需求。這些能力的基礎支撐來自于結構穩(wěn)定性和審美質量的增強。例如，動態(tài)動作中四肢的完整性、小物體的細節(jié)呈現(xiàn)，以及在顏色、光照、材質和構圖方面的提升，都是 Seedream 3.0 高可用性的關鍵因素。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

自動評估

根據(jù)上一版本的自動評估方式，對文本到圖像生成模型進行了兩項標準的評估：文本圖像對齊和圖像質量。Seedream 3.0 在所有基準中持續(xù)排名第一。

在文本圖像對齊的自動評估中，主要關注 EvalMuse，它在多個基準中與人工評估具有較好的一致性。如表 1 所示，Seedream 3.0 的表現(xiàn)優(yōu)于其他模型。更精細的維度分析顯示，與 Seedream 2.0 相比，Seedream 3.0 在大多數(shù)維度上都有所提升，尤其是在物體、活動、位置、食物和空間等方面。為了與此前報告的結果保持一致，此處及后續(xù)章節(jié)中也納入了對 Ideogram 2.0 的評估。

在圖像質量評估方面，復用了兩個外部指標 HPSv2和 MPS，以及兩個內部評估模型：Internal-Align 和 Internal-Aes。如表 1 所示，Seedream 3.0 在所有指標上均排名第一。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

在包含 MPS 和我們內部審美評估模型的審美評估中，Seedream 3.0 的表現(xiàn)優(yōu)于 Midjourney，而 Seedream 2.0 在先前評估中未能做到這一點。同時，在 HPSv2 指標方面，Seedream 3.0 首次突破了 0.3，表明我們的模型與人類偏好具有極高的一致性。

文本渲染

Seedream 2.0 在文本渲染方面（特別是中文字符）獲得了用戶的廣泛好評。在 Seedream 3.0 中，進一步優(yōu)化了這一能力并進行了全面評估。我們的文本評估基準包含 180 條中文提示和 180 條英文提示，覆蓋了包括 logo 設計、海報、電子顯示、印刷文本和手寫文本在內的多種類別。

采用一個基于感知的指標（可用率）以及兩個基于統(tǒng)計的指標（文本準確率和命中率）來評估文本渲染能力?？捎寐手傅氖窃谖谋句秩净菊_的前提下，考慮文本與其他內容的融合及整體審美質量后，被認為可接受的圖像比例。具體的客觀指標定義如下：

文本準確率 定義為：

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

文本命中率定義為：

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

圖 11 顯示，Seedream 3.0 在文本渲染性能方面優(yōu)于包括其前代版本（Seedream 2.0）在內的現(xiàn)有模型。該系統(tǒng)對中英文字符均實現(xiàn)了 94% 的文本可用率，基本消除了文本渲染作為圖像生成限制因素的問題。值得注意的是，中文文本可用率相較于 Seedream 2.0 提升了 16%?？捎寐逝c命中率接近的數(shù)值進一步表明，布局或媒介相關的渲染錯誤發(fā)生頻率極低。這些結果驗證了我們原生文本渲染方法相比于后期合成方式和外部插件解決方案的有效性。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

除了整體可用率的提升，Seedream 3.0 在密集文本渲染方面的卓越表現(xiàn)也尤為值得關注。密集文本指的是字符密度高、內容較長的段落，如包含眾多祝福語的文字內容，一直是此前模型的挑戰(zhàn)所在。相比之下，Seedream 3.0 在處理此類細字符時展現(xiàn)出了顯著的進步。如圖 12 和圖 13 所示，Seedream 3.0 在小字符的精度生成以及文本布局的自然性方面均表現(xiàn)出色。為進行對比，將在后續(xù)章節(jié)中評估另一個在密集文本渲染方面也表現(xiàn)突出的模型 GPT-4o。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

擬真肖像

AI 生成圖像（尤其是肖像）過于合成的外觀，一直是文本生成圖像模型的批評焦點。諸如過于光滑的皮膚和油膩的質感等問題，使得生成圖像看起來很不自然。

為了全面評估 Seedream 3.0 在該領域的表現(xiàn)，構建了一個包含 100 條提示詞的肖像評估集。這些提示詞聚焦于肖像生成的多個方面，包括表情、姿態(tài)、角度、發(fā)型特征、皮膚紋理、服飾和配飾等。評估采用 Elo 對戰(zhàn)方式，參與者需在不同模型生成的肖像中選出更優(yōu)者，并說明理由。評估標準主要關注兩個維度：真實感與情感表達。

參評模型包括 Seedream 3.0、Seedream 2.0、Midjourney v6.1、FLUX-Pro 1.1，以及以擬真著稱的新版 Ideogram 3.0。為了確保公平比較，Midjourney v6.1 會進行多輪圖像生成，以排除那些過于藝術化或抽象的結果，保留更具現(xiàn)實感的作品。

經過超過 50,000 輪公開對戰(zhàn)評估后，結果如圖 14 所示（部分模型變體未顯示）。

Seedream 3.0 與 Midjourney v6.1 并列第一，顯著優(yōu)于其他模型。圖 15 中的示例展示了 Seedream 3.0 成功去除了人像中的合成感。生成的人臉紋理如今具備諸如皺紋、細小面部毛發(fā)和疤痕等真實特征，逼近自然人類皮膚的外觀。同時，Seedream 3.0 仍可根據(jù)提示生成完美無瑕的皮膚質感。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

此外，雖然 Midjourney v6.1 在紋理表現(xiàn)方面略遜于 Seedream 3.0，但在情感表達上的表現(xiàn)更為突出，這也為其贏得了高分排名。未來版本將進一步加強這兩個方面。

特別指出，Seedream 3.0 能夠直接生成高分辨率圖像，如 2048×2048，進一步提升了肖像紋理質量。圖 16 展示了部分 Seedream 3.0 的生成示例。生成肖像的質量正朝著專業(yè)攝影水準邁進，為應用場景帶來全新可能。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

與 GPT-4o 的對比

近期，GPT-4o 推出了令人印象深刻的圖像生成功能，展現(xiàn)出極強的多模態(tài)能力。由于缺乏大規(guī)模圖像生成的 API，尚無法進行系統(tǒng)性評估。然而，通過選取部分案例進行對比分析發(fā)現(xiàn)，GPT-4o 與 Seedream 3.0 在不同場景中各具優(yōu)勢與不足。

密集文本渲染

GPT-4o 展現(xiàn)出優(yōu)秀的文本渲染能力，從多個示例中可見一斑。benw 生成了可比案例以便進行比較，如圖 17 所示。GPT-4o 在渲染英文小字符及部分 LaTeX 符號方面表現(xiàn)出色。然而，在中文字體渲染方面存在明顯不足。相比之下，Seedream 3.0 能輕松應對密集的中文文本生成，并在排版和美學構圖方面優(yōu)于 GPT-4o。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

圖像編輯

圖像編輯任務將生成能力與真實圖像結合，因其實際應用價值而備受關注。GPT-4o 能根據(jù)提示對給定圖像執(zhí)行編輯操作。由 Seedream 派生出的 SeedEdit 同樣支持此類功能。此外，Gemini-2.0 近期在多模態(tài)圖像生成方面展現(xiàn)出強勁能力，尤其是在交替生成與多輪編輯方面。本研究聚焦于這些模型的單輪圖像生成能力，如圖 18 所示。展示了 SeedEdit 在保持 ID 和遵循提示方面表現(xiàn)更優(yōu)。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

這三種模型各具特點。GPT-4o 擅長滿足多樣的編輯需求，但在保留原始圖像（尤其是 IP 和 ID 一致性）方面表現(xiàn)欠佳。Gemini-2.0 雖然在像素層級上保留原始圖像，但常出現(xiàn)色彩不自然和圖像質量下降的問題。SeedEdit 1.6 實現(xiàn)了平衡的性能，能有效應對典型編輯需求，并保持較高的可用率。但在處理更復雜的任務（如多圖參考、多輪編輯）方面仍有局限。未來版本將針對這些問題進行改進。

主要對比了 SeedEdit 與 GPT-4o 在文本相關編輯任務中的表現(xiàn)。文本編輯本身具有挑戰(zhàn)性，它要求不僅能渲染文本，還能識別并理解圖像中的字符。能處理文本編輯任務，是可控圖像生成向真實圖像應用邁進的重要標志。圖 19 展示了文本寫入、刪除、修改等任務的示例。SeedEdit 繼承了 Seedream 3.0 的文本相關能力，表現(xiàn)令人滿意。它能夠精準識別圖像中的文本，從而實現(xiàn)準確刪除或修改。同時，在添加文本時，SeedEdit 能考慮排版，使文本與原圖無縫融合。相比之下，GPT-4o 雖能完成文本編輯任務，但在保留原圖方面表現(xiàn)不佳，限制了其實用性。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

生成質量

生成質量（包括色彩、紋理、清晰度和美學吸引力）是評估文本生成圖像模型的重要指標。Seedream 系列在這些方面持續(xù)表現(xiàn)出色，而 GPT-4o 則存在一些短板。如圖 20 所示，GPT-4o 生成的圖像往往帶有偏黃暗調，且存在較多噪點，嚴重影響圖像在多場景中的使用價值。

Seedream 3.0技術細節(jié)重磅發(fā)布！中文圖文生成再進化,2K高清+爆改文字渲染,遠超Canva！-AI.x社區(qū)

結論

本文介紹了 Seedream 3.0，它通過多項創(chuàng)新策略應對了現(xiàn)有挑戰(zhàn)，包括圖像分辨率受限、復雜屬性依從性、細粒度排版生成，以及視覺美感和保真度不足等問題。通過在數(shù)據(jù)構建、模型預訓練、后訓練和模型加速等方面進行系統(tǒng)升級，Seedream 3.0 在多個維度上較前一版本取得了全面提升。

Seedream 3.0 提供原生高分辨率輸出、全能能力、更高的文本渲染質量、更佳的視覺效果和極致的生成速度。隨著其在豆包、即夢等平臺上的集成，Seedream 3.0 展現(xiàn)出強大的潛力，成為覆蓋各類工作與生活場景的高效生產力工具。

本文轉自AI生成未來，作者：AI生成未來

原文鏈接:??https://mp.weixin.qq.com/s/eUrV5XgxuhimSTGPOfwntw??

標簽

贊

收藏

回復

舉報

回復

相關推薦

海報生成如此簡單！OPPO聯(lián)合港中文發(fā)布基于LLM的端到端方案GlyphDraw2

angel ? 5153瀏覽 ? 0回復
怎么用ai文字生成繪畫圖？一分鐘教你學會ai文生圖

行走的小非 ? 5931瀏覽 ? 0回復
Midjourney V6.1再進化！人像逼真細節(jié)拉滿，攝影級畫面秒生成

duhorse ? 4014瀏覽 ? 0回復
大模型技術細節(jié)——大模型之文本生成與文檔總結

AI探索時代 ? 8682瀏覽 ? 0回復
即插即用，效率遠超ControlNet！賈佳亞團隊重磅開源ControlNeXt：超強圖像視頻生成方法

angel ? 5268瀏覽 ? 0回復
AgentWrite：為什么你的模型生成的內容長度總是不超過2K?

大語言模型論文跟蹤 ? 7856瀏覽 ? 0回復
全球首個帶背景音樂，文生1080超高清視頻模型

Aceryt ? 4144瀏覽 ? 0回復
Anthropic研究團隊提出新技術，引入Contextual Retrieval讓RAG再進化，大幅降低檢索失敗率

AI博物院 ? 3902瀏覽 ? 0回復
RAG再進化？基于長期記憶的檢索增強生成新范式-MemoRAG

大模型自然語言處理 ? 3845瀏覽 ? 0回復
文字秒變視頻，附技術細節(jié)

云原生AI百寶箱 ? 4054瀏覽 ? 0回復
DeepSeek核心架構-MLA：剖析低秩聯(lián)合壓縮優(yōu)化KV緩存、提升推理效率的技術細節(jié)

南夏的算法驛站 ? 7503瀏覽 ? 0回復
DeepSeek做爆款圖文，太強了

Bx玩AI ? 4423瀏覽 ? 0回復
重磅，微軟LazyGraphRAG正式開源及實現(xiàn)細節(jié)剖析！

PaperAgent ? 5283瀏覽 ? 0回復
繼GTP- 4o爆火后，最強中文AI繪畫模型「即夢3.0」上線：設計師的末日要到了？

算家計算 ? 5779瀏覽 ? 0回復
OpenING：用于評估開放式交錯圖文生成的綜合基準

AIRoobt ? 2691瀏覽 ? 0回復
中文、日文、韓文等多種語言精準生成！Liblib重磅開源RepText：打破AI圖文生成語言壁壘

angel ? 4629瀏覽 ? 0回復
谷歌Gemini 2.5家族全面升級：Pro、Flash與Flash-Lite正式發(fā)布，AI推理能力再進化

AI博物院 ? 1.2w瀏覽 ? 0回復
Qwen-Image-Edit發(fā)布：圖像編輯終于能“懂語義+改細節(jié)”了

Halo咯咯 ? 8268瀏覽 ? 0回復
AI的自我進化時代來臨：多所頂尖機構聯(lián)合發(fā)布50頁重磅綜述

柏企閱文 ? 2830瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

多領域SOTA誕生！Vid2World：打通視頻擴散到世界模型的“任督二脈”｜清華、重大 2025-05-23 10:17:32發(fā)布
多模態(tài)終極大一統(tǒng)！字節(jié)開源BAGEL爆火：圖文生成理解雙冠王，竟能預測未來畫面？ 2025-05-22 09:33:05發(fā)布

熱門推薦

用 Cognee 構建端到端知識圖譜，實現(xiàn)當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態(tài)輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

8%價格，2倍速度！國產MiniMax M2暴打Claude Sonnet 4.5？我們實測后發(fā)現(xiàn)堪稱性價比之王！ 0回復

上一篇： GPT-4o圖像生成能力全揭秘：背后竟藏自回歸+擴散架構？北大&中山等開源GPT-ImgEval

下一篇：又一爆款！港大&字節(jié)開源GigaTok首次破解圖像重建與生成矛盾，30億參數(shù)登頂SOTA！

社區(qū)精華內容

目錄

久久午夜鲁丝片午夜精品| 在线免费黄色网| 人成在线免费视频| 视频精品一区二区| 日韩一区二区三区国产| 视频区图片区小说区| av在线中出| 国产欧美日韩在线| 国产精品精品软件视频| 国产精品免费无遮挡无码永久视频| 久久福利综合| 亚洲成av人乱码色午夜| 天天干在线影院| 超免费在线视频| 国产精品视频线看| 国模精品一区二区三区| 国产精品欧美激情在线| 国产精品美女| 超碰精品一区二区三区乱码| 好吊日免费视频| 韩国三级成人在线| 在线欧美小视频| 妞干网视频在线观看| 成人免费在线视频网| kk眼镜猥琐国模调教系列一区二区| 国产精品久久久久久久久免费看| 久久免费小视频| 欧美大黑bbbbbbbbb在线| 日韩av中文字幕在线| 国产高清av片| 欧美黄色三级| 欧美丝袜一区二区三区| 天堂8在线天堂资源bt| 国产原创精品视频| 国产日韩一级二级三级| 国产在线精品日韩| 性欧美18一19性猛交| 蜜桃视频第一区免费观看| 97高清免费视频| 欧美人妻精品一区二区三区| 欧美成人激情| 日韩在线观看你懂的| 美女洗澡无遮挡| 亚洲视频分类| 精品丝袜一区二区三区| 成年人的黄色片| 成功精品影院| 精品粉嫩超白一线天av| 风韵丰满熟妇啪啪区老熟熟女| 婷婷久久免费视频| 欧美婷婷六月丁香综合色| 欧美牲交a欧美牲交aⅴ免费下载| 高清精品在线| 午夜电影一区二区| 国产九色porny| heyzo中文字幕在线| 亚洲黄色尤物视频| 精品免费久久久久久久| 中文字幕在线观看播放| 一区二区三区色| 亚洲精品天堂成人片av在线播放| 黄色片网站在线观看| ●精品国产综合乱码久久久久| 亚洲一卡二卡三卡| 黄色网页在线免费观看| 亚洲精选视频免费看| 精品免费久久久久久久| av今日在线| 欧美日韩国产精品一区| 不卡影院一区二区| 免费污视频在线一区| 欧美日韩一区小说| 日本一二三四区视频| 日韩中文字幕无砖| 亚洲国产精品电影| 亚洲成人网在线播放| 狠狠综合久久av一区二区蜜桃 | 免费av网址在线| 都市激情亚洲综合| 欧美日本免费一区二区三区| 香蕉视频xxx| 亚洲国产中文在线| 亚洲精品国产精品久久清纯直播 | 97一区二区国产好的精华液| 精品粉嫩aⅴ一区二区三区四区| 久久国产精品无码一级毛片| 精品成av人一区二区三区| 久久久精品久久| 久久草视频在线| 日本91福利区| 91传媒在线免费观看| 亚洲欧美日韩综合在线| 国产精品久久久久久久久免费桃花 | 欧美天堂影院| 亚洲精品自产拍| 久久一级免费视频| 亚洲国产裸拍裸体视频在线观看乱了中文| 2019国产精品自在线拍国产不卡| 制服丝袜在线一区| 国产成人午夜精品5599 | 精品一区二区三| 久久伊人精品一区二区三区| 国产精品久久久久久久妇| 美腿丝袜亚洲一区| 韩国成人动漫在线观看| 日韩理伦片在线| 精品久久久久久久大神国产| 国模私拍视频在线观看| 欧美毛片免费观看| 久久久成人精品| 日韩一级在线视频| 国产盗摄女厕一区二区三区 | 欧洲美女亚洲激情| 九一亚洲精品| 欧美大片在线看免费观看| 精品成人无码久久久久久| 成人国产在线观看| 国产精品亚洲天堂| 蜜桃精品在线| 亚洲精品动漫100p| 久久免费精彩视频| 国产一区二区在线观看免费| 欧美亚洲爱爱另类综合| 乱插在线www| 欧美一区二区三区视频免费| 欧美三级视频网站| 免费久久99精品国产自在现线| 91高跟黑色丝袜呻吟在线观看| av免费观看一区二区| 精品久久久中文| wwwxx日本| 欧美高清不卡| 91九色在线视频| 亚洲欧美视频一区二区| 欧美体内she精视频| 久久久久久国产精品无码| 99热在线精品观看| 国产原创精品| 国产一二三在线| 337p日本欧洲亚洲大胆精品 | 深田咏美中文字幕| 国产精品观看| 91精品久久久久久蜜桃| 国产美女在线观看| 337p亚洲精品色噜噜噜| 日本少妇aaa| 激情五月激情综合网| 中文字幕在线观看一区二区三区| 国产精品久久久久久吹潮| 亚洲人在线观看| 无码人妻丰满熟妇精品区| 久久尤物电影视频在线观看| 国产免费黄色av| 伊人久久大香线蕉无限次| 日本久久久久久久久| 精品乱码一区二区三四区视频| 色综合久久久网| 永久免费成人代码| 日产欧产美韩系列久久99| 亚洲日韩国产第一区| 亚洲国产aⅴ精品一区二区三区| 日韩在线小视频| 国产美女明星三级做爰| 一区二区三区在线视频免费| 中文字幕天堂av| 亚洲欧美日韩专区| 日韩中文字幕一区二区| 日韩av首页| xvideos亚洲人网站| 国产探花精品一区二区| 亚洲第一精品在线| 一区二区三区免费在线观看视频| 丝袜亚洲另类丝袜在线| 伊人狠狠色丁香综合尤物| 国产在线不卡一区二区三区| 欧美激情精品久久久久久蜜臀| 日韩一级在线播放| 在线影院国内精品| 污软件在线观看| www..com久久爱| 国产av人人夜夜澡人人爽| 国产精品久久久久久影院8一贰佰国产精品久久久久久麻豆一区软件 | 天天摸天天干天天操| 日本高清不卡视频| 色婷婷在线视频观看| 不卡视频在线观看| 9久久婷婷国产综合精品性色| 四虎国产精品免费观看| 国产伦理一区二区三区| 成人做爰视频www网站小优视频| 日韩在线视频免费观看| 韩国av在线免费观看| 在线观看日韩国产| 久草视频免费播放| 国产女人18毛片水真多成人如厕| 欧美国产在线一区| 久久久久99| 青青草视频国产| 久久不见久久见中文字幕免费| 91精品一区二区| 国产不卡网站| 欧美国产第二页| 国产在线黄色| 亚洲国产精品久久| 国产精品国产精品国产专区| 精品国产91久久久久久老师| 91精品少妇一区二区三区蜜桃臀| 91老师片黄在线观看| 日本中文字幕在线不卡| 日韩在线一区二区三区| 日韩人妻无码精品久久久不卡| 色婷婷色综合| 日本一区免费| 嫩草国产精品入口| 亚洲一区二区三区视频| 免费在线成人激情电影| 97精品视频在线| 中文字幕有码在线视频| 日韩中文字在线| 免费在线观看一级毛片| 欧美精品一区二区三区在线| av中文字幕播放| 欧美日韩国产a| 337p粉嫩色噜噜噜大肥臀| 亚洲高清不卡在线观看| 国产精品久久久久久久精| 国产精品美女视频| 中文字幕第20页| 久久夜色精品国产噜噜av| 毛毛毛毛毛毛毛片123| 精品一区二区三区视频| 天天干在线影院| 日本欧美一区二区三区| 亚洲爆乳无码专区| 国产精品入口| 欧美日韩成人免费视频| 一区视频在线看| 精品视频在线观看一区二区| 91精品福利| 国产又大又长又粗又黄| 91亚洲国产高清| 中文字幕免费在线不卡| 久久看人人摘| 中文字幕一区综合| 亚洲有吗中文字幕| 久久久成人精品一区二区三区| 久久精品99久久无色码中文字幕| 色噜噜狠狠色综合网| 欧洲视频一区| 视频一区视频二区视频| 欧美综合另类| 影音先锋欧美在线| 婷婷另类小说| 麻豆一区二区三区在线观看| 欧美va天堂在线| www.亚洲成人网| 亚洲网站视频| 欧美网站免费观看| 亚洲欧美大片| 日日噜噜噜噜久久久精品毛片| 日韩精品成人一区二区在线| 国内自拍视频网| 精品亚洲国产成人av制服丝袜| 天堂在线一区二区三区| 国产电影一区在线| 成人精品在线观看视频| 国产片一区二区三区| 国内毛片毛片毛片毛片毛片| 亚洲人一二三区| 精品人妻在线播放| 欧美午夜精品久久久久久浪潮 | 国产视频99| 欧美男gay| 伊人久久大香线蕉成人综合网| 你懂的视频一区二区| 蜜臀av色欲a片无码精品一区| 久久精品导航| 在线一区二区不卡| 成人动漫一区二区在线| 三级网站在线免费观看| 一色屋精品亚洲香蕉网站| 欧美精品一区二区蜜桃| 色综合天天性综合| 99国产精品久久久久久久成人| 亚洲国产精久久久久久 | 久久综合免费视频影院| a级大胆欧美人体大胆666| 国产福利精品av综合导导航| 99国内精品久久久久| 精品欧美国产| 婷婷亚洲综合| 国产成人a亚洲精v品无码| 久久福利视频一区二区| 少妇一级淫片免费放播放| 欧美激情一二三区| 国产精品23p| 欧美日韩免费视频| 亚洲色图欧美视频| 久久躁日日躁aaaaxxxx| 一区二区三区电影大全| 亚洲aⅴ男人的天堂在线观看 | 国产精品一区二区av影院萌芽| 91精品美女在线| 亚洲素人在线| 男女激情免费视频| 美女www一区二区| 国产国语性生话播放| 综合久久久久久| www.欧美色| 亚洲国产91色在线| 黄色成人影院| 国产精品www色诱视频| 国产精品午夜av| 男女爱爱视频网站| 日韩电影在线观看网站| 日韩少妇一区二区| 亚洲免费av网站| 一区二区视频免费| 亚洲美女性视频| 2001个疯子在线观看| 亚洲最大av在线| 91久久高清国语自产拍| 另类小说第一页| 久久久精品中文字幕麻豆发布| 久久久夜色精品| 精品日韩欧美一区二区| 日本综合在线| 国产精品老女人视频| 久草精品在线| 国产日产欧美视频| 99久久婷婷国产精品综合| 久久国产免费观看| 日韩一区二区三区高清免费看看| 香蕉视频网站在线观看| 国产精品女视频| 欧美色图一区| 久久久久久三级| 国产亚洲精品福利| 成人一级免费视频| 亚洲香蕉伊综合在人在线视看| 成人性生交大片免费观看网站| 精品国产福利| 日韩一级精品| 亚洲精品视频大全| 欧美日韩视频在线| 欧美视频免费一区二区三区| 欧美又大粗又爽又黄大片视频| 四虎影视精品| 成人久久久久久久久| 久久女同精品一区二区| 男人天堂av在线播放| 一区二区亚洲精品国产| 99re久久| 中文字幕在线亚洲精品| 国产一区二区不卡老阿姨| 欧美成人精品欧美一| 精品欧美一区二区三区精品久久 | 一级中文字幕一区二区| 成人免费视频国产| 久久久噜噜噜久久久| 欧美综合精品| 日日碰狠狠丁香久燥| 国产欧美精品在线观看| 91成品人影院| 欧美高清视频在线播放| 久久久久久毛片免费看| 女人天堂av手机在线| 国产亚洲一本大道中文在线| 中文字幕在线2018| 久久综合电影一区| 九九热hot精品视频在线播放| 欧美日韩黄色一级片| 国产人久久人人人人爽| 国产哺乳奶水91在线播放| 性色av一区二区三区红粉影视| 国产精品中文字幕亚洲欧美| 欧美一级特黄a| 亚洲一级在线观看| 蜜桃视频在线观看网站| 91精品啪在线观看麻豆免费| 亚洲精品人人| 国产精品久久免费观看| 日韩视频123| 亚洲欧洲美洲av| 樱花www成人免费视频| 成人午夜大片免费观看| 日韩国产亚洲欧美| 欧美黑人xxxⅹ高潮交| 西野翔中文久久精品国产| 九九热免费在线观看| 精品久久久久久国产91| 国产黄a三级三级三级av在线看 | 亚洲国产日韩在线一区| 精品成人av一区| 免费黄色在线看| 久久精品成人一区二区三区蜜臀| 精品在线播放免费| 日韩成人av毛片| 久久色免费在线视频| 九九视频免费观看视频精品|