Qwen-Image-Edit :一句話搞定圖像編輯,告別復雜PS操作

前言
在 AI 圖像生成與編輯的浪潮中,如何在“自由度”和“保真度”之間取得平衡,一直是技術前沿的挑戰。近期,阿里巴巴團隊發布的 Qwen-Image-Edit 模型引起關注。它是在 Qwen-Image(20B 參數版本) 基礎上延伸出來的圖像編輯能力模塊,專門用于在已有圖像上做精細化/語義化編輯,同時對文本元素(中英文)也支持高度精確的增刪改動。
Qwen-Image-Edit 不僅僅是簡單地“涂涂改改”,而是在視覺語義控制與外觀控制兩方面都有所突破:一方面讓整體語義(如物體、風格、視角、語境等)可以被調整;另一方面讓某些區域可以精確保持原樣,只編輯所需的部分,不影響其他區域。
如何體驗
如果你想體驗 Qwen-Image-Edit,可以前往https://modelscope.cn/aigc/imageGeneration?tab=default,選擇“快速生圖”中的“Qwen Image Edit”。上傳圖片,輸入提示內容,并選擇圖片比例,然后點擊【開始生圖】即可生成。

核心能力亮點
下面是 Qwen-Image-Edit 的幾個核心能力/技術亮點:
語義編輯 + 外觀編輯共存
- 語義編輯:例如改變對象旋轉角度、風格轉化、IP 形象創造等。即使整體像素大量變化,但語義一致性(例如人物、角色、物體)得以保留。
- 外觀編輯:例如某一區域的組件添加/刪除/修改(比如給人像換衣服、給圖片中某物添加標志牌等),其它區域盡可能保持不變。
精準文字編輯能力(中英雙語)
對于含有文字的圖像(如海報、標識牌、手寫或印刷文字),可以直接修改、刪除或新增文字,同時保留字體、大小、風格等原有特征。無論是英文標識還是中文海報,Qwen-Image-Edit 都展示了強大的文字寫入與校正能力。
強 benchmark 性能與可用性
在多個公開的圖像編輯 benchmark 上,Qwen-Image-Edit 的性能為目前 SOTA(state-of-the-art)水平。模型開源、License 為 Apache-2.0,也降低了應用與部署門檻。
操作靈活、可組合編輯
可以通過鏈式(chained)編輯方式來逐步細化:例如先大致修改,再對某個小區域精修。適合復雜場景,比如書法或者細節文字有誤需糾正時。
典型應用場景
1. 風格切換
提示詞: 改為宮崎駿動漫風格
原圖

生成圖片

2. 視角切換
提示詞: 小狗朝向右側
原圖

生成圖片

3. AI消除
提示詞: 移除圖中的礦泉水
原圖

生成圖片

4. 穿搭模擬
提示詞: 用淺藍色襯衫替換圓點襯衫
原圖

生成圖片

5. IP 形象創作
提示詞: 給熊穿上一套藍色和白色的運動服,右手拿著一個橙色的籃球,左腿彎曲
原圖

生成圖片

6. 修復舊照片
提示詞: 修復舊照片,去除劃痕,減少噪點,增強細節
原圖

生成圖片

7. 添加文字
提示詞: 將這盤菜放到白色大理石餐桌上,上方添加文字“揚州炒飯”,下方添加小字“農家大排檔”。
原圖

生成圖片

結語
Qwen-Image-Edit 是當前圖像編輯領域中一個非常有競爭力的模型,它在文字編輯、語義與外觀控制兩個維度上的能力讓很多傳統圖像編輯任務變得更為簡單和智能。對于設計師、內容創作者、廣告/視覺藝術領域從業者,甚至普通用戶來說,都具有很大吸引力。






























