谷歌發布新一代圖像生成模型 Nano Banana Pro:基于 Gemini 3 Pro 打造,支持 4K 分辨率與完美文字渲染

11 月 20 日消息,谷歌今日正式推出了全新圖像生成與編輯模型 Nano Banana Pro (Gemini 3 Pro Image)。該模型基于 Gemini 3 Pro 架構構建,號稱能以“前所未有的控制力、完美的文字渲染效果以及增強的世界知識儲備”,將用戶的構想轉化為“工作室級(studio-quality)”的設計作品。相比今年 9 月發布、因生成超寫實 3D 手辦而走紅的初代模型,此次更新代表了谷歌在圖像生成領域的又一次重要躍升。


即日起,Nano Banana Pro 面向全球用戶開放免費試用。用戶只需登錄 Gemini 應用,選擇“生成圖像(Create image)”功能,并切換至“Thinking”模式即可體驗這一最新模型。
據谷歌介紹,Nano Banana Pro 在處理復雜信息方面表現出色,能夠生成包含豐富上下文的信息圖表,直觀呈現天氣、體育賽事等實時數據。
該模型的一大突破在于其文本渲染能力。Nano Banana Pro 能夠生成細節更豐富、文字更準確的圖像,并支持以不同風格、字體及語言生成文本內容。無論是簡短的標語還是長段落文本,Nano Banana Pro 都能清晰、準確地將其直接渲染在圖像中。這一特性使其極具實用性,非常適合制作多種語言版本的海報或邀請函。此外,模型還具備強大的合成能力,支持在一個畫面中融合最多 14 張圖像素材和多達 5 個人物主體。


據IT之家了解,在編輯功能上,Nano Banana Pro 引入了更高級的創意控制選項。用戶不僅可以對圖像進行局部選擇與編輯,還能調整攝像機角度、添加背景虛化(Bokeh)效果、改變焦點、進行專業色彩分級(Color Grading),甚至自由切換日夜光照效果。在輸出規格方面,模型支持多種長寬比,最高可生成 4K 分辨率的高清圖像。

值得注意的是,所有經由 Nano Banana Pro 生成或編輯的圖像都將嵌入 C2PA 元數據。隨著行業規范的逐步建立,這一舉措旨在幫助用戶更容易地在搜索結果和社交媒體中識別生成式 AI 內容及深度偽造(Deepfakes)。就在本周,TikTok 也宣布將采用 C2PA 元數據為 AI 生成內容添加隱形水印。
不過,谷歌也指出,盡管 Nano Banana Pro 圖像質量顯著提升,其生成速度有所下降,使用成本亦更高:原 Nano Banana 單張 1024px 圖像生成費用為 0.039 美元(IT之家注:現匯率約合 0.28 元人民幣);而 Nano Banana Pro 生成 1080p/2K 圖像費用升至 0.139 美元(現匯率約合 0.99 元人民幣) / 張,4K 圖像則為 0.24 美元(現匯率約合 1.7 元人民幣) / 張。
目前,免費版 Nano Banana Pro 用戶擁有一定的使用限額,而 Google AI Plus、Pro 和 Ultra 的訂閱用戶則享有更多配額。此外,美國的 Google AI Pro 和 Ultra 訂閱用戶可通過搜索功能中的“AI 模式”使用該模型,全球 NotebookLM 科研助手用戶亦可直接調用。
目前,Nano Banana Pro 正逐步集成至谷歌多項主流 AI 工具中:
- Gemini 應用:默認啟用 Nano Banana Pro 生成圖像;免費用戶可生成有限數量圖像,額度用盡后將自動回落至 Nano Banana;
- Google AI Plus / Pro / Ultra 訂閱用戶:享有更高生成配額(具體上限未公開),并可在 Notebook LM 中調用該模型;
- 搜索(Search):美國地區的 AI Pro 與 Ultra 訂閱用戶可通過“AI 模式”使用該模型;
- 視頻工具 Flow:僅 Ultra 訂閱用戶可調用;
- Google Workspace:現已支持在 Slides 與 Vids 中使用 Nano Banana Pro。
面向開發者,該模型已開放接入 Gemini API、Google AI Studio 及谷歌全新集成開發環境(IDE)Antigravity。




























