谷歌Nano Banana Pro上線，深度結(jié)合Gemini 3，這下生成世界了

2025-11-21 08:44:56

Nano-banana，也就是 Gemini 2.5 Flash Image 模型，有多猛大家也不陌生了。無論是修復(fù)老照片，還是生成迷你手辦，Nano Banana 在圖像編輯方面邁出了重要一步，讓普通創(chuàng)作者也能輕松表達(dá)創(chuàng)意。

三個(gè)月前，來自谷歌 AI Studio 負(fù)責(zé)人 Logan Kilpatrick 的一個(gè)香蕉表情暗示了現(xiàn)象級(jí)圖像生成模型 Nano-banana 出自谷歌，引發(fā)了軒然大波。

我們也曾經(jīng)翻遍全網(wǎng)，整理了 7 種體現(xiàn)納米香蕉超強(qiáng)圖像理解生成能力的趣味玩法，感興趣的讀者可以回顧一下。

就在前兩天，Gemini 3 發(fā)布前，Logan Kilpatrick 故技重施，點(diǎn)燃了大家對(duì)新模型的期待。

結(jié)果今天下午梅開三度。

網(wǎng)友說：「停停」。

在 Gemini 3 重磅登場(chǎng)后，谷歌的王炸模型只剩下了那支傳說級(jí)的香蕉。

不出所料，就在剛剛，谷歌最新，最強(qiáng)大，最全面的圖像生成模型 Nano Banana Pro（Gemini 3 Pro Image）正式登場(chǎng)，掛上了「專業(yè)級(jí)」后綴的納米香蕉，結(jié)合了 Gemini 3 Pro 的強(qiáng)大推理能力和世界知識(shí)，實(shí)力再次實(shí)現(xiàn)了飛躍。

官方鏈接：https://gemini.google/overview/image-generation/

簡(jiǎn)而言之，Nano Banana Pro 主要 Pro 在：前所未有的控制力、完美的文字渲染效果和更強(qiáng)的世界知識(shí)，具備打造工作室級(jí)別的設(shè)計(jì)作品的生成能力。

前所未有的控制力

高分辨率

作為一款圖像生成模型，Nano Banana Pro 這次最直觀、最能有感的基礎(chǔ)能力升級(jí)，是能夠生成 2K 和 4K 的高分辨率圖像。

圖像像素量有顯著的提升，意味著模型必須同時(shí)在細(xì)節(jié)刻畫、畫面精度、生成穩(wěn)定性、一致性以及可控性上全面升級(jí)。

除此以外，Nano Banana Pro 支持了廣泛的圖像長寬比，解決了基礎(chǔ)款 Nano Banana 使用時(shí)很難控制圖像比例的痛點(diǎn)問題，尤其是在 Gemini 對(duì)話中明確要求圖像比例時(shí)，Nano Banana 仍不能生成對(duì)應(yīng)長寬比的圖像。

Nano Banana Pro 生成不同比例的超高清圖像

得益于多種可用的長寬比和 2K / 4K 高分辨率，谷歌聲稱：「作品可以直接用于任意平臺(tái)，從社交媒體到印刷物料。」

更強(qiáng)大的一致性

Nano Banana 火遍全網(wǎng)，其中最重要的原因就在于它令人驚嘆的視覺一致性控制。

舉個(gè)大家最熟悉的例子：只需上傳一張簡(jiǎn)單的服裝圖和人物照片，再配上一兩句限制性文本指令，它就能快速精準(zhǔn)地將元素融合，輕松生成風(fēng)格統(tǒng)一、構(gòu)圖自然，并且保持人物和服裝一致的 OOTD 合成照。感興趣的讀者可以看看我們這一篇報(bào)道，輕輕松松做一名時(shí)尚博主。

而使用 Nano Banana Pro，你可以融合比以往更多的元素：

最多使用 14 張參考圖像，保持多達(dá) 5 個(gè)人物的一致性與相似度。

讓我們簡(jiǎn)單來看兩個(gè)實(shí)例：

Prompt: Combine these images into one appropriately arranged cinematic image in 16:9 format

Prompt: A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor. They are all facing forwards, watching a vintage, wooden-boxed television set placed on a low wooden table in front of the sofa. The room is dimly lit, with warm light from a window on the left and the glow from the TV illuminating the creatures’ faces and fluffy textures. The background is a cozy, slightly cluttered living room with a braided rug, a bookshelf with old books, and rustic kitchen elements in the background. The overall atmosphere is warm, cozy, and amused.

效果非常令人驚訝，Nano Banana Pro 不僅可以保留參考圖片中的物體和人物特征，更能夠理解參考圖片中的背景圖像信息，理解光影、材質(zhì)和圖像結(jié)構(gòu)，深刻洞察用戶的設(shè)計(jì)意圖。哪怕高達(dá) 14 張參考圖像，Nano Banana Pro 都能夠在新圖像中保留全部的細(xì)節(jié)。

不管是將一張隨手勾勒的手繪草圖變成可落地的實(shí)體產(chǎn)品，還是把技術(shù)藍(lán)圖轉(zhuǎn)化為質(zhì)感逼真的 3D 結(jié)構(gòu)，Nano Banana Pro 都能幫你輕松跨越那道長期存在的從想象到落地的鴻溝。

此外，在設(shè)計(jì)領(lǐng)域中，Nano Banana Pro 也可以為設(shè)計(jì)稿一鍵套入理想的視覺風(fēng)格，包括品牌主視覺、潮流配色，不同材質(zhì)和質(zhì)感的測(cè)試效果，它都能快速生成。最終呈現(xiàn)的結(jié)果在所有關(guān)鍵特征上都能保持高度統(tǒng)一，從電商圖到宣傳海報(bào)，從社交內(nèi)容到實(shí)體包裝，毫無割裂感。

相比 Nano Banana 更強(qiáng)的一致性控制，遠(yuǎn)遠(yuǎn)拓展了參考圖生成的上限，創(chuàng)造了更多玩法可能。

更靈活的創(chuàng)意控制

借助 Nano Banana Pro 的全新能力，高級(jí)圖像編輯不再是專業(yè)團(tuán)隊(duì)的專屬 —— 真正的創(chuàng)意控制權(quán)被交回到用戶手中。

用戶可以對(duì)畫面進(jìn)行近乎「分子級(jí)」的操控：

自由選取并重塑圖像任意局部區(qū)域，實(shí)現(xiàn)精準(zhǔn)微調(diào)
切換攝像機(jī)角度，快速生成不同視角與構(gòu)圖
調(diào)整焦點(diǎn)位置，打造更具敘事感的畫面重心
應(yīng)用電影工業(yè)級(jí)調(diào)色，一鍵改變視覺氣質(zhì)
重塑場(chǎng)景光照，從白天到夜晚、從硬光到散景過渡皆可瞬時(shí)完成

這些能力讓 Nano Banana Pro 從簡(jiǎn)單的圖像生成工具，躍升為一個(gè)能夠支持創(chuàng)作者進(jìn)行分鏡級(jí)、視覺導(dǎo)演級(jí)創(chuàng)作的圖像引擎。

視頻中也簡(jiǎn)單演示了從一張圖像，到天氣的重塑，最后使用 Veo 3 模型生成極具電影風(fēng)格的視頻的全過程。下面兩個(gè)示例不僅能夠展示 Nano Banana Pro 強(qiáng)大的創(chuàng)意控制能力，也展開了結(jié)合首尾幀視頻生成的全新可能。

Prompt: change lighting of this portrait to from the left, diffused and soft

Prompt: Focus on the flowers

文字與知識(shí)大師

輕松拿捏文字生成

我們知道，在圖像生成模型中，生成文本一直是一個(gè)難點(diǎn)。

Nano Banana Pro 正是在這一痛點(diǎn)上實(shí)現(xiàn)了再一次迭代：它具備非常強(qiáng)大的文本生成能力，能夠生成包含更準(zhǔn)確、清晰可讀、多語言文本的視覺內(nèi)容。

Nano Banana Pro 是生成圖像內(nèi)可讀文本的最佳模型，無論你需要的是一句簡(jiǎn)短標(biāo)語還是一整段較長文本，都能夠清晰，完整，合理的生成，并且與圖像內(nèi)容完美融合。

Prompt: make 8 minimalistic logos, each is an expressive word, and make letters convey a message or sound visually to express the meaning of this word in a dramatic way. composition: flat vector rendering of all logos in black on a single white background

Prompt: Create an image showing the phrase "How much wood would a woodchuck chuck if a woodchuck could chuck wood" made out of wood chucked by a woodchuck.

現(xiàn)在我們可以在視覺設(shè)計(jì)或海報(bào)中創(chuàng)建帶有更多細(xì)節(jié)的文本，具備更廣泛的紋理、字體與創(chuàng)意樣式。

另外，憑借 Gemini 的增強(qiáng)多語言推理能力，我們可以通過 Nano Banana Pro 生成多語言文本，或?qū)?nèi)容進(jìn)行本地化與翻譯，從而實(shí)現(xiàn)全球化擴(kuò)展，或更輕松地與朋友和家人分享內(nèi)容。

就比如將飲料瓶上的英文翻譯成韓語，并且無縫的合成在原文字的位置，還能保證超高質(zhì)量的細(xì)節(jié)和字體風(fēng)格。

Prompt: translate all the English text on the three yellow and blue cans into Korean, while keeping everything else the same

Gemini 3 賦能知識(shí)庫

由于和 Gemini 3 大模型的深度融合，可以借助 Gemini 3 的高級(jí)推理，Nano Banana Pro 不只是生成漂亮的圖像，它還能幫助你創(chuàng)建更有用的內(nèi)容。

Nano Banana Pro 將龐大的知識(shí)庫融入生成過程，能夠比以往的圖像生成模型產(chǎn)出更具事實(shí)準(zhǔn)確性的視覺內(nèi)容。

此外，在啟用相關(guān)能力時(shí)，通過與 Google 搜索的檢索基座相結(jié)合，模型可以連接到實(shí)時(shí)的網(wǎng)頁內(nèi)容，生成基于最新數(shù)據(jù)的輸出。

于是我們可以獲得準(zhǔn)確的解釋內(nèi)容，進(jìn)一步理解一個(gè)事實(shí)主題，并且生成語境豐富的信息圖和示意圖。

這對(duì)于需要精確呈現(xiàn)現(xiàn)實(shí)信息的應(yīng)用場(chǎng)景尤為重要，如生物學(xué)示意圖或歷史地圖。

Nano Banana Pro 生成的制作豆蔻茶的教程圖片

更進(jìn)一步，Nano Banana Pro 還具備根據(jù)內(nèi)容自動(dòng)生成 PPT 頁面的能力。

無論用戶提供的是一段文字、幾條要點(diǎn)，還是一篇長文，模型都能自動(dòng)理解內(nèi)容和結(jié)構(gòu)，生成對(duì)應(yīng)演示文檔圖像。實(shí)現(xiàn)了「從文字到展示」的流程自動(dòng)化與智能化的實(shí)用進(jìn)步。

隱形水印，快速驗(yàn)證

Nano Banana Pro 的圖像生成能力再次進(jìn)化后，生成圖像和真實(shí)圖像愈發(fā)難以區(qū)分。

但谷歌在這次更新發(fā)布后，對(duì) AI 圖像鑒別采取了新的方法，提高內(nèi)容來源的透明度。

Gemini 應(yīng)用中現(xiàn)在加入了一項(xiàng)新功能：用戶可以直接驗(yàn)證某張圖像是否由 Google AI 生成或編輯。

從今天開始，用戶可以直接在 Gemini 應(yīng)用中驗(yàn)證某張圖像是否由 Google AI 生成或編輯。

如果你看到一張圖像并希望確認(rèn)它是否由 Google AI 生成，只需將其上傳至 Gemini 應(yīng)用，并提出類似于：「這是由 Google AI 生成的嗎？」的問題，就可以獲取準(zhǔn)確的答案。

這一能力由 SynthID 實(shí)現(xiàn)，這是谷歌的數(shù)字水印技術(shù)，它將不可察覺的信號(hào)嵌入到 AI 生成內(nèi)容中。谷歌在 2023 年推出 SynthID。自那以來，已有超過 200 億份 AI 生成內(nèi)容通過 SynthID 加上水印。

Gemini 會(huì)檢測(cè)圖像中的 SynthID 水印，并結(jié)合自身的推理能力，為用戶提供結(jié)果，使用戶更了解你在網(wǎng)上看到的內(nèi)容的背景。不久后，谷歌將擴(kuò)展 SynthID 驗(yàn)證能力，支持包括音視頻在內(nèi)的更多格式，并讓這些能力覆蓋更多產(chǎn)品，如搜索等。

作為此次發(fā)布的一部分，從今天起，通過 Gemini、Vertex AI，Google ADs、Flow 生成的 Nano Banana Pro（Gemini 3 Pro Image）圖像都將嵌入 C2PA 元數(shù)據(jù)，進(jìn)一步提升圖像生成方式的透明度。

面向各類用戶上線

谷歌表示，會(huì)在多個(gè)原本支持舊版本模型的 Google 產(chǎn)品中上線 Nano Banana Pro：

面向消費(fèi)者與學(xué)生

在 Gemini App 中，當(dāng)你選擇「Create images」并使用「Thinking」模型時(shí)，將在全球范圍內(nèi)陸續(xù)上線。
免費(fèi)用戶會(huì)獲得有限的免費(fèi)額度，用完后將回退至原版 Nano Banana 模型。
Google AI Plus、Pro 和 Ultra 的訂閱用戶將獲得更高額度。
在搜索的 AI Mode 中，Nano Banana Pro 將向美國的訂閱用戶提供。
NotebookLM 中，Nano Banana Pro 也將向全球訂閱用戶提供。

面向?qū)I(yè)人士

Google Ads 將升級(jí)圖像生成功能至 Nano Banana Pro，讓廣告主可在 Asset Studio 中使用最前沿的生成與編輯能力。
同時(shí)，它也將從今天開始陸續(xù)向 Workspace 用戶推出，包括 Google Slides 和 Google Vids。

面向開發(fā)者與企業(yè)

可通過 Gemini API 與 Google AI Studio 訪問，并可在 Google Antigravity 中用于創(chuàng)建豐富的 UX 布局與原型。
企業(yè)可立即在 Vertex AI 中開始大規(guī)模內(nèi)容創(chuàng)作支持，并且即將登陸 Gemini Enterprise。

面向創(chuàng)意人士