谷歌Nano Banana Pro上線,深度結(jié)合Gemini 3,這下生成世界了
三個(gè)月前,來自谷歌 AI Studio 負(fù)責(zé)人 Logan Kilpatrick 的一個(gè)香蕉表情暗示了現(xiàn)象級(jí)圖像生成模型 Nano-banana 出自谷歌,引發(fā)了軒然大波。

Nano-banana,也就是 Gemini 2.5 Flash Image 模型,有多猛大家也不陌生了。無論是修復(fù)老照片,還是生成迷你手辦,Nano Banana 在圖像編輯方面邁出了重要一步,讓普通創(chuàng)作者也能輕松表達(dá)創(chuàng)意。
我們也曾經(jīng)翻遍全網(wǎng),整理了 7 種體現(xiàn)納米香蕉超強(qiáng)圖像理解生成能力的趣味玩法,感興趣的讀者可以回顧一下。
就在前兩天,Gemini 3 發(fā)布前,Logan Kilpatrick 故技重施,點(diǎn)燃了大家對(duì)新模型的期待。

結(jié)果今天下午梅開三度。

網(wǎng)友說:「停停」。

在 Gemini 3 重磅登場(chǎng)后,谷歌的王炸模型只剩下了那支傳說級(jí)的香蕉。
不出所料,就在剛剛,谷歌最新,最強(qiáng)大,最全面的圖像生成模型 Nano Banana Pro(Gemini 3 Pro Image)正式登場(chǎng),掛上了「專業(yè)級(jí)」后綴的納米香蕉,結(jié)合了 Gemini 3 Pro 的強(qiáng)大推理能力和世界知識(shí),實(shí)力再次實(shí)現(xiàn)了飛躍。

- 官方鏈接:https://gemini.google/overview/image-generation/
簡(jiǎn)而言之,Nano Banana Pro 主要 Pro 在 :前所未有的控制力、完美的文字渲染效果和更強(qiáng)的世界知識(shí),具備打造工作室級(jí)別的設(shè)計(jì)作品的生成能力。
前所未有的控制力
高分辨率
作為一款圖像生成模型,Nano Banana Pro 這次最直觀、最能有感的基礎(chǔ)能力升級(jí),是能夠生成 2K 和 4K 的高分辨率圖像。
圖像像素量有顯著的提升,意味著模型必須同時(shí)在細(xì)節(jié)刻畫、畫面精度、生成穩(wěn)定性、一致性以及可控性上全面升級(jí)。
除此以外,Nano Banana Pro 支持了廣泛的圖像長寬比,解決了基礎(chǔ)款 Nano Banana 使用時(shí)很難控制圖像比例的痛點(diǎn)問題,尤其是在 Gemini 對(duì)話中明確要求圖像比例時(shí),Nano Banana 仍不能生成對(duì)應(yīng)長寬比的圖像。

Nano Banana Pro 生成不同比例的超高清圖像
得益于多種可用的長寬比和 2K / 4K 高分辨率,谷歌聲稱:「作品可以直接用于任意平臺(tái),從社交媒體到印刷物料。」
更強(qiáng)大的一致性
Nano Banana 火遍全網(wǎng),其中最重要的原因就在于它令人驚嘆的視覺一致性控制。
舉個(gè)大家最熟悉的例子:只需上傳一張簡(jiǎn)單的服裝圖和人物照片,再配上一兩句限制性文本指令,它就能快速精準(zhǔn)地將元素融合,輕松生成風(fēng)格統(tǒng)一、構(gòu)圖自然,并且保持人物和服裝一致的 OOTD 合成照。感興趣的讀者可以看看我們這一篇報(bào)道,輕輕松松做一名時(shí)尚博主。
而使用 Nano Banana Pro,你可以融合比以往更多的元素:
最多使用 14 張參考圖像,保持多達(dá) 5 個(gè)人物 的一致性與相似度。
讓我們簡(jiǎn)單來看兩個(gè)實(shí)例:

Prompt: Combine these images into one appropriately arranged cinematic image in 16:9 format

Prompt: A medium shot of the 14 fluffy characters sitting squeezed together side-by-side on a worn beige fabric sofa and on the floor. They are all facing forwards, watching a vintage, wooden-boxed television set placed on a low wooden table in front of the sofa. The room is dimly lit, with warm light from a window on the left and the glow from the TV illuminating the creatures’ faces and fluffy textures. The background is a cozy, slightly cluttered living room with a braided rug, a bookshelf with old books, and rustic kitchen elements in the background. The overall atmosphere is warm, cozy, and amused.
效果非常令人驚訝,Nano Banana Pro 不僅可以保留參考圖片中的物體和人物特征,更能夠理解參考圖片中的背景圖像信息,理解光影、材質(zhì)和圖像結(jié)構(gòu),深刻洞察用戶的設(shè)計(jì)意圖。哪怕高達(dá) 14 張參考圖像,Nano Banana Pro 都能夠在新圖像中保留全部的細(xì)節(jié)。
不管是將一張隨手勾勒的手繪草圖變成可落地的實(shí)體產(chǎn)品,還是把技術(shù)藍(lán)圖轉(zhuǎn)化為質(zhì)感逼真的 3D 結(jié)構(gòu),Nano Banana Pro 都能幫你輕松跨越那道長期存在的從想象到落地的鴻溝。

此外,在設(shè)計(jì)領(lǐng)域中,Nano Banana Pro 也可以為設(shè)計(jì)稿一鍵套入理想的視覺風(fēng)格,包括品牌主視覺、潮流配色,不同材質(zhì)和質(zhì)感的測(cè)試效果,它都能快速生成。最終呈現(xiàn)的結(jié)果在所有關(guān)鍵特征上都能保持高度統(tǒng)一,從電商圖到宣傳海報(bào),從社交內(nèi)容到實(shí)體包裝,毫無割裂感。
相比 Nano Banana 更強(qiáng)的一致性控制,遠(yuǎn)遠(yuǎn)拓展了參考圖生成的上限,創(chuàng)造了更多玩法可能。
更靈活的創(chuàng)意控制

借助 Nano Banana Pro 的全新能力,高級(jí)圖像編輯不再是專業(yè)團(tuán)隊(duì)的專屬 —— 真正的創(chuàng)意控制權(quán)被交回到用戶手中。
用戶可以對(duì)畫面進(jìn)行近乎「分子級(jí)」的操控:
- 自由選取并重塑圖像任意局部區(qū)域,實(shí)現(xiàn)精準(zhǔn)微調(diào)
- 切換攝像機(jī)角度,快速生成不同視角與構(gòu)圖
- 調(diào)整焦點(diǎn)位置,打造更具敘事感的畫面重心
- 應(yīng)用電影工業(yè)級(jí)調(diào)色,一鍵改變視覺氣質(zhì)
- 重塑場(chǎng)景光照,從白天到夜晚、從硬光到散景過渡皆可瞬時(shí)完成
這些能力讓 Nano Banana Pro 從簡(jiǎn)單的圖像生成工具,躍升為一個(gè)能夠支持創(chuàng)作者進(jìn)行分鏡級(jí)、視覺導(dǎo)演級(jí)創(chuàng)作的圖像引擎。
視頻中也簡(jiǎn)單演示了從一張圖像,到天氣的重塑,最后使用 Veo 3 模型生成極具電影風(fēng)格的視頻的全過程。下面兩個(gè)示例不僅能夠展示 Nano Banana Pro 強(qiáng)大的創(chuàng)意控制能力,也展開了結(jié)合首尾幀視頻生成的全新可能。

Prompt: change lighting of this portrait to from the left, diffused and soft

Prompt: Focus on the flowers
文字與知識(shí)大師
輕松拿捏文字生成
我們知道,在圖像生成模型中,生成文本一直是一個(gè)難點(diǎn)。
Nano Banana Pro 正是在這一痛點(diǎn)上實(shí)現(xiàn)了再一次迭代:它具備非常強(qiáng)大的文本生成能力,能夠生成包含更準(zhǔn)確、清晰可讀、多語言文本的視覺內(nèi)容。
Nano Banana Pro 是生成圖像內(nèi)可讀文本的最佳模型,無論你需要的是一句簡(jiǎn)短標(biāo)語還是一整段較長文本,都能夠清晰,完整,合理的生成,并且與圖像內(nèi)容完美融合。

Prompt: make 8 minimalistic logos, each is an expressive word, and make letters convey a message or sound visually to express the meaning of this word in a dramatic way. composition: flat vector rendering of all logos in black on a single white background

Prompt: Create an image showing the phrase "How much wood would a woodchuck chuck if a woodchuck could chuck wood" made out of wood chucked by a woodchuck.
現(xiàn)在我們可以在視覺設(shè)計(jì)或海報(bào)中創(chuàng)建帶有更多細(xì)節(jié)的文本,具備更廣泛的紋理、字體與創(chuàng)意樣式。

另外,憑借 Gemini 的增強(qiáng)多語言推理能力,我們可以通過 Nano Banana Pro 生成多語言文本,或?qū)?nèi)容進(jìn)行本地化與翻譯,從而實(shí)現(xiàn)全球化擴(kuò)展,或更輕松地與朋友和家人分享內(nèi)容。
就比如將飲料瓶上的英文翻譯成韓語,并且無縫的合成在原文字的位置,還能保證超高質(zhì)量的細(xì)節(jié)和字體風(fēng)格。

Prompt: translate all the English text on the three yellow and blue cans into Korean, while keeping everything else the same
Gemini 3 賦能知識(shí)庫
由于和 Gemini 3 大模型的深度融合,可以借助 Gemini 3 的高級(jí)推理,Nano Banana Pro 不只是生成漂亮的圖像,它還能幫助你創(chuàng)建更有用的內(nèi)容。
Nano Banana Pro 將龐大的知識(shí)庫融入生成過程,能夠比以往的圖像生成模型產(chǎn)出更具事實(shí)準(zhǔn)確性的視覺內(nèi)容。
此外,在啟用相關(guān)能力時(shí),通過與 Google 搜索的檢索基座相結(jié)合,模型可以連接到實(shí)時(shí)的網(wǎng)頁內(nèi)容,生成基于最新數(shù)據(jù)的輸出。
于是我們可以獲得準(zhǔn)確的解釋內(nèi)容,進(jìn)一步理解一個(gè)事實(shí)主題,并且生成語境豐富的信息圖和示意圖。
這對(duì)于需要精確呈現(xiàn)現(xiàn)實(shí)信息的應(yīng)用場(chǎng)景尤為重要,如生物學(xué)示意圖或歷史地圖。


Nano Banana Pro 生成的制作豆蔻茶的教程圖片
更進(jìn)一步,Nano Banana Pro 還具備根據(jù)內(nèi)容自動(dòng)生成 PPT 頁面的能力。

無論用戶提供的是一段文字、幾條要點(diǎn),還是一篇長文,模型都能自動(dòng)理解內(nèi)容和結(jié)構(gòu),生成對(duì)應(yīng)演示文檔圖像。實(shí)現(xiàn)了「從文字到展示」的流程自動(dòng)化與智能化的實(shí)用進(jìn)步。
隱形水印,快速驗(yàn)證
Nano Banana Pro 的圖像生成能力再次進(jìn)化后,生成圖像和真實(shí)圖像愈發(fā)難以區(qū)分。
但谷歌在這次更新發(fā)布后,對(duì) AI 圖像鑒別采取了新的方法,提高內(nèi)容來源的透明度。
Gemini 應(yīng)用中現(xiàn)在加入了一項(xiàng)新功能:用戶可以直接驗(yàn)證某張圖像是否由 Google AI 生成或編輯。

從今天開始,用戶可以直接在 Gemini 應(yīng)用中驗(yàn)證某張圖像是否由 Google AI 生成或編輯。
如果你看到一張圖像并希望確認(rèn)它是否由 Google AI 生成,只需將其上傳至 Gemini 應(yīng)用,并提出類似于:「這是由 Google AI 生成的嗎?」的問題,就可以獲取準(zhǔn)確的答案。

這一能力由 SynthID 實(shí)現(xiàn),這是谷歌的數(shù)字水印技術(shù),它將不可察覺的信號(hào)嵌入到 AI 生成內(nèi)容中。谷歌在 2023 年推出 SynthID。自那以來,已有超過 200 億份 AI 生成內(nèi)容通過 SynthID 加上水印。
Gemini 會(huì)檢測(cè)圖像中的 SynthID 水印,并結(jié)合自身的推理能力,為用戶提供結(jié)果,使用戶更了解你在網(wǎng)上看到的內(nèi)容的背景。不久后,谷歌將擴(kuò)展 SynthID 驗(yàn)證能力,支持包括音視頻在內(nèi)的更多格式,并讓這些能力覆蓋更多產(chǎn)品,如搜索等。
作為此次發(fā)布的一部分,從今天起,通過 Gemini、Vertex AI,Google ADs、Flow 生成的 Nano Banana Pro(Gemini 3 Pro Image)圖像都將嵌入 C2PA 元數(shù)據(jù),進(jìn)一步提升圖像生成方式的透明度。
面向各類用戶上線
谷歌表示,會(huì)在多個(gè)原本支持舊版本模型的 Google 產(chǎn)品中上線 Nano Banana Pro:
面向消費(fèi)者與學(xué)生
- 在 Gemini App 中,當(dāng)你選擇 「Create images」并使用 「Thinking」模型時(shí),將在全球范圍內(nèi)陸續(xù)上線。
- 免費(fèi)用戶會(huì)獲得有限的免費(fèi)額度,用完后將回退至原版 Nano Banana 模型。
- Google AI Plus、Pro 和 Ultra 的訂閱用戶將獲得更高額度。
- 在搜索的 AI Mode 中,Nano Banana Pro 將向美國的訂閱用戶提供。
- NotebookLM 中,Nano Banana Pro 也將向全球訂閱用戶提供。
面向?qū)I(yè)人士
- Google Ads 將升級(jí)圖像生成功能至 Nano Banana Pro,讓廣告主可在 Asset Studio 中使用最前沿的生成與編輯能力。
- 同時(shí),它也將從今天開始陸續(xù)向 Workspace 用戶推出,包括 Google Slides 和 Google Vids。
面向開發(fā)者與企業(yè)
- 可通過 Gemini API 與 Google AI Studio 訪問,并可在 Google Antigravity 中用于創(chuàng)建豐富的 UX 布局與原型。
- 企業(yè)可立即在 Vertex AI 中開始大規(guī)模內(nèi)容創(chuàng)作支持,并且即將登陸 Gemini Enterprise。
面向創(chuàng)意人士
- Nano Banana Pro 將提供給使用 Flow 的 Google AI Ultra 訂閱用戶,為創(chuàng)作者、導(dǎo)演與營銷團(tuán)隊(duì)提供更精準(zhǔn)、更可控的鏡頭與場(chǎng)景生成能力。

Gemini 2.5 Flash Image 和 Gemini 3 Pro Image 模型可通過 Gemini API、Google AI Studio 和 Vertex AI 以付費(fèi)預(yù)覽形式使用。

使用 Nano banana (Gemini 2.5 Flash Image) 獲取更快、更低成本的圖像生成/編輯;使用 Nano banana Pro(Gemini 3 Pro Image)處理更加復(fù)雜、要求更高的任務(wù),但成本與延遲也更高。





































