谷歌Nano Banana 2 來了,圖片AGI提前到來?
伴隨著 Gemini 3、GPT 5.1 的各種小道消息散播半個(gè)月。
Nano Banana 2,2K原生輸出,竟然要提前來了,春節(jié)前大玩具有了。
今年玩模型,比較沉迷的是Gemini 2.5 Pro和Nano banana,第二代Nano banana肉眼可見的提升, 可以替代很多Photoshop的功能。在生活實(shí)戰(zhàn)中,價(jià)值一點(diǎn)都不比語言模型低。
圖片AGI提前到來?


提前泄露,意外上線,GitHub代碼曝光,這串營銷工作流是越來越熟練了。
Nano Banana 2用了一套多步驟生成流程,先規(guī)劃、再生成、然后自己審查、發(fā)現(xiàn)錯(cuò)誤、修正、迭代,最后才給結(jié)果。這個(gè)自我糾錯(cuò)的循環(huán),之前的版本沒有。
對(duì)于那些對(duì)圖片精度要求高的場(chǎng)景,比如修改配色、調(diào)整視角、修復(fù)文字,這可能真的有用。之前Nano Banana 1在這些任務(wù)上基本是瞎搞。
關(guān)于底層模型,到底是 Gemini 2.5 Flash,還是 3.0 Pro 也說不清楚。 內(nèi)部代號(hào)是 GEMPIX 2,所以還可能是 Imagen 4。只能靠猜。
從對(duì)比圖來看,Nano Banana 2在細(xì)節(jié)、配色、文字生成上確實(shí)比第一代強(qiáng)不少。

Nano Banana 2 vs Nano Banana 1

Nano Banana 2 vs Nano Banana 1
把水變成粉色 這種編輯任務(wù),Nano Banana 1基本做不了,新版本能搞定。

另外 Google這次不打算把GEMPIX 2只放在Gemini里,還準(zhǔn)備接入其他實(shí)驗(yàn)項(xiàng)目,比如Whisk。
Gemini UI里已經(jīng)出現(xiàn)發(fā)布預(yù)告卡片了,按照慣例,幾天內(nèi)就會(huì)正式上線。

關(guān)于模型細(xì)節(jié)上的泄露,有2點(diǎn)
- 指令遵循能力提升3倍,一致性也大幅增強(qiáng)。
- 分辨率和比例終于跟上了。代碼里顯示,支持的長寬比終于多了:1:1、2:3、3:2、3:4、4:3、9:16、16:9、21:9。輸出分辨率有1K、2K、4K三檔。

Nano Banana 1 vs Nano Banana 2
本文轉(zhuǎn)載自??探索AGI??,作者:獼猴桃

















