北京時(shí)間2月27日深夜,谷歌在沒有任何預(yù)熱、沒有發(fā)布會(huì)的情況下,將一個(gè)新的生圖模型悄悄塞進(jìn)了Gemini平臺(tái)——Nano Banana 2。上線方式也很低調(diào):一邊在官方博客和文檔里更新說明,一邊在X(原Twitter)上發(fā)布幾張對比圖和基準(zhǔn)測試成績,讓開發(fā)者自己“拆箱”。
最近使用過Gemini圖像生成的用戶可能已經(jīng)注意到一個(gè)細(xì)節(jié):進(jìn)度條旁邊偶爾會(huì)閃過一行“正在加載Nano Banana 2”。這個(gè)名字聽起來有點(diǎn)戲謔的模型,正在把過去一年多積累的Pro級能力,批量下放到Flash級的速度中。
Nano Banana 2的官方代號是Gemini 3.1 Flash Image,底層架構(gòu)從上一代的Gemini 2.5 Flash升級到了3.1。用官方的話說,它的定位是:用Flash的速度,跑出Pro的質(zhì)量。在Gemini產(chǎn)品矩陣?yán)铮鸩饺〈f版Nano Banana,成為默認(rèn)的圖像生成模型,而Nano Banana Pro則退守到對事實(shí)準(zhǔn)確性要求極高的專業(yè)場景。
如果只看分辨率和參數(shù),升級似乎不算夸張:輸出從2K提升到4K,支持從512px到4K的多種分辨率和寬高比,包括4:1、1:4、8:1、1:8這樣的超寬/超畫幅。真正讓開發(fā)者興奮的是,它把過去Pro版本獨(dú)占的能力“拉平”給了Flash用戶:更強(qiáng)的世界知識、更精準(zhǔn)的文本渲染、更可控的多圖一致性,以及原本Pro才有的推理與指令遵循能力。
谷歌給出的示例顯示,Nano Banana 2可以基于“水循環(huán)”這樣的抽象概念,直接生成信息圖級別的平鋪畫面,而不是簡單畫一張“好看的水滴”。模型背后接入了Gemini的實(shí)時(shí)搜索和圖像檢索,能根據(jù)地理位置、天氣數(shù)據(jù)、文化符號來校準(zhǔn)畫面細(xì)節(jié),比如倫敦雨天時(shí),窗外的街景、雨滴在玻璃上的折射,都更符合當(dāng)?shù)氐墓庥昂徒ㄖ卣鳌?/p>
換言之,它不再是“照著風(fēng)格畫畫”,而是先理解世界,再動(dòng)筆。
谷歌今日推出了全新圖像生成與編輯模型Nano Banana Pro (Gemini 3 Pro Image)
2025-11-21 08:10:45谷歌發(fā)布新一代圖像生成模型