更重要的是,它終于把文字這件事“搞對(duì)了”。很長(zhǎng)一段時(shí)間里,AI生圖最尷尬的不是畫(huà)得不好,而是畫(huà)上的字寫(xiě)得亂七八糟:中文亂碼、英文拼寫(xiě)錯(cuò)誤、排版毫無(wú)邏輯,導(dǎo)致生成物幾乎無(wú)法直接用于商業(yè)設(shè)計(jì)。Nano Banana 2把文本渲染當(dāng)作重點(diǎn)升級(jí)方向,官方和多方實(shí)測(cè)都提到,中英日等多語(yǔ)言混排基本穩(wěn)定,亂碼明顯減少,已經(jīng)可以可靠地生成漫畫(huà)對(duì)白、海報(bào)文案和UI標(biāo)注。
在一次測(cè)試中,當(dāng)提示詞要求生成一只戴著京劇頭飾的大熊貓,在茶館里用毛筆寫(xiě)“生成式AI”時(shí),Nano Banana 2不僅準(zhǔn)確還原了熊貓毛發(fā)、頭飾珠翠的質(zhì)感,還讓毛筆字整體流暢,只在“式”字的細(xì)節(jié)上略有不規(guī)范——這在過(guò)去已經(jīng)是“可用級(jí)”的表現(xiàn)。
另一個(gè)被頻繁提起的進(jìn)步,是“時(shí)鐘難題”。早期AI生圖經(jīng)常畫(huà)不出可讀的時(shí)鐘,指針位置、刻度邏輯一團(tuán)糟。Nano Banana 2在單獨(dú)生成時(shí)鐘時(shí)已經(jīng)能做到指針與時(shí)間對(duì)應(yīng)準(zhǔn)確,但當(dāng)模型同時(shí)面對(duì)“時(shí)鐘+滿(mǎn)杯紅酒”這樣的多物體、多物理約束場(chǎng)景時(shí),仍然會(huì)把時(shí)針和分針搞反——這說(shuō)明AI對(duì)復(fù)雜物理世界的理解仍有“盲區(qū)”,但至少已經(jīng)從“完全不會(huì)”走到了“偶爾翻車(chē)”。
對(duì)企業(yè)來(lái)說(shuō),比“畫(huà)得多好”更重要的是“畫(huà)得多快、多便宜”。在谷歌AI Studio的定價(jià)里,Nano Banana 2的計(jì)價(jià)單位是像素:1000像素圖像每張約0.0672美元,2000像素約0.101美元,4K圖像約0.151美元。對(duì)比Nano Banana Pro(2K圖像0.134美元/張,4K圖像0.24美元/張),Nano Banana 2在4K分辨率下價(jià)格直降約37%,而推理速度接近翻倍。
換算成更直觀(guān)的說(shuō)法:用接近一半的錢(qián),拿到接近甚至更好的畫(huà)質(zhì),而且生成時(shí)間從“去泡杯咖啡”縮短到“喝口水就好”。有中國(guó)網(wǎng)友在測(cè)試后感慨:“Nano Banana 2出來(lái)了,產(chǎn)圖真的是又快又好,不到一分鐘就能產(chǎn)4K圖,比Nano Banana Pro效果好、快、便宜?!?/p>
谷歌今日推出了全新圖像生成與編輯模型Nano Banana Pro (Gemini 3 Pro Image)
2025-11-21 08:10:45谷歌發(fā)布新一代圖像生成模型