谷歌推最強(qiáng)圖像模型登頂雙榜單

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-08-28 13:57:29 大江網(wǎng)

谷歌推最強(qiáng)圖像模型登頂雙榜單！谷歌在圖像生成和編輯領(lǐng)域推出了最新的模型Gemini 2.5 Flash Image，該模型迅速登頂多個(gè)主流圖像排行榜，成為新的性能冠軍。實(shí)測結(jié)果顯示，模型在角色一致性、提示詞跟隨、物理邏輯的真實(shí)性和畫面審美方面表現(xiàn)出色。然而，對于中國用戶來說，該模型不支持中文輸入，即使使用英文提示，涉及中文內(nèi)容時(shí)效果也會(huì)顯著下降。此外，模型偶爾會(huì)出現(xiàn)多肢體等結(jié)構(gòu)錯(cuò)誤。

盡管存在一些限制，Gemini 2.5 Flash Image仍被認(rèn)為是當(dāng)前市場上最強(qiáng)的圖像編輯和生成模型之一。谷歌官方演示顯示，該模型已具備替代部分人工修圖的能力，可幫助設(shè)計(jì)師一鍵完成圖像修改與創(chuàng)意生成，適用于電商產(chǎn)品圖的制作。單張圖像生成成本不到3毛錢，極具性價(jià)比，有望大幅推進(jìn)AI圖像生成的商業(yè)化進(jìn)程。

在正式發(fā)布之前，市場已經(jīng)有一些風(fēng)聲。上周一款名為“nano-banana”的模型出現(xiàn)在大模型競技場中，接受用戶的匿名體驗(yàn)和打分，投票數(shù)超過250萬。如今謎底揭曉，“nano-banana”正是Gemini 2.5 Flash Image。在LMArena的文生圖與圖像編輯兩個(gè)場景中，谷歌的圖像模型均拿下全球第一，在圖像編輯榜單上表現(xiàn)尤為出色，獲得1362的高分，領(lǐng)先第二名flux-1-knotext-max 171分。

知名AI基準(zhǔn)測試機(jī)構(gòu)Artificial Analysis也獲得了早期訪問權(quán)限，并在過去一周以“rex”的化名進(jìn)行了測試。目前谷歌的模型在圖像編輯方面排名第一，超過了OpenAI的GPT-4o和國內(nèi)阿里的Qwen-Image-Edit，在文生圖方面則略遜于字節(jié)Seedream 3.0和GPT-4o，排名第三。

Artificial Analysis還做了一個(gè)對比測試，讓谷歌、阿里通義和OpenAI三家的模型生成新的照片：在自行車后座上加一名乘客，并將地點(diǎn)更改為內(nèi)蒙古的草原。從輸出結(jié)果看，千問的圖像模型未能準(zhǔn)確進(jìn)行指令跟隨，在畫面真實(shí)度上，谷歌的模型表現(xiàn)比GPT-4o更為突出。

12 全文共 2 頁下一頁

關(guān)閉

谷歌推最強(qiáng)圖像模型 登頂雙榜單

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

谷歌推最強(qiáng)圖像模型登頂雙榜單