2月27日报道,刚刚,谷歌正式发布其最强图片生成和编辑模型Nano Banana 2(Gemini 3.1 Flash Image),该模型已在谷歌Gemini应用、搜索、AI Studio等谷歌全线产品中上线。

▲谷歌官宣Nano Banana 2发布
Nano Banana 2兼具Pro级功能与Flash级速度,在世界知识、图像质量、推理能力和主体一致性等方面实现了全面升级,在基准测试中大幅超越了GPT-Image 1.5、Seedream 5.0 Lite、Grok Imagine Image Pro等业界领先模型,配合思考模式、文本和图像搜索工具则全面超越Nano Banana Pro。

▲Nano Banana 2基准测试成绩
智东西第一时间对Nano Banana 2进行了体验,发现Nano Banana 2生成图片细节逼真度增强,指令精准执行上表现超出预期,文字渲染能力和中国传统文化储备提升,且在处理复杂场景方面明显提升。
比如我们让Nano Banana 2和Nano Banana Pro基于围绕“60岁亚洲渔夫”的一段相同的提示词生成图片,前者生成效果明显更逼真、细节更丰富,指令遵循准确度更高。

▲Nano Banana 2生成

▲Nano Banana Pro生成
提示词:一位年约60岁的亚洲渔夫的超高清面部特写,海浪作为背景虚化。他脸上布满饱经风霜的皱纹和晒斑,皮肤纹理极其细腻,能看到细小的毛孔和银色的胡茬。阳光从侧面45度打来,照亮他半张脸,眼睛微眯,眼神中透露出坚毅与平静,眼球表面映出远处海平面的反光。画面锐度极高,皮肤质感真实到仿佛能触摸到。
不过Nano Banana 2仍被经典的“时钟+满杯红酒”问题难倒,在同时面临多物体+物理逻辑+光影难题等多重问题时生成仍不准确(后文第一部分详解)。同时,一些图片仍有“AI感”,无法做到完全以假乱真。不过话说回来,瑕不掩瑜,Nano Banana 2相比Nano Banana Pro跨代升级明显。
虽然效果更强、速度更快,但Nano Banana 2的价格不增反降。在谷歌AI Studio平台,Nano Banana 2相比Nano Banana Pro的输入图片的单价从2美元降至0.5美元,输出图片的单价也从0.134美元减半至0.067美元。
