Gemini Flash Image Logo

深度测评:“Nano Banana” 正式登场 —— Gemini 2.5 Flash Image Preview 体验报告

on 56 years ago

深度测评:“Nano Banana” 正式登场 —— Gemini 2.5 Flash Image Preview 体验报告

一、官方能力亮点

从 Google 官方博客我们获悉:

  • Gemini 2.5 Flash Image(代号 nano-banana)是全新一代图像生成与编辑模型,支持多图融合、角色一致性、自然语言本地化编辑、以及内置世界知识理解能力。
  • 模型现已通过 Gemini APIGoogle AI StudioVertex AI 生态对开发者与企业开放。定价约为每百万输出 token 收费 30 美元,每张图像约 1290 输出 token,即约 0.039 美元/张

这些功能使其不仅提升图像质量,也在控制与细节方面实现显著优化。


二、媒体测评观点汇总

  • Axios
    报道指出,“Nano Banana” 不仅能生成图像,还可以进行高级、多步骤的图像编辑(如合并两张不同图片),在 AI 图像处理领域具备领先优势。

  • 经济时报(ET)
    强调 Gemini 2.5 Flash 增强了用户对图像生成与编辑的控制能力,在聊天机器人界面中带来更丰富的视觉交互体验。

  • Lifewire
    指出该模型已整合进 Adobe Firefly 和 Adobe Express,用户可在 Firefly 中免费生成 20 张图像进行试用,9 月起在 Express 中全面开放。

  • TechCrunch
    评价 Gemini 2.5 Flash 是 Google 在 AI 图像模型上的关键升级,突出了它在保持被编辑对象特征一致性方面领先业界。它在 LMArena 测评中表现极佳。

  • Business Insider
    测试发现,模型在保留图像细节方面相较竞争对手更胜一筹。例如在给 T 恤加红色并添加眼镜的测试中,只有它保留了 T 恤上的条纹图案,细节锐利。

  • 9to5Google
    指出“nano banana” 是迄今为止 LMArena 排名最高的图像编辑模型,并强调其核心优势在于“保持角色相貌一致性”,无论是人还是宠物。

  • Medium(Data Science in Your Pocket)
    作者认为 Gemini 2.5 的强项是简洁、有效地实现“你说我就画”的自然语言控制,而不是痴迷于基金模型或架构炫技。


三、社区反馈:热情与质疑并存

Reddit 社区的反馈如下:

“Gemini 2.5 Flash-image (aka Nano Banana) is the best image edit model in the world. Whopping 171 POINTS JUMP. GG Google.”

但也有用户提到:

“Gemini hallucinating is still a big problem for 2.5 Flash” ——意味着某些情况下仍有“幻觉”错误出现。

还有关于费用计入出现异常、接口表现差异的问题,也在社区中被讨论。


四、综合对比一览表

项目优点潜在问题 / 待改进
角色一致性可跨场景保持人物/物体面貌不变某些情境下可能遗漏细节或出现偏差
细节保留能保留图像细节如纹理、图案合并人像时可能出现面部失真
多图融合支持多图融合,场景自然非拼接极少报导认为边缘融合仍可提升
编辑控制力强本地化 prompt 编辑强、生成精准少数反馈仍出现 hallucination
试用与整合集成 Adobe 工具、支持试用机会免费额度有限,高频使用成本累积
社区评价Reddit 正面评价热烈也存在社区反馈模型可进一步改进之处

五、结语:是 Photoshop 后时代的开端吗?

综合官方介绍、媒体测评与用户反馈,不难看出:

  • 优势不少:优秀的角色一致性、细节控制、本地化编辑与多图融合能力,让 “Nano Banana” 在实际应用场景中具备强竞争力。
  • 生态广泛:从 Google 自家 AI Studio 到 Gemini 应用、再到 Adobe 工具的整合,覆盖创作者工作流关键环节。
  • 挑战依然存在:模型在非常复杂或极端场景下仍偶有失真,社区也指出 hallucination 仍需关注,同时后续定价与开放策略对创作者而言将影响持续使用。

总体而言,“Nano Banana” 的出现是 AI 图像生成/编辑领域的重大进展。而说它会让 Photoshop “过时”,目前或许言之尚早,但它无疑正推动图像创作进入一个更智能、更灵活的阶段。

体验 Gemini Flash Image 强大功能

使用 Gemini Flash Image 先进的 AI 技术,通过简单的文字描述即可生成专业级高质量图像,为您的创作提供无限可能。