深度测评:“Nano Banana” 正式登场 —— Gemini 2.5 Flash Image Preview 体验报告
深度测评:“Nano Banana” 正式登场 —— Gemini 2.5 Flash Image Preview 体验报告
一、官方能力亮点
从 Google 官方博客我们获悉:
- Gemini 2.5 Flash Image(代号 nano-banana)是全新一代图像生成与编辑模型,支持多图融合、角色一致性、自然语言本地化编辑、以及内置世界知识理解能力。
- 模型现已通过 Gemini API、Google AI Studio 及 Vertex AI 生态对开发者与企业开放。定价约为每百万输出 token 收费 30 美元,每张图像约 1290 输出 token,即约 0.039 美元/张。
这些功能使其不仅提升图像质量,也在控制与细节方面实现显著优化。
二、媒体测评观点汇总
-
Axios
报道指出,“Nano Banana” 不仅能生成图像,还可以进行高级、多步骤的图像编辑(如合并两张不同图片),在 AI 图像处理领域具备领先优势。 -
经济时报(ET)
强调 Gemini 2.5 Flash 增强了用户对图像生成与编辑的控制能力,在聊天机器人界面中带来更丰富的视觉交互体验。 -
Lifewire
指出该模型已整合进 Adobe Firefly 和 Adobe Express,用户可在 Firefly 中免费生成 20 张图像进行试用,9 月起在 Express 中全面开放。 -
TechCrunch
评价 Gemini 2.5 Flash 是 Google 在 AI 图像模型上的关键升级,突出了它在保持被编辑对象特征一致性方面领先业界。它在 LMArena 测评中表现极佳。 -
Business Insider
测试发现,模型在保留图像细节方面相较竞争对手更胜一筹。例如在给 T 恤加红色并添加眼镜的测试中,只有它保留了 T 恤上的条纹图案,细节锐利。 -
9to5Google
指出“nano banana” 是迄今为止 LMArena 排名最高的图像编辑模型,并强调其核心优势在于“保持角色相貌一致性”,无论是人还是宠物。 -
Medium(Data Science in Your Pocket)
作者认为 Gemini 2.5 的强项是简洁、有效地实现“你说我就画”的自然语言控制,而不是痴迷于基金模型或架构炫技。
三、社区反馈:热情与质疑并存
Reddit 社区的反馈如下:
“Gemini 2.5 Flash-image (aka Nano Banana) is the best image edit model in the world. Whopping 171 POINTS JUMP. GG Google.”
但也有用户提到:
“Gemini hallucinating is still a big problem for 2.5 Flash” ——意味着某些情况下仍有“幻觉”错误出现。
还有关于费用计入出现异常、接口表现差异的问题,也在社区中被讨论。
四、综合对比一览表
项目 | 优点 | 潜在问题 / 待改进 |
---|---|---|
角色一致性 | 可跨场景保持人物/物体面貌不变 | 某些情境下可能遗漏细节或出现偏差 |
细节保留 | 能保留图像细节如纹理、图案 | 合并人像时可能出现面部失真 |
多图融合 | 支持多图融合,场景自然非拼接 | 极少报导认为边缘融合仍可提升 |
编辑控制力强 | 本地化 prompt 编辑强、生成精准 | 少数反馈仍出现 hallucination |
试用与整合 | 集成 Adobe 工具、支持试用机会 | 免费额度有限,高频使用成本累积 |
社区评价 | Reddit 正面评价热烈 | 也存在社区反馈模型可进一步改进之处 |
五、结语:是 Photoshop 后时代的开端吗?
综合官方介绍、媒体测评与用户反馈,不难看出:
- 优势不少:优秀的角色一致性、细节控制、本地化编辑与多图融合能力,让 “Nano Banana” 在实际应用场景中具备强竞争力。
- 生态广泛:从 Google 自家 AI Studio 到 Gemini 应用、再到 Adobe 工具的整合,覆盖创作者工作流关键环节。
- 挑战依然存在:模型在非常复杂或极端场景下仍偶有失真,社区也指出 hallucination 仍需关注,同时后续定价与开放策略对创作者而言将影响持续使用。
总体而言,“Nano Banana” 的出现是 AI 图像生成/编辑领域的重大进展。而说它会让 Photoshop “过时”,目前或许言之尚早,但它无疑正推动图像创作进入一个更智能、更灵活的阶段。
体验 Gemini Flash Image 强大功能
使用 Gemini Flash Image 先进的 AI 技术,通过简单的文字描述即可生成专业级高质量图像,为您的创作提供无限可能。