专栏名称: Dots机构投资者社区

机构投资者组成的社区，深度点评财经事件

Google 用文生图 AI 开始真正重塑行业｜9 个测试案例，带你看懂 Gemini 能力边界

Dots机构投资者社区 · 公众号 · · 2025-03-15 08:15

正文

自从在一支烟花群里和朋友测试起 Google 这个新工具，一上午就没停下来 WOC 的感叹。

Google 总算放出了他们去年承诺的“可连续对话改图”的 Gemini 文生图能力。

照例先给总体评价：

1. Gemini （或者说 Imagen3）是当下最值得全设计行业，甚至全碳基社会使用的文生图 AI
2. 它在自然语言的修改指令理解、材质质感复现、局部细节微调方面，达到了部分生产创作环节完全可用的水准（当然也有些 Case 还差点意思）
3. 这几乎可以算 AI 许愿机、超级嘴炮魔法了，甚至说句“快变天了”不为过 🥲

特别的，如果你是设计行业、内容创作相关的朋友，请务必要刷完本文。（文末附有 Gemini 使用指南）

本文将用 4 项能力测试，5 个应用案例，带你理解 Gemini 的能力边界。

主要测试，挑战 AI 能力边界

主测试 1：简单形体的材质变换、连续微调形态细节，并大幅度改变视角

先用一些变态的 Case 开始，测试 Gemini 文生图的能力边界。

这是我测试的第一个 Case，因为一上来也不知道它到底边界在哪，先从简单的形体开始，让它画个正方体。⬇️

整个 Case 看下来非常连贯，指令理解到位，材质变换没问题，基础形态从未变形，甚至还能大幅更改相机视角，添加模特也完全没问题。

💬

PS：我说这个“简单” Case 已经秒了其他的所有文生图 AI，不过分吧。

主测试 2：手绘稿转设计渲染图，顺便拍出产品宣传图

继续测，在测试 1 的基础上，我们上到设计生产级别，用一张手绘图打底，让 Gemini 完成全流程的产品造型概念设计推敲。

这个应该是很多设计公司在乎的 Case：

这张图已经是最好的证明，感觉也不需要多说什么解读的话语了。

💬

如果你看到这里，也发出了“WOC”的感慨—— 非常感谢你点赞、转发、在看、评论本文。

虽然在实测中，在产品穿到人身上这不算稳定，总会带着一些人像与产品的变形。

就这手稿转 3D 产品渲染图，还能再微调局部设计的水平，已经完全超出本科设计专业的毕业生水平（对，因为我自己就是工业设计毕业的）

还能快速在概念设计阶段，生成模特使用场景图，进一步验证设计方案的效果。

对了，如果你还不服气，我再补一句：每张图的生成时间不超过 10s…… 这还不算“炸裂”，那还有什么算呢？

主测试 3：一次性生成多套不同风格的设计

我发誓，这是本文最后一个工业设计的 Case 了，后面还有游戏设计、自媒体应用等更多元的 Case，一个比一个精彩。⬇️

💬

我其实一贯 AI 评测挺克制的，但在测试 Gemini 文生图的 4 小时内，基本每分钟都在发出粗鄙的感慨……

这个 Case 就是进一步模拟工业设计的造型推敲环节。

原本我们会需要大量的时间在犀牛（一套工业设计建模软件）中花数天时间建模，再花数天在 keyshot（一套工业设计渲染软件）中调整材质、打光出图。

而且一旦建模完成后，想要再对模型进行造型调整，简直是对设计师无尽的折磨。

现在，Gemini 在 20s 内就给你一次性生成 12 张 🥲 ……

主测试 4：抠图、换背景、打光影

搞定了产品设计，正常商业流程中，我们还要解决一下最终宣发的物料问题。

这时候离不开抠图、换背景、打光影拍照的工作流程。

先抠个图，无中生有地换背景：

没问题，换的非常好。

再看看商业级别的背景合成与打光：

再引用一个 WaytoAGI 上看到的例子：