自从在一支烟花群里和朋友测试起 Google 这个新工具,一上午就没停下来 WOC 的感叹。
Google 总算放出了他们去年承诺的“可连续对话改图”的 Gemini 文生图能力。
照例先给总体评价:
-
1.
Gemini (或者说 Imagen3)是当下
最值得全设计行业,甚至全碳基社会使用的文生图 AI
-
2.
它在自然语言的修改指令理解、材质质感复现、局部细节微调方面,达到了
部分生产创作环节完全可用的水准
(当然也有些 Case 还差点意思)
-
3.
这几乎可以算 AI 许愿机、超级嘴炮魔法了,
甚至说句“快变天了”不为过
🥲
特别的,如果你是设计行业、内容创作相关的朋友,请务必要刷完本文。
(文末附有 Gemini 使用指南)
本文将
用 4 项能力测试,5 个应用案例,带你理解 Gemini 的能力边界。
主要测试,挑战 AI 能力边界
主测试 1:简单形体的材质变换、连续微调形态细节,并大幅度改变视角
先用一些变态的 Case 开始,测试 Gemini 文生图的能力边界。
这是我测试的第一个 Case,因为一上来也不知道它到底边界在哪,先从简单的形体开始,让它画个正方体。⬇️
整个 Case 看下来非常连贯,指令理解到位,材质变换没问题,基础形态从未变形,甚至还能大幅更改相机视角,添加模特也完全没问题。
💬
PS:我说这个“简单” Case 已经秒了其他的所有文生图 AI,不过分吧。
主测试 2:手绘稿转设计渲染图,顺便拍出产品宣传图
继续测,在测试 1 的基础上,我们上到设计生产级别,用一张手绘图打底,让 Gemini 完成全流程的产品造型概念设计推敲。
这个应该是很多设计公司在乎的 Case:
这张图已经是最好的证明,感觉也不需要多说什么解读的话语了。
💬
如果你看到这里,也发出了“WOC”的感慨——
非常感谢你点赞、转发、在看、评论本文。
虽然在实测中,
在产品穿到人身上这不算稳定,总会带着一些人像与产品的变形。
就这手稿转 3D 产品渲染图,还能再微调局部设计的水平,已经
完全超出本科设计专业的毕业生水平
(对,因为我自己就是工业设计毕业的)
还能快速在概念设计阶段,生成模特使用场景图,进一步验证设计方案的效果。
对了, 如果你还不服气,我再补一句:
每张图的生成时间不超过 10s……
这还不算“炸裂”,那还有什么算呢?
主测试 3:一次性生成多套不同风格的设计
我发誓,这是本文最后一个工业设计的 Case 了,后面还有游戏设计、自媒体应用等更多元的 Case,一个比一个精彩。⬇️
💬
我其实一贯 AI 评测挺克制的,但在测试 Gemini 文生图的 4 小时内,基本每分钟都在发出粗鄙的感慨……
这个 Case 就是进一步模拟工业设计的造型推敲环节。
原本我们会需要大量的时间在犀牛(一套工业设计建模软件)中花数天时间建模,再花数天在 keyshot(一套工业设计渲染软件)中调整材质、打光出图。
而且一旦建模完成后,想要再对模型进行造型调整,简直是对设计师无尽的折磨。
现在,Gemini 在 20s 内就给你一次性生成 12 张 🥲 ……
主测试 4:抠图、换背景、打光影
搞定了产品设计,正常商业流程中,我们还要解决一下最终宣发的物料问题。
这时候离不开抠图、换背景、打光影拍照的工作流程。
先抠个图,无中生有地换背景:
没问题,换的非常好。
再看看商业级别的背景合成与打光:
再引用一个 WaytoAGI 上看到的例子: