给可灵 1.6 做了一个详细的测试，它就是现在最强的图生视频模型-20241219174038_歸藏的AI工具箱的专栏文章_微信文章

给可灵 1.6 做了一个详细的测试，它就是现在最强的图生视频模型！

写实图片生成视频居然可以完成 Veo 2 的牛排测试 #AI创造营# #ai视频#

风格化更是断档领先，我都怀疑 Veo2 有没有这么强

无论是 3D、动漫还是艺术画都不在话下试完之后又想自己搞片子了。

模型整体升级点：
文本响应度提升：对对运动、时序类动作、运镜提示词的响应明显变强，比如之前都搞不定的风格化图片希区柯克变焦。
物理世界理解和真实感提升：这个其实有一个很好的例子就是前几天Veo的那个切牛肉的例子，个例子有两个递进的难点，首先是刀要切下去，切下去的时候手部动作和肉的反馈，第二个难点是切出去的肉需要拿刀扒拉过去，扒拉过去之后肉的大小和材质不能发生变化。
画面质量的提升：1.6虽然分辨率没有提升，但是整体画面中运动的部分明显增多，如果是文生的话可以看到画面明显变得丰富了很多，比如下面的柿子树。

风格化图片的部分:
非写实内容：这里指的是类似一些偏 3D 的但是现实中没有的场景或者事物运动，比如这个龙在吐息的场景，可以看到龙的毛发被风吹动的时候每一根都在动而且很合理
奇怪的姿势和艺术化表达：比如下面这个例子，这个图片画出来的时候我都无法想象她应该怎么动，而且角色大部分的装饰和其他身体部位是没有露出的，结果出来的时候我都傻了
画面笔触和纹理非常独特的一些风格图片：比如下面这个雪天的小女孩，整体的笔触非常的特别

可灵这次 1.6 进步之大我觉得叫 2.0 也不过分，但是他们依然只把版本号往前提了0.1。
说明他们对于自己能力和模型相当自信，无法想象可灵 2.0 该是什么样的表现。
我现在还记得可灵 1.0 发布的那个下午和我看到演示时激动的场景，短短半年时间他们让这种场景出现了很多次，真的很强。

给可灵 1.6 做了一个详细的测试，它就是现在最强的图生视频模型-20241219174038

正文

2024-12-19 17:40
本条微博链接

请到「今天看啥」查看全文