给可灵 1.6 做了一个详细的测试,它就是现在最强的图生视频模型!
写实图片生成视频居然可以完成 Veo 2 的牛排测试 #AI创造营# #ai视频#
风格化更是断档领先,我都怀疑 Veo2 有没有这么强
无论是 3D、动漫还是艺术画都不在话下试完之后又想自己搞片子了。
模型整体升级点:
文本响应度提升:对对运动、时序类动作、运镜提示词的响应明显变强,比如之前都搞不定的风格化图片希区柯克变焦。
物理世界理解和真实感提升:这个其实有一个很好的例子就是前几天Veo的那个切牛肉的例子,个例子有两个递进的难点,首先是刀要切下去,切下去的时候手部动作和肉的反馈,第二个难点是切出去的肉需要拿刀扒拉过去,扒拉过去之后肉的大小和材质不能发生变化。
画面质量的提升:1.6虽然分辨率没有提升,但是整体画面中运动的部分明显增多,如果是文生的话可以看到画面明显变得丰富了很多,比如下面的柿子树。
风格化图片的部分:
非写实内容:这里指的是类似一些偏 3D 的但是现实中没有的场景或者事物运动,比如这个龙在吐息的场景,可以看到龙的毛发被风吹动的时候每一根都在动而且很合理
奇怪的姿势和艺术化表达:比如下面这个例子,这个图片画出来的时候我都无法想象她应该怎么动,而且角色大部分的装饰和其他身体部位是没有露出的,结果出来的时候我都傻了
画面笔触和纹理非常独特的一些风格图片:比如下面这个雪天的小女孩,整体的笔触非常的特别
可灵这次 1.6 进步之大我觉得叫 2.0 也不过分,但是他们依然只把版本号往前提了0.1。
说明他们对于自己能力和模型相当自信,无法想象可灵 2.0 该是什么样的表现。
我现在还记得可灵 1.0 发布的那个下午和我看到演示时激动的场景,短短半年时间他们让这种场景出现了很多次,真的很强。
写实图片生成视频居然可以完成 Veo 2 的牛排测试 #AI创造营# #ai视频#
风格化更是断档领先,我都怀疑 Veo2 有没有这么强
无论是 3D、动漫还是艺术画都不在话下试完之后又想自己搞片子了。
模型整体升级点:
文本响应度提升:对对运动、时序类动作、运镜提示词的响应明显变强,比如之前都搞不定的风格化图片希区柯克变焦。
物理世界理解和真实感提升:这个其实有一个很好的例子就是前几天Veo的那个切牛肉的例子,个例子有两个递进的难点,首先是刀要切下去,切下去的时候手部动作和肉的反馈,第二个难点是切出去的肉需要拿刀扒拉过去,扒拉过去之后肉的大小和材质不能发生变化。
画面质量的提升:1.6虽然分辨率没有提升,但是整体画面中运动的部分明显增多,如果是文生的话可以看到画面明显变得丰富了很多,比如下面的柿子树。
风格化图片的部分:
非写实内容:这里指的是类似一些偏 3D 的但是现实中没有的场景或者事物运动,比如这个龙在吐息的场景,可以看到龙的毛发被风吹动的时候每一根都在动而且很合理
奇怪的姿势和艺术化表达:比如下面这个例子,这个图片画出来的时候我都无法想象她应该怎么动,而且角色大部分的装饰和其他身体部位是没有露出的,结果出来的时候我都傻了
画面笔触和纹理非常独特的一些风格图片:比如下面这个雪天的小女孩,整体的笔触非常的特别
可灵这次 1.6 进步之大我觉得叫 2.0 也不过分,但是他们依然只把版本号往前提了0.1。
说明他们对于自己能力和模型相当自信,无法想象可灵 2.0 该是什么样的表现。
我现在还记得可灵 1.0 发布的那个下午和我看到演示时激动的场景,短短半年时间他们让这种场景出现了很多次,真的很强。