AI 视频圈上演「神仙打架」,全球网友开启花式整活。
然而,摆在创作者面前的第一道槛儿,就是永远不知道下一秒会生成个啥。
例如,上一秒还是美女,下一秒就蹿出个怪物史莱克:
明明是个丑萌的布偶猴子,接着就蹦出个小浣熊:
还有更离谱的,一秒变性:
这类邪门视频层出不穷,究其原因,还是 AI 难以保持主体一致性。
不过就在昨天,生数科技的视频模型 Vidu 上线了新功能 —— 主体参照,仅需一张图片即可实现主体可控。
比如,上传一张猪八戒的照片,通过提示词任意切换场景,而猪八戒样貌不变。
提示词:猪八戒在街上玩滑板
提示词:猪八戒在河里游泳。
更重要的是,它免费开放,注册邮箱即可使用。
体验地址:www.vidu.studio
-1-
实测:一张图,场景随意换
所谓「主体参照」,就是用户上传任意主体的一张图片,Vidu 就能锁定该主体形象,通过提示词任意切换场景,输出主体一致的视频。
啥叫任意主体?
甭管是
人物、动物、商品,还是动漫角色、虚构主体,它都能确保其视频生成的一致性。
Vidu 也是全球首个支持该能力的视频大模型。
接下来,我们就奉上一手实测。
Round 1:人物主体
我们上传一张「黑旋风」李逵的照片。
李逵的硬汉形象在海边沙滩场景中得到了完美保留,动作幅度大且流畅自然。
比如骑摩托时,风将袖子吹鼓起来,毛发微微向后晃动。
西装革履的马斯克坐在咖啡馆里,缓缓转过头来,端起了咖啡杯,整个过程一气呵成,相当逼真。
值得注意的是,为了防止生成违规视频,Vidu 还在提示词中进行了限制,不能输入暴力、色情以及政治人物的名字等。
Vidu 还可以实现动物在不同环境下、大幅运动状态中细节特征保持一致。
这意味着,我们只需上传一张萌宠照片,就能随心所欲生成一段 Vlog。
满是冰川的北极,一只凶猛的北极熊在水里扑腾,周围溅起了圈圈水花。
镜头中北极熊运动幅度很大,画面却很稳定清晰。
虽然我们投喂给 Vidu 的是一张兔子的侧面照,但它仍能生成兔子抱着胡萝卜啃的正面大特写。
从这则 8 秒视频可以看出,Vidu 基本能遵循提示词的要求,生成的场景就是一个灯光闪烁的舞台。
毛茸茸的企鹅跳着笨拙的舞蹈,还有表情变化。
Round 3: 虚构角色
Vidu 不仅能搞定写实风格的主体,针对虚构的主体,它也可以保持其高度一致。
这只蜗牛扑闪着眼睛,在海浪里疾驰。
Round 4 : 动漫主体
动漫风格可以说是 Vidu 的强项,在之前的 7 大 AI 视频神器测评中,Vidu 就凭借着该强大功能备受好评。
而此次「主体参照」功能中,动漫角色仍是拿手好戏。
生成的视频中,无论是装扮还是面孔,都是那个熟悉的柯南。
而且,整个镜头的画风均保持动漫风格。
不过,它也有些 bug。
例如,胳膊摆动时会有些虚化,随着镜头拉远,柯南竟然腾空飞起来了。
Vidu 最让人惊喜的,还得是对于 3D 动画人物的处理。
Round 5:商品主体
众所周知,广告片的一大关键就是保证多个镜头、不同场景下品牌物形象的一致性。
Vidu 的「主体参照」功能就派上用场。
例如,我们上传一张可口可乐的商品图,
并输入提示词:
罐子垂直落在水里,溅起水花,Vidu 随即完成产品的动态表现。
上效果: