专栏名称: 机器之能

探索全球人工智能应用场景及商业化

目录

相关文章推荐

SEO实战营 · AI颠覆SEO：DeepSeek三个月流量暴 ... · 昨天

SEO实战营 · AI颠覆SEO：DeepSeek三个月流量暴 ... · 昨天

机器之心 · DeepSeek冲击下，奥特曼刚刚给出对AG ... · 昨天

爱可可-爱生活 · 通俗版解读查看图片-20250210072144 · 昨天

黄建同学 · 想自己微调模型的可以要试试unsloth有对 ... · 昨天

硅星GenAI · DeepSeek-R1深度思考火出圈; ... · 4 天前

硅星GenAI · DeepSeek-R1深度思考火出圈; ... · 4 天前

51好读 › 专栏 › 机器之能

最全测评！Vidu全球首个新功能，搞定「美女变野兽」难题

机器之能 · 公众号 · AI · 2024-09-12 19:07

正文

机器之能报道

编辑：杨文

AI「表演」猪八戒送外卖、黑旋风啃鸡腿。

AI 视频圈上演「神仙打架」，全球网友开启花式整活。

然而，摆在创作者面前的第一道槛儿，就是永远不知道下一秒会生成个啥。

例如，上一秒还是美女，下一秒就蹿出个怪物史莱克：

明明是个丑萌的布偶猴子，接着就蹦出个小浣熊：

还有更离谱的，一秒变性：

这类邪门视频层出不穷，究其原因，还是 AI 难以保持主体一致性。

不过就在昨天，生数科技的视频模型 Vidu 上线了新功能 —— 主体参照，仅需一张图片即可实现主体可控。

比如，上传一张猪八戒的照片，通过提示词任意切换场景，而猪八戒样貌不变。

提示词：猪八戒在街上玩滑板

提示词：猪八戒在河里游泳。

提示词：猪八戒骑摩托送外卖

更重要的是，它免费开放，注册邮箱即可使用。

体验地址：www.vidu.studio

-1-

实测：一张图，场景随意换

所谓「主体参照」，就是用户上传任意主体的一张图片，Vidu 就能锁定该主体形象，通过提示词任意切换场景，输出主体一致的视频。

啥叫任意主体？

甭管是人物、动物、商品，还是动漫角色、虚构主体，它都能确保其视频生成的一致性。

Vidu 也是全球首个支持该能力的视频大模型。

接下来，我们就奉上一手实测。

Round 1：人物主体

我们上传一张「黑旋风」李逵的照片。

提示词：一个男子正在海边的沙滩上啃鸡腿。

李逵的硬汉形象在海边沙滩场景中得到了完美保留，动作幅度大且流畅自然。

而且，脸部没有崩坏，也没有出现「六指狂魔」。

我们又上传了一张孙悟空的剧照。

提示词：孙悟空骑着摩托，行驶在路上。

孙猴子立马化身机车手，上演了一出「速度与激情」。

Vidu 对于细节的处理也挺到位。

比如骑摩托时，风将袖子吹鼓起来，毛发微微向后晃动。

再来祸祸一下「硅谷钢铁侠」马斯克。

提示词：一个男子坐在咖啡馆里喝咖啡。

西装革履的马斯克坐在咖啡馆里，缓缓转过头来，端起了咖啡杯，整个过程一气呵成，相当逼真。

值得注意的是，为了防止生成违规视频，Vidu 还在提示词中进行了限制，不能输入暴力、色情以及政治人物的名字等。

Round 2: 动物主体

Vidu 还可以实现动物在不同环境下、大幅运动状态中细节特征保持一致。

这意味着，我们只需上传一张萌宠照片，就能随心所欲生成一段 Vlog。

提示词：一只北极熊在水里游泳。

满是冰川的北极，一只凶猛的北极熊在水里扑腾，周围溅起了圈圈水花。

镜头中北极熊运动幅度很大，画面却很稳定清晰。

提示词：一只兔子在啃胡萝卜。

虽然我们投喂给 Vidu 的是一张兔子的侧面照，但它仍能生成兔子抱着胡萝卜啃的正面大特写。

提示词：一只企鹅在舞台上跳舞

从这则 8 秒视频可以看出，Vidu 基本能遵循提示词的要求，生成的场景就是一个灯光闪烁的舞台。

毛茸茸的企鹅跳着笨拙的舞蹈，还有表情变化。

Round 3: 虚构角色

Vidu 不仅能搞定写实风格的主体，针对虚构的主体，它也可以保持其高度一致。

一只蜗牛在海里冲浪，溅起浪花。

‍ 这只蜗牛扑闪着眼睛，在海浪里疾驰。

提示词：猫咪坐在电脑前打字。

Round 4 : 动漫主体

动漫风格可以说是 Vidu 的强项，在之前的 7 大 AI 视频神器测评中，Vidu 就凭借着该强大功能备受好评。

而此次「主体参照」功能中，动漫角色仍是拿手好戏。

提示词：蜡笔小新踢球。

提示词：柯南在路上奔跑。

生成的视频中，无论是装扮还是面孔，都是那个熟悉的柯南。而且，整个镜头的画风均保持动漫风格。

不过，它也有些 bug。例如，胳膊摆动时会有些虚化，随着镜头拉远，柯南竟然腾空飞起来了。

Vidu 最让人惊喜的，还得是对于 3D 动画人物的处理。

提示词：男孩站在厨房切菜。

提示词：女孩在花园里跳舞。

Round 5：商品主体

众所周知，广告片的一大关键就是保证多个镜头、不同场景下品牌物形象的一致性。

Vidu 的「主体参照」功能就派上用场。

例如，我们上传一张可口可乐的商品图，并输入提示词：罐子垂直落在水里，溅起水花，Vidu 随即完成产品的动态表现。

上效果：

请到「今天看啥」查看全文

推荐文章

SEO实战营 · AI颠覆SEO：DeepSeek三个月流量暴增30倍，传统优化师集体失业？

昨天

SEO实战营 · AI颠覆SEO：DeepSeek三个月流量暴增30倍，传统优化师集体失业？

昨天

机器之心 · DeepSeek冲击下，奥特曼刚刚给出对AGI的「三个观察」，包括成本速降

昨天

爱可可-爱生活 · 通俗版解读查看图片-20250210072144

昨天

黄建同学 · 想自己微调模型的可以要试试unsloth有对新手非常友好的免费N-20250210074628

昨天

硅星GenAI · DeepSeek-R1深度思考火出圈; OpenAI o3-mini紧急上线｜春节周AI热榜

4 天前

硅星GenAI · DeepSeek-R1深度思考火出圈; OpenAI o3-mini紧急上线｜春节周AI热榜

4 天前

虚拟现实 · VR软件销售额4年后或达140亿美元

8 年前

北京发布 · 这一生你都将享有哪些权利？一条短片告诉你

7 年前

THLDL领导力 · 为什么喝酒的男人值得尊重？

7 年前

微设计 · 豪宅楼盘景观考察 | 南京站

7 年前

券商中国 · 恒大认亏化解万科股权僵局，深铁如愿成第一大股东，投桃报李支持恒大…

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!