专栏名称: TechWeb
TechWeb专注于互联网消费领域,每日专业提供互联网产品、智能设备及互联网服务等方面的最新资讯。
目录
相关文章推荐
爱范儿  ·  这个广告牌,能看懂的都不是一般人 | ... ·  4 天前  
36氪  ·  这一届年轻人,流行「回家」喝酒 ·  5 天前  
新浪科技  ·  【#中国OLED市场份额迅速增长# ... ·  6 天前  
51好读  ›  专栏  ›  TechWeb

AI生视频:智谱“清影” VS 生数科技“Vidu”,谁胜出?

TechWeb  · 公众号  · 科技媒体  · 2024-08-19 18:05

正文

TechWeb 文/ 果青
8月19日消息,自OpenAI放出文生视频模型Sora后,国内AI生视频的产品研发脚步也加快了。上一期,我们测试了国内短视频领域的两家头部企业快手和抖音旗下的AI生视频产品“可灵” 和“即梦AI”的效果这一期,我们将测试国内两家AI创业企业推出的AI生视频产品,一个是智谱AI在7月26日推出的“清影”,另一个是生数科技在7月底推出的“Vidu”。
目前,智谱“清影”支持文生视频、图生视频,能生成6s时长的视频。免费使用,但是需要排队,如果想要加速,可以付费5元/天或199元/年。

Vidu同样支持文生视频、图生视频,提供4s和8s两种视频时长选择。目前,用户可以免费生成4秒视频,如果要生成8s视频,则需要付费,9.99美元/月或者95.99美元/月。

测试条件:

因此,这一期,我们选择了免费的默认设置下,清影(6s)和Vidu(4s)图生视频和文生视频生成的效果进行比较

图生视频

从动物、风景、人物图片来测试比较。

第一个

使用一张含有“熊猫”的照片。

输入提示词要求:熊猫头抬起来,看向我,露出笑容

看看清影(6s)和Vidu(4s)的生成结果表现。

视频结果比较:

清影表现不错,熊猫抬头、挥手、微笑动作连贯。不过,熊猫在挥手的时候,手部有较明显失真。不过,有一个惊喜的地方是:原图片中左下角有一个自拍杆连接的手机在对熊猫进行拍摄。在生成视频的时候,清影似乎是试图让手机拍摄的熊猫画面也动起来。

Vidu这个视频就很尴尬了,除了首帧是原图外,之后视频出现的熊猫太突兀了,而且和原熊猫没有关系。

这一局PK,站清影(+1分)

第二个

用一张含有上海东方明珠塔的风景图。

输入提示词要求:东方明珠塔从下往上依次亮起彩灯

看看清影(6s)和Vidu(4s)的生成结果表现。

视频结果比较

清影生成的视频没有显示完整的图片内容,聚焦在局部,这一点受到图生视频最初对竖版图片选择的影响。不过,这也带来东方明珠塔局部更清晰的视频效果,从下往上、依次亮、彩灯这几个元素都有很好展现。清影聚焦局部细节,且背景一致性更稳定,感觉就像东方明珠塔在眼前一点一点亮灯了,真实感更好。

Vidu完整展示了东方明珠塔及亮灯,不过忽略了“从下往上依次”亮灯的需求,背景中云朵变幻非常快速,感觉像是视频被加了倍速。

这局PK站清影(+2分)

第三个

用一张含有人物的图。

输入提示词要求:孩子翻动手中的书,并露出微笑
看看清影(6s)和Vidu(4s)的生成结果表现。

视频结果比较:

清影生成视频中,书、人物手、挥动胳膊都有明显失真。

Vidu生成视频中,小孩举起书翻动、仰头等动作,整体更连贯自然。

这局PK站Vidu(+1分)

文生视频

第一个:采用Sora经典视频的提示词,让清影和Vidu各自生成视频。

输入提示词A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

看看清影(6s)和Vidu(4s)的生成结果表现。

视频结果比较:

清影生成的视频,前2s人物走动姿态还略显生硬,后续更自然。背景街道景物、远方及周围人的高度与主人公相比更为协调。

Vidu这个视频中,主人公特别突兀,其身高与周边路过和远方的人相比明显高出,显得格格不入。另外,背景街道景色过于模糊。

这局PK站清影(+3分)

第二个:

输入提示词文本在桂林山水间,一位侠女乘坐竹筏前行,她穿着红色的长裙,手拿黑色的佩剑,注视着远方,阳光洒在水面,波光粼粼,有白云从山顶飘过。

看看清影(6s)和Vidu(4s)的生成结果表现。

视频结果比较:

清影对桂林山水、竹筏、红色长裙、阳光洒在水面,波光粼粼等都有不错的呈现。问题还是出在手拿黑色的佩剑上,有明显失真。

Vidu对竹筏理解有误,侠女乘坐的更像是小船,而且视频画面整体较为模糊。

这局PK,从清晰度上还是站清影(+4分)。

最后,总结一下:

这5局,Vidu生成的4s 视频大小在200K左右,清影生成的6s视频大小均超过2M。虽然Vidu号称生成的视频“分辨率最高达1080P”,但是就目前生成的视频来看,在清晰度上清影明显要更优。

从上面5五局PK来看,清影4局胜出Vidu。

大家觉得哪个更好呢?欢迎投票。

—【 THE END 】—
往期精彩文章回顾:
丨iPhone 16 Pro/Pro Max四款配色曝光:新增古铜色,取代前代蓝色版本

丨腾讯回应“苹果税”:正与苹果就iOS小游戏收入事宜进行谈判

极氪新车发布会直播全员禁言 网友吐槽新车半年变“旧车