专栏名称: 歸藏的AI工具箱
产品设计师🎨 AI画图工具操作员🔧 AI课程撰写与信息收集整理📰 致力于发掘借助AI工具改善设计与产品开发流程的各种可能性🤔
目录
相关文章推荐
一涵笔记  ·  DeepSeek爆火后,中国和美国股票价值要 ... ·  昨天  
一涵笔记  ·  DeepSeek爆火后,中国和美国股票价值要 ... ·  昨天  
科技头版  ·  深圳比亚迪,让整个汽车行业躁动不安 ·  昨天  
科技头版  ·  深圳比亚迪,让整个汽车行业躁动不安 ·  昨天  
阿枫科技  ·  我建了个免费无门槛的DeepSeek交流群 ·  昨天  
阿枫科技  ·  我建了个免费无门槛的DeepSeek交流群 ·  昨天  
51好读  ›  专栏  ›  歸藏的AI工具箱

可灵创造出了真正的梦想机器!完美的 ID 保持视频生成,还有跟 Sora 的对比

歸藏的AI工具箱  · 公众号  · 科技自媒体  · 2024-12-13 07:00

主要观点总结

文章主要围绕Sora和可灵两个AI视频模型进行了对比测试。作者尝试使用Sora后感到失望,转而使用可灵进行测试并分享了其强大功能。可灵在文生视频和图生视频方面的表现都优于Sora,尤其是在ID保持技术上,表现出真实感和极高的相似度。

关键观点总结

关键观点1: Sora的失望体验

作者尝试使用Sora后,遇到图生视频基本不可用、生成失败频繁等问题,觉得它存在各种限制条件,几乎等同于诈骗。

关键观点2: 可灵AI视频模型的优势

作者通过对比测试发现可灵AI视频模型功能强大,可以定制,并且在文生视频和图生视频方面表现优异,特别是在ID保持技术上。

关键观点3: 可灵ID保持技术的特点和优势

可灵的ID保持技术相似度高、真实感强,能够根据场景变化对用户的样貌进行微调,且使用便捷,但需要钻石会员和一定的视频素材投入。

关键观点4: AI内容生成技术的重要性

作者认为AI内容生成技术的效果对内容消费者产生的影响巨大,可能正是可灵投入高成本开发其模型功能的原因。同时,期待可灵在另外的两个一致性上,即风格一致性和场景一致性上能带来更多惊喜。


正文

前几天 Sora 发布之后满心欢喜的去尝试,结果太令人失望了,图生视频基本不可用,同时还有频繁的生成失败和各种限制条件,基本等于诈骗。

很多博主也开始翻出可灵等其他模型去测试,发现不知不觉他们都已经这么强大了,我也顺便去可灵做了一个对比测试, 做测试的时候才发现居然可以定制 AI 视频模型了,这个太强大了,试了一下给我惊艳到了 ,后面有介绍。

先来看看和 Sora 的对比,这次分了两个部分,文生视频和图生视频。



图生视频 这里就别说了,Sora 的完全不可用,感觉成功率连 1% 都不到,大部分都不动,好不容易动了没按提示词动,或者在画面中加入了完全跟图片风格不同的内容非常出戏。

文生视频 这里的话成功率上来了一些,但是画面完全不动的情况也时有发生,而且一旦涉及到一些非现实或者不常见的概念它就摆烂,开始生成 20 年前游戏画面那种劣质 3D 的视频。

然后我开始测试他们这个 AI 视频模型的功能,老实说创建过程确实有点繁琐。

但是, 当我用我自己的模型生成第一个视频的时候,我觉得这些都是值得的 ,这是目前市面上独一份的视频生成 ID 保持技术,可以看藏师傅的梦想生活短片。

当然一些图片方案也可以达到在视频生成后 ID 保持的效果,但是要么有闪烁,要么保持的非常死板,图片什么样视频里就什么样,跟环境不融合,要么是在视频后半部分或者运动幅度大的时候无法保持 ID 的一致性。

但是可灵这个方案根本不存在这些问题,我在给朋友们看了以后他们的表情真的很精彩,有的对 AI 不了解的朋友真的以为我去做这些事情了。

首先是 相似度真的爆表 ,比如我脸上的一些痘痘,还有感人的发际线,以及面部肌肉线条,都还原了,甚至我后脑勺的头发长度都是一样的,当然还有我的眼镜款式。

另外模型也 不会一直死板的还原你现在的状态和样貌 ,当你生成不同的环境的时候他会根据场景对你的样貌生成一些变化,比如下面这个我在沙漠探险很长时间后,可灵就给我的胡子变得很长。

最后就是 真实感 了,因为是模型的原因,你的面部表情和神态动作都会学到,比如一些常见的表情,以及物理效果,这里面最好的部分是我跳伞的画面,真的我自己看到的时候都恍惚了一下。







请到「今天看啥」查看全文