专栏名称: AI算法与图像处理
考研逆袭985,非科班跨行AI,目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技,共同分享宝贵的资源资料,这里有机器学习,计算机视觉,Python等技术实战分享,也有考研,转行IT经验交流心得
目录
相关文章推荐
青年文摘  ·  他可不是一夜爆红。 ·  2 天前  
冯唐  ·  一个人最顶级的教养,就是从不拆穿 ·  3 天前  
51好读  ›  专栏  ›  AI算法与图像处理

Sora开放前夕,最好的视频生成模型是哪个?

AI算法与图像处理  · 公众号  ·  · 2024-11-26 20:28

正文


据不可靠消息,OpenAI大概率在年底正式开放视频生成模型Sora,目前已经有些创作者参与Sora的内测:


而且生成的视频质量看起来非常好:


OpenAI在今年2月份正式发布Sora, 距离现在已经有9个多月的时间 ,但是Sora迟迟没有对外开放。这期间,其他大模型公司已经陆续发布对标Sora的视频模型,比如Runway发布的Gen-3,以及快手发布的可灵等等。大家感觉已经对不开放的Sora失去了兴趣, 连Sora的核心作者 Tim Brooks 前段时间都离开OpenAI去谷歌DeepMind了 。所以说,今年底OpenAI很大概率会开放Sora,以重拾大家的信心。

借着Sora可能开放的这个消息, 今天我们想聊聊在Sora开放之前,目前市面上已经发布的视频生成模型最好的是哪个 。其实,这个问题并不太好回答,因为所有的发布者都说自己是最好的,而且还拿出了可量化的指标。但是,我们知道,对于图像生成和视频生成,量化指标不一定和人工评分是正相关的。所以说,评价视频生成模型的好坏,还是要人还评。之前我们介绍过一个人工评测平台 Artificial Analysis's Text-to-Image Ar ena ,当时神秘模型“red_panda"模型在这个榜单上拿了第一: 神秘“红熊猫”模型登顶文生图榜首,是DALL-E 4,还是国产之光? 最后 神秘模型 “red _panda "揭秘是一个创业公司: 最好的文生图模型“小熊猫”揭秘了,竟然来自一个黑马公司! ,而且实测后大家认为效果确实非常能打。

其实这个平台还有其他模型的评测,比如LLM以及视频模型:

这个平台是随机选择两个模型生成的视频,让用户选择更好的那一个,所以其实算是比较客观一些。目前这个平台评测的模型有: Kling 1.0, CogVideoX-5B, Runway Gen 3 Alpha, Pika 1.5, Hailuo Al, Luma Dream Machine, Pyramid Flow, Mochi 1 。目前的排行榜如下所示:

这里排行第一是 MiniMax的 Hailuo AI Hailuo AI虽然比Gen-3和Kling推出的要晚,但其实效果很能打,这里人工评测也是第一。下面是两个从 Hailuo AI官网上看到的例子,整体效果还是非常好的:

而且 Hailuo AI也支持图生视频,下面是我实测的蒙娜丽莎:







请到「今天看啥」查看全文