专栏名称: AI算法与图像处理

考研逆袭985，非科班跨行AI，目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技，共同分享宝贵的资源资料，这里有机器学习，计算机视觉，Python等技术实战分享，也有考研，转行IT经验交流心得

Sora开放前夕，最好的视频生成模型是哪个？

AI算法与图像处理 · 公众号 · · 2024-11-26 20:28

正文

据不可靠消息，OpenAI大概率在年底正式开放视频生成模型Sora，目前已经有些创作者参与Sora的内测：

而且生成的视频质量看起来非常好：

OpenAI在今年2月份正式发布Sora， 距离现在已经有9个多月的时间 ，但是Sora迟迟没有对外开放。这期间，其他大模型公司已经陆续发布对标Sora的视频模型，比如Runway发布的Gen-3，以及快手发布的可灵等等。大家感觉已经对不开放的Sora失去了兴趣， 连Sora的核心作者 Tim Brooks 前段时间都离开OpenAI去谷歌DeepMind了 。所以说，今年底OpenAI很大概率会开放Sora，以重拾大家的信心。

借着Sora可能开放的这个消息， 今天我们想聊聊在Sora开放之前，目前市面上已经发布的视频生成模型最好的是哪个 。其实，这个问题并不太好回答，因为所有的发布者都说自己是最好的，而且还拿出了可量化的指标。但是，我们知道，对于图像生成和视频生成，量化指标不一定和人工评分是正相关的。所以说，评价视频生成模型的好坏，还是要人还评。之前我们介绍过一个人工评测平台 Artificial Analysis's Text-to-Image Ar ena ，当时神秘模型“red_panda"模型在这个榜单上拿了第一：神秘“红熊猫”模型登顶文生图榜首，是DALL-E 4，还是国产之光？最后神秘模型 “red _panda "揭秘是一个创业公司：最好的文生图模型“小熊猫”揭秘了，竟然来自一个黑马公司！，而且实测后大家认为效果确实非常能打。

其实这个平台还有其他模型的评测，比如LLM以及视频模型：

这个平台是随机选择两个模型生成的视频，让用户选择更好的那一个，所以其实算是比较客观一些。目前这个平台评测的模型有： Kling 1.0, CogVideoX-5B, Runway Gen 3 Alpha, Pika 1.5, Hailuo Al, Luma Dream Machine, Pyramid Flow, Mochi 1 。目前的排行榜如下所示：

这里排行第一是 MiniMax的 Hailuo AI ， Hailuo AI虽然比Gen-3和Kling推出的要晚，但其实效果很能打，这里人工评测也是第一。下面是两个从 Hailuo AI官网上看到的例子，整体效果还是非常好的：

而且 Hailuo AI也支持图生视频，下面是我实测的蒙娜丽莎：

Sora开放前夕，最好的视频生成模型是哪个？

正文

请到「今天看啥」查看全文