这是《窄播Weekly》的第31期,本期我们关注的商业动态是:AI视频生成大模型。
今年2月OpenAI通过Sora的发布,为AI视频生成明确了依靠DiT(Difffusion Transfomer)架构获得突破的技术路径。随后,快手、阿里巴巴、字节跳动、美图、生数科技、智谱AI、MiniMax纷纷入局其中,持续提升着AI视频生成的赛道热度。
9月,国产视频生成大模型迎来了目前最重要的一轮爆发:
8月31日,MiniMax正式发布视频模型video-01,拉开了红毯仪式的序幕。
9月19日,阿里云CTO周靖人在云栖大会上发布全新视频生成模型。同日,快手发布可灵1.5模型,内部评测整体效果比可灵1.0模型提升了95%。
9月23日,美图公司宣布美图奇想大模型完成视频生成能力的升级。
9月24日,字节跳动旗下火山引擎发布了PixelDance和Seaweed两款视频生成大模型。
9月26日,美图公司又向所有用户开放了AI短片创作工具MOKI。
9月30日,可灵又上线了「对口型」功能,支持对生成的人物上传音频内容,并宣布正式全面开放API,上线了AI创作社区「创意圈」。
国庆假期,国外视频生成大模型领域也迎来了新变化。当地时间10月4日,Sora团队研发负责人Tim Brooks宣布离职加入DeepMind,继续从事视频生成和世界模拟器方面的工作。
同日,Meta对外公布了新的大模型Movie Gen。该模型支持根据文本提示创作视频和音频内容,并允许用户添加特效、道具、服装或对生成内容中的部分元素进行简单调整,可生成最长16秒的1080P视频。Meta认为,Movie Gen旨在处理从个性化视频创作到复杂的视频编辑和高质量音频生成等任务,并计划于2025年在Instagram落地应用。