专栏名称: 计算机视觉深度学习和自动驾驶
讨论计算机视觉、深度学习和自动驾驶的技术发展和挑战
目录
相关文章推荐
传媒招聘那些事儿  ·  腾讯:内容型产品-执行制作人 ·  2 天前  
中国国家地理  ·  这里才是江南水乡之夜! ·  昨天  
传媒招聘那些事儿  ·  《SPOTLiGHT聚光》多个全职岗位@你! ·  6 天前  
传媒招聘那些事儿  ·  小红书:新媒体传播专家 ·  3 天前  
传媒招聘那些事儿  ·  8k-30K/月!星球研究所2025超多全职 ... ·  5 天前  
51好读  ›  专栏  ›  计算机视觉深度学习和自动驾驶

微软版Sora开源,Mora可生成12s视频

计算机视觉深度学习和自动驾驶  · 公众号  ·  · 2024-03-23 03:48

正文


在人工智能领域,视频内容生成一直是研究的热点和挑战。

近日,微软研究院(Microsoft Research)宣布推出一款名为Mora的全新开源多智能体视频生成框架,旨在通过协作智能体实现高质量视频内容的生成。

这一突破性技术的出现,标志着视频生成技术向更广泛的应用场景和更开放的创新生态迈出了重要一步。

Mora框架的发布,是对OpenAI推出的Sora模型的一种开源回应。

Sora作为首个大规模通用视频生成模型,自2024年2月发布以来,其出色的视频生成能力和广泛的应用范围引起了社会各界的广泛关注。

然而,Sora的闭源性质限制了学术界和开发者社区对其进行深入研究和扩展的可能性。

Mora的推出,旨在打破这一局限,提供一个开放、可扩展的视频生成平台。

Mora框架的核心在于其多智能体协作机制。

通过将视频生成任务分解为多个子任务,并由专门的智能体负责处理,Mora能够高效地完成包括文本到视频的生成。

无论是展现海底珊瑚礁的生动场景

还是模拟沙漠中黄金城市的奇幻画面

以及白雪山脉湖泊

Mora都能够根据用户的文本提示,生成具有丰富细节和流畅动态的视频序列。

文本条件图像到视频的生成

视频扩展、视频到视频的编辑

视频连接以及模拟数字世界等多种视频相关任务。

这种模块化的设计不仅提高了视频生成的灵活性和效率,也为未来的创新和定制化应用提供了广阔空间。

在实际应用中,Mora展现出了令人印象深刻的性能。

根据最新的实验结果,Mora能够生成长达12秒的高清视频,分辨率达到1024×576,且视频内容与文本描述高度一致。


Mora的开源性质,意味着它不仅能够促进学术界的研究和讨论,还能够激发开发者社区的创新活力。

开发者可以通过Mora框架,探索新的视频生成算法,开发定制化的视频内容生成工具,甚至将其应用于电影制作、游戏开发、虚拟现实等多个领域。

尽管Mora在视频生成质量和多样性上已经取得了显著的成就,但与Sora相比,仍存在一定的性能差距。







请到「今天看啥」查看全文


推荐文章
传媒招聘那些事儿  ·  腾讯:内容型产品-执行制作人
2 天前
中国国家地理  ·  这里才是江南水乡之夜!
昨天
传媒招聘那些事儿  ·  《SPOTLiGHT聚光》多个全职岗位@你!
6 天前
传媒招聘那些事儿  ·  小红书:新媒体传播专家
3 天前
i黑马  ·  OPPO和VIVO的人民战争
8 年前
米尔看天下  ·  人类灭绝后,地球将发生十件事......
7 年前