专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
目录
相关文章推荐
风动幡动还是心动  ·  纳斯达克指数暴跌​! ·  2 天前  
风动幡动还是心动  ·  纳斯达克指数暴跌​! ·  2 天前  
51好读  ›  专栏  ›  专知

【CVPR2025】GEN3C:基于3D信息的世界一致性视频生成与精确相机控制

专知  · 公众号  ·  · 2025-03-07 11:00

正文

我们提出了 GEN3C ,一种具有精确相机控制和时间3D一致性的生成视频模型。现有的视频模型已经能够生成逼真的视频,但它们往往利用较少的3D信息,导致不一致性,例如物体突然出现或消失。即使实现了相机控制,也不精确,因为相机参数仅仅是神经网络的输入,网络必须推断视频如何依赖于相机。相比之下,GEN3C通过 3D缓存 进行引导:通过预测种子图像或先前生成帧的逐像素深度获得的点云。在生成下一帧时,GEN3C以用户提供的新相机轨迹对3D缓存的2D渲染进行条件生成。


至关重要的是,这意味着GEN3C既不需要记住它先前生成的内容,也不需要从相机姿态推断图像结构。相反,模型可以将其生成能力集中在先前未观察到的区域,并将场景状态推进到下一帧。我们的结果表明,与现有工作相比,GEN3C实现了更精确的相机控制,并在稀疏视角新视图合成中取得了最先进的结果,即使在驾驶场景和单目动态视频等具有挑战性的设置中也是如此。最佳效果请观看视频。访问我们的网页: https://research.nvidia.com/labs/toronto-ai/GEN3C/

专知便捷查看,访问下面网址或 点击最底端“阅读原文”







请到「今天看啥」查看全文