专栏名称: 数据派THU
本订阅号是“THU数据派”的姊妹账号,致力于传播大数据价值、培养数据思维。
目录
相关文章推荐
CDA数据分析师  ·  Deepseek来袭,数据分析师会失业吗? ·  23 小时前  
CDA数据分析师  ·  【2月】CDA网校2025 ... ·  23 小时前  
人工智能与大数据技术  ·  因一条1分钟的视频,工程师被OpenAI封禁 ... ·  昨天  
大数据与机器学习文摘  ·  突发!o3-mini ... ·  3 天前  
51好读  ›  专栏  ›  数据派THU

【ICLR2025】CUBEDIFF:将基于扩散的图像模型重新用于全景生成

数据派THU  · 公众号  · 大数据  · 2025-02-09 17:00

正文

来源:专知

本文约1000字,建议阅读5分钟

我们介绍了一种从文本提示或图像生成360°全景图的新方法。


我们介绍了一种从文本提示或图像生成360°全景图的新方法。我们的方法利用了3D生成领域的最新进展,通过使用多视角扩散模型来联合合成立方体映射的六个面。与依赖处理等矩形投影或自回归生成的先前方法不同,我们的方法将每个面视为标准透视图像,从而简化了生成过程并使现有的多视角扩散模型得以使用。我们展示了这些模型可以在不需要关注层之间的对应关系的情况下适应并生成高质量的立方体映射。我们的模型支持精细的文本控制,能够生成高分辨率的全景图像,并且在训练集之外也能很好地泛化,同时在定性和定量上都达到了最先进的结果。项目页面: https://cubediff.github.io/



关于我们







请到「今天看啥」查看全文