专栏名称: PaperWeekly
PaperWeekly是一个分享知识和交流学问的学术组织,关注的领域是自然语言处理的各个方向。我们热爱知识,分享知识,希望通过我们大家的努力为自然语言处理的发展做出一点点贡献。我们每周会分享一期特定话题的论文笔记和本周值得读的相关论文。
目录
相关文章推荐
实验万事屋  ·  博士就发了14.5分的Cell大子刊,这厦门 ... ·  3 天前  
NaturePortfolio  ·  转载 ... ·  5 天前  
PaperWeekly  ·  多模态大模型,杀疯了!!! ·  6 天前  
51好读  ›  专栏  ›  PaperWeekly

革命性突破UltrAvatar!3D虚拟可驱动人物生成,纹理引导生成打造极致完美

PaperWeekly  · 公众号  · 科研  · 2024-11-07 13:14

正文


UltrAvatar: A Realistic Animatable 3D Avatar Diffusion Model with Authenticity Guided Textures

CVPR 2024


引言

在数字化时代迅速演进的今日,OPPO美国研究中心和西湖大学的研究者们带来了一项革命性的技术——UltrAvatar。这项研究不仅缩小了虚拟与现实体验之间的差距,更是在3D虚拟人像生成领域迈出了重要的一步。


研究团队通过大量实验,展示了UltrAvatar方法的有效性和鲁棒性,其性能在多个实验中都大幅超越了现有最先进的方法。通过UltrAvatar生成的虚拟形象,不仅拥有真实材质色彩与纹理,在高频几何细节上呈现清晰锐利的效果,在生成端可以生成多样化高质量的可驱动虚拟人,为用户带来了前所未有的3D虚拟体验。

01


背景简介


三维可驱动虚拟人的生成在计算机视觉和计算机图形学领域都具有着重大的意义。深度学习的最新进展显著提升了虚拟人生成的逼真度。虽然多视图三维重建方法(如Multi-View Stereo和 Structure from Motion)能够通过不同角度捕捉多张图像生成头像,但由于繁琐的输入、受限的视角、不必要的光照干扰和较差的图像质量,由用户拍摄的单张图像或从文本描述产出的图像来生成逼真的三维头像变得极具挑战性。

02


方法架构

UltrAvatar技术能够将文本描述或单一图像作为输入,生成具有物理基础渲染(PBR)纹理的真实可驱动的3D虚拟形象,这些虚拟形象在质量、多样性和保真度上均达到了卓越的水平。不仅适配多种物理渲染引擎,还克服了以往技术在面部细节上过度平滑以及多样性不足的缺陷,实现了高质量的细节表现与真实感。


UltrAvatar首先采用了一种全新扩散生产的方法,提取了真实的散射色彩,去除不必要的光照效应,从而生成真实皮肤材质颜色,使得生成的形象在不同光照条件下呈现出自然的质感。此外,UltrAvatar还提出了一种基于两种梯度引导的扩散模型,用于生成PBR纹理,使得渲染的虚拟形象呈现丰富的特征与纹理细节,同时也更好地与3D网格几何形状对齐。

03


实验结果

01


文本生成头像

我们将文本信息输入通用扩散模型来创建二维人脸图像。结果显示,重建的人物不仅保持了特征ID一致性,还具备高保真的PBR 纹理,与3D网格精准对齐,呈现出极高的逼真度。为验证生成纹理的质量,我们在不同光照的环境下对每个生成虚拟人进行了重打光渲染,以展示其真实质感。


02


重打光后的结果























03


名人头像生成结果


我们可以根据名人的名字生成其高质量的三维虚拟形象。


04


非特定领域的角色生成

我们还能够生成一些非特定领域的卡通形象和非人类形象。


05

特征编辑与驱动

生成的虚拟人高频细节由高精度PBR纹理表示,并依附于简易的3DMM网格模型, 因此我们可以通过改变表情和姿势参数为来驱动虚拟人生成动画。此外,我们还可以使用AGT- DM中的文本输入的能力进行一些纹理编辑,从而进一步丰富虚拟人的外观表现力。



04


结论

在数字娱乐、虚拟现实、教育培训、远程沟通等领域,UltrAvatar开辟了新的可能性,使用户能够更加自由地创造和体验可驱动的3D虚拟形象。通过Text2Avatar、Image2Avatar的形式,直接生成高分辨率的虚拟人以及物理PBR材质加以驱动,达到以假乱真的视频效果。为在电影中,以低廉的成本,实时生成和驱动需要的人物或非人物角色,铺平了道路,推动了数字角色生成的创新发展。


OPPO美国研究中心和西湖大学的这一成果不仅体现了在3D虚拟形象创造领域的技术领先性,也为我们呈现了一个更加真实和引人入胜的虚拟世界。我们期待看到这一技术的进一步发展和广泛应用。UltrAvatar——打造真实的数字化未来,今日已来。



相关论文:https://openaccess.thecvf.com/content/CVPR2024/html/Zhou_UltrAvatar_A_Realistic_Animatable_3D_Avatar_Diffusion_Model_with_Authenticity_CVPR_2024_paper.html

项目网站:https://mingjoe.github.io/UltrAvatar/

 

该团队由Mingyuan Zhou, Rakib Hyder, Ziwei Xuan和齐国君老师组成