CAP4D:一种使用可变形多视图扩散模型从任意数量的参考图像(即一到一百张)重建照片级真实的 4D(动态 3D)肖像数字人并实时为其制作动画和渲染的方法。#ai创造营##ai#
现有方法存在的问题:
1. 传统方法:视觉效果工作室使用摄像机阵列来捕获数百张参考图像,而内容创建者可能试图为从互联网上下载的单个肖像图像制作动画。因此,数字人重建方法的生态系统庞大且异构。
2. 基于多视图立体或神经渲染的技术可以实现最高质量的结果,但需要数百张参考图像。
2. 最近的AI生成模型可从单个参考图像生成数字人,但视觉保真度仍然落后于多视图技术。
项目: felixtaubner.github.io/cap4d/
论文: arxiv.org/abs/2412.12093
ChatGPT 黄建同学的微博视频
现有方法存在的问题:
1. 传统方法:视觉效果工作室使用摄像机阵列来捕获数百张参考图像,而内容创建者可能试图为从互联网上下载的单个肖像图像制作动画。因此,数字人重建方法的生态系统庞大且异构。
2. 基于多视图立体或神经渲染的技术可以实现最高质量的结果,但需要数百张参考图像。
2. 最近的AI生成模型可从单个参考图像生成数字人,但视觉保真度仍然落后于多视图技术。
项目: felixtaubner.github.io/cap4d/
论文: arxiv.org/abs/2412.12093
ChatGPT 黄建同学的微博视频