本期为TechBeat人工智能社区第636期线上Talk。
北京时间11月6日(周三)20:00,北京大学博士生余旺博的Talk将准时在TechBeat人工智能社区开播!他与大家分享的主题是: “探索视频扩散模型在3D生成和重建中的应用”,届时他将介绍团队最近在可控视频生成方面的研究,以及其在3D生成和3D重建等下游任务中的应用。 长按识别二维码,一键预约TALK!
Sora等视频生成模型能够在接收一段文本或单张图像输入的条件下生成高度一致的连续视频,在广告、游戏和自媒体等领域展现出强大的应用前景。然而,大多数现有的视频生成模型缺乏内容可控性,用户无法细粒度地定义生成的内容,这限制了视频生成模型在下游任务中的应用。如何提高视频生成模型的可控性,使其能够应用于下游任务,已成为一个值得研究的热点。
本次讲座将主要介绍我们最近在可控视频生成方面的研究,以及其在3D生成和3D重建等下游任务中的应用。
2. 视频扩散模型和基于视频扩散模型的3D生成
3. 基于视频生成模型的高保真新视角生成方法:ViewCrafter
论文链接:
https://arxiv.org/abs/2409.02048
代码链接:
https://github.com/Drexubery/ViewCrafter
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!余旺博,北京大学在读博士。研究兴趣为基于扩散模型的3D生成和视频生成,3D人脸Avatar重建, 以及图像风格化等底层视觉任务。在SIGGRAPH, ECCV等会议上发表多篇论文。
个人主页:
https://www.techbeat.net/grzytrkj?id=41744
如果你也想成为讲者
▼
单人Talk | 团队专场 | 录播or直播 | 闭门交流
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区