专栏名称: 3D视觉工坊
1、OpenCV的技术传播; 2、3D点云与重建技术; 3、Vslam技术; 4、深度学习; 5、技术干货分享。
目录
相关文章推荐
贵州日报  ·  贵州“新春第一会”:主攻现代化产业体系 ·  2 天前  
上海证券报  ·  蚂蚁集团,重要人事变动 ·  3 天前  
上海证券报  ·  9万亿元!湖北新目标 ·  3 天前  
百姓关注  ·  刚刚!小S发声 ·  3 天前  
51好读  ›  专栏  ›  3D视觉工坊

NeurlPS'24开源 | 清华新作DiffGS:首个通用3D GS生成模型!

3D视觉工坊  · 公众号  ·  · 2024-12-06 07:00

正文

点击下方 卡片 ,关注 「3DCV」 公众号
选择 星标 ,干货第一时间送达

来源:3DCV

添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。

扫描下方二维码,加入 「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料: 近20门独家秘制视频课程 最新顶会论文 、计算机视觉书籍 优质3D视觉算法源码 等。想要入门3D视觉、做项目、搞科研,欢迎扫码加入!

清华大学近期的工作:DiffGS: Functional 3D Gaussian Splatting Diffusion 被接收于 NeurIPS 2024。在本文中,作者第一次实现了原生的三维高斯生成式模型,无需对高斯数据进行体素化等预处理操作,并可以生成任意数量的3DGS。DiffGS同时是第一个通用三维高斯生成模型,支持图生3DGS、文生3DGS、三维高斯补全、点云到3DGS的生成等任务。论文代码已开源:

论文地址:https://arxiv.org/abs/2410.19657
项目主页:https://junshengzhou.github.io/DiffGS
代码地址:https://github.com/weiqi-zhang/DiffGS

作者提出使用函数化方式来将离散的、非结构化的三维高斯表征解耦地表示为三个三维高斯函数,包括高斯概率函数、高斯颜色函数和高斯变换函数。在这三个连续的三维高斯函数上,可以训练一个标准的VAE + LDM (Variational Auto-encoder + Latent Diffusion Model) 的扩散生成式模型来生成这些函数。最后通过高斯提取算法获得最终生成的高斯。

DiffGS 网络框架:

DiffGS 包括一个Gaussian VAE以及一个Gaussian LDM。首先训练Gaussian VAE来构建一个可以编码三维高斯并解码出三维高斯函数的隐特征空间,在这个隐特征的基础上训练一个Diffusion模型来实现三维高斯的生成。同时可以引入各种condition,如文本、图像和残缺高斯,来实现可控的三维生成。

高斯提取算法

DiffGS设计了一个基于Octree的优化式高斯提取算法,以从生成的高斯概率函数、颜色函数和变换函数中恢复出高斯模型。该算法的目标类似于Marching Cubes算法从SDF中提取表面的过程。

下游应用

DiffGS可以实现多个3DGS生成任务,如Unconditional Generation,Text-to-3DGS Generation,Image-to-3DGS Generation,Gaussian Completion,Point-to-Gaussian Generation。

无条件三维高斯生成

与现有SOTA方法的可视化以及量化结果对比:

图/文生三维高斯

给定文本,比如“a grey chair has two L type legs”, DiffGS能够生成对应的三维高斯模型

三维高斯补全

DiffGS 是首个能够实现三维高斯补全的模型。给定残缺的模型,DiffGS能够预测完整的三维高斯模型

点云生成三维高斯

DiffGS 还可以支持基于点云的三维高斯生成任务。只需要将Gaussian VAE的输入修改为三维点云即可以实现该任务。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉交流群,成立啦!

目前我们已经建立了3D视觉方向多个社群,包括 2D计算机视觉 最前沿 工业3D视觉 SLAM 自动驾驶 三维重建 无人机 等方向,细分群包括:

工业3D视觉 :相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM :视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶 :深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、Occupancy、目标跟踪等。

三维重建 :3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机 :四旋翼建模、无人机飞控等

2D计算机视觉 :图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

最前沿 :具身智能、大模型、Mamba、扩散模型、图像/视频生成等

除了这些,还有 求职 硬件选型 视觉产品落地、产品、行业新闻 等交流群

添加小助理: cv3d001,备注: 研究方向+学校/公司+昵称 (如 3D点云+清华+小草莓 ), 拉你入群。

▲长按扫码添加助理:cv3d001

3D视觉工坊知识星球

「3D视觉从入门到精通」知识星球 ( 点开有惊喜 ) ,已沉淀6年,星球内资料包括: 秘制视频课程近20门 (包括 结构光三维重建、相机标定、SLAM、深度估计、3D目标检测、3DGS顶会带读课程、三维点云 等)、 项目对接 3D视觉学习路线总结 最新顶会论文&代码 3D视觉行业最新模组 3D视觉优质源码汇总 书籍推荐







请到「今天看啥」查看全文