专栏名称: 自动驾驶之心

自动驾驶开发者社区，关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等，坚持为领域输出最前沿的技术方向！

如何看待3DGS这个方向的前景？

自动驾驶之心 · 公众号 · · 2025-01-14 07:30

正文

整理 | 3D视觉之心

原文链接：https://www.zhihu.com/question/4480461408

落地工业界的能力

支撑科研发论文的能力

这条技术路径的繁衍能力（十年后还有人沿着这条路走吗）

其他指标，欢迎在留言区补充

HexUp的看法

支撑科研发论文的能力：优秀，主要因为这玩意儿相对之下没那么吃计算资源。你搞几张3090就能玩的很开心。国内拥有A100及以上级别显卡的组非常少，没有这种卡那基本上就训练不了生成式模型了。数据需求也没那么严苛，不像训练一些生成式的基座模型。落地工业界的能力：有点用处，但局限性较大这玩意儿刚出来的时候demo挺惊艳的，但其实他的生态位离游戏、动漫这种其实比较远我赞同楼上有个回答，这个更像是3D版的视频可能我想象力有限，但我觉得它最有用的落地场景可能是porn industry，就像其他很多技术一样

这里也推荐下平台最新推出的《 面向科研&落地的3DGS全栈实战教程 》，3DGS全栈技术从入门到精通！

阳明先生的看法

3DGS定位为3D版本的图像->视频，比较务实

最近看了比较多的3DGS和光照&建模&动画等等的结合，但感觉大部分是在拾传统渲染之牙慧，那些并不是它所长（比如另一个回答提到的3DLS）

MeowCat的看法

落地目前看起来不太多，如果局限在互联网，那相比业务算法少多了；如果放眼自动驾驶，华米ov都算进来能变多一点。
发论文卷得飞起，个人觉得3dgs适合3d熟练工，一如之前NeRF的狂潮，新人的话，如果没有靠谱的前辈带，上手速度可能还没新论文出得快，或者找个偏一点的idea发。
才疏学浅不敢预测。

3DGS为什么受欢迎？

相比于隐式神经网络的黑盒表示，3D Gaussian的表征方式更符合直觉，更通俗易懂。3DGS之所以爆火，很大程度在于他的实时性。除此之外，Gaussian Splatting根本不涉及任何神经网络，甚至没有一个小型的 MLP，也没有什么 "神经"的东西，场景本质上只是空间中的一组点。而更重要的一点，相比自动驾驶感知任务、大模型之类的领域，3DGS所需的算力非常小，基本上单卡就能运行，训练往往只需要分钟级。在大家都在研究数十亿个参数组成的模型的人工智能世界里，这种方法越来越受欢迎，令人耳目一新。

目前为止，3D Gaussian Splatting已经衍生出很多子领域，原始3DGS关注静态场景的重建；引入时序位姿进化为4DGS，重建动态场景；压缩三维表示到2DGS，重建表面场景；动静态结合可以重建自动驾驶场景。

重建效果如何？

静态场景重建：

表面场景重建：

动态场景重建：

自动驾驶场景重建：

入门学习仍然困难？

正如前文所述，3DGS发展至今已经衍生出各个子方向，3D Gaussian如何表示三维世界？又是如何渲染出二维图像？时序又如何引入进化到4D GS？整个3DGS涉及到的模块、细节众多。这类知识点琐碎，系统也比较复杂，如果没有比较好的教程带着入门，往往会踩坑，后期不知道怎么学习。新视角泛化怎么提升？场景编辑又是什么魔法？自动驾驶仿真闭环又是如何用到Gaussian Splatting的？ 工业界和科研还适不适合入局？ 这些都是阻挡新手入门以及进阶的难点。

优惠劵在此，扫码加入学习！

为此，我们联合业内头部自动驾驶公司算法专家，联合展开了业内首门面向3DGS全栈实战小班课，Cover 3DGS的各个子领域，让大家真正能够学得透彻，后期配有代码实战讲解，助力大家真正从实现的角度上搞懂算法 。同时作为专享福利，小班课将赠送《NeRF与自动驾驶论文带读课程》!

小班课完整版大纲如下：

这门课程将会如何展开

第一章：视觉重建算法基础

第一章会介绍视觉重建领域的基础算法 。视觉重建属于计算机视觉和计算机图形学的交叉领域，其基础算法也会涉及到这两个研究方向。神经辐射场（NeRF）和3D高斯泼溅（3DGS）的提出就是建立在视觉重建算法的基础上。本章的内容主要包括：

第二章：3DGS大观

第二章会详细介绍有关3DGS的技术细节 。3DGS自从发表在Siggraph 2023上，由于其训练和渲染速度快的特点，在不到两年的时间内迅速发展，被大量的相关工作采用作为基础模块并且扩展到自动驾驶领域。因此第二章带大家深度入门3DGS，从数据到算法、从可视化到评测、从整体到细节模块，全面剖析！本章的内容主要包括：

第三章：静态场景重建-3DGS

第三章会挑选有关增强3DGS在静态场景中渲染表现的三个工作进行剖析 。对于项目实战，本章挑选CVPR2024的最佳学生论文Mip-Splatting作为主体。Mip-Splatting专注于对3DGS在多分辨率图像下的渲染表现进行增强。它引入的3D 平滑滤波器和2D 盒式滤波器策略有效地解决了原始3DGS在放大效果下的伪影和交叠问题，而这部分内容仍然是当下学术界研究的前沿。本章的内容主要包括：

第四章：动态场景重建4DGS

第四章会讲解三个动态场景重建的工作 。动态场景重建能够建模物体随时间运动的变化，世界不是静止的，物体在移动，色彩在变化。4DGS就像行走在时间上的舞者，在每个时刻都有自己独特的表现。本章选取CVPR2024的满分文章Deformable GS来作为项目实战，来让大家对可变形场有个清晰的认识，也为之后的课程大作业打好基础。本章的内容主要包括：

第五章：场景表面重建-2DGS

第五章会着重介绍基于3DGS进行场景表面重建的三个相关工作 。通过场景的表面重建，可以对自动驾驶场景进行物理编辑，比如添加车辆，行人等物体。本章选取当前基于3DGS的SOTA方案PGSR来让大家深入了解场景表面重建的一些基本环节，本章的内容主要包括：

第六章：自动驾驶场景重建-混合GS

第六章则聚焦在自动驾驶场景 ，对将动静态场景混合情况下的3DGS进行优化的三个工作进行深度解读。只有重建出完整的场景，才能进行场景编辑，进而才能实现闭环仿真。自动驾驶场景的重建涉及到动静态物体分解，所以本章选取Street Gaussians项目作为实战来带大家熟悉基本的分解策略。本章的内容主要包括：

第七章：课程大作业

第七章是课程实战的精华部分 ，3DGS未来还有哪些研究方向？驾驶场景如何优化？工业界&科研最常用的算法框架是哪个？为此，我们选择了当下应用最广泛的gsplat，其对3DGS的pytorch版本进行了代码重构的开源项目，并提升了原版代码的训练效率，且仓库十分活跃，目前已经支持很多主流算法，非常适合科研及工程应用。本课程的大作业会带着大家从头到尾实现一个基于gsplat的驾驶场景重建的算法设计。

第八章：升学和求职模块

第八章是课程的应用模块，主打升学和求职的经验分享。 工欲善其事必先利其器，有了前面七个章节的『器』，咱们在第八章终于可以做『事』了。有了算法经验和工程经验，如何进一步升学和求职呢？需要做哪些准备？3DGS在学术界的研究趋势和工业界的落地现状如何了？目前还有哪些问题仍未解决？在这一章节，老师都会毫无保留的分享给大家。