整理 | 3D视觉之心
原文链接:https://www.zhihu.com/question/4480461408
-
-
-
这条技术路径的繁衍能力(十年后还有人沿着这条路走吗)
-
HexUp的看法
支撑科研发论文的能力:优秀,主要因为这玩意儿相对之下没那么吃计算资源。你搞几张3090就能玩的很开心。国内拥有A100及以上级别显卡的组非常少,没有这种卡那基本上就训练不了生成式模型了。数据需求也没那么严苛,不像训练一些生成式的基座模型。落地工业界的能力:有点用处,但局限性较大这玩意儿刚出来的时候demo挺惊艳的,但其实他的生态位离游戏、动漫这种其实比较远我赞同楼上有个回答,这个更像是3D版的视频可能我想象力有限,但我觉得它最有用的落地场景可能是porn industry,就像其他很多技术一样
这里也推荐下平台最新推出的《
面向科研&落地的3DGS全栈实战教程
》,3DGS全栈技术从入门到精通!
阳明先生的看法
3DGS定位为3D版本的图像->视频,比较务实
最近看了比较多的3DGS和光照&建模&动画等等的结合,但感觉大部分是在拾传统渲染之牙慧,那些并不是它所长(比如另一个回答提到的3DLS)
MeowCat的看法
-
落地目前看起来不太多,如果局限在互联网,那相比业务算法少多了;如果放眼自动驾驶,华米ov都算进来能变多一点。
-
发论文卷得飞起,个人觉得3dgs适合3d熟练工,一如之前NeRF的狂潮,新人的话,如果没有靠谱的前辈带,上手速度可能还没新论文出得快,或者找个偏一点的idea发。
-
3DGS为什么受欢迎?
相比于隐式神经网络的黑盒表示,3D Gaussian的表征方式更符合直觉,更通俗易懂。3DGS之所以爆火,很大程度在于他的实时性。除此之外,Gaussian Splatting根本不涉及任何神经网络,甚至没有一个小型的 MLP,也没有什么 "神经"的东西,场景本质上只是空间中的一组点。而更重要的一点,相比自动驾驶感知任务、大模型之类的领域,3DGS所需的算力非常小,基本上单卡就能运行,训练往往只需要分钟级。在大家都在研究数十亿个参数组成的模型的人工智能世界里,这种方法越来越受欢迎,令人耳目一新。
目前为止,3D Gaussian Splatting已经衍生出很多子领域,原始3DGS关注静态场景的重建;引入时序位姿进化为4DGS,重建动态场景;压缩三维表示到2DGS,重建表面场景;动静态结合可以重建自动驾驶场景。
重建效果如何?
静态场景重建:
表面场景重建:
动态场景重建:
自动驾驶场景重建:
入门学习仍然困难?
正如前文所述,3DGS发展至今已经衍生出各个子方向,3D Gaussian如何表示三维世界?又是如何渲染出二维图像?时序又如何引入进化到4D GS?整个3DGS涉及到的模块、细节众多。这类知识点琐碎,系统也比较复杂,如果没有比较好的教程带着入门,往往会踩坑,后期不知道怎么学习。新视角泛化怎么提升?场景编辑又是什么魔法?自动驾驶仿真闭环又是如何用到Gaussian Splatting的?
工业界和科研还适不适合入局?
这些都是阻挡新手入门以及进阶的难点。
优惠劵在此,扫码加入学习!
为此,我们联合业内头部自动驾驶公司算法专家,联合展开了业内首门面向3DGS全栈实战小班课,Cover 3DGS的各个子领域,让大家真正能够学得透彻,后期配有代码实战讲解,助力大家真正从实现的角度上搞懂算法
。同时作为专享福利,小班课将赠送《NeRF与自动驾驶论文带读课程》!
小班课完整版大纲如下:
这门课程将会如何展开
第一章:视觉重建算法基础
第一章会介绍视觉重建领域的基础算法
。视觉重建属于计算机视觉和计算机图形学的交叉领域,其基础算法也会涉及到这两个研究方向。神经辐射场(NeRF)和3D高斯泼溅(3DGS)的提出就是建立在视觉重建算法的基础上。本章的内容主要包括:
第二章:3DGS大观
第二章会详细介绍有关3DGS的技术细节
。3DGS自从发表在Siggraph 2023上,由于其训练和渲染速度快的特点,在不到两年的时间内迅速发展,被大量的相关工作采用作为基础模块并且扩展到自动驾驶领域。因此第二章带大家深度入门3DGS,从数据到算法、从可视化到评测、从整体到细节模块,全面剖析!本章的内容主要包括:
第三章:静态场景重建-3DGS
第三章会挑选有关增强3DGS在静态场景中渲染表现的三个工作进行剖析
。对于项目实战,本章挑选CVPR2024的最佳学生论文Mip-Splatting作为主体。Mip-Splatting专注于对3DGS在多分辨率图像下的渲染表现进行增强。它引入的3D 平滑滤波器和2D 盒式滤波器策略有效地解决了原始3DGS在放大效果下的伪影和交叠问题,而这部分内容仍然是当下学术界研究的前沿。本章的内容主要包括:
第四章:动态场景重建4DGS
第四章会讲解三个动态场景重建的工作
。动态场景重建能够建模物体随时间运动的变化,世界不是静止的,物体在移动,色彩在变化。4DGS就像行走在时间上的舞者,在每个时刻都有自己独特的表现。本章选取CVPR2024的满分文章Deformable GS来作为项目实战,来让大家对可变形场有个清晰的认识,也为之后的课程大作业打好基础。本章的内容主要包括:
第五章:场景表面重建-2DGS
第五章会着重介绍基于3DGS进行场景表面重建的三个相关工作
。通过场景的表面重建,可以对自动驾驶场景进行物理编辑,比如添加车辆,行人等物体。本章选取当前基于3DGS的SOTA方案PGSR来让大家深入了解场景表面重建的一些基本环节,本章的内容主要包括:
第六章:自动驾驶场景重建-混合GS
第六章则聚焦在自动驾驶场景
,对将动静态场景混合情况下的3DGS进行优化的三个工作进行深度解读。只有重建出完整的场景,才能进行场景编辑,进而才能实现闭环仿真。自动驾驶场景的重建涉及到动静态物体分解,所以本章选取Street Gaussians项目作为实战来带大家熟悉基本的分解策略。本章的内容主要包括:
第七章:课程大作业
第七章是课程实战的精华部分
,3DGS未来还有哪些研究方向?驾驶场景如何优化?工业界&科研最常用的算法框架是哪个?为此,我们选择了当下应用最广泛的gsplat,其对3DGS的pytorch版本进行了代码重构的开源项目,并提升了原版代码的训练效率,且仓库十分活跃,目前已经支持很多主流算法,非常适合科研及工程应用。本课程的大作业会带着大家从头到尾实现一个基于gsplat的驾驶场景重建的算法设计。
第八章:升学和求职模块
第八章是课程的应用模块,主打升学和求职的经验分享。
工欲善其事必先利其器,有了前面七个章节的『器』,咱们在第八章终于可以做『事』了。有了算法经验和工程经验,如何进一步升学和求职呢?需要做哪些准备?3DGS在学术界的研究趋势和工业界的落地现状如何了?目前还有哪些问题仍未解决?在这一章节,老师都会毫无保留的分享给大家。
讲师介绍