本文提出了首个能够渲染 X 光的 3D Gaussian Splatting 框架以用于 X 光的新视角合成 (Novel View Synthesis, NVS)。值得一提的是,我们的方法无需计算耗时的 Structure-from-Motion (SfM) 算法来进行初始化。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
本文介绍我们在 ECCV 2024 上的新工作
《Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis》
本文提出了首个能够渲染 X 光的 3D Gaussian Splatting 框架以用于 X 光的新视角合成 (Novel View Synthesis, NVS)。值得一提的是,我们的方法无需计算耗时的 Structure-from-Motion (SfM) 算法来进行初始化。我们的工作还被推特科研风向标的 AK 和 MrNeRF 大佬转发报道
media report by AK:
https://x.com/_akhaliq/status/1765929288044290253?s=46
media report by MrNeRF:
https://x.com/janusch_patas/status/1766446189749150126?s=46
目前所有的代码、数据、高斯点云模型、训练日志均已开源,欢迎大家来使用或是提交 issue
1. X 光新视角合成任务介绍
X 光由于其强大的穿透力而被广泛地应用于医疗、安检、考古、生物、工业检测等场景的透射成像。然而,X 光的辐射作用对人体是有害的,受试者与测试者都会受到暴露于 X 光下的影响。为了减少 X 光对人体的伤害,本文研究稀疏视角下的 X 光三维重建任务 —— 新视角生成。即只拍摄少数几张 X 光片,剩下视角的 X 光片通过渲染得到,用以帮助医生进行诊断分析。
NeRF 类重建方法由于需要密集地采集射线,并在射线上采样多个 3D 点,计算后通过再通过 volume rendering 渲染得到 2D projection。这一过程非常消耗时间。当前正火的 3D Gaussian Splatting (3DGS) 因为其高度平行化的渲染方法 —— Rasterization 而有着比 NeRF 更快的渲染速度。然而 3DGS 是针对自然光成像设计的。直接将 3DGS 用于 X 光成像会遇到两个问题:(i)首先,如图 2 所示,自然光成像主要依靠于光线在物体表面的反射,这使得从不同角度看,物体表面的颜色会有差异。为了拟合这一各向异性的特点,3DGS 采用球谐函数(Spherical Harmonics,SH)来模拟自然光的分布。然而在 X 光成像中,X 光穿透物体并衰减,然后落在探测器上成像。X光无论从各个角度穿透同一物质点,其衰减都是一样的。直接使用 SH 很难拟合 X 光成像的这一各向同性的特点。(ii)其次,3DGS 的初始化需要通过计算 Structure-from-Motion (SfM) 算法来得到各个视角的相机内外参数以及一个稀疏点云作为起始。这个算法十分耗时,增加了患者和医生的等待时间。
图 2 3DGS 自然光成像与 X-Gaussian 进行 X 光成像对比
本文针对上述这些问题展开研究,做出了以下四点贡献:
针对 X 光新视角合成任务,本文提出首个基于 3D Gaussian Splatting 的技术框架 — X-Gaussian。
我们设计了一个全新的辐射高斯点云模型(Radiative Gaussian Point Cloud Model),基于该模型我们又设计了一个可微的辐射光栅化渲染方法(Differentiable Radiative Rasterization)。
针对我们的高斯点云模型,我们提出了一种初始化方法 — Angle-pose Cuboid Uniform Initialization(ACUI),这种初始化方法能够通过 X 光扫描仪的设备参数和旋转角直接计算出相机内外参数和初始稀疏点云,这使得我们方法免于计算 SfM,从而大幅提升训练速度。
我们的 X-Gaussian 在性能上超过当前最好 NeRF 方法 6.5 dB 的情况下,推理速度还达到了 73 倍。同时我们在传统算法上也验证了,通过我们方法合成的新视角 X 光片能够提升 CT 重建的图像质量。
2. 空间坐标系的转换
我们在圆形扫描轨迹锥形 X 光束扫描(circular cone-beam X-ray scanning)场景下研究三维重建问题。空间坐标系的变换关系如图 3 所示。被扫描物体的中心 O 为世界坐标系的原点。扫描仪的中心 S 为相机坐标系的中心。探测器 D 的左上角为图像坐标系的原点。整个空间坐标系的变换遵循 OpenCV 三维视觉的标准。
图3 空间坐标系转换关系示意图
3. 本文方法
图4 X-Gaussian 算法框架流程图
我们算法的流程图如图4所示,首先通过图 4(a)中的 Angle-pose Cuboid Uniform Initialization(ACUI)来计算出 X 光源(Source)在对应旋转角
下的相机内外参矩阵并计算出初始稀疏点云。然后,我们针对 X 光各向同性的成像特点设计了辐射高斯点云模型(Radiative Gaussian Point Cloud Model),如图 4(b)所示。针对这一点云模型,我们还设计了一个可微的辐射光栅化(Differentiable Radiative Rasterization,DRR)渲染方法,用于三维高斯点云的泼溅渲染,如图 4(c)所示。本节我们先介绍辐射高斯点云模型,然后是可微的辐射光栅化,最后介绍 ACUI 初始化方法。