专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

JHU上交等提出首个可渲染X光3DGS！推理速度73倍NeRF，性能提升6.5dB | ECCV 2024

新智元 · 公众号 · AI · 2024-09-11 12:54

主要观点总结

本文报道了关于X-Gaussian技术的新研究，这是一种基于3D Gaussian Splatting框架的新型技术，专为X光新视角合成而设计。该技术旨在减少医疗成像中的X光辐射剂量，并通过高效的渲染技术提高图像质量、减少训练时间和提升推理速度。文章详细描述了X-Gaussian的方法和技术特点，包括辐射高斯点云模型、可微的辐射光栅化渲染方法以及角度位姿立方体均匀初始化等。与现有方法相比，X-Gaussian在新视角生成任务和稀疏视角CT重建方面取得了显著成果。

关键观点总结

关键观点1: 技术背景

X光由于其强大的穿透力广泛应用于医疗、安检、考古、生物、工业检测等场景的透射成像，但X光的辐射作用对人体有害。为了减少X光对人体的伤害，研究人员提出了新视角生成任务，即只拍摄少数几张X光片，剩下视角的X光片通过渲染得到，用于医生诊断分析。

关键观点2: X-Gaussian技术特点

X-Gaussian是首个能够渲染X光的3D Gaussian Splatting框架，无需计算耗时的Structure-from-Motion（SfM）算法进行初始化。它通过辐射高斯点云模型和可微的辐射光栅化渲染方法，实现了高效的X光新视角合成。

关键观点3: 研究成果

X-Gaussian技术在新视角生成任务上比当前最好的NeRF方法高出6.5dB，推理速度达到73倍。在稀疏视角CT重建任务上，新方法能够辅助传统方法提高PSNR性能超过10dB。

关键观点4: 研究意义

X-Gaussian技术的研究对于减少医疗成像中的X光辐射剂量、提高图像质量、减少训练时间、提升推理速度以及辅助传统CT重建方法具有重要意义。

正文

新智元报道

编辑：LRST

【新智元导读】 X-Gaussian是一种新型的3D Gaussian Splatting框架，专为X光新视角合成而设计，以减少医疗成像中的X光辐射剂量，通过高效的渲染技术，能够在保持图像质量的同时显著减少训练时间和提升推理速度。

‍

X光由于其强大的穿透力而被广泛地应用于医疗、安检、考古、生物、工业检测等场景的透射成像。

然而，X光的辐射作用对人体是有害的，受试者与测试者都会受到暴露于X光下的影响。

为了减少X光对人体的伤害，约翰霍普金斯大学、香港科技大学（广州）、上海交通大学的研究人员提出了稀疏视角下的X光三维重建任务——新视角生成，即只拍摄少数几张X光片，剩下视角的X 光片通过渲染得到，用以帮助医生进行诊断分析。

论文链接： https://arxiv.org/abs/2403.04116

代码链接： https:// github.com/caiyuanhao19 98/X-Gaussian

视频链接： https://www. youtube.com/watch? v=v6FESb3SkJg&t=28s

文中提出了首个能够渲染X光的3D Gaussian Splatting框架以用于X光的新视角合成（Novel View Synthesis, NVS）。

值得一提的是，该方法无需计算耗时的Structure-from-Motion（SfM）算法来进行初始化。

图1 高斯点云分布在模型训练中的变化过程

目前所有的代码、数据、高斯点云模型、训练日志均已开源，欢迎大家来使用或是提交issue。

研究背景

NeRF类重建方法由于需要密集地采集射线，并在射线上采样多个3D点，计算后通过再通过volume rendering渲染得到2D projection。这一过程非常消耗时间。

当前正火的3D Gaussian Splatting （3DGS）因为其高度平行化的渲染方法——Rasterization而有着比NeRF更快的渲染速度。然而3DGS是针对自然光成像设计的。

直接将3DGS用于X光成像会遇到两个问题：

（1）首先，如图2所示，自然光成像主要依靠于光线在物体表面的反射，这使得从不同角度看，物体表面的颜色会有差异。为了拟合这一各向异性的特点，3DGS采用球谐函数（Spherical Harmonics，SH）来模拟自然光的分布。然而在X光成像中，X光穿透物体并衰减，然后落在探测器上成像。X光无论从各个角度穿透同一物质点，其衰减都是一样的。直接使用SH很难拟合X光成像的这一各向同性的特点。

（2）其次，3DGS的初始化需要通过计算Structure-from-Motion（SfM）算法来得到各个视角的相机内外参数以及一个稀疏点云作为起始。这个算法十分耗时，增加了患者和医生的等待时间。

图2 3DGS 自然光成像与 X-Gaussian 进行 X 光成像对比

本文针对上述这些问题展开研究，做出了以下四点贡献：

针对X光新视角合成任务，本文提出首个基于3D Gaussian Splatting的技术框架——X-Gaussian；

设计了一个全新的辐射高斯点云模型（Radiative Gaussian Point Cloud Model），基于该模型，又设计了一个可微的辐射光栅化渲染方法（Differentiable Radiative Rasterization）；

针对高斯点云模型，提出了一种初始化方法——Angle-pose Cuboid Uniform Initialization（ACUI），这种初始化方法能够通过X光扫描仪的设备参数和旋转角直接计算出相机内外参数和初始稀疏点云，这使得新方法免于计算 SfM，从而大幅提升训练速度。

X-Gaussian在性能上超过当前最好NeRF方法6.5dB的情况下，推理速度还达到了73倍。同时在传统算法上也验证了，通过新方法合成的新视角X光片能够提升CT重建的图像质量。

空间坐标系的转换

在圆形扫描轨迹锥形X光束扫描（circular cone-beam X-ray scanning）场景下研究三维重建问题。空间坐标系的变换关系如图3所示。被扫描物体的中心O为世界坐标系的原点。

扫描仪的中心S为相机坐标系的中心。探测器D的左上角为图像坐标系的原点。整个空间坐标系的变换遵循OpenCV三维视觉的标准。

图3 空间坐标系转换关系示意图

本文方法

图4 X-Gaussian 算法框架流程图

算法的流程图如图4所示，首先通过图4（a）中的Angle-pose Cuboid Uniform Initialization（ACUI）来计算出X光源（Source）在对应旋转角𝜙下的相机内外参矩阵并计算出初始稀疏点云。然后，针对 X 光各向同性的成像特点设计了辐射高斯点云模型（Radiative Gaussian Point Cloud Model），如图4（b）所示。

针对这一点云模型，团队设计了一个可微的辐射光栅化（Differentiable Radiative Rasterization，DRR）渲染方法，用于三维高斯点云的泼溅渲染，如图4（c）所示。本节先介绍辐射高斯点云模型，然后是可微的辐射光栅化，最后介绍ACUI初始化方法。

辐射高斯点云模型

本小节首先回顾一下3DGS的基本知识。3DGS将一个物体或场景用𝑁𝑝个高斯点云表示如下：