在基于深度学习的相机标定中,由于广角镜头和CMOS传感器的广泛应用,径向畸变和滚动快门畸变的校正受到越来越多的关注。这里主要回顾这两种畸变的标定与校正方法。径向畸变针对基于深度学习的径向畸变校正方法,文献大致分为两类:基于回归的解决方案和基于重建的解决方案。
基于回归的解决方案
-
经典方法:Rong等人和DeepCalib是学习型广角相机标定的开创性工作,他们将相机标定建模为监督分类或回归问题,通过卷积层和全连接层的网络学习输入图像的畸变特征,并预测相机参数,其中DeepCalib提出了三种学习策略,实验表明简单的单网络架构(SingleNet)在准确性和效率方面表现最佳。后续改进:一些研究引入了语义特征和几何特征,以增强网络对畸变的感知能力。此外,方法如无监督学习、自监督学习和强化学习进一步提升了泛化能力。
-
动态生成:RDC-Net通过在训练过程中随机生成畸变图像,提升了校正性能并防止模型过拟合。
-
可解释性:一些研究探索了径向对称特性,开发了位置感知的权重层,如Shi等人的固定权重层和PSE-GAN的可学习权重层,从而使网络显式感知畸变。
基于重建的解决方案
受到条件图像到图像转换技术和密集视觉感知的启发,重建方法从传统回归方法中逐渐发展出来。例如DR-GAN首次直接建模失真图像和校正图像之间的逐像素映射,摆脱了对相机模型假设的依赖,实现了无相机参数训练和单阶段校正。
-
统一模型:DDM通过畸变分布图将不同相机模型统一到一个领域,并结合几何先验实现图像校正。
-
减少伪影:后续研究开发了位移场来减少像素级伪影生成。例如FE-GAN将几何先验和自监督策略相结合,提出了一种适用于广角相机标定的失真流学习方法。
-
改进架构:PCN设计了校正层,避免跳跃连接造成的模糊问题,而PolarRecNet通过将失真图像从笛卡尔坐标系转换到极坐标系,进一步提高了对径向对称性的感知能力。
-
滚动快门畸变:深度学习在滚动快门(RS)畸变校正方面分为两类:基于单帧的解决方案和基于多帧的解决方案。
基于单帧的解决方案
经典方法是URS-CNN是首个针对滚动快门校正的学习型工作,通过长核卷积网络提取场景结构和行扫描相机运动的交互特性。RSC-Net进一步提升自由度至6-DoF,提出了结构与运动感知校正模型。事件相机EvUnroll利用事件相机的高时间分辨率特性,将RS校正问题转化为事件流处理。
基于多帧的解决方案
运动估计:DeepUnrollNet首次使用两帧RS图像构建端到端网络,通过前向映射模块估计RS到全局快门(GS)的位移场。联合校正:JCD结合RS校正和去模糊技术,设计了双向映射流以补偿位移并恢复细节。对齐改进:SUNet通过上下文感知的校正流消除连续帧之间的错位问题,而AW-RSC利用多头注意力机制和可学习卷积块进一步提升了校正精度。
基于回归的解决方案逐渐被基于重建的方法替代,后者通过学习位移场实现更高效的校正,越来越多的研究引入几何先验和多样化特征,推动了深度学习模型的快速收敛和解释能力的提升。未来方向
-
将滚动快门和广角相机标定的技术互相借鉴,如多帧校正策略和几何先验的应用。
-
设计更高效的训练数据采样策略,减少冗余标注数据对模型训练效率的影响。
-
引入高精度传感器(如事件相机)或多模态传感器,实现跨模态联合标定,提高标定的精度和稳定性。