准确且快速地获取锐利的边界特征和稳健的语义特征,对于许多下游机器人任务至关重要,如机器人抓取和操作、实时语义建图以及在边缘计算单元上执行的在线传感器校准任务。虽然边界检测和语义分割是相辅相成的任务,但大多数轻量化研究集中在语义分割任务上,忽视了边界信息的重要性。本工作中提出了Mobile-Seed,一个轻量化的,针对同步语义分割和边界检测任务的框架。该框架包括一个双分支编码器、一个主动融合解码器(AFD)以及一个多任务正则化约束项。编码器由两个分支组成:一个分支捕获类别感知的语义信息,另一个分支从多尺度的语义特征中提取边界信息。AFD模块通过学习特征通道间的关系,自适应的分配各个通道的权重,从而实现语义特征和边界特征的动态融合。此外,作者还提出了一种正则化约束项,以缓解多任务学习引入的冲突。与现有方法相比,Mobile-Seed提出了一个轻量化的多任务学习框架,可以同时提高语义分割表现并准确定位物体的边界。在Cityscapes数据集上的实验表明,Mobile-Seed在mIoU指标上比SOTA的基线方法提高了2.2个百分点,在mF-score指标上提高了4.2个百分点,同时在RTX 2080 Ti GPU上以1024x2048分辨率输入保持23.9帧每秒(FPS)的在线推理速度。在CamVid和PASCAL Context数据集上的扩展实验证实了该方法的广泛的应用前景。
在语义标签的监督下,模型的顶层模块学习抽象的语义表示,使其能够对各种不同形状、光照条件和纹理的同一类别目标做出鲁棒的预测。相比之下,边界标签的监督引导底层模块区分类别无关的边界或非边界信息,而非类别可知的语义。由于底层同时为语义分割和边界检测提供基础特征支持,因此在反向传播过程中,底层会接受两种截然不同的监督。相关研究DDS(Deep diverse supervision, DDS)表明,深层次的,完全不同的监督会导致模型的性能衰退。因此,作者提出了双向的一致性约束来保证两个任务能够相互促进的学习。一方面,作者使用差分模板将语义特征差分为伪边缘特征,通过和边界分支预测的边缘特征对齐来保证语义到边界的一致性;另一方面,作者强调边界区域和内部区域的语义一致性,对边界区域的语义预测结果加以额外的监督,从而保证边界到语义的一致性。