在众多科研人员的共同努力下,近年来ReID技术已经取得了长足的发展。但必须承认的是,现阶段ReID技术的研究仍然面临着不少的现实挑战,主要有几个方面:
首先是数据,和其他视觉任务相比,ReID的数据规模是非常小的。目前ReID领域的公开数据集所含的ID数量不超过6000个。相比之下,人脸识别的公开数据集ID数量已经超过了100万,而企业私有的ID规模更在此之上。
导致ReID训练数据缺乏的主要原因在于,行人数据集需要采集同一个人在一段时间内同时出现在多个摄像头下的画面,如此严苛的条件无疑对行人数据集的构建造成了巨大挑战。
除了数据缺失,数据标注也是一个不小的挑战。数据标注是一件工作量特别庞大的事情,要知道大规模图像分类数据集 ImageNet通过众包的形式,前后有4.8 万人花了近两年时间才标注完成。此外,行人数据的标注本身有时也是非常困难的。区分猫狗非常容易,但要在视频中将两个年龄、体貌相似,穿着同样衣服的不同行人分开是比较困难的。
其次是算法。ReID技术的发展大致经历了两个阶段:2014年以前主要是依靠一些传统方法,比如设计手工特征等;2014年以后则基本是基于深度学习的方法。众所周知,深度学习算法的训练依赖于大量的高质量数据。而ReID相关的训练数据不仅数量少,质量也很难保障。
现有的视频监控设备受成像质量、分辨率等因素的制约,抓取的图像信息经常是模糊不清的。另外,相机拍摄角度差异大、室内室外环境变化、行人服装配饰更换、季节性穿衣风格差别大、白天晚上光线差异等因素,也给跨摄像头、跨地区、跨时间的ReID分析造成了巨大挑战。