继百度深度学习研究院、腾讯优图以及Face++之后,小米最新的人脸检测算法日前也在业界最权威的FDDB数据集上拿下了第一的成绩。
根据小米联合创始人黄江吉公开的信息,小米此次研发的新算法基于深度卷积检测网络(Faster RCNN Bootstrapped by Hard Negative Mining),即利用深度卷积检测网络,同时学习人脸和非人脸特征,从而准确识别出人脸的位置和大小。
雷锋网第一时间联系了参与这一项目的小米联合创始人黄江吉,他表示小米人脸检测改良了现有的方法,尤其是针对比较模糊的人脸有明显的优化,不过具体细节还要等到相关论文公布才能知晓。
当然,在此之前我们需要了解的是,人脸测试可分为人脸识别、人脸检测、人脸表情、人脸年龄、人脸性别等等,这其中人脸识别和人脸检测是最主流的两个方向。
|
人脸识别
人脸识别的目的就是找出图片中的人脸,然后识别人脸是谁,目前,全球人脸识别的数据集最多,如WebFace、MegaFace以及LFW(Labeled Faces in the Wild)等。LFW是人脸识别研究领域比较有名的人脸图像集,LFW库共有5749个人的13233幅图像,其中1680人有两幅及以上的图像,4069人只有一幅图像。
例如,Facebook Deepface、香港中文大学汤晓鸥教授的DeepID以及Face++都在LFW上进行了相应的测试。
|
人脸检测
事实上,相比人脸识别,人脸检测的任务要稍微简单一些,它只关注前者的第一步,就是给出一张照片,找出有人脸的区域(椭圆型或矩阵)就达到目的了。
FDDB(Face Detection Data Set and Benchmark)是最具权威的人脸检测评测平台。FDDB和LFW一样,都是马萨诸塞大学的人脸数据库,它包含2845张图片,共有5171个人脸作为测试集。测试集范围包括:不同姿势、不同分辨率、旋转和遮挡等图片,同时包括灰度图和彩色图,标准的人脸标注区域为椭圆形。小米人脸检测的测试就是在FDDB进行的。
“检测和识别都是基于特征提取,检测相当于一张图上有足够多的选框(例如:20X20 的选框,各个像素点逐一筛选。)可先识别出人脸的位置,然后做选框,再根据选框内部的像素点逐一筛选。”宇泛智能CEO赵弘毅如是说。
通俗点讲,在图片上任意给出一个框,判断框是不是人脸,然后选框逐渐移动去判断是不是人脸。这个过程在学术领域称为“滑窗”,是特征提取的一个过程。所以,在一张图片中至少需要对几万个框做分别提取特征,从而来识别人脸。