专栏名称: 兴业计算机团队
兴业证券计算机团队:力求勤勉、专注、深入、严谨 —— 成员:袁煜明/蒋佳霖/徐聪/雷雳/陈冠呈/洪依真
目录
相关文章推荐
自贡网  ·  荣县无人机立功啦! ·  16 小时前  
自贡网  ·  2.8亿“大项目”!涉及62.4万人次—— ·  3 天前  
自贡网  ·  荣县:暖心举措助力农民工返岗 ·  3 天前  
51好读  ›  专栏  ›  兴业计算机团队

【兴业计算机袁煜明团队】人脸识别行业报告:浮云渐散,刷脸时代来临

兴业计算机团队  · 公众号  ·  · 2017-09-23 22:47

正文

投资要点

近日,2017年苹果新品手机iPhone X采用Face ID人脸解锁,此前小米Note3手机、Vivo V7+手机也推出具备人脸识别功能的智能手机。这标志着人脸识别技术加速迈入消费级领域。

人脸识别大致分为两种应用模式四步流程。 两种模式包括1:1比对和1:N识别,1:1是比对两个人脸的相似度,只需要确定是否授权人;1:N是识别对象是否在人脸数据库中。四部流程依次是人脸检测、活体检测、人脸特征提取和人脸匹配识别。

技术、应用范围和价格问题逐渐解决,深度学习和3D技术助推人脸识别走出实验室。 长久以来技术不足、应用范围局限、价格高企制约人脸识别发展。尽管实验室条件中人脸识别技术精准度可达到99%以上,有些公司在ImageNet、LFW也名列前茅,但落地到实际应用中受到光照姿态、表情等条件干扰,精准度始终不尽如人意。近几年技术问题得到逐步解决,近红外和可见光结合解决光线问题、3D感应和摄像头解决姿态和表情问题,深度学习算法提高现实场景识别效率和精确度

刷脸时代来临,人脸识别市场广阔,盈利模式多变,消费级领域产业化将爆发。 人脸识别技术可以运用到政府、安防、公安刑侦等政府级别,也可以运用到金融、汽车电子、新零售等工业级别,目前智能手机、支付、互联网+等消费级应用也即将迎来爆发,应用场景日趋多元,市场仍然处于加速扩张期。盈利模式从传统的硬件销售、软件按量或按时收费(SaaS模式/PaaS模式)、软件技术支持、软硬件一体化解决方案再到未来可能会实现的大数据变现,变现模式多样。我们认为未来人脸识别有巨大的市场需求和广阔的应用前景,有望维持高速增长。

硬件巨头、互联网巨头和创业公司都在相继布局。 Google、Facebook、百度等互联网巨头都在人脸识别产业链不同领域都在布局,传统垂直领域厂商如苹果、海康、大华、华为都在研发技术巩固自身原有业务。巨头发展的方式为外延和内生并行,例如Facebook收购Face.com,苹果收购PrimeSense。同时也可以看到有旷视、商汤、依图、云从等创业公司已经发展壮大成独角兽。

相关标的 :东方网力、佳都科技、熙菱信息、远方信息、海康威视、大华股份、汉邦高科、浩云科技、北部湾旅、川大智胜。

报告正文

一、刷脸时代已经到来?

1.1、消费级人脸识别产业化爆发

北京时间9月13日,苹果在乔布斯剧院召开新品发布会,最备受瞩目的当属其推出苹果十周年特别版首款OLED全面屏iPhone X。它的独特之处在于没有了TouchID指纹识别,而是采用FaceID人脸识别作为手机生物辨识技术,不需要任何动作,抬手秒解锁。

除了万众瞩目的苹果,国内手机厂商小米、vivo在苹果发布会之前也相继推出了人脸识别手机。9月11日,小米发布Note3手机,提供人脸解锁功能,识别速度为500毫秒。9月7日vivo在印度正式发布了旗下首款全面屏手机V7+,同样具备人脸解锁功能。

手机设备以外的众多领域也同样在发生重大变革。8月25日,武汉火车站宣布全面刷脸进站;8月23日百度宣布与首都国际机场签署战略合作协议打造刷脸登机的智慧机场;9月1日支付宝宣布商用刷脸支付;9月5日杭州大量宾馆免身份证,刷脸即可入住;9月7日,京东苏宁开启刷脸支付;9月9日,北京所有公租房将推行“人脸识别”门禁;9月11日,北师大宣布学生宿舍全面启用刷脸开门;9月12日,农业银行总行在自动取款机试点“刷脸取款”,目前已下发通知要求全国推广刷脸取款,将为全国24064家分支机构、30089台柜员机、10万个ATM机安装人脸识别系统;招商银行也已于近期在全国重点城市的ATM取款机系统上线了“刷脸取款”选项,用户可不带银行卡、身份证,不用输入银行账户,靠“刷脸”就能取款。

由此可见,人脸识别技术加速渗透进入安防、银行、支付等众多领域,并且已经从政府级别应用、商业级别应用开始进入到消费级别的爆发时期,验证了人脸识别技术巨大的市场需求与广阔的应用前景。

1.2、概念辨析:机器人脸识别VS肉眼识别

人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等。该技术融合了生物学、心理学、认知学、模式识别、图像处理、计算机视觉等多领域的知识和相关技术,可广泛应用于身份确认、身份鉴别、访问控制、安全监控、人机交互等场景。

人脸识别的工程应用始于20世纪60年代,经过50多年的发展,人脸识别技术已经取得了重大突破,很多经典算法和人脸库相继出现。目前人脸识别系统最高的正确率可以达到99.5%,而人眼在同等条件下识别的正确率仅为97.52%, 人脸识别的准确率已经做到了比肉眼更精准。

我国的人脸识别技术位居世界一流水平。 目前,世界上最高的人脸识别正确率即由我国团队创造。2016年的ImageNet大规模视觉识别竞赛中,中国团队大放异彩,商汤和港中文、公安部三所、海康威视、南京信息工程大学包揽了各个项目的冠军。同时由于我国人口基数大的特殊国情,政府和产业对人脸识别技术具有较为迫切的需求,推动了我国的人脸识别商业化进程走在世界前列,人脸识别技术和产品已被应用于政府、军队、银行、社保、电子商务、安防等领域。

与其他生物特征识别技术相比,人脸识别技术在实用性方面具有独到的 技术优势 ,主要体现在以下方面:

1、非接触 :人脸图像的采集不同于指纹、掌纹需要接触指掌纹专用采集设备,指掌纹的采集除了对设备有一定的磨损外,也不卫生,容易引起被采集者的反感,而人脸图像采集的设备是摄像头,无须接触。

2、 非侵扰 :人脸照片的采集可使用摄像头自动拍照,无须工作人员干预,也无须被采集者配合,只需以正常状态经过摄像头前即可。

3、 友好 :人脸是一个人出生之后暴露在外的生物特征,因此它的隐私性并不像指掌纹、虹膜那样强,因此人脸的采集并不像指掌纹采集那样难以让人接受。

4、   直观 :我们判断一个人是谁,通过看这个人的脸就是最直观的方式,不像指掌纹、虹膜等需要相关领域专家才可以判别。

5、  快速 :从摄像头监控区域进行人脸的采集是非常快速的,因为它的非干预性和非接触性,让人脸采集的时间大大缩短。

6、 简便 :人脸采集前端设备——摄像头随处可见,它不是专用设备,因此简单易操作。

7、 可扩展性好 :它的采集端完全可以采用现有视频监控系统的摄像设备,后端应用的扩展性决定了人脸识别可以应用在出入控制、黑名单监控、人脸照片搜索等多领域。

1.3、人脸识别分为两种模式四步流程

我们把人脸识别总结为两种应用模式和四步流程。两种应用模式包括1:1比对和1:N识别:

人脸验证技术(1:1比对)。1:1 的定义是一个判断的作用,使用人脸识别技术计算出拍摄对象与数据库中两个人脸的相似度,应用的场景包括金融、人证、手机解锁等。目前支付宝、银行刷脸取款的人证比对、智能手机解锁使用的都是1:1人脸识别。以iPhone X的FaceID为例:首先用户需要开通该服务,将人脸信息存储在iPhone X当中;开通之后,在解锁、支付中就可以使用Face ID,所以Face ID并不需要识别很多张脸,而只需要识别机主的人,或者其他授权的人。

人脸检索技术(1:N识别)。1:N 识别首先需要把众多的人脸存储在一个数据库里面,之后把识别到的对象特征与数据库中N个人脸信息进行对比匹配。1:N识别多用于安防、刑侦等政府公安部门。

我们把人脸识别技术划分为四个步骤,依次是人脸检测、活体检测、人脸特征提取和人脸匹配识别:

人脸检测 :在一个动态的视频流或者图像中当中检测到人脸的位置,这涉及到将人像从运动变化区域分割出来。例如一个人在镜头前出现,如何把人脸从静止的建筑、运动的车辆等背景中提取出来。动态人脸检测使得人脸识别技术可以在实际场景中实现非配合式快速处理,可广泛应用于地产、安防、交通等领域。

活体检测 :用户根据系统指令交互式配合做出所要求的姿态、动作或表情,比如眨眼、左右摇头、张嘴闭嘴等来判断用户是否是活体用户,另外更进一步还会利用三维建模技术加强防伪攻击的能力。

活体检测是为了防止静态图像破解,国内多个知名APP中的人脸识别都采用了该项技术。以互联网三巨头BAT为例,百度使用自身研发的活体识别技术用在百度钱包账号找回功能,在刷脸的过程中需要眨眼睛完成识别;支付宝的技术支持来源于旷视科技,刷脸功能用于账户登录中,整个识别过程中不需要任何动作即可完成识别,旷视科技已经实现在静默状态对关键点实时标注和检测,判断活体,对照片攻击、切换攻击、面具攻击、遮挡攻击的防御;腾讯系微众银行使用腾讯自研技术用于微众银行开户中,活体检测需要镜头前的开户者读一段数字,采用语音识别配合的方法完成活体检测。

人脸特征提取 :人脸特征提取是指对人脸进行特征建模的过程。当找到人脸位置的时候,仍然会有许多问题的存在,包括角度不同、逆光、弱光、模糊、眼镜、局部遮挡等情况出现。因此在进行人脸识别前,为了提高识别率,需要先对得到的人脸进行预处理把图像质量提高,包括灰度校正、光线补偿、直方图均衡化等。在此之后才会对整个人脸热证进行建模,目前人脸识别技术中使用的人脸特征主要包括视觉特征、人脸图像变换系数特征、人脸图像代数特征等。

人脸匹配和识别 :利用上一阶段提取到的人脸特征,与数据库里面存储的特征模板进行搜索匹配。在产品化时,通常会预先定义一个阈值,当相似度超过该阈值时,则会输出匹配结果。目前实验室级别都可以达到99%的准确率,但拿到外部环境下,在外接因素干扰下有可能准确率变为0。

二、核心技术:深度学习和3D视觉是助推器

2.1、从实验室到落地应用,人脸识别商业化道阻且长

长久以来,技术创新不足、应用推广有限、价格成本高企是制约人脸识别发展的三大因素。研究人脸识别算法优化、轻量化的团队较少,算法的优化尚未完成,在功耗小的情况下保持一定的速度和精度是人脸识别应用发展的难点。因此最近几年人脸识别虽然被广泛应用到出入境通关、机场安检等政府部门中,但一直没能真正进入到更广泛的商业化应用领域中。

第一,在技术层面上, 人脸识别的精准度和核心算法的原始创新不足、技术标准制定还不完善,快速准确完成人脸识别需要解决很多技术上的难点:

自身生理变化。 在人脸比对的过程中,如果自身与数据库里面存储的人脸发生了较大的生理变化,例如经历剃须、换发型、戴眼镜遮挡等变化。即使外貌并没有发生太多变化,人通过脸部的变化产生很多表情,都有可能会引起比对失败。

外部环境影响。 人脸受到很多外部因素的影响:在不同的角度进行拍摄,人脸的视觉图像相差很大;容易受到光照条件影响,比如白天和黑夜、室内和室外的光照存在较大差异。

除了这两种情况,还有人为的整容行为、双胞胎等极端情况存在。如何规避这些外因对于人脸识别速度和识别效果的影响,一直都是科研的重点研究方向。

第二,应用方面上, 人脸识别基本局限在公安部门出入境管理等政府部门中,未能渗透到大规模商业级别应用和个人消费级别当中。在应用层面上,尽管在实验室等科研条件下,许多人脸识别技术的精准度已经达到99%、甚至99.5%以上的水平,但是这些技术和方案很难落地到实际应用层面上。人脸识别技术落地的过程中,需要考虑到不同的场景运用。在实际落地过程中,指纹识别等其他生物识别由于技术成熟,不易受到外界因素影响,早已经运用到考勤认证、智能手机账号登录中,可替代物的成熟发展也制约了人脸识别产业化的进程。

第三,价格方面, 市场竞争不足和技术不成熟导致价格处于高位。由于技术不成熟,人脸识别技术并未应用到商业场景和消费级领域,大部分被运用到政府和公安部门,且采用系统集成的方式交付,一套系统的成本和价格非常高昂。

但近几年来,这一情形开始转向,三大问题正在逐渐得到解决。

技术: 深度学习算法的成熟,使得人脸的准确率得到大幅提升。以深度学习算法为基础的计算机技术的进步,为人脸识别提供了强大的计算和分析工具。反过来,巨量的生物特征数据也为机器训练提供了丰富的素材,“大数据成为人工智能的燃料”。人脸识别方面,Face++团队创造了世界上最高的人脸识别正确率,曾在人脸检测FDDB评测、人脸关键点定位300-W评测和人脸识别LFW评测上,接连拿下了三项世界第一。

应用: 目前,生物识别的应用场景已经极大地拓宽。银行在客户身份核验场景下应用生物识别,覆盖了弱实名电子账户开户、结算账户开户和存取款等不同风险层级的场景。第三方支付和手机银行等移动支付应用开始使用生物识别方案。公安部门在视频监控和多类场所的人员进出管理中大力引入人脸识别技术。在政策推动下,人脸识别也已入驻社保、教育、医疗系统。近几年,国内智能手机消费剧增,手机用户的移动支付习惯逐渐养成,智能家居渐受青睐,三方面个人消费需求的增长推动手机端的消费级人脸识别开始爆发。

价格: 人脸识别设备近两年不断下降,汉王的500人规模人脸识别考勤机在2009年第一代推出时价格超过4000元,2010年第二代推出时已降至3000元左右,2012年第三代推出时进一步下降到2700元左右。

近年来,技术的进步和算法的改善让人脸识别技术迈上一个新的台阶,在国家政府推动和政策支持下,我国人脸识别技术和应用都取得了非常大的进步。受益于三大问题的逐步解决,国内人脸识别产业正迎来前所未有的发展机会,其应用范围和市场规模有望实现快速扩张。

2.2、驱动因素之一政策推动

国家政府部门的政策支持,为人脸识别的技术发展和商业落地提供了良好的环境。 我国推出系列支持政策,把人工智能提升到国家战略层面,并于2016年、2017年推出《互联网+人工智能三年实施行动方案》、《新一代人工智能发展规划》,对人工智能予以高度重视。人脸识别做为人工智能的应用方向之一也获得了国家政府的高度重视,尤其在社会治安保障上和金融效率加强和安全提高上皆有相应的政策支持,2015年人民银行就已经明确表示允许有条件的银行探索生物特征识别技术做为核验手段。

2.3、驱动因素之二技术升级

近红外人脸识别与可见光技术的结合、3D结构光、深度摄像头的发展都给人脸识别技术带来了技术革新。

1)、近红外人脸识别解决环境光线影响

如果使用普通的可见光图像进行识别,那么会容易受到环境光线变化的影响,因此在识别过程中往往需要采用预处理算法对光照进行处理。在光照预处理的过程中虽然能一定程度上消除光照的影响,但同时也会使图像损失一部分有用的信息。近红外人脸识别是为了解决光照问题提出的解决方案,使用强度高于环境光线的主动近红外光源成像,配合相应波段的光学滤片,可以得到与环境光照无关的人脸图像,人脸图像只会随着人与摄像头的距离变化而单调变化。

当人与光源距离不变时,近红外人脸图像非常稳定,因此近红外人脸识别非常适用于配合式处理的海关和自助通关系统中。近年来近红外人脸识别被广泛应用到如“深圳-香港生物护照自助通关系统”、“澳门-珠海生物护照自助通关系统”、“北京机场T3航站楼自助通关系统”等均取得了很好的效果。

虽然近红外人脸识别对比传统可见光人脸识别有了明显优势,但是这种办法也存在一些问题:第一,近红外主动光源会在眼镜上产生非常明显的反光,降低定位眼睛的准确度;第二,目前的大量视频和照片采用的相片都是可见光下采集的数据,因此不能用于逃犯追踪等场景;第三,近红外对距离有一定的限制,当人脸离摄像头较远时会影响精度。

2)、三维可形变模型解决姿态和表情问题

三维可形变模型用于解决人的姿态和表情变化的问题,具体是把输入的图像构建成一个三维的人脸模型,然后根据关键点的位置用三维模型把姿态扭转过来。当转至正面后,把这个表情进行归一化处理,变成一个中性的表情,最后输出的结果才进去人脸识别比对。3D可形变模型能够解决在大姿态、多表情的条件下人脸识别的准确率。

2.4、驱动因素之三算法改善

深度学习算法的突破大大促进了人工智能和人脸识别技术的发展,提高了识别的效率和精确度。 深度学习本质上是一种算法,通过模拟大脑的神经网络,使得计算机在某种程度上能够像人脑一样思考,它的主要特点是通过多层次的学习而得到对于原始数据的不同抽象程度的表示,进而提高分类和预测等任务的准确性。深度学习的概念源于人工神经网络的研究,是让计算机模拟大脑皮层神经网络的运作模式,达到计算机自己学习的目的。目前统治性的方法是Berkeley在2014年提出的全卷积网络(FCN),这个方法使得神经网络具有了有强大的结构化输出能力。

过去几年深度学习神经网络在解决人脸识别、语音识别、自然语言处理等诸多方面表现出非常好的性能,甚至能推进到很多中期和初期视觉理解问题上。

相对比以往的人脸识别,深度学习算法推动的人脸识别有以下巨大变化:

准确率更高。 应用深度学习算法的人脸识别技术,可以从原始数据中提取具有更高阶、表达能力更强的特征,这些特征往往使得分类效果更好,从而使得识别分类对象的准确率更高;

环境适应性更强。 同样是环境特征的提炼,深度学习算法可以自行提取更丰富、更适合的特征参数,从而达到更强的抗环境干扰能力。这意味着深度学习的人脸识别可以应用到更广泛的环境当中;

识别种类更丰富。 理论上只要有足够多的样本进行训练,深度学习能够实现比较精准的目标分类识别,自主特征识别的特点,又让深度学习特别适用于抽象、复杂的关于人的特征、行为的分析领域。

随着Facebook、Google、百度等科技巨头纷纷开源其深度学习框架,开发者可以在框架上建立自己的深度学习框架。 从2015年1月Facebook开源了自身的一个关注深度学习的开源软件项目Torch后,各大涉足人工智能领域的IT巨头谷歌、Facebook、IBM、微软、百度、雅虎等争相开源。科技巨头开源深度学习降低了人工智能应用的门槛,有助于产业的蓬勃发展。

深度学习发展推动下,众多人工智能创业公司搭建起深度学习框架。以商汤科技为例,商汤科技的深度学习框架包含以下三个主要部分:

高性能异构分布式平台: 分布式深度学习平台支持深度学习模型与算法的定制扩展,支持大量通用CPU,GPU或者CPU,GPU混合分布式运算。

深度学习并行训练集群系统: 由专为SenseTime深度学习定制的硬件平台以及针对硬件平台深度优化的软件组成。支持多机器多GPU分布式深度学习模型训练,极大提升了训练和迭代模型的速度。

高性能算法库: 包含了深度神经网络在内的各种机器学习算法与数学和图像处理算法;相对行业内开源平台库,带来2-5倍的性能提升。

Face++则使用完全自研的训练引擎“MegBrain”。除了核心引擎,Face++的体系结构组还搭建了一个强大的深度学习平台Brain++来管理庞大的GPU集群,完成数据标注和管理、模型训练、GPU集群中心化管理、产品化发布的自动化流程。

2.5、iPhone X 3D人脸解锁带来下一个技术风口

1)、解析苹果iPhone X人脸识别技术

与其他所有已存在的智能手机解锁和人脸识别产品不同,苹果iPhone X使用的3D解锁技术。 人脸解锁技术包括2D解锁和3D解锁 2D解锁 主要为软件级别解锁,运用非配合式活体和简单深度信息进行解锁; 3D人脸解锁 技术主要采集可见光影像叠加红外光深度影像,或侦测红外光投影光点变化。iPhone X运用3D双重结构光解决2D解锁的攻击,如过滤照片、视频。3D结构光解锁是还原级别的技术,可以过滤2D的信息。

对比小米Note 3和苹果iPhone X的人脸解锁,苹果iPhone 8采用结构光3D解锁技术,而小米采用的是单射2D解锁技术。两个产品的差异在于其底层技术的差异。3D技术通过结构光扫描信息还原人脸,2D技术不需要经过扫描信息并建模的复杂过程,两种技术的精确度相差不大。

根据2017苹果发布会的信息,iPhone X实现人脸解锁功能的组件可以分为前端的深度摄像头(包括红外镜头、点阵投影器、反光感应元件和前置摄像头四个组件)和配备A11生物神经网络引擎芯片。

前端:采用深度摄像头

iPhone X的FaceID人脸解锁运用的是3D 结构光技术。苹果iPhone X将整个系统称之为原深感摄像头(TrueDepth Camera System),包含四个重要部件:红外镜头(Infrared camera),点阵投影器(Dot projector),反光感应元件(Flood illuminator),前置摄像头(Front camera)。

点阵投影器将3万多个红外光侦测点投影在脸部,以3D形式记录和识别用户面部,绘制独一无二的面谱深度图,并将其存储起来。解锁时,iPhone X红外镜头投射出人脸看不见的红外光,并读取用户脸部的3D点阵图案、捕捉其红外图像、发送至处理器确认是否匹配,图片相近,即可解锁成功。整个系统除了能用于Face ID人脸验证,也可以扩展自拍功能,实现动画表情发布,和AR效果叠加。

后端:配备A11生物神经网络引擎芯片,人脸解锁达到毫秒级别

为了更好更快地完成实时面部数据比对,苹果根据A11芯片的能力专门构建了A11生物神经网络引擎,为人脸识别提供了足够强大的计算能力,从而让面部录入和解锁的过程顺畅而快速。神经引擎使用双核设计,每秒运算 6000 亿次,面部数据都由A11引擎在本地处理,使得人脸解锁速度可以达到毫秒级别。

A11芯片采用6核心设计,6个CPU内核可以同时使用,包括4个名为“Mistral核”的能效核(4*2.5Ghz)和2个名为“Monsoon”性能核,都具备独立寻址能力。A11里内置了苹果自研的3核GPU,可用于辅助人脸识别、语音识别等 AI 应用。

2)、三种3D感应技术

目前3D感应有3种主流方案:结构光,飞行时间(TOF)以及双目测距。

结构光(Structured Light): 结构光投射特定的光信息到物体表面后,由摄像头采集,这些光斑打在物体上后,因为与摄像头距离不同,被摄像头捕捉到的位置也不尽相同。根据物体造成的光信号的变化来计算物体的位置和深度等信息,进而复原整个三维空间。苹果iPhone X人脸识别技术即是采用了3D 结构光技术。

飞行时间TOF(Time Of Flight): 通过专有传感器,捕捉近红外光从发射到接收的飞行时间,判断物体距离。TOF的硬件实现方式和结构光类似,区别只是在于算法上,结构光采用编码过的光信息进行投射,而TOF直接计算光往返各像素点的相位差。此技术被微软用在了第二代的Kinct上。

双目测距(Stereo System): 原理类似人的双眼,在自然光下通过两个摄像头抓取图像,通过三角形原理来计算并获得深度信息,目前的双摄像头就是双目测距的典型应用。在移动设备上的应用较少,多用在户外机器人。(来源:雷锋网)

由于双目测距技术受限条件较多,不能在黑夜中使用,所以商用的3D深度视觉包括飞行时间和结构光两种技术。下面我们重点分析前两种3D深度视觉技术的特点。

结构光

3D 结构光双摄技术原理是主动发射特定红外结构光照射被检测物体,从而获取人像的3D 图像数据。这项技术将可以抵御目前所有的人脸识别破解手段,包括屏幕翻拍照片、翻拍视频、纸张打印、相片打印、立体模型等。

3D结构光的硬件目前由苹果公司垄断,苹果公司通过在2013年收购以色列公司PrimeSense获得此项技术。2005年PrimeSense在以色列成立,2009年E3大展微软发布了获得PrimeSense芯片授权的Kinect一代。2013年11月,苹果宣布3.6美元收购PrimeSense,此后PrimeSense再也没有对外发布过任何产品和技术。

PrimeSense主要提供传感器和中间件,可以让设备感知周边的三维环境,实现人机交互。这种技术用于前置摄像头,可以为拍照、背景虚化、人脸识别、手势识别带来便利。原理如下图所示,首先向空间投影一定图案,传感器获取反射回来的图案,与原图进行对比生成深度图。

在专利方面,苹果在15年获得人脸识别解锁设备的专利,特意保护红外传感器的使用。17年获得一项关于利用景深地图信息进行人脸识别技术的专利,其中提到采用特殊的红外线将将光辐射图投影到场景上,然后将其转换为深度图。如果在一个场景中如果出现了多个人时,可以根据不同人距离镜头距离的不同而识别面部。

飞行时间(TOF)

3D飞行时间(ToF)技术是计算光线飞行的时间:实现让装置发出脉冲光,并且在发射位置有个仪器接受目标物的反射光,飞行时间产生的时间差可以算出目标物的具体,从而创建人脸或者物体的3D深度图。

结构光和TOF两类技术特色各有千秋 。 两者都是利用了主动光源的技术,主动发射红外波段光源,照射场景,再根据反射回的成像来计算深度。结构光的优势在于技术成熟,深度图像分辨率较高,不需要特制感光芯片,只需要普通的CMOS感光芯片,让成本大大降低;但是缺点在于容易受到光照影响;TOF方案抗干扰性能好,深度精度和扫描速度更好,但是芯片并不成熟,集成难度高,成本短期内难降低。因此结构光方案是当前最为合理的智能手机3D感应技术,TOF则是未来发展方向。

三:技术取得突破,人脸识别遍地开花已是大势所趋

随着技术的突破,人脸识别技术的应用场景已经不仅仅局限于早期的政府部门和安防领域中,近年来人脸识别解决方案和应用软件出现在银行、考勤门禁等商业级领域。2017年,苹果、小米、Vivo不约而同推出搭配有人脸识别技术的智能手机,这标志着人脸识别技术真正进入消费级领域中。

3.1、政府安防和公安刑侦率先应用

政府部门包括各地公安、交通、司法部门。随着城镇化建设速度加快,城市人口密集,流动人口增加,引发了社会治安、交通、重点区域防犯罪等问题,如何在茫茫人海中准确定位嫌疑目标,一直是公安刑侦智能化建设的重中之重。安防行业监控领域正在进入数据大爆炸时代,面对井喷式增长的视频监控数据量,只停留在浅层次分析识别的传统智能算法,已无法满足深层次数据价值挖掘的需求。市场对更深层次的人脸识别和智能监控急切需求,因此,人脸识别和人工智能在安防行业的落地水到渠成。

把人脸识别技术配备在智能监控系统上,是前后端浅层次智能安防模式的升级,前端通过 GPU 运行算法,进行视频的采集,后端利用大数据,进行分析和检索等,可以协助公安刑侦部门在大量的监控视频和图像中识别嫌疑人。在以往的一些案件中,比如2012年在南京发生的“1·6”抢劫案和“8.10重庆枪击抢劫案”(周克华案),警方都动用了上千的公安干警进行原始的视频数据人眼搜索,严重影响公安部门破案的进度和效率。而通过人脸识别自动查找、识别视频信息的优势显而易见,相关技术在该领域的应用前景非常巨大。目前国内的上市公司如东方网力、海康威视、大华股份等均在人脸识别技术进行深化和改善,更加快速地在视频和图像中识别对象。

在人脸识别技术的帮助下,许多长期未能破案的案件得以结案。以大华股份和依图科技为例,大华股份在2011年开始把人脸检测和识别技术应用到自身产品中。2014年大华股份推出人脸检测智能iDVR新品,让人脸识别落地在安防产品中。在人脸识别算法和结构化数据基础设施的不断完善下,大华股份把深度算法网络加深到上百层,于2016年推出了人脸识别服务器 DH-IVS-F7300 天眼系列,能完成人脸实时抓拍、建库、比对等功能;2015年底,经过依图人像n:N系统的比对筛查,挪用公款潜逃15年涟水县银行储蓄所原主任何东升被依法逮捕,依图科技经过人像筛查比对最终锁定其在山东济南某小区。

3.2、商业级别初具规模,正在加速落地

机场安检

人脸识别技术运用在国内机场中的探索可追溯到10年前,2016年开始大规模应用,2017年全面爆发,大部分国内一二线城市国际机场已经配备了人脸识别技术强化身份认证。

总结起来,人脸识别在国内机场的应用整体可以分为两个阶段:

第一是探索阶段,人脸识别技术从实验室向机场落地阶段,国内机场在2009年首次应用人脸识别技术到2016年一共经历了7年的探索阶段:

如前文所述,前期的人脸识别技术大多停留在实验室或者刷国际人脸识别榜单的技术阶段,仍然面临着不能应用到实际场景中等问题。其中一个临界点是2011年美国发生911事件后,华盛顿考虑在机场出入境使用生物识别技术强化身份认证和黑名单管理,拉开生物识别技术在机场应用的帷幕。

但是在这一阶段,传统的人脸识别技术效果并不理想,远远不能满足机场对识别速度、准确率、抗干扰性等各方面的要求。技术与实际使用需求之间的脱节,导致人脸识别技术久久不能在机场应用中落地。

2014年。“马航”时间中两名乘客使用国际刑警组织数据库里的失窃护照登上国际航班。由于人脸识别技术可以辅助在视频监控、安检、登机环节分级校对身份,这再次推动机场和航空公司对生物识别技术的应用高度重视,

第二是大规模应用阶段,得益于深度学习算法的介入,识别率大幅上升:

深度学习算法在2006年重新兴起,在人脸识别上的效果飞速上升,推动技术从实验室走向业界。2014年7月,南京机场首次将人脸识别技术用于机场登机,但仍然不能实现自动通关。

2016年7月,深圳宝安机场首次将人脸识别系统嵌入到机场安检信息系统。标志着人脸识别技术已经被机场所接纳。2017年,人脸识别技术在机场中安检通关的应用急剧增加,呈现井喷态势。

金融

金融领域的应用主要体现在三点,第一是银行监控,需要计算机主动提前识别网点的异样信息,这与政府领域的安防监控应用类似;第二是人脸识别在银行、证券远程开户上的应用。在远程开户时,金融机构可以通过智能终端在线上进行身份鉴权验证,使用人脸识别技术开户可以极大提升业务办理的安全性、时效性,并节省大量人力;第三是刷脸取款,在这方面人脸取代了银行卡,只需要人脸+密码即可完成取款。在前两个方面,人脸识别技术已经被国内各大银行广泛采用,刷脸取款方面,农行和招行抢先一步在ATM上线了刷脸取款功能。

另外,使用人脸识别技术后,人脸数据在金融行业沉淀了大量数据,将这些人脸数据结合大数据可以实现金融系统征信实时监测,还可以通过人脸识别实现VIP迎宾和精准营销等服务优化,实现构建无人值守的智能网点。

云从、旷视、商汤和依图,是国内人脸识别技术在金融行业应用最早和最为成熟的企业。国内银行人脸识别和刷脸取款的技术支持大多数是从这四家中选择。目前国内银行中把“刷脸取款”在全国范围内大规模应用的只有农业银行和招商银行。

农业银行: 农业银行的合作对象是云从科技,目前刷脸取款服务则覆盖了全国2万多个分支机构,深入到县乡镇。云从科技为农行ATM机提供红外双目摄像头,摄像头通过同时采集红外光和可见光作为输入数据,通过红外成像、立体成像检测、红外与可见光成像匹配识别,分析人脸皮肤的纹理及微小动作带来的规律变化,实现人脸识别和活体检测。

招商银行: 招商银行人脸识别技术服务商为依图科技,目前刷脸取款功能已经在全国106个城市近千台ATM机上实现。依图为其提供自主知识产权的双目活检技术,在1秒内就能完成活体检测和人脸识别,还可以适应不同场景环境,真人通过率达到99%时,异常情况拒绝率达到99.99%,同时进行手机号码验证、密码验证三层防护。

3.3、消费级应用即将爆发,应用场景日趋多元

互联网+

人脸识别技术在互联网领域得到了广泛应用。商汤科技通过深度学习算法,在新浪微博“面孔专辑”功能实现人脸检测并且分类;旷视为美图旗下的美图秀秀 App 、美颜相机、美颜手机等一系列软硬件产品提供了人脸识别技术支持。其中美图秀秀和美颜相机 App 通过 旷视(Face++) 的人脸检测和关键点检测技术,可以在图像中精准定位人脸和五官位置,从而进行人像美白、五官美化等处理,快速完成精准修容。

新零售&支付

人脸识别技术也被应用在新零售领域,推动着无人零售的发展与实现。2017年9月KFC与蚂蚁金服合作在其第一家升级店K PRO采用人脸识别系统等技术,消费者微笑就可通过人脸识别系统完成支付。店内没有设置点餐台和收银员,消费者到店点餐不仅可以通过设置在门口的自助点餐机点餐,也能通过手机扫描餐桌上的二维码自助点餐、支付。

在未来,人脸识别技术还可用于客流统计、消费者心理和行为分析。通过客流统计数据,分析不同区域、通道的客流和顾客滞留时间,与销售业绩报表结合,可以分析顾客购买行为,顾客性别年龄组成。

智能手机

人脸检测和分类技术早已经被运用到智能手机应用中,例如OPPO、小米等手机中,应用了商汤的人脸聚类功能,云端存储照片将被自动分类,避免了手动分类照片的繁琐操作,优化了用户体验。

2017年苹果、小米、Vivo等智能手机厂商不约而同地在新上线的新机型中搭配人脸解锁功能。除了可以应用到解锁功能,苹果FaceID人脸识别还可以取代以往TouchID指纹识别的功能,包括身份验证、支付等。在安全性方面,根据苹果官方消息,被相同指纹破解 Touch ID 的概率是五万分之一,而遭遇相同的面部能破解 Face ID 的概率则是一百万分之一,安全性提升 20 倍。众多手机厂商在人脸识别的布局,有望引爆人脸识别消费级领域的爆发。

总而言之,除了政府、安防、公安、金融之外,互联网、消费电子、汽车电子、零售、医疗、教育等诸多领域都在逐步引入人脸识别,人脸识别正在逐步渗透进消费级领域方方面面。

四、群雄逐鹿,巨头和创业公司谁能问鼎?

目前从事人脸识别技术的公司包含三类:工业巨头、互联网巨头和创业公司:

硬件巨头: 直接面向某一特定领域,在该行业已经有较长时间的积累,例如安防领域的海康威视、大华股份、苹果、华为等;

互联网巨头: 这些公司拥有人脸识别的底层算法和专利,在此基础上开发技术服务,例如Google、Facebook、百度;

创业公司: 从事人脸识别和人工智能技术服务的创业公司。

4.1、未雨绸缪,国内外科技巨头已提前布局

从终端厂商来看,苹果、三星、华为、Facebook、谷歌的多项专利显示,各大终端巨头都在纷纷布局人脸识别技术。各家科技巨头主要是采用自研为主,并购为辅的发展战略。

外延并购: 苹果在人脸识别的应用专注于手机端,先后收购 PolarRose,PrimeSense,Perceptio,Faceshift,Emotient,Turi 等人脸识别相关技术公司;Facebook2012年收购了以色列脸部识别公司Face.com。我们总结了国外巨头公司近几年在人脸识别领域及其上下游发生的外延并购。

自研技术: 谷歌在 2012 年获得人脸识别解锁手机的专利;苹果获得相应专利的时间为2015年。在国内市场,BAT也在人工智能领域奋力竞争,我们以百度人工智能开放平台上人脸识别为例,百度的人脸识别技术已经形成从基础层到场景应用层较为完整的产业链条。

在基础层,百度拥有自己的分布式深度学习平台PaddlePaddle;

在技术层,百度的人脸识别已经较为成熟,功能包括人脸检测、人脸比对、人脸查找;

在场景应用层,百度人脸识别产品已经落实到实际商业应用中,提供的技术和产品包括人脸核身、人脸会场签到、人脸会员识别,并且已经有搭配人脸识别的智能产品面世,例如人脸闸机、CuerOS智慧家庭。

4.2、融资、技术、应用领域、 客户四个角度剖析创业公司佼佼者

1)、资本市场活跃

把深度学习算法运用到人脸识别上目前走在最前列的是百度等互联网公司。同时,很多创业型企业技术也不弱,比如商汤科技(Sense Time)、旷视科技、依图科技、云从科技四家独角兽公司。这些公司无论是从技术上还是从应用能力上都相对成熟,获得了资本市场的高度重视。下面对比四家人脸识别独角兽公司的技术和应用场景。

2)、技术团队多来自高校科研人才

在技术团队上,未来3-5年在人脸识别领域的竞争是技术人才之间的竞争。经过对比我们发现,大多数人脸识别的独角兽公司的技术团队都具备高校科研经历,这些技术人员在前期中积累了大量的计算机视觉、人脸识别、深度学习和人工智能的专利。

旷视科技

旷视科技技术人员来自清华大学、美国哥伦比亚大学、斯坦福大学、微软亚洲研究院等国际顶级院校、科研机构,以及来自谷歌、阿里巴巴、华为、微软等跨国企业的一流团队。旷视提供的技术包括动态人脸识别、在线/离线活体检测、超大人像库实时检索、证件识别、行人检测、轨迹分析,技术功能全面且强大。

商汤科技

商汤科技联合创始人汤晓鸥是香港中文大学教授;曾于微软亚洲研究院担任视觉计算组主任;担任多个重要国际会议的主席,包括计算机视觉最顶尖的国际会议ICCV和CVPR,在人工智能、计算机视觉和人脸识别领域有权威地位。

商汤的技术人员多来自于高校,拥有亚洲最大的深度学习研究团队,包括18名教授,以及来自麻省理工学院、斯坦福大学、北大、清华等世界名校的120余名博士生。 此外,商汤科技已与香港中文大学、清华大学、浙江大学、上海交通大学等众多高校院所建立了合作,其中与香港中文大学、浙江大学分别建立有联合实验室。

在ImageNet上,商汤在2014年取得第二,仅次于谷歌;2015年取得两项世界第一;2016年,商汤最新的算法误识率达到千万分之一,等效7位的数字密码。另外,商汤科技在CVPR、ICCV和ECCV三大计算机视觉学术会议上发表的论文数量位居世界前列。

云从科技

云从科技是专注于计算机视觉与人工智能的高科技企业,核心技术源于四院院士、计算机视觉之父——Thomas S. Huang黄煦涛教授,有中国科学院和上海交通大学两个支点提供强大技术力量支撑,拥有“双层异构深度神经网络”、“动态场景实时解析”、“自适应实时多目标跟踪”等多项核心技术,以及“云之眼人脸识别服务引擎”、“动态人脸识别系统”等人脸识别智能系统和设备。云从科技目前由上海、成都、重庆三个研发中心,美国 UIUC 和硅谷两个前沿实验室,及中科院、上海交大两个联合实验室组成三级研发架构。

依图科技

依图创始人朱珑美国加州大学洛杉矶分校,获统计学博士,师从霍金的弟子艾伦•尤尔(Alan Yuille)教授,从事计算机视觉的统计建模和人工智能的研究。之后在麻省理工学院人工智能实验室担任博士后研究员,深入研究大脑科学和计算摄影学。依图科技的技术团队来自MIT、Google、阿里巴巴等知名学术和工业机构。

3)、应用领域布局各有侧重

人脸识别在众多领域贬低开花已经是大势所趋,四家独角兽公司凭借先进的技术实习在各自擅长的领域进行深度布局,积累了丰富的客户资源。







请到「今天看啥」查看全文