300 + 明星创业公司,3000 + 行业人士齐聚
全球人工智能与机器人峰会 GAIR 2017
,一 同见证 AI 浪潮之巅!峰会抢票火热进行中。
悄悄提醒一句,
文末有读者专属福利!
雷锋网按:
中国工程院高文院士谈到,监控数据本身就不是给人看的,而是给人工智能。
虽然近些年 AI 算法有着质的突破,但具体落实到安防现实场景中,准确率往往比在实验室里残酷的多。那么人工智能在安防领域的落地究竟到了哪一步?
参照传统安防巨头的实战使用效果比看算法方案商的 DEMO 更有说服力。
近日,由深圳市安全防范行业协会主办、CPS 中安网承办的人工智能安防行业应用暨实战演练论坛中,威富集团董事长张少林、大华先进技术研究院研发总监郑韬、天地伟业总工程师杨清永,深入讲解了三家安防巨头各自在 AI 安防方向的探索与实践。
一、安防实战中的数据挑战
硬盘公司从业者向雷锋网透露,他们生产的硬盘,每两块就有一块进入到安防行业。以北京为例,属于政府和社会公共机构的摄像头总数超过 200 万个,这些摄像头每分每秒都在保持录像,每天会产生长达 200 多万天的录像,折合成年为 5000 多年。所以整个安防体系,从摄像头到存储都是一个拥有极大数据量的网络。
这里提出一个疑问:数据由摄像头产生,那么这些数据是由谁消费?在当前的安防监控视频网络中,绝大部分消费者是监控中心里的工作人员,简单来说就是警方。他们在破案时会去查看很多录像,而数据生产的速度远超过数据消化的速度,这导致今天安防监控行业的一个主要矛盾:我们产生了太多的视频,可这些视频却没办法消化。
威富集团董事长张少林也谈到了传统安防面临的挑战:
1. 被动式应用:监控人员需同时面对数十甚至上百路视频,难以及时发现视频画面中的突然和异常事件,监控视频录像一般只能用于事后取证,且录像查证过程需要耗费大量人力和时间。
2. 数据无法有效利用:海量的视频数据不能进行有效的数据挖掘和深度分析,不仅使得监控系统运行效率低下,而且对视频设备和数据资源也造成极大浪费。
3. 存储压力巨大:海量的非结构化数据,大部分是无用数据,给存储设备带来极大的压力,不仅浪费存储空间,增加存储成本,也不利于数据的快速检索。
目前以视频数据为核心的安防监控体系,确实给客户带来了大量的麻烦。把这些数据放在客户跟前,然后用纯人工去寻找线索好比大海捞针。但随着 AI 的成熟,相比于其他行业,安防行业的两大特性,让人工智能在安防领域有着很大的发挥空间。一是安防的数据基础满足人工智能的大数据特性,视频数据有两大特点:源数据信息量大、数据层次丰富。其次是,安防业务的本质诉求与人工智能的技术逻辑高度一致:
事后追查——事中响应——事前预防
大数据——深度学习——智能判断
所以整个行业都把希望寄托在人工智能上,引进 AI 这个 “消费者”,自动把这些视频数据里面的内容和目标变成结构化数据。何为结构化数据?结构化数据就是数据能够直接表达目标的性状、属性以及身份。这种数据可以大规模去检索,大规模地分析、统计。智能化是希望 AI 能够变成以视频数据为核心的物联网里面,这些数据的 “消费者”,这时候 “消费者” 的 Output 就是结构化数据。结构化数据也不能直接拿来使用,因为这些数据一旦实现了大规模结构化后,数据量仍旧非常庞大。
当人工智能把这么多的录像转变成结构化数据后,就会产生一个新的数据海洋:结构化数据海洋。如果数据没有经过很好的挖掘,那它也不是有意义的情报。结构化数据目前已经可以使用非常成熟的手段去挖掘,这个过程中会有一些非常浅度地挖掘、简单的筛选:如黑名单。检测到一辆车时,车牌号码是一个嫌疑犯车牌号,当检测到车牌号码时,这辆车就被后台预警。再比如说要检测一个人:假设我有一张逃犯的照片,当我在某个地铁站的摄像头里看到一个人长得像这个逃犯时,它可能就变成了一个有意义的情报。当人工智能产生大量的结构化数据后,会有大量空间需要去做针对应用的数据挖掘。因为以前在没有结构化数据时期,不同客户使用的摄像头和录像机都是标准设备,只要看到画面就行。它从画面里观察得到的信息如何体现到它的业务内容,这些事情需要人去做。当今天这些数据变成了结构化数据以后,在不同行业、不同场景要有大量的数据挖掘应用才能够有效地把结构化数据变成有意义的情报。而人脸、车牌均可以看作是垂直场景的针对性数据挖掘。
二、安防实战中的技术挑战
在过去十年中,指纹识别、语音识别、人脸识别、虹膜识别、车牌识别、指静脉识别已经在安防领域有所应用。
相比于其他生物识别技术,人脸识别具有独特的优势。自然无侵扰、直观易判断、简便可扩展,这些条件均为人脸识别的大规模推广应用提供了技术支撑。
人脸识别将在身份查验和布控追逃等诸多应用中发挥巨大作用,智能识别认证合一、人脸自动检测、定位、跟踪、黑名单自动比对、实现标签化存储、检索效率高、节约警力、节省时间。
天地伟业总工程师杨清永深入讲解了人脸识别算法和真实应用场景。
人脸识别可分为警用和非警用两种应用方向,警用包括反恐、刑侦、维稳,民用则是支付、考勤、门禁,二者相比之下警用是最大的应用市场。现在公安对于人脸识别非常感兴趣,因为人脸识别的确对他们工作有很大的帮助。
随后杨清永继续谈到人脸识别在这些场景中会受到影响:
一、相似面部:容易将两张相似的人脸误判为同一个人。
二、光照条件复杂:尤其在强逆光环节下,非常影响人脸识别,大多以补光的方案进行处理。
三、受多变表情和跨年龄识别:如果目标对象面部表情过于夸张,以及一个从年幼到成年脸型发生变化后,机器很难识别出来是一个人。
四、脸部大面积遮挡:普通口罩和眼镜的遮挡,较为有限,如果人脸特征遮盖太多,对识别的影响较大。
当然,上述提到这几项难题的研究成熟度也不断在加快。
其中杨清永指出的跨年龄识别方面,百度已经取得了非常好的效果。今年年初,吴恩达率队的百度人工智能在人脸识别跨年龄识别任务中以 3:2 的比分击败《最强大脑》名人堂轮值主席、世界记忆大师王峰。
这其中 Cross-Age Face Identification(跨年龄人脸识别)就是一个难度较大的挑战,在第一个节目设置中,需要识别对象的年龄跨度大概为 20 岁。在第二个节目设置中,对比小学毕业照和成年照,年龄跨度也高达十几岁,而且第二个节目设置中的人脸数达到了 1500 个以上。
最终,小度的表现非常惊艳,
这里,在稀疏的数据集上学习到更好的特征,保证跨年龄的同一个人的两张人脸的距离,比不同人相似年龄的两张人脸距离小就是关键。
一般而言,在跨年龄阶段人脸识别中,类内变化通常会大于类间变化,这造成了人脸识别的巨大困难。同时,跨年龄的训练数据难以收集。没有足够多的数据,基于深度学习的神经网络很难学习到跨年龄的类内和类间变化。
百度 IDL 人脸团队选择用度量学习的方法,即通过学习一个非线性投影函数,把图像空间投影到特征空间中。在这个特征空间里,跨年龄的同一个人的两张人脸的距离会比不同人的相似年龄的两张人脸的距离要小。
考虑到跨年龄人脸的稀缺性。用大规模人脸数据训练好的模型作为底座,然后用跨年龄数据对它做更新。这样不容易过拟合。
将两点结合起来做端到端的训练,可以大幅度提升跨年龄识别的识别率。
得益于百度拥有两亿量级的训练数据,才能在跨年龄识别方面取得不过的效果。除此之外,比赛过程对工程要求也非常高,这些条件均是国内绝大部分公司难以比拟的。
而保证上述人脸识别准确率的关键就是深度学习。
三、安防实战中的额外挑战
大华先进技术研究院研发总监郑韬谈到,人脸识别能在近些一年呈井喷式发展,无疑离不开深度学习的支持。深度学习首先要满足以下三大条件: