分论坛:3C智造未来
时间:2017年6月21日上午
地点:中国·杭州JW万豪酒店
主讲人:郑韬 大华股份先进技术研究院研发总监
大家好!今天我讲一下人工智能和安防行业的关系,大致说一下人工智能的简单历史,以及人工智能在安防行业的情况。
首先看一下人工智能到底是什么。国内国外很多学者都会这样定义,人工智能到底是什么,能够做什么,或者是它将来会发生什么。我对于它的理解,人工智能是帮助机器去认识世界、理解世界、改变世界的一个工具,一个软件的算法。
在把人类分成物质和意识两方面来看,我们人类在物质上面,人类历史已经走的非常远了,从最开始人类使用火、使用耕田的犁等工具去改变世界,去种植粮食,用牲口,譬如用牛等等来帮助人类提高物质力量,来解放和提高人类的生产力。从这些方面,人类在几千年前就已经做的非常好了,在最近几百年通过了几次工业革命,通过制造了大型的机器,我们用了石油、电等工具之后,把机器引入了人类的发展,它提高的生产力远远超过几千年一直以来人类发展的水平。相比之下,意识、精神方面的发展略微要晚于物质力量这方面。从孔子把自己的话教给弟子,以口述的方式,然后弟子记录下来,这就是一种书本,形成了《论语》。慢慢到了19世纪初左右,我们有了各种IT类的产品,比如电影、唱片,一些数字化的工具来记录人类的知识,颠覆了课本。接下来到了最近的21世纪左右,我们人类发展出了互联网,把IT数字的信息都汇聚到一起,这些数据信息爆发之后,人类需要一些东西帮助我们处理这些数字化的东西,那必然是AI。所以AI重要性到底在哪里?AI重要性相当于大家用的电、开的车、飞机、轮船等等,会非常大的改变我们人类生活的方式,但并不是所有的,大家现在点外卖的时候交到你手上的那个人,还是用人交到你手上的,只是中间的过程,你下单、打电话等等,这些才会用到机器方面的应用。所以人工智能对于整个类历史来说,它是一个非常非常重要的一点,它是能够像电、机器一样能改变人类历史的,但并不是像有些媒体说的会摧毁我们。
人工智能从认识世界角度来说,它有很多的代名词,在大概上个世纪80年代左右可能是图像处理或者是图像识别,到90年代有小波,后面是神经网络,21世纪是支持向量机,再到后来的深度学习。人工智能作为一个算法,它的效果好、识别准,这些优势能够帮助人类解放生产力,使人类解决以前解决不了的问题,比如AlphaGo打败了柯洁,包括测序基因、很多机器人的算法、用法。所有的这些东西,在很早以前都已经有了,比如下围棋之前,IBM在很早以前有一个深蓝或者更深的蓝这个产品,这个产品打败了国际象棋大师卡斯特洛夫(音译)这个人,但是发现这个算法还不是很好用,后来用了深度学习的算法,用了更先进的机器,更强大的计算能力,在围棋上能战胜世界第一的人类。
为什么现在会有深度学习这个东西出来呢?从一开始每个人都有个人电脑,企业会有企业的电脑等等,最开始大家是不联网的。发现我有这个数据,我有这个信息,我想分享给大家,或者大家的东西我想知道的情况下,至少会有一个需求,这个需求是我要分享,这就是互联网。把这个网络建起来之后,大家想着我把我的电脑放到了网上,全世界都能看到了,我不如把我的设备也放到网上,就是物联网,比如大华主营的摄像头,把摄像头放到网络上去,通过这种形式汇聚到很多数据,数据汇聚到后端、存储,就形成云、大数据的概念,这个时候就发现这么多的设备同时通过网络,不一定是互联网,通过局域网等等汇聚过来之后人没有办法去看,没有办法看就没有价值,就等于零,需要一个机器帮助人们看,这就是AI。这个数据到底有多少呢?在安防行业来说,16年一整年全球有超过3亿万台的设备新装,加上存量一年可能会超过15万亿个小时的安防数据,15万个小时是我们全人类一起去看都看不完的,这个数据非常大。这无论对于我们的客户还是对于任何人来说,安防视频数据如果没有人去看它的价值就是零,因为它就是放在一个硬盘上0和1的编码,它就是一个录像放在硬盘上。当这个数据为0的时候,对于客户来说他花了很多的钱去购买存储,去购买网络,这些硬件它的价值是没有的,他买了一些设备回来,这不是客户想看到的。他想买的是服务,他想看到视频的信息是什么,比如我在马路上装一个摄像头,我不是为了存这个视频,我是要知道这个摄像头所拍的这段路上面每天经过了多少辆车,或者经过了什么车,譬如浙A12345开过了三次,浙A12347开过了四次等等。然后我们再去看所有的浙A12347所有经过的录像、视频、图片,发现它到底是什么原因或者是一辆什么车,发现它是一辆出租车就比较好理解了,但如果发现开过的是一辆无牌车,还有撞击的痕迹,那会联想到是不是偷来的等等,而过去没有办法通过快捷简单的方式去定位到这辆车。
比如像电影的视频,大家看电影的经验肯定比较丰富一些。但说实话,我看安防视频的经验还没有我看电影的时间长,很少有人去看安防视频。在电影里面,我们看到人脸是各种各样的,起码还是比较帅、比较漂亮的,一下子能够看清楚这个人是谁的。或者是互联网的视频,互联网视频量也相对来说比较多,比如直播的视频。这里有一个安防的视频,看起来跟直播视频一样,只是在我们公司模拟下的ATM视频,主要看这些去ATM机的人有没有戴墨镜,可以判断出你是不是被尾随的情况,被尾随的情况比较严重,会发生一些恶劣情形的案件。所以要判断这张视频有没有两张或者两张以上的人脸,同时戴着大墨镜、口罩要做预警。这个量是非常大的,如果没有人工智能,光靠银行的安保人员看这个视频,就像银行那么有钱的也会马上倒闭了。左边是普通安防人脸的监控,再看类似通道场合下进行人脸的抓拍或者是识别所做的布控,一般应用在海关、机场等等一些关键的区域。
(PPT图示)这是大家在电影里面看到的车辆,非常炫酷,没有车牌。这是宣传的车辆,是很好的角度,放在那里摆拍,基本上是静止的。这是安防场景的车辆,在安防场景里面、安防视频里面基本上就是这个角度,做的车牌的大小、角度都不会有太大的不同,因为它必须装在一个6米多高的杆子上面,保证抓拍的角度,保证车牌能够清楚的被识别掉,可以清楚地看到左边那辆车的车牌、车的情况,以及在红绿灯的位置必须同时能抓拍到车辆、红绿灯以及停止线,这样对车牌进行识别的同时,还能够对车的行为进行判断,比如到底是不是在红绿灯的时候跨过了那道停止线,或者不能左转的时候进行了左转弯,来进行行为的判断。
安防视频还有一个和电影不一样的地方,就是背景。安防场景的背景就像左边我们看到的那个,不会变,就是一个很无聊的路面,没有一个目标经过,也可能很多人经过,比如上下班的路很多人经过,一天大部分时间都是这样控制的。而电影不一样,电影不停地变换背景,基本上一秒钟变一下,给大家很刺激的感官,这种感官的刺激对于我们人来说是觉得这个电影很好看,是一个艺术片。对于安防视频来说它就是很无聊、很乏味,如果人长时间观看这个视频会疲劳,疲劳就会造成人看这个视频的时候,比如我看了两个小时以后,就会没有办法正确发现里面运动的目标,或者这个目标所带着的我需要的一些信息。假如说这个人是一个嫌疑犯,我一个人看了这个视频8个小时以后,这个人到底是人还是什么可能都不一定发现,因为那个时候我的眼睛已经闭起来了。
(PPT图示)这个时候看电影的方式是一堆人,起码超过十几个人一起去看一个屏幕。
(PPT图示)这是我们看安防的方式,是一个人坐在那里看一个屏幕,这个屏幕将近10块,但是每一块屏幕里面还做了9分屏,也就是这一个人同时在看超过20个视频,这个观看的人上班的时候一般会看8个小时。这种情况下怎么能够保证他所看的视频里面的所有信息被他准确地捕捉到?这是基本上没有办法做到的。所以在安防行业里面,我们很早就引入了智能化,我们需要智能化,需要机器帮助我们看这些视频,提取视频里面有用的信息,要把人提取出来,把车提取出来,把里面会动的目标预警出来。在很早,安防行业就做了很多智能化的工作,比如简单的数人头,可以计数从上到下或者从下到上人的数量,一般放在旅游行业或者出入口来统计人的流量,在零售业行业的小店门口也有差不多这样的应用。
视频质量诊断,这也是一个非常典型的例子,一般来说一个平安城市的项目会用到上千路的视频,这些视频每天都有一定的几率会坏掉,也有一定的几率被人动了,也有一定几率被雷劈了等等,有很多很多的情况。我如果从运维的角度,从使用这些视频的安保人员的角度,我没有办法每天都去把这1千路视频都看一遍,或者2千路、3千路,这种情况下就需要智能化的算法,需要一个工具把这些视频都看了。然后发现这些视频有什么问题,比如偏色,比如场景变了,可能被人挂了一个帽子在上面,或者是视频丢了等等的情况,我们需要有一个机器帮我们做这样的事情。做完以后,把这1千路视频里面所有有问题的视频做一个报警交给运维人员,运维人员不是每天面对1千路视频,他只要看这报表,然后去电脑上处理一下报上来的10%或者1%的摄象头是不是真的有这样的问题,然后让工作人员去处理一下就可以。这是一个非常典型的,用智能化去解决海量视频的一个情况。
行为分析。传统的算法,把摄像机里面运动的目标,譬如人或者是车,在视频里面划一条线,来判断这个人有没有跨过这条线,或者两次跨过这条线,或者进入这个区域,或者这个区域放一个包,这个包有没有人拿走,一旦拿走就报警。
(PPT图示)高清卡口,这是车头对着我们的场景,我们能够识别更多信息,在这个产品里面可以识别出车的车牌、车的颜色、车系,比如这辆是尼桑几几年款,比如奥迪A4L,是04年款、09年款还是17年款?能够精确地识别到这个。车标识别,就是到底是现代还是尼桑、丰田等等。
电子警察,就像我刚才说的,会在场景下面判断一些车辆的行为,比如他是不是闯了红灯,闯了红灯会有三张抓拍,同时有一张特写抓拍,抓拍你的车牌,保证这个路口所有闯红灯的车辆能够全部抓拍掉。我也不需要交警去看所有的高空镜头监控的高架桥上面是否拥堵,拥堵成什么样子,我只需要预警一下就能够大致判断出来这条路上拥堵的情况。我也不需要让高速公路的维修人员去判断是不是在高速公路上面有抛洒物。我也可以大致判断一下高速公路上的车流量,比如在节假日是不是有一个高峰,它在几点会有一个车流量的高峰,我在上一个卡口或者下一个卡口不让车都上来或者车都下去。
违章停车,这个大家体会可能更深刻一点,因为杭州这个城市拥堵,停车又难,它能帮助大家找到可以停车的位置。
这是大华在用深度学习算法之前用的智能化的方法。在深度学习进来之后,安防行业大华引入了深度学习的技术,我们提供了更多更好的产品,首先为什么大华安防行业能够做深度学习?首先算法需要三点,第一是大量样本,要非常非常大的样本来进行它的训练、迭代,才能够有一个非常好的模型,大量的样本,刚才看到所有的摄像头都是大华造的,现在大华是全球第二的安防行业,市场占有率非常高。所以在这种情况下大华制造了摄像头,制造了视频,同时会用深度学习去学习视频。所以大华在深度学习上面拥有了大量的样本,这是很多非安防行业比不上的一点。
第二,高性能的计算。为什么在十年前左右会有深度学习这个点爆发出来呢?就是因为高性能的计算,英美达(音译)在这方面能力还是非常强的,能够解决深度学习计算的矛盾,解决了之后人类的计算能力就有了很大的提高。
最后一个是市场,有很多情况下,譬如医疗行业,医疗行业有大量的样本,有医疗的样本,有CT片,有X光的图片,这些都是大量的样本。医院也有很多的高性能计算服务器,但是医院没有产生深度学习的产品,这是为什么?因为它们没有这样的需求,医院没有原始的动力去做这个事情。譬如像西门子、IBM,它们有这个动力去做,它们要提供这种产品给医院,但是它没有办法拿到这个数据,或者很难拿到这个数据,我知道很多公司已经在做这样的事情,但它们的痛点是没有数据,没有办法把这三个点都抓到手上来。而安防行业有这样一个契机,我们有非常好的渠道在一线面对市场、面对所用的人。譬如交警,我们会有大量高性能服务器,我们还有大量样本,所以天时地利人和,使我们结合的比较紧密。
(PPT图示)传统算法和深度学习算法的对比。右边是一个传统的算法,在场景二分之一的位置都没有红色框框的那些车。左手边的车无论在视频的最远处,或者停在其他车的后面,只要露出一个角就能够被查到。所以这是深度学习算法对传统算法的一个颠覆。同理,这里可以看到红色的框距离那边框的非常远,而传统算法二分之一以上基本上就无能为力了。
(PPT图示)这就是刚才我提到的视频结构化的算法,现在视频算法能够做到把刚才那两张图片上面所有人衣服上的颜色,他们是否带了雨伞,是否拎了包,是否背了包,是否戴了帽子,衣服是条纹的还是花纹的,这种属性都能够提取出来。车能提取什么属性?就是刚才说的车牌的识别、车身的颜色、车系的识别、车标的识别。包括你车况内所有的信息,比如你的年检标志、遮阳板是否放下来、安全带是否系了、中控台是否放了纸巾盒,以及挂坠是什么样子的,全能够识别出来。
(PPT图示)深度学习还有其他的应用,这是在高密度人群的计算,传统算法只能看到红色框框的那部分,相对来说近一些,这些人的遮挡会少一些。在绿色框那部分是非常小的,遮挡非常大,很多情况下不一定是正脸面对你,有可能是侧面,有可能是后脑勺,有可能80%的脑袋都躲在了另一个人的肩膀或者后面。这时候我们就引入了深度学习的技术,基本上检测准确率达到95%以上,整个场景里面所有人一个不落全部抠出来,这样就能精确统计这个场景下到底有多少人。譬如这个广场管理人员告诉我这个场景下面人员不能超过90个或者不能超过200个,当达到这个阈值的时候就可以报个警,在达到80个的时候就让工作人员做一个疏导,达到200个人的时候把所有通道入口关掉,否则就会发生拥挤甚至是踩踏的行为。
深度学习同时帮我们改进了人脸识别的算法,大华在16年刷到当年世界第一的水平,人脸识别达到了99.78%,基本上很少有错的。
(PPT图示)这是立体视觉技术,不是深度学习。会有立体视觉技术引入到安防领域来,通过视频来判断车外的人、车、马路等等距离我车的距离,或者我是放在教室里面判断大家的出勤率,有没有这么多人来,或者考试的时候是不是两个人靠的过近了,都可以通过这种方式去做一个判断。刚才讲的除了这个场景之外,都是讲的通过深度学习改进智能化等等方面。
最后我再说一下人工智能在安防中的展望。功能是一模一样的,在20年前就有人脸识别,在10年前有人脸识别,在5年前就有人脸识别,我保证未来还有人脸识别,人脸识别还是一样的,大部分应用和给客户的功能都是差不多的,只是技术在不断地提高,识别率越来越好,能够检测的目标越来越小,可能会有更多传感器,比如在安防摄像头里面会放更多PM2.0的传感器,会放噪音传感器,会放WIFI的传感器等等,相当于会有更多的数据。这是人工智能在安防行业后面的发展。到了后面人工智能不光对视频做识别,最后它要落地,最后它要解决问题必然是对人的模拟,要去模拟安保人员、交警、刑警,在识别他做什么样的行为。我们光光做一个识别报一个警是不够的,没有办法发挥价值的,最终是我要帮助实际操作的这个人,解决人的生产力,这才是智能在安防中最终的目的。
温馨提示:若您有任何疑问,欢迎联系我们的机构销售人员!
欢迎关注华泰证券研究所唯一官方微信!
点击下方“阅读原文”收听会议录音