专栏名称: AI掘金志
雷锋网《AI掘金志》频道:只做计算机视觉 +「安防、医学影像、零售」三大传统领域的深度采访报道。
目录
相关文章推荐
51好读  ›  专栏  ›  AI掘金志

大华股份殷俊:AI,构建数字世界的基础

AI掘金志  · 公众号  ·  · 2019-11-03 20:52

正文

数据世界是四维的:通过感知获得一维数据,来观测真实世界;第二维,通过人工智能对感知数据进行特征提取,真实地反映世界;第三维,随着空间数据的融合,构建空间矩阵,构建与真实场景业务有匹配的数据场景化;第四维,则是全面计算的过程,通过时空数据的维度来构建时空矩阵,充分描述和表达真实世界。

编辑 | 王优雅


10月27日,由雷锋网 & AI掘金志主办的「全球AI芯片·城市智能峰会」,在深圳大中华喜来登酒店盛大召开。
延续雷锋网大会一贯的高水准、高人气,「全球AI芯片·城市智能峰会」以“城市视觉计算再进化”为主题,全面聚焦城市视觉与城市算力领域,是业内首个围绕“算法+算力”展开的大型智能城市论坛。
峰会邀请到了业内极具代表性的14位业内知名专家,世界顶尖人工智能科学家、芯片创业大牛、产业巨头首席技术高管、明星投资人齐聚,为行业资深从业者们分享前瞻的技术研究与商业模式方法论。
在大会上午场,大华股份研发中心副总裁、先进技术研究院院长殷俊以《AI构建数字世界的基础》为主题发表精彩演讲。
在殷俊看来,数据世界是四维的: 通过感知获得一维数据,来观测真实世界; 第二维,通过人工智能对感知数据进行特征提取,真实地反映世界; 第三维,随着空间数据的融合,构建空间矩阵,构建与真实场景业务有匹配的数据场景化; 第四维,则是全面计算的过程,通过时空数据的维度来构建时空矩阵,充分描述和表达真实世界。
他表示,在二维世界里面,人脸、语音识别或者很多检测识别真正构筑了二维特征数据的空间,数据的准确率是最高要求。 因为只有构建精准的二维数据世界,才能准确表达世界上的万世万物。 对行人的特征描述,则是典型的应用三维数据来形成更精准的定位。 四维空间内,系统可以加入时域的分析,做更多预测、决策和评估的工作。
算力方面,殷俊认为,数据在不断升迁,算力增加是必然的,往后更需要大算力芯片。 而大算力的芯片除了感知之外,还可以在边缘侧提取特征和空间分析; 到了中心侧,能够完成二维、三维、四维数据的分析。
同时他也强调,尽管随着数据迁移,数据大幅度浓缩,从单点来看要求下降,但四维数据要求的路数和要获得的感知数据更多,网络成本反而增加。 到越高维,网络代价越高。 所以,需要根据业务综合部署,考量网络和计算的分布,看到底如何形成最佳的计算网络。
以下是殷俊的大会现场演讲内容,雷锋网做了不改变原意的整理及编辑:
大家好,非常荣幸今天能够代表大华为大家分享我们对AI的认识以及对AI的定位。
首先我提一个观点: AI是构建数字世界的基础,那什么是数字世界,以及为什么数据会成为数字世界的必要条件?
首先我们来看一下AI做了什么事情。
其实我们正在构筑一个数字世界,用数字化世界描述真实世界。 实际上数字世界和真实世界有很大差异,真实世界中物质由很多元素构成,数据世界数据是唯一的元素,只有数据才能构建我们的数字世界。
我们的数据世界如何构建? 在大华看来,我们构建了四维的数字世界。 首先,我们通过感知获得一维感知数据,来观测真实世界发生了什么事情。
第二维,通过人工智能对感知数据进行特征提取,真实地反映真实世界到底是什么东西,比如是一个人、一个人脸、一辆车。
在第三维世界,随着空间数据的融合,我们构建空间矩阵,构建与真实场景业务有匹配的数据场景化。
第四维,我们认为是一个全面计算的过程,通过时空数据的维度来构建时空矩阵,充分描述和表达真实世界到底发生什么事情、出现什么行为、出现什么事件。
这个过程中,我们用感知和物联网技术构建一维数据,用人工智能构建第二维、第三维、第四维数据,而且不同维度都会进行数据检索。 随着数据维度增多,数据的价值也会快速提升。 以往我们看一个小时的数据,一维世界可能会消耗多达几个G的存储空间,到四维数据可以通过简单描述告诉观察者这段时间发生什么事情、观测对象是什么,所以数据是高度浓缩的。 这个过程中,我们消耗了大量计算能力。 每一维数据升迁需要耗费很大计算力,这是AI真正帮助我们构建的数字世界。
我们认为在二维世界里面,人脸、语音识别或者很多检测识别真正构筑了二维特征数据的空间。 在这里,我们认为数据的准确率是最高要求,因为只有构建精准的二维数据世界,才能准确表达世界上的万世万物。 我们大华在前几年一直把每项指标做到最高的精度,以交通为例,在车辆抓拍、车辆识别、车型车系方面提升精度,在出口都会大幅度运用优秀的特征,对车辆有完整的描述。
同时,我们会把真实商用化的算法做评测,确立所有的算法在业内的领先性。 同时,我们在人脸识别方面,去年也持续在提升,今年在NIST全球综合排名第五。 同时,现实生活中有很多跨年龄的问题,我们可以做到国内第一。 在整个评测过程中,我们是全球算法速度第二快的的公司,这也意味着这一套算法我们直接可以商用,这个是我们觉得在整个人脸进度中最重要的环节。
我们还在目标检测、跟踪、识别、场景分析方面在构建二维、三维的数据能力。 我们年初在market-1501测试集上准确率达到了96.7%的水平,这种性能提升真正帮助我们刻画真实的数字世界。
所有人工智能都围绕业务场景,正在加速业务场景的扩展,人工智能不仅仅是人脸和车辆等物体,而是能真实的表现真实世界,包括我们和零售做商品识别、货架空置率识别,来提升对商品的认知。
在能源方面,大华有几百种检测手段,原来一个人爬山涉水去观测每条线的输油管道、燃气线的安全事故,现在我们可以通过智能手段来快速检测,实时预警。
还有动物的检测,比如在养猪上的应用,来做猪的计数,确定猪有没有丢失等等。
机场是比较封闭的,我们识别飞机下降到入位、移位以及停靠过程中廊桥的状态,安全车辆与飞机匹配的状态,通过自动化解决航站人工的痛点。
在社区里面,高空抛物是痛苦的事情,我们会做这个识别,精准识别谁家把东西抛出来,提升安全。
人工智能不只是处理图像问题,还要处理很多感知数据的问题。 举个例子,这是普通的烟感,传统烟感的误报率会很高,比如受到水气、蚊虫的影响,还会受到烟和PM2.5的影响,都会影响它的准确率。 我们通过人工智能的手段去分析它采集到的数据。 真正落地之后,我们发现可以把误报降低90%以上,实现精准的报警。
我们把人工智能利用在编解码上,像H265、H266,我们通过AI赋能,可以把码流压低80%,用20%的带宽(200多kb带宽)可以传输原先需要4M编码的性能。 H266的研究中,我们发现同样可以降低70%以上的码流,这都是人工智能带来的数字化改造。 我们认为未来有更多的利用场景需要我们扩展,而且我们也在积极拓展各个行业的应用。
人工智能离不开训练中心,实际上我们的工程师团队也是希望我们的训练中心能够实现各个行业的愿望,他们把人工智能平台取名于巨灵,源于阿拉丁神灯的灯神,希望可以达成我们的各种愿望。 我们在想如何加速产业化落地,过往三年,大华建成了三地三中心的算力平台,算力提升了20倍,每天在线任务数提升了40倍以上,满足我们对行业场景的覆盖和定制化,满足场景需求。
在这里我们会想一个问题,是不是算力越大,不断增加计算的算力可以帮助我们增加很多。 我们认为算力增加是必然的,更重要的是中心除了算力训练和算法之外还有很多东西要做,比如现在有这么多芯片,算力芯片层出不穷,我们要做芯片适配,有很多应用程序,需要做应用场景的适配,这将需要很大的人力物力和时间解决这个问题,所以我们在人工智能平台里面把芯片面向业务的集成部署作为我们的一部分。






请到「今天看啥」查看全文