AR是3D视觉的发展方向。
AR技术体系分三个层次:基础型、娱乐型和数据型。AR要实现三种功能,第一是虚拟物体和真实的场景,要求对周围环境完整的识别,第二是对人体的行为动作要进行识别,第三是交互,三种功能的实现都涉及到数据的部分,因而AR是一个完整的体系。关于3D会涉及一些双摄、显示技术等话题,但是核心的技术源泉还是在AR的基础技术,显示和3D本身是一个硬件载体。
AR从属于AI,完整的AR应由前端智能化芯片和后台云智能平台构成。
AR可以对人体的环境识别,又可以对人的物理属性识别,相当于有了眼睛。光有眼睛还不够,它一定要和数据平台对接,也就是前面的端到后面的云,即整个大脑的部分,前端主要处理数据采集和AR的环境营造,后端主要是大数据的处理、智能算法的更新。
AR大约将在2018、2019年开始火爆。
微软2010年推出Kinect,革命性交互产品,垄断5年全球体感交互市场。微软号称在2018年1月份推出800美元左右的AR眼镜。苹果2013年收购Primesense,现在推出iPhoneX,从供应链传来的消息,明年基本上要上后置,AR的芯片已经开始量产。
华捷艾米的方案给终端厂家、供应链、应用厂家赋能。
整个AR解决方案包括光学小型化器件模组、一体化AR计算芯片和SDK工具包,适用于手机等多种小型化设备。AR芯片基本将AR核心技术手势识别、三维识别、人脸识别等融合在一起。华捷艾米的AR芯片技术方案包括与3D芯片的结合,相当于一个通用性的专用芯片。这款芯片现在是全球第三家能够完整设计和开发的芯片。2017年10月份量产了一款基于28纳米的三维测量的多维的芯片,明年AR一体化的芯片将量产。计算芯片则包括了软件、硬件部分,整体上处理AI前端是ISP+DSP+DNN的结构。
手机方案可以给客户提供两种模式。
第一种是直接做成一个完整的光学模组,把生产的基础工作全部准备好,提供给厂家。第二种是有一些厂家更多的看重结构设计、外形、功耗的问题,也可以单独提供进行一对一的支持。此外也提供SDK方面的软件解决方案。除了3D深度数据之外,还提供人工骨架、人物的提取、彩色抠图、人脸的识别、男女识别等,以及基于3D的SDK的游戏引擎,可以方便应用厂家快速开发应用。
目前行业技术难度大,技术难度集中于3Dslam和人体行为识别。
微软kinect问世八年,没有类似的产品出现,并且除了微软和A公司之外,还没有完整的AR产品。这其中两大核心技术可以说是有世界难度的,一个是3Dslam,一个是人体行为识别。微软和A公司已经有行为识别能力,微软、A公司和谷歌已将3Dslam芯片化,此外暂时没有其他厂商做出来。包括联想、华为已经研究不下7年,暂时还没有收获。从时间角度来说,一蹴而就完成AR产品的想法是不切实际的,短期内跟上没那么容易。
行业投入大、周期长,AI需极大投入。
苹果花了200亿进行相关技术的投资和收购。假设刚起步的企业来做,简单推算一下周期:首先需两年时间才能完成基础原理的研发,此后数据采集、标注、训练至少要花8个月的时间,投入的成本要1到2亿。芯片的设计与量产要一年半以上,投入成本要8000万以上。同时还要并行搭建数据平台,投入至少要5000万,累积的时间是4年2个月。这是不考虑技术有多大门槛的情况下,如果用在银行或者是安防领域,不一定需要芯片的开发,可能时间会短一点,但是在消费电子领域,芯片是必不可少的,现在的CPU无法支撑这种规模的并行运算,在终端上,特别是消费电子,必须要开发芯片,所以这个累积成本2亿只能搞个初步,所以我们看到苹果的iphoneX出来了,但是在2019年年中之前,类似于做到苹果那样的faceID出来可能性是不大的。华捷艾米也是刚刚开始做3D人脸的,对周期判断是2019年中甚至以后。对人体识别、手势识别经历了8年的研发,已经采集了一亿多的样本。
AR的行业刚刚兴起,存在四个需求关系。
第一,应用对算法的需求不明确;第二,算法对上层算法的需求关系多样;第三,算法对硬件的需求关系多样;第四,应用对硬件的需求关系多样。用在电视、手机、机器人上对功耗、帧率是不太一样的。因此,基于3D视觉的AR和AI技术还有相当长的演进和完善的过程。
AR量产的供应链整合具有一定难度
,
包括激光器、DOE、CMOS、模组生产,这些都是巨头厂家在做。现在已经储备完成了供应链的整合。供应链里面主要是这四个难题:激光器、DOE、CMOS,现在满足AR在户外用的CMOS暂时还没有标准,这是目前的难点。此外还有是模组生产,模组对光、湿、热的要求比较高,现在要达到一个良好的精度,对生产要求比以前的1200万象素的模组生产要求更高一点,所以生产的磨合性应该有一个周期。A公司2015年的时候就开始做这种量产的计划,两年还没有完全搞定,可见模组生产还是有一定的难度。
华捷艾米的核心优势是全球第三家具备完整智能AR的技术体系公司,
这里面包括深度学习、核心算法,还有自主芯片。能够把AR落地必须有一个完整的芯片,也必须要有一个完整的数据平台,数据本身在实践中就是滚动的。也就是说要完成这个AR技术落地,两个东西是必须要完成的,第一个是芯片,这也是计算平台,第二是数据平台。