你一定体验过AR技术。近几年,各种各样的AR技术应用纷纷出现在我们身边,呈现效果有些让大家惊艳不已,当然也有些是差强人意,但总体来说,AR技术作为行业风口,已经成为全民关注的热门已是不争的事实。
尤其是今年春节,QQ和支付宝分别在春节期间推出AR红包玩法,都将AR作为切入口。抛开其它的东西,我们单从技术上来看,这两家的AR技术究竟是什么水平,以及这两家对AR技术有什么推动?
所谓AR,官方解释是增强现实技术(Augmented Reality)的简称,是一种实时地计算摄影机影像的位置及角度,并加上相应图像、视频、3D模型的技术。这种技术能在屏幕上实现把虚拟世界套在现实世界,并进行互动。
通俗地讲,它其实是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术。是把原本在现实世界的一定时间空间范围内,很难体验到的实体信息(视觉、声音、味道、触觉等信息),通过电脑等科学技术,模拟仿真后再叠加,将虚拟的信息应用到真实世界。真实的环境和虚拟的物体实时地叠加到了同一个画面或空间,同时存在,并被人类感官所感知,从而达到超越现实的感官体验。
总结起来,AR技术具有两大要素,一是真实世界和虚拟的信息集成;二是具有实时交互性。我们可以简单的将其概括为“识别”和“追踪”。 只有能够识别现实世界,并且将虚拟形象叠加到现实世界中,才能称之为AR。
所以,根据这个理论,我们可以直接下一个结论,支付宝红包其实并不能算是AR。
来看下支付宝AR红包的玩法:用户只要扫描生活里出现的任何“福”字(需要写得规范一些),就可以识别跳出AR虚拟内容,经过一段小动画后,用户就能领取到一张福卡。
这个看起来像是以手机摄像头作为“眼睛”,在现实世界里叠加了一个动画。但实际上,这里面最关键的一点是,支付宝并没有让自己建立的这个形象跟现实世界产生交互,也就是说,支付宝只有图片识别,根本没有实现“追踪”。
最简单的例子,AR在现实世界所建立的虚拟形象,其实它是有位置信息的。如果把摄像头比作眼睛,那么只有当手机对着世界虚拟形象的时候,才能够看到这个形象。把摄像头对准别的地方,应该是看不到这个形象的。而支付宝的扫福,不管你摄像头朝着哪个方向,其实都能看到AR动画,这个不是AR技术,顶多算是以摄像头拍到的东西为背景播放了一段动画。
或者我们可以这样说,支付宝的扫福,其实就是一个图片识别技术,对于AR技术的核心,对现实世界的识别和虚拟形象跟现实世界的互动,也就是“追踪”,并没有做到。
支付宝没有使用真正的AR技术,这个可以理解,毕竟相比图片识别,AR的3D建模和追踪要难得很多,但这并不是说现在我们看到的没有真的AR。从目前我们能够看到的AR领域,大体上可以分为两种类型:有标记AR、无标记AR,而无标记AR又分为初级和进阶两个阶段。
有标记的AR可以算是AR技术中相对简单的模式。所谓有标记,就是在实现AR互动时具备“参照物”这一前提,用户通过扫描固定的参照物才能产生AR虚拟形象的展现。其背后的视觉跟踪技术是基于模板匹配的方式,预先对需要跟踪的target进行训练,在跟踪阶段通过不断地跟预存训练数据进行比对解算当前的位姿。这种实现方式的好处是速度较快、数据量小、系统简单,适用于一些特定的场景,但不适用于大范围的场景。
QQ在2016年奥运会期间曾经尝试过使用AR技术,通过用户扫描一系列特定的图片(标记),就可以在屏幕中显示虚拟内容,你可以通过调整手机的位置,去观察这个虚拟内容的各个角度,不仅可以拉远和推近,甚至能上下左右360度观看这个内容的所有角度————这也就是所谓的“追踪”环节,是AR的一个重要体验——这个其实就是典型的有标记AR。再举个例子,可口可乐的可乐瓶AR体验其实也是属于这种有标记的AR。通过识别可口可乐的logo,我们能看到一个虚拟的形象出现在可乐瓶里。
有标记的AR常见于市场性质的推广活动里,很少被用于现实的生活场景。原因就是,有标记的AR虽然实现难度较低——有一个固定的识别图片或者物体,虚拟形象只跟这个固定的物品发生交互——但它的局限性也比较大,对有标记的AR来说,标记物就是AR的全世界。我们可以这样理解,有标记的AR技术,其实算是真正AR技术的Demo。
相对的,无标记AR更高级一点,它不需要特定的图片或者物体,识别的是真正的现实世界,交互也是跟真正的现实世界产生关联。这里,无标记其实是一个相对的概念,因为这种技术最终也是与现实的一些标记物产生互动,只是这个过程,被放到了AR体验环节中。也就是说,在这种实现方式中,AR实现是实时的,设备在形成AR虚拟内容前,先要完成对现实世界的识别和计算。由于处理器对现实世界的识别是一个非常复杂的难题,所以它可以分为初级阶段和进阶模式。
先来说无标记AR的初级阶段:举例说明,前段时间风靡的Pokemon Go就是基于这种无标记的AR模式。用户可在没有参照物的现实世界中随意探索,系统会实时识别现实世界,根据LBS定位在现实世界中投影出各种小精灵的形象,并通过抛出虚拟的精灵球完成捕捉。
同样的例子还有这次的QQ红包,从技术上来看,QQ红包和PokemonGo其实差不多,都是基于LBS的信息,在摄像头识别的现实世界上出现一个“财神企鹅”。你可以试一下,当企鹅出现之后,如果你把摄像头转向别的地方,其实是看不见这只企鹅的。原因就是这只需你的企鹅它是“存在”的,它具备地理位置信息。
这种无标记的AR技术目前采用比较多,因为它其实没有对现实世界做完全识别,只是让虚拟形象跟手机之间有一个相对的位置信息。这种技术可以说最常见,但是它离真正的AR,也还是有很长的距离。
真正未来会出现在我们生活场景中的AR——不是广告或者游戏场景,其实是需要通过特定的硬件设备,对现实世界进行实时的3D建模,识别并计算包括景深、位移等环境数据,所生成的AR虚拟内容也将投射到这个立体空间中。这种AR技术实现,会大大地增强虚拟内容和现实世界的互动感,混淆真实与梦幻。
但这种方式技术要复杂的多、实现难度也大,虽然我们人眼识别现实世界是一件很轻松的事情,但对于计算机来说,对现实世界的识别并且追踪,并没有那么简单。
不过,目前也有一些公司能够达到这种技术。比如微软出品的Microsoft Hololens,如果你体验Hololens,你会发现最开始,你需要带着眼镜看一圈周围,为什么?其实,它是对现实世界进行实时建模——识别这个技术,之后再来判断,究竟虚拟形象要出现在这个世界的哪个位置。这样的AR体验会让人分不清真实和虚拟,虚拟内容与现实世界的互动程度是前所未有的。
Hololens背后的追踪技术采用的其实是SLAM方法,也就是即时定位和地图构建技术。这类技术不需要预存场景信息,而是在运行阶段完成对于场景的构建以及跟踪。其优点是不需要预存场景,可以跟踪较大范围,适用面广,在跟踪的同时也可以完成对于场景结构的重建。这类技术计算速度慢、数据量大、算法复杂度高,远非我们现在的手机就可以实现的。
甚至严格一点来说,我们现在所谓的智能手机,如果想使用AR技术,其实可能性微乎其微。要知道,在iPhone 7 Plus之前,手机识别景深都很难。在大多数手机看来,现实世界就是一个平面世界,这怎么来实现AR?不过据我所知,一些公司的技术目前可以让手机识别出原本就是平面的东西,比如现实世界里的桌子、地板,之后再让虚拟形象跟其互动,这应该是目前手机作为终端能够实现AR技术的最大限度了。
很多人会问,我们什么时候能真正的将AR技术应用到生活中,这个么……真的比较难回答,它受限于硬件,甚至市场发展等各种因素,很难给出一个确切的时间。有一点可以断定的是:“因为春节红包,我们很可能就进入到AR世界了……”这个绝对是扯淡的。
不过,通过今年腾讯和阿里两家的红包活动,对于AR技术的一个贡献是,会让AR概念的热度增高,这样或许有可能对AR技术的进一步发展有所贡献。