专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
新浪科技  ·  【#特斯拉为Cybertruck进入中国做准 ... ·  昨天  
新浪科技  ·  #华为MateX6开启预订#,你会考虑购买折 ... ·  4 天前  
51好读  ›  专栏  ›  雷峰网

谷歌 VR/AR 负责人 Clay Bavor:关于 VR,我们身处何地?我们将走向何方?

雷峰网  · 公众号  · 科技媒体  · 2017-05-28 10:12

正文

200 多家明星企业,20 位著名投资机构顶级投资人共同参与!「新智造成长榜」致力于发掘 AI 领域有 “三年十倍” 成长潜力的创新公司,下一波 AI 独角兽,会有你么?点击阅读原文了解详情!

雷锋网按:在经历去年的高潮后,VR 目前正面临一个调整期。作为移动 VR 的领导者,Google 是怎么看待这段时期的呢?在 Google I/O 举办前,Google 的 VR/AR 负责人 Clay Bavor 在 Medium 撰文阐述了自己和 Google 的看法,我们一起来看下。本文由雷锋网编译。

过去一年对 VR 和 AR 非常重要:从基于智能手机端到桌面台式机,面向普通消费者的 VR 硬件产品上市。开发人员开始认真研究 AR 技术。我们在 Google 的团队正努力将一些重要产品推出。六个月前,我们推出了高品质移动 VR 平台 Daydream。不久之后,第一款内置 Tango 功能的手机即将发售,首次将基于智能手机的 AR 功能置于消费者手中。

在短时间内,虽然整个行业发生了很大变化,我们取得了很多进展,但仍然有很多问题亟待解决。我们已经有数百万消费者开始体验到这些新技术所带来的乐趣,但目前还是处于早期阶段。

现在正是回顾历史的最佳时机,看看 VR 和 AR 的概况,并分享一下我们的看法:我们处于何种阶段,我们目标是什么,为什么这些技术对 Google 很重要,为什么对世界很重要。

谷歌 VR/AR 副总裁 Clay Bavor,图片来源 Fortune

到底什么是 AR?什么是 VR?

术语 “VR” 和 “AR” 是什么意思?我经常说:VR 可以把你带到任何地方,AR 可以给你带来任何东西。VR 可以把你送到其他地方。AR 让你呆在自己的地方,并将物品对象和信息用文本形式带给你,使它们看起来就像在你身边。它们都能赋予你超能力。一般通过佩戴相应头戴设备或者通过观看智能手机的取景窗口这类方式,即可完成体验。

许多人问我哪个技术会 “赢”。问题是这样的提问将它们变成了两种相互竞争的互斥技术。但这是一个错误的认为。VR 和 AR 更像是光谱上的两点 —— 区别在于能有多少由计算机生成的图像被投射到自然环境中。VR 完全用计算机生成的图像替代了现实世界,例如将你送到卢浮宫博物馆的虚拟展览中。相比之下,AR 为你的周围环境添加了一些计算机生成的图像。举个例子,如果你在真实的卢浮宫里面漫步,AR 可以在面前的地面上显示虚拟的数字脚印,指引你前往达芬奇的画作 —— 蒙娜丽莎。

但是在某些时间点上,这些频谱上的区别会变得模糊:我们将拥有可以增强整个视野的 AR 头戴设备,以及可以逼真数字显示你周围环境的 VR 头戴设备,以及两者兼备的设备。一旦技术进步到这一点,VR 和 AR 之间的区别将比今天更加缩小。

同时,如果 VR 和 AR 是频谱上的两点,那我们应该称频谱为什么?这里有一些参考 —— 沉浸式计算,存在计算,物理计算,感知计算,混合现实或沉浸式现实。这种技术是新兴的,对其定义还需要有很长的路要走,但现阶段,我们称之为沉浸式计算。

人机交互的发展曲线

1940 年加州统计局的电脑打卡机

为什么沉浸式计算使事物看起来像真的一样很重要?为什么技术上的投资能使这成为可能?

为了展望未来,我们先回顾一下电脑的历史,以及我们如何与它们进行交互的。在过去的几十年里发生的改变,每次人们都使得电脑更像我们一样工作,每一次当我们去除人与电脑之间的一层抽象的隔阂 —— 电脑都会变得更加广泛,易用,更有价值。反过来,我们变得更有能力,更有成效。

一开始,人们只能通过逐字的重写才能与电脑 “通话”。接下来打卡是一个改进,电脑变得更容易编程。后来命令行的出现,使得打字取代了冲孔卡。

真正的突破是图形用户界面(GUI)的出现。计算机第一次变得视觉化,突然之间,更多的人接触到并使用它们。人们开始广泛使用它们,从编写学校报告到设计喷气发动机。

人手一部的智能手机进一步推动了计算机的普及性和计算能力。触摸屏使我们能够直接与我们的计算机进行交互,用手指和智能手机相机让我们能够看到世界。最近,像 Google Assistant 这样的对话交互界面,使你能够像与人交流一样,同设备进行更加自然和无缝的交互。

但就我们来说,抽象的概念仍然存在。当和朋友视频通话时,你不会像现实生活中看到的那样,只是在屏幕上看到一个又小又平的图像。当你想知道一家餐馆的位置时,你会看到一张难以置信的详细地图,然后你要自己判断所在位置的蓝点与你周遭在地图的相关位置状况。你的手机不能直接让你走到那里。

借助身临其境的计算技术,我们不用盯着屏幕或不断检查我们的手机,而是围绕着我们的真实世界和虚拟世界。我们可以使用我们的手直接移动事物,或者只是看着它们再采取行动。沉浸式计算将会消除我们与计算机之间的更多抽象概念。你可以使用文本信息,将计算机无缝编织到你所处的环境中。这是计算交互接口发展不可避免的下一步。

为什么是 Google?

1998 年的 google.com 首页

Google 的使命是组织世界的信息,使其被大众普遍使用。我们从网页 —— 文本和图像 —— 开始,然后是书籍,地图和视频。随着网络上的信息变得更加丰富,搜索和访问它们的工具也是如此变化。

沉浸式计算将会更进一步。如果你想了解有关马丘比丘古城 (Machu Picchu) 的更多信息,而不是阅读或观看有关它的视频,你将会在虚拟现实中游览该城。我们将有 VR 摄像机可以捕捉到我们生活的时刻,并使我们能够在几年之后走入当时的场景。你的 AR 设备不再使用 2D 街道地图找到餐厅,而是会精确地知道它在空间中的位置,并显示到达距离。外科医生将观察病人的 3D 扫描图像,以更好地了解病人的身体状况。随着我们身边的沉浸式计算越来越多的融入到我们的环境中,信息将更加丰富,更相关,对我们更有帮助。

不过这不仅仅是信息本身。这是关于人们如何访问它。这就是为什么多年来我们投资建立广泛的计算平台。通过 Chrome,我们希望使网络更快,更安全,更强大。通过 Android,我们的目标是使更多的人能够使用移动计算。通过 Cardboard 和 Daydream,我们希望通过能够提供多样化的,有用又有趣的设备,来普及沉浸式计算。

与人工智能和机器学习一起,我们将 VR 和 AR 视为 Google 组织世界信息使命的下一阶段的一部分。这就是我们如何思考沉浸式计算的更大背景,和它位于计算机发展中所处的位置,以及 Google 为什么投资。

我们身处何地?

1984 年摩托罗拉 DynaTAC 8000X 手机,图片来源:Motorola

我们经常被问到 VR 和 AR 何时将 “be ready”,什么是 “杀手级应用程序”。这个问题表明 VR 和 AR 将会有一个奇异的时刻突然 “爆发”,非常有用,每个人都想使用它。

首先,重要的是考虑我们在沉浸式计算的发展过程中的位置,并确保我们做出正确的比较。一个例子就是看手机发展的过程。 iPhone 在十年前推出,现在智能手机无所不在。所以有些人认为沉浸式计算将在相同的时间尺度上遵循相同的曲线。这是不正确的,但是为了找找原因,回顾手机的发展历史是有用的。

第一款商用手机,DynaTAC 8000X,于 1984 年发布。那是 33 年前,不是十年。由于我们现在是处于第一代消费者可用的沉浸式计算设备阶段,因此将其与 20 世纪 80 年代的手机进行比较,比过去十年发布的任何手机更合适。这并不是说我相信 VR 和 AR 将需要 30 年的时间才能完全成熟并达到类似的使用和影响。我比那更乐观。但是和十年前的智能手机比较是错误的。

手机的发展还有另一个相关的教训。在技术生命的早期,只能为一小部分人服务。GPS 被认为用途狭隘 —— 主要是应急人员,也许是在偏远的旷野徒步旅行的人,还能有谁呢?第一台拍照手机按目前的标准,质量会非常差。而今天,GPS 和拍照智能手机是相当的普遍存在。

无论具体的时间尺度如何,VR 和 AR 都会经历手机类似的发展。功能将会改善。设备将变得更便宜,更易于使用。用户界面和应用程序将有突破。随着价值上涨和成本下降,沉浸式计算对于越来越多的人来说将是有意义的。这不是一个假设的问题 —— 这是一个什么时候发生的问题。

我们将走向何方?

我们团队的口头禅是 “为每个人提供沉浸式计算体验”。我们开始使用 Cardboard,下一步是 Daydream,为 Android 生态系统的手机带来高品质的移动 VR。Tango 为智能手机带来了全新形式的 AR,可以用于游戏,娱乐,教育各个方面。但下一步呢?需要做什么才能实现目标?

一个简短的答案是这样的:不是某一件事要做得更好,而是每一件事都要做得更好。

下面则是一个更长的回答。

首先,障碍。我们必须消除更多使用这些设备的障碍。头戴设备必须更容易使用,更舒适,更便携。我们刚刚在 Google I / O 上公布的 Daydream 独立 VR 头戴设备是朝着正确方向迈出的一步。它拥有 VR 所需的所有内容。体验虚拟现实仅需轻松的戴上它们。但是,我们几乎没有优化用户体验。

接下来,有底层的技术。为了使 VR 更加便携,AR 更有说服力和有用,这些体验背后的一切都必须改进:显示,光学,跟踪,输入,GPU,传感器等。作为一个例子,为了在 VR 中实现 “视网膜” 解决方案 —— 就是要在一个完整的视野中给予一个 20/20 的视野,我们将需要比现在的显示器大约多出 30 倍的像素。为了使更精细的 AR 成为可能,智能手机将需要更先进的感测功能。我们的设备将需要了解运动,空间和非常精确的位置。我们需要的精度不是米,而是以厘米或甚至毫米为单位。

这可能听起来像是巨大的技术飞跃。它们确实是。但我们已经在取得进展。WorldSense 可以实现对 VR 的位置跟踪和 VPS —— 像 GPS 这样的 “视觉定位服务”,但是对于精确的室内位置,这两个推动因素很重要。而且我们应该记得,像现在这样高级的 VR 和 AR 设备大都是由生产智能手机的组件组成的。就像我们正在用自行车和汽车零件建造飞机。你可以这样做 —— 这是怀特兄弟们开始的 —— 但不可能是最终点。在接下来的几年中,我们将开始看到专门为 VR 和 AR 构建的更多组件,这些将产生性能更强大的设备。

这里的另一个部分是实现更广泛,深入的体验。随着底层技术的改进,新的应用和体验将成为可能。为了举例说明我的意思,拿一个像 Tilt Brush 这样的应用程序来说。在我们拥有能够实现空间中进行位置跟踪的控制器之前,根本不可能存在。用手柄绘画没有任何意义。硬件和软件必须一起发展。我们将来会看到更多的共同演变。准确的手跟踪将使一组新的交互方式成为可能,眼睛跟踪将使新类型的社交应用程序依赖于眼神接触和逼真的面部表情。

而且,我们需要更多的内容来体验,玩和使用。需要针对每个人兴趣的体验和应用程序。为了推动内容的发展,我们正在支持 YouTube Spaces 和 Jump 相机的创作者,为媒体带来更多的想法和观点。我们与数十名艺术家紧密合作,帮助他们用我们的 Tilt Brush Artists in Residence 项目探索 VR。但是当然,我们需要开发人员,创作者,讲故事者和电影摄影师的帮助来探索和建立这些。

一个布满可能性的洞穴

这是一个隐喻,我用来思考目前沉浸式计算所处的阶段:我们正在探索布满可能性的洞穴。这是个巨大的,有众多分支和潜在路径,而且大部分都处在黑暗中的洞穴。虽然有一些闪光的地方,很难看到很远的地方。但是,通过研究,建立原型,创造产品,最重要的是看到人们如何利用这些技术,并从这些技术中获益,我们照亮了大部分洞穴,并更清楚地看到了这一切的走向。我们取得了进展。

从我们现在的观点来看,很难清楚地看到这一切如何展开。然而,很明显的是,它终将会展开。我非常乐观,相信沉浸式计算将很快让我们的生活变得更好。我们已经看到了那天的到来 - 帮助孩子们在教室里探索更多的世界,让记者将观众带到世界各地的前线,使艺术家能够创造出以前难以想象的艺术作品。将来有一天,我们会想知道如何在没有计算机帮助的情况下,完成我们的工作 —— 感知环境意识,显示文本信息,并且像现实世界中一样观察,感觉和行动。

这不会在一夜之间发生。但是终将会发生。它会改变我们的工作,娱乐,生活和学习的各个方面。

Via medium,雷锋网编译