专栏名称: 爱范儿
关注这个时代最好的产品。
目录
相关文章推荐
36氪  ·  金沙江创投也要「分家」了 ·  15 小时前  
雷科技  ·  6万大洋、实测5款折叠屏,谁最拉胯? ·  15 小时前  
51好读  ›  专栏  ›  爱范儿

自动驾驶汽车和隐私的终结

爱范儿  · 公众号  · 科技媒体  · 2017-02-16 21:51

正文

作者:Ernest Oppetit 译者:ONES Piece 周卿 任宁
译者按:颠覆性的产品和品牌迭代在百年汽车史中并不鲜见,但是从未脱离以发动机驱动以化石燃料为能源的核心技术,以驾驶者的驾驶体验和乘客的舒适度为核心的产品功能。但毫无疑问的是汽车产业正引来一股跨界颠覆的风潮,自动驾驶汽车成为创业者、投资者给予极大关注的风口,各路资本蜂拥而入。但是自动驾驶汽车带来极具想象力未来的同时,也必然对现有经济社会的方方面面产生巨大影响。Ernest Oppetit 的文章为我们做了很好的梳理,并将重点放在会影响每个人生活的隐私方面,结论并不乐观,在自动驾驶汽车大跃进的过程中,隐私问题目前并没有得到足够的重视。
很快地,每一个地方的每一件事都将被持续记录及上传到互联网上。这将首先从人口稠密的城市区域开始,但随后地球上每一部分的每一平方米都将被记录。在机器视觉和人工智能领域的进步意味着这些海量的数据将具有可用性,这将彻底改变广告推广和法律的实施,也将把我们带回到有隐私之前的世界。
(噢,是的,你猜对了,这篇文章的绝配就是电影《少数派报告》。)
哪里都有摄像头
这是我们今天的情况:
  • 卫星和无人机 可以记录这地球上的任何地方。这使得 Terra Bella(Google 的一家子公司)可以出售地球上任何地方的高清即时影像以作商业上的应用。但是在大多数情况下,分辨率还比较差,例如你可以从空中监控到一辆卡车是否在某个建筑工地,但是不能看到卡车的车牌。
  • 闭路电视和家庭摄像系统的数量 已经随着传感器价格的下跌而激增,同时在国家安全方面和个人安全方面(家庭安全和儿童照看等)的监控需要都增加了。英国有超过 600 万套监控系统。
  • 用户视频的录制量 已经经历了疯狂的增长。从数量级上讲:每天有超过 400 万小时的视频被上传到 YouTube。这种增速并未减缓,因为这个星球上那一半没有智能手机的人也正在开始用上智能手机,同时类似 Facebook Live、Twitter 的 Periscope 和 Snapchat 这样的产品都驱使着智能手机的用户拍摄更多的(现在是「直播」)视频。
但是真正的改变即将到来:
  • 增强现实版的「Google」们 将变成巨大的市场,也将需要将用户正在看的东西持续录制成视频以便用软件来「增强」显示。目前微软的 Hololens 和 Snapchat Spectacles 处于领先地位,但市场渗透率不高。很多聪明且资金充裕的人们正在致力于让增强现实技术取得成功。笼着神秘面纱创业公司 Magic Leap 就是走前最前面的。他们目前融资了 50 亿美金,拥有 700 多名员工。

自动驾驶汽车将变成一个巨大的市场,并且自动驾驶汽车将能持续摄制高分辨率、高帧率的 360 度全景视频。 想到这场自动驾驶汽车革命将替代今天所有的汽车,你已经会发现这些视频的量将非常巨大,但要是考虑到自动驾驶汽车在更大的物流领域的角色,这事情就更具有颠覆性了。随着市场需要货物被越来越「按需」送达(亚马逊已经推出了「一小时送达」服务),自动驾驶汽车(包括无人机)将成为公司满足这种需求最合算的途径。如果使用该种汽车是免费的,并且充电也能实际上变成免费的(随着电动引擎效率和太阳能技术方面的进步)——为什么不让商家送 10 件 T 恤到你家给你试穿,然后退掉你不喜欢的 9 件呢?(想了解更多的话:我朋友 Alex Flamant 在伦敦的未来学家聚会上关于这个话题有过非常有预见性的论述)
随着这些技术革命的展开,我们正与能对这个星球上任一部分的每一平方米持续录制高清视频的时间越来越近。
现在,虽然某些视频很棒(这里就有一个有趣的),但没人能一直坐着把他们全部看完。
从视频到洞见
得益于视频数据德爆发,电脑视觉在过去 20 年发生了不可思议的进步。
让我们从一些你可能没有意识到的事情开始:
作为麦克风的视频 :目前,在用算法处理极高分辨率的无声视频后,我们能够复原出视频录制当场的声音。能够识别声音引起的周围物体的细微震动的技术使这成为现实(一些同样的技术使得我们可以从视频中获得别人的心率)。在这个视频的惊人例子中,研究人员能够通过拍摄在隔音玻璃后面的一包薯片来复原一段对话。在根本不录制声音的情况下,这种复原好到足够让人明白交谈者在讲些什么。但是自动驾驶汽车和闭路电视系统没有理由不录制声音,这些技术也许有助于获得更好的声音分辨率,尤其是在距离较远和环境嘈杂的情况下。

自然语言处理 :现在你笨拙的 Google Now 和 Siri 可能还无法胜任,但是在研究实验室里,在将声音转化成文本方面,我们已经有了靠谱的技术。在人脸识别方面,训练自然语言处理(NLP)算法(来自于智能手机和机器人程序的交互界面以及 Amazon Alexa/Google Home 音箱)的数据爆发式增长也刺激了这场革新。在 2016 年,微软的技术在语音识别能力方面已经击败了人类对照组。在此之后不久,Google 展示了将八对语言组合进行实时翻译的新方法,这也意味着这些新技术已经轻轻松松嗖地一声超过了(大部分)人类的翻译能力。

面部识别 问题已经被解决了。在 2015 年 6 月份,Facebook 的人工智能负责人 Yann LeCun 宣称 Facebook 的算法在识别从 Flickr 获得的 40000 张图片中的人脸时正确率达到 83%。有趣的是,有时候图片中并不需要出现人脸——因为算法在拥有足够多关于用户的数据时,能够使用其他类似于衣着之类的线索来识别用户(「Mark 似乎总穿灰色的 T 恤衫」)。随着照片激增,Facebook 和 Google 也随着用户在图片中标记他们的朋友而获得持续的反馈,基于图片的识别技术正在持续进步。在拥有视频、每个用户的习惯、着装和定位的历史记录的情况下,算法将在识别谁是谁这方面轻松超越人类。(还记得上次你挣扎着辨认某个你几年没见的人吗?)而也许在解读视觉线索上,算法也比你厉害。

大海捞针
人工智能系统能够从原始数据中推断出更高水平的概念(「特征」)。例如,人脸就是一个从构成视频的原始像素中推断出来的特征。这实质上使得所有视频和所有声音都变成了可搜索的文件。clarify.io 公司就是提供该种服务的。

但是人工智能不仅局限在帮助人类进行搜索,它还能为你完成所有可能的搜索并得出更高水平的「特征」:有趣的模式或是异常事件。
人工智能也通过对数据集加上常见的识别符来对许多可获得的数据资源进行此种搜索。所以你看到的不仅是「视频里的一张人脸」,也是这张脸后面的人名,是这个人在网络上留下的蛛丝马迹(包括所有其他这张脸曾经出现过的地方、所有浏览活动、所有通信、所有线上社交过程中的观点等)和所有其他可能获得的数据集。
这些人工智能系统将持续进步,并且每次经过改进的版本将对原始数据重新进行处理。比如说英国警方用一个算法对上周所有公共闭路电视的录像进行了处理来确认一个罪犯的长相。今天的算法可能找不到,但是未来的版本就可以。
所以,这些进步意味着什么呢?
对商业的意义
广告商、保险公司、零售商和银行将尽情享受这些新数据,就像他们目前为止已经对其他互联网数据做的那样。 他们的目标依然是对「你」建立起一个充满细节的用户画像,以卖给你更多东西并量化你带来的风险或责任。
无迹可寻的监控加上一直在进步的人工智能系统可以提供:
  • 你的经济社会地位:你居住的地点、你工作的地点和收入、你是否要送小孩上学、你跟谁以何种频率到哪里消遣。

  • 你的购物习惯:你到哪里购物、你穿什么衣服、你的朋友穿什么衣服、你去工作的时候必须穿什么衣服。

  • 你的健康:你有多活跃、你是否吸烟或喝酒、你光顾或预定哪种餐馆、你去看过多少医生。

在更宏观的层面上来讲,这也带来一些有趣的进行预测的机会:






请到「今天看啥」查看全文