![](http://mmbiz.qpic.cn/mmbiz/P1chKeAo8dpuhdeFneeYibmdoL5wf0jAicw3hhk2iaApCV7vDAiad6cwG9G106tianRSrT5l6K0t8FEa4ZFu6vuTnuw/0?wx_fmt=png)
出租车上的GPS其实是一流的狗仔
这年头,手机里装满了你所有的秘密。但是你可知道陌生的出租车上的GPS也装满了你的秘密呢。
纽约城市出租车和豪华轿车委员会对外公布了一份2013年全市的出租车行程,这份文件20G大,有全年超过1亿7千万次出租车GPS数据等,以及上下车时间、接送地点、车费、小费等等。当然,这些数据都是匿名的,隐去了乘车人的相关信息和出租车司机信息等等。在纽约市政府和普通老百姓眼里,这份资料已经隐去了很多关键信息,对外公布只是给有关部门制定城市交通政策起到一些参考作用,给一些研究机构提供一些大数据信息,不会侵犯个人的隐私。
“还能从这1亿多次匿名的乘车信息里找到我么?”你肯定是这么想的。
但事实上,这份匿名的大数据信息对于数据研究者来说,已经足够了解你的全部秘密!当时还是美国西北大学研究生的Anthony Tockar就像玩游戏一样轻松地揭开了这些秘密,甚至比你现在想象得要多得多的秘密。
Anthony Tockar首先从明星下手。他通过google搜索带有“2013年明星坐出租车出现在曼哈顿”这些关键词的图片,结果轻而易举地通过粉丝和狗仔队上传的各类明星上下出租车的照片,然后通过照片透露的上下车地点、大致的时间,以及可能露出的出租车牌等信息,在纽约城市出租车和豪华轿车委员会对外公布的那份大数据包里,很快就锁定了明星的行踪,甚至包括他可能偷偷去跟谁会面、付没付小费等等。
比如他分别找到布莱德利·库珀和杰西卡•阿尔芭的行踪,如下图所显示。
![](http://mmbiz.qpic.cn/mmbiz_jpg/P1chKeAo8dokibbb3kY6CpRJE0Dl7vG1zUiaic2KX8ibXCPtU4IXicI3dDUWyzN6EtgPPSHuNpwEs0rmMW0UtTbnJ2w/0?wx_fmt=jpeg)
![](http://mmbiz.qpic.cn/mmbiz_jpg/P1chKeAo8dokibbb3kY6CpRJE0Dl7vG1zKAIrJTJVByeTxZGMsjU33ROic2roSYYNMsRumV9Njl31ePQl2geSZHw/0?wx_fmt=jpeg)
根据Anthony Tockar的发现,布莱德利•库珀打了一辆车应该是去一家叫Melibea的餐厅吃饭,他打车的目的是为了要避开狗仔队,结果纽约出租车委员会把他的老底全透露了。布莱德利•库珀这次车费10.5美金,但是他居然没有付小费!
另外一位杰西卡•阿尔芭又怎么样呢?她被发现从Trump SOHO这家酒店走出来打了一辆车去了某个地方,居然也没有付小费!可能中国人对小费没有太大概念,在美国是有付小费的文化。可以说付小费是一件天经地义的事情,尽管不会有任何法律问题,但是道德上还是不好看的。公众人物在镜头前辛苦经营的光辉形象,就栽在这一点小费上,非常没有面子。
我想是不是卓伟这样的中国第一狗仔也需要掌握一些大数据的知识。这年头光靠辛苦地在街上溜达寻找明星的蛛丝马迹,还真不如在家鼠标一点,大数据一分析,靠谱又轻松。
![](http://mmbiz.qpic.cn/mmbiz/P1chKeAo8dpuhdeFneeYibmdoL5wf0jAicZ66Xgib2tLNq6rL0JwDvRfMuPNVzTBdupYhk0rt66gEKDZWKfiaj44HA/0?wx_fmt=png)
普通人也逃不过
当然,你可能会想,明星的行踪自然很容易暴露。我是一个普通人,丢到大街上都没有人认识,你怎么找我呢?
Anthony Tockar自然会有办法。他搜索了从半夜12点到凌晨6点在曼哈顿著名成人俱乐部附近的全部上下车信息,包括时间地点等,如下图所示。
![](http://mmbiz.qpic.cn/mmbiz_png/P1chKeAo8dokibbb3kY6CpRJE0Dl7vG1ztFynqD3RE8l4qkkVotrbUbPGsW9r6Vh5OsibCFic1JW8hAHuOhcWibkGw/0?wx_fmt=png)
其中黄色的点表示很多次出租车都准确地停在这个位置,然后客人下车。这很有可能是一位熟客。于是Anthony Tockar就挑选了几条GPS线路进行跟踪,通过这个数据,他顺藤摸瓜找到了这些人的全部个人信息。
感谢google地图高清晰的画质,Anthony Tockar很轻松地锁定了这些人的家庭住址,通过搜索家庭住址,就能发现这个人的姓名和邮件等信息,当然也可以评估得出他的房屋价值、计算得出家里几口人、是否在法院或警察局有案底、开公司的相关信息、从事的行业等等。当然,顺手再搜索一下与这个地址有关的出租车路线,会发现这位主人还经常去其他的成人俱乐部等等。
对于Anthony Tockar来说,这一切只是他从事数据研究的一些方法而已,不会暴露这些人的隐私。但是Anthony Tockar表示,如果掌握这些数据的人不是科学家,而是竞争对手、小偷、或者任何想要跟踪你的人,那么你的隐私早就被牢牢掌握在别人手里你还什么都不知道。
不过话说回来,像纽约城市出租车和豪华轿车委员会这样的机构,他们即便是掌握了大家的数据,也不会年年公布,也不太懂数据挖掘。而更多的高科技公司,则会把我们的数据进行商业化,则要可怕很多。
![](http://mmbiz.qpic.cn/mmbiz/P1chKeAo8dpuhdeFneeYibmdoL5wf0jAic8tG3icBuERia0sL7D7VtQFZmKr34CiaGnKK3LibWtFHdia766giaS7FaFBEg/0?wx_fmt=png)
Uber也知道你的隐私
Uber毫无疑问是一家数据驱动的高科技公司,共享出行就是建立在分析乘客和司机的行程路线上,然后进行配对,已达到最好的经济效果。但是Uber的数据科学家们可不仅仅只是在研究乘客和司机的配对,因为他们能获得很多第一手的数据,而且这些人还喜欢对此进行深挖。
![](http://mmbiz.qpic.cn/mmbiz_jpg/P1chKeAo8dokibbb3kY6CpRJE0Dl7vG1zjfMhUmSia8fdpaVvqvicGIJe9picMLFCZ4miaGJpo8icXSeh4aqbQ8zXvNQ/0?wx_fmt=jpeg)
根据贝叶斯算法,Uber的大数据团队可以大致估算出你这次叫车大致会去多远的地方,以及预测你要去的地址。Uber的算法根据三个重要数据,第一是这个客人的历史用车信息,第二是其他客人的用车行为参考,第三是一些特定区域的热门指数等。
这个客人以前经常去哪儿?这个地点是一个酒吧还是一个办公楼?这里的生意如何?是个热门的目的地吗?这些就是算法需要的一些基本信息,当然还需要结合一些合理的逻辑推理,比如上午11点叫车,这肯定不是去娱乐场所;比如距离,你以为你提前一点下车Uber就不知道你最后去的是哪里吗?
根据美国媒体的报道,Uber被怀疑在乘客下车之后,还在搜集乘客的GPS信息。因为Uber的APP可以在苹果设备的后台运行时,还不断地搜集用户的地理位置信息等。就算是用户关掉了手机上的GPS功能,依然可以通过手机的IP地址知道这个人的所在地。Uber表示希望通过更多地获取用户的信息,来洞悉这个用户的真实想法,以便更好地提供服务。
研究还表明,Uber可以通过获取用户的电话薄获取更多的联系人信息,进而可以帮助它更好地进行推广。这一点已经被Uber的相关负责人证实,承认了他们的确会在推广新的APP或者应用的时候获取老客户的电话薄,但他们强调这是经过了用户的允许。
可能有人会觉得这也是正常的商业行为,顶多是处于隐私的灰色地带,那么Uber接下来做的两件事情真的会让你觉得被冒犯了:
Uber可以通过后台的GPS数据,调取并跟踪曾经写过自己负面报道、又恰巧用过这款软件的记者,一个员工还在Uber内部公布了这个记者的相关数据,Uber内部有一个自己人才使用的程序“God View”,Uber的员工可以通过这款软件跟踪用户而不被察觉。
![](http://mmbiz.qpic.cn/mmbiz_jpg/P1chKeAo8dokibbb3kY6CpRJE0Dl7vG1zpTExQWIIev18bupbtGEHoGawNsHMGbicBVe6jmiaCDYK7qk4TuZZaic4Q/0?wx_fmt=jpeg)
当然这里以Uber举例并不是只有它一家会做上述事情,它也只是众多大数据驱动的高科技公司之一,有很多的公司对数据的深度挖掘、对用户的隐私研究要比Uber做得好得多。今天只是想探讨我们平时并不在意的GPS信息,就能透露如此众多的秘密,真是值得我们警惕。