专栏名称: 51CTO
51CTO官方公众号——聚焦最新最前沿最有料的IT技术资讯、IT行业精华内容、产品交流心得。本订阅号为大家提供各种技术干货,还会不定期的举办有奖活动,敬请关注。
目录
相关文章推荐
新浪科技  ·  【#OPPO ... ·  5 天前  
51好读  ›  专栏  ›  51CTO

谷歌使用众包和机器学习攻克“停车难”,Google Earth 开源

51CTO  · 公众号  · 科技媒体  · 2017-02-06 11:44

正文


导读

 “停车难”问题困扰车主的一个大问题。最近,谷歌研究员们开始使用机器学习的方法来攻克这一难题。 



开车的时候,有大部分的时间要么是花费在堵车上,要么是花费在寻找停车位上。谷歌地图和 Waze 一类的产品,有一个长期的目标,那就是帮助人们更容易也更高效地导航。但是,直到现在为止,还没有一个工具能解决我们已经习以为常的“停车难”难题。


上周,谷歌地图在美国25个城市发布了一个面向Andriod的新功能,提供关于目的地附近的停车情况预测,以便司机能作出相应的计划。提供这一功能需要解决以下一些主要的难题:


  1. 空车位的情况根据时间、星期 、天气、特殊事件、假期等因素是高度变化的。问题如此复杂,所以关于免费停车位,目前几乎没有实时的信息。


  2. 即使是在那些用联网的停车计时器提供空车位信息的区域,这些数据并没有包含那些非法停车、持证停车或者提前离开的停车信息。


  3. 道路组成的是一个二维的图表,但是,停车图表的结构可能会是更加复杂的,车流的交汇包含多层信息,很可能包含了不同的布局。对于停车来说,供给与需求都是不断变化的,所以,即便是最好的系统也会面临着一建好就过时的风险。


要解决这些挑战,谷歌的研究员结合了众包(crowdsourcing)和机器学习技术,开发了一个系统,为司机提供关于目的地停车的信息,甚至还能帮助你决定出行方式。


在一个预览版本中,他们发现,出行方式按钮的点击率有显著的提高。这意味着,用户在对停车难的问题有了额外的了解后,他们会更愿意选择公共交通而不是驾车出行。


要为解决停车难的问题设计一个算法,需要三方面的技术:通过众包的方法获得地面实况数据;一个恰当的机器学习模型,以及一系列稳定的特征(features)来训练模型。


地面实况数据

搜集高质量的地面实况数据对于任何机器学习解决方案的开发来说通常都是一个关键的难题。谷歌的做法是,在不同的地点和时间,对司机进行采访,看他们是否遇到了停车难的问题。但是,我们发现,面对这样主观的问题,通常会得到相互矛盾的答案:在某一特定的地点,有人可能会觉得很“容易”找到停车位,但是其他人会觉得“很难”。


模型特征

有了这些可用的数据,下一步就是选择用来训练模型的特征。运用集体的智慧,该项目从愿意分享个人定位数据的用户中收集匿名信息,这已经是实时交通、热门停车时间和访问持续时间测量的重要信息来源。


谷歌研究员称,他们很快便发现,即便有了需要的数据,但是还是会有一些独特的挑战悬而未决。比如,如果有人在自己门前或者私人的停车位停车,系统不该错误地认为这里的停车位是可用的。用户搭乘出租车到达,可能会造成门前停车很多的假象,类似的,公共交通用户可能会被系统认为是在公家车站停车。这些错误的认知,都会误导机器学习系统。


因此,系统的设计需要更强大的聚合特征。不奇怪,其中一个功能的灵感来自谷歌所在的 Mountain View。如果Google导航观察到许多用户在午餐时间开着车在市中心绕圈,它表明停车可能非常困难:


谷歌的研究员在思考,如何把这些关于停车难的“蛛丝马迹”作为一个特征来进行训练。在这一例子中,研究员考虑了用户开车到门口和他们实际到达之间的差异,将绕圈、停车和步行作为参考因素。如果多数用户在二者之间所用的时间存在显著差异,就被认为是遇到了停车难的问题。


从那里,我们继续开发更多的功能,考虑到任何特定的目的地,停车位置的分散,日时钟和日期依赖的停车(例如,如果用户在清晨接近目的地,但是更远的繁忙时间?),历史停车数据等。


以这一点为基础,研究员进一步开发了更多的特征,将目的地的特殊性、停车位的分散、决定停车难问题的时间和日期、历史停车数据等都考虑了进来(例如,如果用户在早上停车离目的地比较近,但是在更繁忙的时候,只能停得远一些,会怎么样?)最终,他们得到了近20个不同的特征、4个模型。接下来就是调整模型性能了。


模型选择&训练

针对这些特征,研究员使用了一个标准的回归机器学习模型。这种选择有几个原因:首先,逻辑回归的原理是大家所熟知的,并且,在训练数据中,它对噪音是有弹性(resilient)的;第二,很自然地,可以将这些模型的输出解释为停车难的概率,然后可以将其映射成描述性术语,如“停车位有限”或“轻松停车”;第三,很容易理解每个特定特征的影响,这使得验证模型是否合理更加容易。例如,当我们开始训练时,我们许多人认为上述“蛛丝马迹”的功能将是“silver bullet”(良方),可以解决所遇到的难题。让人吃惊的是,情况根本不是这样,事实上,它是基于停车位置的分布特征的,这是停车难的最有力的预测之一。


结果

谷歌在官方博客中写道:使用我们的模型,我们能够生成关于任何地点和时间的停车难度的估计。下图给出了我们的系统的输出的几个例子,用于提供给定目的地的停车难度估计。例如,星期一上午,整个城市停车都是困难的,特别是在最繁忙的金融和零售区。在星期六晚上也很困难,但主要是在餐馆和景点地区。

谷歌的研究员说:“我们很高兴有机会根据用户反馈继续提高模型质量。如果我们能够更好地了解停车难度,我们将能够开发新的和更智能的停车辅助系统, 对于ML的未来应用,我们都很兴奋,希望AI能带来更让人享受的交通体验。”


Google Earth 将开源

春节期间,谷歌还宣布了另外一件事:2017年1月30日,Google官方博客将开放源 Google Earth 企业版(GEE)。这一企业产品允许开发人员构建和托管自己的私有地图和3D地球仪。在这个版本中,GEE Fusion,GEE Server和GEE Portable Server源代码(全部470,000+行!)将于3月份在 Apache2 许可证下在GitHub上发布。


 

Google是在2015年3月宣布弃用和终止企业版销售。


为了给客户足够的时间过渡,Google提供了两年的维护期,这一维护期将于3月22日结束。Google称,开源GEE将给予客户社区继续改进和推进该项目。Google表示, Google Earth Enterprise客户端、Google Maps JavaScript API V3 和Google Earth API并不开源。


本文转载自新智元(ID: AI_era)