专栏名称: 大数据与机器学习文摘
分享大数据技术相关文章和资源
目录
相关文章推荐
人工智能与大数据技术  ·  程序员又又又要失业了?有反转!Google ... ·  3 周前  
数据派THU  ·  NeurIPS 2024 | ... ·  6 天前  
大数据文摘  ·  3名高中生中了AI顶会NeurIPS!来自人 ... ·  1 周前  
CDA数据分析师  ·  【干货】竞品分析怎么写?戳此了解深度指南! ·  1 周前  
51好读  ›  专栏  ›  大数据与机器学习文摘

谷歌地图基于 ML 的停车难度预测

大数据与机器学习文摘  · 公众号  · 大数据  · 2017-06-05 10:29

正文

(点击上方公众号,可快速关注)


编译:伯乐在线 - CrazyEric,英文:Yitaek Hwang



(一周不同日子里旧金山的停车困难度模型,越红代表停车越困难)


据英国每日电讯报报道,平均每位司机在找车位上要花费 2549 个小时,也就是106 天。这些是英国的统计数据,但是我打赌住在美国大都市的司机花在找车位上面的时间并不会比这个少。


今年 2 月份,Google 悄悄地在安卓版谷歌上针对美国 25 个主要城市推出了一个新的停车功能。如果你在这些城市范围内,你会看到一个红色的停车标志表示着停车位紧张,以此来帮助你规划你的出行。



这次更新有趣的部分是,它不依赖联网的停车状况数据,因为(联网数据)经常由于某些车主违规停车或者提早离开车位,而导致提供不完整或者错误的信息。Google 地图用了另一种替代方案,就是结合众包数据以及相对简单的机器学习算法来给停车困难度做分类。


Google 同时也提到,他们在早期的一个实验中发现“公共交通出行模式按钮的点击率有显著上升”,也就意味着知道了停车难度信息的用户更容易去考虑公共交通出行而不是驾车。仅仅通过提示停车难度,在城市里就可以鼓励人们多乘坐公交少开车,这有可能会缓解交通问题。


机器学习方案


为了训练算法,Google 通过测量用户停车所需时间来分类找车位是“困难”还是“简单”,在把这个信息和位置数据关联之后,Google 需要过滤掉那些误报的信息(false positives):用户停在私家车位里或者乘坐出租车到达,会让系统误以为那个区域很好停车。



为了解决这个问题,Google 决定,如果用户像上图所示那样在某个位置绕来绕去,那么这通常意味着停车困难。为了识别出这种行为,他们对比了用户预计抵达的时间和实际抵达的时间的差异,差异越大,也就意味着找车位越困难。Google 同时还添加了其它特征,比如每天时间的变化、日期以及历史停车数据来调校模型。


Google 用了简单的 Logistic 回归模型来训练算法。他们解释说 Logistic 回归很适合这个案例,因为:


  • 算法很好理解并且对噪声数据的容错能力强;

  • 模型的解释很直观(停车困难度可以被映射到“简单”或者“停车困难“)

  • 验证每个特征对于模型的影响相对简单。令人意外的是,停车位置的分布是停车困难度最重要的变量,比预计到达时间和实际到达时间的差异更重要。


Google 最新的停车困难度预测,带给我们两点在智慧城市建设方面的经验:


  • 第一,不是所有的智慧城市应用都需要传感器。有时候数据就在那里,我们不需要借助于添加新的传感器去获取那些信息。

  • 第二,虽然神经网络目前很流行并且准确率很高,但有时候更简单的算法也能很好地满足需求。


看完本文有收获?请转发分享给更多人

关注「大数据与机器学习文摘」,成为Top 1%