(点击上方公众号,可快速关注)
编译:伯乐在线 - CrazyEric,英文:Yitaek Hwang
(一周不同日子里旧金山的停车困难度模型,越红代表停车越困难)
据英国每日电讯报报道,平均每位司机在找车位上要花费 2549 个小时,也就是106 天。这些是英国的统计数据,但是我打赌住在美国大都市的司机花在找车位上面的时间并不会比这个少。
今年 2 月份,Google 悄悄地在安卓版谷歌上针对美国 25 个主要城市推出了一个新的停车功能。如果你在这些城市范围内,你会看到一个红色的停车标志表示着停车位紧张,以此来帮助你规划你的出行。
这次更新有趣的部分是,它不依赖联网的停车状况数据,因为(联网数据)经常由于某些车主违规停车或者提早离开车位,而导致提供不完整或者错误的信息。Google 地图用了另一种替代方案,就是结合众包数据以及相对简单的机器学习算法来给停车困难度做分类。
Google 同时也提到,他们在早期的一个实验中发现“公共交通出行模式按钮的点击率有显著上升”,也就意味着知道了停车难度信息的用户更容易去考虑公共交通出行而不是驾车。仅仅通过提示停车难度,在城市里就可以鼓励人们多乘坐公交少开车,这有可能会缓解交通问题。
机器学习方案
为了训练算法,Google 通过测量用户停车所需时间来分类找车位是“困难”还是“简单”,在把这个信息和位置数据关联之后,Google 需要过滤掉那些误报的信息(false positives):用户停在私家车位里或者乘坐出租车到达,会让系统误以为那个区域很好停车。
为了解决这个问题,Google 决定,如果用户像上图所示那样在某个位置绕来绕去,那么这通常意味着停车困难。为了识别出这种行为,他们对比了用户预计抵达的时间和实际抵达的时间的差异,差异越大,也就意味着找车位越困难。Google 同时还添加了其它特征,比如每天时间的变化、日期以及历史停车数据来调校模型。
Google 用了简单的 Logistic 回归模型来训练算法。他们解释说 Logistic 回归很适合这个案例,因为:
Google 最新的停车困难度预测,带给我们两点在智慧城市建设方面的经验:
看完本文有收获?请转发分享给更多人
关注「大数据与机器学习文摘」,成为Top 1%