大数据文摘作品,转载要求见文末
作者 | Greg Michaelson
数据机器人实验室(DataRobot Labs)总监
编译团队 | 万如苑,弋心
美联航“暴力赶客”引发全世界媒体口诛笔伐,美联航被迫作出道歉,表示将承担全部责任。而利用机器学习预测,这种悲剧本来可以被避免。
应付不可预测地改变计划的乘客是航空公司面临的许多后勤挑战之一:个人的行程常有意外,而当个人行程累计,飞机上很可能只有一半的乘客。这让航空公司不满,造成了额外的污染,也是美联航等航空公司超售的主要原因。
不幸的是,航空公司处理他们面对的困难时并不总是很优雅,正如美联航“暴力驱客”的故事那样。一个特定的航班被超量预订,没有人想放弃他们的机票来换取航班信用积分。在所有可能的选择中,美国联合航空公司决定强制执法,将一名倒霉的乘客拖下飞机。 这个事件的视频最后被发布到了YouTube上,引发了海啸般的反应。
事实上航空公司的超售有着很好的理由:它具有良好的经济意义。飞机上有多少座位就只销售多少座位不仅不利于企业,而且对环境也不好,对乘客也不利。
上边的漫画说明:很多人想买机票去某些地方。飞机有一百个座位所以只出售100个座位。但是一些人改变了他们的主意。他们被收取高额的改签费用,否则就会失去整张机票。飞机上只有一半的乘客让航空公司不满,造成了额外的污染,也让他们提高了票价。
航空公司依靠大数据,收集有关所有客户及其行为的海量数据和信息。他们知道你什么时候飞,你往哪里飞,你喜欢什么座位,你家在哪里,还有其他更多的信息。航空公司应该(有时确实这么做了)使用数据科学来最大限度地提高您的舒适度,幸福度,最终将盈利最大化。使客户更快乐对企业有利。航空公司应该使用机器学习来解决问题。机器学习只是使用历史数据来构建一个可以对未来事件做出预测的模型。例如,既然我的航空公司过去已经飞了数以千计的班次,我的数据应该告诉我明天航班被超额预定的可能性。
也许航空公司要解决的最简单的问题是估算不来乘机的人数。解决这个问题最简单的办法就是把历史上没来乘机的人数统计出来,然后取平均值。更复杂的解决方案可能会随季节调整; 例如,冬季月份可能意味着道路状况会导致更多的乘客缺席。最复杂的方法可能包括分析交通和天气数据以预测取消预定和放弃座位的概率。有趣的是,在过去几年,我见过的超售情况的次数确实有所下降,所以航空公司在这方面的做法可能越来越复杂了。
即使是最复杂的模型,系统中也总会有一些不可预测性。幸运的是,只有在您找不到愿意乘坐稍后航班的人的情况下,超额预订才会成为一个麻烦。航空公司通常会提供飞行券甚至现金来激励人们乘坐稍后的航班。
然而,在这次事件中,这个方法没有奏效。航空公司可以支付一大笔钱(超过1000美元的现金)给乘客,从而说服他们搭乘稍后的航班。我不能想象那架飞机上没有一个人愿意为了1000美元放弃座位。我的猜测只能是航空公司补偿的不够罢了。
机器学习可以很容易地用于预测愿意以特定的补偿率放弃座位的人数。那么这个优化问题就变得很简单了。
鉴于机场发生的事故数量之多,每个航空公司都应该有一个自动系统,以便在出现某些情况时向主管发出警报。例如,如果登机口的工作人员无法找到超售航班上愿意放弃座位的乘客,则应将信息自动发送给主管。如果乘客已经登上飞机,但其中有些乘客不得不被赶下去,则应立即自动通知主管。
当然,就三大航空公司来说,有足够的数据可以估算出变更航班的人数。 如果任何一家公司收回这项政策——这个政策真的是过去的糟粕——他们就会极大地超越竞争对手。退一万步来说,凭什么不取消超售航班的改签费用?
虽然能够识别那些可能会提供座位的乘客会很有用,但是了解客户为什么这么做会更有价值。这一点数据科学也可以做到。征信机构一直在通知客户为什么他们的信用评级多年来总是下降——主要是通过监管。同样的技术也应该用来帮助航空公司了解客户为什么做出那样的选择。(据我所知,DataRobot是唯一可以使这些原因代码用于所有现成模型的机器学习平台)
航空公司建立的预测模型都不会持续很长时间,因为世界在不断变化。人们会改变,他们的习惯会改变,住所也会改变。这意味着这些模型会比其他类型的模型老化得更快。能够快速地迭代现有的模型进行改进和更新是保持领先的关键。
事实是,做数据科学很困难。因为很难找到同时有数学技巧和编码能力的人,并且他们还要清楚怎么才能做好航空公司业务。不仅如此,商界人士和管理人员也很难在自己的业务中找出利用这项技术真正的商业机会。如果他们不理解,他们就不会优先考虑它,所以也就不会做这件事。我看到这种情况发生在数百家公司里,航空公司也没有什么不同。
在大多数情况下,手工编码的预测模型是一种过时的建模方法。像DataRobot这样的工具可以让商业分析师像数据科学家一样能够在短时间内顺利地建立预测模型。这意味着积压的项目可以尽快的完成,能够避免上述事故的人工智能将得以建立,而且竞争对手会疑惑究竟哪里出了错。自动化正是每年建立几个模型和每年执行几百个人工智能解决方案的区别所在。它也是把你的客户从飞机上拖下来和把你大笔的钱存到银行之间的区别。
一人一笔 | 数据团队建设“全景报告”
大数据文摘将结合一系列专访和问卷,与清华数据科学研究院联合发布《数据团队建设全景报告》。
在数据驱动时代,不同行业、不同公司处在数据团队建设的哪些阶段?数据团队应该如何运作?
如果你和数据团队一起工作,或者希望了解其他数据团队的发展现状和趋势——
那么请您花费5分钟时间,点击“阅读原文”填写问卷,帮助我们完成这次调研。
你将获得:
*《数据团队建设全景报告》最终完整版;
* 大数据文摘2017年度电子杂志
原文地址: https://www.datarobot.com/blog/did-big-data-cause-united-airlines-to-drag-a-screaming-passenger-off-a-plane/
如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 | bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:[email protected]。
StackOverflow6万程序员大起底:揭秘行业薪酬和圈内槽点