关联阅读
(点击标题即可)
从零开始,成为数据科学“大咖”
【必看】数据分析师必懂的10种分析思维。
干货 :如何用大数据分析创造商业价值
做数据挖掘工作需要具备哪些思维原理?
音乐作伴,轻松阅读!
在Google、Amazon、Facebook、Uber、Airbnb等公司成功的背后,有这样一批人:他们可以将大量的数据变为有价值的金矿,例如,搜索结果、定向广告、准确的商品推荐、可能认识的好友列表等。没错,他们就是被誉为
「今后10年IT行业最重要的人才」
——
Data Scientist(数据科学家)
。
现在的互联网行业,越来越多的企业对数据科学家求贤若渴。
虽然数据科学家的需求一直在快速增长,但事实是在业内还没有对数据科学家的准确定义。有人开玩笑说,「数据科学家就是住在硅谷的数据分析师」,甚至有人画了这样的漫画:
没错,找到一位优秀的数据科学家和找到一个理解数据科学家是做什么的人一样难。
要理解数据科学家是做什么,首先要理解人尽皆知却总被误读的大数据:
大数据不是大量的数据,而是复杂的数据。
《大数据时代》联席作者Kenneth Cukier在Ted上的热门演讲:《Big data is better data》,告诉你大数据驱动技术和设计的未来,以及大数据的「好」与「坏」。
(视频时长16”,建议在WiFi环境下观看)
这些解决复杂数据带来的问题的人,就是数据科学家。
那么,数据科学家在工作中是怎样解决问题的呢?
分享两个共享经济的典范:Airbnb和Uber——在运用大数据方面的经验。
1、Airbnb
在Airbnb,工程师要解决这样一个问题:如何让用户了解一个自己从来没去过的地方?如何知道哪个地方最适合自己的旅行?
Airbnb拥有海量的独有数据,包括旅游地、用户评论、房源描述、社区信息等,Airbnb还有一支队伍去各地和当地人交流,搜集所有的相关历史数据。Airbnb的数据科学家是这样运用数据的:
(Airbnb accommodations (red) and traditional accommodations (blue) in San Francisco)
-
当用户在搜寻一个住宿的地方时,Airbnb的「location relevance model」会通过Airbnb社区告诉未来的客人哪里是更好的住宿地。
-
当用户在寻找想体验的新地方时,「Airbnb Neighborhoods」会将当地的内容编辑亲手整理的必备资料和专业的照片呈献给用户。
-
Airbnb的「discovery team」通过自然语言处理和机器学习来为用户搜索关键词提供更准确的推荐。
-
Airbnb甚至造了一个叫做「AT-AT」的复杂工具,帮助用户更深入地了解某个地点,包括地理信息无法描述的文化或宗教上的区分。