专栏名称: 数据分析
专注大数据,移动/互联网,IT科技,电子商务,数据分析/挖掘等领域的综合信息服务与分享平台。合作|约稿请加qq:365242293
目录
相关文章推荐
51好读  ›  专栏  ›  数据分析

怎样成为一个数据科学家 : 针对大学毕业生的指导

数据分析  · 公众号  · 大数据  · 2017-02-10 17:25

正文

刚毕业的大学生们,恭喜你们!欢迎成为劳动者的一员。在你所有可能申请的工作中, “数据科学家”这个风骚无比的职位也许最难得到的一个,同时也许是最具有潜在丰厚回报的一个 。但是别害怕:Datanami在这里以一个实际数据科学家从业者的身份给你一些建议,告诉你怎样成为他们中的一员。


开始成为数据科学家的第一条建议是别被这个职位的要求所挫败。没有一个刚毕业的大学生能满足即是数学\统计天才,又精通市场、产品、网络安全,还是专业的Python、Java、R程序员。(提示:这就是为什么数据科学家被称为独角兽——因为他们不存在)


“在数据科学的屏蔽伞下隐藏着许多的技能,我们不能期望一个人能精通里面的所有东西 。” Booz Allen Hamilton的数据科学家Kirk Borne说( http://www.boozallen.com/)“数据科学家人才短缺的最好解决方案是组成一个数据科学家团队。所以我建议有应该精通两个多个领域的同时对其他领域也能有一个基本的了解”


根据Kirk Borne所说的,你需要抓紧好好温习数据科学的核心技能, 例如,机器学习、信息管理、统计学以及数据信息可视化。同时你也需要懂得数据库的周边知识和数据结构,最少掌握几门像Python、R、SAS、Spark这样的编程语言。熟悉图分析、自然语言处理、最优化也能使你的数据科学简历更好看一些。还需要进行数据建模和一些模拟练习。


“对学习物理学、生物学、天文学、化学或其它科学的学生来说,一个好消息是他们可以很容易地将它们的科学技能转换到数据科学这一领域”他说。

你应该返回学校继续修炼吗?


尽管最近数量可观的博士级别的数据科学编程者的出现一定程度上解决着这个“独角兽”短缺的问题,可是你不想再在学校待太长时间。一个硕士学位就已经足够了。Borne如是认为。


“最近越来越多的机构愿意雇佣既有一定课堂知识,又有一定实际经验的中等学位的数据科学家。”他对Datanami.说“学位最终对职业提升是十分重要的(对于一个包含商业分析的MBA来说也许是最重要的),所以要重视获得你的学位 ——它只是在你刚开始从事数据科学家职业之前不是必须的。”

Hadoop服务提供商Qubole ( http://www.qubole.com/)的CEO也针对评估做出了回应


。虽然具有所需的如数学、数据挖掘、统计学、概率论、SQL等坚实背景,数据科学家还是有很多路要走,最终要从象牙塔进入产业界来获得最重要的元素:有趣的数据。


“在产业界去获得这些技能是十分重要的”Apache Hive联合创造者Thusoo说“你有坚实的知识基础,但是为I了运用这些技能你需要获得数据。很多有趣的数据集是和现实产业紧紧绑在一起的。现在不再像20或30年前那样——绝大多数的数据都在研究机构”。


现在顶级的数据科学家去学校不再是研究成为一个数据科学家,而是为了学习成为一个计算机科学家、天体物理学家(就像Borne)、化学工程师、或者理论物理学家。随着世界的前进,这些艰涩的科学和数学技能被证明对于处理日益增长的数据是无价的、弥足珍贵的。


“围绕数据进行思考是第一要义”Thusoo说“现成的工具和编程语言之类的你能很容易学会使用。无论是Python实现的、Scale实现的、Java实现的还是其他语言实现的,随机森林算法就是随机森林算法。你需要理解的是在哪里使用适合的技术,而不是怎样用代码实现这些技术。”


南方卫理公会大学统计科学的副教授、数据科学硕士项目主任Dr. Monnie McGee说在大数据领域统计学也扮演着很重要的角色。


“统计和计算机科学都是很重要多的技能” 她说“然而作为一个统计学领域的个体,我偏向地认为在数据科学领域统计训练对于一个个体来说是相当重要的”。


有统计方面的训练并不仅仅是能使用正确的统计方法或运行相关的软件,她说,“我的意思是有U能力做出能被测试的假设,适当的采集数据,设计方案评估数据中的噪点和信息,在问题的上下文环境层面解释结果。”她说。


耐心,年轻人


不要期望在你22岁时就能解决世界上的数据科学问题。实际上要成为一个数据科学家需要多年的训练和经验,为数众多的失败,不被打到的毅力。


伊利诺斯理工学院计算机科学与数据科学硕士项目主任Shlomo Engelson Argamon说,要想在数据科学领域做出成绩需要很多不同领域的经验。“需要数目繁多条目繁杂的工具和技能”Argamon继续说道“真正深入研究它们需要消耗多年多的时间和经验,对于一个刚刚踏入数据科学领域的人,关键是抓住其中每一个领域的基础原理,有能力使用一两种方法和工具。倘若一个人基础知识掌握的比较好的话,其它工具和叫技术会很容易地学会。”







请到「今天看啥」查看全文