专栏名称: Python程序员
最专业的Python社区,有每日推送,免费电子书,真人辅导,资源下载,各类工具。我已委托“维权骑士”(rightknights.com)为我的文章进行维权行动
目录
相关文章推荐
Python爱好者社区  ·  国企官网被挂上“码农的钱你也敢吞,还钱” ·  昨天  
Python开发者  ·  DeepSeek 下棋靠忽悠赢了 ... ·  3 天前  
Python爱好者社区  ·  “给我滚出贵大!”郑强出任贵州大学校长,打算 ... ·  4 天前  
Python爱好者社区  ·  python接私活,yyds ·  2 天前  
Python爱好者社区  ·  DeepSeek 最新中国大学排名 ·  2 天前  
51好读  ›  专栏  ›  Python程序员

数据科学和机器学习2017研究现状

Python程序员  · 公众号  · Python  · 2017-11-08 08:10

正文

Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。

今年,我们首次进行了全行业调查,全面了解数据科学和机器学习的现状。我们收到了超过16,000个答复,了解了哪些人在从事数据相关工作,在各行业机器学习的最前沿发生了什么,以及新的数据科学家如何能够最好地进入该领域。下面的报告分享了一些我们的主要发现,采用了交互式可视化的形式,以便你能轻松地获取数据,确切了解到你想知道的内容。 以下是一些示例:

  • Python可能是最常用的工具,但统计学家更常使用R。

  • 数据科学家平均年龄在30岁左右,但这个值在不同国家之间是不同的。例如,印度的受访者的平均年龄比澳大利亚的小大约9岁。

  • 受访者中比例最高的最高学历为硕士学位,但最高工资阶层(150K +)的人群大多数都有博士学位。

我们已经在Kaggle上分享了完整的匿名数据集(https://www.kaggle.com/kaggle/kaggle-survey-2017 ),供您下载和探索。也欢迎参与其中分享数据分析与代码(https://www.kaggle.com/amberthomas/kaggle-2017-survey-results ),以助我们继续推进数据科学和机器学习的现状分析。参与还可赢取现金奖哦。(如果您对Kaggle不甚了解,请参阅文末简介)

哪些人在从事数据相关工作?

获知从事数据相关工作的人的信息有很多种方法,不过我将从介绍一些数据科学工作者们的职业和背景信息开始。

您的年龄?

平均来说,调查对象约30岁,但这个数值因国家而异。例如,印度受访者的平均年龄比澳大利亚受访者约小9岁。

您的就业状况如何?

您的职称是什么?

虽然我们将使用代码来分析数据的人定义为“数据科学家”,但是我们发现有大量其他的职称也属于数据科学领域。例如,在伊朗和马来西亚,数据科学工作者较多使用的职称是“科学家或研究人员”。

您的全职年薪是多少?

虽然在我们的调查中,“工资和福利”的排名不如“专业发展的机会”重要,但了解合理的工资区间还是很有意义的。在美国,机器学习工程师工资最高(平均而言)。

您的最高学历?

那么,你需要获得更高一级的学位吗? 一般来说,数据科学工作者中获得硕士学位的比例最高。但那些高薪阶层($150K - $200K和$200k +)基本都有博士学位。

综上所述,平均调查对象是一个30岁的硕士学位,从事数据科学家工作,年薪约55000美元的人。 但实际上人是无法进行平均的。前述几个人口统计学问题仅仅从表面上表明了Kaggle的数据科学界在年龄,性别,居住国家,职称,薪水,经验水平和正规教育方面的分布。

数据科学家在工作中做什么?

我们将数据科学家定义为“编写代码来分析数据”。当问及这些人的日常工作内容时,我们发现了如下要点:

工作中会使用哪些数据科学方法?

逻辑回归是除军事和安全外其他所有行业最常用的数据科学方法,而在军事和安全行业更常使用的是神经网络。

工作中使用什么语言工具?

Python是数据科学家最常用的数据分析工具,但统计人员更青睐R。

工作中使用什么类型的数据?

关系数据是除学术界、军事和安全行业外所有行业最常用的数据类型,而在这些行业更常使用的是文本数据。

代码如何共享?

尽管比例最多的受访者使用Git共享代码,但大公司的员工更倾向于不使用云端而是使用文件共享软件(如Email),而小型公司的员工则选择通过云共享来提高灵活性。

工作面临哪些障碍?

啊,又见脏数据。一般来说,似乎脏数据是数据科学领域工作人员最常遇到的问题。一个例外是那些必须细致的数据库工程师。除了脏数据、公司政治,缺乏管理和/或财政支持是数据科学家面临的真正难题。

您可能已经注意到,许多行业的受访者表示,他们的组织中很缺乏数据科学人才。这意味着想要进入数据科学行业恰逢其时!请继续阅读,了解我们目前就业的受访者是如何走上正轨的。

新的数据科学家如何进入这个领域?

当开始一条新的职业道路时,参考其他人如何成功是有帮助的。我们询问了在数据科学行业工作的人们是如何成功的。以下是一些我们喜欢的建议:

您会推荐新的数据科学家先学什么语言?

每个数据科学家对应该先学什么语言都有自己的想法。事实证明,只使用Python或R的人觉得他们的选择是正确的。但是如果问同时使用R和Python的人,他们会大概率推荐Python。







请到「今天看啥」查看全文