编译|机器之心(ID:almosthuman2014)
Python以其上手快,开发生态成熟以及编程方便几个优点迅速成为最受欢迎的机器学习语言,这对于零基础想学习机器学习的小伙伴来说绝对是个好消息。 你应该挑选正确的工具做机器学习。
你正在做的特定预测模型问题要求特定的编程语言、库、甚至是机器学习算法。但如果你只是刚开始呢?还在找一个平台学习并实践机器学习呢?
在此文章中,你会发现 Python 正在成为做机器学习逐渐流行的平台,在采用率与能力上极可能超过并推翻 R 语言。
读完该文章后,你将会明白:
对 Python 机器学习的搜索量增长迅速,已经超越了 R 语言机器学习的搜索量;
Python 机器学习招聘的比例正在增长,已经超越了 R 语言;
调查中,近 50% 的调查对象使用 Python,而且正在增长;
让我们看一下以下三个领域,从此三方面都能看到使用 Python 进行机器学习的趋势正在增长:
搜索量可能表明学生、工程师和其他从业者搜索信息开始或者深入这一主题的趋势。
谷歌提供了一个名为 Google Trends 的工具,能让我们观察关键字随时间变化的搜索量。
我们能够调查 2014 年至 2016 年「Python 机器学习」的增长趋势,如下图所示:
我们能够看到在 2012 年趋势开始上涨,在 2015 年急剧上涨,这可能是因为 TensorFlow 这样的 Python 深度学习工具。
我们也可与 R 机器学习的搜索量进行对比,我们可以看到在 2015 年中期,Python 机器学习已经超过 R 机器学习:
蓝色代表「Python 机器学习」,红色代表「R 机器学习」。
Indeed 是一个招聘搜索网站,像 Googel Trends 一样,它可提供匹配关键词的招聘广告量。
我们能够调查过去 4 年的「Python 机器学习职位」。
我们能够看到 X 轴上的时间和匹配关键词的招聘比例。该图显示从 2012 年至 2015 年几乎呈现线性增长,在 2016 年有曲棍球式的增长。
我们也可以对比 Python 和 R 的招聘广告。
蓝色表示 Python 机器学习,橙色表示 R 机器学习。
与谷歌搜索量有显著的对比。从 Indeed 网站获得的招聘广告的比率显示从 2012 年开始,对 Python 机器学习技能的需求一直高于对 R 机器学习技能的需求,差距在近几年逐渐拉大。
KDnuggets 调查结果:更多人使用 Python 进行机器学习 通过回顾 KDnuggets Software Poll Results 我们能够观察机器学习从业者使用的工具:
下面就引自 2016 年的结果:
R 语言仍然主导工具,占有 49% 的份额,但 Python 增长迅速,几乎赶超 R 语言。——Gregory Piatetsky。
该调查追踪了机器学习和数据科学从业人士使用的工具,在调查中,从业者可以选择多种工具。以下是过去 4 年 Python 机器学习的增长比例:
下面是一张增强趋势图:
我们可以看到几乎呈现线性增长趋势,在 2016 年刚好低于 50%
值得注意的是,近几年的调查中参与调查的对象也从几百增加到了几千人,参与者是自选择的。
O'Reilly 调查结果:更多人使用 Python 进行机器学习 O'Reilly 展示了年度数据科学薪水调查结果。
他们收集了大量数据科学家和机器学习从业者的数据,并展示了调查结果。该调查追踪了从业人员对工具的使用情况。从下面这段话中,我们可以看到 Python 如今在数据科学薪资中扮演重要角色:
Python 和 Spark 是最对薪资有贡献的工具。
回顾此调查结果,我们可以看到类似的增长趋势:
图形展示如下:
有趣的是 O'Reilly 的调查结果非常类似于 KDNuggeets 的结果。
想要学习Python机器学习,第一个门槛就是学会经典算法。
针对对机器学习感兴趣、想从事相关职业的零基础学员,StuQ 推出课程《Python 机器学习经典算法与实战》,现在参与拼团,原价 999 元,最低只要 499元 ~