专栏名称: 大数据实验室
宽客俱乐部旗下美国大数据实验室,大数据研究应用。
目录
相关文章推荐
数据派THU  ·  【NeurIPS2024】将连续潜在变量模型 ... ·  3 天前  
软件定义世界(SDX)  ·  钉钉公布收入,年可达30亿元 ·  4 天前  
数据派THU  ·  【CIKM2024教程】大语言模型在表格任务 ... ·  1 周前  
51好读  ›  专栏  ›  大数据实验室

Python成为高收入国家增长最快的语言

大数据实验室  · 公众号  · 大数据  · 2017-09-14 08:00

正文

我们最近的研究表明,富裕国家(世界银行定义为高收入国家)喜欢研究的技术与其他国家的不同。其中,我们看到最大的差异是Python语言。当我们关注高收入国家的时候,甚至可以看到Python的增长速度甚至比Stack Overflow Trends或者其他一些全球软件开发排名显示的还要快。


在这篇文章中,我们将探讨过去五年中Python语言不寻常的增长速度,正如在高收入国家的Stack Overflow流量中所示的那样。 “增长最快”一词可能很难精确定义,但是我们认为Python确实是增长最快的主流编程语言。


本文提到的大部分数字都来自高收入国家,比如美国、英国、德国、加拿大和其他类似的国家,他们加起来占了Stack Overflow 64%的流量。其他一些国家,如印度、巴西、俄罗斯和中国,也为全球软件开发生态系统做出了巨大的贡献。尽管这些国家的Python也在增长,但本文几乎不涉及这些经济体。


需要强调的是,使用某种语言的用户数并不能用来衡量该语言的质量:我们现在正在讲的是开发人员使用的编程语言,而不是处方。


Python在高收入国家的增长情况


你可以在Stack Overflow Trends上看到,Python在过去几年里一直在迅速增长。但是对于这篇文章,我们将重点关注高收入国家,并且分析的是Stack Overflow上问题的访问情况,而不是用户提的问题。


有关Stack Overflow问题视图的数据可以追溯到2011年底,在这段时间内,我们可以看一下Python相对于其他五种主流编程语言的增长情况。这是目前高收入国家中Stack Overflow访问量前十的标签中的六个;另外还有这四个没包括在内,分别是CSS、HTML、Android和JQuery。



2017年6月,Python第一次成为高收入国家Stack Overflow访问量最大的标签。它在美国和英国是访问量最大的标签,在大部分其他高收入国家中也是排在前两名(另外一个要么是Java要么是JavaScript)。这尤其令人印象深刻,因为在2012年,Python的访问量小于其他五种语言,而到现在其访问量已经增长了2.5倍。


产生这种现象的部分原因是Java流量的季节性因素。由于Java是本科重点课程,所以它的流量会在秋季和春季上升,而在夏季下降。但是它会在年底再次赶上Python吗?我们可以尝试使用名为“STL”的模型来预测未来两年的增长情况,这个模型能将增长情况与季节性趋势相结合,从而预测未来的值。



根据这个模式的预测,Python可能会在今年秋天保持领先地位或被Java反超,但到了2018年,Python肯定会成为最受欢迎的标签。STL还暗示JavaScript和Java在高收入国家中的流量将保持相似的水平,就跟最近两年的情况差不多。


从整体上来看,有哪些标签增长得最快?


以上我们只看了六种主流语言,那么目前在高收入国家中还有哪些目前增长最快的技术呢?


我们用2017年和2016年的流量占比来定义增长率。在这个分析中,我们只考虑编程语言(比如Java和Python)和平台(比如iOS、Android、Windows和Linux),不包括类似Angular的框架和类似TensorFlow的库。



*量化投资与对冲基金*第十二期实战班

全面了解FOF组合基金

从入门到精通程序化交易

运用阿尔法套利与统计套利实战

MATLAB在量化投资中的具体应用

CTA多因子策略分析与资金管理方案探讨

如何打造实战性量化投资策略

波动率量化交易

组合课程,一网打尽

2017.10.20—2017.10.22 上海

报名电话/微信:18516600808




由于这个漫画中描述的“增长最快”存在问题,因此,我们使用平均差异图来比较各个语言的增长率与整体平均增长率。



Python凭借着27%的年增长率在所有标签中独占鳌头,它既是流量最大也是增长最快的标签。拥有类似增长率的第二大标签是R语言。我们可以看到,其他大多数大标签的流量在高收入国家都保持稳定,而Android、iOS和PHP的访问量则略有下降。(我们在之前一篇Flash之死的帖子中研究了一些流量减少的标签,如Objective-C、Perl和Ruby)。我们还注意到,在函数式编程语言中,Scala是流量最大并且增长非常迅速的语言,F#和Clojure则较小并且还在不断下降,而Haskell则位于它们之间并保持着稳定。


在上图中有一个重要的东西被遗漏了:TypeScript的流量去年竟然增长了142%,这足以让我们对它进行单独处理,以避免超过现有的范围。你还可以看到,其他一些较小语言(例如R、Go和Rust)的增长速度与Python差不多或更快,而且也有许多标签,例如Swift和Scala,它们的增长情况也很惊人。与Python相比,他们的流量变化情况怎么样呢?



像R和Swift这样的语言的发展情况确实很惊人,而TypeScript在更短的时间内表现出了更快速的扩张。如图所示,当标签一开始相对较小时,则后期越容易出现较快地增长。


请注意,我们的意思并不是说这些语言可以与Python“抗衡”。相反,我们正在解释的是为什么要把它们单独拿出来分析,这些都是较低流量的标签。Python有着一个与众不同的情况,它是Stack Overflow中最受欢迎的标签之一,也是增长最快的一个。


其他地区的情况


到目前为止,我们一直都在分析高收入国家的发展趋势。那么,在像印度、巴西、俄罗斯、中国等其他一些国家中,Python的增长情况如何呢?


它依然是增长最快的编程语言。



在非高收入国家中,Python仍然是增长最快的主流编程语言;它只是最开始的水平比较低,并且是在两年后才开始增长(从2014年开始,而不是2012年)。事实上,非高收入国家的Python同比增长率略高于高收入国家。


本文中有关高收入国家标签流量增减的许多结论也都适用于其他地区,并且这两者的增长率存在着0.979的相关性。在某些情况下,你会看到类似于Python的“滞后”现象,即某个技术在高收入国家的接受度发展水平比其他地区要早一到两年。


下一步工作


我们不希望挑起所谓的“语言之战”。一种语言的用户数量并不代表着它的质量,而且肯定无法告诉你哪种语言更适合某种特定情况。不过,考虑到这个观点,我们认为有必要了解一下有哪些语言建起了开发者生态系统,以及生态系统当前的发展情况。


原文:The Incredible Growth of Python 

作者:David Robinson 

翻译:雁惊寒

转自:CSDN大数据

人大量化对冲高级研修班(七期)


名校教授、业界专家、IT大咖授课

金融市场以及主要金融工具分析方法详解

建立全面、平衡、优化的量化对冲知识架

全面掌握量化投资业绩评估、投资组合管理和风险控制方法


2017年11月1日-5日  北京

报名电话/微信:18516600808