专栏名称: 拓扑社
拓扑社是IT桔子旗下专注企业级服务的垂直媒体,关注和报导To B市场的新产品、新趋势、新观点,传递企业服务价值。
目录
相关文章推荐
投行业务资讯  ·  IPO闯关成功!江苏再添一家上市公司! ·  2 天前  
铅笔道  ·  苏州杀出超级IPO:年入9.28亿,全国第三 ·  2 天前  
高毅资产管理  ·  从人类简史到AI浪潮,赫拉利对未来的五个判断 ... ·  5 天前  
投行业务资讯  ·  1过1!市占率连续三年全国第一! ·  4 天前  
投行业务资讯  ·  又一科创板IPO终止! ·  1 周前  
51好读  ›  专栏  ›  拓扑社

开源也是一门生意,硅谷顶级VC盘点最火热的40个开源项目

拓扑社  · 公众号  · 科技投资  · 2017-05-05 19:06

正文

作者丨Dharmesh Thakker,Battery Ventures管理合伙人,前Intel Capital董事总经理

编译丨拓扑社 Smiletalker


在本文中,作者介绍了自己对热门开源项目和开源社区的研究和思考,并且从几个不同角度为当下最流行的40个开源项目进行了排名

 

当今很多最新最热门的企业级技术核心都是免费的“开源”技术。所以很多大公司,从金融巨头、零售到服务公司,都围绕全新的、基于开源社区的技术打造他们的业务,这些技术与过去的IT实践有着天壤之别。

 

但企业客户和投资者应该如何评估所有的这些新的开源产品呢? 他们如何区分哪些项目(通常是奇怪的名字Ansible,Vagrant,Gradle)能带来最多的客户增长动力哪些最受软件开发者的追捧,哪些又有大的市场潜力

 

这些问题尤其难以回答,因为大多数开源公司都没有上市,不必披露关键用户和财务指标数据。(尽管如此,这一局面正在发生改变,开源巨头Cloudera最近宣布计划上市,增加市场对开源技术的关注。)

 

这就是为什么我们决定创建一个新的、详细的名单来追踪流行的开源软件项目,并获得对这些开源技术公司的新洞察。这个名单叫做Battery开源软件指数BOSS指数),我们花了几个月整理公开信息并将每个季度更新,随着更多使用这些开源项目的开源公司上市,这个指数将越来越准确。

 

该名单涵盖了40个开源项目,从GitHub和Datamation的开源项目筛选而来,下图为完整列表。

我们主要关注企业IT相关领域的项目,如IT运维,包括为运维和供应系统提供技术支持数据和分析,包括人工智能和机器学习以及数据库相关的工具,以及DevOps,其中包括专注于“容器”热门趋势的项目,这些项目可帮助开发者在一个独立的环境中快速开发软件。


名单上有一些非常有名的名字,其中包括催生了大型公司的项目。 它们包Red Hat的基础Linux; MySQL衍生出了同名公司,并由Sun Microsystems(现已被Oracle收购)在2008年以10亿美元收购; 以及衍生出Cloudera和HortonworksHadoop。

 

也有一些没那么知名的项目排名很高,比如Selenium这表明在开放源代码领域有很多来自基层革新还有许多新的项目正在产生有价值的公司。尽管如此,我们的调研发现,用户量大的开源项目并不意味着就可以转化为一家商业上可行的公司。

 

我们根据以下四个因素对项目进行排名,包括:

 

  • 公众关注度,按照Google搜索量进行衡量

 

  • 用户活跃度,以热门技术讨论社区Stack Overflow提到该项目的次数进行评估


  • 职业影响力,以工作网站Indeed和Simply Hired上提到这些开源项目的职位数量来衡量

 

  • 开源社区中的影响力,以项目在Github上的影响力来衡量。我们追踪了项目在Github上被Fork(复制一份)的次数,标星的次数,以及浏览量。数据更新截至日期到2017年2月9日。

 

因为某些项目可能在某一点上做得非常好,或者非常差,可能有一个项目排在榜单的Google搜索量上排名很高,但职业影响力得分很低,所以我们去掉了每个项目最高得分和最低得分。类似奥运会体操项目的评分,这种统计方法被称为切尾平均数。

 

即使如此,仍然有改进的余地。一些接受度和受欢迎程度的标准(如下载)显然难以测量,而且我们肯定没有覆盖到所有最新最热的工具。随着我们计划的季度更新,我们应该能够跟踪到新兴行业领袖的产生。所以我们希望社区的反馈能够帮助我们改善我这个指数。

 

以下是基于我们研究的一些核心观点。


Linux, Git和MySQL最为出众


开源项目是Linux占据第1名应该不足为奇,这个1991年首次发布的技术已经成为开源项目。基于Linux的商业化公司包括Red Hat(为数不多上市的开源公司)、Ubuntu和SUSE。

 

位于第2名的是Git,这个广受欢迎的版本控制系统开源软件启发了GitHub和GitLab两家公司的出现,用于跟踪软件开发人员之间的变和协调工作。

 

名列第3的是开源数据库MySQL开发于1995年。目前Google,Facebook和Twitte等巨头网络科技公司都在使用MySQL。值得注意的是一些NoSQL(非关系型数据库技术),排名也很高,这种技术更适合拥有结构化数据的公司。

 

这些NoSQL技术包括MongoDB,它在我们的名单中排在第9位。由Redis Labs进行商业化的Redis排名12; 数据库公司DataStaxCassandra排在第25。Elasticsearch在第7位,目前正由Elastic公司商业化。

 

MongoDB在2015年年底进行了新一轮融资该公司的估值约为15亿美元,现在甲骨文IBM和微软巨头在数据库领域进行竞争总的来说,这些NoSQL厂商之间相互独立发展,而不是融入一个大的系统。这也预示着数据基础架构领域会更加碎片化,几个NoSQL领域的强大的玩家在未来可以成为上市公司。


大数据助推开源


随着许多公司都拥有管理大量结构化和非结构化数据的需求,这些数据来源包括:安全软件、社交网络、物联网传感器等等。它们越来越需要新的数据管理和存储解决方案。这个趋势反映在我们的名单中,40个项目中有15个是数据库和数据处理相关的开源技术。

 

上文提到的Hadoop就是这样的项目。另一个是正在Databricks商业化的Spark,排名第8


其他值得关注的项目


Docker是容器技术的宠儿,帮助软件开发者提高开发效率,在我们的名单中排名第五。许多人认为Docker可以替代传统巨头VMware技术,Docker可以通过开放源码社区便捷、廉价获取,这一点已经推动了它的采纳度Docker还与Google的Kubernetes(排名33)和Mesos等开源平台技术存在竞争关系。

 

开源界的另一个热点是“持续集成和持续交付”,一种能够与其他平台无缝集成的代码编写软件。该领域的一些工具包括由CloudBees和TravisCI商业Jenkins(排名14)。 类似DevOps中,有Maven(排名30)等技术,以及快速增长的二进制存储库管理工具Artifactory,这是一款旨在优化二进制文件下载和存储的软件工具,由JFrog公司进行商业化。


开源之路


正如我们前面提到的那样,拥有大量用户虽然对最终获得商业吸引力非常重要,但并不能保证开项目商业化的成功。这需要大量的辛勤工作和创造力,特别是需要构建新型商业模式利用复杂的开源许可证并调整传统的企业销售实践以适应开源产品 

 

此外,我们发现,IT公司利用开源项目组成一个技术栈,会增加企业商业成功机会, 比如ElasticELK”技术栈,其中包括开源的Elasticsearch(排名第7),Kibana(排名36),和Logstash(排名29)

 

时间序列数据库公InfluxData 拥有类似的技术栈“TICK”,包括 Telegraf,InfluxDB,Chronograf和Kapacitor。 最后一个例子是DevOps公司HashiCorp已经将许多开源项目商业化了,其中包括两个我们名单上的项目Vagrant(排名15)和Vault(排名40)。软件开发人员希望能够从这些堆栈中挑选自己喜欢的组件,以符合当今软件开发的最佳组合产品思路

 

这些开源项目不是我们父亲一代的Sun或甲骨文这类公司。显而易见的是,全球主要公司的CIO现在依赖开源技术,包括我们名单中提到的许多技术,来运行其基础设施的关键部分,其中许多项目将会长期存在。

 

事实上,去年举办的开源峰会上,来自高盛和Capital One大型公司的IT主管在部署新的软件和基础设施方面讨论中表明了他们的“开源第一”态度。 随着更多的开放源码公司在未来几年内上市,我们将获得更多有关这些顶级项目的表现的信息,并将继续跟踪项目进展行业影响力。


— END —

   >>阅读推荐