专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
51好读  ›  专栏  ›  企业存储技术

一份难得的数据库市场分析报告

企业存储技术  · 公众号  ·  · 2019-08-05 08:00

正文

请到「今天看啥」查看全文


本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧_huangliang,以便更好地与读者互动。


目录

- 数据库分类维度:关系型 / 非关系型、交易型 / 分析型

- NoSQL 数据库的进一步分类

- OLTP 市场规模:关系型数据库仍占营收大头

- 数据库市场份额:云服务和新兴厂商主导 NoSQL

- 开源数据库 vs. 商业数据库

- 数据库三大阵营:传统厂商和云服务提供商

最近由于时间原因我写东西少了,在公众号上也转载过几篇搞数据库朋友的大作。按说我算是外行,没资格在这个领域品头论足,而当我看到下面这份报告时立即产生了学习的兴趣,同时也想就能看懂的部分写点心得体会分享给大家。

可能本文比较适合 普及性阅读 ,让数据库领域资深的朋友见笑了:)

来自 Willian Blair 的《 Database Software Market:The Long-Awaited Shake-up ,文末我会提供原报告出处。 或者关注本公众号,从后台留言“ database ”获取下载链接

数据库分类维度:关系型 / 非关系型、交易型 / 分析型

首先是分类维度,上图中的纵轴分类为 Relational Database (关系型数据库, RDBMS )和 Nonrelational Database (非关系型数据库, NoSQL ),横轴的分类为 Operational 交易型,即 OLTP )和 Analytical 分析型,即 OLAP )。

按照习惯我们先看关系型数据库,左上角的交易型类别中包括大家熟悉的商业数据库 Oracle MS SQL Server DB2 Infomix ,也包括开源领域流行的 MySQL MariaDB 是它的一个分支)、 PostgreSQL ,还有云上面比较常见的 SQL Azure Amazon Aurora 等。

比较有意思的是, SAP HANA 正好位于交易型和分析型的中间分界处,不要忘了 SAP 还收购了 Sybase ,尽管后者今天不够风光了,而早年微软的 SQL Server 都是来源于 Sybase Sybase ASE 数据库和分析型 Sybase IQ 还是存在的。

右上角的分析型产品中包括几款知名的 列式数据仓库 Pivotal Greenplum Teradata IBM Netezza (已宣布停止支持),来自互联网巨头的 Google Big Query Amazon RedShift 。至于 Oracle Exadata 一体机,它上面运行的也是 Oracle 数据库,其最初设计用途是 OLAP ,而在后来发展中也可以良好兼顾 OLTP ,算是一个跨界产品吧。

再来看非关系型数据库,左下角的交易型产品中,有几个我看着熟悉的 MongoDB Redis Amazon DynamoDB DocumentDB 等;右下角的分析型产品包括著名的 Hadoop 分支 Cloudera Hortonworks (这 2 家已并购), Bigtable (来自 Google Hadoop 中的 HBase 是它的开源实现)、 Elasticsearch 等。


显然非关系型数据库的分类要更加复杂,产品在应用中的差异化也比传统关系型数据库更大。 Willian Blair 很负责任地对它们给出了进一步的分类。

NoSQL 数据库的进一步分类



上面这个图表应该说很清晰了。非关系型数据库可以分为 Document-based Store (基于文档的存储)、 Key-Value Store (键值存储)、 Graph-based (图数据库)、 Time Series (时序数据库),以及 Wide Cloumn-based Store (宽列式存储)。

我们再来看下每个细分类别中的产品:


文档存储 MongoDB Amazon DocumentDB Azure Cosmos DB

Key-Value 存储 Redis Labs Oracle Berkeley DB Amazon DynamoDB Aerospike

图数据库 Neo4j

时序数据库 InfluxDB

WideCloumn DataStax Cassandra Apache HBase Bigtable

多模型数据库 :支持上面不只一种类别特性的 NoSQL ,比如 MongoDB Redis Labs Amazon DynamoDB Azure Cosmos DB 等。

OLTP 市场规模:关系型数据库仍占营收大头


上面这个基于 IDC 数据的交易型数据库市场份额共有 3 个分类,其中深蓝色部分的关系型数据库( RDBMS ,在这里不统计数据挖掘 / 分析型数据库)占据 80% 以上的市场。

Dynamic Database DDMS ,动态数据库管理系统,同样不统计 Hadoop )就是我们前面聊的 非关系型数据库 。这部分市场显得小(但发展势头看好),我觉得与 互联网等大公司多采用开源 + 自研 ,而不买商业产品有关。

而遵循 IDC 的统计分类,在上图灰色部分的“非关系型数据库市场”其实另有定义,参见下面这段文字:


数据库市场份额:云服务和新兴厂商主导 NoSQL


请注意,这里的 关系型数据库 统计又包含了分析型产品。 Oracle 营收份额 42% 仍居第一,随后排名依次为微软、 IBM SAP Teradata


代表 非关系型数据库 DDMS 分类中(这里同样加入 Hadoop 等),云服务和新兴厂商成为了主导, 微软 应该是因为云 SQL Server 的基础而小幅领先于 AWS ,这 2 家一共 占据超过 50% 的市场 ,接下来的排名是 Google Cloudera Hortonworks (二者加起来 13% )。


上面是 IDC 传统分类中的“非关系型数据库”,在这里 IBM CA 等应该主要是针对大型机的产品, InterSystems 有一款在国内医疗 HIS 系统中应用的 Caché 数据库(以前也是运行在 Power 小机上比较多)。我就知道这些,余下的就不瞎写了。

开源数据库 vs. 商业数据库


按照流行度来看,开源数据库从 2013 年到现在一直呈现增长,已经快要追上商业数据库了。


商业产品在关系型数据库的占比仍然高达 60.5% ,而上表中从这列往左的分类都是开源占优:

Wide Cloumn :开源占比 81.8%

时序数据库:开源占比 80.7%

文档存储:开源占比 80.0%

Key-Value 存储:开源占比 72.2%

图数据库:开源占比 68.4%

搜索引擎:开源占比 65.3%



按照 开源 License 的授权模式 ,上面这个三角形 越往下管的越宽松 。比如 MySQL 属于 GPL ,在互联网行业用户较多;而 PostgreSQL 属于 BSD 授权 ,国内有不少数据库公司的产品就是基于 Postgre 哦。

数据库三大阵营:传统厂商和云服务提供商


前面在讨论市场份额时,我提到过交易型数据库的 4 个巨头仍然是 Oracle 、微软、 IBM SAP ,在这里 William Blair 将他们归为第一阵营。

随着云平台的不断兴起, AWS Azure GCP Google Cloud Platform )组成了另一个阵营,在国外分析师的眼里还没有 BAT ,就像有的朋友所说, 国内互联网巨头更多是自身业务导向的 ,在本土发展公有云还有些优势, 短时间内将技术输出到国外的难度应该还比较大 。(当然我并不认为国内缺优秀的 DBA 和研发人才)

第三个阵容就是规模小一些,但比较专注的数据库玩家。

接下来我再带大家简单过一下这前两个阵容,看看具体的数据库产品都有哪些。


甲骨文的产品,我相对熟悉一些的有 Oracle Database MySQL 以及 Exadata 一体机。



IBM DB2 也是一个庞大的家族,除了传统针对小型机、 x86 (好像用的人不多)、 z/OS 大型机和 for i 的版本之外,如今也有了针对云和数据挖掘的产品。记得抱枕大师对 Informix 的技术比较推崇,可惜这个产品发展似乎不太理想。



微软除了看家的 SQL Server 之外,在 Azure 云上还能提供 MySQL PostgreSQL MariaDB 开源数据库。应该说他们是 传统软件 License+PaaS 服务两条腿走路 的。



如今人们一提起 SAP 的数据库就想起 HANA ,之前从 Sybase 收购来的 ASE Adaptive Server Enterprise )和 IQ 似乎没有之前发展好了。


在云服务提供商数据库的 3 巨头中,微软有 SQL Server 的先天优势,甚至把它移植到了 Linux 拥抱开源平台。 关系型数据库 的创新 方面值得一提的是 Amazon Aurora Google Spanner (也有非关系型特性),至于它们具体好在哪里我就不装内行了:)

非关系型数据库则是 Amazon 全面开花 ,这与其云计算业务发展早并且占据优势有关。 Google 当年的三篇经典论文对业界影响深远, Yahoo 基于此开源的 Hadoop 有一段时间几乎是大数据的代名词。 HBase Hive 如今已不再是人们讨论的热点,而 Bigtable BigQuery 似乎仍然以服务 Google 自身业务为主,毕竟 GCP 的规模比 AWS 要小多了。


最后这张 DB-Engines 的排行榜,相信许多朋友都不陌生,今年 3 月已经不是最新的数据,在这里列出只是给大家一个参考。该排行榜几乎在每次更新时,都会有国内数据库专家撰写点评。

以上是我周末的学习笔记,班门弄斧,希望对大家有帮助。

参考资料《 Database Software Market:The Long-Awaited Shake-up

https://blocksandfiles.com/wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf

扩展阅读:《 数据库 & 存储:互相最想知道的事



:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流 技术 可以 加我的 QQ/ 微信: 490834312 。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号: HL_Storage

长按二维码可直接识别关注


历史文章汇总 http://chuansong.me/account/huangliang_storage

点击下方“阅读原文”,查看更多历史文章
↓↓↓






请到「今天看啥」查看全文