本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧_huangliang,以便更好地与读者互动。
目录
-
数据库分类维度:关系型
/
非关系型、交易型
/
分析型
-
NoSQL
数据库的进一步分类
-
OLTP
市场规模:关系型数据库仍占营收大头
-
数据库市场份额:云服务和新兴厂商主导
NoSQL
-
开源数据库
vs.
商业数据库
-
数据库三大阵营:传统厂商和云服务提供商
最近由于时间原因我写东西少了,在公众号上也转载过几篇搞数据库朋友的大作。按说我算是外行,没资格在这个领域品头论足,而当我看到下面这份报告时立即产生了学习的兴趣,同时也想就能看懂的部分写点心得体会分享给大家。
可能本文比较适合
普及性阅读
,让数据库领域资深的朋友见笑了:)
来自
Willian Blair
的《
Database Software Market:The Long-Awaited Shake-up
》
,文末我会提供原报告出处。
或者关注本公众号,从后台留言“
database
”获取下载链接
。
数据库分类维度:关系型
/
非关系型、交易型
/
分析型
首先是分类维度,上图中的纵轴分类为
Relational Database
(关系型数据库,
RDBMS
)和
Nonrelational Database
(非关系型数据库,
NoSQL
),横轴的分类为
Operational
(
交易型,即
OLTP
)和
Analytical
(
分析型,即
OLAP
)。
按照习惯我们先看关系型数据库,左上角的交易型类别中包括大家熟悉的商业数据库
Oracle
、
MS SQL Server
、
DB2
、
Infomix
,也包括开源领域流行的
MySQL
(
MariaDB
是它的一个分支)、
PostgreSQL
,还有云上面比较常见的
SQL Azure
和
Amazon Aurora
等。
比较有意思的是,
SAP HANA
正好位于交易型和分析型的中间分界处,不要忘了
SAP
还收购了
Sybase
,尽管后者今天不够风光了,而早年微软的
SQL Server
都是来源于
Sybase
。
Sybase
的
ASE
数据库和分析型
Sybase IQ
还是存在的。
右上角的分析型产品中包括几款知名的
列式数据仓库
Pivotal Greenplum
、
Teradata
和
IBM Netezza
(已宣布停止支持),来自互联网巨头的
Google Big Query
和
Amazon RedShift
。至于
Oracle Exadata
一体机,它上面运行的也是
Oracle
数据库,其最初设计用途是
OLAP
,而在后来发展中也可以良好兼顾
OLTP
,算是一个跨界产品吧。
再来看非关系型数据库,左下角的交易型产品中,有几个我看着熟悉的
MongoDB
、
Redis
、
Amazon DynamoDB
和
DocumentDB
等;右下角的分析型产品包括著名的
Hadoop
分支
Cloudera
、
Hortonworks
(这
2
家已并购),
Bigtable
(来自
Google
,
Hadoop
中的
HBase
是它的开源实现)、
Elasticsearch
等。
显然非关系型数据库的分类要更加复杂,产品在应用中的差异化也比传统关系型数据库更大。
Willian Blair
很负责任地对它们给出了进一步的分类。
NoSQL
数据库的进一步分类
上面这个图表应该说很清晰了。非关系型数据库可以分为
Document-based Store
(基于文档的存储)、
Key-Value Store
(键值存储)、
Graph-based
(图数据库)、
Time Series
(时序数据库),以及
Wide Cloumn-based Store
(宽列式存储)。
我们再来看下每个细分类别中的产品:
文档存储
:
MongoDB
、
Amazon DocumentDB
、
Azure Cosmos DB
等
Key-Value
存储
:
Redis Labs
、
Oracle Berkeley DB
、
Amazon DynamoDB
、
Aerospike
等
图数据库
:
Neo4j
等
时序数据库
:
InfluxDB
等
WideCloumn
:
DataStax
、
Cassandra
、
Apache HBase
和
Bigtable
等
多模型数据库
:支持上面不只一种类别特性的
NoSQL
,比如
MongoDB
、
Redis Labs
、
Amazon DynamoDB
和
Azure Cosmos DB
等。
OLTP
市场规模:关系型数据库仍占营收大头
上面这个基于
IDC
数据的交易型数据库市场份额共有
3
个分类,其中深蓝色部分的关系型数据库(
RDBMS
,在这里不统计数据挖掘
/
分析型数据库)占据
80%
以上的市场。
Dynamic Database
(
DDMS
,动态数据库管理系统,同样不统计
Hadoop
)就是我们前面聊的
非关系型数据库
。这部分市场显得小(但发展势头看好),我觉得与
互联网等大公司多采用开源
+
自研
,而不买商业产品有关。
而遵循
IDC
的统计分类,在上图灰色部分的“非关系型数据库市场”其实另有定义,参见下面这段文字:
数据库市场份额:云服务和新兴厂商主导
NoSQL
请注意,这里的
关系型数据库
统计又包含了分析型产品。
Oracle
营收份额
42%
仍居第一,随后排名依次为微软、
IBM
、
SAP
和
Teradata
。
代表
非关系型数据库
的
DDMS
分类中(这里同样加入
Hadoop
等),云服务和新兴厂商成为了主导,
微软
应该是因为云
SQL Server
的基础而小幅领先于
AWS
,这
2
家一共
占据超过
50%
的市场
,接下来的排名是
Google
、
Cloudera
和
Hortonworks
(二者加起来
13%
)。
上面是
IDC
传统分类中的“非关系型数据库”,在这里
IBM
和
CA
等应该主要是针对大型机的产品,
InterSystems
有一款在国内医疗
HIS
系统中应用的
Caché
数据库(以前也是运行在
Power
小机上比较多)。我就知道这些,余下的就不瞎写了。
开源数据库
vs.
商业数据库
按照流行度来看,开源数据库从
2013
年到现在一直呈现增长,已经快要追上商业数据库了。
商业产品在关系型数据库的占比仍然高达
60.5%
,而上表中从这列往左的分类都是开源占优:
Wide Cloumn
:开源占比
81.8%
;
时序数据库:开源占比
80.7%
;
文档存储:开源占比
80.0%
;
Key-Value
存储:开源占比
72.2%
;
图数据库:开源占比
68.4%
;
搜索引擎:开源占比
65.3%
按照
开源
License
的授权模式
,上面这个三角形
越往下管的越宽松
。比如
MySQL
属于
GPL
,在互联网行业用户较多;而
PostgreSQL
属于
BSD
授权
,国内有不少数据库公司的产品就是基于
Postgre
哦。
数据库三大阵营:传统厂商和云服务提供商
前面在讨论市场份额时,我提到过交易型数据库的
4
个巨头仍然是
Oracle
、微软、
IBM
和
SAP
,在这里
William Blair
将他们归为第一阵营。
随着云平台的不断兴起,
AWS
、
Azure
和
GCP
(
Google Cloud Platform
)组成了另一个阵营,在国外分析师的眼里还没有
BAT
,就像有的朋友所说,
国内互联网巨头更多是自身业务导向的
,在本土发展公有云还有些优势,
短时间内将技术输出到国外的难度应该还比较大
。(当然我并不认为国内缺优秀的
DBA
和研发人才)
第三个阵容就是规模小一些,但比较专注的数据库玩家。
接下来我再带大家简单过一下这前两个阵容,看看具体的数据库产品都有哪些。
甲骨文的产品,我相对熟悉一些的有
Oracle Database
、
MySQL
以及
Exadata
一体机。
IBM DB2
也是一个庞大的家族,除了传统针对小型机、
x86
(好像用的人不多)、
z/OS
大型机和
for i
的版本之外,如今也有了针对云和数据挖掘的产品。记得抱枕大师对
Informix
的技术比较推崇,可惜这个产品发展似乎不太理想。
微软除了看家的
SQL Server
之外,在
Azure
云上还能提供
MySQL
、
PostgreSQL
和
MariaDB
开源数据库。应该说他们是
传统软件
License+PaaS
服务两条腿走路
的。
如今人们一提起
SAP
的数据库就想起
HANA
,之前从
Sybase
收购来的
ASE
(
Adaptive Server Enterprise
)和
IQ
似乎没有之前发展好了。
在云服务提供商数据库的
3
巨头中,微软有
SQL Server
的先天优势,甚至把它移植到了
Linux
拥抱开源平台。
关系型数据库
的创新
方面值得一提的是
Amazon Aurora
和
Google Spanner
(也有非关系型特性),至于它们具体好在哪里我就不装内行了:)
非关系型数据库则是
Amazon
全面开花
,这与其云计算业务发展早并且占据优势有关。
Google
当年的三篇经典论文对业界影响深远,
Yahoo
基于此开源的
Hadoop
有一段时间几乎是大数据的代名词。
HBase
和
Hive
如今已不再是人们讨论的热点,而
Bigtable
和
BigQuery
似乎仍然以服务
Google
自身业务为主,毕竟
GCP
的规模比
AWS
要小多了。
最后这张
DB-Engines
的排行榜,相信许多朋友都不陌生,今年
3
月已经不是最新的数据,在这里列出只是给大家一个参考。该排行榜几乎在每次更新时,都会有国内数据库专家撰写点评。
以上是我周末的学习笔记,班门弄斧,希望对大家有帮助。
参考资料《
Database Software Market:The Long-Awaited Shake-up
》
https://blocksandfiles.com/wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf
扩展阅读:《
数据库
&
存储:互相最想知道的事
》
注
:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。
进一步交流
技术
,
可以
加我的
QQ/
微信:
490834312
。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)
尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:
HL_Storage
长按二维码可直接识别关注
历史文章汇总
:
http://chuansong.me/account/huangliang_storage