专栏名称: 大话存储
由存储系统架构师、《大话存储》系列图书作者冬瓜哥创立。分享业界逼格甚高的存储和计算机系统底层知识,皆为原创。存储系统底层技术、机理、设计、思路分享,绝不忽悠。想变得比别人逼格高一点,就来阅读本公众号的文章。
51好读  ›  专栏  ›  大话存储

隐藏在阿里云POLARDB云原生数据库背后的支撑者

大话存储  · 公众号  ·  · 2019-06-27 11:33

正文



在云时代,一切变化皆有因。


许多年以前,传统数据库一统天下,企业用户的核心应用也是基于这样的底层而构建,集中式架构代表着一个时代。


现在,云计算深入各行各业,来自公共云供应商层出不穷的创新,也在数据库领域开拓出来了一片新天地,以 分布式架构 为代表的一个新时代,正在以前所未有的速度革新着全球数以千计、万计的用户。


而这一切的变化,皆来自企业用户数字化转型带来的影响与结果。


All in Cloud,云原生数据库生逢其时


在2019年3月,一则业内消息引发了我的注意, 阿里云POLARDB 成为业内首个兼容Oracle的云原生数据库,并为企业用户提供多样化的数据库解决方案,以此方便企业用户将其应用程序迁移和部署到云上。



阿里云在数据库领域的激流勇进,足显公共云供应商在满足企业用户需求上的努力与创新。


在企业 All in Cloud 时代,云原生数据库兼具开源数据库的易用、开放特点,以及传统数据库的管理和处理性能等优势,成为企业的首选。为了更好地满足企业用户对于云的需求,Oracle这样的传统数据库厂商也在不断走向云化,对于传统数据库厂商来说,迈向云计算的转型中,自然少不了为传统数据库产品加入适应云计算的特性、功能与服务。


不过,以 阿里云、AWS 等公共云供应商的云原生数据库激进派,却已经在该领域打下了坚实的基础。


早在2014年,AWS发布了全球首个云原生关系型数据库Aurora。


阿里云紧跟其后,2017年,面向全球发布了自研的首个云原生数据库POLARDB,然而性能却在当时达到了Aurora的两倍左右。


全球公共云供应商在数据库领域的创新动力也令传统数据库厂商惊讶不已,公共云供应商基于分布式创新架构带来的新机遇,互相在云原生数据库领域你追我赶,也加速了云原生数据库在更多行业领域的应用。


由此而来, 作为企业IT系统的核心,数据库在过去多年中发展趋于缓慢,在云计算大潮的推动下却又呈现出一派勃勃生机。 随着企业数字化进程的加快,传统数据库固有的防线正在被一点点破裂,云原生数据库生逢其时,也为企业用户带来了云时代特有的价值和应用创新动能。


让存储与计算分离,分布式数据库解放新IT


在云时代数据成为企业用户的资产的时候,云计算也就成为了企业新时期的新IT。


可是,企业用户面临数字化转型的挑战中,海量数据和海量并发带来的难题再一次舒服了企业IT的生产力。


如何再一次解放IT生产力? 那么这就必然需要一个有着天然分布式基因的底层数据库来做强大的支撑,否则,这一切的发展都很难再继续进行。


然而,想要推出这样一款强大的分布式数据库,必然也需要一个大规模应用场景来进行不断的验证与创新。


毋庸置疑,阿里已经拥有了一支全球顶级的数据库团队。研发能力强大的同时,加上应用场景的强大,从而让阿里分布式数据库得到了前所未有的发展。


比如多年以来阿里在双11全球最高峰值的打磨下,也让阿里巴巴在分布式数据库架构经受住了严苛的实际考验。


谁都知道像双11这样的场景,全球范围内也是特例了,对于数据库承载的数据规模和并发量,也十分惊人。


相对于传统数据库,阿里云分布式数据库有着天然分布式的良好基因。


传统数据库采用单节点架构,存储和计算绑定在一起,这对于当前企业用户有着大规模应用与并发的场景下,很难适应得了。


分布式数据库采用解耦合的共享存储,通过 RDMA网络 形成分布式共享存储,可以实现一写多读共享存储的模式。


共享存储 的是一份数据,不再针对分布式节点之间看数据状态,目前分布式共享存储还不能无限制扩展,阿里云只能十多个到二十个左右存储节点的共享实现。


如果要更大扩展,就需要分库分表,阿里云不需要对用户业务逻辑做深度改造,原生分布式数据库技术可以实现业务逻辑做最小改动,允许业务逻辑跨共享的查询和事务处理,分布式事务、分布式查询的优化可以尽量减少对业务逻辑的改变。



阿里云POLARDB采用了存储与计算分离的设计理念,数据库计算节点和存储节点之间采用高速网络互联,并通过RDMA协议进行数据传输,使得I/O性能不在成为瓶颈。


由此,分布式数据库带来了计算与存储的分离,底层支撑的强大,自然为数字化转型加速的企业用户再一次解放了新IT的生产力。


POLARDB性能强大,源自背后推手的秘诀


POLARDB以分布式共享存储架构为基础,其中一个关键在于: 使用了英特尔®傲腾™DC固态盘(SSD)和英特尔®3DNAND固态盘。


为了满足企业用户在公共云中的数据库与数据迁移等应用需求,随着阿里云POLARDB的创新,一种新的 DBaaS模式 也为企业带来了云时代的便利。


当然,阿里云POLARDB的DBaaS模式采用了软件定义的创新性,并 使用了两种SSD。 一类SSD是来自英特尔®傲腾™DC固态盘,具有快速、低延迟的特点;另一类SSD也是来自英特尔®3DNAND固态盘,具有低成本、高容量的优势。


POLARDB有着如此优秀的表现,必然少不了背后推手的秘诀。



进一步分析来看,POLARDB在软件层将高速、高容量的英特尔®傲腾™DC固态盘和高吞吐量的英特尔®3DNAND固态盘结合起来, 实现了一个混合型存储层。 这种采用两类SSD相结合的方式,与存储层只使用英特尔®3DNAND固态盘相比,整体性价比高出很多。由此,在这样的混合型存储层应用模式下,也让企业从中受益匪浅。


为了实现卓越的存储效率、高QoS、高IOPS、高吞吐量和始终如一的性能,POLARDB所有软硬件设计均采用高可靠性、高可用性的云原生设计,从而也实现了高效协同, 包含与底层英特尔®硬件的协同。


然而,POLARDB在采用了英特尔两类SSD混合型应用模式后,其性能的强劲,却在成本上也尤为突出。 这样的性能表现,只需要传统内部部署的关系型数据库大约一成的成本。


因此,英特尔®傲腾™DC固态盘和英特尔®3DNAND固态盘相结合,明显有助于POLARDB降低用户成本,优化存储性能。并且,英特尔®傲腾™DC固态盘帮助阿里云消除了数据中心存储瓶颈,可容纳更大、更经济实惠的的数据集,加快了应用速度,降低了对延迟敏感的工作负载的事务成本,降低了POLARDB的数据中心总拥有成本( TCO )。







请到「今天看啥」查看全文