专栏名称: 大话存储
由存储系统架构师、《大话存储》系列图书作者冬瓜哥创立。分享业界逼格甚高的存储和计算机系统底层知识,皆为原创。存储系统底层技术、机理、设计、思路分享,绝不忽悠。想变得比别人逼格高一点,就来阅读本公众号的文章。
目录
相关文章推荐
51好读  ›  专栏  ›  大话存储

Scale-Out与全闪存似乎天然配对儿

大话存储  · 公众号  ·  · 2018-07-03 08:18

正文

请到「今天看啥」查看全文


广告:冬瓜哥新作 《大话计算机》 将于8月份出版,详细内容点击链接。

内容试读(根据留言要求贴出):

《大话计算机》内容节选之:fork流程及QPI内存映射

《大话计算机》内容节选之:指令系统和分支预测

《大话计算机》内容节选之:计算的本质、bio

《大话计算机》内容节选之:冬瓜哥彪悍图解Cache组关联

《大话计算机》内容节选之:CUDA对线程的安排方式及Linux进程0创建和运行

《大话计算机》内容节选之:详解超线程

《大话计算机》内容节选之:详解多核心、用户栈和内核栈

《大话计算机》内容节选之:GPU是怎么把平面贴图计算成立体感观的


《大话计算机》内容节选之:P/N节、晶体管发展史



Scale-Out的分布式系统为何离不开SSD/全闪存?如果没有闪存,Scale-Out为什么就让人感觉火候不太够?而Scale-Out的出现,除了得益于闪存助力,还有什么其他因素么?本文冬瓜哥就来分析分析。


本文组织:

  1. DELLEMC XtreamIO x2 简介

  2. 说说 Scale-Out 架构与全闪存


1
DELLEMC XtreamIO x2 简介

2018 5 1 日,戴尔 EMC DellTechnologies World 宣布了最新的计算和存储产

戴尔在 5 8 日宣布了对 XtremIOX2 的一些重要改变, XtremIO X2 在其目前的产品线中,其定价减半 (55%) ,正试图以一个入门级的系统打入中档市场。 XtremIO X2 在其软件中添加了新功能 ( 提供了将变化数据复制到目标系统的复制方式 ) ,这将减少在进行本地复制时传输的数据量。戴尔还宣布,未来版本的 XtremIO X2 将支持 NVMe SCM


DELLEMC XtreamIO x2 为一款具备横向扩展能力的全闪存阵列。其相比上一代 XtreamIO 的提升如下图所示:

每个阵列单元称之为 X-Brick 。每个 X-Brick 单元可配置 18~72 SSD

上图为 XtreamIO x2 全闪存阵列 X-Brick 模块 外观图。每个 X-Brick 高度为 1U ,分别由 Storage Controller DAE SSD 扩展柜)、 UPS 电源组成,每个控制器为 1U 双路 服务器 ,每个 X-Brick 配置了 4 16Gb 光纤通道端口、 4~8 10GbiSCSI 端口、 4 56Gb Infiniband 端口(每 Controller 配置 2 个)以及 2 1Gb 的管理端口。

下图所示为 XtreamIO x2 X-Brick 架构。每个控制器运行了一个定制化的轻量级的 Linux 内核, XIOS 。为了获取最高的性能, I/O 处理模块直接运行在用户态,直接操作底层硬件。节点间互联采用基于 Infiniband 网络的 RDMA 方式。

XtreamIO x2 已经在实验室环境中实现了八个 X-Brick(16 个节点 ) 甚至更大的集群, DELLEMC 估计也会很快提供 8 X-Brick 配置的阵列。从理论上看, 8 个、 16 X-Brick 32 X-Brick 并没有区别,但是涉及到很多测试和实际应用场景, 即客 户当前是否需要这么大的容量和性能。


X-Brick 具有非破坏性 XIOS 软件及硬件升级、拥有高可靠性的热插拔升级,且不存在着单点故障。集群化的 XtremIO x2 阵列中各个 X-Brick 可以拥有不同存储容量 ; 集成了 VMware VAAI vmware 多通道 I/O 支持,数据分卷能够夸整个系统 ; 拥有丰富的数据保护功能。

XtreamIO x2 全闪存阵列将数据分为 4KB 的散列块,这些 4KB 的散列块完全打散,不按照逻辑地址进行排列存储,而是根据物理位置进行安置。如下图所示。

数据天然带有指纹 hash ,这也是 XtreamIO x2 实现重复数据删除的基础。

其他一些产品也使用了类似策略,但是其数据存储方式一般都是基于逻辑地址,时间久了之后不可避免的就会产生磁盘碎片化,从而对性能产生影响。 XtreamIO 全闪存阵列的策略则是将数据彻底的打乱完全碎片化,基于 4KB 的数据块通过指纹来识别、存储、管理等。一方面可以实现全局磨损均衡,令一方面可以让重删变得非常容易。

XtreamIO 的数据保护机制 XDP ,通过双阶数据引擎避免了 RAID5 RAID6 的写放大外,达到了 RAID6 的保护效果。


2
说说 Scale-Out 架构与全闪存


分布式系统的发展有三个技术条件,分别为:高速网络、大容量硬盘、固态介质。这三者彻底解放了分布式系统的生产力。通俗一点说也就是:网络快了、盘容量大了、盘速度快了。高速网络是分布式系统赖以生存的根本,分布式存储系统早在上世纪中后期就已经形成了理论基础,但是一直到近几年,网络的时延和带宽才足以支撑分布式系统架构。为了降低成本,业界兴起所谓软件定义,也就是利用廉价白牌机或者标准的机架服务器,加上分布式存储软件管理层,搭建出软件定义分布式存储系统,与传统的 SAN 存储系统瓜分市场。而分布式系统的大行其道,极大的促进了固态存储的需求量,因为为了成本考量,分布式系统中每个节点往往不会连接多级 JBOD 从而靠大量的硬盘形成高并发性能,而是只靠每个服务器自带的少量盘位,加上固态盘来抵消跨网络通信带来的时延增加,形成让传统机械盘系统望尘莫及的 IOPS 和时延性能。

所以,固态存储系统用于 Scale-Out 分布式系统可谓是非常自然的一种需求。


大话存储


大话计算机













请到「今天看啥」查看全文