专栏名称: 云头条
云计算领域科技媒体:传播观点,传播价值,连接商业与技术;Web:www.yuntoutiao.com ,欢迎互动~~~
目录
相关文章推荐
钛媒体  ·  王维嘉:DeepSeek为何能血洗美股? ·  昨天  
科技每日推送  ·  DeepSeek遭饱和式攻击,老板梁文锋回湛 ... ·  4 天前  
硅星人Pro  ·  Meta微软发关键财报,市场都在问DeepSeek ·  5 天前  
智东西  ·  DeepSeek危及美国国家安全?火爆海外开 ... ·  6 天前  
51好读  ›  专栏  ›  云头条

NVMe fabrics为传统阵列敲响丧钟!

云头条  · 公众号  · 科技媒体  · 2017-08-22 19:15

正文

由于数据路径中没有了阵列控制器,谁还需要它?


天哪,瞧瞧时间!这是NVMeF时间。(图片来源:YuriyZhuravov / Shutterstock)

 

NVMe-over-Fabrics(NVMeF)共享存储访问可能会终结传统存储阵列业务,除非厂商们有所创新、另辟蹊径,除NVMeF数据访问外,还设法继续提供收费的数据管理服务。


我们是如何得出这个结论的?


NVMeF架构不仅适用于请求存储IO的服务器,还适用于这种服务器和目标存储系统:使用RDMA传输协议,传输直接进出服务器内存和存储驱动器(最终包括快速访问的固态驱动器)的数据。


这种技术之所以值得关注,原因在于虚拟化的多核多线程服务器发现,它们在等待IO完成,因为它们使用的网络SAN和文件管理器(filer)的响应速度不够快。将这些存储系统中的磁盘驱动器换成SATA和SAS闪存驱动器(SSD)有望加快速度,但涉及的两个网络仍耗费太长的时间来传输IO请求数据,这两个网络是阵列里面的SATA或SAS网络,以及阵列与访问服务器之间的块访问光纤通道/iSCSI或文件协议网络。


内部阵列网络问题可以通过使用速度比SAS和SATA更快的NVMe驱动器和NVMeF网络来加以解决。然后,进出驱动器的数据由RDMA传输到存储阵列控制器的内存。在内存中,数据通过控制器软件堆栈加以处理,并且跨外部网络进出阵列。


NVMeF方案


这两种操作都要耗费时间。NVMeF方案是将传统的块访问网络换成类似扩展PCIe总线的机制,并使用一种端到端NVMe协议,较之SCSI大大提升了并行处理性能,在访问服务器与目标存储阵列之间作为一种RDMA传输技术来运行。这缩短了物理网络传输时间,并且直接访问驱动器,因而撇开了存储阵列控制器的软件堆栈。


OK,一些阵列控制器软件堆栈是块访问协议中固有的,比如对于共享存储的网络访问处理逻辑单元号(LUN),将它们映射到驱动器。但是其他部分(比如RAID方案)则不然,这些在数据路径中。不用阵列控制器意味着不用阵列控制器数据管理服务。


我们看到闪存驱动器的容量变得足够大,以至于以联网访问共享存储的方式访问大于物理驱动器的数据集变得不那么重要。希捷有一款64TB的SSD,三星在大力宣传128TB的SSD。


NVMeF访问和大幅增加的服务器直接连接存储(DAS)容量意味着不需要阵列控制器,这可能意味着我们现在看到的全闪存双控制器和整体式阵列寿终正寝。相反,阵列实际上变成了一堆组成远程DAS结构的闪存驱动器(JBOF),拥有NVMe前端,需要某种最基本的共享访问,或者这种共享访问在拥有庞大DAS容量的超融合系统中完全消失。


阵列供应商(即戴尔、HDS、HPS、IBM、NetApp、Tegile、Tintri及其他公司)该如何是好呢?


将控制器数据管理迁移到应用程序堆栈中


一种可能性是,将某种阵列控制器功能迁移到访问服务器中,并让这项操作与NVMe数据访问过程并行执行。如果这切实可行,那么它们可以为此收取费用。


数据管理服务过去是在服务器应用程序堆栈层面提供的。比如说:


  • ·维尔卷管理器-VxVM和VxFS

  • ·维尔卷复制器

  • ·拥有内置逻辑卷管理器的操作系统

  • ·Oracle DataGuard


不过那意味着,NVMe驱动器无法直接看到,不过可以通过其他机制(比如卷管理器)来访问,而这种访问要耗费时间。


其中一部分时间可以通过用硬件来进行数据管理来消除。与加密一样,RAID已经实施在硬件中,纠删码是另一种级别比较低的活动,可能会进入到ASIC或FPGA。


但是级别较高的服务(比如重复数据消除)需要CPU周期和内存,它们无法用硬件来消除。


我们可以采用这种方法:使用内部NVME fabric的阵列控制器和驱动器可能在200微秒内响应数据请求,而NVMe访问驱动器只要花10微秒。通过提高数据管理堆栈的效率,并用硬件来执行低级操作,那么就可以将这200微秒缩减至100微秒,并为我们提供某种NVMeF加速机制,而不影响数据管理服务。


而那些数据管理服务可以在阵列控制器中或应用服务器中来执行。


双重访问阵列


另一种方法可能是使用双轨阵列,为此将面向主数据的JBOF添加到当前阵列的上面或旁边,并以某种方式将进出JBOF的数据传输到面向辅助数据的数据管理的存储域,数据在这里加以保护、复制、重复数据删除或其他操作。


由于NVMeF数据访问和传统块数据访问这两路并行运行,这将帮助客户转而进入到即将到来的NVMeF时代。


在NVMeF时代提供数据管理服务


我们需要指出的是,数据管理服务根本不是可有可无。数据保护、复制和重复数据删除等服务都是处理失效驱动器和服务器系统以及昂贵存储的好方法。某种数据管理功能需要在访问服务器中运行,防范(DAS)驱动器故障和服务器故障。


谁会提供这个?首先服务器供应商会提供(借助操作系统扩展),其次阵列供应商可能会提供,阵列软件组件转变成服务器插件。


这整个领域目前对于这类阵列供应商来说问题重重:不得不设法规划一条通向NVMeF未来的道路,可能会让它们当前的套件对于存储主数据而言毫无用处,或者不得不找到一种与NVMeF相当或更好的数据访问和存储方法。这看起来是个过高的要求。


这对服务器和服务器系统软件供应商来说是个潜在机会,而不是迫在眉睫的问题。维尔卷管理器和类似产品会获得新的生机吗?


服务器系统软件和阵列控制器软件工程师都非常聪明。不妨看看他们拿出什么产品来。


顺便说一下,Pure Storage和思科在6月份已展示了一款全闪存NVMeF设备,该设备将Pure Storage FlashArray块存储与思科统一计算系统(UCS)服务器集成起来。直接集成到FlashBlade的思科虚拟接口卡(VIC)提供了NVMe存储fabric。


相关阅读:

中高端IT圈人群,欢迎加入!

赏金制:欢迎来爆料!长期有效!