专栏名称: 大话存储
由存储系统架构师、《大话存储》系列图书作者冬瓜哥创立。分享业界逼格甚高的存储和计算机系统底层知识,皆为原创。存储系统底层技术、机理、设计、思路分享,绝不忽悠。想变得比别人逼格高一点,就来阅读本公众号的文章。
目录
相关文章推荐
51好读  ›  专栏  ›  大话存储

打造全国产存储系统到底有多难?

大话存储  · 公众号  ·  · 2017-11-23 09:01

正文

中华民族伟大复兴的路上,计算机系统的国产化道路可谓任重道远。本篇,冬瓜哥就来分析一下,打造一款全国产存储系统,到底需要哪些部件,以及国产化现状。


《存储系统权协议栈总结》 一文中,冬瓜哥给出了存储系统中的权协议栈分析,其可作为一个了解存储系统架构的基础文章。

目前的存储系统部件关系基本是这样的:存储介质(磁盘、NAND、光盘)--->介质驱动器/控制器(硬盘驱动器控制器、SSD控制器、光驱控制器)---> I/O接口控制器(SATA/SAS/PCIE) ---> I/O通道扩展器/交换器(SAS Expander、PCIE Switch) ---> I/O通道主机总线适配器(SAS/SATA HBA/Raid适配器)---> CPU/桥片。

在这条完整的I/O路径上,目前来讲,可以说,从头到尾全国产化,基本看不到边。

一.  存储介质和硬盘

先说说机械硬盘,当年长城硬盘算是国产,但是,其内部也并没有实现全部件国产,曾经尝试过使用一些国产部件,但是都以失败告终,不得不换成日产部件,导致成本居高不下,最后夭折,演绎了一段悲情奏鸣曲。从此,再没有人搞机械硬盘,市场被国外垄断,如今只剩下三家在玩,而且面对固态硬盘的围堵,玩也是毫无动力。

再说说固态硬盘,固态硬盘的门槛比机械盘可谓是低得多,其没有精密机械部件和模拟信号处理部件,全都在数字域,而SATA/SAS/PCIE,以及SCSI/NVMe协议都是标准开放的,所以用fpga就可以实现一个SSD控制器。但是企业级NAND颗粒和SDRAM颗粒占了SSD整个成本的90%左右,而目前来讲,这方面国产一片空白。紫光的3D NAND据息明年可以量产上市,这是个良好的开端,在固态存储时代实现弯道超车,从存储介质开始。

SSD控制器虽然不是SSD的成本的主要核心,却是其他一切的核心,包括性能、可靠性、兼容性、寿命、开发成本等。在这方面国产公司雨后春笋,其中大部分是中低端产品,而中高端产品则一直被国外产品垄断,包括Intel、Microsemi(收购了PMC的Flashtec系列控制器)、三星以及其它厂商。不得不说,国外的这些SSD控制器在可靠性和成熟度、市场推广能力和生态建设能力上都更胜一筹,但是其高价格也相对高。

SSD整盘方面,目前国产产品中较为高端的为Memblaze(忆恒创源)的PBlaze5系列产品,其采用了高规格的主控制器和3D NAND颗粒,固件+算法完全是自主研发,算是国产SSD厂商中唯一一个可以做到100万IOPS以上的全系列企业级产品线的。另外,PBlze5系列产品还率先支持了NVMe双端口设计,为NVMe固态盘在企业存储系统中的广泛应用扫清了一道关键障碍。企业级存储系统的一个重要特征就是双冗余部件,什么都是双份或者多份。纵使可以使用Raid技术实现硬盘的冗余,但是为了防止单个控制器故障,其要求单个硬盘提供两个物理上独立的接口,分别接入到两个控制器中的各一个。

这个特性在SAS接口上得到了完美的实现,SAS硬盘都是双端口,但是在新兴的NVMe+PCIE接口的固态硬盘上却一直没有人推出,直到PBlze5。该特性可以通过软件控制来变更,也就是原本一个x4 PCIE通道的U.2接口,可以被配置为分裂成2个x2通道的逻辑接口,然后通过背板或者专用连接器,将这两路的x2信号分别导向两个控制器中的一个上的CPU一端,这样,当其中一个控制器故障时,依然可以通过另一个控制访问该盘,从而实现冗余。

光存储应该说是存储领域长期默默无闻的角色,但是俗话说,三十年河东三十年河西。光存储或许会是将来的一匹黑马。目前,光存储系统已经基本上实现了全面国产化。其典型代表为国内的紫晶光存储系统,紫晶是目前中国最大的蓝光光盘和蓝光光存储系统提供商,也是拥有全自主研发的软硬件和介质的厂商。


紫晶光存储系统有3个系列:分别为柜式中低端的BD系列(光盘库)、柜式高端的ZL系列(光存储系统)以及桌面式的MHL系列(光存储系统)。BD系统更像是以光盘为边界的光盘管理系统,其上存储的数据格式符合标准格式,可以被任意标准光驱读写。其他来源的标准格式存储的光盘也可以纳入BD系统的管理范围。而ZL系列更像是个比较封闭的光存储系统,其有自己的存储格式,用户感知不到光盘,而只感知到NFS/CIFS目录空间。

ZL系列在一个标准机柜内最多可装载 12240 张光盘,存储容量按型号的不同从 180TB 到 1.2PB,属于业界领先水平。支持可48个光驱并发,支持万兆网传输。提供数据冗余技术,用户可按需要配置冗余级别,实现数据的最高安全化。MHL系列为4U高度的机架式光存储系统。

小结:固态硬盘全国产化,指日可待!但是随着Intel推出3d Xpoint介质和对应产品,NAND介质以及其附属生态是否会迎来发展瓶颈,也是值得思考和观察的。

二. I/O通道和Serdes

硬盘的主控前端,是I/O接口控制器,包括SATA、SAS和PCIE这三者。其核心技术并不在于连接器形态,这些都根不不是事。其核心技术也并不过多的在于其交互协议,因为这些协议都是开放的、标准的,其无非就是一堆事务数据包编码格式。其真正的核心在SATA/SAS/PCIE的PHY层,或者说,Serdes层,或者说,Serdes中的信号完整性处理层。

目前,中低端的SAS/SATA I/O控制器基本上被Marvell垄断,而中高端的(性能、可靠性、扩展性都要更高)基本被Microsemi和Broadcom垄断。Intel一度想把SAS控制器集成到桥片内部,但是最后出了bug,据说也是Serdes方面的问题,后面就再也没玩了,只搞PCIE,以及后续的Ominipath接口。







请到「今天看啥」查看全文