专栏名称: 企业存储技术
企业存储、服务器、SSD、灾备等领域技术分享,交流 | @唐僧_huangliang (新浪微博 )
目录
相关文章推荐
51好读  ›  专栏  ›  企业存储技术

可调容量SSD 与 Open Channel的质保疑问

企业存储技术  · 公众号  ·  · 2019-09-04 08:00

正文

请到「今天看啥」查看全文


本文内容非商业用途可无需授权转载,请务必注明作者及本微信公众号、微博 @唐僧_huangliang,以便更好地与读者互动。


目录

- Open Channel SSD 保修问题:从唐总的疑问谈起

- 可调容量让企业级 SSD 价格更透明

- 顺序写 DWPD :这个保修政策怎么用?

今天有空写点东西,并不算是一个全新的话题吧,

上周末看到一篇好文《 实战 | eBay PB 级日志系统的存储方案实践 》,主要是关于 Ceph FS MDS 集群应用的宝贵实践经验,最后一段在讨论应对 SSD 稳态性能下降时提到:

读密集型 SSD 加上大的 OP (超量配置,如主动预留 20% 的额外空间) ,能达到同系列写入密集型 SSD 同样的性能和可靠性 ,但我们并不确定该经验是否在更大范围内具有通用性。

记得早在多年前 Intel IDF 峰会上就有技术课程讲过这一点。巧合的是,上面这篇文章的作者,陈晓熹 黄志腾两位专家之前也是在 Intel 研究 Ceph 的:)

Open Channel SSD 保修问题:从唐总的疑问谈起

这个问题唐杰总在一年前的 FMS 闪存峰会撰文时提出过。如果 Open Channel SSD 将不同物理 NAND Flash 通道直接暴露给上层主机,应用的写入不均匀,导致某个或某些通道先超标损坏怎么办?


先不论这样完全 Open Channel SSD 有多少销售,我想厂商是不愿承担这个风险的。

个人猜想下,对于 一部分闪存通道写入 DWPD 超标,而余下通道仍能使用的情况, SSD 供应商估计是不管的 ,能否继续用看用户的本事。除非在质保期限(如 5 年)内, NAND 之外的部分如控制器、 DRAM Cache 等损坏导致 SSD 故障,这些应该属于保修的范围。

以上逻辑不复杂吧,主要是我脑子笨,过了一年才把这些写出来:)讨论Open Channel先到这里,下面开始正题:

可调容量——让企业级 SSD 价格更透明

大家应该知道,传统 企业级 SSD 通常按照写入性能 / 寿命分 2-3 个等级 。比如 Intel SSD DC P4510 的最大 DWPD=1 ,容量点是 1 2 4 8TB ;而 P4610 的最大 DWPD=3 ,容量点则是 1.6 3.2 6.4 7.68TB

在以往 1.6TB P4610 可能比 2TB P4510 要贵不少,而上周末我在和专家朋友聊天时,他告诉我这个价格差距已经不大了。其实各位看过本文开头的朋友,也许猜到了 二者可能使用了相同等级 / 容量的物理 NAND 颗粒,主要是 OP 预留空间不同

而现在也开始流行另一个趋势,就是不再把这 2 SSD 划分不同的型号,干脆按照容量设置来定义寿命。


根据 WD 的资料, SN640 可以 使用简单的 resize 操作将 1.92TB 降低容量到 1.6TB ,同时写寿命从 0.8 提高到 2.0 DWPD

也就是说,同样物理闪存容量的 SSD 硬件配置为 1.92TB DWPD=0.8 ,可最大写入 2.8PB 数据;而配置为 1.6TB DWPD 则提高到 2.0 ,可最大写入 5.8PB


其他厂商也有类似的情况,只是有些仍保持不同的 SSD 系列命名。不难判断, 1.6TB 1.92TB 应该是卖同一个价格了。 以此类推

从资料来看,只有 U.2 2.5 NVMe 外形的 SN640 提供 2.0 DWPD 的选择,估计是 M.2 E1.L (即 EDSFF 规范,外形同 Intel Ruler )都针对读密集型应用。

这里有个小问题,就是按道理 0.8 2.0 DWPD 的规格应该 对应不同的写入性能 。其实在下面的小字注释里写了这些性能指标都是针对 6.4TB 的,预计 0.8 DWPD SN640 很可能达不到 12 万稳态随机写 IOPS 这么高。

而我在这里也有一个质保的问题。 如果用到一半改变过 OP ,写寿命限制该怎么计算? 我们知道 SSD S.M.R.A.T. 计数器中有个写入容量记录,对于可调容量 SSD ,这个数值是否要 2 种容量点模式下分别统计?


友情插个小广告:如有需要联系 WD/HGST SSD 等产品销售的朋友,可以找圈子里的名人 平台小秘书 (秘书长)。如果您还不认识他,可以私信或者在本文下面留言,我帮忙介绍:)

顺序写 DWPD :这个保修政策怎么用?

写到这里,我又想起 2 年前在《 Intel 发布 P4500 P4600 NVMe SSD :规格释疑 》中提到过的一点。


我倾向于认为,上面列出的顺序写 DWPD 更多时候只是一个参考值。

P4500 SSD 为例,其 顺序写寿命比随机写高不少,因为 SSD 内部产生的写入放大不同

当年我并没考虑过这种 SSD 的保修是否有 2 种算法。我也还 没听说过提供顺序写和随机写的单独统计? 那么有哪些用户可以享受 4.62 DWPD 的政策呢?

在没有找 Intel 朋友核实的情况下,我猜测 也许有的大客户能协商到这个待遇吧 ,比如视频监控行业,前提要优化过的 I/O 都是以大数据块顺序来写入。一般用户怎么来保证 / 证明自己的随机、顺序写比例啊?

免责说明 :本文为纯技术讨论,具体的 SSD 质保等政策请以各厂商解释为准。


参考资料:https://documents.westerndigital.com/content/dam/doc-library/en_us/assets/public/western-digital/product/data-center-drives/ultrastar-nvme-series/product-brief-ultrastar-dc-sn640.pdf


:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 进一步交流 技术 可以 加我的 QQ/ 微信: 490834312 。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)


尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号: HL_Storage

长按二维码可直接识别关注


历史文章汇总 http://chuansong.me/account/huangliang_storage

点击下方“阅读原文”,查看更多历史文章
↓↓↓






请到「今天看啥」查看全文