近日,阿里云在成都云栖大会上发布了文件存储产品 NAS Plus,面向 4K级非编、基因测序、影视渲染等对数据吞吐、处理要求极高的业务,本文就 NAS Plus 的技术特性及非编场景进行详细分析。
说到广电行业,广电系统基本可以归纳成采集、编辑、审核、播放四大块,他们对存储有多维度的诉求,比如采集需要多路并发顺序写能力;编辑和审核需要高吞吐、低延时的高性能存储;媒资需要大容量,高性价比的海量存储;播放需要稳定,安全的存储;各个子模块都需要高可靠、高可用、端到端安全的存储系统。
非线编系统对存储的挑战是最大的,也是广电整条链路云化最关键的路径。以2017春晚为例,有6套4K机位进行了全程记录,每个讯道每小时产生 250G 数据,长达4个半小时的节目将积累大约7TB左右的总素材量。编辑如此庞大的数据量需要超高吞吐、低延时响应的存储系统才能满足。
阿里云这次推出的超高性能 NAS Plus 支持 PB 级别的存储空间,容量弹性伸缩,最大支持 200Gbps 的吞吐能力,1ms 以内的延时,支持12层4K媒体编辑能力,官方称比一般多媒体处理性能高10倍。基于飞天分布式系统上构建的超高性能NAS,具备高可靠、高可用、高可扩展的基本能力。
从兼容性上,阿里云NAS已经支持企业级应用通用版,即既支持NFS(v3.0/v4.0)协议,又支持 CIFS/SMB(v2.0/v2.1/v3.0)协议,同时有低成本大容量的和基于SSD高性能的存储类型。阿里云 NAS Plus 是 NAS 的升级版,针对行业定制的超高性能 NAS,适配广电非线编,基因计算,渲染,科学计算等高吞吐低延时场景。
除了上述基本特性外,NAS Plus 提供了定制化的客户端,无缝对接 linux 和 windows 操作系统,应用程序无需任何修改。
安全方面,NAS Plus 相比传统 NAS 做了更强的升级,支持软件定义的防火墙技术,端到端的数据加密,数据分层备份。
此外,针对媒体场景 NAS Plus 提供了特定的 API 接口,比如智能拼接和帧级共享。举例来说,在转码服务上,一个1T文件,按照 100MBps 的速度转码大概要3小时,而采用智能拼接 API 后,只需要 100ms 就可以完成,极大地提升了效率。
架构上,NAS Plus 的 client 会部署在高性能计算实例上(比如GPU);底层是分布式存储服务,即提供多份数据冗余,节点故障、网络故障等异常处理;中间通过万兆网络连接,可支持数百台 HD 工作站同时编辑。
说完了技术,再来看看场景。在广电各种场景下,NAS Plus 可以有如下应用:
满足中小网的需求,50TB 以内存储能力,提供HD非编工作站的存储支撑,100台以内 HD 工作站并发访问(单台4层HD实时播放)。
满足大网的需求,比如央视等高清制播系统,高码率音视频文件多层编辑,100TB 级别的存储能力,100台以上精编工作站持续多层并发制作能力。
提供 500TB 空间和 100Gbps 级别的吞吐,通常在超大型网或者教育行业,比如多个班次的学生同时使用非编,对存储的性能有非常高的要求。
一个最典型的例子是广电新闻制作系统采、编、审、播云端一体化解决方案,如下图,新闻采集直接上传到云端,在云上通过 NAS Plus 完成剪辑、编辑和审查,最后通过互联网分发到用户手中。
高吞吐和低延时不仅适用广电行业,基因计算、视频渲染等场景也有类似的需求,这些业务的中间过程都需要上百个或者上千个节点同时访问同一个文件系统,NAS Plus 同样适用这些高性能计算场景。