有了这些全面的考量和针对性的解决问题的技术和方案之后,上海交大HPC中心不仅实现了数据像风一样自由,而且还赢得了很好的收益。
通过安装戴尔HPC存储系统解决方案,成功解决了上海交大HPC系统的痛点,不仅成功应对了用户日益增长的存储要求,提升了存储系统性能的稳定性,并提供了轻松、高效、安全的管理环境。这不仅有利于满足教学科研等相关课题组的需求,强化了校内各院系科研实力,保证各院系课题组科研和教学的正常、顺利进行,更有助于提升上海交大科研和教学的竞争力。
首先,突破了存储容量和性能瓶颈。新系统上线后,目前投入使用的存储容量达到了2PB,几乎是原有存储系统容量的3倍,后续还会继续扩容至3PB。文件系统的负载目前可保持在一个较低的水平,同时小文件的读写操作速度很快。
生命科学学院基因组测序课题组一直是HPC系统的用户,新系统上线后,他们不再受原来系统在容量或性能上的限制,已经在新的系统上新增存储100TB。课题组的研究人员说:“与以前的系统相比,新系统运行更加稳定,没有出现什么问题导致整个集群性能下降,可以同时利用100多个节点进行高通量的基因测序分析。”
其次,简化了人员管理难度 。英特尔文件系统Lustre智能、丰富且直观的管理界面大大简化了所有硬件和存储系统组件的管理和监控。
上海交大HPC中心韦建文老师表示:“在可管理性上,Intel Lustre提供了一个Web界面,使我们能够非常方便地查看整个文件系统的吞吐量和故障点,并且当出现故障时操作也非常简单和方便。管理员只要远程登录到管理界面,鼠标点击几下就能完成故障恢复,比以前要方便很多。”
再次,稳定的文件系统性能值得关注。在保障文件系统性能稳定方面,Intel Lustre并行文件系统搭配戴尔HPC存储设备这一得以验证的参考架构,对于Lustre并行文件系统有针对性地进行了优化,提高了文件读取速度。
上海交大HPC中心韦建文老师说:“我们对于系统的小文件操作非常满意。在我们系统运行过程中,整个文件系统的负载可以保持在非常低的水平。”