专栏名称: 数据中心运维管理
专注于数据中心基础设施运维与运营管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。
目录
相关文章推荐
数据中心运维管理  ·  NASA数据中心被淹,太阳观测数据处理中断! ... ·  2 天前  
数据中心运维管理  ·  AI交换机:未来四大变革 ·  4 天前  
数据中心运维管理  ·  某金融数据中心扩容改造供配电在线割接实战 ·  5 天前  
数据中心运维管理  ·  综合布线施工方案,安装、验收、测试、评审全过程 ·  6 天前  
51好读  ›  专栏  ›  数据中心运维管理

NASA数据中心被淹,太阳观测数据处理中断!附,历年类似案例分析

数据中心运维管理  · 公众号  · 数据库  · 2024-12-22 16:28

正文

事件回顾


      近日,美国宇航局负责存储两颗太阳观测卫星数据的服务器发生了故障。故障原因是斯坦福大学太阳动力学天文台(SDO)联合科学运行中心(JSOC)的服务器液体冷却系统中,一条直径10厘米的水管爆裂。这次爆裂导致实验室严重积水,水距离地板只有几厘米,严重损坏了设备。美国宇航局不知道它们何时能恢复工作,该数据中心不得不无限期关闭。


      太阳动力学观测站官网上的一篇博文解释道:“初步评估是水影响了许多系统,但没有给出何时恢复服务的时间。”

(图片来源于网络,侵删)


JSOC 团队表示,目前尚不清楚评估损失、维修设备和完成恢复工作需要多长时间,但损坏严重,预计维修工作将持续到 2025 年。


事件影响


1、由于JSOC处理来自太阳动力学天文台(SDO)和区域成像光谱仪(IRIS)的数据,此次事件导致NASA无法使用这些卫星监测太空天气。


2、SDO卫星每月传输约42TB的数据,数据处理系统无法处理之后的新数据,数据的交付将出现重大延误。


数据中心的守护者


     在数据中心的运维管理中,有效的动环监控系统能够实时监测环境和设备状态,预防灾难发生,确保数据处理和存储的连续性。云新产品能够实现对设备的全面监测,实时收集设备的监测数据,确保及时响应任何异常。



支持多种渠道的告警通知,包括邮件、短信、微信、钉钉、电话、飞书、弹窗等,确保告警信息能及时被管理人员获取并快速定位故障。


总结


     NASA数据中心的淹水事件凸显了数据中心基础设施的脆弱性和动环监控系统的重要性。云新产品通过全面监测和多渠道告警通知,提供了一种高效的解决方案,以确保数据中心的稳定运行和数据处理的连续性,从而最小化数据中心运营的风险和潜在的业务中断。


      在数字化日益深入的今天,数据中心的安全和稳定运行至关重要。云新产品不仅提升了数据中心的安全性,也为企业的稳定运营提供了坚实的技术支持。


      在过于异常的天气里,很多情况已经远远超出了人们的预料之外。这对于对环境有着严格要求的数据中心来说,无疑是一场严峻的考验。数据中心对于安全性有着极高的要求,即使发生地震、水灾等自然灾害和设备故障、火灾等突然事件,数据中心也必须具备很高的安全性和可靠性,以保证企业业务的连续性。


数据中心一旦有水灾事故发生,就会瞬间造成设备损坏和信息丢失,会带来无可挽回的经济损失。那么,我们先来看一下几个曾遭受水灾的案例:


案例一 美国Hunt Valley数据中心遭遇水管爆裂


△ 遭遇水管爆裂的Hunt Valley数据中心


2008年,美国Hunt Valley数据中心洗手间的一根管道爆裂并涌出大量的水。好在该中心的服务器机柜设计较为合理,离地间距为4英寸(1英寸=0.0254米),管理人员及时的发现了这一险情,并快速抢修,总算是有惊无险。


案例二 水淹土耳其Vodafone数据中心


△ 伊斯坦布尔Ikitelli地区所处位置(截自谷歌地图)


2009年9月9日,土耳其伊斯坦布尔遭遇暴雨并引发了洪水。由于地势低洼,疯狂肆虐的洪水淹没了该市Ikitelli区的大部分地段,也淹没位于该区的Vodafone数据中心。城市里的很多Vodafone(沃达丰)手机用户都因该数据中心被淹而无法使用通信服务。


案例三 澳大利亚Datacom数据中心遭暴雨冲击


△ 遭到暴雨冲击的Datacom数据中心


2010年,大暴雨将Datacom主机代管中心的天花板冲毁,使得服务器、存储和网络设备都遭损坏。起初该公司否认出现问题,但随着事故在网络上得到曝光,人们逐渐知道了真相。


另外,我们这里还要介绍一种意外事件带来的潜在威胁。当IT管理员周末步入数据中心查看的时候发现,机房顶端的天花板已经湿透并逐渐往下渗水。渗出来的水流入到地面并不断积压。管理员发现后立即将水桶放到渗水的位置,避免水位进一步提升。

△ 数据中心的天花板漏水


经过检查发现,这些水来自于空调管道,而这些管道被铺设在天花板上方,而且没有经过严密的密封处理。


从以上几个实例中我们可以看出,水灾对数据中心的影响之大已经是毋庸置疑。为了避免水灾对数据中心带来的潜在危害,数据中心的选址、海拔、机柜离地间距甚至是整个数据中心建筑物的设计,都需要有一个充分的科学论证,才能有效保证数据中心远离水灾可能造成的事故。

针对水灾防御的关键问题:

1.机房选址

数据中心选址时,在综合考虑自然地理条件、配套设施、周边环境、成本因素、政策环境、高科技人才资源环境、社会经济、人文环境等各个因素的前提下,应尽量选择足够的海拔以及不易受到水淹的位置。


2.灾备计划

一家优秀的IDC服务商,应当在发生诸如地震、水灾、雷击、火灾、机器故障这些偶然事件时,也具备很高的安全可靠性,保证业务不会停止。完善的灾备计划对于提高数据中心抵御水灾来说是十分重要。


3.机房建筑

IDC主机房间地面和空调室应建立100mm高的防水坝,并在防水坝的范围内做防水处理。在整个防水坝的范围内安装漏水报警系统,并与空调上水进水电磁阀联动,这样一旦发生漏水则可及时切断水源。由于机房外采用水消防,故可以在机房气体保护区分界墙体安装400mm高的防水坝以隔断可能产生的水患。同时,除了地面上要注意防水之外,也要注意屋顶的修建,屋顶应有足够的机械强度以及防水性能,位于机房上方的各种管路也应该妥善安装、定期检查,以确保水不会从机房的上方漏下来。


若是数据中心针对以上几个问题对于提前做好水灾防御措施的话,成功抵御必然在意料之中。