专栏名称: 数据中心运维管理
专注于数据中心基础设施运维与运营管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。
目录
相关文章推荐
DataFunTalk  ·  电子书上新 ... ·  4 天前  
DataFunTalk  ·  电子书上新 ... ·  4 天前  
数据分析与开发  ·  又“刑”了!搞瘫公司三千多工作电脑,不给 ... ·  1 周前  
51好读  ›  专栏  ›  数据中心运维管理

应急预案接受实战检验 ——学校网络中心机房抢险实录

数据中心运维管理  · 公众号  · 数据库  · 2017-05-22 06:50

正文

2017年4月10日晚,学校网络中心机房温度突然升高,信息办负责人迅速通过部门微信群沟通,部署启动应急处理,工作人员第一时间到达现场,通过远程检查、现场勘察、应急实施、检查分析,原因为机房精密空调故障。


按照温度异常应急预案处理流程和措施紧急处理,直至11日凌晨2点机房温度回落至25.9摄氏度,基本满足机房运行需求,应急处理过程机房设备无损坏、网络无中断、数据无丢失。


机房精密空调于2011年购置投入使用,曾在2014-2015年多次出现故障,2015年7月签订维保服务合同,并加装了温湿度传感报警器,极大地降低了故障概率。


紧急行动

 22:29机房室温超过设定报警阈值(30摄氏度),信息办全体人员即刻收到手机短信报警。信息办立即启动应急预案迅速做好工作安排和人员分工,一路迅速赶往机房现场勘查处理,另一路开展中心机房内设备状态远程巡检,并制定下一步技术措施。


 现场工作人员23:00到达现场,经初步勘查,机房精密空调22:10高压报警且无法重置,导致中心机房内热量无法散发,高温触发警报。工作人员随即开展第一阶段应急措施:打开中心机房内所有隔断、门、窗,利用室外较低温度合理散发中心机房内热量,打开工作区中央空调协助机房降温等。


23:30开展第二阶段应急处理措施:清理室外压缩机出风口后,断开精密空调空气开关,强制重置精密空调等。至11日00:30许,应急措施全部生效,精密空调恢复工作,中心机房室内温度有明显下降。


01:30中心机房内温度逐渐降至合理范围,经全体信息办工作人员远程、现场巡检后,确认中心机房运行环境全部恢复正常。


后续对空调运行日志分析,制冷故障技术评估及空调外机清洗等工作正在积极开展,同时对当前精密空调运行状况做风险评估,并纳入学校信息化建设统筹,以底线思维确保中心机房安全运行。


工作人员在机房按照预案应急实施



来源:天津中德应用技术大学

专注于数据中心基础设施运维与运营管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。

联系小编:wj2012bj

QQ交流群: 108888484

投稿邮箱:[email protected]


数据中心运维管理

ID:wj-yunwei


▲长按二维码"识别"关注