仲夏来临,气温一言不合就能飙到35℃+,你与烤肉只差一撮孜然……然而运维同学必须要挺住,因为还有机房要照顾啊!
随着夏季气温升高,雷雨增多,由于散热或者接地不良、漏雨导致设备运行出现问题的机率开始上升。
根据近期一组数据,已有部分地区出现由于机房环境温度较高、设备风扇故障、防尘网堵塞等带来的设备机框温度过高导致的业务异常,甚至单板长期高温环境下运行导致故障的情况。
所以,夏季机房运维需要注意什么?运维同学该怎么做?Tips马上奉上:
每天检查机房环境温度,通过调整机房空调温度设定达到设备运行要求。加强对相应网管系统的监控,每天监控设备内部温度情况和设备风扇运行情况。如出现风扇故障、温度超限告警需要及时进行更换并返修。每月定期检查一次设备防尘网情况(关注机房防尘条件不好、室外机柜),及时进行清洗,避免出现尘土堵塞导致散热不良的情况。强烈建议每季度清洗一次设备防尘网,环境较差的局点建议提高清洗频次,以防高温带来设备运行风险。对长期运行容易出现故障的风扇组件,建议储备部分备件,以便风扇故障后能及时更换。对温度过高的设备通过打开机柜门、采用风扇强制散热的方式进行应急降温,同时及时返修故障风扇。部分机柜门上有一层防尘网,在机房粉尘情况良好的情况下建议将机柜防尘网拆除,提升散热效果。检查设备接地情况,尤其是模块局等条件相对不足的边缘局点,确保设备接地良好平稳度过雷雨季节。检查机房的防雨情况及时进行修复,避免由于漏雨导致设备故障。专注于数据中心基础设施运维管理,分享运行维护经验,分享数据中心行业发展趋势及新技术应用。
联系小编:wj2012bj
QQ交流群: 108888484
投稿邮箱:[email protected]
▲长按二维码"识别"关注