专栏名称: 运维帮
互联网技术分享平台,分享的力量。帮主一直坚信技术可以改变世界,从毕业到现在干了15年运维,有许多话要和你说。
目录
相关文章推荐
51好读  ›  专栏  ›  运维帮

是时候跟传统告警通道SAY BYE BYE了(文尾有彩蛋)

运维帮  · 公众号  · 运维  · 2017-07-31 14:08

正文

告警通道已经是运维人员最熟悉的“非本专业”业务了,通道的表现已经直接决定了MTTR(平均恢复前时间),进而直接影响SLA。


运维兄弟们经常会为迟迟收不到报警而苦恼,等收到报警都过去10多分钟了,严重影响了故障处理效率,这是为什么呢?因为传统的短信或电话通道商,存在以下问题:

  1. 接入传统通道商过程繁琐,漫长;

  2. 传统通道商的服务意识差,处理问题效率低;

  3. 传统通道商无法合并相同告警,也无法进行风暴限速。


总结成一句话说:传统的通道商就不是为了运维告警服务而存在的。


下来,我们再来看看几个熟悉的坑爹告警场景:

  1. 故障已经发生,监控系统已经发现并吐出告警,但是短信通道堵塞,报警丢失或者一小时后才收到。

  2. 每个故障都吐出告警了,并且一直吐到修复为止。上百个告警中,重要告警没有被看到,业务down了20分钟才被发现。

  3. 凌晨半夜,故障发生,但连轴转的运维工程师们都睡着了,长期重要信息的漏看,头痛的leader不得不专门招聘一名半夜看报警的外包。

  4. 故障发生的时候,对所有的对象开始无差别的全部发送报警,很快一群人的手机都被打爆,为了避免群体骚扰,也避免所有人都侥幸地想XX会处理实际却没人处理的状况,只好专门采购一部运维手机用以大家轮流值班。


上述场景相信运维人员屡见不鲜,一旦出现,运维瞬间会成为群殴的对象,还要对着KPI流泪,但是你很难做些实际的改变,因为:


过去我们的告警通知是这样接入的


做过运维的同学都知道监控系统只能实时展现监控对象的运行状况,无法吐出报警通知,为了不时时“监视”监控系统,我们需要在监控系统中接入通知通道,如短信通知或电话通知。这个时候我们首先想到的是接入二级通道商(因工信部最新政策规定一级通道商不再对外提供新的短信或语音接入服务)。


这里需要我们花时间上网去搜或熟人介绍,用时长度取决于我们对通知的要求,如需要及时到达、返回失败回执,要求越高,就可能需要花费更长的时间来找通道商。下面让我们来还原一下之前告警通知接入传统通道商的过程:

1、接入测试

需要公司的商务跟传统通道商谈拢合作意向,提供N个公司证件、盖章,然后找到公司开发与对方负责接入的技术人员测试通道的各项指标是否属实。为了保证测试的效果的真实性,一般需要选择不同的时间段去做多次测试,并且需要通道商技术人员全程紧密配合。

2、开发上线

如果筛选出来的通道商测试结果满足公司的需求,然后便需要开发同学按照传统通道商的接入步骤接入开发上线,这步的快慢取决于传统通道商的接入流程和步骤难易程度,和,对方有没有及时解答接入过程中的问题。

3、告警风暴来袭

好不容易完成开发,上了线,结果在中午吃饭的一个小时内,手机收到将近100条报警,风暴来的如此突然,农药都打输了。于是回到工位,让商务同学去咨询通道商能否做相同告警通知的合并时,对方的答复都是做不到。但如果为此开发,又是人员投入。

4、等不到的服务

当通道商的通道本身出现了故障,应该及时向我们反馈情况,解决自身的故障吗?事实上,却是A让B查,B说要C,C说你问问D,一圈下来,只好投降。


如此繁琐、漫长的过程,无法实现的合并相同告警、风暴限速,低效的问题处理,组成了并不是为运维告警存在的传统通道商。


你还愿意接入这样的通道商吗?相信大家都不想再跳坑了。但,不接入,我们要如何实现告警送达?


幸运的是,在被报警折磨多年后,我们看到了业界第一款运维专属通道产品的出现。灵犀云通道,3分钟完成接入、让每一条通知都有价值。


灵犀云通道,是为IT运维打造的专属告警通道。它具有以下5大特点:

1、安全稳定

多通道接入,最大程度避免堵塞,专注运维服务,无营销通知,多重安全策略保障通道平台永不查封;---再也不用担心通知通道无故宕机了

2、智能合并

基于通知内容关键字的分析,合并同类事件,能够有效减少相似、重复通知的骚扰,让每条通知都具有价值;---再也不用担心被重复通知骚扰

3、多种场景

提供短信告警、电话告警、短信通知、语音通知等4种使用场景,总有一种场景适合您;---再也不用为了找不同场景的通道商日以继夜

4、简单接入

一个API快速接入Zabbix、Ngions、Open-Falcon等监控工具,迅速让你拥有告警通知功能。---再也不用在接入通道商时遇到各种坑和需要帮助时的无助

5、7*24小时服务

灵犀云通道提供贴心的7*24小时服务,只要你有问题,都可以随时找到我们,第一时间给你排忧解难。--再也不用担心通道商无视你的问题和诉求


这么安全、智能、多场景、简单、服务到位的通道服务,只需要三步就可以接入:


1、注册/登录,申请认证后,新建应用



2、新建接收人/群组



3、API接入

灵犀云通道提供了四种场景的API,可以接入任何系统,如运维常用的Zabbix、Ngions、Open-Falcon、Prometheus、Cacti、监控宝等。以短信告警API为例,来看下接入API的文档。



以上步骤在通过实名认证审核后只需3分钟就能完成告警通知的接入,接入后发给你的每一条通知都有价值。


看到这么简单的接入流程,你是不是有点心动呢~赶紧来体验吧,注册就有免费短信和语音数量相送。


详细请扫码二维码或者点击「阅读原文


网友福利,送书活动

本文留言点赞最多的前 5 名,每人送正版《Zabbix 企业级分布式监控系统》1 本,内增51CTO学院课程学习卡,活动截止8月3号前。