专栏名称: 高效运维
高效运维公众号由萧田国及朋友们维护,经常发布各种广为传播的优秀原创技术文章,关注运维转型,陪伴您的运维职业生涯,一起愉快滴发展。
目录
相关文章推荐
InfoQ架构头条  ·  专访太古可口可乐,饮料行业怎么做数字化升级? ·  4 天前  
51好读  ›  专栏  ›  高效运维

腾讯一人维护一万台服务器的奥秘 | 本周末沙龙活动

高效运维  · 公众号  · 运维  · 2017-06-12 07:11

正文


作者简介:

梁定安(大梁)

腾讯  织云负责人

目前就职于腾讯社交网络运营部,开放运维联盟委员,腾讯云布道师,腾讯课堂运维讲师,EXIN DevOps Master 讲师,凤凰项目沙盘教练,复旦大学客座讲师。

前言:

本文是以腾讯 SNG 的运维团队为背景,讲述在以织云标准化运维体系支撑下的运维效率。

先澄清下,这并非是要宣扬运维的个人主义,而是希望以腾讯的自动化运维实践案例,论证运维标准化和非功能规范对提升运维团队的能力、对做好DevOps 持续交付、对强化 IT 线对企业价值输出能力,有着深远且关键的功效。


1、分解运维一天的工作

运维的工作大致可以划分成两大类:计划内任务和计划外任务。

计划内任务指的是日常的变更、项目发布、待办工单处理等常规工作,这类任务如果安排得当,一般都不会是紧急任务。

还有一类很令人讨厌的,容易让运维同仁变成救火队员,并且背黑锅的任务,便是计划外任务。

顾名思义,这类工作指的是故障、异常发布变更、突发的告警,每当遇到这类任务,多为紧急重要,一不留意便容易酿成事故,让运维苦不堪言。

2、如何有效避免计划外任务:

既然深受计划外任务的困扰,我们有什么方法可以优化它,让运维的工作遵循二八原则,牢牢的将日常的 80% 需要完成的工作都控制在计划内任务中,甚至将此比例进一步扩大呢?

从 DevOps 的方法论中寻找答案,我们在持续交付八大原则找到一些提示(如下图)。

可能是先入为主的关系,一直从事运维工作的我学习 DevOps 时,总是喜欢先以运维的思路去理解,持续交付八大原则也不例外。

经过反复的斟酌,我将持续交付的八大原则辅以备注(见图中备注)。用一句话概括便是:

每个企业必须建立其标准化的运维体系,并以管理该运维体系作为运维工具平台的建设目标,最终提高企业 IT 的生产效率与质量,为企业输送更大的价值。

所以,避免计划外任务的有效手段便是前瞻性的规划与设计一套适用于企业自身的运维标准化和非功能规范。

让工具理解规则并自动化的完成规则内所产生的工作需求,从最大化的提升运维效率。

3、具象化运维标准化与非功能规范

要设计一套适用的运维标准化和非功能管理规范,我们必须要理清运维团队需要管理的运维对象都有哪些。

用脉络思考法,不难从日常的工作中,反向思索到运维需要关注的运维对象。(下图以腾讯的运维对象举例)

找到运维需要关注的运维对象后,并要规划清楚运维平台要对该对象纳管到何种程度。

举例说明下,如我们要管理的对象是软件包,抛开代码层面业务逻辑(功能特性)的考虑,对运维来说最关注的是:部署、容错、性能、监控、容量、进程端口、操作命令等等。

以腾讯织云十多年对软件包的标准化运维实践经验为例,通过将包管理与 CMDB、组件、监控等运维系统能力的有效结合,实现包管理的高度自治。

再配合自动化的运维平台,将软件包这个运维对象的标准化的最佳实践推行到整个腾讯 SNG 十万台生产服务器上。

正因如此运维团队收获的运维效率提升十分显著,自包管理标准被贯彻执行后,生产环境20000 多个包管理与 1 个包管理的复杂度是一样的,运维轻松应对对包的日常操作的所有需求。

同时,当面对计划外的进程/端口不存在、包日志写满硬盘、包 coredump、包监控异常的让运维陷入被动的难题,都被自动化工具或流程所覆盖,所有关于包这个运维对象管理的工作都变得有条不紊,从计划外任务向计划内任务转移。

4、腾讯运维实践的关键点

每家企业都应该有属于他们的运维难题,都应有一套对应的运维体系所解决。要实现腾讯一样的高效运维并不难,DevOps的方法论与技术实践中也有诸多参考可供选择。

想了解腾讯实践 DevOps 和运维自动化的更多细节?

敬请关注 6 月 17、18 日成都和重庆的DevOps China 线下活动,不仅有大梁的主题分享《一人维护一万台服务器的奥秘》,而且有萧帮主、猪八戒网专家等大咖分享哟。

🔽 长按下方二维码以参加

6月17日(周六)成都沙龙

🔽 以下为6月17日(周六)成都沙龙活动议程

🔽 长按以下二维码以参加

6月18日(周日)重庆沙龙

🔽 以下为6月18日(周日)重庆沙龙活动议程

您不在以上城市?

也请告诉你的小伙伴哟。


您也可以,点击“阅读原文”链接,以直接访问成都沙龙官网。