你好,我是赵成,来自美丽联合集团,集团旗下两大主力产品是蘑菇街和美丽说,我目前负责管理集团的技术服务团队。
为什么我选择踏上运维之路?
我加入蘑菇街之前,在华为工作了七年,经历过开发、测试、运维以及一线客户服务等诸多岗位。这段在华为的经历,不但迅速提升了我的能力,培养了我全面思考的意识,还让我积累了丰富的电信级和互联网业务研发及运维经验。
说起来,自己踏上运维之路有很大的偶然性,主要是因为:
第一,我不忍心看着自己跟团队辛苦开发出来的系统到了线上总是出问题,所以每当出现问题的时候,我就第一时间想要解决问题,久而久之,自己就积累了丰富的经验,也成为团队中比较重要的角色;
第二,也是更重要的一个因素,我自己非常享受那种攻克难题之后的成就感。
从业这十年,我所遇到的这些挑战,让我获得很多宝贵的实战经验和感悟,也让我对运维产生有了一些不一样的思考。
我认为“运维思路上的转变,远比单纯提升运维技术更有价值”
我认为,一个研发团队内,除去业务需求实现层面的事情,其它都是运维的范畴,这个范畴内的事情本质上都是在为软件生命周期中的运行维护阶段服务。
我们在大学的软件工程中就学过,从软件生命周期的角度看,软件开发阶段只占整个生命周期的 20%~30%左右,软件运行维护阶段是最长尾的,这条规律放在当前这个时代同样适用。
在软件生命周期中,我们可以很清晰地划分出“开发阶段”和“运维阶段”,这个分界点就从开发完成代码开发,测试验收通过后,交付到运维手上的软件包开始,自此之后的阶段就是软件的运行维护阶段了。
一个公司对于开发的诉求应该是全力实现业务需求,并将需求尽快发布上线以实现商业上的收益。但是,在一个公司里,除了专注于业务需求的开发和测试角色外,还会有另外一大类开发,比如我们常见的中间件开发、稳定性开发、工具开发、监控开发、IaaS或 PaaS平台开发,甚至专注于底层基础架构的内核开发、网络开发、协议开发等等。
这里请你跟我一起仔细思考下,我们会发现除了业务开发和测试外,前面所提到的那些技术岗位都是为软件生命周期中的运行维护阶段服务的,这些角色的作用就是提升研发效率和稳定性,进而降低成本。虽然他们并没有全部被定义为运维岗位,但是本质上他们是跟业务软件的运行维护阶段直接相关的。
我之前做外部分享,一直表达的一个观点就是,运维能力是整体技术架构能力的体现,运维层面爆发的问题或故障,一定是整体技术架构中存在问题,割裂两者,单纯地看技术架构或运维都是毫无意义的。
但是,我们在绝大多数情况下,忽略了这个隐藏在软件生命周期中真正的运维范畴,而是简单直接地从软件生命周期分段的角度,生硬地给开发和运维划定了一条界限。
也正是这样一个简单直接的界限划定,让我们将运维仅仅局限在了服务器维护、网络设备配置、软件安装维护这些最末端的职责上,而我们又期望运维这个角色能够掌控全局,不要在这个阶段出现任何问题。这就很像临渴而掘井,是不现实的。
很显然,我认为,运维思路上的转变,远比单纯提升运维技术更有价值,而运维真正的价值应该跟研发团队保持一致,真正聚焦到效率、稳定和成本上来。
而这也正是我们很多公司和团队,当前所遇到的最大的痛点和问题。所以,在我的专栏里,我会针对这些痛点和问题分享一些我的思考。
在我的专栏里你能看到什么?
通过“赵成的运维体系管理课”专栏我会做系统地内容输出,用 3个月时间把一个运维体系讲透。专栏内容聚焦在分布式软件架构下的应用运维这个领域,更多的是我对运维的一些架构思考,主要有以下四个部分:
应用运维体系建设。这是我们做运维的基础,我会分享从标准化和应用生命周期开始,如何一步步建立运维技术体系和组织架构,以及整个过程中的沟通协作等方面;分享我们应该如何树立正确的运维建设思路。
效率和稳定性等方面的最佳实践。这些是运维价值的体现,我会围绕持续交付和稳定性建设两个方面,分享如何打造不需要任何运维参与的端到端交付过程,如何在实践中锤炼出稳定性保障体系。
云计算方面的思考和实践。云计算技术的蓬勃发展为我们的业务和技术提供了更多的可能性,利用好云这个平台将会是运维升级转型的必备要求。我会分享在混合云、云存储、静态化以及 CDN上的实践经验,以及这些实践所带来的在成本和体验上的巨大收益。
个人成长与趋势热点分析。这一部分更多的会是我个人的一些思考,包括运维技术发展趋势、团队管理、个人成长、热门事件解析、观点碰撞等。
订阅专栏
点击下图 / “阅读原文”,订阅“赵成的运维体系管理课“,赵成带你走进运维世界,了解运维真正的价值。
我们还建立了“赵成的运维体系管理课“微信群,有机会试读一手文章,更能有可能和作者亲密互动!赶紧关注“极客时间”服务号(ID: jikeshijian),回复关键词“运维”,获取入群方式吧!