专栏名称: 51CTO
51CTO官方公众号——聚焦最新最前沿最有料的IT技术资讯、IT行业精华内容、产品交流心得。本订阅号为大家提供各种技术干货,还会不定期的举办有奖活动,敬请关注。
目录
相关文章推荐
新浪科技  ·  【#黄仁勋称通用机器人时代已到来#】#英伟达 ... ·  20 小时前  
36氪  ·  金沙江创投也要「分家」了 ·  昨天  
51好读  ›  专栏  ›  51CTO

【平凡的世界】服务器需要“被忘记”

51CTO  · 公众号  · 科技媒体  · 2017-07-07 11:45

正文


Jane: “Kurt,这些人是谁?他们在干什么?”

Kurt: “一帮搞计算机的家伙,我们可能遇到了严重的安全问题,这些人在找到底是哪里的漏洞。”

Jane: “所以,他们是在修计算机了?还是……?”

Kurt: “Patterson说这件事情可能很严重,所以我们要小心一点儿,什么也不要碰,一切都听这些楼下的人的。”

Patterson: “Jane,这些人平常不会出现在这里,但如果他们出现了,那一定有大问题。”

Jane: “所以?”

Kurt: “我们可能有大麻烦了。”


这是美剧《Blindspot》第二季中的一幕,平常在办公室、实验室工作的FBI探员Kurt、Patterson和同事Jane,一早刚进办公室就发现,几乎所有FBI纽约分部的IT人员都在他们的办公室紧张忙碌着,所有人被告知不要碰任何东西,“特别是你们的PC和智能手机,U盘也不要碰”,于是,就有了上述的对话。

这一幕当然只是美剧中虚构故事中的一个情节,但这一场景却很显然来自于真实世界:就像Patterson说的,那些 “IT Guys”(干IT的家伙们)平常不会和我们打半点儿交道,可是一旦他们出现 ——就是那样忽然紧张忙碌的出现——一定会有什么不正常、不顺利的事情发生,所以 “我们可能有大麻烦了”。

人们总说:艺术来源于生活,更高于生活,但真实世界中有关“IT Guys“的故事,却远比《Blindspot》中所展示的画面更加戏剧化:去年夏天,Uber位于美国硅谷圣克拉拉(Santa Clara)的数据中心意外出现空调失灵情况,导致数据中心的温度极速飙升至46摄氏度,这意味着无论湿度如何,数据中心的温度很明显已经超了x86服务器的正常工作温度。


随之而来的情形,用Uber的话说就是: " Racks and racks of Servers went down(一个机架又一个机架的服务器宕机了)" ——这真是个糟糕透顶的时刻,也正是IT Guys要登场的时刻了: 如果情况继续恶化下去不得到遏制,这一数据中心所支持的成千上万的Uber司机与乘客正面临着服务掉线的风险, 不难想象,类似"Uber is down","Uber has been unable to respond"的推文一旦成千上万的出现在Twitter上,对这家共享经济独角兽公司,是一个多大的业务、市场和公关灾难。

好在,“46℃灾难”在戴尔PowerEdge服务器的面前停止了—— "but not one single Dell Server(没有一台的戴尔服务器)", 虽然大量机架上的服务器都出现了高温宕机,戴尔服务器却凭借着 "在45度的高温(湿度90%)下工作超过90个小时" 的优异能力坚持了下来,它拯救了所有IT Guys的工作,避免了楼上业务部门很可能遭受的灭顶之灾——来自媒体、Uber司机、乘客和公众的大规模声讨。


所有所幸度过这一“劫难”的Uber员工心里或许都会想起一句知名的谚语:No news is good news(没有消息就是好消息)——“真希望从来没有听见过服务器的报警声,甚至是一台服务器重启的声音,都会让我们的神经紧绷起来。” 一位在新浪微博工作了多年的数据中心运维工程师说,即使是新服务器启动加电的声音,“有时候都会让人心里颤抖一下”,作为在第一线和服务器打交道的人,“我们不求大富大贵,但求平安无事。”


IT即业务 计算即未来

服务器需要“被忘记”

如果说十年前,写一篇文章《IT即业务 计算即未来》,可能很多人还会不以为然,那时候电子商务才刚刚兴起,在线应用主要还是游戏、网站和QQ等聊天工具,没有滴滴打车,没有Uber,更没有微信和ofo共享单车,除了少数互联网公司,“IT就是IT,业务就是业务”,把这两者画上等号简直是不可思议的事情。


现在,再写一篇文章,同样是《IT即业务 计算即未来》的标题,人们则会说“这是一个多么土的话题”或者“这还用你说?”,几乎每一个身处于IT行业、新经济环境中的从业者都清清楚楚的明白: IT即业务 计算即未来——企业的业务就是IT,IT就是业务本身,而计算则是企业业务发展的未来。


但作为IT的核心、计算的承载,服务器又肩负着什么样的任务呢?


简单来说,服务器要能做到IT Guys的“默默无闻,鲜有问津”就是最好的,“在这个计算无所不在的世界里,服务器是无所不在的,支撑着企业业务、社会服务和创新应用,而为了让一切都按部就班、井然有序, 服务器最好的平凡的,没有人意识到服务器的存在,或者说,服务器从不出现在话题讨论的头条中,是最好的。”

服务器是需要“被忘记”的产品,之所以这么说,是因为在实际的运行中,服务器能“被想起来,被重视,被提到CIO或CEO的议事日程上”的情况无外乎有四种:

性能不足,无法满足业务的峰值需求,这个时候,使用计算能力的用户面对的是延迟的甚至是无法返回的响应,无法得到正常的业务服务;

管理复杂,运维困难,导致数据中心服务器管理团队工作超负荷,不断地投入人力、物力和精力,但往往收效甚微,团队的工作时间都被侵占在服务器管理运维上,无法去支持其他同样重要的业务;

在突发状况时无法积极应对,比如说前面说到的Uber数据中心空调故障的问题,直接导致业务延迟甚至中断,而且恢复起来非常困难,造成长期的影响和企业的商业减誉;







请到「今天看啥」查看全文