回顾2017年京东6.18全民年中购物节,18天累计下单金额1199亿元、卖出商品超过7亿件。这些商品包裹的总重量可以装满957架空中客车A380,也可以装满5.9万个12米的集装箱。
眼见来到京东11.11全球好物节,在这场年底的全民消费狂欢中,我们带你走进京东,看看在这一年两度的狂欢节背后,是谁支撑了这样的奇迹。
11.11是服务器的盛会
2017年,京东引领了一波技术创新的浪潮,从无人机,无人超市到零售即服务的战略落地,在高科技领域所推动的任何新兴技术,都依托京东高质量的数据中心能力支持。
为了迎接2017年的11.11京东全球好物节,京东IT资源服务部为给消费者带来更极致的体验,服务器家族又增添了很多新成员。
新采购的服务器,冰山一角
不断刷新眼球的“双节”海量交易的背后,是海量默默工作的服务器,IT基础设施,它们承载着京东商城的业务,为全球的用户提供出色流畅的购物体验。
备战与交付:两大台阶,周期扩容
增加服务器数量只是京东商城面对618和11.11电商大战的一个缩影。中国电商行业飞速发展的特性决定各电商平台在618、11.11之前都需要扩容备战。
在618或11.11结束之后,上线的服务器就将继续服务商城新业务,因此618和11.11已成为京东服务器扩容的周期性指针。
针对大促京东形成了独有的每年两批次的服务器采购模式,大批量购买能够带来价格优势,但是对于京东IT资源服务部来说,从采购需求对接,到机房服务器上架,操作系统部署,服务器运维保障等关于基础设施的全生命周期管理,这都是不断面临的新挑战。
服务器的规模以每年上两个台阶的节奏,快速的增长。 京东IT资源服务部的基础设施管理部负责人汤鑫已经经历了6个618和11.11,从最初618“战役”只需上新少量服务器开始,到2017年618活动上线服务器规模扩大二十倍,汤鑫亲身经历了京东的快速发展。
正因为如此,每年618和11.11给汤鑫的感受并不是买!买!买!而是备战和再备战的过程:“从过完年开始,二、三月份是设备采购周期,三、四月份开始到货,五月份开始备战,整整一个月的时间。2017年11.11的备战时间更短,压力也更大。而在11.11之后,大家又会开始启动618的准备工作。”
京东IT资源服务部的职责
面对今年需求较多服务器数量,在5个月的时间里完成选型、购买、交付、上线,中间还夹杂着2017年内存价格飙升、SSD缺货等各种异常情况,所以京东基础设备部门今年的压力特别大。
“往年的备战工作,在10月份基本就已经一切就绪了,但是今年,一直到11月初,还有需求提出”而且还遇到了国庆节和“19大”两次机房暂时不能上线的特殊时段。
京东IT资源服务部的硬件系统部今年的工作也格外忙碌:不同版本服务器的网卡驱动、RAID卡驱动、操作系统版本验证等工作一项项的展开,为后续服务器批量上线铺平了技术道路。
由于京东商城的运营模式不同于其他的互联网公司,因此京东在兼容性和漏洞测试上会更加严格。就在2017年9月,京东IT资源服务部的支持团队在测试中发现某品牌服务器出厂版本的BIOS软件存在bug,有可能导致机器批量宕机。因为发现及时,IT资源部门在备战11.11前升级了近1万台机器的BIOS,确保服务器承载业务的正常运行。
前后两批到达的服务器被送往京东的各个核心机房,华北、华南、华东地区的十几个核心机房都得到了服务器计算的扩容。仅就机房部署上线能力而言,京东可以在一天上线交付1200台服务器(单机房),在通用服务器部署上线能力上,京东已经达到了国内一流水准。
运维与支持
数据中心的规划、服务器的维护,都离不开人的主导。 在现代化的数据中心,人与服务器的比例正发生着巨大的变化,机房运维人员的数量并没有随服务器的数量线性增长。借助外力的输入、科技的进步,大型数据中心中可以做到自动化运维来解放绝大多数的人力资源。
京东基础设施部门的团队现在约有70人,如果完全靠自己的人入场运维,仅华北地区的十几个核心机房就会把人力全部吃光,在京东要求7×24全覆盖无死角的保障618和11.11期间,值守机房的一线运维人员非常辛苦。