专栏名称: 运维
关注互联网运维技术,分享知识
目录
相关文章推荐
InfoQ架构头条  ·  从架构角度认识AI:为架构师解读机器学习与生 ... ·  6 天前  
51好读  ›  专栏  ›  运维

被曝裁到大动脉,网易云大规模故障真相:大幅降本裁员,人手太少排查了半天

运维  · 公众号  · 运维  · 2024-08-21 12:28

正文

8月19日下午

网易云音乐崩了

冲上热搜,

引发关注。

↓↓↓

热搜爆了!突然崩了!官方紧急回应


8月19日,有用户发现网易云音乐疑似出现崩溃,用户无法正常播放歌曲,App的页面也出现报错,相关消息迅速登上社交媒体。


有网友提到,网易云音乐“一直显示加载失败、播放失败、网络错误,电脑端、手机端、WiFi、流量都不行”“重启也不行,一度以为手机坏了”。有网友调侃称“怀疑电脑出问题都没怀疑过你”“补偿一下,送我一年会员吧”。



多个网友爆料,网易云音乐今天下午疑似出现服务器故障,网页端出现502 Bad Gateway报错,App无法使用。



网页版同样显示打开错误。





网易内部相关技术人员处获悉,此次宕机事件或与今年二季度的机房搬迁有关。“网易在贵州建立了机房,旗下业务分阶段搬迁,2024年Q2网易云音乐刚刚完成了贵州机房的迁移。


据前述知情人士表述,这次搬迁内部曾评估难度极大,稍有不慎就有重大事故发生的可能性。“前几天刚说这次完成的不错,结果就打脸了。”其认为,近几年互联网公司多出现大型技术事故,多与降本增效相关。而网易此次搬迁,内部也称实现了大幅的成本下降。“再加上裁员,连故障排查都要很长时间”。



针对此次故障的原因,网上有传闻称系有“程序员删库跑路”,导致系统全面崩溃。


对此,网易云音乐相关负责人第一时间回应称,相关传闻失实,此次故障与机房无关。“这个传闻缺乏基本常识,个别的程序员不可能有这么大的权限。”该人士说道。