专栏名称: OSC开源社区
OSChina 开源中国 官方微信账号
目录
相关文章推荐
程序猿  ·  2024 互联网公司工作时长排行榜 ·  1 周前  
程序猿  ·  刚刚对面的程序员怼了产品经理 ·  2 天前  
逸言  ·  项目札记004:多租户的领域建模设计 ·  3 天前  
码农翻身  ·  Chrome背后最大的秘密:印度人拯救了Go ... ·  3 天前  
51好读  ›  专栏  ›  OSC开源社区

Gitlab.com 因疲劳误删数据导致宕机超24小时,现已恢复

OSC开源社区  · 公众号  · 程序员  · 2017-02-02 09:00

正文



国内时间 1 月 31 日晚上 11 点左右 Gitlab.com 平台因为其运维人员误删了数据导致整个网站下线。根据最新消息,其整个数据恢复过程在2日凌晨1点左右已经恢复,目前网站可以正常访问。


恢复期间 Gitlab 在 Youtube 上直播了整个数据恢复过程(小编想说:Gitlab 心真大,可能其是为了挽回一点在技术人员心中的印象吧)。根据官方对整个事情的描述大概可以推断 Gitlab 使用的是故障发生前6个小时的备份数据。因此就算恢复了整个平台,这6个小时时间内的数据还是丢失了。


下面一起回顾一下本次故障过程:


2 月 1 日GitLab.com 官方网站发布声明称由于其产品数据库问题导致的网站无法正常访问。据国外媒体报道称 Gitlab 网站疲惫的系统管理员深夜在进行数据库维护时,使用 rm -rf 删了300 GB 生产环境数据。等到清醒过来紧急按下ctrl + c,只有4.5GB保留下来。然后恢复备份失败,网站已经宕了10个小时还没恢复。



目前可以确认的是 Gitlab 的数据备份是无效的。报告称此次数据丢失并非仓库的数据,而是仓库相关的 issue 以及合并请求操作。


GitLab.com 号称有五重备份机制:

● 常规备份(24小时做一次)

● 自动同步

● LVM快照(24小时做一次)

● Azure备份(只对 NFS 启用,对数据库无效)

● S3备份。


这次事故发生时,所有备份全部无效!为了纪念这个事件,已经有人提议,将2月1日定为“世界备份日”


编译自:https://www.theregister.co.uk/2017/02/01/gitlab_data_loss/





推荐阅读

有了这些创意开源工具,再也不用担心春节无聊啦(2)

有了这些创意开源工具,再也不用担心春节无聊啦(1)

盘点各类编程语言中最火的开源项目,跟你想的一样吗?

免费个人博客搭建教程详解:Hexo+OSChina

程序员排行榜:测测你的码力值,2016年击败了全国多少工程师?

点击“阅读原文”查看更多精彩内容