Re: [爆卦] Gitlab員工手殘砍掉production惹消失
ㄤㄤ
官方事故報告昨晚出惹
前後發生了幾個事件串連,才導致停機這麼久
1. 原本是在處理數個惡意流量用戶(還發現有個用戶把gitlab當某種cdn在用)
2. 發現高負載下從庫db2數據落後4GB, 改惹改配置卻一直沒路用。想說把PG的data文件
夾砍掉,重新再跑一次乾淨的同步。
3. 幹連到db1砍到主庫ㄌ
4. 發現自家原訂五個備份計劃都失效,兩個異地備份還都空ㄉ。
5. 唯一一次有效的備份還是DBA六小時前因為別的原因手動快照
6. 直播修復挺潮ㄉ,這次事件透明度網友讚譽有佳
還釣到幾個PG的主要貢獻者來幫他們處理問題
QQ
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 106.1.45.38
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1486037655.A.768.html
推
02/02 20:20, , 1F
02/02 20:20, 1F
推
02/02 20:23, , 2F
02/02 20:23, 2F
推
02/02 20:36, , 3F
02/02 20:36, 3F
推
02/02 20:52, , 4F
02/02 20:52, 4F
→
02/02 21:03, , 5F
02/02 21:03, 5F
→
02/02 22:24, , 6F
02/02 22:24, 6F
推
02/02 22:25, , 7F
02/02 22:25, 7F
推
02/02 22:31, , 8F
02/02 22:31, 8F
推
02/02 22:46, , 9F
02/02 22:46, 9F
→
02/02 22:47, , 10F
02/02 22:47, 10F
→
02/02 22:48, , 11F
02/02 22:48, 11F
→
02/02 22:48, , 12F
02/02 22:48, 12F
→
02/02 22:53, , 13F
02/02 22:53, 13F
推
02/03 00:20, , 14F
02/03 00:20, 14F
推
02/03 08:10, , 15F
02/03 08:10, 15F
→
02/03 08:43, , 16F
02/03 08:43, 16F
→
02/03 08:45, , 17F
02/03 08:45, 17F
推
02/03 09:34, , 18F
02/03 09:34, 18F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):