【最近一次/印象最深的运维 TiDB 时的误操作】
业务高峰期手滑改了大表的索引,结果集群CPU飙升,慢查询炸了。
【最后是怎么解决的】
1.赶紧用 ADMIN CANCEL DDL JOBS 取消变更。
2.临时降级业务流量,半夜再用工具重新搞索引。
3.盯着监控直到指标恢复正常。
【给小伙伴们一些避坑建议吧~】
1.改表前先备份,避开业务高峰!
2.高危操作开二次审批,别用高权限账号瞎浪!
3.监控大屏必须挂墙上,变更多瞅两眼!
5.测试环境定期练手,误删误操作也能秒恢复