FYIRH 发表于 2020-11-25 22:04:59

稳定性管理的重点:变更管理

SRE的经验告诉我们,大概 70% 的生产事故由某种部署的变更而触发。变更管理的最佳实践是使用自动化来完成以下几个项目 ∶

● 采用渐进式发布机制。
● 迅速而准确地检测到问题的发生。
● 当出现问题时,安全迅速地回退改动。

这三点可以有效地降低变更给 SRE 和最终用户带来的时间成本和服务质量的下降。通过将人工因素排除在流程之外,这些操作将不再受到经常发生在人身上的"狼来了"思想以及对大量重复性劳动的关注疲劳所影响。于是,变更执行的速度和安全性同时得到了提高。
页: [1]
查看完整版本: 稳定性管理的重点:变更管理