×

微信扫一扫,快捷登录!

SRE发展状况报告之7

标签: 暂无标签


P12

关键要点1:存在可观测性组件;可观察性不


服务级别上是否存在运行状况监控,以能够检测到中断或性能或绩效问题(在服务级别上)?


每个服务都有自己的监控和警报,并具有自己的运行状况检查API,可以插入我们的可观察性框架中43%


一些服务拥有自己的监控并使用运行状况检查API发出警报,而其他服务则没有27%


每个服务都有自己的监控和警报。没有运行状况检查API或可观察性框架19%


没有服务级的监控9%


不适用。我们的系统中没有离散服务。我们有整体应用程序。 2%


可观察性是关于回答以前与“为什么”有关的无法回答的问题。“为什么”用户无法访问我的网站? “为什么”用户无法访问他们的数据? “为什么”用户的情绪如此低?


回答“为什么”的能力应该由框架而不是单个工具提供动力。这是一个非常重要的指标问题,我们将在供应中关闭该部分。如果43%的受访者将其数据插入可观察性框架,那么57%的人则不会。在下一部分中,我们将通过研究一些关键的“ Dev”与“ Ops”数据,进一步缩小这一差距。

------

可观察性 回答了以前无法回答的问题,因为它涉及“为什么”。 “为什么”用户不能到达我的网站?“为什么”用户不能访问他们的数据?“为什么”用户的情绪这么低落?

回答“为什么”的能力应该由一个框架来驱动,而不是一个单独的工具。 这是一个非常重要的指标问题,我们将以此作为本节的结尾。若有43%的受访者将他们的数据插入到可观察性框架中,则有 57%的受访者做不到。在下一节中,我们通过查看一些关键的“Dev”和“Ops”数据来进一步探讨这一差距。


P13

重点菜2

成本带来了沉重的操作负担


实施DevOps的SRE原则,以通过设计和构建可观察的系统来防止事件发生。将可靠性移到更左端的工作,将带来减少成本,团队协作和业务结果的好处。将50/50开发工作与运维工作拆分为指南,不超过25%的运维工作处于待命状态。然后,在上下文中朝着预防性最终目标进行迭代时,确定要删除的约束。捕获结果以构成章程的基础。删除约束后,请相应地更新您的章程。

-----
实施DevOps的SRE原则,通过设计和构建可观察的系统来防止事件发生。将可靠性进一步左迁 ,提供降低成本、团队一致性和业务结果的好处。使用 50/50方式拆分Dev和Ops工作,以此作为指导方针, 其中低于25%的Ops工作是on-call的。然后,当您在环境中朝着预防性的最终目标迭代时,识别约束以将其移除。捕获结果以形成章程的基础。当您移除约束时,相应地更新您的章程。




上一篇:全球SRE状态调查report 6
下一篇:SRE的状态调查报告 8 主要内容
admin

写了 864 篇文章,拥有财富 29590,被 26 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by IT 运维管理
返回顶部