×

微信扫一扫,快捷登录!

SRE Foundation培训课程内容提纲

标签: 暂无标签
[size=100%]


  网站稳定性工程师是致力于打造「高扩展、高可用系统」,并将其贯彻为原则的软件工程师。
[size=100%]与 DevOps 工程师的高效能有所不同,SRE 的关键词包括:高扩展性、高可用性。其职责包括:

      
  • 为应用、中间件、基础设施等提供选型、设计、开发、容量规划、调优、故障处理
      
  • 为业务系统提供基于可用性、可扩展性考虑决策,参与业务系统设计和实施
      
  • 定位、处理、管理故障,优化导致故障发生相关部件
      
  • 提高各部件资源利用率
[size=100%]由此我们可以看出SRE 的综合素质要求较高,大型企业对于SRE有非常高的需求,从而薪资水平也长居薪资排行榜第二。
[size=100%]
[size=100%]StackOverflow 2020 开发者调研结果
[size=100%]Foundation 课程是对 SRE 原理和实践的介绍课程,使组织能够可靠且经济地扩展关键服务。引入SRE(站点可靠性工程)需要组织重新调整,关注工程和自动化并采用一系列新的工作范式。
[size=100%]该课程重点介绍了SRE的发展及其未来方向,并为参与者提供了实践,方法和工具,以使整个组织中的人们参与到可靠性和稳定性中,这些案例通过使用真实场景和案例来证明。完成课程后,学员将在回到公司后可以切实地利用诸如了解,设置和跟踪服务水平目标(SLO)的内容。
[size=100%]该课程使学习者能够成功完成 SRE Foundation 认证考试。
[size=100%]课程受众
[size=100%]SRE Foundation 课程的目标受众是专业人员
[size=100%]任何对更高可靠性感兴趣的人
[size=100%]任何对现代IT领导力和组织变革方法感兴趣的人
[size=100%]SRE工程师
[size=100%]业务经理
[size=100%]商业利益相关者
[size=100%]顾问
[size=100%]DevOps从业者
[size=100%]IT主管
[size=100%]IT经理
[size=100%]IT团队负责人
[size=100%]产品负责人
[size=100%]Scrum大师
[size=100%]软件工程师
[size=100%]系统集成商
[size=100%]工具提供者
[size=100%]_
[size=100%]课程大纲
[size=100%]课程介绍
[size=100%]模块1:SRE原则和实践

      
  • 什么是站点可靠性工程?
      
  • SRE和DevOps:有什么区别?
      
  • SRE原则与惯例
[size=100%]模块2:服务水平目标和错误预算

      
  • 服务水平目标(SLO)
      
  • 错误预算
      
  • 错误预算政策
[size=100%]模块3:减轻苦工

      
  • 什么是苦工?
      
  • 为什么很辛苦?
[size=100%]模块4:监控和服务水平指示器

      
  • 服务水平指标(SLI)
      
  • 监控
      
  • 可观察性
[size=100%]模块5:SRE工具和自动化

      
  • 自动化定义
      
  • 自动化焦点
      
  • 自动化类型的层次结构
      
  • 安全自动化
      
  • 自动化工具
[size=100%]模块6:抗脆弱性和从失败中学习

      
  • 为什么要从失败中学习
      
  • 抗脆性的好处
      
  • 转移组织平衡
[size=100%]模块7:SRE的组织影响

      
  • 为什么组织采用SRE
      
  • SRE采用的模式
      
  • OnCall
      
  • 事后回顾与反思总结
      
  • SRE和规模
[size=100%]模块8:SRE、其他框架

      
  • SRE和其他框架
      
  • 未来
      
  • 其他信息来源
      
  • 考试准备
      
  • 考试要求,问题权重和术语表
      
  • 考试样题复习
[size=100%]课程目标
[size=100%]SRE Foundation 课程的学习目标包括对以下方面的实践与理解

      
  • SRE的历史及其在Google中的实践
      
  • SRE与DevOps和其他流行框架的相互关系
      
  • SRE背后的基本原则
      
  • 服务水平目标(SLO)及其用户关注点
      
  • 服务水平指标(SLI)和现代化的监控环境
      
  • 错误预算和相关的错误预算策略
      
  • 可观测性可以指示服务的运行状况
      
  • SRE工具,自动化技术和安全性的重要性
      
  • 抗脆弱性,我们的失败和失败测试方法
      
  • 引入SRE带来的组织影响





上一篇:SRE工程师一般需要掌握什么技能?
下一篇:SRE职位机会 AfterShip
admin

写了 864 篇文章,拥有财富 29590,被 26 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by IT 运维管理
返回顶部