×
搜索
热搜词
ITIL培训
ITIL认证
ITIL课程
DevOps认证
ITSS培训
新手福利
ITIL考证
ITIL4成熟度评估
干货下载
ITIL沙盘实战
ITIL聚会
开源ITIL软件
返回主页
登录
注册
登录IT运维流程库更精彩
下次自动登录
忘记密码
立即注册
登录
其他帐号登录:
微信扫一扫,快捷登录!
用户组:游客
主题
帖子
威望
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
退出
[loopa]
[/loopa]
滚动公告:
ITIL Master(大师)之路(2023-10-06)
收看本周专家讲堂的方法(2023-09-28)
ITIL先锋论坛专家讲堂精彩回放
作者:
忘我之境
阅读
ITIL 4 Foundation培训课程 长河讲授
作者:
slbenben
阅读
长河ITIL流程沙盘实战训练营
作者:
admin
阅读
ITIL先锋论坛干货下载中心
作者:
匿名
ITIL认证学习和流程落地实践
阅读
全国巡回ITIL聚会系列活动
作者:
august
ITIL认证学习和流程落地实践
阅读
来自:
ITIL理论学习和落地实战
2020-12-02
图片
总393期:李威老师《如何简单快速的度量您组织的Devops成熟度》12月2日20:00点开讲!
李威《如何简单快速的度量您组织的Devops成熟度》12月2日直播! 第393期IT运维管理专家微课堂主讲嘉宾:李威老师时 间:12月2日20:~21:00 主题简介:随着DevOps概念的普及,越来越多的企业在工作流程中采用DevOps。大多数的IT组织均具备了DevOps团队或相关职能的团队,尝试了工具链及文化的建设 ...
2435
0
0
@
2020-12-2
来自:
ITIL理论学习和落地实战
论坛小编
2020-12-01
图片
艾拓先锋社区第392期网络讲堂—长河《2019 SRE 报告解读》视频回放
1、背景: 近15年来,SRE作为DevOps在运维视角的落地实践,对IT服务和业务系统的可靠性提供了强大的方法论和实践支持,众多互联网公司设立了专门的SRE团队,该职位的薪水也非常具有吸引力。 为了给广大运维从业者们提供SRE知识的启蒙和深入了解,特安排本周讲堂,邀请长河老师来分析全球2019年 ...
2345
0
0
论坛小编
@
2020-12-1
来自:
ITIL理论学习和落地实战
FYIRH
2020-11-25
SRE的基本指导思想
本部分将描述 SRE日常工作背后的指导思想——工作模式、行为方式,以及平时运维工作中关注的重点等。 本部分的第一章(第3章)是最重要的一章。这一章从最广泛的角度描述了SRE的日常工作,以及背后的指导思想。这一章从"风险"入手,描述了如何评估风险、管理风险,以及利用错误预算的手段来推进中立 ...
2281
2
0
東東
@
2020-11-30
来自:
ITIL理论学习和落地实战
FYIRH
2020-11-25
图片
莎士比亚搜索∶SRE负责的一个示范服务
为了更好地说明一个服务是怎样利用各种基础设施,以及是如何在 Google生产环境中部署的,我们在这里提供一个假想的莎士比亚搜索服务。这个服务的作用是在所有莎士比亚的文献中搜索给定的词语。 整个系统可以分为两大部分∶ [*]批处理部分(batch)。给全部莎士比亚文献创建索引,同时将索引 ...
2309
0
0
FYIRH
@
2020-11-25
来自:
ITIL理论学习和落地实战
FYIRH
2020-11-25
SRE的核心工作之一:需求预测和容量规划
需求预测和容量规划简单来说就是保障一个业务有足够的容量和冗余度去服务预测中的未来需求。这里并没有任何特别的概念,但是我们发现行业内有许多团队根本没有这个意识和计划去满足这个要求。一个业务的容量规划,不仅仅要包括自然增长(随着用户使用量上升,资源用量也上升),也需要包括一些非自然增 ...
3742
0
0
FYIRH
@
2020-11-25
来自:
ITIL理论学习和落地实战
FYIRH
2020-11-25
稳定性管理的重点:变更管理
SRE的经验告诉我们,大概 70% 的生产事故由某种部署的变更而触发。变更管理的最佳实践是使用自动化来完成以下几个项目 ∶ ● 采用渐进式发布机制。 ● 迅速而准确地检测到问题的发生。 ● 当出现问题时,安全迅速地回退改动。 这三点可以有效地降低变更给 SRE 和最终用户带来的时间成本和服务 ...
2572
0
0
FYIRH
@
2020-11-25
来自:
ITIL理论学习和落地实战
FYIRH
2020-11-25
SRE日常工作:应急事件处理
可靠性是 MTTF(平均失败时间)和 MTTR(平均恢复时间)的函数(参见文献)。评价一个团队将系统恢复到正常情况的最有效指标,就是MTTR。 任何需要人工操作的事情都只会延长恢复时间。一个可以自动恢复的系统即使有更多的故障发生,也要比事事都需要人工干预的系统可用性更高。当不可避免地需要人工 ...
1845
0
0
FYIRH
@
2020-11-25
来自:
ITIL理论学习和落地实战
FYIRH
2020-11-25
SRE的耳目:监控系统
监控系统是SRE 团队监控服务质量和可用性的一个主要手段。所以,监控系统的设计策略值得着重讨论。最普遍的和传统的报警策略是针对某个特定的情况或者监控值,一旦出现情况或者监控值超过阈值就触发 E-mail警报。但是这样的报警策略并不是非常有效∶一个需要人工阅读邮件和分析警报来决定目前是否需要 ...
2059
0
0
FYIRH
@
2020-11-25
1 ...
261
262
263
264
265
266
267
268
... 2482
/ 2482 页
下一页
欢迎关注“ITIL先锋论坛”微信公众号
微信公众号:
微信在线客服:
IT运维管理
|
网站地图
ICP11099876
Powered by IT 运维管理
返回顶部