本文件为某企业信息技术监控管理规程,内容包括总则、组织架构与职责、工作内容及要求、监督与检查以及附则等部分。该规程旨在规范信息技术运维中心的信息系统监控管理活动,以提高监控效率和系统稳定性,确保业务需求得到满足。
1. 总则 - 目的:强化信息技术运维中心的信息系统监控管理,提升监控效率和系统适应性,结合实际情况制定本规程。 - 适用范围:本规程适用于信息技术运维中心及其承建单位的运维岗位。 - 原则:坚持“全程监控与即时响应”,实行统一领导和分级负责制。
2. 组织架构与职责 - 流程负责人:全面负责监控体系的建设与实施,对实践结果和原则进行决策,监控有效性与效率,并在必要时发起改进措施。 - 流程经理:负责流程的开发、设计、实施等,制定考核指标,跟踪分析关键绩效指标(KPI),确保流程记录的可追溯性,管理事态的生命周期。 - 监控规划经理:定义监控目标、对象、优先级等,评估监控标准,定义事态类型与阈值,建立服务运行模型,确定响应团队。 - 监控专家:设计监控指标,确保状态的准确反馈,优化指标与分类规则,设计新的监控指标。 - 监控工具工程师:搭建和维护监控工具,实现数据的互联互通,开发新的监控方式和指标。 - 监控工程师:实时监控关键组件,通知负责人,跟进事态处理,记录并报告相关信息。 - 事态响应工程师:处理告警,排查故障,优化系统,确保系统稳定运行。
3. 工作内容及要求 - 监控内容分类 - 监控规划:由监控规划经理与监控专家共同完成,包括定义监控目标、内容、对象、事态类型、阈值、服务运行模型、关联规则集及行动角色通知关联。 - 事态处理:由运维工程师或与维保单位共同完成,涵盖事态检测、记录、过滤、分类、响应选择、通知与执行策略。 - 监控和事态管理评审:由监控和事态流程经理牵头,确定评审目标、维度,执行评审与优化。 - 工作要求原则 - 优先级区分:明确确定和记录信息技术组件优先级的方法及调整策略。 - 组件可监控性:在采购和开发阶段考虑监控需求,纳入开发周期。 - 纳入监控体系:生产环境中的信息技术组件应自动纳入监控体系,新组件上线时及时更新文档与策略。 - 专门响应团队:指定人员响应告警并提供培训。 - 监控阈值优化:基于数据驱动定期优化阈值。 - 数据驱动监控:监控活动基于数据的收集、处理、分析与可视化展示。 - 全面监控:覆盖信息技术基础设施、网络、应用性能和用户体验。 - 灵活性与可扩展性:监控系统具备适应变化的能力,采用模块化设计与开放标准协议,定期审查更新。
4. 监督与检查:信息技术运维中心负责对信息系统信息技术运维监控工作进行评价和考核。
5.附则:本规程由信息技术运维中心负责解释与监督执行,自发布之日起生效。
|