IT运维问题管理实践错误控制流程
错误控制流程
表:错误控制流程步骤说明
序号步骤名称责任人说明
503.1问题解决方案开发问题处理人·根据问题的根本原因,问题分析专家尝试找出所有可能的解决方案。
对所有可能的解决方案进行分析,找出最有可能的解决方案,并对解决方案进行测试;
·确认问题根本解决方案,并详细更新到问题记录系统中,更新问题记录的状态为“已有解决方案”,并通报问题经理;
·当问题分析专家预见目前不能实施根本解决方案时,通报问题经理,来共同分析对该问题的处理。
503.2问题解决方案启动问题处理人·在大多数情况下,问题需要通过变更解决。负责的团队按照组织初始化和实现变更的程序,提交变更请求。
·在其他情况下,所需的操作不归类为变更,可以按照其他过程来启动和执行。无论哪种方式,团队都会启动已定义问题解决所需的操作。可能需要以相关理由支持(包括财务、风险、合规性、技术和其他注意事项)。
续表
序号步骤名称责任人说明
503.3已知错误的监控与回顾问题经理如果已知错误的解决方案得到批准
使用预先商定的标准控制和确认解决方案的实施。这通常由发起解决方案的团队,或其他预先约定的角色,如由问题经理来完成。
如果找不到针对已知错误的可行解决方案
[*]指定专家团队对已知错误进行监控。这通常是负责与已知错误关联的配置项、服务或产品的团队。该团队按照消解策略中定义的方式的监控已知错误的状况。监控的参数可能包括:
·相关事件的动态
·事件解决方案的有效性问题解决的有效性
·解决问题所需资源状态的变化(预算,供应商,专家的更新,新的基础结构等)
[*]团队应定期进行问题审查(根据商定的消解方法),或基于监控结果进行问题审查。
[*]如果评审确认消解方法有效且是最新的(问题存在,最新影响评估,事件解决方案有效,问题变通方案有效且没有可行的问题修复程序方案可用),那么继续进行已知错误的监控。
[*]如果临时方案变得无效,则启动问题解决方案开发活动来审查和重新定义消解方法。这可能包括开发和实现一个问题解决方案或更新相关事件的事件解决方案。
[*]如果问题不再存在(例如,已通过计划的软件或硬件更新或通过停用受影响的配置项将其移出),则启动问题关闭。
[*]如果问题出现了一个新状况,建议修改或创建问题模型,并将问题模型将作为问题评审活动的一部分进行记录和交流。
[*]基于监控数据更新问题记录。
503.3问题关闭问题经理·负责问题的团队(或专家)记录问题评审结果并正式关闭问题记录。
·如果确认解决,则团队记录解决控制结果并正式关闭问题记录。已关闭问题记录应作为组织的知识库的一部分,尤其是如果有类似的问题可能会再次发生。
参考数字化IT运维管理体系建设指南等书籍资料
页:
[1]