IT运维问题管理实践流程概要设计和详细设计
流程概要设计
流程概要设计构成了流程设计的初始阶段。在此阶段,主要任务是明确流程的核心构成要素及其相互关联,涵盖流程的起始与终止节点、主要流程步骤或活动、活动的执行顺序,以及流程的主要参与者及其职能。流程概要设计通常采用图形化表达方式,如流程图或流程地图,以便于人们更直观地理解与沟通流程。
其核心目标在于确立流程的整体架构与逻辑,为后续的详细设计奠定基础框架与指导方向,并可用于初步的流程评估与优化,识别流程中的瓶颈、冗余或非必要环节,以及潜在的改进空间。
问题管理流程的实现可通过以下三个子流程来完成:
·主动问题识别流程:该流程旨在识别组织产品中存在的潜在错误,这些错误并非源自事件记录。将问题的主动识别与控制视为风险管理的一种手段,即特别关注产品中的漏洞,包括对漏洞及其相关风险的识别、评估与分析。
·被动式问题标识:该流程利用过去或当前事件的相关信息进行问题原因的调查。问题的识别与控制可能因诊断分析正在发生事件的性质而变得紧迫。在这种情况下,问题管理与事件管理实践在相同的价值流中进行,同时,它们需要相同(或重叠)的资源,包括团队、工具和流程。
·问题控制流程:该流程专注于问题的调查,旨在揭示问题产生的根本原因,并将问题标识为已知错误。
错误控制:该流程着重于监测和控制已知错误(已分析但尚未解决的问题)的状态及其解决方案。它有助于确保已知错误对服务的负面影响得到控制并最小化;确保事件解决方案的有效性;同时必须确保已知错误的缓解措施是有效、可行且高效的。
流程详细设计
[*]主动问题识别流程
详细流程设计是从逻辑层面对主动问题识别流程的各主要活动节点进行详细描述,结合IT运维管理中心的具体情况,详细流程图如下:
表:主动问题识别流程活动步骤说明
序号步骤名称责任人说明
500.1提交问题问题发起人·服务设计人员,软件开发人员,架构师和其他团队正在开发的配置和其他组件的下一版本中发现的错误:在后续版本开发过程中发现的当前生产版本的错误,以及在当前部署到生产环境版本中的后续版本中的错误,这些版本在测试期间已被识别但尚未修复;
·软件和其他配置项的供应商:供应商的系统和组件的当前实施版本中的错误;
·用户和专业团队:由维护技术人员在日常维护工作中根据自己的经验或分析,在自己负责的领域内发现并提出的问题请求:
通过日常巡检发现的问题;
对日常维护监控数据进行分析;
·监控数据:服务和配置项的性能或绩效中的可疑趋势和偏差;
·用户:正在使用服务中的漏洞
500.2审核提交的信息问题经理根据来源和标题,所提交的信息将由专家或专家组进行审查。评审包括检查是否存在重复项,适用性,常识以及可能与提交的信息相关的正在发生的事件;
如果决定不登记问题,则可能会通知发起方(通常适用于主动提交或"推送"提交的情况;
如果信息是从外部来源获得或"拉动"的,则不适用)如,来源于供应商公告,没有人期望得到反馈);
500.3问题登记问题经理如果确认需要问题控制,则对问题记录进行登记。这可以通过特定的角色或由更多的专业角色来完成
500.4问题的初步分类与分派问题经理问题经理进行初步分类。该信息通常包括以下某些内容(如果已知或合理假设):
资源描述
·关联的配置项或配置项分类
·初步评估事件的影响及其发生的可能性
·相关和可能受影响的服务
·对组织和客户的影响
基于初步分类,问题被分派给负责相关配置项、服务或产品的专家组。在适用和预期的情况下,可以将问题登记通知发送给问题发起者
参考数字化IT运维管理体系建设指南等书籍资料
页:
[1]