IT运维事件管理实践重大事件原则及相关事件原则
6)重大事件原则
重大事件是指对IT运维管理中心业务有重大影响的事件,包括:
·数据中心停电;
·网络核心故障;
·重要应用系统故障:
·重要网站平台瘫痪;
·优先级为1的事件。
·重大事件发生后需按最高优先级进行升级,并考虑是否触发应急预案,事件解决后,需要对重大事件进行回顾,分析原因,并采取改进措施。
·重大事件解决人需提交《重大事件报告单》,经事件管理员及相关部门负责人审核后,上报至中心领导。
7)目标解决时间原则·为了更好地控制事件的解决过程,事件处理过程被划分成几个阶段。每个阶段都设定了目标时间。
·事件目标解决时间的相关规定参照以下内容
表:事件目标解决时间
事件优先级服务台/一线响应时间(事件单创建开始计算)二线解决时间(最后一次派单开始计算)三线解决时间(最后一次派单开始计算)事件总体解决的时间(事件单创建-事件“已解决”,相当于SLA)
优先级1N/A30分钟2小时2.5小时
优先级25分钟60分钟4小时8小时
优先级310分钟4小时12小时2个工作日
8)事件升级原则升级原则旨在为不同优先级的事件合理分配资源,确保其在既定时限内得到妥善解决。该原则明确了事件升级的时间框架与升级路径,规定了若事件在预定时间内未获解决,则应启动升级机制。事件升级方式涵盖职能性升级(技术升级)与结构性升级(管理升级)。
·技术性升级:技术升级基于技术能力要求,将事件的受理转移至具有更高技术级别的支持团队。
●管理性升级:
·管理性升级涉及因非技术因素导致的事件处理受阻,需要领导层介入的升级情形,例如:
·事件处理过程中需要额外资源,如其他部门的协助;
●事件可能违反服务等级协议(SLA),需要领导层的了解与支持。
·事件自创建至当前所经历的时间作为触发升级的时间标准。
●事件升级的时间框架与升级路径详见下文内容。
表:事件升级策略模板
事件升级机制技术升级 管理升级 通知策略
服务台二线三线部门领导科生处分管领导升级处理方式事件管理员部门领导中心领导分管主任升级处理方式
优先级1N/A直接上报30分钟2小时10分钟10分钟10分钟电话告知,现场协调10分钟内10分钟内10分钟内15分钟电话告知
优先级25分钟1小时4小时30分钟30分钟30分钟电话告知,现场协调10分钟内10分钟内30分钟N/A电话告知
优先级310分钟4小时12小时4小时4小时N/A电话告知现场协调1小时4小时4小时N/A电话告知
9)事件终止原则在本事件管理流程中,事件的终止应严格遵循以下原则:
·所有事件必须在问题得到解决后(可以是变通方法解决),并经服务台与用户确认后才能终止;·与用户的确认信息包括:事件解决效果,人员服务态度等;
·如果累计两次与用户确认,用户未能配合确认的,并且事件解决已超过48小时的,可由服务台选择自动终止(默认终止);
·通过邮件、语音系统、电话确认等方式进行的确认可以作为事件单终止的依据;·事件处理过程未完整记录的事件单不允许终止;
·事件的实际解决时限以事件状态转为“已解决”为准;
·事件终止前的确认中可以针对每个事件的满意度进行调查;
·事件单的用户可以要求终止此事件单,例如:误报、错报事件。
10)事件通知原则
·事件的(首问)负责人应跟踪事件的进展,如用户需要了解他们所报告的事件或服务请求的处理进展,须及时提供事件状态信息;
·事件升级或受理时,可通过电话、短信、邮件等方式,向用户进行通告;
·重大事件发生时,需由服务台及时通知用户,或根据情况通知其他利益相关方(如供应商等),并依照程序进行升级;
·如果发生一个高度影响性的事件,如某关键业务或服务器中断,虽然用户还未报障,仍需主动通知所有相关用户,并且不同级别对应不同的通知方式。
11)事件暂停原则
设置事件暂停原则的目的在于帮助更加公正的统计“事件处理时间”等与事件处理人员相关的指标。在处理事件过程中遇到如下情况时应选择将事件暂停:
·因需要用户配合(如需用户提供详细信息或需用户进行解决结果确认等)而导致时延,则应将事件状态设置为“暂停”,当用户完成配合后进行解暂停;
·需要其他部门配合而导致时延,则将事件状态设置为“暂停”,当其他部门完成配合后进行解暂停。
事件暂停原则包括:
·事后统计时应将“暂停”时长从整体处理时间中扣除;·在事件单中,须注明暂停原因;
·只有事件管理员才有权“暂停”,或解除“暂停”状态。参考数字化IT运维管理体系建设指南等书籍资料
页:
[1]