本文由长河、陈贺、傅盛原创,张翼、王岩校对。
ITIL事件的优先级也可理解为处理事件的优先顺序,其决定了处理事件的顺序及所需的资源。优先级是事件管理的一个关键要素。
在填写事件单时,其中一个重要事项是确定正确的事件优先级,这将决定事件所要进入的已预先设置的分级处理轨道,以满足不同的SLA要求。优先级通常通过综合考虑事件的紧急度和影响度进行定性的分析。
- 紧急度:事件所影响业务的恢复紧急程度。例如对于某通信运营商,其计费系统类事件的紧急度相对较高,而OA系统类事件的紧急度相对较低。
- 影响度:就是如果事件未能及时修复,将会造成的影响面,如影响的系统个数、影响的区域范围或影响的业务受众的广度等。其中“影响范围”可以根据CI中定义的“影响范围”或用户报障描述来确定。可以想象一下,在春节前夕,某银行的网络银行系统由于IT系统的原因无法正常交易,这将造成何种影响?
为了避免一线IT服务工程师缺乏经验无法判断优先级。我们往往需要在事件管理流程的事件分类基础上,基于事件优先级的设定原则,设置默认的优先级,并在将来的工作中进行逐步优化。而且优先级可在单一事件的生命周期中被改变,更改时建议由事件经理批准,并将更改事件单优先级的原因和行为在该事件单中记录。优先级的准确评定依赖于我们不断地回顾事件——例如在事件周报或月报中,在重大事件分析会上;从而持续优化事件的分类和设定准确的优先级。
通常我们会在告警策略中定义它的重要性级别,也会在CMDB中定义该CI的业务影响级别,事件单可以用来参照其来定义故障的紧急度。设备或系统对业务影响的紧急度还跟是否处于业务提供时段有关。
一个和事件优先级相关的典型指标是“在目标时间内按照优先级解决的事件百分比”,该指标实际上也对SLA提供了一个直接的测度,数值建议不低于90%。
关于优先级的设定,一般需要制定一个WI,来指导IT运维人员(主要是服务台坐席)在记录事件单时进行正确地定义优先级。下面是一个示例: IT运维管理社区原创文章,禁止任何形式的转载,侵权必究! |