如何让监控告警推送的ITIL事件单自动关联上相应的CI(配置项)
将监控告警推送的事ITIL件单自动关联上对应的CI有两个好处:一是非常便利于运维服务人员进行故障的排查,当运维服务人员接收到服务台派(事件)单时,能同时获得告警CI以及与之相关的具体信息,对TTR提升的帮助不言而喻;二是一旦事件触发变更,变更单可以和事件单更快地进行关联,尽量减少人工干预。
在实际的ITSM工具与监控工具的配合使用中,我们必须考虑让监控工具在发现故障后自动发起事件单给ITSM平台——这是主动运维的基础之一。 一个常见的处理方法是:在配置信息中设置一个叫“序列号”的字段,在监控工具首次纳管该配置项时,将获取的该配置项的唯一序列号告知配置管理员,由其将序列号属性添加至该CI信息中,自动发现工具可以帮忙批量发现序列号及收集序列号,但仍然需要人工审核。然后,告警工具在监控到故障发生并自动发起事件单给ITSM时,在其生成的事件单告警信息中包含该设备的唯一序列号,这样ITSM工具在自动创建事件单时通过一个转换运算即可查出该设备的配置编号,然后将其关联到事件单上。
目前自动化运维的工具多不胜数,能对此提供帮助的工具也不少。我们可以考虑通过Zabbix+Puppet,Nagios+Cfengine等方式,进行自动化监控工具+自动化配置工具的搭配,这将有助于我们相对轻松地完成监控和CI之间的关系管理。
IT运维管理社区原创文章,禁止任何形式的转载,侵权必究!
|