20150617MONICAZHANG 续上
5.5.3告警等级 根据告警信息的严重程度,将告警级别进行划分,具体分为六个级别。具体划分请参见表6-1。ITSS体系
表6‑1告警级别划分 严重级别 | | | 致命告警,仅由严重告警升级而成。当严重告警半小时没有处理时需要升级为致命告警。 致命告警需要上报某公司总部,并需要进入流程平台生成工单进行处理。 致命告警需要通过短信、邮件、界面告警等方式通知用户。 | | 严重告警,当网络、设备、数据库、中间件、操作系统、应用系统等DOWN或不可用时,产生严重告警。例如服务器、网络设备的宕机、数据库实例停止运行、应用服务端口关闭等 严重告警需要上报某公司总部,并需要进入流程平台生成工单进行处理。ITSS软件 严重告警需要通过短信、邮件、界面告警等方式通知用户。 | | 次严重告警。性能数据超过一定的阈值,会威胁到系统可用性时产生次严重告警。当次严重告警未处理时间超过一定范围(如半小时)时,升级为严重告警。 次严重告警可选择手工生成工单 次严重告警需要通过邮件、界面告警等方式通知用户,也可以选择短信方式 | | 警告告警。当性能数据超过一定阈值时作为预警信息反应当前系统运行状况 警告告警可选择手工生成工单,并可定期清除 警告告警需要通过界面告警方式通知用户,也可以设置邮件方式 | | 无害告警。可能是流程平台的工单返回信息,或系统的一些提示信息 不需要生成工单,可定期清除ITSS团购 无害告警仅需要通过界面告警方式通知用户 | | 未知级别的告警。需要人工判断其告警级别 未知告警在确定其告警级别后,再进行相应处理 |
根据设备或应用的重要程度,以及告警的严重级别,可以确认此告警的紧急度(Priority)。紧急度具体分为3个级别(高、中、低)。 设备或应用的重要程度可参考“附件二设备分级”中对被管理对象的级别划分。告警严重级别定义可参照表6-1。表6-2为告警的紧急度定义: 表6‑2告警紧急度定义
5.5.4告警响应ITSS工具 通过告警管理软件的自动化任务,为不同告警设置不同的响应方式,可以在告警管理服务器或远程服务器,甚至是同时在多个系统上执行。 根据某公司的要求,对告警需要提供声音、邮件、短信以及自动化任务等告警响应。对于这些告警响应实现方式的设计如下: 声音告警:当特定的告警发生后,在指定的工作站发出告警声音,提示管理员发生了故障。不同的告警级别将采用不同的告警声音进行区分。 邮件报警:当特定的告警发生后,发送邮件通知到对应的管理维护人员告知或敦促进行处理。用户可以在“告警订阅”界面中设定发送邮件的告警类别或告警级别。 短信通知:当特定的告警发生后,发送手机通知到对应的管理维护人员告知或敦促进行处理。用户可以在“告警订阅”界面中设定发送短信的告警类别或告警级别。ITSS考试 自动化任务:最常见的情况就是当发现某些服务、进程处于Down的状态时,可以自动重新启动这些服务和进程;或者当发现某个文件系统可用空间非常紧张的时候,能够自动分配空间。当然,执行自动化相应应该非常谨慎,而且任何自动化响应的动作都需要留下日志记录。
5.5.5告警处理规则 告警处理应遵循以下原则: 实时性:保证关键告警信息及时得到处理。 准确性:保证告警信息根据所属级别得到准确处理。ISO20000培训 参数化管理:提供灵活的参数化配置,保证告警处理具有很强的适应性 告警管理服务器包含一个告警处理引擎,能够根据规则库中的各种规则对告警进行处理,包括进行以下的操作: 告警故障定位 告警故障定位应与IT资源管理数据和应用逻辑相结合,根据设备厂商或应用软件开发商提供的最小粒度定位,如CPU、路由模块、网络接口卡、关键业务点等。 告警过滤 针对单位时间内发生大量告警的情况,按维护要求和管理部门的要求及实际管理情况,过滤从底层提取的告警信息中不重要的信息,减少轻微告警的干扰,以提高监控与处理的效率。同时可以根据业务与平台的关联关系,对业务与平台两层面的告警数据进行关联分析,定位主要告警、过滤掉关联告警,提高告警的处理效率。 告警过滤需要提供灵活的过滤规则,可按告警网元、告警级别、告警类别或告警标题等设置过滤规则。 可根据告警信息的内容,屏蔽掉一些次要的字段。对已设定的过滤规则需要提供保存和修改功能,便于维护人员灵活选择。 告警过滤应实现对以下告警的过滤:ITIL培训 n频繁发送的同一告警 n由主要告警引起的相关大量的关联告警 n已进入服务管理流程进行处理,重复发送的告警 n特殊情况下,只需要记录不需要展现的特殊资源的相关告警 告警升级 对于系统中持续出现以及超过规定处理时间仍未解决的告警,需要升级该告警的告警级别,以保证得到优先及时的处理。 告警重定义 根据系统平台及应用逻辑在结构、功能等方面发生的变化,重新定义告警数据所属的类别和级别,保证告警系统处理的正确性。 告警前转 系统提供告警前转功能,将告警信息以各种手段(手机短信、EMAIL等)转至指定的维护人员。ITSS培训 1、告警前转方式 自动前转:根据事先的设定,将告警信息自动前转其它综合网管系统或相关人员。 手工前转:由监控人员把告警手工前转其它系统或相关人员。 2、告警前转条件 告警前转的设置条件:告警级别、告警类型、被管资源类型、告警设备所在地区、需要通知的相关系统和人员、告警的处理时间等。 管理员可以存储设定的告警前转条件,并可对告警前转条件列表进行增、删、改、查等操作。 告警清除 对于系统中已经处理完毕的告警信息,需要设置相关的标志,标记为清除,退出告警处理流程。 告警的展现功能将在统一展现平台功能模块设计中体现。ITSS认证
本帖关键字:ITSSISO20000
|