IT运维事件管理实践流程执行原则
流程执行原则
1)总体原则
事件管理流程在运行过程中应遵循的总体性原则包括:
·IT运维管理中心应提供全天候(7*24小时)的服务。工作时间由技术服务部服务台统一接收用户提交的事件,非工作时间由IDC部值班人员负责记录事件,并在工作时间将未解决的事件交接给服务台继续跟踪;
·服务台作为所有提交至服务台的事件的负责人(Owner),必须全程跟踪事件处理进展直至事件关闭;
·所有在事件管理流程范围内发生的事件,都应被完整且准确地记录下来,记录的信息应足够详细,包括事件现象、事件处理过程,详细的解决方案和相关的附件等;
·在事件处理过程中,若需寻求第三方支持,应遵循以下原则:
·根据事件实际处理情况,由二线支持(各技术部门工程师)选择相应供应商提供支持;
·在供应商参与解决事件的过程中,二线支持(各技术部门工程师)仍需承担事件处理责任。
·所有支持人员必须优先处理优先级较高的事件,对优先级1和2的事件所采取的恢复行动,相比其他任务具有更高优先权;
·按月编写事件管理报表,分析服务质量,对未解决的事件、重大事件、多次重复发生的事件或利用变通方法解决的事件,应每月回顾和评估;
·定期(每年)对流程进行回顾、支持优化,回顾内容包括关键衡量指标、流程执行效率和流程支持工具的有效性,以改进事件管理流程。
2)事件责任人原则
责任人原则旨在确保每个事件在任何时段都有适当的人员负责。IT运维管理中心事件管理流程在运行过程中,遵循以下责任人原则:
·采用首问负责制:
·用户通过电话报告的事件,首次接听电话的服务台座席负责记录此事件的详细信息,并进行初步支持,该座席作为此事件的负责人,负责跟踪事件处理的整个过程直至事件关闭,以确保事件得到及时有效的解决;
·监控系统以邮件和短信方式自动上报的事件给相应工程师,系统自动开事件单,该受理工程师作为此事件处理的负责人,服务台负责跟踪事件处理的整个过程直至事件关闭,以确保事件得到及时有效的解决;
·事件被分派至二线支持后,二线支持(各技术部门工程师和外包人员)作为该事件的接单人负责事件的诊断和解决,但服务台座席仍旧是此事件的负责人,有义务跟踪和推动事件处理进展,并及时将事件进展情况反馈给用户;
·事件如需第三方(厂商或其他供应商)处理,二线支持作为事件的接单人,有义务跟踪和推动第三方处理事件的进展。第三方处理事件的过程由事件接单人负责记录,如第三方有驻场人员的,接单人可督促其记录处理过程。
3)事件单创建原则
IT运维管理中心事件单的创建应遵循以下原则:
·用户报告的事件由服务台创建事件单;
·监控工具发现的事件自动创建工单(前提需具备流程平台);
·巡检中发现的事件和潜在故障由巡检人员自行创建事件单并通知给服务台。
4)监控事件处理原则
·监控工具发现告警记录分为两类:告警和取消告警;
·告警等级分为五级:严重、主要、次要、警告、信息;
·监控发现的事件,分为工作时间和非工作时间:
·工作时间:监控告警接收人(各技术部门工程师)要及时创建工单,并通知服务台跟踪事件处理情况;
·非工作时间:IDC值班人员应创建事件工单并通知工单处理人员,值班期间对故障进行跟踪,换班时通知服务台继续跟踪事件的处理情况。
5)事件再分派原则
事件再分派也称为转派,是指因事件被分派至错误的支持对象导致的重新分派,包括同一支持组内和跨组再分派。IT运维管理中心事件管理流程遵循以下再分派原则:
·同组和跨组转派都需说明退单理由和转派建议;
·同一组内允许互相转派。事件再分派必须事先在线下达成共识,然后通过IT运维管理平台完成再分派操作;
·跨组转派需先退回服务台,再由服务台重新分派;
·转派次数超过两次的或退回到原点的,服务台需升级至事件管理员,由事件管理员来协调重分派;
·因多次转派而导致事件处理超时的,责任由本该处理事件但没及时处理事件的人员承担。遇分歧时由事件管理员/IT服务管理委员会判定,由确定责任承担者。参考数字化IT运维管理体系建设指南等书籍资料
页:
[1]