[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放
一、引言
IT技术的迅猛发展,使IT已经成为企业运行不可或缺的重要环节,企业面临着大量的IT日常运维服务,包括硬件、软件、设备运维、配置、发布、人员管理、知识的提升等等。当今IT服务管理中存在许多棘手问题:
1.配置信息混乱
①设备和软件供应商众多,厂商范围和时间跨度都很大,信用和评价目前还停留在人工管理的范畴,需要用IT技术手段管理;
②设备台帐不能反映设备维修历史记录。软件的升级、变更等缺乏登记信息;
③设备和软件的配置信息不详,或者配置信息经过长期维修调整已经与实际不相符合。
2.被动响应式的工作方式
①维护的设备和系统众多,疲于应付突发故障;巡检机制不到位,预防工作未贯彻执行;很难及时发现和预见问题的发生;
②故障处理过程缺乏共享的记录信息和跟踪信息;故障处理流程不规范,职责划分不清晰;问题出现后,很难快速、准确地找到根本原因,并及时地找到相应的人进行修复和处理;问题找到后,缺乏流程化的故障处理机制;
③重复、丢失、忘记用户的请求和信息;支持过程总是被打断和干扰;关键人员的工作负载过重;
④维保厂商或外包服务商处理故障进度无法在线监控,服务质量缺乏考核手段;
⑤没有形成有效的知识库,遇到相同的问题,不能从知识库获取解决问题方案;
⑥运维分析报告编制困难,维护成功率、维护及时率、用户满意度等指标缺乏准确的统计。
3.绩效管理缺乏数据
①IT服务工作量量化考核困难,无法计算IT服务人员的工作绩效;资源和人力成本计算工具匮乏;服务请求的响应时间和质量无法衡量;
②外包服务商或厂家工程师处理及时率缺乏准确统计,结算和考核都缺乏数字化依据。
4.企业能力提升缺少方法
①IT服务技能日新月异,企业必须不断学习;
②人员流动。经验难以积累;对人的依赖,导致人员变更后出现运维问题;
③错误重复发生,没有很好的解决思路及对问题的识别。
以上种种弊端造成IT部门整天疲于奔命,却仍被投诉无法满足服务时效性和稳定性需求。这种工作模式下的IT资源管理,不仅IT部门吃力不讨好,而且也无法正常发挥IT系统的整体功能。
现代企业需要建立完善而成熟的IT运维管理体制,通过流程管理,不断提高IT运维质量,实现高效运维,提升组织内IT服务满意度。IT务管理方法论已经相对成熟,企业需要基于IT服务管理标准的管理方法来协助企业管理日常的IT服务。ITIL是关于IT服务管理领域事实上的国际标准,它以流程为导向,以客户为中心,通过整合服务与流程提高企业或组织的服务提供和服务支持的能力与水平。ITIL标准告诉我们做什么,但没有告诉我们怎么做才能达到ITIL管理目标,因此有必要大胆实践,探索符合中国企业实施TTIL管理体系的最佳方案。
二、ITIL简介
ITIL是英国政府中央计算机与电信管理中心(CCTA)在二十世纪90年代初期发布的一套IT服务管理最佳实践指南。1991年以推广ITIL为目的的非盈利性组织IT服务管理国际IT运维管理社区ITSMF(ITServiceManagementForum)在英国成立,它是世界最大的IT服务管理用户组织,也是唯一被认可的ITJ]艮务管理行业组织。90年代初ITIL被引入欧洲其他国家后,成为了事实上的欧洲IT服务管理标准。90年代后期ITIL被引入美国、南非和澳大利亚等国。2001年英国标准学会BSI在ITSMF上正式发布以ITIL为核心的IT服务管理英国国家标准BSl5000。ITIL已成为事实上的IT服务管理的国标标准。
ITIL主要包括六个模块,即业务管理、服务管理、安全管理、ICT基础架构管理、应用管理、IT服务管理实施规划。
ITIL最核心的模块是服务管理,该模块又包括“服务交付”和“服务支持”两个流程组。其中服务交付涉及与IT管理相关的5个战术级流程,即服务级别管理、IT服务财务管理、能力管理、IT服务持续性管理和可用性管理。服务支持包含了与IT管理相关的一项管理职能及5个运营级流程,即服务台、事件管理、问题管理、配置管理、变更管理和发布管理。
三、基于ITIL管理的IT服务管理实践
ITIL并不是一套理念模式,它所根据的是最佳的实际经验。其中许多经验不但广为人知,而且有无数IT机构都是采用它来提升IT服务的效率及加强IT部门间的横向沟通。这套方法论历经了数十年的考验,被证明是最为IT业界所接受的一套经营IT经验指南,是IT管理的业界标准。
ITIL作为一项来源实践的标准,提倡渐进式部署模式,也就是说在引入ITIL时,可以不必完全照搬ITIL十大流程,而应该在遵循ITIL渐进式部署原则的基础上,充分结合用户自身已经形成的日常运维流程特点定义和梳理运维管理流程,通过梳理一个、实施一个、落实一个的渐进式导入模式,灵活地将原有流程与ITIL。结合起来,使得ITIL真正落地,发挥效益。
对IT管理部门来说,实施ITTL的意义在于清晰梳理日常IT运维管理过程中遇到的各种各样的事,使IT运维过程变得有序连贯,从而提高IT服务的能力和水平。如何在实际工作中实施ITIL呢?ITIL来源于实践,又用于指导实践。它列出了各个服务管理流程的“最佳”目标、活动、输入和输出以及各个流程之间的关系,但并没有说明具体的操作流程及活动。具体实现这些功能必须基于具体情况,结合实际需要采取不同的方式。本文以某企业IT部门为例,浅谈基于ITIL管理的ITIL服务管理实践。
1.基于ITIL体系的组织结构
根据企业IT的实际运营需求,结合ITIL体系理论,
①值班员处理简单重复问题
根据企业IT部门的实际情况设置相当于ITIL服务台功能的岗位——值班员。值班员接受其他部门及各业务客户故障保修、咨询及相关业务请求,确保找到合适的支持人员来解决问题和请求。同时,值班员也负责跟踪来自IT部门内部的服务请求(如:自动或人工检查到的故障或潜在故障等)。服务值班员处理简单、大量重复并记录在知识库中的问题,从而减少维护组技术人员的压力。
②一线维护组应急攻克或规避故障
由于服务台值班员将大量简单重复问题自行解决,从而使维护组技术人员可以从日常繁杂的维护工作中抽出身来,去研究那螳技术难度大、对业务影响大的问题,并将对这些问题处理的方法和解决方案记录到知识库中,从而使该问题再次出现时,服务台值班人员就可以直接处理,真正发挥技术人员的才能〕一线维护组的主要任务是对服务台值班员提交的故障进行分析并着力在短时间内解决故障,对于暂时不能解决的故障,根据应急处置预案操作规避故障点以保证对外服务的连续。
③二线维护组终极故障难题
在一线维护组采取应急预案,规避故障点保证对外服务的连续性后,一线维护组将故障提交给二线维护组,由二线维护组最终解决故障。由于二线维护组需要对设备、系统等有更为专业的维护知识和经验,一般将二线维护组的工作外包给各厂商维护支持人员。
2.作业管理流程
根据企业IT部门的运行情况及人员配备,将ITIL体系的IT服务管理流程进行精简,在实际作业流程中形成以值班员为统一对外服务窗口,以配置流程管理为中心,以事件管理流程为主线,包括问题管理流程、变更管理流程及发布管理流程的闭环管理系统。
基于ITIL的服务管理主要通过服务支持流程获得恰当的服务来支持业务活动,该流程主要有以下几个环节:
服务台值班员-沟通纽带
服务台在服务支持中扮演着一个极其重要的角色。完整意义上的服务台可以理解为系统应用部门和服务流程的“前台”,它是业务部门与IT部门之间交流的纽带。服务台是用户与企业IT部门的唯一联系点,在碰到任何事故或疑问时,只需通知和联系服务台的工作人员,再由服务台的工作人员指导和协调下一步的处理下作。通过提供一个集中的服务联系点促进组织业务流程与服务管理基础架构集成,从而确保用户能找到帮助其解决问题和请求的相关人员。服务台的主要目标是协调客户(用户)和信息中心之间的联系,为IT服务运作提供支持,从而提高客户的满意度。
事件管理-及时恢复服务供应
所谓事件,是指企业IT运行维护范围内的所有与IT基础架构和应用相关的故障报告。事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事件管理的首要目标是要解决事件并尽快恢复服务供应。为了达到这个目标,采用事件驱动模式。企业IT部门通过事件管理流程对用户上报的故障、服务请求、咨询及投诉建议进行支持。保证各类事件得到标准化的处理。
如事件处理过程中,涉及到对应用系统或其它基础设施的变更操作,事件管理流程可向变更发布管理流程发起变更请求;如事件无法成功解决或未找到最终解决方案,可升级至问题管理流程进行后续处理。
问题管理-建立稳定信息系统
在尚未查明事故产生的原因前,事故所对应的潜在原囚被称为问题。问题管理是指通过调查和分析汀基础架构的薄弱环节、查明事故产生的潜在原因,并制定解决事故的方案和防止事故再次发生的措施,将由于问题和事故对业务产生的负面影响减小到最低的服务管理流程。与事故管理强调事故恢复的速度不同,问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。问题管理的主要目标是找到用户IT系统所存在的问题、防止事件发生,提高故障解决率,提升整体服务质量和客户满意度。
问题管理可以将问题和已知错误与配置项对应起来,并且可以根据配置管理数据库中的信息来分析事件和问题。问题管理还可以通过将基础设施的实际配置信息与配置管理数据库中经过批准的配置信息进行核实,来找出配置信息的不一致之处和基础设施存在的缺陷。
企业IT部门依照自身情况构建问题管理流程,对应用系统及基础架构的故障进行主动分析,建立每周、每日的巡检制度,通过预防性措施降低故障的发生率。同时,对于事件流程中未能成功解决的故障进行深人的根源分析,并设计最终解决方案对问题予以根除,保证类似事件不再反复发生。涉及到对应用系统或其它基础设施的变更操作,问题管理流程也可向变更发布管理流程发起变更请求进行控制和实施。
通过问题管理过程,逐渐将信息系统所涉及到的问题一一记录,包括解决方法和解决方案,归集为一整套庞大完善的知识库。建立知识库,可以对事件流程进行有效的支持,同时有利于摆脱由于技术人员调动或流失而造成信息系统的不稳定,可以迅速使信息部门将一个新人从服务台一线,到二线、三线向后培养,建立一个有效的人才培养路径。
配置管理-数据和信息的及时更新—核查—纠正
配置管理是识别和确认系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的过程,其日的是提供IT基础架构的逻辑模型,支持其它服务管理流程特别是变更管理和发布管理的运作。
实时了解网络环境中的各项网络、系统服务器、数据库、业务应用以及它们之间的关联关系,是保障网络及业务系统良好运行,提高整体IT运维效率的关键所在。而配置管理数据库是IT服务提供商向用户提供IT服务的核心工具。企业IT部门对当前运行维护的应用系统、系统模块、支撑应用系统的各类IT基础架构设施、用户人员组织、服务目录等方面的数据和信息进行梳理,并纳人配置管理数据库中进行管控,以支持事件/问题的诊断、变更发布的风险评估等各项服务支持工作的有效开展。
配置管理流程的关键成功因素在于确保数据库中的信息始终得到及时更新。这就意味着必须严格执行变更管理和发布管理,并为需要记录的信息指派相应的责任人。企业IT部门构建了完整的配置管理流程,对信息的录入、维护过程进行严格控制;构建配置管理数据库与开发数据库的接口,保证服务支持过程与开发过程、服务运营团队与开发团队的沟通和资源整合;同时,通过定期的审计活动对信息进行必要的核查和纠正。
变更管理标准化负面影响最小化
变更是指IT环境的各要素(如网络基础设施、主机及操作系统、数据库和应用软件等)的变动和更改的一切活动。变更管理是指从变更请求的处理、变更批准、变更准备、变更实施、变更实施后的确认或拒绝、恢复管理、变更的控制和跟踪、发布变更结果,到最终形成变更管理报告的一系列管理过程和活动。变更管理的目标是确保在变更实施过程中使用标准的方法和步骤,尽快地实施变更,以将由变更所导致的业务中断对业务的影响减小到最低,同时通过在组织内进行有效的协商和沟通确保所有的变更都具有可追溯性。
发布管理高效执行
发布管理是指对经过测试后导人实际应用新增或修改后的配置项进行分发和宣传的管理流程。发布管理最主要的目标是确保发布首次被导入实际运作环境取得成功,包括整合、测试和存储。结合实际情况,企业IT部门参考ITIL最佳实践重点建设变更和发布管理流程,对应用系统及其它基础设施的变更和发布过程进行严格的控制和管理。通过方案设计、审批、日程计划、构建、测试、上线等各个环节,保障每次变更发布得以高效执行,同时对应用系统及IT基础设施的风险和影响降至最低。
四、分阶段实施ITIL服务管理
ITIL框架中的IT服务管理包括十大流程和服务台管理职能。在选择实施ITIL的时候,应根据企业自身的复杂程度、信息化成熟度、应用水平状况和企业对服务管理的需求程度,进行有针对性的实施。通常可以分2个阶段实施,即理论实施阶段和工具实施阶段。
1.理论实施阶段
该阶段通过手工填写纸质表单将ITIL的管理流程应用到单位的IT管理中,让ITIL的理论变得“有形”、“标准化”和“可重复”,同时随时根据实施中的反馈信息调整各流程及个表单。流程的建设和完善是循环往复的过程,IT服务管理每个流程都应在实践中不断完善。
2.工具实施阶段
通过一段时间的理论实施阶段,管理流程达到了一定成熟程度。但是手工操作和纸质表单实施ITIL的管理流程存在不足,如:不利于高层管理人员监督流程实施情况、流程实施出现拖延导致不能及时完成、不利于汇总统计等等。为解决理论实施阶段的不足,必须进人工具实施阶段。
进入工具实施阶段,必须要有2类管理工具,即监控工具和流程自动化工具。
通过监控工其监控正常提供IT服务需要的基础信息,如:主机监控、网络监控、安全监控、物理环境监控、应用服务监控、数据库监控等等。这些内容的监控可由不同的监控工具来实现,但是在选择监控工具的时候一定要考虑其与流程自动化系统的对接,以实现监控界面的统一展现、报苦信息的统一入口以及统一管理功能的实现。
通过流程自动化工具,将纸质单据转为电子单据,将手工填写纸质单据变为手工录入或系统自动创建,将各类信息按照一定的管理逻辑存储到专业的数据库软件中,并提供标准的信息接入接口和信息输出接口,以便于其他管理监控软件或设备无缝联接。
五、实施ITIL服务管理所带来的成效
通过实施ITIL,企业IT部门将成为一个提供IT服务的,一站式店铺”——以一种单点联系的方式解决所有与IT相关的问题。这一服务方式在以下几个方面带来显著的好处:
1.组织架构—用户体验为中心
通过服务台值班员对用户上报的新需求、故障、服务请求、咨询及投诉等进行统一受理,并按策略转给不同的团队进行支持。这种单一联系点的模式保证了发生故障时,业务人员可以直接与IT技术服务人员联系,避免了不知找谁来解决问题的情况发生,从而缩短了“遗失时间”。
通过服务台,对所有用户请求的处理过程进行全程跟踪,有效地保证了事件在约定的期限内得到妥善解决。
位于服务台的服务人员可直接接触用户,解决用户的问题。他们的服务以及对用户的态度将直接决定业务用户对IT的认识,IT服务台提供的高效服务,为IT与业务用户建立畅通无阻的沟通渠道,改善业务用户对IT的认识。
当面对同时发生的大量突发事件时,服务台提供了一种结构化的流程来安排工作优先级,影响度大且紧急的问题优先解决;同时,服务台选择最快的方式来排除故障,恢复IT服务。由于所有解决问题的方法都将被记录在问题管理数据库中,只要搜索一下该数据库,就可获得同类问题的解决方案,缩短了平均不可用时间。
2.流程设计—以服务需求为核心
服务台人员对所有IT用户提交的服务请求、故障和问题等进行记录,这些记录提供了一种发现IT基础设施问题的机制。
运维工作处理中对于问题和服务故障处理记录,形成了一个现成的经验和知识,帮助运维人员直接解决问题,避免运维人员陷人重复解决同类问题的困局。
通过配置管理中的配置管理数据库,处于单一联系点的IT服务人员可以掌握所有配置项信息,充分高效地利用各种配置项资源。为IT管理提供一种可量化的评价机制来评估业务。提高服务支持的风险防范能力;通过参照ITIL标准,改进IT管理的相关流程。信息中心的IT管理实现了两方面的收益:直接收益和间接收益,详见下表。
六、体会
ITIL的应用过程和效果的获得,不是单纯地通过项目建设能够达到的,而是高层领导、IT部门、服务提供商、产品提供商等多方共同努力的结果,也是一个持续改进、不断优化的长期过程。因此,在ITIL实施过程中必须注意以下几点:
1.在实践中优化ITIL流程
ITIL流程必须是贴合自身需求“量身定制”,切忌照搬照抄,也不应该为了追求ITIL而做ITIL,应该充分认识到ITIL的实施是一个长期的系统化改善,应从最迫切的需求人手,一步一步按照框架进行,最终才能实现ITIL的长远目标。
2.从流程的建设转移到流程的监管
在基本完善了对ITIL主要流程的建设后,必须将对流程本身的关注,逐步转变到对如何管控和流程执行效果的关注上来。
3.技术与业务相结合
ITIL未来的趋势主要体现在五个方面:一是体系优先;二是面向业务;三是流程导向;四是基于控制;五是绩效驱动。体系优先尤其是目前我国IT服务管理发展的一个大趋势,它是通过把技术流程整合到体系中进行实施,从而实现IT服务管理流程化。让IT完全服务于业务,这不是一个纯技术性的项目,它是技术和业务相结合的过程。
水滴石穿非一日之功,消除瓶颈非一朝一夕。在未来发展中,企业IT部门应参照国际通行的IT服务管理最佳实践,不断总结,建立起以用户体验为中心,能够提供更加快捷、高效服务的IT服务管理中心。
|