[典型案例] ITIL理念与IT技术完美结合的实践
学习资料:IT运维管理社区专家讲堂直播300期视频回放
ITIL理念与IT技术完美结合的实践
--宝信软件运维管理解决方案简介
1、运维服务与ITIL理念
1.1IT运维服务
随着信息化建设的不断深人和完善,信息化系统已和各领域的主营业务紧密相连,信息化系统能否正常运行已影响其支撑的主营业务的开展,并且如何进行有效的IT运维服务和管理,这方面的知识积累和应用技术还刚刚起步,所以对这一领域的研究和探索,将具有广阔的发展前景和重大的现实意义。
专家研究和大量企业实践表明,IT项目生命周期中,大约80%的时间与IT项目运行维护有关,而往往该阶段的投资仅占整个IT投资的20%,出现了典型的“轻服务、重技术”现象。国际著名咨询调查机构Gartner集团的调查发现,在经常出现的问题中,源自技术或产品(包括硬件、软件、网络、电力失常及天灾等)方面的问题其实只占20%,而管理流程失误问题占40%,人员疏失问题占40%管理流程失误包括米做好变更管理、无预防、超载、无测试等错误,人员疏失包括操作不规范、训练不足、备份错误或安全疏忽等,而且人员疏失的源头仍然是管理缺失。由此可见,IT运维服务管理在IT项目中的作用是非常重要的。
面对如此高的要求和压力,企业的IT部门和IT服务供应商就需要有一套完善的并可持续改进的IT运维服务管理流程,使信息系统更加适应业务持续变化的需求。
那么,什么是IT运维服务呢?
IT运维服务是指供方为满足需方运维对象(IT)运行要求所提供的活动,主要包括基础设施维护服务、系统运行维护服务和系统运营支持服务。基础设施维护服务是指对基础环境、硬件、基础软件的故障诊断和修复等服务。系统运行维护服务是指通过使用监控、服务管理工具等方式,保障系统正常运行的服务。系统运营支持服务是指为提升业务有效性所提供的评估、数据管理、数据分析、业务流程管理等服务。
1.2ITIL的发展历史
20世纪80年代中期,英国商务部为解决“IT投资、采购与服务质量不佳”的问题而组织开发了IT基础架构库,即ITILV1.0(InformationTechnologyInfiastructureLibrary,信息技术基础架构库)。自1989年出版了第一本指南之后,其他9本也陆续出版。10本指南分别说明了IT服务管理中的10个核心流程。于是ITIL作为IT运营的最佳实践,确定了以流程为中心的IT服务管理方法。
2000-2003年期间,英国商务部发布了ITIL的全新版本:ITILV2.0,最终形成了由服务管理、业务管理、ICT基础架构管理、应用管理、IT服务管理规划和安全管理6个模块组成的ITIL结构(见图1)。
2005年5月17日,国际标准化组织(ISO)正式将ITIL纳人成为国际标准化体系ISO200000。2005年12月15日,由国际标准化组织和国际电工委员会正式颁布ISO/IEC20000,即信息技术服务管理,IT服务管理(ITSM)所依据的标准ITIL已经由“事实上的标准”发展成为真正的国际标准。
1.3在运维服务领域的各厂商解决方案综述
20世纪90年代初,越来越多的公司进人IT服务管理领域井加大了在该领域的投人,如BMC公司通过收购Peregrine公司的Remedy解决方案切人这个市场。其次,围绕着ITIL,各组织也相继开发了各种各样的IT服务管理方法,如荷兰Virje大学软件工程研究中心(SERC)组织开发的ITServiceCMM(IT服务能力成熟度模型),微软公司为所有微软产品开发的MOF(管理运营框架),HP开发的该公司实施IT服务管理的方法沦HPITSMReferenceModel(IT服务管理参考模型),IBM的ITPMSIT流程模型)及“信息系统管理系统”(即“黄皮书”),CA的ESM(企业系统管理),等等。
经过一系列的开发、并购和整合,针对IT服务管理的软件系统和解决方案更趋完善,并出现了可以实现ITIL各核心流程的集成管理解决方案和服务平台,如CA公司的Unicenter,HP公司的OpenView,这些解决方案完善地支持ITIL理沦,并且包含了IT服务管理(ITSM)的全部内容。
IT运维服务作为IT服务管理的一个主要领域,目前也在其运维服务范围里推广此IT服务管理理念和各类软件。
2、宝信软件的运维管理体系
2.1宝信软件的运维管理体系产生的背景
作为IT服务供应商的宝信软件,正不断推动公司的运维服务更加有效、持续和稳定发展,他们希望引进最先进的ITIL管理理念和ISO20000国际标准,结合宝信软件多年在IT运维服务管理领域积累的丰富经验,以协助客户提高IT运维服务管理的效率和规范性,保障客户系统的持续稳定运行。
2.2运维标准与规范制度
ISO/IEC20000标准为IT运维服务提供商提供了一种以流程为导向、以客户为中心的方法,通过整合IT服务与业务来提高IT服务支持和服务交付的能力及水平。ISO/IEC20000就是这样一个框架。ISO20000关注3个层面的客户关系管理、关注IT与业务的整合(见图2)。
建立国际先进水平的IT服务管理体系是宝信软件为全面实现“三个国内一流”战略定位采取的具体举措之一。2007年初全面启动ISO20000认证工作。公司在全面梳理原有IT服务管理制度和操作规程的基础上,按照ISO/IEC20000管理体系的要求对管理体系文件进行了系统的策划、编制和修订,形成了包括2份第一层次文件、31份第二层次文件、1345份第三层次文件在内的IT服务管理体系文件,井于2007年6月1日发布运行,IT服务管理体系文件的建立和发布为体系的有效运行奠定了坚实的基础(见图3)。
公司强势推进IT服务管理体系文件的执行力,通过强化服务理念、服务意识、服务规范的教育和培训增强了员工的服务意识,通过促进管理文件规定与“集中运维管理平台”的融合固化了服务管理流程,通过知识共享和专家小组的知识传递带动了服务相关部门整体服务管理水平的提升,通过管理文件执行力的评估并将评估结果纳人绩效评价,有力地推动了管理文件的执行力度。
为了有效地开展运维服务管理,宝信软件自主开发了基于ISO20000的“IT服务集中运维服务管理平台”(见图4)。该平台把各级IT运维服务人员联系起来,构成统一的支持服务体系。既可以被动接受通过呼叫中心(CallCenter)或Web界面手工提交的事件,也可以主动收集由监控中心转发的事件,并且按照规范的处理流程完成事件请求、变更答理、资产答理、知识答理以及服务水平答理,科学地自动地完成人力资源分配,确保每个事件能得到及时解决。
2.3运维服务的组织、绩效考核指标体系与流程
一方面,宝信软件针对每个客户建立项目答理流程,通过项目答理的方式答理每个运维服务。宝信软件为每一个项目指定专门的项目经理,结合宝信软件四级技术支持体系(如图5所示)配置各级别支持人员,开展口常运维和专业技术支持服务。
CallCenter,作为宝信软件服务对外的统一窗口,向用户提供“7x24"全人候服务,通过CallCenter实现客户服务受理、处理、跟踪、反馈的闭环答理。
一线服务,即现场服务工程师,采用“N+M”的服务模式,由“N”名“7x24"(7天x24小时)和“M”名“5x9"(5天x9小时)组成一线技术服务团队;严格按照相关操作手册进行口常点检和维护工作,能够处理常见故障,编制并实施口常维护方案,能够对系统重大故障进行初步判断。
二线支持,由各专业技术领域具有丰富经验的工程师组成,其主要工作内容是作为一线服务的技术支撑,通过现场或远程的方式提供“7x24”的技术支持服务。二线支持除提供相关的技术支持外,还承担所维护系统的调优、完善、专业的预防维护、模型与工艺方面的攻关等工作。
三线支持,由宝信各领域技术专家组成,作为二线支持的支撑,负责运维服务整体方案的策划、技术规范的审核和重大故障的技术支持。
四线支持,宝信软件提供原厂商级别的技术支持服务;宝信软件通过购买原厂商的服务,以获取原厂商级别的技术支持。
为促进技术支持体系上各级人员的积极性和主动性,宝信软件设定了合理的绩效考核KPI体系,主要从4个维度进行考核:用户的评价、对业务的灾献、改革创新和高效的运作。其中从用户的评价和对业务的灾献维度设定的KPI示例,如图6所示。
另一方面,宝信软件为客户提供多种符合ITIL的服务流程,包括服务等级答理、则务答理、持续性答理、容量答理、可用性答理、变更答理、发布答理、问题答理、服务台答理和配置答理等,主要可分为服务支持流程和服务提供流程。
服务支持流程主要面向用户,用于确保用户得到适当的服务以支持组织的业务功能,确保提供的服务质量,符合服务级别协议(SLA)的要求。服务提供流程主要面向为服务付费的机构和个人客户。它的任务是根据组织的业务需求,对服务能力、持续性、可用性等服务级别目标进行规划和设计,同时还必须考虑到实现这此服务目标所需要耗费的成木。这此答理流程必须解决“客户需要什么”、“为满足客户需求需要哪此资源”、“这此资源的成木是多少”、“如何在服务成木和服务效益(达到的服务级别)之间选择恰当的平衡点”等问题。其中问题答理的流程设计,如图7所示。
2.4效果与价值评估 宝信软件IT运维服务答理给实施企业自身、企业员工及其他利益相关者带来了多方面的价值。这邺价值可归纳为商业价值、则务价值、对员工的价值、创新价值和内部价值。
商业价值包括提高了业务运营的质量,对IT运维服务有更合理的期望,提高了客户和业务人员的效率,并在客户和IT运维服务提供者之间建立更加融洽的工作关系。
则务价值包括降低了实施变更的成木,当软件或硬件不再使用时,可以及时取消其维护合同。
对员工的价值包括让IT运维服务人员更加清楚了解对他们的期望,并有合适的流程和相应的培训以确保他们能够实现这邺期望,提高了IT运维服务人员的生产率和工作满意度。
创新价值包括让IT运维服务提供方更为清楚地理解客户的需求,提高了服务的灵话性和可适应性,提高了对米来发展趋势的预测能力。
3、宝信运维平台、监控平台的解决方案
宝信软件作为IT运维服务供应商,打造一个集运维相关的各流程答理和远程监控于一体的平台显得尤为重要。在此背景下,宝信IT服务管理(ITSM)平台暨集中运维服务答理平台(以下简称“运维平台”)、宝信软件系统网络监控平台(以下简称“监控平台”)等服务于IT运维服务答理的信息化答理系统应运而生,通过信息化的手段答理信息系统的运行维护。
3.1平台架构和功能简介
3.1.1运维平台
宝信“运维平台”融入了基于ITIL的事件答理、问题答理、变更答理、配置答理流程和运维知识库答理等服务支持功能以及个性化的报表答理功能,提供了短信、电子邮件、弹出窗口等多种可选信息通知方式,具有故障受理的自动化、处理流程的规范化、运维支持经验和知识的共享化、服务的可视化和可量化、服务过程的可追溯性、与公司CTI系统无缝集成等特点,为运维服务口常答理提供了强有力的支撑(系统架构见图8)。
宝信“运维平台”具备如下功能:
事件答理。通过建立一套标准化事件答理流程来处理所有影响IT系统正常运行的突发事件,使受事件影响的业务尽快地恢复正常。
问题答理。解决IT服务运营过程中遇到的所有问题,包括问题处理和问题控制,以防止与这此问题相关的事件再次发生。
变更答理。通过建立一套标准化的实施流程来控制所有对于宝信承担运维的IT基础设施和应用功能的变更,确保所有对于IT系统的变更在经过计划、风险评估、审批等标准化过程之后,对用户产生最小的影响。
配置答理。对所维护的IT系统的软、硬维护对象进行监控和答理,提供根据分类代码进行配置项的查询功能,以帮助其他流程的支持人员在处理故障时更好地作出决策,从而降低在实施变更时对业务系统产生的影响。同时与备件答理和变更答理相结合,为备件的采购模型提供支持
运维知识库答理。提供运维知识库,使IT运维人员能及时利用成热的问题解决方案更快地排除故障。
服务等级答理。对服务等级的答理,可以记录服务水平协议、设置请求优先级、评估服务水平等。
监控系统集成。与监控系统(即安装有系统网络答理软件的主机系统)集成,接收其产生的事件,及时作出处理,并达到自动预警和自动事件创建的功效。
CTI集成。与公司呼叫中心CTI系统设备的集成,形成完整的服务答理平台解决方案。
报表答理集成。与报表答理平台集成,实现登录集中运维平台后集成报表的自动登录,并提供权限分组控制,以实现报表展现的个性化。
邮件服务器集成。与邮件服务器集成,通过自动发送邮件的方式来发送集中运维平台中的通知。
短信平台集成。与宝信短信平台集成,通过自动发送短信的方式来发送集中运维平台中的通知。
3.1.2监控平台
为了对维护的信息系统进行实时监控.及时收集系统运行状态信息,宝信软件自主研发设计了系统、网络监控平台。“监控平台”具有对网络和客户主机系统运行状态进行远程自动监控、安全报警、用户答理、监控策略答理、报表统计、事务处理等功能,提供远程集中监控和答理的界面以及监控I=kJ值设置、监控对象配置、控制组件配置、系统设置等操作界面.具有安装快捷、操作简单、跨平台、远程集中监控与答理等特点。
宝信“监控平台”采用B/S方式进行设计,考虑到将来的司扩展性,系统架构将采用分布加集中的模式,即分布数据采集集中管理控制。
“监控平台”整体架构如图9所示:
宝信“监控平台”具备如下功能:
集中监控。使目前需要维护的分布在不同物理区域的700多套系统有集中统一的监控环境,可以让运维人员方便地查看各个系统的运行情况,可以提高效率并节约人力成木。
自动监控。对各个需要监控的网络/服务器通过配置实现自动监控,在无需人员查看的情况下即时发现系统隐患和故障,提高发现系统错误的及时性和准确性,提高运维质量。
安全报警。在监控系统发现隐患时主动报警,通知客户端,采用语音和颜色报警,即时通知相关人员,对故障的及时排除和隐患的解决提供保障。
系统管理、对系统用户、被监控网络/服务器等各项配置进行答理。灵活的监控配置,友好的Web界面,提供直观和易操作的各种系统功能,通过预设默认值或者提供列表,方便操作。
报表统计。按区域、设备、时间对监控项目的结果进行统计,并提供周报、月报、年报。使答理层能更方便有效地了解网络/系统的运行情况,进行运行趋势分析以及统筹规划。
3.2使用效果
宝信“运维平台”和“监控平台”自上线以来,客户的满意度正在逐步提升,运维服务支持人员从原来的“救火队员”角色中彻底解脱出来,IT运维部门将由原先的“急诊大夫”晋升为“保健医生”,人力资源的使用分配更趋合理,服务也由被动变为主动,从而提高了企业IT服务的整体效率和服务水平。 鼎力支持!! 鼎力支持!!
页:
[1]