[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放[p=30,2,center]
[p=30,2,center]
ITIL将改变以往以技术专家为主的IT维护和管理模式,从技术主导转变为业务主导,从而消除IT服务过程中对单个人的依赖,实现IT服务的“工程化”。
在2002年,世界上两个最大的木制品和包装制品公司Mead和Westvaco进行了重组,合并成为市值达72亿美元的新公司Mead-Westvaco。原Mead公司流程管理副总裁JimMcGrane成为新公司首任CIO。上任伊始,当务之急是将原来两个公司的两套系统整合到SAP的系统上。这个工作很富有挑战性,为了给用户提供一个更有效率的流程,公司一直在对流程进行标准化,但是,包括IT部门在内的很多部门仍然还在延续以前的一套工作习惯。“IT部门也没有把注意力落在流程上,”McGrane说,这很有讽刺意味:那些负责制定和优化业务流程的部门自己没有一套标准的工作流程,因此,IT部门就没有办法在各个机构中采用同一套标准。在2002年下半年的很长时间,McGrane和他的很多项目经理们一直在思考,为IT部门制定一个长期的远景,同时规划为了实现这个远景需要哪些关键流程。在McGrane心中,这个部门应该具有一定预见性,能在问题还没有出现之间就能解决,而且能够快速地适应业务的改变。McGrane曾采用过几个流程框架,但每次都以失败而告终。“我们曾经探讨过来自Gatner、IBM以及其他一些类似机构的资料,但都无法落实到操作层面,”McGrane说,“比如,他们都会给你一个关于可用性的描述,但很少有人真正能说清楚可用性到底是什么样的。”很偶然地,一位同事了解到ITIL(InformationTechnologyInfrastructureLibrary,ITIL)——一组由英国政府20多年前总结出来的有关IT运营的最佳实践。与此前McGrane所知道的流程框架不同:ITIL虽然层次比较高,但对每个术语都有比较详细的解释,足以让人明白如何应用到一个组织中。McGrane一下买了10套有关ITIL的书,2002年岁末,McGrane和他的人都在学习ITIL。2003年第一季度,McGrane拟定了一个计划,决定依据ITIL重组他的IT部门。尽管MeadWestvaco的整合还在进行,当时的IT维护合同比往年减少了10万美元,而运营稳定性比以前提高了10%左右,但McGrane还是决定投入人力物力实施ITIL。ITIL受到追捧ITIL受到追捧是各种外在环境交织的结果:由于面临IT外包的压力,CIO们急于向公司证明IT部门的价值;由于要遵循SOA法案的规定,给企业带来了额外的成本支出,这些都迫使CIO们急于寻求一种有效的IT运营管理流程。这种管理的流程应该给我们称之为“艺术”的计算机科学提供一种一致的、可评估的方法,换句话说就是提供一些科学性。
在ITIL之前,不少企业曾尝试过CMM、6希格马、信息和相关技术控制目标(Cobit)等,它们每一个都针对特定的领域。与它们不同,ITIL重点关注IT运营。如果应用得恰当,ITIL将能帮助IT部门改善他们的服务质量,包括提高系统的连续运营时间、更快速地解决问题、更高的安全性等。在欧洲ITIL已经流行相当长的时间了,现在美国的公司正在逐渐接受它。在2004年的一次数据中心负责人大会上,Gartner曾对164名参会者(他们大部分来自美国的大型企业)进行过调查。结果表明与前几年相比,对ITIL的了解和熟悉程度都有很大提高,其中41%的人说,他们在企业中已经采用或部分采用了ITIL,而2003年同期这个比率只有31%。
但是,要正确地实施ITIL绝非易事。McGrane说,对工作流程进行变更是ITIL的基础,CIO应该像对待ERP项目一样来实施ITIL,这个过程可能长达数年,而不是几个月。那些以为很容易就能实施ITIL的CIO一定会很失望,ITIL并没有对如何真正实施它所介绍的最佳实践提供任何建议,这对于那些习惯于根据详细的开发指南来工作的人会很不习惯。也许正是出于这方面的原因,最近Forrester对65家全球性企业的CIO进行的调查表明,只有3%的企业把ITIL作为最主要的实施指南。“大多数企业都在应用ITIL的帮助台管理,”
ForresterCIO组副总裁BobbyCameron说,“但是,这并不意味着整个企业已经接受ITIL或者把ITIL作为主要的战略。”然而,正如大多数公司的CIO们所看到的,ITIL应用正在逐步普及,这是显而易见的。不管是美国还是加拿大的企业都会在IT合同中使用ITIL,如通用汽车的IT合同就是这样要求的。Forrester认为,由于ITIL带来的好处,包括对客户满意度的改善和提高运营效率,ITIL成为事实上的标准只是时间问题。“ITIL绝对是目前已知的有关IT运营的最佳框架,”Cameron说,“在这方面,我们还看不到竞争对手。”“使用ITIL,我们现在能够及时地对我们的工作进行评估,”从事股票和证券代理业务的Pershing公司CIOSureshKumar说,“因而,我们可以不断对我们的工作流程进行改善,并找出瓶颈之所在,据此,使得我们的故障次数和时间都大大降低。所有事实都表明,我们的工作得到明显改善。”
ITIL的作用在Pershing公司,如果有人遇到了IT系统故障或者硬件故障,他可以打电话到服务台,服务台会根据故障的症状将他的电话分别转接到四个对口的部门:桌面、网络、大型机或者是分布式系统。Pershing公司从2004年1月份开始实施ITIL,负责接听电话的专业人员已经积累了各种故障及其对应的解决办法的案例:如果故障在10分钟内没能得到解决,服务台会自动地把电话转到合适的专家那里,故障一般会在一个小时内解决;如果1个小时后问题依然不能解决,IT部门的高级管理人员,包括Kumar在内,会召开一个电话会议,商讨解决问题的办法。如果故障持续时间超过2个小时,Kumar会打电话给相应的业务部门领导商议故障对业务的影响,以及应该采取的措施等。至从12个月以前按照ITIL重建帮助服务台以后,Pershing的故障响应时间减少了50%。而且,由于每一次发生的故障都可追踪和管理,使得IT人员可以很容易地进行故障原因分析,从而使得原来那些要很长时间才能得以解决的故障大大减少了。同时,在进行系统更改和安装新版本时,由于遵循了固定的流程,使得从前常常发生的版本冲突很少再发生。另外,由于IT部门都会按照统一的流程规范各自的工作,使得各个小组的作用得到更大程度的发挥。“一个企业可能同时有网络维护外包和大型机维护两个方面的工作,”McGrane说,“如果每一个部门都只专注于最大化本部门的价值,并不一定能为整个企业带来最大的价值。”ITIL提供了一种“语言”或者说一个流程来协调整个IT部门所有人员的努力,从而使得IT部门的价值得到最大化。ITIL最早于上个世纪80年代由英国政府的计算机和通信局(如今这个部门已经不存在了)开始使用,是对政府IT部门最佳实践进行的总结。不久,ITIL就在英国私人企业开始得到应用,接着流传到欧洲,又经过几年时间,ITIL进入美国,在美国开始流行开来。现在,见到的是ITIL的第二版,由7本书组成,每本200页左右,售价大约11.5美元。每一本介绍一个实践领域:服务支持,服务提供,服务管理的实现计划,安全管理,信息和通信基础设施管理,应用管理,业务远景等。
到今天为止,大多数美国的企业只是在两个领域实施了ITIL:服务支持和与服务支持相对应的服务提供领域的实践(要提醒那些初次接触ITIL者的是,大多数美国的企业和咨询公司谈到ITIL时,仅仅指服务支持)。由于对很多IT组织而言,服务支持是一个相对比较容易得到改善的领域,所以大多数CIO和ITIL专家建议选择服务支持作为实施ITIL的起点。
在服务支持这本书里介绍了5个流程,每个流程又包含一些子流程。这5个流程分别是事件管理、故障管理、配置管理和发布管理等,这些流程用来帮助公司对整个事件的生命周期进行管理,即从事件最初发生一直到对系统进行更改或者发布新的补丁程序等,这种控制最终会改善IT部门的服务等级。对于专门负责标准化考试的大学委员会(CollegeBoard)软件工程副总裁JimStrande而言,这正是ITIL吸引他的地方。尽管他没有就IT运营与业务部门签订服务等级协议,但是很明显,他没有能满足业务部门对公司网站的期望。
Strande负责的IT部门能保证IT系统99.9%的运行时间,但每年网站的宕机时间仍然还有9个小时。而且,宕机几乎总是发生在考试注册期间或者考试成绩公布期间的40、50天内,这恰恰是公司最需要网站运行的时间段。Strande转向ITIL寻求帮助,他使用ITIL来对他的IT部门进行评估。评估的结果让他了解到IT部门并没有对每一次事件发生的原因进行跟踪分析[在ITIL中,对事件(不定期发生的任何一种事情)和故障(表现为IT系统不能正常工作,通常是很多事件的综合结果)没有区别]。结果,网站的故障没有得到根本解决,下一次还会再次发生。
按照ITIL在服务支持这本书中介绍的方法,Strande对IT部门进行了重组,详细规定了事件和故障管理的办法,并就一些关键事件的应对策略对职员进行培训。例如,如果网站和信用卡处理中心的连接中断,现在,服务台的员工马上就能知道故障的原因及其对应的解决办法:很可能是公司与信息卡处理中心的交换机出现了问题,因此需要重启交换机,同时对交易进行重新处理。Strande说,通过贯彻新的流程,现在故障的重复发生率大大下降了,服务级别也得到了提升。
在Pershing公司,如果IT部门两个小时内还不能解决问题,CIOKumar必须向公司的高层管理人员汇报,即使故障发生在深夜或者凌晨。
“我们非常不希望在深夜两点给CEO打电话,”他说,但有几次他还是不得不这么做。最近,公司的一个交易结算中心系统突然崩溃,这给Pershing公司的IT部门带来了极大的压力:IT部门必须完成每晚的1.2万笔交易的处理,对账面数据进行更新,同时准备第二天的在线系统,备份数据库和文件,接收和发送电子消息,以及制作电子的和书面的报告等。Kumar在半夜召集30多名工程师召开了一个电话会议,从法律问题到所需的人手进行了商讨,最后制定出最佳的应对策略。ITIL的核心ITIL的服务支持为IT组织提供了一些流程,用于追踪事件、识别故障、进行修改以解决问题,但是最终要靠人来执行这些流程。最佳的办法是为IT人员提供一个系统来帮助他们完成这件事。
配置管理数据库(ConfigurationManagementDatabase,CMDB)可以满足这一方面的要求,它被认为是ITIL项目的基石。“CDMB是ITIL的核心,”计算机硬件制造商Finisar的IT经理ChristineRose说,Finisar在2002年开始实施ITIL。“它让你可以对IT资产进行追踪,对所做过所有工作进行实时记录。”本质上,CDMB就是记录公司所有IT资产的一张地图,包括系统、路由器、服务器、PC机以及针对这些资产所做的每一次更改,还有与这些资产有关的所有事件及其这些资产与更大范围的技术环境的关系等。例如,Rose从CDMB中得到的一张报表显示,Finisar的FTP服务器与最近几次的故障有直接关系。这台服务器用来为最终用户提供技术支持,过重的负载使得硬盘接近崩溃的边沿。找到了故障的原因,Rose很简单地通过添加存储空间解决了问题。“如果没有关于这台服务器的运行记录,我们根本就不会注意到这个问题,因为业务部门是不会把业务负载有多大这种需求告诉IT部门的。”现在大多数商品化的CDMB产品都内置了事件跟踪、故障跟踪、变更跟踪功能。不过,即使没有这些功能,把这些流程连接到一起也并不困难,McGrane说。MeadWestvaco公司最初的配置管理系统实际上就是代顿大学大四学生的一个课题。“我们刚开始并没有认识到CDMB是多么关键,”McGrane说(该公司后来从BMC购买了一套配置管理软件)。
CDMB可以帮助人们制定“What-If”计划,这个计划可以帮助人们发现,在某个环境中如果进行一些更改,可能会给环境中的其他一些系统带来哪些影响。ITIL的变更管理方法规定,如果要进行一个关键的改变,应该在72小时之前通知有关的业务部门。如果按照这个规定,财务部门可能会要求推迟对ERP的修改,因为他们需要系统完成账目结算。“业务部门做的很多事情IT部门根本就不知道,”Rose说,“这样的规定可以让我们和业务部门建立起联系,从而避免业务部门需要却不能获得的事情发生。”ITIL所做不到的人们对于ITIL最大的误区在于认为它包含了IT管理的最佳实践,而实际上,ITIL只是列出了公司应该可以做到的一些事情。“你没有办法只根据ITIL的教材来实施ITIL,”一位ITIL专家说,“你只可以利用他来帮助你对组织进行一些改变。”换句话说,ITIL本身没有提供如何真正应用它所归纳的最佳实践的办法,每一个组织必须基于ITIL原理设计自己的流程。
“因为ITIL只是一个框架,因此,你需要依赖一些人来帮助你完成框架到设计自己的流程这个跨越,”Strande说。在CollegeBoard,是咨询公司来帮助他们完成ITIL的实施的。CollegeBoard的实施方法具有普遍性。至从上世纪80年代ITIL第一版由英国政府出面组织编写以来,如今的所有版本都是咨询公司和供应商所编写——这些人的生计依赖于为那些需要实现他们在书中所描述的实践的公司提供咨询服务。
“编写这些资料的人应该离咨询公司或者供应商远一点,”IT服务管理IT运维管理社区(ITSMF)CEOAidanLawes坦承。这个组织负责ITIL的日常管理工作(尽管英国政府目前仍然拥有ITIL的商标,但实际上是由ITSMF负责ITIL的日常管理工作)。ITIL下一个版本预计在2007年上半年推出,Lawes说,在新书的编撰过程中,ITSMF将扩大作者的数量,并给作者提供相应的报酬。McGrane和Rose虽然都没有聘请咨询顾问,但他们都承认,完全由自己来负责ITIL是一件既耗费时间由需要投入大量精力的事情。在MeadWestvaco,进行前期有关ITIL知识的培训就用了差不多1年的时间,这就使得IT部门的重组不得不推迟到2004年的第三季度才得以进行。而且,这还只是个开始。设计新的流程也许只要几个月,但要从原来的流程转移到新的流程这是一个非常困难的事情,这个过程也许需要几年。MeadWestvaco从最开始实施ITIL的流程框架距今已有两年时间了,但目前仍然还只在服务支持和服务交付方面做了一些工作,而且,按照McGrane的计划,到2005年年底不会尝试新的流程。McGrane建议,从引入ITIL的概念到真正开始采用ITIL所阐述的流程进行业务管理,这个时间需要1年半到两年。MeadWestvaco的流程转变负责人TomThompson说得更坦率,“你也许可以在四个月内完成,但前提是你要准备累死一批人。”另一个障碍是:老的习惯很难更改。Rose说,为了防止用户绕过服务帮助台直接打电话给IT人员,无奈之下的她不得不给IT人员更换了新的电话号码。另外,裁员也是在所难免的,因为总有一些IT人员不能适应新的流程。不过,Stande在ITIL项目中发现,他现有的人无法达到预期的服务级别和故障管理,又新雇佣了几个员工。不过,对于大多说的CIO们来说,ITIL的痛苦是值得的。至从Finisar对帮助服务台的流程进行标准化后,客户的满意度从33%上升到95%,而IT的投入从收入的4%降低到2.4%。
“像经营业务一样管理IT,你必须了解其中的关键服务,”McGrane说,“ITIL让这件工作可视化了。它让你可以比较出哪些是最重要的,从而让你可以对那些重要的事情进行强调,而不重要的就可以暂时不管。”
ITIL的未来发展ITIL从字面上理解只是一个库,实际的表现形式是一套书。用户常批评ITIL的书只介绍IT服务管理是什么,而不是如何进行IT服务管理。但也有些ITIL的早期使用者表示喜欢这样,他们说就需要一些指南,而不需要有关如何制作报告等细节,另外一些人甚至希望ITIL能提供更多的发挥空间。
“ITIL是一本书,”一位专家说,“我们要做的是把它应用到实际工作中。它只提供了一些最佳实践的框架,它会告诉你应该做那些事情,但不会告诉你如何做这些事情。”
英国政府的商务部(OGC)以及各种ITIL的合作伙伴,如ITSMF正在酝酿对第二版的ITIL进行一些修改。其目标是增加更多的实施细节,比如哪些信息应该记录,哪些指标应该注意等。还有人批评ITIL没有把业务流程和IT流程紧密结合起来。对此,OGC已经注意到了。今年8月,OGC的有关负责人表示,“对ITIL进行修改的最大目的就是提高ITIL在支持业务需求方面的有效性和适应性,并阐述清楚IT最佳实践与商业收益之间的关系。”(博文综合编译)链接几个与IT相关的流程框架ITIL:ITIL(ITInfrastructureLibrary)是一组可定制的最佳实践的流程框架,用来促进IT部门服务质量的改进。ITIL提供了一套控制和管理IT运营的流程模型,并通过一组综合的管理办法来帮助IT部门解决组织架构和技术需求方面的问题。COBIT:COBIT(ControlObjectivesforInformationandRelatedTechnology)是为管理人员、审计师以及IT用户提供的一组被普遍接受的有关信息安全的控制目标,以帮助他们在公司内部建设适当的IT治理机制。
CMM:CMM(CapabilityMaturityModel)是一种评估企业软件开发流程成熟程度的方法,共分5个级别。CMMI是CMM的改进版,它为组织的流程改进提供指南,同时也为产品和服务的开发、购买以及维护提供管理方法。SixSigma:SixSigma是一种数据驱动的用于控制变更的质量管理程序。“SixSigma”是指在统计分析中的一个偏差标准,也就是要求每百万个产品中次品最多不超过3.4个。
链接
ITIL的七种实践类型
ITIL把IT实践分成七种类型:
1.服务支持它描述为了提供IT服务,日常需要进行的支持和维护活动的流程。
2.服务提供包括为提供IT服务所需的规划和提供流程。它着眼于IT服务提供的质量的长期改进。
3.服务管理的实施规划包括与服务管理流程的规划、实施和改进相关的各种问题和工作,同时,也包括与组织和文化的改变有关的问题,以及长期发展战略的制定。
4.安全管理详细描述了规划和管理特定安全级别的信息和IT服务的流程,包括与安全事件有关的各个方面。另外,还包括风险和漏洞的评估和管理,以及对策的成本分析。
5.信息与通信基础设施管理涉及信息与通信基础设施的各个方面,从采购流程中的业务需求分析到产品的测试、安装、部署、运营维护到产品和IT服务的优化。
6.应用管理描述了如何对应用的整个生命周期的各个阶段进行管理,包括从最初的业务需求到最后不再使用。在整个应用生命周期中重点强调确保IT项目和战略与公司的业务紧密结合,以确保公司的投资得到最大回报。
7.业务目标为IT人员提供建议,帮助IT人员了解他们应该如何为企业的业务目标做出自己的贡献,以及他们的角色和服务如何才能最大化这种贡献。
关于ITIL项目的几点建议
●从小处着手,实施ITIL一次最好不要超过两个或者三个流程;
●对现行的流程进行评估,找出最头疼之处,并确立基准点;
●尽早实施事件管理,这部分用户或者客户最容易看到效果;
●要灵活,不要“一根筋”;
●使用一些能实现ITIL流程自动化的软件工具,特别是那些集成了事件管理和变更管理的工具;
●尽早找到一些有经验的人来负责ITIL的培训和流程的改进;
●承认ITIL是一个要持续多年的工作。
成功案例
1宝洁:提高客户满意度在实施ITIL之前的宝洁公司里,如果服务器宕机了,IT人员要马上要找出故障原因,这是非常自然的一个事情。为了找出故障的最根本原因,他们要进行事故原因分析,并找出解决问题的办法,最后让服务器重新运行起来。而问题在于,这期间用户只能等待,等邮件服务重新恢复工作,等到重新看到所需的报表,这个过程可能要1个小时,也可能要更长时间。现在,由于有了ITIL,宝洁公司可以在几分钟之内马上让服务器重新运行起来,为用户提供所需的服务。随后,在进行事故原因分析,而这个过程用户也许根本就看不到。
“用户等待系统恢复的时间大大减少了,”宝洁系统安全经理KevinMcLaughlin说,“实施ITIL后,也许最初阶段出现问题的数量减少得并不明显,但是,用户的感觉完全不同了。ITIL帮助IT部门提高了用户满意度。”提高用户的满意度正式ITIL的核心内容之一。这个有关IT服务管理的方法和最佳实践的集合从上世纪80年代问世以来,迅速得到普及。宝洁是美国较早接受ITIL的公司,它在6年前就开始按照ITIL的原则来改进IT服务了。宝洁从ITIL的10个最基本核心流程中的事件管理和配置管理开始着手,接下来又实施了故障管理、变更管理和帮助台管理。在此过程中,宝洁把大多数IT服务工作外包给了惠普公司,现在ITIL在这两个公司都得到了应用。McLaughlin说,惠普能得到这个外包合同与他们使用了ITIL有很大的关系。
2美国五三银行:控制风险位于辛辛那提的美国五三银行(FifthThirdBank)是美国9大银行之一。它于1年前从ITIL的事件管理、配置管理、变更管理开始引入ITIL。在此之前,该银行也曾考虑别的质量控制框架,例如以审计为重点的Cobit和美国联邦财政研究院检查委员会推出的运营标准等。“我们认为要达到我们的目标,ITIL是最合适的,”五三银行负责服务管理的副总裁EricStrunk说。当时,该银行针对软件、硬件和基础设施分别制定了流程,银行的管理层希望ITIL将能给他们带来一个统一的视角,Strunk说。“2004年,我们一共进行了3000多次修改,”他说,“每一次的修改会带来什么样的影响?我们需要一种更好的管理办法。作为银行,我们的核心工作是要控制风险。”为了快速地确定系统崩溃的原因,银行还希望在事件管理和变更管理之间建立更紧密的联系。“这可以缩小我们的搜索范围,帮助我们更快速地找到分析和解决问题的人。”Strunk说。他还希望分析修改的数量与系统崩溃的频率和时间的关系。他说,银行现在正在制定一些指标,用来计算在ITIL上的投资所带来的回报。ITIL的倡议者说,确立指标是保证所有改进服务质量工作获得成功的一个关键。“从一开始,就要引入一些指标,”一位ITIL领域的研究人员建议,“有人问你从某个时间段以来做了哪些工作?如果你不是从一开始就有了各种指标,回答这些话就会很困难。”
3EarhtLink:整合优势资源位于亚特兰大的互联网服务提供商EarhtLink公司的IT运营管理非常分散。两年前,公司的每个服务区域都有自己的IT服务级别管理流程。“单独看来,每个区域的IT人员实施的都是非常恰当的流程,”IT副总裁WillaFabian说,“但是,每个人都不可能从全局来处理一些事情。”让人感觉意外的是,每个服务区都拥有非常优秀的管理流程反而给实施ITIL带来了很大挑战,Fabian说,“这是一种文化上的巨大改变,‘我知道你在你的专业领域表现得很好,但是现在我们需要聚到一起,按同一种方式做事情。’”EarhtLink之所以能够克服预期中的困难获得ITIL项目的成功,与引入ITIL的初期,组织了公司40个“最有思想”的IT工程师首先进行试点有直接关系。最后,决定实施ITIL的并不是公司高级管理人员,而是来自那些参加试点的工程师们。Fabian说:“这是一个巨大的改变,后来工作遇到困难,我们就可以对他们说,这是大家自己的选择。”在正式开始ITIL项目后,原来各分公司的流程负责人成为ITIL的几个主要领域(如,变更管理、故障管理等)负责人,相应地各子流程的负责人成为公司各个服务部门的负责人。在ITIL项目的进行过程中,为了保证整个公司统一采取行动,这些人会定期召开会议。正是这种统一、协调的行动保证ITIL项目的顺利进行
|