指标量化IT服务管理
作者:丰祖军
为IT服务建立优质的指标,可以实现业务与IT更好的协调,并帮助企业达成目标。为了使业务目标与IT之间协调一致、帮助业务运营达标,并为实现卓越的IT运营提供战略推动力,在IT服务管理中需要运用一些指标。“指标(metric)”就是量度。在IT领域,指标对于不同的人可能代表着不同的意义。指标本身不是目的。指标是管理系统(ManagementSystem)的一个重要部分;管理系统对IT进行导向和控制,使其不偏离原定的方向。指标必须按照客户的要求来设计,必须依据一定的标杆,以确保它们是可以达到的;指标必须受到监测,以确保它们不超出预期的范围,一旦出现问题则要采取纠正行动。指标还是持续服务改进方案(ServiceImprovementProgramme,SIP)的对象,随着流程和服务持续地得到改进,对它们进行测量的指标也要随之提高。重要的是,要理解企业的目标是什么,最终做出的安排会保障所有的指标、监测和控制都协调一致地用于达到这些目标。
IT扮演三角色设计ITIL的目的是使IT与业务需求协调一致,这必须理解:业务目标、各个利益相关者的需要,以及IT为了帮助达到这些目标和提供所需服务而承担的角色。为了帮助企业了解其业务流程表现的如何,IT需要在三个方面扮演角色。首先,现今IT通常负责为业务流程提供财务、物流和其他直接服务。相应地,各种测量值通过管理报表提供给各个业务部门。另外,IT为服务目录(ServiceCatalogue)中所罗列的业务流程提供服务,其交付细节由服务水平管理经理(ServiceLevelManager)和业务客户之间的各种服务等级协议(SLA)来规定。这些测量值呈现为相对于关键绩效指标(KPI)而言的异常报告(exceptionreports),而这些KPI是以谈判所达成的SLA为基础的。这些报表中的趋势显示IT如何向高标准看齐,不断地改进其服务提供能力。
最后,IT本身是一个重要的业务流程,不包含IT服务应急部分的业务应急计划(businesscontingencyplan)是很少见的。因而,关于IT流程运维的报表是企业所必需的管理信息的一部分,这些指标是基于对IT服务管理流程的运维来进行测量。然而,这样的信息属于业务信息,详细的技术指标是不适宜的。IT流程的测量结果经过精简之后要能够以业务术语呈现。归根结底,业务测量指标都是货币量度,因而,IT的目的最终都是提供投资回报率(ROI)、运用投入资本回报率(ReturnonCapitalEmployed,ROCE)、经济增加值(EconomicValueAdded,EVA)或任何其他的表达。在清晰而恰当的指标被设计出来之后,更为重要的是清晰地呈现它们。诸如“平衡记分卡(balancedscorecard)”、“红绿灯(trafficlight)”和“仪表板(dashboard)”体系是实现它们的方法。不同的报告方式和不同的指标体系,其适应性因不同的受众(audience)而异。指标的名称同样重要,如果一项指标从一个报告期转变为另外一个报告期,这一点要体现清楚。如果流程不是以前后一致的、可重复的方式得到贯彻,那么这样的流程所生成的指标将是不可靠的。正如ISO20000所强调的,要想指标能够提供有用的测量信息,一个具有足够的成熟度和流程管理的健全的管理系统(ManagementSystem)应当成为企业行事方式的一部分。
合理的指标利于管控
当业务上的某件事情成为测量的对象时,尤其是这个测量结果成为一名经理和一个团队的责任时,被测量的人的行为将随之改变。如果指标设计合理,且这些指标的目的与业务要求相吻合,则行为将倾向于与业务需要相吻合。也就是说,一个设计合理、测量方式合理的指标是一种控制方式。如果一项指标设计不合理,与实际业务需要不吻合,或者测量的方式不正确,那么这个“控制”就可能把行为导向相反的方向,并损害业务的运行。
这样的例子不胜枚举,只举一例就足以说明问题。在英国,政府认定病人排队等待手术的时间长度是一个重要的指标。为了对此进行量度,政府认定了缩短排队名单的目标。结果是政府要求的行为如期出现:排队名单缩短了,目标也达到了。然而病人要做手术实际上还是要等待与以前同样长的时间。医院管理人员不允许病人进入手术等待名单,直到病人的手术被按照等待时间的目标值规划好。从而就出现了第二个非正式的等待名单,那些等待被允许进入待施手术病人队列的人在这里排队。这个例子表明一项测量指标的设计必须要做到对真正重要的对象进行测量。例子中测量的是手术等待队列。然而,更恰当的——很可能也更困难的——是测量病人确诊需要进行手术的日期与病人被施行手术的日期相隔的时间长度。所以,测量指标的设计是很重要的。
最后一个问题是没有对流程本身进行测量,因而,当医院管理人员发明出新的流程(等待进入待施手术队列的非正式队列)时,政府审计人员是无从得知的。许多企业遇到的另一个问题是无所适从。如果指标设计有问题,当然是要更改。然而,如果是为了解燃眉之急而更改指标——而不是精心设计指标,那么新指标也将被证明好不到哪里去。这就意味着需要再次更改这些指标。如果每隔几个月,指标就更改一次,那么谁也没有理由为了达到这些指标而努力工作。人们很快发现他们只需要等待指标被更改,从而就出现了一个新的不安定时期,在这个时期没有有效的指标,从而也不存在有效的管理控制。一个频繁更改测量指标的企业,可能比完全没有指标的企业还要乱。
另外,所设立的指标必须被认为是可以达到的,在业务上站得住脚,才能鼓励积极的行为改变。我们都乐意为达到我们认为有很大可能达到的目标而努力。如果我们因为工作做得好而获得认可,有时甚至只是口头的赞扬,我们也会更好地工作。如果我们被要求做一件不可能完成的工作,那么我们肯定会因为无法完成工作而受到指责。对于这种情形,人们的自然反应是予以放弃,或者只不过在表面上做一些努力的样子。
沟通、沟通、还是沟通
沟通是IT服务管理的一个关键部分。如果各利益相关者通过测量指标而获得信息,他们可以通过支持这种公开性和透明度以及对改进的关注来为企业的成功作贡献。这要求各利益相关者都有必要参与IT的界定,并满意于其积极参与所看到的结果。沟通是一个双向的过程,因而要综合各个利益相关者的要求,并使他们自始至终地参与,以求服务交付(servicedelivery)和流程运行的改进。为了把这件事情做得妥当,具体行动时就要精心构建一个沟通计划,并在其完成与评估的过程中寻求各利益相关者的协助。在设置IT服务管理指标时,涉及到的利益相关方包括客户、使用者、员工、董事会、其他利益相关者(例如政府、股东)。
就客户而言,一般是指一项服务的购买者,无论其是内部购买者还是外部购买者。在此,我们指的是业务的最终客户。归根结底,所有的业务努力都应当指向最终客户。IT为业务流程提供支持职能,但有时IT的贡献为企业所体验的同时,也为客户(最终客户)所体验。在这些情形下,为了确保对企业做了有效的贡献,企业必须测量所有最终客户的满意度。然而,这项测量必须敏感地对待。如果我们对客户的调查太过频繁,这件事情本身对客户来说将变成一个负面因素。如果我们不以一定的频率征求有关我们做得如何的意见,则存在长期不知晓的服务事故(以致足以严重地影响客户满意度)的危险。从使用者方面看,由于使用者不参与服务条款的谈判,也不为此支付费用,因此他们不是IT的直接客户。
然而,作为利益相关者,他们对服务的满意度是至关重要的。如果使用者不满意提供给他们的劣质服务,最终我们的客户也会不满意。IT部门内部的员工有交付服务流程的责任。他们也是利益相关者之一。相应地,IT部门有责任提供良好的工作条件,包括公平的考核与报酬。如果员工感到不满意,无论测量指标规定得多么完善,所提供的服务也将低于应该达到的水平。因而,IT部门的管理者有责任衡量员工的士气,并对可能对士气造成负面影响的变化保持敏感。当员工感到作为一个利益相关者得到认可时,他们会更加高兴。除此之外,他们需要能够对公司产生身份认同感,而这出于对企业的尊敬和对流程的认同。向员工清晰、公开地传达测量指标,能够让他们理解IT在哪些方面做得好,在哪些方面存在问题,需要进一步努力。有效的沟通能够使员工发现和解决问题,并鼓励他们进一步努力。作为利益相关者的管理高层和董事会有着特别的需要。
为了企业的发展,他们需要对任何可能造成严重后果的事故作出预警,以便采取紧急的纠正行动。与董事会之间开放而透明的沟通,有助于及早发现这些事故,以免变得难以收拾。好消息对于董事会来说也是重要的,可以在公司的内部和外部传播好消息,以提升其口碑。例如,达到ISO20000,就应当成为董事会自豪地向外宣称的一个成就。
指标与SLA、KPI
业务部门,即客户,与IT之间的协议,是经由服务级别管理员谈判而达成的,其结果是一套明确的服务水平协议(SLA)。这些SLA界定了IT同意提供怎样的服务水平。这些SLA被服务水平管理员用来制订运营水平协议(OLA),如果涉及第三方,还要据此制订使得服务的交付成为可能的支持合同(UnderpinningContracts,UC)。IT的关键成功要素(CSF)由OLAs所界定——如果你以自下而上的眼光来看待它。如果某项OLA被达到,相应的CSF也将得到满足——如果这两者之间匹配良好。实际上OLA由SLA衍生而来,后者依赖于CSF,因而,在范围上是超越某个特定的OLA的。不过,对于组织的某个成员来说,CSF可以被视为OLA的目标。CSF是对服务交付(servicedelivery)的量度,必须得以满足才能符合SLA的要求。因而,每一个CSF都可以被用来定义一个关键绩效指标(KPI),后者是对是否达到CSF的一种量度。另外,KPI提供了一个面向客户的指标,它量度与客户共同界定的服务等级协议的成功程度。
这使得IT管理能够每个月知道其工作的优劣状况,然而对于采取措施来说则为时已晚。汽车的仪表盘告诉你油箱已空是没有什么用处的。你需要仪表盘告诉你油箱里还剩多少油,以便在油用尽之前就把它加满。同理,IT管理应当拥有测量手段显示部门每一天或每一个星期的运行状况如何,以便在SLA受到损害之前就采取纠正行动。这正是流程指标(processmetrics)的用武之地。ITIL的IT服务管理方式以对客户的服务来定义交付(delivery),所以说,KPI是服务交付的恰当测量手段。然而,ITIL在流程的层面对IT各个部分的运营进行了定义。每一个这样的流程都可以被视为一个引擎,它接受一定的输入,进行处理之后输出,如图一所示。它显示了部门之间和/或流程状态之间的流程进程对指标的贡献。该图还显示了流程与内部以及外部的利益相关者之间的协调一致性。对于IT来说,蓝色代表属于内部的流程和组织,黄色代表外部的联系和部门。从图中可见,流程责任人为了能够控制过程的运作以达到其目标,制订了流程KPIs。这些KPIs每天或每小时进行测量,阀值被触发则决定升级以采取纠正行动。然而,每一个流程与其他ITIL流程一起工作时,对其进行管理的一套指标要能够报告给IT管理和其他的利益相关者,以便其对不同的IT流程的运行进行比较。仔细地选择和量度图一中所示的流程指标,使流程管理对流程责任人(有时还包括负责流程的团队)的测评成为可能。这些指标包括流程责任人所使用的某些KPIs。然而流程责任人需要使用的指标往往更多一些,以便更细致地了解流程交付(processdelivery)的日常变动情况,从而使管理更加到位。
|