实现ITIL“意外事件管理”的重点要素
学习资料:IT运维管理社区专家讲堂直播300期视频回放
2006年,Opsware公司的营业额是一亿多美元。如果有公司打算收购Opsware,按照一般的做法,大约需要付出营业额4"5倍的金额即可。但是,今年7月,HP以16亿美元收购了Opsware,这是为什么呢?Opsware首席技术官TimHowes向解释说:“因为Opsware具有独特的技术,而这些技术正是HP所需要的。”Opsware公司的名字是Operations和Software的组合,从组建伊始Opsware就将自己定位在要通过自动化的手段完成大型企业和网站所要求的IT系统及数据中心的一系列建设和运维流程,提供高标准的IT服务。Opsware已成为IT自动化领域的领导厂商,提供针对大型IT系统的全面运维管理自动化解决方案。
Howes说:“大多数IT运维做到一定水平的组织已经发现,运维系统的上线虽然在一定程度上改善了运维的反应时间,并建立了标准的运维流程,但也带来了一个很大的问题,那就是众多的事件和流程要求大幅提升了工作量,而且这种繁琐复杂的工作量的提升规模几乎无法靠增加运维人员的方法来解决。以今天IT系统的规模、复杂度和流程化、标准化的要求,自动化已经成为IT运维部门的必然的选择。”
Opsware的IT自动化解决方案为IT运维主体(即IT运维团队)提供了5个“机器人”产品,分别是:服务器运维操作机器人、网络运维操作机器人、存储运维操作机器人、应用系统画图机器人和流程调度管理机器人。这些机器人具备运维操作和流程调度的能力,从而可以为IT运维团队提供一个运维操作的平台,帮助运维团队自动化地实现大量配置收集和管理、变更执行和记录、系统/补丁和应用的安装卸载、日常配置检查、合规审计等工作,同时可以对运维人员所做的所有日常维护工作进行记录和审计。
另外,Opsware的解决方案对实现ITIL也有重要意义。像HPOpenview、IBMTivoli等网络/系统监控软件在“意外事件管理”方面往往只做到了了“监”,而没有做到“控”。也就是说,IT人员可以通过上述软件看到发生了什么故障,甚至可以了解若干故障之间的关联和受影响的业务等,但是解决这些问题还是需要运维人员手工的操作,这就使得运维的效率出现了“延迟”;如果故障数量太多,超过了运维人员的处理极限,哪怕是很小的、很容易解决的故障,都会因为延迟累积而放大故障效果,直到影响业务的正常运转。因此,一个自动化的运维平台对于实现ITIL“意外事件管理”是至关重要的。
为了三千积分! 鼎力支持!!
页:
[1]