[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放[p=30,2,center]
[p=30,2,center]
高可用性在ITSM中有两个重要的考核指标:故障时间和系统恢复时间。狭义的定义是:计算机系统的可靠性,即尽量缩短因日常维护操作和突发的系统崩溃所导致的停机时间。广义上它还包含了响应速度、服务质量和数据安全等方面的内容。可以看出广义的定义已经将可用性管理提高到非技术层面。
可用性管理不是简单的技术活,这个认识早已随着ITIL的普及逐渐为人接受。在大量投资IT基础设施期望提高IT产品可用性没有取得理想的效果后,ITer开始反思哪里出了问题。孤立看待IT产品的可用性是最初认识到的问题所在。依据标准管理流程来寻求人为的反应速度以提高系统的可用性成为日后ITer改进的出发点。组织流程调整、员工计算机操作规范、行为记录、明确权责等管理改进或加强的内容被提上工作日程。相比于组织流程的调整,其它几项内容更多要求的是执行到位。
维护系统高可用性体现在IT的多个环节,甚至可以说是各个环节。不是“就事论事”的修正单点故障,这不能从根本上降低再次出现故障的可能。ITIL提到PPT也可以看作是分析和改进系统高可用性的三个维度。怎么控制人的作为不成为可用性降低的因素,怎么完善组织的流程以减少管理带来的系统可用性降低,以怎样的工具来提高系统的可用性。
总之,可用性虽然体现出来的只是那几个指标。但真正管理的是指标背后的综合因素。
|