蓝蓝 发表于 2011-8-9 17:13:00

ITIL在数据中心运维中的应用

学习资料:IT运维管理社区专家讲堂直播300期视频回放





ITIL在数据中心运维中的应用

ITIL是一套以流程为基础、以客户为导向的IT服务管理框架,这与传统的IT系统注重技术管理的弊端,实现从技术管理到流程管理,再到服务管理的转化,是以客户的需求为出发点,为客户提供高效率、低成本的IT服务为目标。写本篇文章的出发点在于结合工作中的经验,梳理工作中运用到的流程,ITIL不是一个标准,是以最佳实践的类库,一百个公司有一百种的用法,描述各个流程之间的关系,以及实际应用中工作输出的文档,做一下总结。在以往公司的实际应用中,有些流程则是以工作流的形式固化在IT系统中,有些则不是,而是一些文档形式体现在工作中,比如服务级别管理。ITIL十大流程和服务台构成了整体框架。
图1ITIL的总体框架

这个框架左边是业务,右边是技术,ITIL也与其他的流程标准CMMI和Cobit相融合,业务视角也可以理解是业务驱动,根据客户的需求驱动,这个业务的实现则是通过中心的服务管理达成。服务管理包含了ITIL的十大流程以及服务台,服务提供有五个子流程,分别是服务级别管理,可用性管理,持续性管理,能力管理,财务管理;服务支持包含了事件管理,问题管理,变更管理,发布管理,配置管理。ICT基础架构管理,是一切IT应用,IT服务的基础,包括机房的建设。所有的设计不能缺少安全方面的考虑。上面的IT服务管理实施规划,则是高层根据现有的硬件资源,所具备的技能水平,成本,需求管理各方面综合对IT服务实施各时期规划目标。右侧技术,是构建ICT基础架构应用所具备的哪些技术。应用管理就是部署在生产环境中的各类应用,办公应用,邮件系统等。这十大流程之间是怎么样协调关系,在下面做更多的叙述。

服务台

服务台是直接与客户沟通的平台,是IT服务支持的一部分。与呼叫中心是不完全相同的概念,服务台包含了呼叫中心的接听电话与的功能,能识别问题的级别,同时具备问题的跟踪与监控,参与服务级别的管理。问题登记之后,工作人员会根据SLA(服务级别协议内容)监控问题直到问题关闭。服务台具备接听电话与问题登记的工具,以及熟悉服务级别的内容。以前公司的用户有VIP与普通用户的区分,电话邮件技术支持和现场支持,当然技术支持的活就不是呼叫中心的事了。

事件管理

事件是由于服务中断或服务质量下降,引发用户反馈,主要是由服务台接听用户电话触发流程,询问性的问题或是简单的问题,在服务台终止,有些问题需要由服务台转移到一级二级技术支持人员解决,不同类别找到相应的技术人员,技术支持人员要在SLA承诺的时间和要求范围内提供解决方法。服务台工作人员监控整个流程的始终。事件管理流程过程中需要对系统软件、硬件、网络、应用系统等做变更以实现问题解决时,触发了变更管理流程。

问题管理

如果说事件管理是,问题管理则是解决RootCause的问题,解决根源问题。如果事件管理是由用户触发的或是机器本身出现异常,问题管理则通常是由技术人员触发的。事件管理是如何产生出问题管理,通常在技术支持过程中,有些问题是有完备的解决方法,一些长期重复的问题,这种问题可能是由于容量出现了问题,需要扩容解决,或者是多方面因素,这时应该启动问题管理流程,立项,成立讨论小组,领导审批,相关部门跨部门协作解决问题。问题管理是由技术人员触发,立项提出解决方案,触发变更管理终止。

变更管理

变更是指,对已批准构建或实施的或已在维护的硬件、软件、网络、应用系统、环境以及相关文档所做的增加、修改或移除。变更管理的目的是要确保在IT服务变动的过程中能够用标准化的方法,有效地监控这些变动,以降低或消除因为变动所引起的问题。这里的“变动”是指一些在IT基础建设项目上的动作所造成一个新的状态;所有在配置项目上的变动都必需纳入变更管理的控制范围。变更管理不仅要求找到解决问题的方法,更需要变更IT基础设施,以从根本上解决问题或事故。

发布管理

发布管理流程从全局的角度监察IT服务的变化,并确保经过完整测试的正确版本得到授权进入正式运作环境。发布管理设计和实施有效的程序来分发IT系统的变更,保障所有软件模块的安全性,确认所有的最终软件库中软件是安全可靠的。同时发布管理还要结合变动管理,准确发布确切内容和首次发布计划。

配置管理

配置管理主要就是CMDB库,包含了各种CI(配置项)的信息,有状态信息,版本信息,变动记录,关系信息,也就是数据中心的所有资源管理库。工作人员可以查询硬件机器的信息,或者系统服务器,应用系统的信息,相应的技术人员信息,各部门流程协调工作。信息的查看和更改有设置权限。是事件管理,变更管理和发布管理的基础。

服务级别管理

关于服务级别管理,在以往的经验,是通过两份Excel文件实现,一份是SLA,一份是OLA,SLA是公司领导与客户签署的协议,许诺服务质量,包括哪几类应用,应用中断时间的,通常都是百分之九十九点九九,也就是持续性和可用性等方面各个指标的规定,不同的数据中心在这方面还存在差异。还有问题级别管理,是根据问题类型,影响范围人数和对业务造成的损失计量,制定出问题的级别。OLA是企业内部不同部门工作人员之间签订的协议,各部门共同承担支撑SLA实现。对于企业的IT部门而言,SLA就是IT部门与公司的协议。

持续性管理

IT服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的流程。它包括:灾难恢复设施的需求分析、灾难恢复计划的制定、计划的更新、测试的执行以及必要时进行实际的灾难恢复等方面。持续性管理主要通过确保服务运营所需的IT技术和服务设施能够在要求和约定的时间期限内得到恢复,为总体的业务持续性管理提供支持。持续性管理的具体应用通过公司的灾备设施,备份恢复部门,在出现断电不良天气时,以最快的速度恢复系统的应用。

可用性管理

简单地说,可用性管理是在正确使用资源,方法及技术的前提下,保障IT服务的可用性。当企业营运越来越依赖IT,为了维持竞争力,IT必需避免或减小预期外的当机时间。可用性管理在深入探讨那些资源和测量是维持最佳营运状态所必要的,希望能让资源的使用最有效。该流程确保IT服务的设计符合业务所需的可用性级别;对实际的可用性、可靠性以及可维护性进行测度和监控并提交相应的报告以确保有关协议目标的实现;优化IT基础设施的可用性并为改进服务绩效提供建议;减少某段时间内事故对IT可用性的频度和时间。

财务管理

该模块主要用来全面核算IT服务运营成本,并按照向客户提供的服务项目进行分摊,同时为管理层提供IT投资决策所需的详细资料;还用来对支持IT服务运营的IT资产和资源进行成本效益管理。IT服务财务管理的主要工作包括:预算、会计、收费和报表。

能力管理

能力管理的目的主要是调整营运需求和IT资源的平衡。简单地说,能力管理是要确保在合适的时间合适的地点以合适的成本提供合适的资源。该流程用来分析当前的业务需求和预测将来的业务需求,并确保这些需求在制定能力计划时得到充分的考虑;确保当前的IT资源能够发挥最大的效能,提供最佳的服务绩效;确保组织的IT投资按计划进行,避免不必要的资源浪费

红儿 发表于 2011-8-9 17:13:00

欢迎拍砖!!!

麦迪逊 发表于 2011-8-30 20:12:00

ITIL几个流程写的蛮清楚的,只是数据中心只出现了2次,ITIL与数据中心的结合点太少。不过还是要支持一下。

解放 发表于 2014-4-19 13:21:11

LZ帖子不给力,勉强给回复下吧

濮真 发表于 2014-4-19 14:05:43

跟大家交流一个ITIL的概念吧:ITIL培训报名时IT服务人员为参加ITIL培训而通过电话或者互联网的模式向培训机构进行报名,IT运维管理社区通过不定期的组织ITIL培训报名来组团进行培训,从而为培训人员节省一定的费用,同时IT运维管理社区通过每周四的ITIL讲堂进行ITIL知识的传播,为广大IT服务人员服务。
页: [1]
查看完整版本: ITIL在数据中心运维中的应用