×

微信扫一扫,快捷登录!

南方航空计算机中心ITSM系统的建设  


[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放

[p=30,2,center]

[p=30,2,center] 微信图片_20231122154235.png





本案例由南方航空计算机中心朱琳提供,并获得南方航空计算机中心授权发布。

项目背景

中国南方航空股份有限公司是目前中国最大的航空公司之一,拥有多家分公司,公司目前员工数量32000多。目前航空业的大部分业务都依赖于一个稳定高效的IT支持环境,南航的IT建设在各大航空公司中是最完善和齐全的,拥有十多个个大系统和许多小系统,计算机中心员工达到200人,拥有多个机房,南航计算机中心数据部负责所有核心服务器的管理。

公司全部的生产经营和日常运作已经和计算机信息系统息息相关,IT服务的质量已经影响到公司运作的方方面面。

南航目前拥有了大量的业务支撑系统,大大提高了南航的IT管理水平和提高了效率,但是在目前的手工和半自动化管理现状下,无法达到确保IT系统的稳定运行和快速响应;同时,维护经验和知识积累在个人手中,而没有形成知识共享,同一个问题会被不同的人员重复研究去解决,浪费了大量的时间;另外,日常维护工作复杂性很高、可变性高,没有形成标准规范,故障问题有时候因为个人的疏忽而导致没有后续跟踪处理。

为了解决这些问题,形成一套完善的管理机制,数据部急需寻找一个基于自身环境和资源下的IT服务管理系统,运用一套完善的管理体系和支撑系统形成高效的IT服务集中管理。

项目的目标和范围

在项目启动时,通过对ITIL的研究和理解,也了解实施ITSM的案例后,确定了以下几个明确的目标和范围:
*改善IT基础设施的运维水平,针对内外部客户提高事故和问题处理的响应速度
*集中各个单点信息,形成统一的信息库和知识库,并可以进行各种统计分析
*对软硬件、网络等资产设备进行的管理,跟踪企业IT资产在每个管理周期内的变化
*可以对企业的各种IT资源(主机、网络、应用软件、基础软件等)全面、统一集中管理,确保IT系统为企业业务发展提供可靠、高效、安全的信息服务
*和现有网络管理系统进行集成,自动接收其产生的事故并进行及时处理
*从公司战略角度慢慢实现服务级别管理、能力管理等目标

项目实施过程

由于项目建设涉及到多个环节和系统,整个项目主要由杰傲科技和客户方相关人员进行主体设计和开发实施工作;翰纬咨询进行ITSM/ITIL理论指导和顾问工作;

因为系统和南航现有的Unicenter网管产品结合紧密和事件集成,有CA公司的专业技术人员参与顾问指导。

南方航空原有CA的系统(CAUnicenter),此次实施和改造并不是完全模仿ITSM各模块的形式,而要根据ITIL思想,结合实际情况,进行重组融合。其中,研究企业本身的业务需求,审视自身的资源配置,调整自身的组织架构和进行流程定义,是系统实施的关键部分。

事故管理和服务台,是见效最快的几个流程,可以首先实现。其它流程可以根据自身需求,需求的级别,以及企业自身的资源和组织架构状况,进行取舍;并依据具体的业务习惯,进行定制。

在实施过程中采取以下过程和方法论
*分析评估:分析当前IT环境、资源、管理方式的当前状况,以及管理意识和水平,收集未来对IT系统和服务水平的要求系统设计:根据当前状况和未来需求,根据ITIL理论设计一个成熟的符合未来需求的ITSM系统,以及与之适应的组织结构
*系统规划:根据目前最迫切需求、效果最好的方式,分阶段实施的方式制定具体计划
*实施部署:根据设计和规划,在各部门进行系统实施和部署
*持续优化:在后续过程中,根据使用进行阶段性分析总结并调整系统达到最优状态

整个项目实施过程分成以下几个重要环节,作为一个完整的IT项目,传统的项目管理理论一样适用,但是在此之外,需要特别注意以下四个环节的阶段性目标,同时采用分步实施的方式以确保项目组成员可以跟随实施过程熟悉ITSM/ITIL相关理论。
*现状分析:分析现有IT部门情况,找到了目前效率不高、服务没有标准化、无法提供有效的量化数据进行分析决策、各人经验集中在自己手中等问题
*角色定义:针对实际管理需求,设置了一线、二线、值班经理等角色,以及不同角色对应需要掌握的技能和工作职责;以及各个角色之间如何协调,从而从行政和组织结构上明确了各自的工作职责和目标,这个是ITSM/ITIL系统实施成功的保证
*流程定义:针对日常维护的设备、问题、不同角色之间的协作方式,确定了事故管理、问题管理、变更管理、配置管理等几个流程的流转细节和不同角色之间的协作模型,从而确保业务环节流程化,把无序的救火变成了有序的预防管理,也在流程中慢慢体现了ITIL理论的优点,各个角色岗位发挥出较好的效率
*软件开发实施:在角色、组织结构、基本流程确定后,利用软件从技术角度固化流程和实现必要的支撑系统,从而让管理思想和流程可以沉淀为一个流水线,进入高效运营状态

在实施系统过程中,针对ITIL各个流程的具体实施过程和效果如下。
*服务台管理:提供统一的Web入口,维护人员可以通过服务台进行事件/故障的查询、人工录入、转派、处理、跟踪等操作。
*事故管理:把网络故障、主机故障、数据库事件、安全事件通过自动触发方式进入事件数据库,人为添加的事件也一并进行处理。事件分级分类,IT人员可以迅速定位和根据历史信息、知识库找到处理的方式和建议,对于确实存在的问题转入问题管理流程。
*问题管理:在一线、二线、经理之间建立一个问题处理流程,并进行跟踪;可以井然有序的管理所有出现的问题。
*变更管理:对于有些设备和服务器确实需要进行设备更换、硬件升级,软件安装等变更的事情进行系统记载和追踪。确保每次变更都是记录的,经过恰当的审批的。
*配置管理:通过UnicenterAMO资产管理模块自动收集了全部设备和安装软件清单,在此基础上添加许多业务管理需要的但是管理软件不能收集到的设备数据,加上手工对部分存储等设备进行处理,并通过机器名增加配置项(各种设备和信息之间的逻辑关系),使得资产和设备等的管理清晰化,符合用户的管理习惯。

项目实施效果

系统建设后,基本达到了开始的预期目标;以往,不到10个系统管理员需要管理南航如此数量多的服务器,以及需要向这么多业务部门提供业务支撑和服务,所有的技术人员基本上经常处于高度紧张的状态,服务质量也无法得到保证;现在,通过实施服务台管理,工作效率和服务质量都得到了大幅的提高,以前紧张而混乱的局面再也不复存在了。

实施服务台管理,具体达到了以下这些效果:
*提高了工作效率:IT人员加强了对组织结构的认识以及基于流程的处理方式,让不同角色的人员很清晰的认识到了自己的职责以及如何和其他人员协作,将原先以工作内容分工的方式替换为以流程为主线;通过流程的优化和角色、职责划分,显著提高了效率,通过流程规范不同角色和人员从事各自擅长的工作,分工又协作;从而大大提高了工作效率和服务质量,以及协助形成规范化过程。
*提高了服务质量:将用户所报故障,管理软件收集的系统,数据库,安全,应用软件事故集成到服务台,分级分类,在处理的全过程进行跟踪监控,使IT服务处在可控的状况下。所有服务和处理被量化记录,降低了重复处理问题所浪费的时间,同时还可以对每个人处理事情的能力进行量化评估;管理员借助服务台系统不再担心问题没人处理,因为系统会在适当的时候进行提示,确保了服务质量。
*提供了大量的分析报表:以及提供可以自由定义的报表工具,可以轻松的制作和生成曾经需要多人工作多天才能制成的报表,现在可以做到随时“按需提供”了;系统主要提供了以下一些报表,用于管理和分析使用:
*机器性能报表:可以通过性能报表分析一个阶段内机器/数据库的性能如何,从而决定下阶段是否需要添置设备、调整业务峰值点、寻找故障和性能瓶颈是否有关联关系等
*资产清单报表:快速获取资产清单
*不同阶段资产变动表:可以获取一个阶段内的资产设备变化情况,在此也是配置管理中的配置项的变化
*故障分析报表:从时间、故障类型、分布机器等进行故障分析,从而预测故障产生的情况和进行避免
*人员工作量统计表:从时间和工作量角度量化数据
*节省了IT投入成本:可以在大量的历史数据中对一段时间中的故障、设备、处理情况等进行分析和挖掘,从而获得大量有用的决策信息;节省了IT投入成本;
*为业务提供了一个可靠高效的IT环境:IT管理部门人员从“救火员”变成了“保健员”,不再处于一个高度紧张的状态,整个IT系统在可控制和规律的情况下得到了集中管理和维护,为业务提供了一个可靠高效的IT环境。
*实现知识共享。系统实施前,维护经验和知识积累在个人手中,而没有形成知识共享,无法借鉴其他人的处理经验;系统实施后,重点问题进入知识库,成为了公司而非个人资产,可以在所有相关人员之间进行知识共享,提高了解决问题的效率。

经验和教训
1.项目成功的关键因素

项目组成员深入了解ITIL理论,并结合实际情况进行合理的分步实施,确保全体团队成员基本熟悉ITIL基本流程规范;

把握每个流程的优先级顺序,首先是事件、故障,然后才是配置管理流程,在流程实施过程中,人力/角色的清晰远远大于系统中的流程支持;

在重视系统建设的同时,同样重视组织结构和流程的设计,从而确保技术和业务流程、人员都得到同样的提升,最终才能实现一个集中高效的IT服务管理体系,从整体上提升TI部门和企业的管理效率和服务水平。

在项目过程中,系统管理员和项目经理进行充分的配合,从而可以更快的去解决遇到的问题;在实施过程中遇到了各种技术难点以及业务和技术要求之间的矛盾,项目组通过对相似案例的研究以及项目组成员的探讨,同时参考ITIL规范中的一些建议去获得最终解决方案。
2.项目实施过程中的经验和教训

通过这个相对不是很复杂的ITSM系统建设,充分认识到理论和方法论对系统建设的重要性;也不能为了系统而建设系统,需要时刻关注系统建设的核心目标是:做到技术、业务、服务结合,达到在IT服务管理方面的目标。
ITSM一方面是技术,但更重要的是管理,在变革的过程中会有平衡。项目的建设不要贪求大而全,全面实施所有的流程,而是要针对具体IT环境,业务环境,组织环境,分析哪些流程是实施后具有现实成效的,是在现实的管理环境下能够产生效益的。

对于ITIL中的服务支持相对容易实施,但是服务提供部分需要经过严密的考虑和分析设计后才能达到预期的目的,从而使整个项目走向成功。
声明:凡注明CIO时代网(www.ciotimes.com)之作品(文字、图片、图表),转载请务必注明出处为CIO时代网(www.ciotimes.com),违者本网将依法追究责任。




上一篇:【版主专栏】学贯今日 致胜未来 ——社区来帮你!
下一篇:IT服务管理 基于ITIL的全球最佳实践(中文版ITIL导论)下载
daisy8

写了 1530 篇文章,拥有财富 19417,被 90 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies
daisy8 发表于 2013-2-28 15:46:33
jesnzhou 发表于 2013-2-28 15:38
顶一下,顺便问一下,你是翰纬滴人?

不是,怎么了?
jesnzhou 发表于 2013-2-28 15:38:37
顶一下,顺便问一下,你是翰纬滴人?
Powered by IT 运维管理
返回顶部