[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放
[p=30,2,center]
各位朋友,先锋小编为你们选了一篇很好的文章,欢迎讨论!
案例简介
安徽移动经过几年的信息化建设,已经建成了统一信息平台Portal、OA、MIS等多个应用系统。企业各个业务所需要的应用系统,极大地提升了企业的信息化水平,提高了工作效率,基本实现了无纸化办公。随着应用系统越来越多、越来越深入,员工的日常工作已离不开这些应用系统,应用系统的运行状况直接影响着员工办公、企业生产,因此确保应用系统的安全、可靠、稳定地运行成为系统维护部门越来越重要的问题,尤其是员工日常办公必需的OA系统。目前安徽移动的OA系统已经运行三年时间,采用LotusDomino平台,供全省5000名员工办公使用。在OA系统维护工作中存在着如下问题:1.系统需要人工监控,维护量巨大,并且无法一一监控到位,同时不能做到持续地实时监控。·忙于应对已发生的故障,被动响应式的工作方式,解决故障的效率低。2.LotusDomino无故宕机,很难及时发现和预见问题的发生。3.问题出现后,很难快速、准确地找到根本原因。4.问题找到后,缺乏流程化的故障处理机制。5.支持过程总是被打断和干扰。6.缺乏过程和变化的跟踪记录,如系统运行状况、主机配置变化、应用模块变更等。7.不能及时地统计、分析系统状况,供领导决策。结果造成维护部门在出现问题时疲于应付、导致维护工作的满意度较低,这些问题一直困扰着IT维护部门。维护部门迫切的希望改变目前的这种状况。为了解决以上一系列问题,真正实现IT服务全过程一体化,包括管理、监控、统计分析等,并通过组织、流程和制度的完善以及相应的技术设施的建设来支撑和保障IT部门的整体服务水平,我们为安徽移动用户提供了基于MochaBSM产品的应用监控解决方案。
用户名称
安徽移动通信有限责任公司
用户类型
电信
用户简介
安徽移动通信有限责任公司是中国移动(香港)有限公司全资子公司。安徽移动于2002年7月1日在香港及海外上市,企业性质为外资企业。公司下属17个市级分支机构、61个县级分支机构。公司经营范围是在安徽省经营移动通信业务,包括话音、数据、多媒体等。如:IP电话及互联网接入服务。从事移动通信、IP电话和互联网等网络的设计、投资和建设。移动通信、IP电话和互联网等设施的安装、工程施工和维修。经营与移动通信、IP电话和互联网业务相关的系统集成、漫游结算清算、技术开发、技术服务、业务、设备销售等。出售、出租移动电话终端设备、IP电话设备、互联网设备及其零配件,并提供售后服务。
用户需求
- 实时监控主机、LotusDomino平台、OA应用、邮件应用等基础设施、应用等IT资源的运行状态、性能和可用性。
- 当监测到系统故障时,快速定位故障的主要原因,估算系统事件对业务的影响及其严重程度,并触发相应的故障处理流程。
- 故障处理流程通过整合OA系统来实现,以短信提醒、待办待阅的报警形式实现系统流程的自动化。
- 简单操作的系统管理配置,方便地配置所监控服务器的信息,应用数据自动获取。
- 系统将根据服务级别协议(SLA),为客户方便地定义符合其需要的各种指标阈值,通过具体的数字来量化地评价服务响应速度、故障修复时间等IT服务水。
- 通过门户系统可以进行统一整合,实现单点登录SSO、统一授权和访问控制、集成展现和个性化等功能,使系统各模块之间实现无缝的协同工作,给IT服务经理、系统管理员、应用管理员等不同的用户群体和角色提供了可视化的工作平台。
- 提供了丰富的报表,提供了统计报告,提供了资源或指标走势,用以辅助分析和决策。
技术路线
产品概述
摩卡业务服务管理(MochaBusinessServiceManagement),简称MochaBSM,整合了系统管理、监控、工作流、统计分析和门户等多种技术,是对ITIL的IT服务管理核心流程的实现,是一个实用、可扩展的技术解决方案。
MochaBSMLotusDomino应用监控是一个专门针对LotusDomino系统提供监控、故障定位、统计报告等功能的组件。
该产品主要具有以下功能:
- 提供面向“服务”的,整合网络、主机、应用、服务等各层面IT资源的、统一的IT服务管理信息视图。
- 实时监控OA系统的运行状态,及时发现问题。
- 告知事件对企业影响的严重程度。
- 准确、快速地定位故障产生的根本原因。
- 根据严重程度和优先级别,触发相应的处理流程。
- 提供统计报告和分析图表,为领导层提供决策依据。
功能描述
安徽移动OA应用监控系统是基于MochaBSM产品,该产品为安徽移动提供了统一的、集中的IT服务管理平台。系统包括系统监控和报表展现、决策分析等主要功能。
系统监控功能
通过对OA系统的主机、平台、应用等方面的监控,实现了对OA系统在性能上、可用性上全方面的跟踪,能够及时发现故障、确定故障影响严重性并能定位故障根本原因。
主机信息监控:提供对OA系统所在服务器进行实时监控。
平台信息监控:监控LotusDomino平台指标信息直接决定提供服务的性能,从根源上管理平台可用性。
应用信息监控:多年经验汇聚提取OA应用层面重要指标,预防为主。
主机方面
监控运行于省公司、地市分公司的OA应用、邮件应用的六台UNIX主机,包括CPU、内存、硬盘、OS文件系统等运行状况的重要指标。
监控时间频度为5分钟采集1次(监控时间频度可以自行配置)。
平台方面
包括运行于省公司、地市分公司的OA应用、邮件应用的十二个LotusDomino分区服务。LotusDomino平台监控的指标主要包括:
应用平台
-AMGR(TASK)状态
-LotusDominoServer状态
-HA切换状态
-HTTP(TASK)状态
-HTTP活动线程数
-HTTP响应时间
-Web代理设置状态
-超时信号灯状态
-丢弃的会话数
-服务器1352端口状态
-个人Internet地址状态
-日志库Corruption信息
-用户Session
-宕机情况
邮件平台
-POP3(TASK)状态
-Router(TASK)状态
-SMTP(TASK)状态
-等待邮件数目
-死信数目
监控时间频度:对于部分监控频度要求较高的指标为5分钟采集1次、对于部分监控频度要求较低的指标1天采集1次(监控时间频度可以自行配置)。
应用方面
包括省公司、地市分公司在内的OA应用、邮件应用的监控:
- OA应用:包括省公司及全省十七个地市的共十八套OA应用系统,分布在四台服务器上。
- 邮件应用:包括全省5000用户的使用的邮件系统,分布在两台服务器上。
应用监控的指标主要包括:
-定时代理激活状态
-数据库存取控制Anonymous状态
-数据库大小
-数据库是否损坏
-数据库视图文档量
-数据库索引大小
-数据库文档量
-数据库增长率
-文档文本域值大小
监控时间频度:对于部分监控频度要求较高的指标为5分钟采集1次、对于部分监控频度要求较低的指标1天采集1次(监控时间频度可以自行配置)。
系统监控的其它功能点
- 对于性能指标超标、宕机故障,通过手机短信、邮件直接发送给OA系统的管理员、维护人员及其他相关人员,在报警信息中明确哪台主机、哪个LotusDomino分区、哪个地市的应用、故障发生的时间、初步定位的故障原因等重要信息,方便维护人员了解故障并及时解决故障。
- 实现了MochaBSM系统跟OA系统集成。对于MochaBSM中的预警、故障会直接触发OA系统中的预警流程、故障处理流程,这些流程会自动推送到OA系统相关人员的待办、待阅任务列表中。
- MochaBSM对OA系统的主机、平台、应用等各方面的过程和变化进行全面的跟踪记录,如系统运行状况、主机配置变化、LotusDomino平台配置变化、应用模块变更等都会自动记录到系统中,非常方便查阅这些动态信息,做到了可追溯,同时这也符合SOX法案的要求。
报表展现、决策分析功能
MochaBSM系统对监控主机、平台、应用等方面收集到的数据提供了各种直观形象的图表和报表展现,提供了统计报告,提供了资源或指标走势,用以辅助分析和决策。
通过MochaBSM提供的查询、统计功能、分析功能,安徽移动客户可以统计1个月以来发生的故障次数以及解决故障的时间等等,作为提高维护质量的基础数据。
MochaBSM能够根据历史数据对未来趋势进行预测,使决策更有依据。例如,能够根据磁盘每天的增长率来预测磁盘扩容的时间点,提前向管理员提示,为主机扩容提供依据,同时避免了人为的检查疏漏而磁盘空间达到临近100%产生的风险。
技术架构
MochaBSM系统设计中采用分层设计的方法,将整个系统划分为用户层、展现层、应用逻辑层、监控层、IT资源层。
过程
在本期工程中主要针对OA系统相关的主机、LotusDomino平台、OA应用、邮件应用、工单应用等进行管理、监控、分析。由于OA系统涉及到全省员工的日常办公,为了降低风险,实施过程分以下几个阶段进行:
试点
首先选择铜陵地市分公司的OA应用、Mail应用进行试点,在该分公司的OA应用、Mail应用中部署MochaBSM系统进行试运行,在
功能、稳定性等方面进行考察。监控铜陵分公司的OA系统稳定运行1个月,在监控主机方面、平台方面、应用方面都获得了比较好的运行情况。在试点期间,安徽移动用户根据试点情况,对MochaBSM进行了全面的测试、对一些配置参数进行了调整,对部分功能进行了细化。经过1个月的试点,MochaBSM满足了推广条件,正式封版,准备全面推广。
推广
事先制定周密的推广方案、详细的工作计划、切实可行的实施步骤、全面的技术支持与服务。推广期间还分别对实施人员、维护人员、管理员等进行了培训。经过充分的试点工作、培训工作后仅用2周时间便成功地将MochaBSM系统推广到省公司及其它地市分公司的OA应用、Mail应用、工单应用中,目前系统均运行良好。
成果
目前MochaBSM系统已经在安徽移动正式上线使用且运行稳定。通过MochaBSM对OA系统的监控、管理,彻底改变了IT部门维护OA系统的工作方式、解决了IT部门之前面临的种种问题。通过MochaBSM的实施和使用:
- 从被动响应式的工作方式转变为主动服务。
- OA系统维护的满意度不断提高。
- 通过自动的资源监控系统及时发现问题,避免重大故障发生。
- 问题出现后能够协助管理员快速找到问题原因,并及时地触发故障处理流程。
- 自动化的流程推送和提醒功能,在多任务工作环境下得心应手。
- 分析数据,展现报表,使公司领导更及时了解到相关信息。
- 使人员分工、IT预算等决策更有依据。
其他
运行环境
安徽移动OA应用监控系统部署:
- 两台Windows2000PCServer服务器:1台为应用服务器,运行MochaPortal应用服务器,部署MochaBSM,另1台为数据库服务器,存储MochaBSM的监控数据。
- 在被监控的6台OA系统UNIX主机上分别部署MochaBSM的代理程序,代理程序负责监控系统、获取各项数据。
- 用户端
- 操作系统:Windows2000、WindowsXP、Windows2003
- 硬件配置:CPU主频200MHz以上、内存128M以上、硬盘300M以上
- 浏览器:IE6.0以上
- 软件产品
- LotusDominoClient
- Oracle9iDatabase
- OracleClient
- MochaBusinessServiceManagement
- MochaRemoteAgentManagement
- MochaAlert
(转)
|