×

微信扫一扫,快捷登录!

标签: 暂无标签
[p=30,2,center]学习资料:IT运维管理社区专家讲堂直播300期视频回放


[p=30,2,center] un9M8fDz_wLkQ.jpg




各位朋友,先锋小编为你们选了一篇很好的文章,欢迎讨论!

案例简介

安徽移动经过几年的信息化建设,已经建成了统一信息平台Portal、OA、MIS等多个应用系统。企业各个业务所需要的应用系统,极大地提升了企业的信息化水平,提高了工作效率,基本实现了无纸化办公。随着应用系统越来越多、越来越深入,员工的日常工作已离不开这些应用系统,应用系统的运行状况直接影响着员工办公、企业生产,因此确保应用系统的安全、可靠、稳定地运行成为系统维护部门越来越重要的问题,尤其是员工日常办公必需的OA系统。目前安徽移动的OA系统已经运行三年时间,采用LotusDomino平台,供全省5000名员工办公使用。在OA系统维护工作中存在着如下问题:1.系统需要人工监控,维护量巨大,并且无法一一监控到位,同时不能做到持续地实时监控。·忙于应对已发生的故障,被动响应式的工作方式,解决故障的效率低。2.LotusDomino无故宕机,很难及时发现和预见问题的发生。3.问题出现后,很难快速、准确地找到根本原因。4.问题找到后,缺乏流程化的故障处理机制。5.支持过程总是被打断和干扰。6.缺乏过程和变化的跟踪记录,如系统运行状况、主机配置变化、应用模块变更等。7.不能及时地统计、分析系统状况,供领导决策。结果造成维护部门在出现问题时疲于应付、导致维护工作的满意度较低,这些问题一直困扰着IT维护部门。维护部门迫切的希望改变目前的这种状况。为了解决以上一系列问题,真正实现IT服务全过程一体化,包括管理、监控、统计分析等,并通过组织、流程和制度的完善以及相应的技术设施的建设来支撑和保障IT部门的整体服务水平,我们为安徽移动用户提供了基于MochaBSM产品的应用监控解决方案。

用户名称

安徽移动通信有限责任公司

用户类型

电信

用户简介

安徽移动通信有限责任公司是中国移动(香港)有限公司全资子公司。安徽移动于2002年7月1日在香港及海外上市,企业性质为外资企业。公司下属17个市级分支机构、61个县级分支机构。公司经营范围是在安徽省经营移动通信业务,包括话音、数据、多媒体等。如:IP电话及互联网接入服务。从事移动通信、IP电话和互联网等网络的设计、投资和建设。移动通信、IP电话和互联网等设施的安装、工程施工和维修。经营与移动通信、IP电话和互联网业务相关的系统集成、漫游结算清算、技术开发、技术服务、业务、设备销售等。出售、出租移动电话终端设备、IP电话设备、互联网设备及其零配件,并提供售后服务。

用户需求



  • 实时监控主机、LotusDomino平台、OA应用、邮件应用等基础设施、应用等IT资源的运行状态、性能和可用性。
  • 当监测到系统故障时,快速定位故障的主要原因,估算系统事件对业务的影响及其严重程度,并触发相应的故障处理流程。
  • 故障处理流程通过整合OA系统来实现,以短信提醒、待办待阅的报警形式实现系统流程的自动化。
  • 简单操作的系统管理配置,方便地配置所监控服务器的信息,应用数据自动获取。
  • 系统将根据服务级别协议(SLA),为客户方便地定义符合其需要的各种指标阈值,通过具体的数字来量化地评价服务响应速度、故障修复时间等IT服务水。
  • 通过门户系统可以进行统一整合,实现单点登录SSO、统一授权和访问控制、集成展现和个性化等功能,使系统各模块之间实现无缝的协同工作,给IT服务经理、系统管理员、应用管理员等不同的用户群体和角色提供了可视化的工作平台。
  • 提供了丰富的报表,提供了统计报告,提供了资源或指标走势,用以辅助分析和决策。

技术路线

产品概述

摩卡业务服务管理(MochaBusinessServiceManagement),简称MochaBSM,整合了系统管理、监控、工作流、统计分析和门户等多种技术,是对ITIL的IT服务管理核心流程的实现,是一个实用、可扩展的技术解决方案。
MochaBSMLotusDomino应用监控是一个专门针对LotusDomino系统提供监控、故障定位、统计报告等功能的组件。
该产品主要具有以下功能:



  • 提供面向“服务”的,整合网络、主机、应用、服务等各层面IT资源的、统一的IT服务管理信息视图。
  • 实时监控OA系统的运行状态,及时发现问题。
  • 告知事件对企业影响的严重程度。
  • 准确、快速地定位故障产生的根本原因。
  • 根据严重程度和优先级别,触发相应的处理流程。
  • 提供统计报告和分析图表,为领导层提供决策依据。

功能描述

安徽移动OA应用监控系统是基于MochaBSM产品,该产品为安徽移动提供了统一的、集中的IT服务管理平台。系统包括系统监控和报表展现、决策分析等主要功能。

系统监控功能

通过对OA系统的主机、平台、应用等方面的监控,实现了对OA系统在性能上、可用性上全方面的跟踪,能够及时发现故障、确定故障影响严重性并能定位故障根本原因。

主机信息监控:提供对OA系统所在服务器进行实时监控。

平台信息监控:监控LotusDomino平台指标信息直接决定提供服务的性能,从根源上管理平台可用性。

应用信息监控:多年经验汇聚提取OA应用层面重要指标,预防为主。

主机方面

监控运行于省公司、地市分公司的OA应用、邮件应用的六台UNIX主机,包括CPU、内存、硬盘、OS文件系统等运行状况的重要指标。

监控时间频度为5分钟采集1次(监控时间频度可以自行配置)。

平台方面

包括运行于省公司、地市分公司的OA应用、邮件应用的十二个LotusDomino分区服务。LotusDomino平台监控的指标主要包括:

应用平台

-AMGR(TASK)状态

-LotusDominoServer状态

-HA切换状态

-HTTP(TASK)状态

-HTTP活动线程数

-HTTP响应时间

-Web代理设置状态

-超时信号灯状态

-丢弃的会话数

-服务器1352端口状态

-个人Internet地址状态

-日志库Corruption信息

-用户Session

-宕机情况

 邮件平台

-POP3(TASK)状态

-Router(TASK)状态

-SMTP(TASK)状态

-等待邮件数目

-死信数目

监控时间频度:对于部分监控频度要求较高的指标为5分钟采集1次、对于部分监控频度要求较低的指标1天采集1次(监控时间频度可以自行配置)。

应用方面

包括省公司、地市分公司在内的OA应用、邮件应用的监控:

  • OA应用:包括省公司及全省十七个地市的共十八套OA应用系统,分布在四台服务器上。
  • 邮件应用:包括全省5000用户的使用的邮件系统,分布在两台服务器上。

应用监控的指标主要包括:

-定时代理激活状态

-数据库存取控制Anonymous状态

-数据库大小

-数据库是否损坏

-数据库视图文档量

-数据库索引大小

-数据库文档量

-数据库增长率

-文档文本域值大小

监控时间频度:对于部分监控频度要求较高的指标为5分钟采集1次、对于部分监控频度要求较低的指标1天采集1次(监控时间频度可以自行配置)。

系统监控的其它功能点

  • 对于性能指标超标、宕机故障,通过手机短信、邮件直接发送给OA系统的管理员、维护人员及其他相关人员,在报警信息中明确哪台主机、哪个LotusDomino分区、哪个地市的应用、故障发生的时间、初步定位的故障原因等重要信息,方便维护人员了解故障并及时解决故障。
  • 实现了MochaBSM系统跟OA系统集成。对于MochaBSM中的预警、故障会直接触发OA系统中的预警流程、故障处理流程,这些流程会自动推送到OA系统相关人员的待办、待阅任务列表中。
  • MochaBSM对OA系统的主机、平台、应用等各方面的过程和变化进行全面的跟踪记录,如系统运行状况、主机配置变化、LotusDomino平台配置变化、应用模块变更等都会自动记录到系统中,非常方便查阅这些动态信息,做到了可追溯,同时这也符合SOX法案的要求。

报表展现、决策分析功能

MochaBSM系统对监控主机、平台、应用等方面收集到的数据提供了各种直观形象的图表和报表展现,提供了统计报告,提供了资源或指标走势,用以辅助分析和决策。

通过MochaBSM提供的查询、统计功能、分析功能,安徽移动客户可以统计1个月以来发生的故障次数以及解决故障的时间等等,作为提高维护质量的基础数据。

MochaBSM能够根据历史数据对未来趋势进行预测,使决策更有依据。例如,能够根据磁盘每天的增长率来预测磁盘扩容的时间点,提前向管理员提示,为主机扩容提供依据,同时避免了人为的检查疏漏而磁盘空间达到临近100%产生的风险。
技术架构

MochaBSM系统设计中采用分层设计的方法,将整个系统划分为用户层、展现层、应用逻辑层、监控层、IT资源层。

20080903092314471.jpg

过程

在本期工程中主要针对OA系统相关的主机、LotusDomino平台、OA应用、邮件应用、工单应用等进行管理、监控、分析。由于OA系统涉及到全省员工的日常办公,为了降低风险,实施过程分以下几个阶段进行:

试点

首先选择铜陵地市分公司的OA应用、Mail应用进行试点,在该分公司的OA应用、Mail应用中部署MochaBSM系统进行试运行,在
功能、稳定性等方面进行考察。监控铜陵分公司的OA系统稳定运行1个月,在监控主机方面、平台方面、应用方面都获得了比较好的运行情况。在试点期间,安徽移动用户根据试点情况,对MochaBSM进行了全面的测试、对一些配置参数进行了调整,对部分功能进行了细化。经过1个月的试点,MochaBSM满足了推广条件,正式封版,准备全面推广。

推广

事先制定周密的推广方案、详细的工作计划、切实可行的实施步骤、全面的技术支持与服务。推广期间还分别对实施人员、维护人员、管理员等进行了培训。经过充分的试点工作、培训工作后仅用2周时间便成功地将MochaBSM系统推广到省公司及其它地市分公司的OA应用、Mail应用、工单应用中,目前系统均运行良好。

成果

目前MochaBSM系统已经在安徽移动正式上线使用且运行稳定。通过MochaBSM对OA系统的监控、管理,彻底改变了IT部门维护OA系统的工作方式、解决了IT部门之前面临的种种问题。通过MochaBSM的实施和使用:

  • 从被动响应式的工作方式转变为主动服务。
  • OA系统维护的满意度不断提高。
  • 通过自动的资源监控系统及时发现问题,避免重大故障发生。
  • 问题出现后能够协助管理员快速找到问题原因,并及时地触发故障处理流程。
  • 自动化的流程推送和提醒功能,在多任务工作环境下得心应手。
  • 分析数据,展现报表,使公司领导更及时了解到相关信息。
  • 使人员分工、IT预算等决策更有依据。

其他

运行环境

安徽移动OA应用监控系统部署:



  • 两台Windows2000PCServer服务器:1台为应用服务器,运行MochaPortal应用服务器,部署MochaBSM,另1台为数据库服务器,存储MochaBSM的监控数据。
  • 在被监控的6台OA系统UNIX主机上分别部署MochaBSM的代理程序,代理程序负责监控系统、获取各项数据。
  • 用户端
  • 操作系统:Windows2000、WindowsXP、Windows2003
  • 硬件配置:CPU主频200MHz以上、内存128M以上、硬盘300M以上
  • 浏览器:IE6.0以上
  • 软件产品
  • LotusDominoClient
  • Oracle9iDatabase
  • OracleClient
  • MochaBusinessServiceManagement
  • MochaRemoteAgentManagement
  • MochaAlert


(转)





上一篇:[每周一问第六十一期]这么多系统要管,如何是好?
下一篇:【考题训练第二百四十二期】Which of the following are the two primary elements...
先锋小编

写了 751 篇文章,拥有财富 5380,被 16 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies
xellexlin 发表于 2012-6-14 19:58:53
监控项目想做好也不容易。
hping 发表于 2012-6-14 09:04:27
监控项目
Powered by IT 运维管理
返回顶部