×

微信扫一扫,快捷登录!

标签: 暂无标签

粘贴上传202501101018489816..png


本文件为华为技术有限公司发布的《IT运维管理:ITIL先锋论坛—行业IT运维白皮书-监控技术规范》,详细阐述了华为统一运维服务在IT资源监控领域的技术规范。该文件旨在向客户提供统一的IT资源监控能力,以确保IT系统的稳定性和可靠性。其目标受众为华为行业运维服务的销售与服务交付相关人员。


file:///C:/Users/Administrator/AppData/Local/Temp/ksohtml3764/wps3.jpg

文档结构与内容概述

文档共分为六个主要章节,详尽描述了从机房环境动力到应用系统的监控技术规范。

1. 概述
- 目的:构建统一的IT资源监控能力,覆盖机房动力环境、物理资源、云基础资源、应用系统运行环境及应用系统资源等范畴。
- 适用对象:主要针对华为运维服务相关工作人员。
- 术语定义:对弹性云服务器、云硬盘、裸金属服务器等专业术语进行了明确界定,以助于文档内容的理解。

2. 机房环境动力
- 监控对象:涉及供配电设施、暖通和制冷设施、机房环境、安防和消防设施等。
- 监控指标:详尽列举了配电柜、UPS、发电机、空调等设备的监控指标,包括电流、电压、负载率、温度等。
- 监控告警:明确了各种设备的告警条件,例如电压异常、负载过高、设备故障等。

3. 物理资源监控
- 服务器:监控指标包括CPU使用率、内存使用率、磁盘I/O等。
- 宿主机:涉及虚拟化平台的CPU和内存使用情况。
- 网络设备:包括路由器、交换机等的CPU利用率、内存利用率、流量值等。
- 存储设备:涵盖块存储、SAN交换机和文件存储的监控指标,如存储容量、IOPS、响应时间等。

4. 云基础资源监控
- 计算资源:包括弹性云服务器和裸金属服务器的CPU、内存、网络和存储使用情况。
- 存储资源:对象存储服务的上传下载流量、请求次数等。
- 网络资源:弹性IP和弹性负载均衡的流量、连接数等。

5. 应用系统运行环境监控
- 操作系统:监控Linux和Windows系统的CPU、内存、网络状态等。
- 中间件:包括Nginx、IIS、WAS、Tomcat等中间件的端口连通性、进程状态、性能指标等。
- 数据库:Oracle、SQL Server、MySQL等数据库的连通性、性能指标、资源利用率等。

6. 应用系统
- 监控指标:访问成功率、首屏用时、客户端崩溃率、服务端口可达性、URL可达性、响应时间等。
- 业务数据:关注关键业务数据的总量、待处理量和已处理量,以揭示性能问题。


文档特点与应用场景

- 全面性:文档全面覆盖了从基础设施到应用系统的监控,确保IT系统的各个层面均得到有效的监控。
- 标准化:提供了统一的监控标准和指标,便于运维人员进行标准化的监控和管理。
- 实用性:详细列出了各种设备和系统的监控指标和告警条件,为运维人员提供了实用的参考依据。
- 适用性:适用于不同规模和类型的IT系统,无论是大型数据中心还是中小型企业,都能从中找到适用的监控规范.

本文件为IT运维管理提供了一套全面、标准化的监控技术规范。通过详尽的监控指标和告警条件,运维人员可以更精确地掌握IT系统的运行状态,及时发现并处理潜在问题,从而保障系统的稳定性和可靠性。这对于提升IT运维效率和质量具有重要意义.








上一篇:IT银行数据中心Zabbix智能运维构建方案(IT运维管理)
下一篇:行业信息技术运维标准白皮书:应用日志运维规范(信息技术运维管理)
slbenben

写了 1715 篇文章,拥有财富 10647,被 10 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by IT 运维管理
返回顶部