IT运维管理用户体验平台设计健康检查、自动配置和自动备份
健康检查健康检查是一种能够与实际IT运维管理场景下的巡检任务相匹配的检查方式。它主要关注于对各类软硬件资源的运行指标、状态以及合规指标进行细致的检查。健康检查能够适应不同场景下的巡检任务需求,包括但不限于日常巡检、节假日巡检以及合规性检查等。
通过预先设定巡检任务和巡检规则,系统能够自动执行定期或实时的资产检查工作,从而有效减轻IT运维管理人员的工作负担。健康检查场景主要由健康检查报告、健康检查任务以及健康检查模板这三个核心部分构成。
健康检查模板是健康检查场景中的重要组成部分。它允许根据不同厂商和不同类型的软硬件设备建立一个详尽的检查模板库。这些模板包含了检查的名称、检查方法(例如采集协议、采集指令等)、结果判断规则等关键信息。模板库的设计使得检查模板支持复制功能,用户可以通过复制现有的模板并调整检查规则,以满足不同IT运维管理场景下的特定需求。
健康检查通过标准协议(如SNMP、TELNET、SSH、JMX、JDBC、WINRM等)连接设备,并执行检查命令以获取所需检查的内容。随后,系统会利用预设的结果判断规则对检查结果进行分析。检查结果的判断不仅包括巡检结果超过预设阀值或出现异常时的告警规则,还涵盖了告警级别的设定等内容。
健康检查任务管理是根据巡检调度计划,对符合触发条件的任务进行调度执行的过程。调度方式分为人工执行和自动执行两种,其中自动触发支持事件触发和周期性触发(周期性触发支持按时、日、周、月、年等不同周期)。最终,根据巡检任务所定义的设备集和指标集以及采集方法,系统会对相应设备的指标值进行采集。
健康检查报告是根据巡检报告生成策略定义的报告样式,能够自动生成巡检结果报告。同时,它还支持对历史巡检数据进行统计,形成巡检的历史趋势分析。健康检查报告支持针对健康检查结果的健康值分析,通过对检查正常数、检查告警数、检查预警数的加权计算,得出本次任务的健康值。并将本次检查结果以直观的方式呈现给IT运维管理人员。
健康检查报告支持导出功能,整个报告分为三部分内容:
1.健康检查总体报告,它包含了健康值、告警数、预警数、检查历史趋势分析以及检查异常资产和不可用资产的统计;
2.检查出告警和预警的集合,IT运维管理人员可以直观地看到本次检查的所有异常结果,并可进行针对性的处理;
3.针对每个资产的健康检查报告,详细分析了该资产本次检查所有检查项的情况,包括正常、告警和预警的列表。
自动配置
在实际IT运维管理场景中,设备配置是一项频繁且重要的工作。然而,在设备数量庞大的情况下,逐台手动配置设备将变得非常耗时且劳动强度大。自动配置功能的引入,旨在通过脚本、配置文件、配置命令等形式实现对各类资产的批量化配置。系统通过执行配置并进行结果检查,来判断配置内容是否已经生效或配置是否成功。
自动配置能够承担起IT运维管理人员重复的工作,从而释放他们的精力。系统内置的配置库能够统一管理和维护不同资源、不同厂商、不同型号的资产的配置命令、脚本、配置参数等。配置库支持用户自定义配置内容,包括变量设定以及配置结果检查。用户还可以自定义配置实例,并将这些配置实例保存起来,方便下次使用和配置参数的调整。
自动备份
自动备份功能为IT运维管理提供了极大的便利,它能够对网络设备、服务器、数据库以及应用系统等关键的配置文件进行有效的备份管理。这项功能允许用户根据周和月的备份计划来执行定期的备份任务,确保数据的安全性和完整性。当配置文件发生任何变化时,系统会自动进行比对,并且能够及时发出告警通知,以便管理人员能够迅速了解配置文件的具体变化内容。
IT运维管理人员随后会对这些变化内容进行仔细的审核,以确认这些变更是否是预期中的正确操作。在确认变更无误的情况下,系统将保持现状;若发现错误或非预期的变更,管理人员则可以利用自动备份功能,迅速将设备恢复到之前的状态。此外,配置文件的管理变得更为便捷,用户可以利用日历视图的方式来查看和管理备份文件,使得整个备份过程更加直观和易于操作。
自动备份系统还提供了高度的自定义性,允许用户根据自己的需求来设置备份任务。用户可以自定义需要备份的文件名称、选择合适的备份路径以及确定备份的方式,无论是全量备份还是增量备份,都可以根据实际情况灵活选择。通过这种自定义设置,用户可以确保备份过程完全符合自己的特定需求,从而实现更加精确和高效的备份管理。参考数字化IT运维管理体系建设指南等书籍资料
页:
[1]