orange78 发表于 2025-1-24 21:35:15

推进智能运维的最佳路径与实践方法

https://www.itilxf.com/data/attachment/forum/202501/11/154426xj68m81vma8dlgss.png.thumb.jpg


智能运维的建设路径与最佳实践,内容源自COPS2020在深圳站的演讲。从四个维度深入剖析了智能运维在企业中的应用和实践:业务数字化带来的运维挑战、智能运维体系的分层构建、循序渐进的场景化构建模式,以及案例分析和价值分享。
业务数字化加剧的运维挑战:随着业务数字化的加速,企业必须发展智能运维能力。以一起IDC服务商机房故障为例,电力负载过高导致配电柜开关跳闸,生产机房停电,空调停止运行,设备宕机,业务全网中断。这一事件凸显了运维在数字化转型中的关键作用。运维的现状和未来涉及分析的局限性、数据治理、主动运营等方面。智能运维的核心在于提升运维数据的认知能力,Gartner预测到2022年,大型企业中将有50%部署AIOps平台,以推进数字化转型。
智能运维体系的分层构建:擎创科技的智能运维体系架构,涵盖运营决策层、运维应用层、数据治理层。具体架构如下:- 运营决策层:包含知识图谱、运营大屏、系统画像。- 运维应用层:包含异构第三方应用、告警解析中心、指标解析中心、日志解析中心、容量分析中心、事件分析、根因定位、异常检测、客量预测。- 数据治理层:包含流式处理、算法处理、运维大数据处理、Data lake、APIs、Agents(指标,事件,日志)。擎创科技的产品组合包括夏洛克AIOps智慧运营平台,该平台以全局运营视角解读IT运维,整合告警事件、性能指标、日志和容量等多维数据,在AI算法平台的支持下实现精准告警、异常检测、根因定位和容量分析等场景,助力企业数字化业务高效、稳定和顺畅运行。同时,通过数据价值的提炼分析优化运营决策,彰显运维对业务的影响力。
循序渐进的智能运维场景化构建模式:智能运维建设的原则和路径,包括三个原则和六步走:- 三个原则:从自身运维出发、补足监控手段不足、提升实时性数据处理能力。- 六步走:1. 集中监控智能化改造2. 指标监控智能化改造3. 日志智能异常检测4. 根因分析和定位5. 智能故障排查6. 故障自愈
案例和价值分享:通过具体案例展示了智能运维的价值,包括:- 异常发现:利用智能化手段快速识别异常。- 根因定位:精确确定问题根源,缩短排查时间。- 运营分析:基于数据进行运营分析,优化决策过程。- 持续治理:持续提高数据质量,优化运维流程。
具体案例包括:- 集中监控的智能化:帮助客户更迅速地发现异常。- 更有效的诊断问题根源:利用智能化手段快速定位问题根源。- 更业务导向的运营分析和决策:基于数据进行更符合业务需求的运营分析和决策。- 更持续有力的提升数据质量:通过持续治理提高数据质量,优化运维流程。
全面分析了智能运维的建设路径与最佳实践,展示了如何通过分层构建智能运维体系、循序渐进的场景化构建模式,提高运维效率,降低运维成本,并为其他企业提供可借鉴的实践路径。

IT运维管理:ITIL先锋论坛—智能运维的推进路线和最佳实践.pdf

页: [1]
查看完整版本: 推进智能运维的最佳路径与实践方法