×

微信扫一扫,快捷登录!

标签: 暂无标签



智能运维的建设路径与最佳实践,内容源自COPS2020在深圳站的演讲。从四个维度深入剖析了智能运维在企业中的应用和实践:业务数字化带来的运维挑战、智能运维体系的分层构建、循序渐进的场景化构建模式,以及案例分析和价值分享。

业务数字化加剧的运维挑战:
随着业务数字化的加速,企业必须发展智能运维能力。以一起IDC服务商机房故障为例,电力负载过高导致配电柜开关跳闸,生产机房停电,空调停止运行,设备宕机,业务全网中断。这一事件凸显了运维在数字化转型中的关键作用。运维的现状和未来涉及分析的局限性、数据治理、主动运营等方面。智能运维的核心在于提升运维数据的认知能力,Gartner预测到2022年,大型企业中将有50%部署AIOps平台,以推进数字化转型。

智能运维体系的分层构建:
擎创科技的智能运维体系架构,涵盖运营决策层、运维应用层、数据治理层。具体架构如下:
- 运营决策层:包含知识图谱、运营大屏、系统画像。
- 运维应用层:包含异构第三方应用、告警解析中心、指标解析中心、日志解析中心、容量分析中心、事件分析、根因定位、异常检测、客量预测。
- 数据治理层:包含流式处理、算法处理、运维大数据处理、Data lake、APIs、Agents(指标,事件,日志)。
擎创科技的产品组合包括夏洛克AIOps智慧运营平台,该平台以全局运营视角解读IT运维,整合告警事件、性能指标、日志和容量等多维数据,在AI算法平台的支持下实现精准告警、异常检测、根因定位和容量分析等场景,助力企业数字化业务高效、稳定和顺畅运行。同时,通过数据价值的提炼分析优化运营决策,彰显运维对业务的影响力。

循序渐进的智能运维场景化构建模式:
智能运维建设的原则和路径,包括三个原则和六步走:
- 三个原则:从自身运维出发、补足监控手段不足、提升实时性数据处理能力。
- 六步走:
1. 集中监控智能化改造
2. 指标监控智能化改造
3. 日志智能异常检测
4. 根因分析和定位
5. 智能故障排查
6. 故障自愈

案例和价值分享:
通过具体案例展示了智能运维的价值,包括:
- 异常发现:利用智能化手段快速识别异常。
- 根因定位:精确确定问题根源,缩短排查时间。
- 运营分析:基于数据进行运营分析,优化决策过程。
- 持续治理:持续提高数据质量,优化运维流程。

具体案例包括:
- 集中监控的智能化:帮助客户更迅速地发现异常。
- 更有效的诊断问题根源:利用智能化手段快速定位问题根源。
- 更业务导向的运营分析和决策:基于数据进行更符合业务需求的运营分析和决策。
- 更持续有力的提升数据质量:通过持续治理提高数据质量,优化运维流程。

全面分析了智能运维的建设路径与最佳实践,展示了如何通过分层构建智能运维体系、循序渐进的场景化构建模式,提高运维效率,降低运维成本,并为其他企业提供可借鉴的实践路径。








上一篇:平安科技在AIOPS建设方面的实践经验分享~
下一篇:某互联网公司对AIOPS体系的实践应用
orange78

写了 58 篇文章,拥有财富 351,被 0 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by IT 运维管理
返回顶部