IT运维管理数据挖掘及AI运营决策中心
IT运维管理数据挖掘1、AIOps告警辨析中心:这是一个具备智能处理能力的事件集中管理平台。它以机器学习算法为驱动,对海量的告警事件进行降噪和关联分析,辅助根因定位并沉淀故障处理的知识,从而显著提升企业的IT运维管理效率,有效降低IT运维管理成本。
通过AI算法甄别内容相关性(重复性、相似性)、时序相关性和拓扑相关性事件来进行告警事件的自动化抑制。基于故障传播链及拓扑信息,智能发现突发故障场景;基于告警“熵值”算法,实现告警的动态优先级推荐;通过时序以及拓扑关系定位故障场景根因,并进行根因标记。
2、AIOps指标解析中心:这个中心能够一站式纳管来自于各种IT运维管理工具中的多样化指标数据,比如系统、网络监控指标、应用性能监控指标以及业务交易类指标等。
通过指标管理池的构建,实现对指标的统一治理、单指标异常检测、多指标相关性分析、故障根因定界及定位、容量分析和预测等场景。用户不仅能通过该产品更快发现问题和分析问题根因,提升IT运维管理效率,而且还能通过其实现业务导向的指标体系构建和健康度评估分析,提升运营效能。
需要具备:
①指标的统一管理和数据治理:多样化的指标赋予业务属性和管理属性标签,便于分析和管理;指标数据清洗、聚合及归一化处理,为异常检测和分析算法提供数据准备;指标体系的建立和维护、健康度评估方式的设置。
②指标的异常检测和原因分析:不同波动特性的指标赋予最合适的异常检测模式;针对业务指标异常的根因诊断;提供多种分析方式,包括波动影响关系、异常数量归因以及拓扑相关性分析或者组合分析。
3、AIOps日志精析中心:这个中心提供海量数据采集、统一管理、集中查询和展示等功能,具备多样化开箱即用模板及智能日志分析能力,协助用户全面分析数字化业务整体状况,提升故障根因定位,日志审计、异常检测等IT运维管理能力,降低日志管理门槛,提高IT运维管理效率和IT运维管理水平。
提供常见场景和应用包,包括:思科日志、IIS日志、系统日志、Oracle日志、Ngnix日志等,提供给客户专业日志分析解决方案。通过应用包简化配置及分析过程,提高应用场景的配置效率,真正达到开箱即用的效果。定期发布常见应用包,提供导入导出功能。支持外部导入应用包。
日志串联查询功能:动态串联展示各环节的日志数据,查询交易链故障;自动计算单笔业务耗时及单节点耗时,快速定位业务中的故障节点;通过日志可视化还原业务流程处理路径;提供上下文日志展示及关联;展示业务环节中的关键数据,帮助业务部门掌握业务运行规律,降低业务运营风险。
4、AIOps日志智能分析中心:这个中心实现将海量日志聚类到肉眼可读的数量,智能识别日志发生规律,分析日志异常并智能告警。拥有高效、实时的智能化能力,让用户无需了解日志结构即可发现异常、定位根因。
AI运营决策中心
定位于能够赋能用户进行一站式数据融合及决策分析的平台,应具备两方面核心价值:首先,它能够融合来自不同来源的数据,包括但不限于工单系统、监控系统以及日志平台等,这些都可以作为可配置的数据源被整合进平台中。用户能够根据自己的需求,自主创建各类IT运维管理和运营分析的可视化场景,主动进行分析和持续优化,而不仅仅是被动地进行故障排查。
平台还能够将IT运维管理人员在分析故障和问题的过程中所积累的经验逐步积累起来,形成一个可探索的知识库。通过知识的沉淀,指导IT运维管理人员更加高效地分析IT运维管理中的故障和问题,从而减少对个人技术和经验的依赖。实现自定义IT运维管理场景分析、自定义运营分析、知识图谱、运营大屏、知识图谱等功能,这些都能够辅助IT运维管理人员进行更加科学的IT运维管理相关决策。
通过采用AIOps智能决策技术,可以将IT运维管理人员的决策过程数据化,构建一个决策支持知识库。这样不仅能够实现经验的累积,还能够从系统掌握的全局到细节的数据中,结合决策支持知识库,为IT运维管理人员提供更加准确的决策支持,从而做出更加明智的决策。参考数字化IT运维管理体系建设指南等书籍资料
页:
[1]