×

微信扫一扫,快捷登录!

标签: 暂无标签



粘贴上传202501111514109868..png








本研究聚焦于IT运营智慧化实践方案,由广东何广柏在COPS2020全球运维大会2020·深圳站进行分享。报告深入探讨了云化架构的运营挑战以及运营智慧化的实践与探索。

云化架构的运营挑战:
报告首先回顾了云化架构的技术演进历程,涵盖了企业应用集成、云计算、边缘计算等技术的成熟,这些技术的发展促进了智能化应用的进步。传统IOE架构通常采用平台+应用的模式,架构扩展主要以纵向为主。云化架构在运营过程中面临的问题与挑战包括:
- PAAS模式引入了新的故障处理挑战,由于组件众多且架构差异大,人员能力参差不齐,导致处理效率及质量不稳定。
- 开源技术带来了新的技能挑战,由于组件多基于分布式架构,问题定位困难。
- 分布式技术组件带来了能力配套挑战,开源组件普遍配套能力不足,不同组件配套工具自成体系,多套分布式环境的升级实施成本高昂。
- 分布式模式引入了新的资源管理挑战,众多大小组件集群的存在,增加了运营成本。

运营智慧化实践:
报告详细阐述了运营智慧化的实践方法,涵盖集约归口、自动化、数据注智、敏捷化、经验固化、AI助力等方面。具体实践包括:
- IT运营从分散向集约转变:随着IT系统从烟囱式向云化建设演进,IT运营也从分散向集约转变。SaaS、PaaS、IaaS的云化三层架构需要智慧化的运营手段,以提高运维人员在资源管理、问题预测、故障处理、运营分析、沟通交互等方面的工作效能。
- 虚拟化云架构的智慧运营手段:通过“标准化、自动化、工具化”的智慧运营手段,提前发现问题、快速处理故障、保障运营质量。具体包括资源管理中心、监控告警中心、运营日志中心、智慧服务中心、数据运营中心、运营分析中心等。
- 资源管理中心:基于CMDB管理平台设备、组件和服务,提供资源的自动化部署,包括集群管理、组件管理、环境管理和自动化部署等。
- 监控告警中心:多视图反映平台设备、组件和应用的健康现状,及时发现并报告异常。主要包括主机设备监控、组件监控、应用监控、告警管理、调用链分析以及大屏展示等功能。
- 运营日志中心:汇聚组件运营日志,提供自助检索及日志分析能力,并为平台门户提供能力。
- 智慧服务中心:提供组件专业管理能力,实现实例管理及专业监控。如数据库服务管理、docker管理等。
- 数据运营中心:多渠道接入,通过知识库、AI机器人、图文识别等,对用户上报问题进行分析,为系统用户与运营人员提供沟通桥梁。
- 运营分析中心:提供平台组件总体运营状况,提供优化建议。通过资源管理中心,集中管理软硬件资源信息,形成层次拓扑图,为各类运营场景提供基础信息管理服务。

智慧化运营的具体实践:
- 自动发现新资源:通过自动发现机制,包括配置库、zookeeper注册中心、网络调用、调用链关系等,实现资源自动发现,助力故障精确定位。
- 集群规模带来资源数据变化:通过CMDB管理,实现扩缩容、高可用切换等操作,自动发现服务,智能识别资源数据。
- 微服务化的调用链监控:通过低损耗、非入侵式的服务调用数据探针,获取业务服务全链路调用信息,实现在线应用运营监控。
- 故障推断:结合基础运营数据,通过图计算技术,以逻辑拓扑为主线生成故障图谱,通过数据分析推断精确故障点。
- 数据智慧化运营分析:通过自动化、智能化的数据运营中心,对分布式数据库实行运行监控与调优分析,避免运维人员频繁操作生产库,减轻数据运维工作。

运维智慧客服:
- 多渠道接入:支持微信等多渠道接入,支持人工服务或通过知识库、AI机器人、图文识别等功能,对用户上报问题进行分析,自动生成处理工单提交后端处理。
- AI机器人:提供智能导航、运维知识、语义分析、图文识别等功能,实现快速精准回复,有效代替人工20%。

未来展望与探索方向:
报告最后提出了运维与DEVOPS的结合,以及AI在运维中的应用等未来展望与探索方向。

本研究为IT运营智慧化提供了宝贵的实践经验,展示了如何通过集约归口、自动化、数据注智、敏捷化、经验固化、AI助力等方法,提升运维人员的工作效能,实现IT运营的智慧化转型。







上一篇:DevOps时代的到来与IT运维管理的变革
下一篇:某互联网企业信息科技运维平台技术方案(信息技术运维管理)
slbenben

写了 1742 篇文章,拥有财富 10784,被 10 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by IT 运维管理
返回顶部