×

微信扫一扫,快捷登录!

标签: 暂无标签
粘贴上传202501111502513908..png


本研究聚焦于AIOps在运维团队中的实施实践,由腾讯游戏AIOps技术负责人在GOPS全球运维大会2020·深圳站进行分享。报告从腾讯游戏DataOps与AIOps的发展历程、日常运维工作中的实际案例分析、以及AIOps在运维工作中的服务模式三个维度,深入探讨了腾讯游戏在AIOps领域的实践经验和成果。

腾讯游戏DataOps与AIOps的发展历程:
腾讯游戏技术运营团队成立于2003年,随着游戏业务的不断扩展,团队经历了从平台产品化、D/O分离、运营开发团队的成立,到基于PaaS模式的运维开发转型等关键阶段。自2015年起,团队开始探索DataOps与AIOps,至2017年已初具行业影响力,至2019年团队规模已扩展至400余人。DataOps与AIOps的发展历程反映了技术运营的演进、团队规模的扩张以及行业影响力的增强。

日常运维工作中的实际案例分析:
报告详细阐述了AIOps在腾讯游戏日常运维工作中的应用实例,涵盖游戏地图设计支持、游戏运营危机事件的化解、用户体验的提升、运维工作效能的增强、运维监控方式的变革以及异常日志的发现指导等方面。
1. 游戏地图设计支持:
- 利用坐标映射和线性回归算法,实现了场景坐标系与像素坐标系的映射,从而优化游戏地图设计。
- 数据流程涉及数据采集、处理与分析,算法模型应用包括线性回归模型,游戏策划通过数据可视化和优化建议进行应用。
- 优化案例展示了楼梯侧方位置设计的改进,有效提升了玩家体验。
2. 游戏运营危机事件的化解:
- 针对恶意信息泛滥问题,面对数据量大、检测速度慢、语法变种多、扫描流程繁琐等挑战,采用屏蔽词表、字音库、字形库、过滤器、模糊筛选、AC自动机等技术,显著提高了检测效率。
- 扫描效率的前后对比表明,拼音扫描模式和标准扫描模式的扫描速度得到了显著提升。
3. 用户体验的提升:
- 针对某大型MOBA类端游的掉线问题,通过应对数据格式不规范、海量数据处理等挑战,采用数据上报、清洗、需求分析等方法,有效提升了用户体验。
- 数据需求涵盖目标信息、基础属性、交叉数据等,数据处理包括随机森林预测、重点维度筛选、相关性分析等。
- 优化效果表明,重连失败率和掉线玩家转化率得到显著改善,业务收益包括提升玩家留存率和减少投诉。
4. 运维工作效能的增强:
- 针对扩容缩容过程中人力投入巨大的问题,通过建立模型、预测、调整参数等方法,采用快、准、高质量的执行系统,显著提升了运维工作效能。
- 原理涉及数据源、数据清洗、数据预处理、最小二乘法、机器学习平台等,效果显示智能运维在扩容缩容方面的显著优势。
5. 运维监控方式的变革:
- 实现无需人工配置策略,覆盖更多复杂场景,告警准确性得到提升。通过曲线分类、算法原理、模型训练、模型应用等方法,改变了运维监控的工作方式。
- 应用案例包括不同指标的告警策略优化,效果显示智能运维在告警准确性和效率方面的提升。
6. 异常日志的发现指导:
- 通过原始日志、向量化日志、实现流程等方法,指导运维发现异常日志。应用案例包括日志分析和异常检测,效果显示智能运维在日志分析方面的优势。

AIOps在运维日常工作中的服务模式:
报告最后探讨了AIOps在运维日常工作中的服务模式,针对业务多样性、场景多样性、需求差异性大的情况,提出了相应的服务提供策略。服务模式包括:
1. 业务多样性下的服务提供策略。
2. 场景多样性下的服务提供策略。
3. 需求差异性大的服务提供策略。

本研究为AIOps在运维团队中的实施提供了丰富的实践经验,展示了如何运用DataOps与AIOps技术提升游戏运维的效率和质量,解决实际工作中的挑战,并为其他企业提供可借鉴的实践路径。







上一篇:数字体验监控与测试服务应用案例研究(IT运维管理领域)
下一篇:DevOps时代的到来与IT运维管理的变革
slbenben

写了 1742 篇文章,拥有财富 10784,被 10 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by IT 运维管理
返回顶部