×

微信扫一扫,快捷登录!

标签: 暂无标签
粘贴上传202501111118084547..png


本研究旨在探讨某互联网公司多活稳定性运维架构的解析与实践。文章从多活架构的定义入手,详细阐述了同城多活与异地多活的概念、优势及面临的挑战,并深入分析了多活管控治理的多个关键领域,包括流量调度、数据同步、缓存一致性、消息队列同步等技术要点,以及多活架构下的业务场景确定、接口依赖梳理、消息场景梳理、接口链路梳理、数据存储梳理等实施步骤。最终,文章总结了多活架构的效益与成本,并对不同类型的多活架构进行了比较分析。

多活架构解析:
多活架构是指在不同地理位置的数据中心部署应用服务和数据,以实现服务的并行提供。该架构可细分为异地多活、同城多活以及单活/灾备三种模式。同城多活数据中心间网络延迟较低,数据层具备同步与切换能力,适用于抵御城市级别的故障。而异地多活数据中心间网络延迟较高,需按用户分片划分流量,数据层具备单元分片能力,适用于抵御城市或区域级别的灾难。

多活管控治理:
多活管控治理涉及流量接入层、数据访问层、缓存层、消息层和数据存储层等多个层面。关键技术点包括:
- 流量调度:通过DCDN、SLB和APIGW实现南北向流量管控,支持多机房流量权重的灵活调整。
- 缓存一致性:采用统一Proxy,支持Redis、Memcache,通过Canal订阅同可用区存储Binlog,投递消息队列,由业务Job解析处理后更新缓存。
- 消息队列同步:遵循单可用区内自产自消原则,支持多可用区间消息双向同步,根据业务场景提供三种消费处理模式。
- 数据存储:支持MySQL、TiDB、Taishan(KV)等,实现主从单向同步、双向同步和高可用容灾切换。

多活架构实施步骤:
实施多活架构需遵循以下步骤:
1. 确定业务场景:对业务进行分级,区分核心/非核心功能,与产研商定多活改造的场景。
2. 接口依赖梳理:梳理依赖应用、接口,划分强弱依赖,梳理依赖中间件、组件。
3. 消息场景梳理:梳理涉及的消息队列,生产/消费者,以及下游处理消息方式。
4. 接口链路梳理:梳理场景涉及业务流程,涉及服务、接口。
5. 数据存储梳理:分类数据,确定一致性要求,可丢失性、可恢复性,以及存储、缓存使用方式。
6. 改造实施上线:制定业务架构、中间件改造方案,多活管控接入、验证方案,以及多活切量执行预案。

收益与成本分析:
多活架构的收益涵盖高可用性、解决机房容量限制、变更灰度管控能力、重大活动稳定性保障等。成本方面,包括数据中心、基础设施、硬件资源投入,业务架构改造成本,以及架构复杂度带来的资源管理和运维管理成本。

多活架构对比:
文章最后对同城多活、单元化多活+异地读多活、异地多活三种架构进行了对比。同城多活适用于抵御城市级别以下的故障,单元化多活+异地读多活提供了更灵活的流量调度和数据管理,而异地多活则能够抵御更高级别的灾难,但其架构复杂度和成本也相对较高。







上一篇:某互联网公司对HDFS存储系统的运维管理实践(信息技术运维管理)
下一篇:某互联网企业混合云大数据系统可靠性工程师(SRE)实践探索(信息技术运维管理)
slbenben

写了 1742 篇文章,拥有财富 10784,被 10 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

Powered by IT 运维管理
返回顶部