×

微信扫一扫,快捷登录!

从中行大机宕机4小时说起  

标签: 中行
【腾讯数码消息】

    12月15日下午,中国银行采用的IBM大型机在运行过程中突然宕机,时间长达4个小时。
    大型机一直给人以“稳定、[  /tag/name/%E5%AE%89%E5%85%A8]安全[/url]”的概念,事实上这也正是IBM在宣传时所特意强调的,但本次大型机的宕机无异于对这种说法进行了驳斥。


    对政府、国防、[  /tag/name/%E5%AE%89%E5%85%A8]安全[/url]、电信、金融、交通、医疗等关系到国计民生的行业的关键业务来说,都需要遵循“5个9”(99.999)、“6个9”(99.9999%)甚至“7个9”(99.99999%)的标准来加以评估,而这些标准代表的,就是一台[  /tag/name/%E6%9C%8D%E5%8A%A1%E5%99%A8]服务器[/url]每年的非计划停机时间分别只有5分钟、30秒和3秒钟。由此我们可以想象本次4小时宕机的时间是多么漫长,所造成的损失又是多么巨大。
    作为单机系统来说,无论设计得如何精妙,维护得如何稳定,都不可能保证100%的无宕机。

    在本次宕机事件中,网友们热烈讨论的就是为什么系统没有在第一时间切换到备份[  /tag/name/%E6%9C%8D%E5%8A%A1%E5%99%A8]服务器[/url],一般说来备份分为本地和异地备份两部分,也是许多数据中心都在应用的模型。在金融行业中,通行一种名为“两地三中心”容灾备份系统的概念,许多银行也都在采用这样的备份模式。但是从这次宕机的结果来看,备份系统并没有起到丝毫的作用。

        笔者认为,之所以中国银行没有迅速切换到备份系统,还要归咎于金融行业的业务特殊性和大型机所带来的心理[  /tag/name/%E5%AE%89%E5%85%A8]安全[/url]感。一般来说目前灾备中心采用主备模式,多数情况下IT设备处于闲置状态。平时这些设备可以用于测试环境或者准生产环境,提高了设备使用率。此外,采用[  /tag/name/%E8%99%9A%E6%8B%9F%E5%8C%96]虚拟化[/url]技术,将灾备中心的[  /tag/name/%E6%9C%8D%E5%8A%A1%E5%99%A8]服务器[/url]配置成多台虚拟机,分给不同的用户所使用,充分地使用硬件资源,也降低了灾备中心设备的能耗。另一方面,银行的灾备系统主要以模拟方式进行,通过桌面模拟演练和Call Tree演练,验证灾备体系的可用性和有效性,只是大家迷信于大型机的“稳定、可靠”,备份系统恐怕从未应用过,更别提在关键时刻担当重任。

        更重要的原因是,本次宕机的是负责信用卡业务的[  /tag/name/%E6%9C%8D%E5%8A%A1%E5%99%A8]服务器[/url],如果启用备份系统,由于存在应用上的未知性,没人知道启动之后会出现什么问题。而据供职于央行的某位IT顾问透露,任何时候银行系统出现问题,都需要一把手拍板做决定,其他人没有这个责任和胆量启动预备系统。由此也不难理解为什么本次中国银行宕机事件没有迅速解决的原因了。

原文链接:[  /zt2013/syibm/index.htm?pgv_ref=aio2012&ptlang=2052]zt2013/syibm/index.htm?pgv_ref=aio2012&ptlang=2052[/url]





上一篇:ITSS 服务质量评价体系存在哪些问题?
下一篇:外媒:2013年企业软件市场的10个预测
daisy8

写了 1530 篇文章,拥有财富 19417,被 90 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies
bs15000 发表于 2013-1-5 21:04:24
:)
huangjie528 发表于 2013-1-6 01:06:02
又一次警钟。
realpt 发表于 2013-1-7 10:33:49
备份系统应该用来应变大的变故的,不会因为这次的意外事故而设置的。淘宝双十一的时候系统能够不死就行,银行的业务不行,不光不能死,还要保证强一致性,不能给用户造成任何的误解
kokotiger 该用户已被删除
kokotiger 发表于 2013-1-23 12:46:41
提示: 作者被禁止或删除 内容自动屏蔽
Powered by IT 运维管理
返回顶部