[提问与解答] 云计算SLA：如何保障正常服务时间

太帅发表于 2011-7-19 10:52:00

云计算SLA：如何保障正常服务时间
【TechTarget中国原创】当前，考虑到云计算和大型主机时代之间的相似性（对远程资源的高度依赖），

云计算服务级别协议

（SLA）已经势在必行。
　　在经历了22年前伊利诺斯州贝尔公司转接站的那场大火之后，Raymond Gloor很自然地成为了一名数据安全专家。当时的火灾导致了数十万人通讯的中断，损坏了该州Hinsdale与其他50个转接中心的光纤通路。“我们从未遇到过一个站点的损坏就导致了这么严重的后果。”Gloor回忆说。下面这段话节选自1988年5月Hinsdale那场大火之后纽约时报的评论文章：
　　由于线路不仅承载话音还负责传输计算机数据，其对国民经济的重要性日益凸显，所以电话系统的脆弱性是一个急需解决的问题。企业日常都用电话线路传输订单、资金和相关信息。电话服务的故障将会极大影响经济的运转，从而导致数以百万计美元的商业损失。
　　“把这篇文章的标题改成《万维网》，同样的内容也一样适用。”Gloor说。而且现在网络上有大量的视频内容，这将会导致反应速度的变慢。而对于某些行业来说，这种延迟是令人无法接受的。
　　“你不能对银行客户说‘我们不知道你的户头上有多少钱’。”Gloor描述说。由于政府关于银行业新法规的出台，如何应对延迟问题变得非常重要。“这不是一只800磅的猩猩。”他说：“这只猩猩是怪兽级别的。”
　　伊利诺斯转接站的教训极其深刻，也同时决定了Gloor对于云服务提供商的立场：“业务连续性是如此重要，尤其是对于那些考虑把应用移入云端的CIO们来说更是如此。Web连接发生故障的后果是什么？如何通过云SLA来解决这种问题？”
　　Ken Harris是Shaklee Corp.（位于加州）的CIO，而且也是Gap Inc.、耐克公司和百事公司的前任CIO。他同意Gloor的观点：“作为CIO，我有责任确保所负责的系统可用性在99.999%以上。但是坦率地说，以我对SaaS的切身体验而言，很多云提供商没有真正认识到这一点。”
　　灾难规划人员认为所有能想象到的事情都会在某个时间点发生。在云服务故障时应该怎么做呢？Harris认为很关键的一点就是用云SLA来确保正常服务时间、响应时间以及系统的及时恢复。
　　云计算SLA保障正常服务时间
　　除去各种不可抗力的因素，Harris认为真正危险的是SaaS服务提供商没有理解CIO们对于正常服务时间的需求：“一个坏损的、无法发挥作用的系统对我们来说是不可接受的。”
　　Harris就这些相关问题和PivotLink公司（位于加州旧金山的一家按需商业智能服务提供商）进行了直接沟通。Harris的雇主Shaklee是一家天然营养品公司，其每年都要进行数百项的科学研究，从而会产生大量的数据。在正式购买PivotLink的服务之前，Harris先确认了该公司满足下列要求：

[*]响应时间。“我必须对响应时间负责，必须达到要求，否则无法合作。”Shaklee公司通过一些简单的交易事务测试了PivotLink服务的响应时间。
[*]故障时间。如果系统故障，提供商应该通过自身力量确保服务恢复。
[*]灾难恢复。仔细核查合同中的相关内容。你应该有一个容灾的恢复站点，可以是企业本地的。
[*]正常服务时间的奖励。Shaklee为PivotLink提供了针对正常服务时间的经济激励。“这在每份SaaS的合同中都应该有所体现。”Harris表示。
　　总之，通过互联网提供的服务难免遇到故障，但是这并不意味着就束手无策了，CIO们可以和

云提供商

进行协商以应对最坏情况的发生 – 而且，要以书面形式加以规定。

小女巫 发表于 2014-4-15 02:32:04

大人，此事必有蹊跷！

畅想2000 发表于 2014-4-15 02:33:34

跟大家交流一个ITIL的概念吧：上海ITIL培训是IT运维管理社区在第四个地方组织的培训，作为IT信息化最为前沿的城市之一，是IT运维管理社区非常重视的培训阵地。虽然ITIL培训在上海的培训机构众多，但是基于IT运维管理社区的强大的人气以及众多的IT运维管理社区qq群，IT运维管理社区的培训团购还是在上海存在一定的知名度。

页: [1]

IT运维流程库's Archiver

[提问与解答] 云计算SLA：如何保障正常服务时间