云计算中的容错性
云计算中的容错性意味着无论某些部分是否失效或不可用,都创建了一个持续工作的蓝图。它帮助企业评估其基础设施需求,并在相关设备由于某种原因不可用时提供服务。
这并不意味着备用系统可以提供100%的整个服务。然而,概念是保持系统可用,并且最重要的是在运行模式下保持在一个合理的水平。如果企业继续以不间断的方式增长并提高其生产力水平,这一点非常重要。
云计算系统容错性的主要概念
- 复制 :容错系统通过为每个服务运行多个副本来工作。因此,如果系统的某一部分出现故障,可以使用其他实例来保持其运行。例如,考虑一个具有相同信息的数据库集群,其中包含3个服务器。所有的操作,如数据输入、更新和删除,都会写入每个服务器。冗余服务器将保持闲置状态,直到容错系统要求它们可用。
- 冗余 :当系统的某一部分失败或处于离线状态时,拥有备份类型的系统是很重要的。服务器使用包含许多冗余服务的应急数据库。例如,具有MS SQL作为数据库的网站程序可能由于某些硬件故障而中途失败。然后,当原始数据库处于离线模式时,冗余概念必须利用新数据库。
实现云计算容错性的技术
- 在设计容错系统时,应给予所有服务优先考虑。数据库应该得到特别优先考虑,因为它支持许多其他实体。
- 设定优先级后,企业必须进行模拟测试。例如,企业拥有一个论坛网站,让用户登录和发表评论。当认证服务由于问题而失败时,用户将无法登录。
然后,论坛将变为只读,并且不能达到目的。但是通过容错系统,将确保修复,并且用户可以在对性能影响最小的情况下搜索信息。
云计算中容错性的主要特征
- 无单点故障 :冗余和复制的概念定义了容错可以发生,但会产生一些较小的影响。如果没有单一故障点,则系统不是容错的。
- 接受故障隔离概念 :故障发生与其他系统分开处理。它有助于将企业与现有的系统故障隔离开来。
云计算中的容错性存在
- 系统故障 :这可能是软件或硬件问题。软件故障会导致系统崩溃或挂起,可能是由于栈溢出或其他原因。对物理硬件设备的不当维护将导致硬件系统故障。
- 安全漏洞事件 :由于安全故障,可能会出现多种导致容错性的原因。服务器的黑客攻击会损害服务器并导致数据泄露。需要容错性的安全漏洞事件的其他原因包括勒索软件、钓鱼、病毒攻击等。
要点
云计算中的容错性是一个必须事先了解的关键概念。当发生数据泄露或系统网络故障导致完全混乱和缺乏准备时,企业会陷入无所适从的境地。建议所有企业应积极追求容错性的问题。
如果企业正在不断增长,即使发生一些故障,也需要设计容错性系统。任何限制都不应影响企业的增长,特别是在使用云平台时。