灾备中心现在几乎成了服务器托管的标配。一般而言,传统的大型数据中心的容灾建设都采用“两地三中心”模式,即生产中心、同城备份中心和异地灾备中心,这种灾备模式的最大好处在于可以完整地保存数据,但其日益显现出一些问题。
当下流行的灾备模式是建设双活数据中心,即两个数据中心之间并没有明确的主备之分,两个中心都有生产、互为灾备。双活数据中心部署模式减少了IT资源和资金的浪费,可以更好地保障数据和应用的实时性以及业务连续性。
双活数据中心是一种主用数据中心和灾备数据中心的热备方式。灾备数据中心和主用数据中心之间的部署方式经历了冷备方式、半热备方式和热备方式三个发展演变过程。
(1)第一层:冷备方式
主用数据中心和灾备数据中心配置相同的硬件、系统、网络访问、数据存储等资源,当主用数据中心发生故障时,需要手动启用灾备数据中心的上述资源和服务。因此,衡量容灾能力的2个重要参数——RTO和RPO会很高,容易造成服务访问的长时间中断和数据的大量丢失,这种灾备模式也渐渐不再被使用。
(2)半热备方式
该模式下,灾备数据中心的应用已经启动,当主用数据中心故障时,应用访问的数据流自动切换到灾备数据中心,这时需要手动启用灾备数据中心的服务。半热备方式在冷备模式的基础上有效降低了RTO和RPO,但是仍旧不能满足当前应用零中断的要求,而且这种业务切换是非透明的,用户能够感知。
(3)热备方式
互联网的快速发展促使用户提高对应用访问的要求,因此行业对数据中心之间服务端的容灾能力要求越来越高。现在的灾备部署已经开始运用新的网络技术和虚拟化技术来支持主用数据中心和灾备数据中心之间的快速切换。在热备模式下两个数据中心之间的数据复制是实时的,它能保障服务瞬间切换的安全性和准确性,且用户对于这种切换是感知不到的。
相比传统的“两地三中心”灾备方式,双活数据中心是实现了最高级别的可用性。双活/多活中心可以实现数据零丢包、实时切换。而且双活数据中心不再设置专用的灾备资源,不同中心的资源同时承担生产和灾备,这大大提高了设备利用率。日常双活数据中心的运维资源都在进行生产,所以当一个中心发生灾难时,其他中心所有的流程、职责、设备资源、系统资源都不需做大的改动即可接管,只是运维工作量有所增加。传统的灾备只做数据层面的同步、异步复制,在其他技术层面不需要互联太多,而双活数据中心则要求在信息系统的各个层面都要紧密互联、互动。