适合云化数据中心的备份容灾系统
适合云化数据中心备份容灾系统适合云化数据中心备份容灾系统 以虚拟化、 超融合、云平台等为形态的云化数据中心已经成为越来越多的企业机 构数据中心升级方案。据权威媒体统计,云每年以 25%的速度增加,其中虚拟 化渗透率大于 80%。云在按需交付、资源池化等方面有先天的优势,但随之也 带来更多的数据和业务安全风险。无论是自建的云还是公有云,每年都频繁发生 大量的数据安全和业务中断事故。 在备份容灾管理领域,一方面 IT 基础架构的云化变化速度已经大大超出了现有 的数据保护技术的变化速度, 而另一方面不少厂商又都声称自家的产品可以备份 云。 那么到底该如何选择真正适合云化数据中心的备份容灾系统,本文重点从以 下几个方面展开讨论。 什么是云化数据中心?什么是云化数据中心? 简单讲, 就是当业务需要,数据中心可以在数分钟内增加或减少业务所需要的计 算、存储、网络等资源。再简单讲,就是随时增加或减少可以安装部署业务应用 软件的服务器。 自建云化数据中心的方案有多种思路,如下: 1 1、虚拟化为中心的经典架构、虚拟化为中心的经典架构 这种方案是目前最主流的云化数据中心方案, 主要采用的方案就是虚拟化操作系 统、服务器与企业级集中式存储,该方案成熟度最高。这种方案,随着虚拟机规 模增加, 底层的集中存储会越来越感觉到不够用。这时候需要增加新的存储或服 务器部署,重新迁移或分布虚拟机系统。 2 2、以、以 OpenStackOpenStack 为代表的开源大集成架构为代表的开源大集成架构 这套体系接近公有云平台的体系, 主要的 3 个核心服务都采用高度弹性的方案来 构成。随着引入的服务越多,运维管理复杂度也大幅度提升。目前开源体系最大 的问题在于企业级运维管理的能力较弱,可靠性不能很好保障,可管理性差,易 用性方面门槛很高,需要高度依赖商业发行版企业来保障持续的运行。 这类平台通常是从几千到上万个虚拟机规模, 是一些大型企业在重点升级的云架 构方案。 3 3、各类公有云的企业部署版本、各类公有云的企业部署版本 国内的云计算公司,都相应推出了企业内部部署的版本,与OpenStack 的架构 类似,核心也包含3 大核心服务,以及各类上层应用服务。第2、第3 这类通常 是一些大型企业,或者技术运维能力很强的机构才会采用。通常需要企业自己配 置开发运维团队。 4 4、采用商业超融合的架构、采用商业超融合的架构 第 2、3 涉及到的硬件投入、软件投入以及人力投入都很大,一般的中小企业都 难以部署和运维。超融合把云计算里最核心的能力:虚拟化计算、软件定义网络 与分布式存储三大核心服务融合在一起, 形成 3-4 个服务器节点一组的模块化方 案。 通过分布式文件系统融合服务器集群管理技术,把服务器的存储能力连接起来, 形成可以被服务器共享的存储池,服务器内置的虚拟化操作系统。通过 Web 管 理控制台,可以为企业打造按需交付的云平台。 该方案无需外置其他存储设备,更容易交付和运维,企业自建私有云变得简单很 多。通常超融合方案按照 3 个服务器节点起进行部署,如果需要扩容,再按 3-4 个节点一组进行扩容。 云化数据中心与传统的数据中心有何不同?云化数据中心与传统的数据中心有何不同? 1 1、传统数据中心的典型结构、传统数据中心的典型结构 下面我们来看一看传统数据中心的架构示意图: 一般每台服务器上跑 1-3 个业务不等, 各业务通过不同的安装目录和不同网络端 口来隔离。所有服务器数据都存入 NAS/SAN 等集中式存储。 2 2、成本与运维效率对比、成本与运维效率对比 两种数据中心,由于底层架构不一样,无论在成本、效率、以及运维管理方法等 方面区别很大。 这也是为什么越来越多的企业机构加速数据中心云化, 只有这样才能更敏捷支持 业务发展需求,提高资源利用率。 3 3、数据备份和业务连续运行保护模型对比、数据备份和业务连续运行保护模型对比 传统数据中心和云化数据中心在保护模型上,区别非常大。了解这些区别后,才 有利于我们选择合适的保护方案。 当前的云化数据中心数据备份容灾现状当前的云化数据中心数据备份容灾现状 1 1、用物理机时代设计的保护模型保护云、用物理机时代设计的保护模型保护云 国内外一些厂家产品都源于物理机保护的模型,延展到虚拟化领域。其基本的架 构设计模型如下: 基本上就是一个简单的集成架构, 把备份软件部署到服务器上, 然后交付到客户。 增加了虚拟机备份支持,本质上,在保护架构设计上没有特别变化。 2 2、保护容量固定、保护容量固定 通常这类架构在底层选用的备份存储容量上,很固定。厂家在做方案时候,通常 会考虑预留较大的空间用于备份数据增长的需求。 这会带来两个问题,一是初次投入较高,二是无法适应云数据规模增长的需求。 最终空间会用满,这时候必须增加新的设备。增加新的设备,由于设备之间相互 独立。势必会带来维护、迁移和更多的数据存储开销。 3 3、备份策略模型笨重、备份策略模型笨重 传统备份方案有全量、增量、差异备份方式。由于一直以来,考虑到底层存储和 各种情况导致的数据错误, 厂商通常采用几种方式结合的方案来保护物理机模型 的备份数据。其中全量模型,会大幅度增加系统的存储开销,在云场景由于数据 量大数十倍,显然是不合适的。 4 4、恢复速度慢、恢复速度慢 物理机时代设计的数据恢复方案,通常考虑的是数据回写恢复的方式。这种方式 在数据规模不大的情况下,可以工作得很好。一旦数据规模很大的时候,这种方 式恢复效率非常低。 5 5、容灾粒度粗、容灾粒度粗 在传统物理机数据中心时代,关键业务要做容灾保护,通常采用的是存储级复制 方案。这种方案,在物理机时代工作得很好。通常一些重要业务如数据库等是独 享存储资源的。 在云化时代,所有的业务都共享存储,采用这种复制方案,显然是缺少优先级、 重要性区分。 在异地容灾效率方面,不能很好地解决业务重要性和业务带宽资源 分配的关联关系。 具备云化数据中心级保护能力的备份系统的八个特征具备云化数据中心级保护能力的备份系统的八个特征 特征一、支持虚拟化在线全增量即时合成模式的备份特征一、支持虚拟化在线全增量即时合成模式的备份 通过云平台输出的 API 来备份数据,而不是安装客户端去备份 Guest 虚拟机内 部数据。通过云平台输出的 API 来备份数据的兼容性好,数据一致性更能得到 保障。 在备份模型选择上,选用全增量模型备份是非常有必要。第一次采用全量备份, 第 2 次以后采用增量备份方式,可以最有效的降低数据读取量,减少网络传输, 最大程度提高备份系统的效率。 同时系统可以根据增量数据即时合成为全量版本, 用于快速恢复。 特征二、支持特征二、支持 Scale OutScale Out 模型的扩展方案模型的扩展方案 虽然可以采用插满硬盘槽位(ScaleUp)或多台组合的方案,来备份整个云数据 中心。但这不是最佳实践。这种方式会大幅度提高运维管理难度。人为的分割和 迁移数据、任务。规模越大,这种方案越难用。到了上千节点的规模,涉及数百 TB 到 PB 级数据,一般的方案需要多台设备(10 台到 20 台不等)组合到一 起,这种方案几乎难以实际运用。 应云而生的是 Scale Out 的横