生产级 VMware 虚拟化替换路线与评估
生产级 VMware 虚拟化替换路线与评估 近年来,越来越多的企业开始聚焦信息技术应用创新发展,“虚拟化”是业界在其发展过程中重点关注的内容之一。尤其在企业IT基础架构从传统架构向分布式架构转型的过程中,如果能同时采用自主研发的虚拟化系统,将实现一举两得的效果。现阶段,尽管市场上出现了许多与虚拟化相关的改进方案,但多数方案仍仅仅停留在支持虚拟桌面、开发测试等一般业务的层面,并未能真正解决企业面临的痛点问题。对此,本文尝试分析了在生产级环境中采用自主虚拟化技术的典型路线及评估要点,希望能够为国内企业在进行方案选型时提供有益参考。 以虚拟化为核心的基础设施更新策略研究 虚拟化应用系统的核心是Hypervisor和存储。在虚拟化系统方面,VMware的vSphere作为最成熟的Hypervisor,在当今的虚拟化市场上占据着举足轻重的地位。因此,企业在面临潜在的“停服”风险时,也必须首先考虑用什么样的技术和产品可以支撑 vSphere留下的空白。此外,与应用工作负载关联最紧密的即为数据,将应用从vSphere虚拟化迁移到其他系统上时,必须保持数据的完整性和一致性。因此,应当同时考虑是否需要更换相关的存储产品。 除了Hypervisor和存储以外,在生产环境中的虚拟化应用体系中还涉及到网络、管理、自动化、备份、恢复等一系列相关功能和组件,但他们是次要因素。因此,首先要确定虚拟化核心和存储改造的方式和方法,并尽量使现有应用平滑迁移到新的虚拟化系统和存储上,之后再考率其他组件的替代产品,分阶段、分步骤完成所选全部产品组件在生产环境的集成。 虚拟化核心系统和存储设施更新的具体思路可以归纳为以下两条: 1.引入自主虚拟化软件并兼顾存储 在虚拟化应用的部署环境中,大部分企业均采用了集中式 SAN 存储与计算虚拟化产品相配合,在虚拟机与存储之间通过iSCSI、NFS等标准接口连接。由此可见,虚拟化应用的存储改造,将主要面向集中式SAN存储产品。根据2021年上半年的IDC报告显示,中国企业级外置存储市场排名前三名分别为华为、新华三和浪潮,他们均拥有全自研的存储产品,这些产品被广泛地用在虚拟化应用系统中。基于此,在虚拟化系统Hypervisor方面,建议更多选择自主开发的、成熟的产品;而正在使用的国产集中式SAN存储设备则可以选择性保留,减少技术改造中的数据迁移工作量,在今后再择机对这些存储设备升级换代。 值得注意的是,虽然目前国内IT厂商具备了自主研发中高端存储的实力,但之前大多是基于x86平台研发,而基于海光、鲲鹏、飞腾等CPU硬件,则更是需要全新设计。此外,由于SAN存储系统的复杂性,其在应对快速增长的弹性需求时往往会显得捉襟见肘,集中式SAN存储的“分布式”和“软件定义”转型已是大势所趋。在这种转型中,企业也可以选择先完成存储部分的转型,沿用现有Hypervisor(如vSphere),再逐步实现全面更新和改造。 2.置换为超融合HCI架构 在虚拟化和存储的改造过程中,部分企业选择将“计算与存储分离”的方式直接置换为更加简单、弹性敏捷的超融合(HCI)架构。IDC刚刚公布的2021年排名靠前的国产超融合软件分别来自华为、新华三、深信服、浪潮和 SmartX。其中,SmartX作为唯一的独立超融合厂商,在金融行业的超融合软件市场占有率排名第一,以良好的口碑被IDC评价为“在金融行业得到青睐”。 从SmartX等厂商的金融行业案例可以看到,超融合方案已经得到生产环境的验证。同时,选择自主研发的超融合产品不仅意味着实现了虚拟化改造,更是完成了从传统架构到分布式架构和软件定义方式的转型。国产超融合方案普遍兼容国产自主研发的服务器,实现了软硬件解耦并支持快速适配,且随着国产服务器产品的不断升级,超融合软件也可以快速迭代。同时,分布式架构可通过软件方式解决系统冗余问题,并整体提升资源池性能,从而弥补国产CPU目前在性能方面的不足。此外,超融合架构因包含了虚拟化与存储这两个核心组件,还可以同时实现虚拟化层和存储层改造,并简化虚拟化计算和存储层次结构,弹性更好、风险更低、落地更容易。 以上梳理了对于虚拟化和存储进行更新改造的两条路线。但是,对现有虚拟化应用体系中使用的几种乃至十几种相关软硬件进行逐一评估,还要制定更新策略和方法,就具有极高的难度。 如果跳出“组件级”的思维,采用私有云或专属云方式对现有虚拟化环境进行整体改造,也可以归纳出两条技术路线: 1.转向整体私有云方案 当前,国内的整体私有云解决方案大部分以OpenStack为基本技术栈进行开发。OpenStack 全面的云方案可以同时管理 IaaS 层的资源池(服务器、存储和网络),且不再需要分别从计算、存储或网络的角度考虑对 VMware 的替换路线图,而是从整体“私有云”维度进行重建。根据IDC 2021年发布的软件定义计算软件市场半年跟踪报告,华为、新华三、浪潮、EasyStack 和九州云在主要体现 OpenStack 技术路线的“云系统软件”分类中排名前五。从开源角度,OpenStack方案的优势是可以快速从社区获得最新的功能。但另一方面,目前基于Openstack、Ceph构建的私有云方案因模块众多、商用化程度有限、稳定性欠佳,大部分部署在开发测试环境,不能实现对用户架构的真正统一,很难达到云化转型的预期效果,且在热度过后,部分理性企业已经开始更加谨慎地选择类似架构。 2.依托公有云技术栈的专属云 专属云(Dedicated Cloud)是指以公有云为基础,面向特定行业与特殊需求,为特定用户提供全栈资源池的专属解决方案。专属云支持用户在公有云上独占机架、服务器和网络,并通过基础设施隔离获得资源的专属使用权和安全性,但专属云的建设和运维仍交由公有云提供商承担。总体而言,专属云打消了国内企业/单位对公有云资源共享模式带来的安全合规、数据私密性等一系列顾虑,并在规模化部署、快速交付和集中运维方面支持企业享受公有云带来的技术红利。当前,国内的主要公有云服务商都可以提供专属云服务,通常面向规模较大的国企、央企、集团公司或金融机构,即由于专属云所依赖的公有云技术在管理平面的开销较大,起步即要求几十个节点(管理节点的要求),导致一般用户往往不具备运维这种大规模云平台的能力。 以上两种整体技术改造的路线,不仅需要对基础设施层进行重建,还需开展应用和数据迁移,甚至有很大可能需要重构应用。 现阶段,无论采用何种方案和产品对虚拟化应用进行改造,都难以在功能特性和使用体验方面保持与原有系统的完全一致。因此,最终决策必然是在认真评估后做出的主动调整,包括放弃部分非核心、不必要的功能,或通过应用层、架构层改造以达到同样的效果。 生产级虚拟化方案评估要点 针对前述方法,不同企业可根据具体情况进行适用程度分析和选择,但无论哪种行业、何等规模的改造,都必须以“符合生产级要求”作为方案的核心评估准则:一是方案的核心要求是“生产级”,如果选择的改造方案在性能、可靠性、安全性和支持力度方面不能达到“生产级”标准,那么改造对业务带来的负面影响将得不偿失;二是落地的可行之路是“取