HiDC解决方案,用于基于华为企业设备构建数据中心的现代化ICT基础架构

纵观2020年推出的所有现代华为企业解决方案,我们将继续探讨有关个人创意和产品的更具体,更详细的故事,这些故事和故事可作为大型企业和政府机构进行数字化转型的基础。今天-关于华为提议在哪些基础上构建数据中心的概念和技术。



在“互联世界”时代,数据存储和处理任务需要在数据中心生命周期的所有阶段采用新方法。它们必须同时变得更简单和“更智能”,以应对分配给他们的角色,这些角色是全球数字经济基础设施的核心要素。

在2018年,人类存储了33 ZB的信息,但到2025年,其总容量将增长五倍以上。ICT基础设施开发方面的三十年经验使华为能够为不断增长的“数据海啸”做好准备,并为其合作伙伴和客户提供智能数据中心的概念,包括其建设,运营和维护的所有阶段。此概念的元素以通用名称HiDC组合。



数字化


网上有个新鲜的玩笑:首席执行官,首席技术官,董事会是谁最大程度地促进了公司的数字化转型?冠状病毒流行!只有懒惰的人不会举行网络研讨会,不会写文章,也不会告诉您如何做。但是所有这些都是反应性的行动。一些事先准备好了。

并不是为了吹牛-出于客观原因,让我们以我们公司为例,该公司几年前开始大规模进行数字化转型。目前,我们能够将几乎所有员工转移到家里,而不会降低效率。十天后在武汉建了一家医院的故事就是预兆。在那里,数字化转型的事实证明了所有IT系统都在三天内部署完毕。因此,数字化转型不是关于“何时”和“为什么”,而是关于“如何”。



建筑方法,而不是自发发展


当我们开始构建某个系统时,我们面临的主要问题是什么?到目前为止,我们所有的客户都在以结合业务任务与应用程序服务和IT解决方案的方式来工作。如果仅通过添加各种模块来创建这样一个复杂的系统,就很难获得一个大致的功能概念。为了将系统构建为单个生物,首先,需要一种架构方法。我们将其体现在HiDC解决方案的思想中。



最大值和最小值


整个HiDC结构是两个主要部分。首先是您习惯使用经典基础架构华为看到的内容。第二部分的元素最容易由术语“智能数据”组合。

为什么需要这个?如今,许多公司积累了大量的信息,这些信息通常是通过各种“布局”分散或访问的。是的,至少要使用常规数据库。向您的数据库管理员询问这些数据库如何互连以及如何在BI系统中使用来自它们的信息来制定业务决策。出人意料的是,DB之间的连接通常非常弱,并充当单独的“孤岛”。因此,首先,我们考虑可以采用哪种体系结构解决此问题。



HiDC架构设计原则


考虑HiDC的基本设计原理。首先,它不仅对特定方向的专家有用,而且对解决方案的架构师来说很有用,该解决方案可以覆盖整个全景图。

最常见的是融合网络单元和数据管理单元。在这里已经出现了一个解决方案架构师很少考虑的概念-数据生命周期管理。他从经典数据库迁移到许多其他系统,包括云和边界(边缘)计算。

. — , . , «» — , . ( — ).


当我们拥有HiDC结构的所有六个块时,这是很棒的。但是,客户通常在以前创建的环境中工作。但是,即使从上面的电路中使用一个块也可以取得成果。而且,如果添加第二,第三等,则将开始出现协同效应。单独使用网络和分布式存储系统的组合将提供更高的性能和更低的延迟。块方法使​​我们不能像行业中经常发生的那样随机发展,而是使用集成架构方法。好吧,模块本身的开放性为选择最佳解决方案提供了自由。



融合网络时代


最近,在世界和俄罗斯市场,我们越来越热衷于推广融合网络的概念。今天,我们的客户已经在RoCEv2(融合以太网v2上的RDMA)上使用融合解决方案来构建分布式软件定义的存储系统。这种方法的主要优点是它的开放性,不需要创建无限数量的完全不同的网络。

你为什么以前没有这样做呢?回想一下以太网标准是在1969年开发的。半个世纪以来,它积累了很多问题,但是华为学会了解决这些问题的方法。现在,由于采取了许多其他步骤,我们可以将以太网用于关键任务应用,高负载解决方案等。



从DCN到DCI


下一个重要趋势是引入DCI(数据中心互连)的协同效应。在俄罗斯,与中国不同,到目前为止,只有电信运营商才能找到类似的东西。当客户考虑为数据中心使用网络解决方案时,他们通常不会在单点存在的位置上充分注意光网络与经典IP解决方案的深度集成。他们使用熟悉的解决方案在IP层上工作,这足以满足他们的需求。

那么为什么需要DCI?想象一下DWDM主机管理员和网络管理员是独立行动的。在某些时候,任何人发生的故障都可能严重降低您的容错能力。如果我们使用协同原理,则IP路由将考虑到光网络上发生的情况进行。这种智能服务的使用大大提高了整个系统可用性的九位数。

DCI的另一个主要优势是其巨大的性能优势。总结范围C和L的可能性,您可以获得约220 lambda。鉴于我们目前的解决方案允许通过每个lambda传输高达400 Gbit / s的速度,即使是大型企业客户,这种储备也不可能很快耗尽。将来,在同一设备上将有可能达到800 Gb / s。

我们通过经典的开放式接口提供的一般可控性提供了更多的便利。NETCONF不仅管理交换机,而且还管理光压缩设备,这使得可以在所有级别实现融合,并将系统视为一种智力资源,而不是“盒子”。



边缘计算更重要


许多人听说过边缘计算。与那些涉及云和传统数据中心的人员一样,应该牢记,我们最近看到边界计算方向发生了重大变化。

是什么原因造成的?让我们看一下通用的实现模型。现在,他们谈论很多关于“智能城市”,“智能房屋”等的概念。该概念使开发商可以创造附加值并提高房地产价格。 “智能家居”识别其居民,进出,为他提供一些服务。据统计,此类服务使公寓价格上涨了约10-15%,并且总体上能够推动新商业模式的发展。另外,之前也有人提到过自动驾驶仪的概念。很快,5G和Wi-Fi 6技术的发展将确保在智能家居,汽车和产生边界计算的主要数据中心之间传输数据的极低延迟。这意味着有可能执行大量与严肃数据处理有关的操作。为了解决这些问题,特别是,您可以使用已经运送到俄罗斯的神经处理器。

刚刚概述的趋势前景不可否认。假设有一个智能的城市交通管理系统,可以切换交通信号灯,调节特定街道的交通负荷,甚至在紧急情况下采取适当措施。



现在,我们转向提供用于实现HiDC概念的资源。

计算方式


当我们需要实现标准计算系统时,具有x86架构的处理器当然会使用它。但是,一旦有了自定义的需求,就该考虑更多样化的解决方案了。

因此,例如,由于内核数量众多,ARM处理器非常适合具有高度并行性的应用程序。多线程可使生产率提高约30%。

如果低延迟对我们至关重要,那么FPGA便应运而生。

解决机器学习问题时,主要需要神经处理器。如果对于特定的实现,我们需要16个机架,每个机架都装有8个装有神经处理器的服务器,那么基于x86架构的同一级别的解决方案将需要(!)大约128个机架。如您所见,各种各样的计算类型使您可以仔细选择硬件平台。



数据存储


第二年,华为一直在呼吁合作伙伴,客户,行业同仁按照“仅闪存”的原则构建存储系统。而且,我们的大多数客户仅在旧解决方案中或很少使用的存档数据中使用机械主轴驱动器。

闪存系统也在不断发展。诸如Intel Optane之类的存储类内存(SCM)系统正在投放市场。中国和日本制造商展示了有趣的发展。目前,SCM在处理级别方面优于所有其他解决方案。到目前为止,只有高昂的成本并不能使它们在任何地方使用。

同时,我们看到,不仅必须在有条件的后端,而且还要在前端,必须提高存储质量。现在,事实上,在新的实现中,我们通常提供和使用通过以太网直接访问内存的机制,但是我们看到了客户的要求,因此,到今年年底,我们将开始更频繁地在Fabrics上使用NVMe。而且,端到端提供了一种通用的体系结构,该体系结构当然必须是高性能的并且能够抵抗控制器的故障。

OceanStor Dorado Storage是我们的旗舰产品之一。内部测试表明,它提供了2,000万IOPS的性能,同时在八个控制器中的七个发生故障的情况下仍可保持可操作性。

为什么功率这么大?让我们看一下当前情况。几个月来,中国人在隔离制度上花费了更多的时间在家里。目前,互联网流量平均增长了30%,在某些省份甚至翻了一番。各种网络服务的消耗量已经增加。在某个时候,这些银行开始承受严重的额外负载,而他们的存储系统还没有准备好。

显然,现在并不是每个人都需要2000万IOPS。但是明天会发生什么?我们的智能系统最大程度地发挥了神经处理器的潜力,以确保流量紧凑,重复数据删除,优化和快速数据恢复。

核心网


正如我们在上一篇文章中提到的那样,2020年将是我们核心网​​络的一年。许多客户,特别是应用程序服务提供商(ASP)和银行,已经在考虑其应用程序如何在与数据中心以及数据中心之间的通信方面精确地工作。这里有一个新的核心网络可以解救。例如,以最大的中国银行为例,它们切换到简化的支持系统,该系统不使用十几种不同的协议进行数据中心之间的通信,而相对而言,使用的是OSPF和SRv6。尽管该组织获得了相同的服务。



智力资源


数据如何使用?直到最近,还存在一个由零散的数据库组成的分散系统:Microsoft SQL,MySQL,Oracle等。为了与它们一起工作,使用了大数据字段中的解决方案,可以组合这些数据,对其进行收集并进行处理。所有这些都给资源带来了沉重的负担。

同时,没有机制可以在事件发生时对数据执行操作。解决方案是开发数据生命周期管理(DLM)原则。

每个人都听说过数据湖。随着从数据管理到数据治理的过渡,“数字湖”开始迅速“变得更加明智”。其中包括对华为解决方案的感谢。在以下材料中,我们将向您介绍我们使用的整个软件技术。现在需要注意的是,正是由于使用了“智能”数据生命周期管理,我们才能简化网络和服务器的使用,并学习如何构建端到端架构,以更好地理解处理数据的原理。



数据中心工程基础架构


我们将发布有关工程基础架构的单独材料,但是,在今天的主题中,我们要提及与HiDC概念相关的那些更改。

长期以来,由于锂电池着火的危险性,禁止在数据中心的应急和备用电源系统(PSA)中使用锂电池。任何机械损坏或违反电池完整性的操作都可能导致火灾和不可预知的后果。就这一点而言,PSA配备了具有低比电荷密度且具有较大质量的过时酸电池。

华为的新型应急和备用电源系统采用了具有智能主动控制功能的智能磷酸铁锂(LFP)电池。在相同的容量下,它们的体积是酸性电池的三倍。它们的生命周期为10到15年,这尤其可以减轻它们造成的环境负担。SmartLi生态系统中获得专利的控制系统允许使用混合动力系统,该混合动力系统由旧电池和新型电池组成,开关系统允许对PSA结构进行“热”更改,并连续保留备用功能。



智能操作


操作HiDC基础结构的原则的重要组成部分是智能自我修复的思想。在一个我们过去的出版物,我们提到的O&M 1-3-5智能平台,这不仅能够检测和分析系统中的不良事件,但也提供了管理员完全自动化的解决问题的几种选择。

自省功能使您可以在一分钟内发现问题。花了三分钟进行分析,并在五分钟内提出了更改系统状态的建议。

假设某个操作员错误导致流程的闭环形成,从而将虚拟化场的性能从100%降低到77%。数据中心管理员在其仪表板上收到一条消息,其中包含问题的完整可视化信息,包括受有害进程影响的资源的网络图。此外,管理员可以手动纠正这种情况,也可以使用向他建议的几种自动恢复方案之一。


系统知道可以在不到十分钟的时间内实施的75种此类情况,而且它们涵盖了数据中心所遇到问题的90%。此时,工程师可以放心地接听有关客户的电话,并确信该服务将在任何时候恢复。



HiDC的新关键产品


除了软件产品,它还应包括在基础架构级别运行的关键解决方案。首先,我们需要提及Atlas系列AI集群中使用的神经处理器,以及基于NPU和GPU的服务器。

此外,您无法再提及Dorado及其在同类产品中的出色表现,这足以满足许多年的需求。在后苏联时代尤其如此,在极少数情况下,习惯上只有在某些东西完全停止工作时才对其进行更新。这解释了单个存储系统的寿命,可以达到十年。为了在十年内提供高质量的服务,Dorado必须具备巨大的生产力。



各方面的创新


在选择特定的基础架构解决方案时,不应忘记其进一步开发的体系结构和场景。来自不同制造商的不同产品不能保证已经针对共享进行优化的解决方案将提供预期的协同效应。

基础结构必须基于正确的技术。 “正确”包括开放式,提供高吞吐量,在高负载下稳定运行。例如,对于数据中心,总能耗与IT负载的良好比率很重要。为了实现所有这些目标,您需要选择环境和组件。在现代条件下,这也意味着人工智能的广泛使用。
根据我们的观察,在华为的战略客户中,仍然不使用机器学习系统的人数减少了。没有ML,您将无法最大限度地利用累积数据的货币化。
货币化系统可以不同:对于银行-提供新的有针对性的产品,为电信运营商-提供个性化服务和忠诚度,为政府客户-高质量的数据生命周期管理以及与其他组织的高水平交互。毕竟,数据管理模型还没有简化为配置防火墙并长时间确保其数据库的网络可见性。

从构想到现有数据中心


建设标准数据中心最多需要一年半的时间。由于使用了一组通用名称为FusionDC 2.0的解决方案,我们的生产周期使我们可以更快地完成此任务。设计,高级设计的开发,IT负载的所有元素的组装均在工厂直接进行。在短时间内,海运集装箱设备从中国运往俄罗斯。结果,仅需四到五个月即可创建交钥匙数据中心。

预制云数据中心的想法也很有趣,因为有可能分阶段开发数据中心,并向其中添加必要的功能块。这种方法嵌入在HiDC概念本身中。


为了不使调查资料变成数据表,有关HiDC的更多信息,建议您访问我们的网站。在这里,您将找到我们所讨论的方法,产品和解决方案的实现的描述和示例。资料越多,您对该网站的访问级别越高。如果您被分配为“合作伙伴”状态,则可以下载HiDC路线图,技术演示和视频。

我们敢于假设本文的大多数读者具有网络架构师的能力。他们一定会对访问我们的设计区感兴趣在那里,我们详细讨论了如何根据华为验证设计(HVD)的规则构建网络基础架构。可下载的指南将帮助您彻底了解公司解决方案的工作方式。不要忘记仅在未经授权的情况下您将获得较少的材料。

***


不仅在俄语领域,而且在国际层面上,都有许多网络研讨会,将帮助您找到自己的出路。我们与他们共享有关我们产品和业务实践的信息。特别是,我们谈到在许多服务链破裂的背景下,华为如何继续向不同国家持续交付其产品。例如,最近有一种情况是,新制造的数据中心设备仅在三周内就到达了莫斯科客户。

在此处获得四月份的网络研讨会列表

All Articles