Solución HiDC para construir una infraestructura moderna de TIC de centros de datos basados ​​en equipos Huawei Enterprise

Con una vista panorámica de todas las soluciones modernas de Huawei Enterprise introducidas en 2020, pasamos a historias más específicas y detalladas sobre ideas y productos individuales que pueden servir como base para la transformación digital de grandes empresas y agencias gubernamentales. Hoy, sobre qué conceptos y tecnologías Huawei propone construir centros de datos sobre la base.



En la era del "mundo conectado", las tareas de almacenamiento y procesamiento de datos requieren nuevos enfoques en todas las etapas del ciclo de vida del centro de datos. Al mismo tiempo, deben volverse más simples e "más inteligentes" para poder cumplir con el papel que se les asigna como elementos centrales de la infraestructura de la economía digital global.

En 2018, la humanidad almacenó 33 zettabytes de información, pero para 2025 su volumen total debería crecer más de cinco veces. Tres décadas de experiencia en el desarrollo de infraestructuras TIC permitieron a Huawei prepararse bien para el creciente "tsunami de datos" y ofrecer a sus socios y clientes el concepto de un centro de datos inteligente, que incluye todas las etapas de su construcción, operación y mantenimiento. Los elementos de este concepto se combinan bajo el nombre general HiDC.



Digitalizarlo


Una nueva broma recorre la web: ¿quién ha acelerado más la transformación digital de su empresa: CEO, CTO, junta directiva? La epidemia de coronavirus! Solo el perezoso no celebra seminarios web, no escribe artículos, no dice cómo y qué hacer. Pero todas estas son acciones reactivas. Algunos preparados de antemano.

No por alardear: por razones objetivas, citemos como ejemplo nuestra empresa, en la que la transformación digital se lanzó a gran escala hace varios años. Actualmente, podemos transferir a casi todos los empleados al trabajo desde casa sin pérdida de eficiencia. La historia con un hospital construido en Wuhan en diez días es indicativa. Allí, la transformación digital se demostró en el hecho de que todos los sistemas de TI se implementaron en tres días. Entonces, la transformación digital no se trata de "cuándo" y "por qué", sino de "cómo".



Enfoque arquitectónico en lugar de desarrollo espontáneo


¿Cuáles son los principales problemas que enfrentamos cuando comenzamos a construir un sistema determinado? Hasta ahora, todos nuestros clientes están trabajando en un modo de combinar tareas comerciales con servicios de aplicaciones y soluciones de TI. Es bastante difícil tener una idea general del funcionamiento de un complejo de este tipo si se creó simplemente agregando varios bloques. Y para construir un sistema como un solo organismo, en primer lugar, se necesita un enfoque arquitectónico. Lo encarnamos en la ideología de nuestra solución HiDC.



Valor máximo y valor mínimo


Toda la estructura de HiDC es dos sectores principales. El primero es lo que estás acostumbrado a ver con Huawei, una infraestructura clásica. Los elementos del segundo segmento se combinan más fácilmente con el término "datos inteligentes".

¿Por qué se necesita esto? Hoy en día, muchas empresas acumulan enormes cantidades de información, a menudo dispersas o accesibles a través de varios tipos de "colocación". Sí, tome al menos bases de datos regulares. Pregunte a los administradores de su base de datos cómo estas bases de datos están interconectadas y cómo usar la información de ellas en los sistemas de BI para tomar decisiones comerciales. Sorprendentemente, los DB a menudo están muy poco conectados entre sí y funcionan como "islas" separadas. Por lo tanto, en primer lugar, pensamos en qué enfoques arquitectónicos se podría eliminar este problema.



Principios de diseño de arquitectura HiDC


Considere los principios básicos de diseño de HiDC. En primer lugar, será útil no para especialistas de ninguna dirección en particular, sino para arquitectos de soluciones que pueden cubrir todo el panorama con una mirada.

Las más comunes son las unidades de red convergentes y las unidades de gestión de datos. Y ya aquí surge un concepto que los arquitectos de soluciones rara vez piensan: la gestión del ciclo de vida de los datos. Desde las bases de datos clásicas, migró a muchos otros sistemas, incluida la computación en la nube y los límites (edge).

. — , . , «» — , . ( — ).


Es genial cuando tenemos a nuestra disposición los seis bloques de la estructura HiDC. Sin embargo, a menudo los clientes trabajan en un entorno creado previamente. Sin embargo, usar incluso un bloque del circuito anterior puede dar frutos. Y si agrega un segundo, tercero, etc., comenzará a aparecer un efecto sinérgico. La combinación de una red y un sistema de almacenamiento distribuido solo brindará un mayor rendimiento y una menor latencia. El enfoque de bloque nos permite desarrollarnos no al azar, como sucede a menudo en la industria, sino usando un enfoque arquitectónico integrado. Bueno, la apertura de los bloques en sí proporciona libertad para elegir la solución óptima.



Tiempos de red convergentes


Recientemente, en los mercados mundial y ruso, estamos promoviendo cada vez más celosamente el concepto de redes convergentes. Hoy en día, nuestros clientes están utilizando soluciones convergentes en RoCEv2 (RDMA sobre Converged Ethernet v2) para construir sistemas distribuidos de almacenamiento definidos por software. La principal ventaja de este enfoque es su apertura y la ausencia de la necesidad de crear un número indefinido de redes dispares.

¿Por qué no has hecho esto antes? Recuerde que el estándar de Ethernet se desarrolló en 1969. Durante medio siglo, ha acumulado muchos problemas, pero Huawei aprendió a resolverlos. Ahora, gracias a una serie de pasos adicionales, podemos usar Ethernet para aplicaciones de misión crítica, soluciones altamente cargadas, etc.



De DCN a DCI


La siguiente tendencia importante es el efecto sinérgico de la introducción de DCI (Data Center Interconnect). En Rusia, a diferencia de China, algo similar hasta ahora solo se puede encontrar entre los operadores de telecomunicaciones. Cuando los clientes consideran soluciones de red para el centro de datos, generalmente no prestan la debida atención a la integración profunda de las redes ópticas y las soluciones IP clásicas dentro de un único punto de presencia. Utilizan soluciones familiares que funcionan en la capa de IP, que es suficiente para ellos.

¿Por qué entonces necesitas DCI? Imagine que el administrador de host DWDM y el administrador de red actúan de forma independiente. En algún momento, la falla que se les ocurrió a cualquiera de ellos puede reducir seriamente su tolerancia a fallas. Y si usamos el principio de sinergia, el enrutamiento IP se lleva a cabo teniendo en cuenta lo que sucede en la red óptica. El uso de un servicio tan inteligente aumenta significativamente el número de nueves en el nivel de disponibilidad de todo el sistema.

Otra ventaja importante de nuestro DCI es su amplio margen de rendimiento. Resumiendo las posibilidades de los rangos C y L, puede obtener alrededor de 220 lambdas. Es poco probable que dicha reserva se agote rápidamente incluso por un gran cliente corporativo, dado que nuestra solución actual permite transferir hasta 400 Gbit / s a ​​través de cada lambda. En el futuro, con el mismo equipo será posible alcanzar 800 Gb / s.

La capacidad de control general que brindamos a través de interfaces clásicamente abiertas brinda una conveniencia adicional. NETCONF gestiona no solo los interruptores, sino también los dispositivos de compactación óptica, lo que permite lograr la convergencia en todos los niveles y percibir el sistema como un recurso intelectual, en lugar de un "conjunto de cajas".



Edge computing es más importante


Muchos han escuchado sobre Edge Computing. Y aquellos involucrados en la nube y los centros de datos clásicos, debe tenerse en cuenta que recientemente hemos visto un cambio serio en la dirección de la computación de límites.

¿Qué causó esto? Veamos los modelos generales de implementación. Ahora hablan mucho sobre "ciudades inteligentes", "hogares inteligentes", etc. Este concepto permite al desarrollador crear valor agregado y aumentar el precio de la propiedad. "Smart Home" identifica a su residente, lo deja entrar y sale, le brinda algunos servicios. Según las estadísticas, dichos servicios agregan aproximadamente un 10-15% al ​​precio de los apartamentos y, en general, pueden impulsar el desarrollo de nuevos modelos de negocio. Además, anteriormente se decía sobre los conceptos de pilotos automáticos. Pronto, el desarrollo de las tecnologías 5G y Wi-Fi 6 garantizará una latencia extremadamente baja en la transferencia de datos entre hogares inteligentes, automóviles y el principal centro de datos que produce computación en la frontera. Esto significa que será posible realizar una cantidad mucho mayor de operaciones relacionadas con el procesamiento serio de datos. Para resolver tales problemas,en particular, puede usar procesadores neurales que ya se envían a Rusia.

Las perspectivas para la tendencia que se acaba de describir son innegables. Imagine, por ejemplo, un sistema inteligente de gestión del transporte urbano que pueda cambiar los semáforos, regular las cargas de tráfico en calles específicas o incluso tomar las medidas adecuadas durante situaciones de emergencia.



Ahora veamos los recursos con los que brindamos la implementación del concepto HiDC.

Cálculos


Cuando necesitamos implementar un sistema informático estándar, los procesadores con arquitectura x86, por supuesto, lo están utilizando. Pero tan pronto como surja la necesidad de personalización, es hora de pensar en soluciones más diversas.

Entonces, por ejemplo, los procesadores ARM, debido a la gran cantidad de núcleos, son excelentes para aplicaciones con un alto grado de paralelismo. El subprocesamiento múltiple proporciona una ganancia de productividad de aproximadamente el 30%.

Si la baja latencia es crítica para nosotros, los FPGA se destacan.

Los procesadores neuronales son principalmente necesarios para resolver problemas de aprendizaje automático. Si para una implementación específica necesitamos 16 racks con 8 servidores cada uno lleno de neuroprocesadores, entonces una solución del mismo nivel basada en la arquitectura x86 requeriría (!) Alrededor de 128 racks. Como puede ver, una amplia variedad de tipos de cálculos le hacen elegir cuidadosamente las plataformas de hardware.



Almacenamiento de datos


Por segundo año, Huawei ha estado llamando a socios, clientes, colegas de la industria para construir sistemas de almacenamiento de acuerdo con el principio de Flash Only. Y la mayoría de nuestros clientes usan unidades de husillo mecánico solo en soluciones antiguas o para datos de archivo raramente utilizados.

Los sistemas flash también están evolucionando. Los sistemas de memoria de clase de almacenamiento (SCM) como Intel Optane están llegando al mercado. Desarrollos interesantes son demostrados por fabricantes chinos y japoneses. Actualmente, SCM es superior en clase de procesamiento a todas las demás soluciones. Hasta ahora, solo el alto costo no permite que se usen en todas partes.

Al mismo tiempo, vemos que la calidad del almacenamiento debe mejorarse no solo en el backend condicional, sino también en el front-end. Ahora, de facto, en las nuevas implementaciones, generalmente ofrecemos y usamos mecanismos para el acceso directo a la memoria a través de Ethernet, pero vemos una solicitud de los clientes y, por lo tanto, más cerca del final del año, comenzaremos a usar NVMe sobre Fabrics con más frecuencia. Además, de extremo a extremo, para proporcionar una arquitectura común, que, por supuesto, debe ser de alto rendimiento y resistente a la falla de los controladores.

OceanStor Dorado Storage es uno de nuestros productos estrella. Las pruebas internas han demostrado que proporciona un rendimiento al nivel de 20 millones de IOPS, al tiempo que mantiene la operatividad en caso de falla de siete de los ocho controladores.

¿Por qué tanto poder? Veamos la situación actual. Desde hace varios meses, los chinos han pasado mucho más tiempo en casa en relación con el régimen de aislamiento. El tráfico de Internet en este momento aumentó en un promedio del 30%, y en algunas provincias, incluso se duplicó. El consumo de una variedad de servicios de red ha aumentado. Y en algún momento, los mismos bancos comenzaron a experimentar una carga adicional grave, para la cual sus sistemas de almacenamiento no estaban listos.

Está claro que no todos necesitan 20 millones de IOPS ahora. ¿Pero qué pasará mañana? Nuestros sistemas inteligentes maximizan el potencial de los procesadores neuronales para garantizar la compactación del tráfico, la deduplicación, la optimización y la recuperación rápida de datos.

Red de núcleo


2020, como mencionamos en el artículo anterior, será el año de las redes centrales para nosotros. Muchos clientes, especialmente los proveedores de servicios de aplicaciones (ASP) y los bancos, ya están pensando en cómo funcionarán sus aplicaciones precisamente en términos de comunicación con centros de datos y entre centros de datos. Aquí una nueva red central viene al rescate. Como ejemplo, tomemos los bancos chinos más grandes que cambiaron a sistemas de soporte simplificados que usan no una docena de protocolos diferentes para la comunicación entre centros de datos, sino, relativamente hablando, un par: OSPF y SRv6. A pesar de que la organización recibe el mismo conjunto de servicios.



Recursos intelectuales


¿Cómo usar los datos? Hasta hace poco, había un sistema fragmentado de bases de datos dispares: Microsoft SQL, MySQL, Oracle, etc. Para trabajar con ellos, se utilizaron soluciones del campo de datos grandes que podían combinar estos datos, recopilarlos y trabajar con ellos. Todo esto creó una gran carga de recursos.

Al mismo tiempo, no existía ningún mecanismo para realizar operaciones con datos cuando ocurría un evento. La solución fue desarrollar los principios de gestión del ciclo de vida de los datos (DLM).

Todos han oído hablar de los lagos de datos. Con la transición de la gestión de datos a la gobernanza de datos, los "lagos digitales" comenzaron a "hacerse más sabios" rápidamente. Incluyendo gracias a las soluciones de Huawei. En los siguientes materiales, le informaremos sobre el conjunto completo de tecnologías de software que utilizamos. Ahora es importante tener en cuenta que fue el uso de la gestión "inteligente" del ciclo de vida de los datos lo que nos permitió simplificar el uso de nuestra red y servidores, así como aprender a construir arquitecturas de extremo a extremo para comprender mejor los principios de trabajar con datos.



Infraestructura de ingeniería del centro de datos


Publicaremos materiales separados sobre infraestructura de ingeniería, sin embargo, en el contexto del tema de hoy, nos gustaría mencionar aquellos cambios que están relacionados con el concepto HiDC.

Durante mucho tiempo, se prohibió el uso de baterías de litio en los sistemas de suministro de energía de emergencia (PSA) del centro de datos debido a su alto riesgo de incendio. Cualquier daño mecánico o violación de la integridad de la batería podría provocar incendios y consecuencias impredecibles. En este sentido, los PSA estaban equipados con baterías de ácido obsoletas que tenían una baja densidad de carga específica con una gran masa.

Los nuevos sistemas de energía de emergencia y respaldo de Huawei utilizan baterías inteligentes de fosfato de hierro y litio (LFP) con control proactivo inteligente. Con la misma capacidad, ocupan tres veces menos volumen que las baterías ácidas. Su ciclo de vida es de 10 a 15 años, lo que, entre otras cosas, reduce la carga ambiental que crean. El sistema de control patentado en el ecosistema SmartLi permite el uso de sistemas híbridos que consisten en conjuntos de baterías viejas y nuevas, y el sistema de conmutación permite la introducción de cambios "en caliente" en la estructura del PSA con la preservación continua de la función de respaldo.



Operación inteligente


Una parte importante de los principios de funcionamiento de la infraestructura HiDC es la ideología de la autocuración inteligente. En una de nuestras publicaciones anteriores, mencionamos la plataforma inteligente O&M 1-3-5, que no solo puede detectar y analizar un evento no deseado en el sistema, sino que también ofrece al administrador varias opciones para una solución completamente automatizada al problema.

La función de introspección le permite detectar problemas en aproximadamente un minuto. Se dedican tres minutos al análisis, y en cinco minutos se hacen propuestas para cambiar el estado del sistema.

Supongamos que un cierto error del operador lleva a la formación de un circuito cerrado de procesos que reduce el rendimiento de la granja de virtualización del 100 al 77%. El administrador del centro de datos recibe un mensaje en su tablero que contiene una visualización completa del problema, incluido un diagrama de red de los recursos afectados por el proceso no deseado. Además, el administrador puede proceder a corregir la situación manualmente o usar uno de varios escenarios de recuperación automática que se le proponen.


El sistema conoce unos 75 escenarios de este tipo que pueden implementarse en menos de diez minutos y, además, cubren el 90% de los problemas encontrados en los centros de datos. En este momento, el ingeniero puede responder con calma las llamadas de los clientes interesados, confiando en que el servicio se restablecerá en cualquier momento.



Nuevos productos clave en HiDC


Además de los productos de software, esto debe incluir soluciones clave que operan a nivel de infraestructura. En primer lugar, debemos mencionar los procesadores neuronales utilizados en nuestra familia Atlas de clústeres de inteligencia artificial, así como los servidores basados ​​en NPU y GPU.

Además, no puede volver a mencionar el Dorado y su rendimiento récord en su clase, que es suficiente para muchos años por venir. Esto es especialmente cierto en el espacio postsoviético, donde, con raras excepciones, es habitual actualizar algo solo cuando deja de funcionar por completo. Esto explica la vida de los sistemas de almacenamiento individuales, que alcanzan los diez años. Dorado necesita una enorme productividad para proporcionar servicios de alta calidad en diez años.



Innovación en cada elemento.


Al elegir soluciones de infraestructura específicas, uno no debe olvidarse de la arquitectura y los escenarios de su desarrollo posterior. Los productos diferentes de diferentes fabricantes no garantizan el efecto sinérgico esperado que proporcionarán las soluciones ya optimizadas para compartir.

La infraestructura debe basarse en la tecnología adecuada. "Correcto" incluye abierto, proporcionando alto rendimiento, funcionamiento estable a altas cargas. Para los centros de datos, por ejemplo, es importante una buena relación entre el consumo total de energía y la carga de TI. Para lograr todos estos objetivos, debe elegir el entorno y los componentes. En las condiciones modernas, esto también significa el uso cada vez más amplio de la inteligencia artificial.
Según nuestras observaciones, entre los clientes estratégicos de Huawei, hay menos personas que todavía no usan sistemas de aprendizaje automático. Sin ML, simplemente no puede maximizar la monetización de los datos acumulados.
El sistema de monetización puede ser diferente: para los bancos, la oferta de nuevos productos específicos, para los operadores de telecomunicaciones, la provisión de servicios individuales y la lealtad, para los clientes gubernamentales, la gestión del ciclo de vida de los datos de calidad y un alto nivel de interacción con otras organizaciones. Después de todo, los modelos de gestión de datos no se han reducido a la configuración de un firewall y a garantizar la visibilidad de la red de sus bases de datos durante mucho tiempo.

De una idea a un centro de datos existente


Construir un centro de datos estándar en el mejor de los casos lleva un año y medio. Nuestro ciclo de producción nos permite hacerlo mucho más rápido gracias al uso de un grupo de soluciones, unidas bajo el nombre general FusionDC 2.0. El diseño, el desarrollo de un diseño de alto nivel, el ensamblaje de todos los elementos de la carga de TI se llevan a cabo directamente en la fábrica. En poco tiempo, el equipo en contenedores marítimos se entrega desde China a Rusia. Como resultado, la creación de un centro de datos llave en mano se puede lograr en solo cuatro a cinco meses.

La idea de un centro de datos en la nube prefabricado también es interesante porque es posible desarrollar un centro de datos en etapas, agregando los bloques funcionales necesarios. Este enfoque está integrado en el concepto HiDC mismo.


Para no convertir el material de la encuesta en una hoja de datos, para obtener más información sobre HiDC, le sugerimos que visite nuestro sitio web . Allí encontrará una descripción y ejemplos de la implementación de los enfoques, productos y soluciones de los que hablamos. Cuantos más materiales, mayor será su nivel de acceso al sitio. Si se le ha asignado el estado de "socio", puede descargar hojas de ruta, presentaciones técnicas y videos de HiDC.

Nos atrevemos a suponer que la mayoría de los lectores de este artículo tienen las competencias de los arquitectos de redes. Sin duda estarán interesados ​​en visitar nuestra zona de diseño.. Allí hablamos en detalle sobre cómo construir una infraestructura de red de acuerdo con las reglas del Diseño Validado de Huawei (HVD). Las pautas disponibles para descargar ayudarán a comprender a fondo cómo funcionan las soluciones de la compañía. No olvides solo que sin autorización estarás disponible menos materiales.

***


Numerosos seminarios web, realizados no solo en el segmento de idioma ruso, sino también a nivel internacional, lo ayudarán a encontrar su camino. Los compartimos con información sobre nuestros productos y nuestras prácticas comerciales. En particular, hablamos de cómo Huawei, en el contexto del desglose de muchas cadenas de servicios, continúa brindando entrega continua de sus productos a diferentes países. Recientemente, por ejemplo, hubo un caso en que el equipo recién fabricado para el centro de datos llegó al cliente de Moscú en solo tres semanas.

La lista de seminarios web para abril está disponible aquí .

All Articles