Escalando una red de alta carga con Nutanix: características y desafíos con un caso personal

imagen

Debido al hecho de que millones de personas están sentadas en casa, el tráfico de Internet se ha disparado. Se ha expresado el temor más de una vez de que una carga excesiva en las redes puede provocar un apagón: nacional, dentro de un país o incluso global. Afortunadamente, este problema todavía se está tratando, pero hay otras dificultades menos obvias.

¿Que tipo? Ahora, muchas compañías de comercio o entrega en línea no tienen tiempo para procesar el número vertiginoso de pedidos, están perdiendo clientes, dinero y reputación, incluso porque su infraestructura de TI no estaba lista para un aumento múltiple en los volúmenes de procesamiento de datos. Esto podría evitarse escalando rápidamente la infraestructura de TI. Esto se puede hacer usando la infraestructura hiperconvergente (HCI). Este artículo está dedicado a ella.

?


Nosotros, Platbox, hemos estado procesando pagos de clientes (bancos, sistemas de pago) durante aproximadamente siete años. Procesamos alrededor de 100 millones de transacciones por año. Esto es adquisición, pagos por SMS, acciones de diferentes compañías, etc.
Con el tiempo, el número de comerciantes cuyos pagos procesamos está creciendo y la carga en la red está aumentando.

El problema de la escala surgió desde el primer día de la existencia de la empresa. La carga está creciendo: estamos comprando servidores, escalando la red, resolviendo el problema. Luego, el número de transacciones vuelve a crecer, los recursos se agotan gradualmente y el ciclo se repite. Ahora la red consiste en un zoológico completo de equipos, que van desde servidores desde SuperMicro hasta Dell. Esta diversidad complica el mantenimiento de la red y aumenta el número de operaciones de rutina durante el mantenimiento.

El aumento en el número de equipos también es un costo. Tenemos bastidores de alquiler en centros de datos. Pagamos el alquiler del espacio físico, la electricidad consumida por los servidores, etc. Cuantos más servidores, más tiene que pagar, todo es simple. Además, decidimos ampliar nuestro lugar en SDH, así como aumentar la potencia informática de los servidores. Surgió la pregunta: continuar escalando lo que ya está allí, actuando en las condiciones de la arquitectura clásica de tres niveles o introducir algo nuevo.

Hace unos seis meses, decidieron buscar otra solución que resolviera los problemas descritos anteriormente. Había varias opciones, elegimos la óptima: usar una infraestructura hiperconvergente en lugar de la tradicional.

¿Qué es la infraestructura hiperconvergente (HCI)?


Aquí necesita un poco de digresión en la historia de TI. Una vez que los datos se procesaron en mainframes, computadoras grandes y potentes, fueron reemplazados por "servidores de arquitectura estándar" más baratos y flexibles, surgió el concepto de arquitectura de 3 niveles y, como resultado, dividió el centro de datos en un subsistema de almacenamiento (SAN) separado , subsistema de procesamiento (servidores) y subsistema de transmisión de datos (parte de la red del centro de datos). A medida que la TI evolucionó, surgieron nuevas formas de almacenar y procesar datos y resolver problemas de los usuarios. HCI es la "infraestructura para la era de la" nube "en TI, el rechazo de la arquitectura de 3 niveles a favor, por ejemplo, del microservicio.

Desde un punto de vista práctico, en una infraestructura convergente clásica, un servidor, un sistema de almacenamiento, un equipo de red y una herramienta de virtualización son elementos separados. La infraestructura hiperconvergente los integra, así como todos los componentes del centro de datos familiar en un solo sistema. A veces, HCI incluye componentes adicionales, por ejemplo, software de respaldo, capacidades de instantáneas, funcionalidad de deduplicación de datos, compresión intermedia y optimización de la red informática.

Si una infraestructura convergente se basa principalmente en hardware, y un centro de datos definido por software a menudo se adapta a cualquier hardware, estas dos capacidades se combinan en una infraestructura hiperconvergente. También mejora la fiabilidad operativa, el rendimiento y la seguridad de los datos. En general, HCI debe verse como una ronda de evolución en la infraestructura de TI.

Después de evaluar los pros y los contras, decidimos probar la hiperconvergencia, contactamos a Nutanix, obtuvimos la plataforma para la prueba, que fue exitosa. Para la prueba, obtuvimos una plataforma hiperconvergente, que consta de seis nodos, pero dos unidades. Ahorramos electricidad, espacio en rack, no es necesario comprar un servidor sin fin.

5 beneficios de la infraestructura hiperconvergente

imagen

  1. IT- – HCI, IT-«», .
  2. ;
  3. . . , . , . Nutanix , .
  4. Se reduce el riesgo de falta de disponibilidad de servicios en caso de falla de uno o varios de los componentes debido a la unificación, respaldo de datos y hardware. Si el equipo "cae" repentinamente en un centro de datos, la reserva comienza inmediatamente en otro.
  5. El código fuente abierto del producto facilita una auditoría de seguridad, y el STIG (Guía de implementación técnica de seguridad o conjunto de recomendaciones para proteger los sistemas de TI) incorporado proporciona una ejecución de código de alta seguridad y resistencia al impacto de los ciberdelincuentes en el sistema de TI.

¿Cómo elegimos un proveedor?


Analizamos varios proveedores de sistemas hiperconvergentes. Entre ellos se encuentran Cisco Hyperflex, SimpliVity, HPE Hyper Converged, Fujitsu PRIMERGY CX y Nutanix. Luego se formularon los siguientes criterios de selección:

  • Fiabilidad y seguridad de los datos en el interior;
  • Cumplimiento de los requisitos de seguridad PCI DSS 3.2.1;
  • Velocidad de trabajo;
  • Mantenimiento y soporte técnico;
  • La flexibilidad para escalar la infraestructura a la velocidad que necesita la empresa.

Como resultado, nos detuvimos en Nutanix, ya que fue con esta compañía que, de hecho, el mercado de HCI comenzó en 2012. Ofrece el producto más estable con flexibilidad y las mejores capacidades, por ejemplo:

  • Una amplia selección de plataformas (HPE, Dell, Fujitsu, Cisco);
  • Disponibilidad de una versión gratuita de Community Edition;
  • La libertad de elegir un hipervisor (incluido gratis - AHV).
  • Una pequeña "cantidad cuántica de crecimiento" (de hecho, es un servidor), que ya le da a la empresa todo lo que puede y le brinda la más grande: confiabilidad, seguridad y nuevas tecnologías. Toda la funcionalidad de Nutanix, que hoy es utilizada por el nivel comercial, por ejemplo, VTB o el grupo Societe Generale, también está disponible para la mayoría de las soluciones de nivel de entrada.

Además, especialistas con experiencia trabajando con la plataforma Nutanix han aparecido en nuestro equipo técnico. Gracias a ellos, sabíamos cómo se comportaría el sistema en situaciones críticas, lo cual es increíblemente importante para nosotros, como para una empresa fintech.

Otro factor que ha influido en la elección de Nutanix es la disponibilidad de una herramienta de transición como Nutanix Move. Le permite traducir máquinas con un tiempo de inactividad mínimo. Entonces, por ejemplo, si hay máquinas VMware y Nutanix, Move actúa como una especie de puente. Toma la máquina de VMWare, la clona, ​​la implementa en Nutanix en base a instantáneas, la apaga en VMWare y la lanza en nutanix. Todo esto en literalmente segundos.

El proceso de transición a Nutanix


imagen

El requisito principal cuando se movía era no violar la estabilidad del sistema, por lo que era necesario cambiar a una nueva plataforma con mucho cuidado.

Por lo tanto, todo comenzó con la prueba de la plataforma de prueba Nutanix, que ya se mencionó anteriormente. Comenzamos una serie de pruebas implementando un entorno de prueba. Usamos el procesamiento, que no está en producción, y, por así decirlo, lo "disparamos" desde Yandex-gun. Verificamos la carga, utilizamos suficientes recursos para nuestros propósitos, nos dimos cuenta de que funcionaba perfectamente y donde se necesitaba optimización.

HCI generalmente coexiste con la infraestructura clásica, sin requerir el abandono inmediato del centro de datos familiar. La migración a HCI puede ser gradual, extendida y suave tanto como lo necesite la empresa. Por ejemplo, si la virtualización y un hipervisor ya se utilizan en el centro de datos de la compañía, la transición al entorno HCI es una migración gradual de máquinas virtuales de servidores antiguos a servidores nuevos: de servidores "clásicos" a servidores HCI. Este es solo nuestro caso. Tendremos que transferir máquinas virtuales a otro entorno virtual. Siempre que sea posible, la migración automática con Nutanix Move estará involucrada, algunos servicios se describen como infraestructura como código (IaC).

Todo esto se puede dividir en varias etapas:

  1. Writing RoadMap.
  2. Lanzamiento de una nueva infraestructura.
  3. Traducción de servicios según RoadMap.

La implementación de estas etapas lleva aproximadamente 2 meses.

Dificultades y problemas de transición

Los problemas, por supuesto, eran. La principal dificultad radica en el hecho de que el procesamiento en el momento de la migración de los servicios aún debe suspenderse. Pero trabajamos en este punto cuando tomamos la plataforma Nutanix para realizar pruebas. Desarrollamos un plan para la compra de equipos y la migración de servicios en la etapa de prueba. La implementación estricta del plan aprobado es la clave del éxito de la migración de servicios.

En algunas empresas, según nuestra experiencia, las dificultades de pasar a una infraestructura hiperconvergente probablemente no sean de naturaleza técnica, sino organizativa o de "presupuesto". Por ejemplo, si un centro de datos funciona y no hay nuevas tareas para él, si se compró una cantidad de equipo costoso relativamente recientemente para el desarrollo de una infraestructura "clásica", será muy difícil tener una idea (y argumentar su administración o inversionistas), que esto debe abandonarse y gastarse dinero nuevamente, ya en HCI.

Resultados positivos del cambio a HCI

imagen

La calidad del sueño para los profesionales que operan ha mejorado significativamente. ¿Por qué? Es simple: el almacenamiento distribuido mejora la confiabilidad del almacenamiento y la disponibilidad de datos.

Procesos empresariales y empleados optimizados:

  • un administrador en lugar de 3;
  • IT-, ;
  • .
  • .

Costes reducidos de hierro. Sobre cómo y por qué, se dijo anteriormente. Simplificó la escala de los costos del centro de datos. En el enfoque clásico, puede ser muy difícil desarrollar una infraestructura que esté lista para crecer diez veces sin la necesidad de cambiarla total o parcialmente. En el caso de HCI, puede comenzar con una solución muy pequeña e invertir gradualmente más en infraestructura.

Existe la oportunidad de redistribuir los costos de los costos de capital a los operativos , que ahora se destinará a TI en todo el mundo. Esto requiere una forma diferente de planificar los costos; de lo contrario, mire cosas familiares, aprenda cosas nuevas, pero aquí es donde va la industria hoy.

Para entender lo simple que es, le daremos un caso. Entonces, durante el maratón de caridad, tuvimos una carga de red muy fuerte, mucho más alta que la calculada. El error de cálculo surgió porque la carga se calculó a partir de las estadísticas de maratones anteriores. No tomamos en cuenta que más personas participarán en la nueva, la razón es la cuarentena y el autoaislamiento. Si el problema hubiera surgido con la infraestructura existente, las consecuencias habrían sido muy negativas, incluida la desconexión de los servicios. Ahora tomamos Nutanix, gracias al cual pudimos aumentar el clúster exactamente dos veces. El sistema "digirió" la carga. Y todo esto podría hacerse en solo 15 minutos y unos pocos clics del mouse.

Un poco sobre las perspectivas de la tecnología y la elección de HCI


¿Deberían todos cambiar a HCI? No claro que no. Básicamente, la infraestructura hiperconvergente es adecuada para aquellas empresas que tienen redes a gran escala, una gran carga en ellas y fondos suficientes para la transición. Si una startup tiene varios servidores, no puede cambiar nada.

Pero si la compañía tiene un zoológico completo de hierro para servidores, una red pobremente optimizada y un alto nivel de costos para el hierro y su mantenimiento, entonces HCI definitivamente está ahí.

Bueno, lo siguiente se puede decir sobre el futuro de HCI. primeramente, HCI se distribuye en el mundo y en Rusia en la medida en que TI está lista para aceptar y usar nuevas ideas. Muchas empresas en desarrollo buscan nuevas oportunidades de desarrollo y crecimiento, especialmente en el contexto de la reducción de los presupuestos de TI. Es probable que las empresas de negocios tradicionales y conservadores vengan a HCI más tarde, sean activas, jóvenes, desarrollen y usen nuevas tecnologías, antes.

En segundo lugar , cada vez más empresas ingresarán al mercado de HCI, la tecnología se generalizará y será más accesible. Ya, todos los principales fabricantes de servidores y sistemas de almacenamiento tienen propuestas en el campo de HCI, y esto ha sucedido literalmente en el último año o dos.

En tercer lugar, la idea de "nubosidad" continuará desarrollándose, incluso en la forma de una "nube híbrida", cuando parte de la infraestructura se ubicará en su "propio" centro de datos, y parte se alquilará según surja la necesidad.

Un ejemplo son las mismas tiendas en línea y servicios de entrega. En el caso de un salto múltiple en el tráfico, podrían escalar en unos minutos alquilando capacidades de un operador de la nube y no "colgarse" todo el día, perdiendo clientes y su dinero. Y luego, después de la disminución de la demanda y la tranquilidad del mercado, reduzca la infraestructura sin sacrificar la seguridad, el rendimiento o gastar dinero en la compra de su equipo. Quizás en el futuro, la "nube" y "su centro de datos" se vincularán sin problemas. Al menos todas las tecnologías para esto ya existen.

Cuarto, los sistemas de automatización para administrar la infraestructura de TI comenzarán a desarrollarse activamente, incluido el uso de IA y la virtualización de la infraestructura de red del centro de datos.

All Articles