Optimice el almacenamiento: un caso de unificación y menor costo de propiedad

El artículo describe el proceso de optimización de la infraestructura de almacenamiento de una empresa de clase media.

Se consideran las justificaciones para tal transición y una breve descripción del proceso de configuración de un nuevo sistema de almacenamiento. Damos un ejemplo de los pros y los contras de cambiar al sistema seleccionado.

Introducción


La infraestructura de uno de nuestros clientes consistía en muchos sistemas de almacenamiento heterogéneos de diferentes niveles: desde sistemas SOHO QNAP, Synology para datos de usuario hasta sistemas de almacenamiento de entrada y de rango medio Eternus DX90 y DX600 para iSCSI y FC para datos de servicio y sistemas de virtualización.

Todo esto difería tanto en generaciones como en los discos utilizados; parte de los sistemas eran equipos heredados que no contaban con soporte de proveedores.

Otro problema fue la administración del espacio libre, ya que todo el espacio disponible en el disco estaba muy fragmentado en muchos sistemas. Como resultado, los inconvenientes de la administración y el alto costo de mantener una flota de sistemas.

Enfrentamos el desafío de optimizar la infraestructura de almacenamiento para reducir el costo de propiedad y unificación.

La tarea fue analizada exhaustivamente por los expertos de nuestra compañía teniendo en cuenta los requisitos del cliente para la disponibilidad de datos, IOPS, RPO / RTO, así como la posibilidad de actualizar la infraestructura existente.

Implementación


Los principales actores en el mercado de los sistemas de almacenamiento de rango medio (y superiores) son IBM con Storwize; Fujitsu, representado por la línea Eternus, y NetApp con la serie FAS. Como un sistema de almacenamiento que cumple con los requisitos dados, se consideraron estos sistemas, a saber: IBM Storwize V7000U, Fujitsu Eternus DX100, NetApp FAS2620. Los tres son Unified-SHD, es decir, proporcionan acceso en bloque y acceso a archivos, y proporcionan indicadores de rendimiento cercanos.

Pero en el caso del Storwize V7000U, el acceso a los archivos se organiza a través de un controlador separado, un módulo de archivos que se conecta al controlador del bloque principal, que es un punto adicional de falla. Además, este sistema es relativamente difícil de administrar y no proporciona un aislamiento adecuado de los servicios.

El sistema de almacenamiento Eternus DX100, que también es un sistema de almacenamiento unificado, tiene serias limitaciones en la cantidad de sistemas de archivos creados, sin proporcionar el aislamiento necesario. Además, el proceso de creación de un nuevo sistema de archivos lleva mucho tiempo (hasta media hora). Ambos sistemas descritos no permiten compartir servidores CIFS / NFS utilizados a nivel de red.

Teniendo en cuenta todos los parámetros, incluido el costo total de propiedad del sistema, se eligió NetApp FAS2620, que consta de un par de controladores que funcionan en modo Activo-Activo, y que permite distribuir la carga entre los controladores. Y cuando se combina con los mecanismos integrados de deduplicación y compresión en línea, puede ahorrar significativamente en el espacio ocupado por los datos en los discos. Estos mecanismos se vuelven mucho más efectivos cuando se agregan datos en un sistema en comparación con la situación inicial, cuando se ubicaron datos potencialmente idénticos en diferentes sistemas de almacenamiento y fue imposible deduplicarlos entre ellos.

Dicho sistema hizo posible colocar todo tipo de servicios bajo el control de un solo clúster de conmutación por error: SAN en forma de dispositivos de bloque para virtualización y NAS en forma de CIFS, recursos compartidos NFS para datos de usuario de Windows y sistemas * nix. Al mismo tiempo, quedaba la posibilidad de una separación lógica segura de estos servicios gracias a la tecnología SVM (Storage Virtual Machine): los servicios responsables de los diferentes componentes no afectan a los "vecinos" y no permiten el acceso a ellos.

También es posible aislar los servicios a nivel de disco, evitando la caída del rendimiento bajo una gran carga de los "vecinos".

Para los servicios que requieren una lectura / escritura rápida, puede usar un tipo híbrido de matriz RAID, agregando varios SSD al agregado de HDD. El sistema mismo colocará datos "activos" sobre ellos, reduciendo la latencia de lectura de datos usados ​​con frecuencia. Esto se suma al caché NVRAM, que garantiza su atomicidad e integridad además de la alta velocidad de escritura (los datos se almacenarán en el NVRAM alimentado por la batería hasta que se reciba la confirmación de su grabación completa del sistema de archivos) en caso de una falla repentina de energía.

Después de la migración de datos a un nuevo sistema de almacenamiento, es posible utilizar de manera más eficiente el espacio en disco de la memoria caché.

Lados positivos


Como se mencionó anteriormente, el uso de este sistema permitió resolver dos problemas a la vez:

- Unificación

  • , , , .
  • . , LUN, .
  • . , . , Ethernet Fiber Channel .
  • , , . .



  • NetApp SVM (Storage Virtual Machine), , , . SVM, . /.
  • .
    SVM , , VLAN-. , SVM, VLAN’. , trunk-.
    iSCSI-, SAN- , , « » .
  • .
    - RAID- ( RAID- ), Volume. Volume SVM’, SVM’ . «» , «» SVM’ .
    RAID- , .



  • . RAID-, .
  • (CPU, RAM). storage-, , IO-, .
  • NetApp S3- , on-premise , .


- Habiendo reducido todos los servicios bajo el control de un sistema, esperamos obtener un mayor impacto al deshabilitar un componente (1 de 2 controladores versus 1 de 10+ en la infraestructura anterior).
- Disminución de la distribución de la infraestructura de almacenamiento. Si los sistemas de almacenamiento anteriores pudieran ubicarse en diferentes pisos / en diferentes edificios, ahora todo se concentra en un estante. Este artículo se puede compensar comprando un sistema menos eficiente y utilizando replicación síncrona / asíncrona en caso de situaciones de fuerza mayor.

Configuración paso a paso


Debido a la confidencialidad de la información, es imposible mostrar capturas de pantalla del entorno real del cliente, por lo que los pasos de configuración se muestran en el entorno de prueba y repiten completamente los pasos realizados en el entorno productivo del cliente.


El estado inicial del clúster. Dos agregados para particiones raíz de los nodos de clúster correspondientes clus01_01, clus01_02


Creación de agregados para datos. Cada nodo tiene su propio agregado que consiste en una matriz RAID-DP.


Resultado: se crearon dos agregados: rg0_node02, rg1_node01. No hay datos sobre ellos todavía.


Creación de SVM como servidor CIFS. Para SVM, es obligatorio crear un volumen raíz para el que se selecciona el agregado raíz: rg1_node01. Este volumen almacenará configuraciones SVM individuales.


CIFS- SVM. IP- ., . VLAN-, LACP . Volume , , .


, . 4,9 , . .


SVM iSCSI-. , Root Volume . CIFS- IP- iSCSI-, . , (LUN), .


LUN 10 . , .


Hyper-V Server iqn.


Hyper-V Server LUN Linux. Volume, , , . LUN , .

Source: https://habr.com/ru/post/undefined/


All Articles