Revisión y prueba de Huawei Dorado 5000V6


Hace seis meses, ya estaba comenzando a hablar sobre la actualización de la línea de almacenamiento de Huawei: Dorado V6. De hecho, logré conocerlos antes del anuncio oficial, y es lógico que en ese momento no tuve la oportunidad de tocarlos con mis propias manos. En mi artículo " Huawei Dorado V6: calor de Sichuan ", me concentré en los modelos más antiguos de Dorado 8000 y 18000 V6, ya que desde el punto de vista de la arquitectura me resultaron más interesantes en ese momento. Finalmente, tuve la oportunidad de probar el sistema 5000V6 en nuestro laboratorio y hablar más sobre el aspecto técnico de estos sistemas.


Por un lado, esta es una revisión y prueba del sistema 5000V6, por otro, es una continuación lógica del artículo anterior, porque En los últimos seis meses, han aparecido más detalles sobre los diversos componentes del sistema, la lógica del trabajo y la funcionalidad implementada.

Pero vayamos al grano. Dado que este sistema es más familiar, un sistema de controlador dual, ha perdido algunas de las ventajas de sus hermanas mayores.

  1. Falta de Frontend y Backend compartidos.

  2. Además, en los sistemas 5000V6 y 6000V6, solo se instalan dos procesadores Kunpeng 920 en cada uno de los controladores, y uno en el 3000V6.
  3. Si se suministran los mismos estantes para 5000V6 y 6000V6 que para 8000V6 y 18000V6 con chips Kunpeng, que están diseñados para acelerar el proceso de reconstrucción, y estos estantes están conectados a través de RDMA de 100 Gb, entonces para el modelo 3000V6 más joven solo están disponibles los estantes SAS.

  4. 5000V6 y 6000V6 están diseñados para instalar 36 unidades SSD PALM o 25 unidades SSD SAS "normales" (seleccionadas al configurar el sistema al realizar el pedido), la 3000V6 más joven solo admite 25 unidades SSD SAS.
  5. 3000V6 admite la instalación de hasta tres tarjetas de interfaz intercambiables en caliente en el controlador, 5000V6 y 6000V6 admiten seis tarjetas.

Como en el artículo anterior, hay una nota al pie sobre el NVMe de extremo a extremo: el soporte para NVMe sobre RoCE v2 y NVMe sobre TCP / IP está planeado en un futuro próximo.

Arquitectónicamente, los sistemas de doble controlador, por supuesto, también difieren.


OceanStor Dorado V6 utiliza una arquitectura activo-activo que tiene las siguientes tecnologías.

  • Algoritmo de equilibrio de carga: equilibra las solicitudes de lectura y escritura recibidas por cada controlador. 
  • Caché global: permite que los LUN no tengan propietarios. Cada controlador procesa las solicitudes de lectura y escritura recibidas, proporcionando un equilibrio de carga entre los controladores.
  • RAID 2.0+: distribuye de manera uniforme los datos en todos los discos del grupo de almacenamiento, equilibrando la carga en el disco.

RAID 2.0+


Si los datos no se almacenan de manera uniforme en un SSD, algunos SSD muy cargados pueden convertirse en un cuello de botella del sistema. OceanStor Dorado V6 utiliza RAID 2.0+ para distribuir de manera uniforme los datos en todos los LUN de cada SSD, equilibrando la carga entre las unidades. OceanStor Dorado V6 implementa RAID 2.0+ de la siguiente manera:

  • múltiples SSD forman un grupo de almacenamiento
  • cada SSD se divide en fragmentos de tamaño fijo (generalmente 4 MB por fragmento) para simplificar la administración del espacio lógico
  • Los fragmentos de diferentes SSD forman un grupo de fragmentos basado en la política RAID definida por el usuario
  • el grupo de fragmentos se divide en "granos" (generalmente 8 KB), que son la unidad más pequeña para volúmenes


ROW Full-Stripe Write


Los chips de memoria flash en SSD se pueden borrar un número limitado de veces. En el modo de reescritura RAID tradicional (escritura en el lugar), los datos activos en el SSD se sobrescriben continuamente y sus chips flash se desgastan rápidamente. OceanStor Dorado V6 utiliza grabación de escritura de redireccionamiento completo (ROW) para datos nuevos y antiguos. Él asigna un nuevo chip flash para cada registro, equilibrando el número de veces que se borran todos los chips flash. Esto reduce significativamente la carga del procesador en el controlador y la carga de lectura / escritura en el SSD durante el proceso de escritura, aumentando el rendimiento del sistema en diferentes niveles de RAID.


Priorización de E / S de extremo a extremo


Para garantizar una latencia constante para ciertos tipos de E / S, los controladores OceanStor Dorado V6 marcan cada operación de E / S con prioridad según su tipo. Esto permite que el sistema planifique la CPU y otros recursos y los priorice, ofreciendo una garantía de latencia basada en las prioridades de E / S. En particular, después de recibir varios SSD de E / S, verifique sus prioridades y procese principalmente las operaciones con mayor prioridad.

OceanStor Dorado V6 clasifica las operaciones de E / S en los siguientes cinco tipos y las prioriza en orden descendente, proporcionando una respuesta de E / S interna y externa óptima:

  • operaciones de lectura / escritura
  • características avanzadas de E / S
  • volver a armar
  • vaciar caché
  • Recolección de basura


En cada unidad, además de priorizar las operaciones de entrada / salida, OceanStor Dorado V6 también permite solicitudes de lectura de alta prioridad para interrumpir las operaciones de escritura y borrado en curso. En este caso, el retraso de lectura del disco (si no había datos en la memoria caché) afecta directamente al retraso de lectura del host. Por lo general, una unidad flash SSD realiza tres operaciones: leer, escribir y borrar. El retraso de borrado es de 5 ms a 15 ms, el retraso de escritura es de 2 ms a 4 ms, y el retraso de lectura es de decenas de microsegundos a 100 microsegundos. Cuando el chip flash realiza una operación de escritura o borrado, la operación de lectura debe esperar hasta que se complete la operación actual, lo que conduce a un aumento significativo en el retraso de lectura.

Caja de disco inteligente


Como escribí en un artículo anterior, los nuevos estantes de disco están equipados con su propio procesador y RAM. Esto le permite transferir tareas como recuperarse de una falla de disco desde los controladores. Esto reduce significativamente la carga en los controladores en caso de recuperación de datos debido a fallas de disco. La siguiente figura muestra el proceso de recuperación de datos dentro de un solo estante de disco utilizando RAID 6 (21 + 2) como ejemplo. Si la unidad D1 está defectuosa, el controlador debe leer D2-D21 y P, y luego volver a contar D1. En total, se deben leer 21 bloques de datos de los discos. Las operaciones de lectura y restauración consumen grandes recursos de procesador.


El estante Smart Disk Enclosure recibe una solicitud de restauración y lee datos para calcular localmente los datos de paridad. Entonces solo necesita transferir los datos de paridad al controlador. La siguiente figura muestra que solo se deben transferir cuatro bloques de datos de paridad entre el controlador y el estante del disco. Esto ahorra el rendimiento de las operaciones de recuperación al reducir el ancho de banda de la red en cinco veces.


Como resultado, al transferir esta carga a los procesadores en el estante, es posible reducir la carga en los controladores de la tarea de reconstrucción a menos del 10%.

SmartDedupe y SmartCompression


OceanStor Dorado V6 realiza automáticamente la deduplicación adaptativa y la compresión en función de las características de los datos del usuario, maximizando la eficiencia. El proceso adaptativo de deduplicación y compresión es el siguiente.

  1. , , . , . .
  2. , «» (SFP) «». , .
  3. Cuando se acumulan varios SFP idénticos en la tabla de "capacidades", los datos correspondientes a estos SFP se leen de los discos de deduplicación después del procesamiento. Una vez completada la deduplicación, se actualiza la tabla de huellas digitales.

Antes de comprimir datos, OceanStor Dorado V6 usa su propio algoritmo de preprocesamiento para determinar la parte que es difícil de comprimir en bloques de datos según el formato de datos. 

OceanStor reordena los datos, dividiéndolos en dos partes:

  • para la parte que es difícil de comprimir, el sistema lo comprime usando un algoritmo de compresión Huawei especialmente desarrollado
  • por otro lado, el sistema usa un algoritmo de compresión común

Algunos proveedores de almacenamiento ya están utilizando la compactación de datos en su arsenal. Pero generalmente usan un bloque de 4K o 1K para comprimir los datos. Huawei ha ido más allá y utiliza la alineación de bytes. Creo que la ilustración es clara.


Por lo tanto, ajustamos 32 KB de datos de usuario en menos de 5 KB.

La compresión y la deduplicación ahora siempre funcionan desde el momento en que instala la licencia de Eficiencia de almacenamiento adecuada. No puede deshabilitarse desde Device Mabager, pero si realmente lo desea, puede hacerlo a través de la CLI. Según la lógica del proveedor, las tecnologías que ahorran espacio siempre deberían funcionar en los SSD.

Un punto importante en toda la línea. Aunque solo hay cinco modelos, ellos, entre otras cosas, difieren entre sí en el volumen de la memoria caché de cada controlador:

  • OceanStor Dorado 3000 V6: 192 GB
  • OceanStor Dorado 5000 V6: 256 GB / 512 GB
  • OceanStor Dorado 6000 V6: 1024 GB
  • OceanStor Dorado 8000 V6: 512 GB / 1024 GB / 2048 GB
  • OceanStor Dorado 18000 V6: 512 GB / 1024 GB / 2048 GB

Como puede ver, el volumen total de los modelos más antiguos no cambia, pero la cantidad de unidades cambia. Según las declaraciones de los ingenieros de Huawei, simplemente no tuvieron la oportunidad de probar sistemas en un volumen mayor que 2Pb. Teóricamente, apoyan más.

Número máximo de unidades / capacidad máxima: 

  • OceanStor Dorado 3000 V6 - 1000 / 500TiB
  • OceanStor Dorado 5000 V6 - 1200 / 1024TiB
  • OceanStor Dorado 6000 V6 - 1500 / 2048TiB
  • OceanStor Dorado 8000 V6 - 3200 / 2048TiB
  • OceanStor Dorado 18000 V6 - 6400 / 2048TiB

En un artículo anterior, olvidé mencionar qué tarjetas de interfaz están generalmente disponibles:


Ya dije (tanto en el artículo anterior como en este) que Huawei ofrece SSD de su propio diseño: Palm Size o, como los llaman, SSD desarrollados por Huawei (HSSD) como dispositivos de almacenamiento.

Además del hecho de que la compañía considera que su desarrollo es más rápido, también ofrece algunas características clave.



  • SSD / - NAND. - NAND.

    HSSD . SSD , /. SSD / , , , , .
  • (Bad Block)

    - NAND. HSSD /, - NAND. , SSD (XOR) . HSSD , .
  • Verificación de antecedentes

    Después de almacenar datos en el flash NAND durante mucho tiempo, pueden producirse errores de datos debido a interferencia de lectura, interferencia de escritura o mal funcionamiento accidental. HSSD lee periódicamente datos de una memoria flash NAND, comprueba los cambios de bits y escribe cambios de bits en páginas nuevas. Este proceso detecta y procesa los riesgos, lo que efectivamente evita la pérdida de datos y mejora la seguridad y la confiabilidad de los datos.

Entonces, vayamos directamente a las pruebas. Probamos ambas variaciones de los controladores 5000V6 con 256 GB y 512 GB de caché.

La primera prueba fue, por así decirlo, calentamiento.


Como podemos ver, en este perfil de carga de 8k 50r / 50rw, la diferencia fue de aproximadamente el 7% (220 kIOP frente a 205 kIOP) y solo afectó el número final de IOPS, y el tiempo de respuesta se mantuvo en el mismo nivel: 0.9 ms.

Por cierto, fue muy simple determinar que comenzamos a descansar en el controlador, el sistema mismo informó una alta utilización de los procesadores del controlador.


La segunda prueba que utilizamos para todos los sistemas en SSD es evaluarlos y compararlos con un perfil más complejo.

Perfil
[global]
direct=1
thread=1
iodepth=16
filename=/dev/sdb
ioengine=libaio
runtime=3600000
group_reptorting
time_based
[8r]
rw=randread
numjobs=24
bs=8k

[8w]
rw=randwrite
numjobs=24
bs=8k

[32r]
rw=randread
bs=32k
numjobs=1

[32w]
rw=randwrite
numjobs=1
bs=32k

[128r]
rw=read
bs=128k
numjobs=1

[128w]
rw=write
bs=128k
numjobs=1

[512r]
rw=read
bs=512k
numjobs=1

[512w]
rw=write
bs=512k
numjobs=1


Aquí la imagen es completamente diferente. Si la diferencia en el número de IOPS en dos mil (172 kIOP frente a 170 kIOP) no es significativa en absoluto, entonces el retraso aumentó cinco veces (de 0.4 ms a 2.1 ms), nos dice que cuando se trabaja con un bloque grande, una mayor cantidad de caché da una ventaja al sistema

El año pasado, mis colegas y yo ya probamos el Huawei Dorado 5000 V3 , por lo que ahora podemos comparar estos dos sistemas.


Progreso en la cara. El perfil de carga y el procedimiento de prueba fueron los mismos en ambos casos.

Por supuesto, sería bueno hacer una comparación con los competidores también, personalmente, me picaban mucho las manos para comparar con el sistema NetApp AFF A400, Full NVMe, que apareció no hace mucho tiempo. Desafortunadamente, todavía no ha visitado nuestro laboratorio de pruebas, y compararlo con el AFF A300 no es del todo lógico, a pesar de que el anterior Dorado 5000 V3 de Huawei se posicionó como su competidor.

En el patio del siglo XXI, muchas compañías ofrecen diversos programas para aumentar el atractivo de sus sistemas. Huawei ha decidido mantenerse en esta dirección.

Garantía de capacidad efectiva


Con los nuevos sistemas de almacenamiento V6, puede confiar de manera segura en un almacenamiento de datos eficiente con compresión y deduplicación. En general, muchos proveedores en el mercado ya ofrecen programas similares, que debido al almacenamiento más eficiente permiten el almacenamiento garantizado de más datos en el volumen útil adquirido del sistema de almacenamiento de datos.

El costo de cada terabyte de SSD sigue siendo bastante alto, por lo que las tecnologías de compresión y deduplicación son extremadamente útiles y muestran una alta eficiencia en muchos tipos de datos. Si sus datos son video, audio, imágenes, datos científicos, PDF, XML o datos cifrados, la deduplicación no será efectiva, de lo contrario, la garantía funciona. Incluso si compró un sistema con la cantidad máxima de unidades instaladas, junto con las unidades del programa también recibirá un estante de expansión.

Flashver



Si, junto con la matriz, compra el programa Huawei Hi-Care Onsite o Co-Care o superior, puede contar con la actualización gratuita de los controladores a los nuevos modelos de la misma línea. Esto le permite tener el sistema más moderno y productivo sin la necesidad de comprar nuevos sistemas o migración de datos. El proceso de reemplazo de controladores también ocurre sin interrupción del servicio.

Si eres fanático de las interfaces y quieres ver el Administrador de dispositivos actualizado, entonces OceanStor Dorado 18000 V6 6.0.0 DeviceManager ya está disponible en el portal de Huawei .

Desafortunadamente, este sistema solo estuvo en nuestras pruebas durante un par de días, por lo que solo logramos medir el rendimiento. Pero también me gustaría llevar a cabo pruebas funcionales, nuestras pruebas de falla favoritas y verificar algunas quejas de rendimiento que se produjeron en la línea V3 anterior al realizar algunas operaciones; es importante comprender qué cambios se han producido en la nueva línea (y, en consecuencia, en el software) y ¿Qué efecto trajeron?

Quiero señalar que la mayoría de las pruebas que realizo para mis artículos son de trabajo en equipo. Expreso mi gratitud a mis colegas del Grupo de integración de la empresa "Onlanta" con la que trabajo. 

Por cierto, estamos buscando un arquitecto de sistemas en nuestro equipo .

All Articles