Examen et test du Huawei Dorado 5000V6


Il y a six mois, je commençais déjà à parler de la mise à jour de la gamme de stockage Huawei - Dorado V6. En fait, j'ai réussi à les connaître avant l'annonce officielle, et il est logique qu'à cette époque je n'ai pas eu l'occasion de les toucher de mes propres mains. Dans mon article « Huawei Dorado V6: Sichuan Heat », je me suis concentré sur les anciens modèles Dorado 8000 et 18000 V6, car du point de vue de l'architecture, ils étaient surtout intéressants à ce moment-là. Enfin, j'ai eu l'occasion de tester le système 5000V6 dans notre laboratoire et de parler davantage du côté technique de ces systèmes.


D'une part, il s'agit d'une revue et d'un test du système 5000V6, d'autre part, c'est une suite logique de l'article précédent, car au cours des six derniers mois, plus de détails sont apparus sur les différents composants du système, la logique de travail et les fonctionnalités implémentées.

Mais allons droit au but. Comme ce système est plus familier - un système à double contrôleur, il a perdu certains des avantages de ses sœurs aînées.

  1. Manque de Frontend et Backend partagés.

  2. De plus, dans les systèmes 5000V6 et 6000V6, seuls deux processeurs Kunpeng 920 sont installés sur chacun des contrôleurs, et un dans le 3000V6.
  3. Si les mêmes étagères sont fournies pour 5000V6 et 6000V6 que pour 8000V6 et 18000V6 avec des puces Kunpeng, qui sont conçues pour accélérer le processus de reconstruction, et ces étagères sont connectées via 100 Go de RDMA, alors pour les modèles 3000V6 plus jeunes, seules les étagères SAS sont disponibles.

  4. Les modèles 5000V6 et 6000V6 sont conçus pour installer 36 SSD PALM ou 25 disques SSD SAS «ordinaires» de 2,5 pouces (sélectionnés lors de la configuration du système lors de la commande), le plus jeune 3000V6 ne prend en charge que 25 disques SSD SAS.
  5. 3000V6 prend en charge l'installation de jusqu'à trois cartes d'interface remplaçables à chaud sur le contrôleur, 5000V6 et 6000V6 prennent en charge six cartes.

Comme dans l'article précédent, il existe une note de bas de page concernant le NVMe de bout en bout: la prise en charge de NVMe sur RoCE v2 et NVMe sur TCP / IP est prévue dans un proche avenir.

Sur le plan architectural, les systèmes à double contrôleur diffèrent bien sûr également.


OceanStor Dorado V6 utilise une architecture active-active qui possède les technologies suivantes.

  • Algorithme d'équilibrage de charge: équilibre les demandes de lecture et d'écriture reçues par chaque contrôleur. 
  • Cache global: permet aux LUN de ne pas avoir de propriétaires. Chaque contrôleur traite les demandes de lecture et d'écriture reçues, fournissant un équilibrage de charge entre les contrôleurs.
  • RAID 2.0+: distribue uniformément les données sur tous les disques du pool de stockage, équilibrant la charge sur le disque.

RAID 2.0+


Si les données ne sont pas stockées uniformément sur un SSD, certains SSD fortement chargés peuvent devenir un goulot d'étranglement du système. OceanStor Dorado V6 utilise RAID 2.0+ pour répartir uniformément les données sur tous les LUN de chaque SSD, en équilibrant la charge entre les disques. OceanStor Dorado V6 implémente RAID 2.0+ comme suit:

  • plusieurs SSD forment un pool de stockage
  • chaque SSD est divisé en blocs de taille fixe (généralement 4 Mo par bloc) pour simplifier la gestion de l'espace logique
  • des morceaux de différents SSD forment un groupe de morceaux basé sur une politique RAID définie par l'utilisateur
  • le groupe de morceaux est divisé en «grains» (généralement 8 Ko), qui sont la plus petite unité pour les volumes


ROW Full-Stripe Write


Les puces de mémoire flash sur les SSD peuvent être effacées un nombre limité de fois. Dans le mode de réécriture RAID traditionnel (écriture sur place), les données chaudes du SSD sont continuellement écrasées et ses puces flash s'usent rapidement. OceanStor Dorado V6 utilise un enregistrement en écriture entièrement redirectionnelle (ROW) pour les données nouvelles et anciennes. Il alloue une nouvelle puce flash pour chaque enregistrement, en équilibrant le nombre de fois que toutes les puces flash sont effacées. Cela réduit considérablement la charge du processeur sur le contrôleur lui-même et la charge de lecture / écriture sur le SSD pendant le processus d'écriture, augmentant les performances du système à différents niveaux RAID.


Hiérarchisation des E / S de bout en bout


Pour garantir une latence cohérente pour certains types d'E / S, les contrôleurs OceanStor Dorado V6 marquent chaque opération d'E / S en priorité en fonction de son type. Cela permet au système de planifier le processeur et d'autres ressources et de les hiérarchiser, offrant une garantie de latence en fonction des priorités d'E / S. En particulier, après avoir reçu plusieurs SSD d'E / S, vérifiez leurs priorités et traitez principalement les opérations avec une priorité plus élevée.

OceanStor Dorado V6 classe les opérations d'E / S dans les cinq types suivants et les hiérarchise par ordre décroissant, offrant une réponse d'E / S interne et externe optimale:

  • opérations de lecture / écriture
  • fonctionnalités d'E / S avancées
  • rebild
  • vider le cache
  • Collecte des ordures


Sur chaque disque, en plus de prioriser les opérations d'entrée / sortie, OceanStor Dorado V6 permet également des requêtes de lecture de haute priorité pour interrompre les opérations d'écriture et d'effacement en cours. Dans ce cas, le délai de lecture du disque (s'il n'y avait pas de données dans le cache) affecte directement le délai de lecture de l'hôte. En règle générale, un lecteur flash SSD effectue trois opérations: lecture, écriture et effacement. Le retard d'effacement est de 5 ms à 15 ms, le retard d'écriture est de 2 ms à 4 ms et le retard de lecture est de quelques dizaines de microsecondes à 100 microsecondes. Lorsque la puce flash effectue une opération d'écriture ou d'effacement, l'opération de lecture doit attendre la fin de l'opération en cours, ce qui entraîne une augmentation significative du délai de lecture.

Boîtier de disque intelligent


Comme je l'ai écrit dans un article précédent, les nouvelles étagères à disques sont équipées de leur propre processeur et RAM. Cela vous permet de transférer des tâches telles que la récupération après une panne de disque à partir des contrôleurs. Cela réduit considérablement la charge sur les contrôleurs en cas de récupération de données en raison de pannes de disque. La figure suivante montre le processus de récupération de données dans une seule étagère de disque en utilisant RAID 6 (21 + 2) comme exemple. Si le lecteur D1 est défectueux, le contrôleur doit lire D2-D21 et P, puis recompter D1. Au total, 21 blocs de données doivent être lus à partir des disques. Les opérations de lecture et de restauration consomment de grandes ressources processeur.


L'étagère Smart Disk Enclosure reçoit une demande de restauration et lit les données pour calculer localement les données de parité. Il lui suffit ensuite de transférer les données de parité au contrôleur. La figure suivante montre que seuls quatre blocs de données de parité doivent être transférés entre le contrôleur et l'étagère de disque. Cela permet d'économiser les performances des opérations de récupération en réduisant la bande passante réseau de cinq fois.


Par conséquent, en transférant cette charge aux processeurs de l'étagère, il est possible de réduire la charge sur les contrôleurs de la tâche de reconstruction à moins de 10%.

SmartDedupe et SmartCompression


OceanStor Dorado V6 effectue automatiquement la déduplication adaptative et la compression en fonction des caractéristiques des données utilisateur, maximisant ainsi l'efficacité. Le processus adaptatif de déduplication et de compression est le suivant.

  1. , , . , . .
  2. , «» (SFP) «». , .
  3. Lorsque plusieurs SFP identiques sont accumulés dans le tableau des «capacités», les données correspondant à ces SFP sont lues à partir des disques de déduplication après traitement. Une fois la déduplication terminée, la table des empreintes digitales est mise à jour.

Avant de compresser les données, OceanStor Dorado V6 utilise son propre algorithme de prétraitement pour déterminer la partie qui est difficile à compresser dans des blocs de données en fonction du format de données. 

OceanStor réorganise les données en les divisant en deux parties:

  • pour la partie difficile à compresser, le système la comprime à l'aide d'un algorithme de compression Huawei spécialement développé
  • d'autre part, le système utilise un algorithme de compression commun

Certains fournisseurs de stockage utilisent déjà le compactage des données dans leur arsenal. Mais ils utilisent généralement un bloc 4K ou 1K pour compresser les données. Huawei est allé plus loin et utilise l'alignement des octets. Je pense que l'illustration est claire.


Ainsi, nous adaptons 32 Ko de données utilisateur en moins de 5 Ko.

La compression et la déduplication fonctionnent désormais toujours à partir du moment où vous installez la licence Storage E ffi cency appropriée. Il ne peut pas être désactivé à partir du Device Mabager, mais si vous le souhaitez vraiment, vous pouvez le faire via la CLI. Selon la logique du fournisseur, les technologies peu encombrantes devraient toujours fonctionner sur les SSD.

Un point important tout au long de la ligne. Bien qu'il n'y ait que cinq modèles, ils diffèrent entre eux par le volume du cache de chaque contrôleur:

  • OceanStor Dorado 3000 V6: 192 Go
  • OceanStor Dorado 5000 V6: 256 Go / 512 Go
  • OceanStor Dorado 6000 V6: 1024 Go
  • OceanStor Dorado 8000 V6: 512 Go / 1024 Go / 2048 Go
  • OceanStor Dorado 18000 V6: 512 Go / 1024 Go / 2048 Go

Comme vous pouvez le voir, le volume total des anciens modèles ne change pas, mais le nombre de lecteurs change. Selon les déclarations des ingénieurs de Huawei, ils n'ont tout simplement pas eu l'occasion de tester des systèmes sur un volume supérieur à 2Pb. Théoriquement, ils soutiennent plus.

Nombre maximum de disques / capacité maximale: 

  • OceanStor Dorado 3000 V6 - 1000 / 500TiB
  • OceanStor Dorado 5000 V6 - 1200 / 1024TiB
  • OceanStor Dorado 6000 V6 - 1500 / 2048TiB
  • OceanStor Dorado 8000 V6 - 3200 / 2048TiB
  • OceanStor Dorado 18000 V6 - 6400 / 2048TiB

Dans un article précédent, j'ai oublié de mentionner quelles cartes d'interface sont généralement disponibles:


J'ai déjà dit (dans l'article précédent et dans celui-ci) que Huawei propose des SSD de leur propre conception - Palm Size, ou, comme ils les appellent, des SSD développés par Huawei (HSSD) comme périphériques de stockage.

Outre le fait que l'entreprise considère que son développement est plus rapide, il propose également quelques fonctionnalités clés.



  • SSD / - NAND. - NAND.

    HSSD . SSD , /. SSD / , , , , .
  • (Bad Block)

    - NAND. HSSD /, - NAND. , SSD (XOR) . HSSD , .
  • Vérification des antécédents

    Après avoir stocké des données dans le flash NAND pendant une longue période, des erreurs de données peuvent se produire en raison d'interférences de lecture, d'interférences d'écriture ou de dysfonctionnements accidentels. HSSD lit périodiquement les données d'une mémoire flash NAND, vérifie les changements de bits et écrit les changements de bits dans de nouvelles pages. Ce processus pré-détecte et traite les risques, ce qui empêche efficacement la perte de données et améliore la sécurité et la fiabilité des données.

Passons donc directement aux tests. Nous avons testé les deux variantes des contrôleurs 5000V6 avec 256 Go et 512 Go de cache.

Le premier test a été, pour ainsi dire, un échauffement.


Comme nous pouvons le voir, sur ce profil de charge de 8k 50r / 50rw, la différence était d'environ 7% (220 kIOPs contre 205 kIOPs) et n'affectait que le nombre final d'IOPS, et le temps de réponse est resté au même niveau - 0,9 ms.

Soit dit en passant, il était très simple de déterminer que nous avons commencé à nous reposer sur le contrôleur, le système lui-même a signalé une utilisation élevée des processeurs du contrôleur.


Le deuxième test que nous utilisons pour tous les systèmes sur SSD consiste à les évaluer et à les comparer avec un profil plus complexe.

Profil
[global]
direct=1
thread=1
iodepth=16
filename=/dev/sdb
ioengine=libaio
runtime=3600000
group_reptorting
time_based
[8r]
rw=randread
numjobs=24
bs=8k

[8w]
rw=randwrite
numjobs=24
bs=8k

[32r]
rw=randread
bs=32k
numjobs=1

[32w]
rw=randwrite
numjobs=1
bs=32k

[128r]
rw=read
bs=128k
numjobs=1

[128w]
rw=write
bs=128k
numjobs=1

[512r]
rw=read
bs=512k
numjobs=1

[512w]
rw=write
bs=512k
numjobs=1


Ici, l'image est complètement différente. Si la différence du nombre d'E / S par seconde sur deux mille (172 kIOP contre 170 kIOP) n'est pas significative du tout, le retard a augmenté cinq fois (de 0,4 ms à 2,1 ms), nous indique que lorsque vous travaillez avec un grand bloc, une plus grande quantité de cache donne un avantage au système.

L'année dernière, mes collègues et moi avons déjà testé le Huawei Dorado 5000 V3 , nous pouvons donc maintenant comparer ces deux systèmes.


Progrès sur le visage. Le profil de charge et la procédure de test étaient les mêmes dans les deux cas.

Bien sûr, il serait bon de faire une comparaison avec les concurrents aussi, personnellement, mes mains étaient très égratignées par rapport au NetApp AFF A400, système Full NVMe, qui est apparu il n'y a pas si longtemps. Malheureusement, elle n'a pas encore visité notre laboratoire de test, et comparer avec l'AFF A300 n'est pas tout à fait logique, même si le précédent Dorado 5000 V3 de Huawei était positionné comme son concurrent.

Dans la cour du 21e siècle, de nombreuses entreprises proposent différents programmes pour augmenter l'attractivité de leurs systèmes. Huawei a décidé de suivre cette voie.

Garantie de capacité e ff cace


Avec les nouveaux systèmes de stockage V6, vous pouvez compter en toute sécurité sur un stockage de données efficace avec compression et déduplication. En général, de nombreux fournisseurs sur le marché proposent déjà des programmes similaires qui, grâce à un stockage plus efficace, permettent un stockage garanti de plus de données sur le volume utile acquis du système de stockage de données.

Le coût de chaque téraoctet de SSD est encore assez élevé, les technologies de compression et de déduplication sont donc extrêmement utiles et présentent une grande efficacité sur de nombreux types de données. Si vos données sont vidéo, audio, images, données scientifiques, PDF, XML ou données cryptées, la déduplication ne sera pas effective, sinon la garantie fonctionne. Même si vous avez acheté un système avec le nombre maximum de lecteurs installés, vous recevrez également avec les lecteurs du programme une étagère d'extension.

Flashver



Si, avec la baie, vous achetez le programme Huawei Hi-Care Onsite ou Co-Care ou supérieur, vous pouvez compter sur la mise à jour gratuite des contrôleurs vers de nouveaux modèles de la même ligne. Cela vous permet d'avoir le système le plus moderne et le plus productif sans avoir besoin d'acheter de nouveaux systèmes ou de migrer des données. Le processus de remplacement des contrôleurs se déroule également sans interruption de service.

Si vous êtes un fan des interfaces et que vous souhaitez consulter le Gestionnaire de périphériques mis à jour, OceanStor Dorado 18000 V6 6.0.0 DeviceManager est déjà disponible sur le portail Huawei .

Malheureusement, ce système n'a été testé que pendant quelques jours, nous n'avons donc réussi à mesurer les performances. Mais je voudrais également effectuer des tests fonctionnels, nos tests de défaillance préférés et vérifier certaines plaintes de performances qui concernaient la ligne V3 précédente lors de l'exécution de certaines opérations - il est important de comprendre quels changements dans la nouvelle ligne (et, par conséquent, dans le logiciel) se sont produits et quel effet ont-ils apporté.

Je tiens à noter que la plupart des tests que je réalise pour mes articles sont du travail d'équipe. J'exprime ma gratitude à mes collègues du Groupe d'intégration de l'entreprise "Onlanta" avec qui je travaille. 

Soit dit en passant, nous recherchons un architecte système dans notre équipe .

All Articles