Qu'est-ce qu'Azure Stack HCI et comment ça marche

Bonjour, Habr! Aujourd'hui, nous voulons parler de la plate-forme Azure Stack HCI. Y compris ce qu'il est en général, à partir de quel matériel est assemblé, quel logiciel contient, comment il fonctionne, et c'est tout. Adhérer maintenant!



Ceci est un post invité des gars d'AltaStor. AltaStor est un intégrateur de systèmes spécialisé dans la création de solutions pour un stockage fiable des données. Grâce à l'expertise accumulée dans la création de clusters de basculement et de HCI, une solution individuelle est sélectionnée pour chaque client le mieux adapté à ses tâches.

Qu'est-ce que Azure Stack HCI?


Il s'agit d'une solution hyperconvergée qui combine plusieurs produits:

  • Matériel d'un partenaire OEM certifié Microsoft.
  • Système d'exploitation Windows Server 2019 Datacenter.
  • Logiciel Windows Admin Center.
  • Services Microsoft Azure si nécessaire.

Cette solution existe depuis longtemps sur le marché et certains de nos clients l'utilisent depuis longtemps et avec succès. Cependant, ils ne publient pas les résultats des tests de performances de leur installation. Nous avons décidé de combler cette lacune et de parler de notre expérience d'utilisation d'Azure Stack HCI avec un exemple spécifique.
 
Pour obtenir de la documentation et des informations générales sur Azure Stack HCI, cliquez ici .
 

Disposition du stand

 

 

Équipement


La création d'une solution nécessite une plate-forme matérielle recommandée par Microsoft. Les principaux fabricants de matériel serveur - HPE, Dell EMC, Fujitsu, Hitachi, Lenovo, etc. - ont développé leurs configurations, les ont testées pour la compatibilité et certifiés pour Azure Stack HCI.
 
Une liste complète des équipements compatibles est disponible sur .
 
Selon les types de lecteurs utilisés, les composants de la plate-forme varient.
 
Nous préférons construire de telles solutions sur la base de serveurs Fujitsu avec le système d'exploitation Windows Server 2019 Datacenter préinstallé. Ce fabricant après la vente prend en charge l'ensemble du complexe logiciel et matériel en tant que solution complète, et pas seulement son matériel. Ceci est important pour nous, en tant que partenaires, et pour le client final.
 
Actuellement, Fujitsu dispose de cinq configurations certifiées pour différents types de disques, modèles de serveurs et nombre de nœuds. Le nombre maximal de nœuds pour Azure Stack HCI est de 16, le minimum est de 2, mais certaines configurations sont limitées à 4.
 
Toutes les configurations Fujitsu compatibles peuvent être consultées ici .
 
Pour l'installation, nous avons choisi la configuration la plus efficace parmi celles actuellement certifiées - Fujitsu Primergy avec des disques SSD pour le stockage des données, et des modules de mémoire ultra-rapides Intel Optane connectés via l'interface NVMe comme cache système. Nous nous attendons à obtenir une baie 100% Flash définie par logiciel avec des performances comparables au stockage classique avec des disques SSD et un cache NVMe.
 
Les systèmes de stockage 100% Flash des leaders de l'industrie ont des configurations de type de support similaires. Nous savons quels IOPS et mesures de latence peuvent être obtenus dans la pratique à partir de systèmes similaires et attendons avec impatience des performances similaires d'Azure Stack HCI basées sur la configuration Fujitsu sélectionnée.


 
L'architecture de cette solution Fujitsu est décrite en détail dans un document disponible ici .
 
Nous vous recommandons de vous familiariser avec celui-ci avant l'installation.
 

 
Le document décrit les limites de l'architecture, les schémas de connexion typiques et de nombreuses autres informations utiles au stade de la mise en œuvre.
 


Commutateurs

 
La solution de Fujitsu utilise son propre commutateur Ethernet PSWITCH. Pour nous, nous avons noté les avantages suivants: 
 
  • Les interrupteurs de cette série sont très productifs, à faible coût.
  • Les commutateurs sont assez simples à configurer et à utiliser l'interface de type CISCO. Les ingénieurs n'ont rencontré aucune difficulté lors de l'installation.
  • Il n'y a aucun excès de propriété dans l'administration et une documentation compétente est disponible.

L'équipement de commutation Fujitsu est l'un des leaders de l'industrie au Japon. Il est récemment devenu disponible sur le marché russe, mais est déjà régulièrement utilisé dans les projets de nos architectes et autres partenaires Fujitsu. Un nombre limité de modèles sont actuellement disponibles. 
 
En savoir plus sur les commutateurs Fujitsu sur le site officiel .
 

Serveur


À l'intérieur du serveur, les cartes mémoire Intel Optane occupent une partie importante de l'espace. 
 



 
Intel accorde une grande attention aux performances en cas de forte demande de chaleur. D'une part, pour un refroidissement de qualité maximale, de grands radiateurs sont utilisés. En revanche, cela limite le flux d'air de refroidissement à l'intérieur de l'ensemble du serveur. 
 
C'est l'un des points clés qui est pris en compte lors de la certification de la configuration - il est nécessaire de considérer tous les scénarios possibles dans lesquels, en raison d'un refroidissement insuffisant, les serveurs sont capables de surchauffer le module Optane, ou vice versa.
 
Lors du déménagement de la salle des serveurs, nos clients ont plus d'une fois été confrontés à une situation où le système de climatisation n'était pas encore mis en service. Par conséquent, nous avons décidé de vérifier à quel point cette installation est exigeante pour le système de refroidissement et de mesurer la durée de vie de la plate-forme sous charge à l'extérieur de la salle des serveurs refroidie.  
 
Les tests ont été effectués à température ambiante, mais nous n'avons rencontré aucune limitation thermique, ni diminution des performances, ni apparition d'erreurs dues à une surchauffe. Nous avons vu de notre propre expérience que les serveurs testés prennent en charge la capacité de travail déclarée à une température ambiante allant jusqu'à +45 degrés Celsius. 
 
Remarque.Cette expérience ne doit pas être considérée comme une recommandation d'abandonner l'utilisation de salles de serveurs spéciales avec une ventilation de haute qualité. Lorsque vous choisissez un fournisseur de solutions matérielles, assurez-vous de faire attention au package de température maximale.
 

Assemblage de plate-forme matérielle

 
Vue avant: Vue
 

 
arrière:
 

 
Un seul interrupteur a été utilisé dans le test. Pour une utilisation commerciale, nous vous recommandons toujours de réserver des chemins d'accès en utilisant au moins deux commutateurs. Selon nos statistiques, la défaillance matérielle la plus courante dans les clusters est une rupture accidentelle de câble ou un contact rompu dans le connecteur. 
 
Fujitsu RX1330 a été utilisé comme serveur avec un logiciel de contrôle. Il s'est également vu confier les fonctions d'arbitre et de serveur de quorum.
 

Déploiement de cluster

 
La première étape a consisté en l'installation physique des composants matériels, la connexion des câbles d'interface, etc. Cela a été suivi par la configuration du logiciel, comme Le système d'exploitation est déjà préinstallé. Nous avons déployé Storage Space Direct sur chaque serveur et construit un cluster de 2 nœuds et un arbitre.
 
Nous avons ensuite utilisé l'utilitaire Fujitsu Infrastructure Manager, une extension Windows Admin Center qui s'intègre étroitement avec le matériel du serveur Fujitsu et contient tous les outils de gestion d'Azure, tels que:

  • Azure Site Recovery fournit une haute disponibilité et une reprise après sinistre en tant que service (DRaaS).
  • Azure Monitor est un site centralisé pour surveiller le fonctionnement des applications, des réseaux et de l'infrastructure avec des analyses approfondies basées sur l'IA.
  • «-» Azure .
  • Azure Backup , -.
  • « Azure» Windows, Azure .
  • Azure Azure VPN- « — ».
  • « Azure» . 

L'extension vous permet d'automatiser un certain nombre de tâches qui peuvent également être effectuées directement dans le centre d'administration.

Pool de stockage rassemblé, créé des volumes dedans. Ces volumes sont par la suite localisés des machines virtuelles pour lesquelles nous avons effectué des tests de performances. Les volumes et les machines virtuelles sont gérés de manière pratique à partir d'une seule fenêtre.
 

 
Grâce à Fujitsu Infrastructure Manager, il est également pratique de faire beaucoup de choses sur la maintenance planifiée et les mises à jour du microcode. L'état de tous les équipements est clairement affiché, beaucoup peut être automatisé.
 

 
Il existe deux versions de l'utilitaire Fujitsu Infrastructure Manager - payantes et gratuites:
 
  • Gratuit. Disponible en téléchargement sur le site Web du fabricant, il suffit amplement pour la gestion du serveur.
  • . Microsoft Azure HCI — Windows Server .

Pour une intégration profonde de Primergy avec Microsoft Azure Stack HCI, vous avez besoin d'un plug-in de gestion de serveur à partir de Windows Server, qui n'est disponible que dans la version payante. Par conséquent, la solution FUJITSU Integrated System PRIMEFLEX pour Microsoft Azure Stack HCI en fait partie. 
 
Plus vous avez d'installation, plus l'automatisation fournie par l'utilitaire est précieuse.
Il n'y a que 2 nœuds dans notre stand et nous pourrions faire tout le travail manuellement. Si vous avez 4 nœuds ou plus, le logiciel réduira considérablement vos efforts d'installation et d'administration. Le coût des services publics représente moins de 1% du projet, mais accélère considérablement la mise en service des équipements.
 
Pour le Centre d'administration Windows, Fujitsu Infrastructure Manager Orchestra est un pack d'extension:
 

 
La même capture d'écran montre la composition du sous-système de disques du serveur: deux modules Optane sont utilisés comme extension de cache et cinq disques SSD comme pool de stockage de niveau 1.
 

Les points importants


Lors de la création d'une solution, plusieurs nuances doivent être prises en compte:
 
vous pouvez gérer Microsoft Azure Stack HCI de deux manières: via le Centre d'administration Windows ou Fujitsu Infrastructure Manager. 
 
Admin Center a également ses avantages - vous pouvez le déployer sur n'importe quoi, même sur un ordinateur portable; Il est possible de contrôler à partir de la ligne de commande. Avec lui, l'administrateur peut faire presque n'importe quoi. 
 
Il existe également Cluster Manager - un outil indispensable pour tout problème avec le cluster. 
 
Lors du déploiement de Witness (serveur de quorum), il est important de l'ajouter à Active Directory et de vérifier sa disponibilité sur tous les nœuds. Les exigences pour cette tâche sont minimes et peuvent être placées sur n'importe quel serveur de base.

 
Du point de vue de Windows Server, il existe trois types de périphériques de disque: NVMe, SSD et HDD. La logique du travail est la suivante: les périphériques NVMe sont le cache de lecture / écriture, le SSD est le niveau de stockage de niveau 1; HDD - Niveau de stockage Tier-2. Ensuite, vous pouvez configurer des stratégies pour déplacer des données entre des pools. Les NVDIMM peuvent également être utilisés comme cache.
 
La taille de bloc par défaut pour la déchirure est 4K, mais peut varier en fonction du type de système de fichiers dans la machine virtuelle. Cela affectera par la suite les performances.
 
Nous utilisons des modules NVMe comme cache, donc la vitesse de lecture et d'écriture des données sera très différente - cela sera clairement visible dans les tests de performances:
 
  • ( ), SSD (Tier-1, ).
  • NVMe , , . .

Avant de créer un cluster, la validation et tous les tests dans le gestionnaire de cluster de basculement doivent être terminés. Le rapport doit être enregistré, car sans lui, il ne sera pas possible d'ouvrir un appel de service dans le support Microsoft, si nécessaire.
 
Lors de l'ajout de nouveaux nœuds à un cluster existant, les nœuds seront automatiquement ajoutés au pool de stockage. Après 15 minutes, le cluster reconstruira, reconstruira et équilibrera automatiquement le pool de stockage. Cela peut affecter les performances lors de la reconstruction.
 

Des tests de performance


Passons maintenant à la partie la plus intéressante - les tests de charge.
 
Configuration de test:
 
  • deux serveurs Fujitsu PRIMERGY RX2540 assemblés en cluster;
  • chaque serveur dispose de deux modules de mémoire de classe de stockage Intel Optane installés, utilisés pour étendre le cache de lecture / écriture;
  • SSD, ,
  • erasure coding ( RAID-5).

En fait, il s'agit d'un système de stockage défini par logiciel exécutant Windows Server 2019 Azure Stack HCI.
 
Nous commençons le premier test avec 12 machines virtuelles exécutées sur les deux nœuds. Le profil de chargement en lecture / écriture est 70:30, la taille du bloc = 8k. La taille de bloc a été choisie en fonction du fait que la plupart des bases de données transactionnelles et des charges OLTP modernes utilisent exactement une telle taille de bloc et approximativement le même rapport de lecture / écriture.
 

 
Les performances du cluster en régime permanent sont de 428 000 IOPS avec un retard de 0,487 ms. C'est un résultat vraiment digne, qui est tout à fait comparable à ce que vous pouvez obtenir sur un système de stockage 100% flash spécialisé de nombreux fabricants. 
 
Des tests indépendants avec un profil de charge similaire sont fournis sur la ressource spcresults.org - il s'agit du test SPC-1. La différence avec notre configuration réside uniquement dans la taille du bloc - elle est de 4k.
 
Si nous simplifions considérablement la méthodologie de comparaison des résultats, nous pouvons diviser en deux indicateurs IOPS obtenus pour les systèmes de stockage 100% flash et les comparer avec les chiffres que nous avons reçus au même temps de réponse. Les résultats obtenus sur notre cluster de deux serveurs de niveau intermédiaire sont assez comparables à la plupart des systèmes de stockage. 

Bien sûr, une telle comparaison n'est pas très correcte, car dans notre cas, une augmentation du nombre de disques affectera les performances et les retards différemment qu'avec un système de stockage spécialisé. Mais, même en tenant compte de toutes ces hypothèses, on peut dire qu'il y a quelques années, de telles performances n'étaient visibles que sur un système de stockage externe multi-contrôleurs d'un niveau moyen voire supérieur. Aujourd'hui, cela est réalisable sur une solution hyperconvergée.
 
L'image des performances change considérablement lorsque la déduplication et les mesures sont activées avec la taille de bloc précédente = 8k. Si vous activez simplement la déduplication sur le même profil de charge, les performances seront inférieures à 300 000 IOPS. 

Si nous exécutons deux profils de charge avec un bloc de 8 Ko où un profil est 100% lu et l'autre 100% écrit, alors ci-dessous sont les meilleurs chiffres que nous avons pu obtenir:
 

 
Nous voyons d'excellents résultats de lecture, surtout si nous prenons en compte un retard de 12 μs. Ici, Optane fait vraiment un excellent travail en tant que cache de lecture avec des algorithmes proactifs pour le transfert prédictif de données vers le cache. Oui, et le pool de stockage lui-même, situé sur le SSD, affiche également de très bons nombres de lecture.
 
Mais la vitesse d'écriture est très différente. Voici quelques facteurs sérieux:

  • L'architecture de la solution, lorsque des données tombant dans le cache d'un nœud sont copiées sur le réseau vers le cache du deuxième nœud.
  • : — , Optane. .

    45%, , — , . .
  • SSD SSD — 3D-NAND , 3D-NAND.


  • OLTP- – 8k .  
  • La déduplication peut être activée à tout moment, mais elle réduit considérablement les performances. L'efficacité de la déduplication dans nos tests était de 45% avec une baisse de performance de plus de 25%. 

Cela vous donne la liberté de choix - soit des performances de stockage supérieures, soit presque deux fois plus de capacité. En outre, beaucoup dépendra du profil de charge et de la capacité de compresser les données enregistrées.

  • En raison de l'architecture de la solution, les opérations d'écriture séquentielle augmentent considérablement le temps de réponse. 
  • Ce n'est pas en vain que Microsoft vous oblige à construire une solution uniquement sur la base de configurations validées de partenaires OEM - cela vous permet d'éviter de nombreux problèmes à la fois lors de l'installation initiale et lors de travaux ultérieurs.
  • Travailler avec le matériel de Fujitsu, comme toujours, n'a laissé qu'une impression positive. Il s'agit d'une documentation judicieuse et de nombreux ajouts utiles d'Infrastructure Manager - ce progiciel simplifie considérablement la gestion du système. Ceci est particulièrement important lors de l'augmentation du nombre de nœuds.
  • La solution PRIMEFLEX de Fujitsu comprend un ensemble de scripts qui accélère le processus de déploiement. Ils facilitent le démarrage et la configuration en général, et les serveurs Fujitsu PRIMERGY en particulier.


 
Pour ceux qui ne souhaitent pas régler automatiquement la solution, il est possible de conclure un contrat de solution technique avec Fujitsu. Dans ce cas, les spécialistes techniques du fournisseur déploieront tout sur une base clé en main et fourniront un support supplémentaire.

All Articles