Faire évoluer un réseau à haute charge avec Nutanix: fonctionnalités et défis avec un boîtier personnel

image

En raison du fait que des millions de personnes sont assises à la maison, le trafic Internet est monté en flèche. Plus d'une fois, des craintes ont été exprimées qu'une charge excessive sur le réseau puisse entraîner une panne de courant - nationale, nationale ou même mondiale. Heureusement, ce problème est toujours en cours de résolution, mais il existe d'autres difficultés moins évidentes.

Quel genre? Maintenant, de nombreuses sociétés de commerce ou de livraison en ligne n'ont pas le temps de traiter le nombre croissant de commandes, elles perdent des clients, de l'argent et de la réputation, notamment parce que leur infrastructure informatique n'était pas prête pour une augmentation multiple des volumes de traitement des données. Cela pourrait être évité en faisant évoluer rapidement l'infrastructure informatique. Cela peut être fait en utilisant l'infrastructure hyperconvergée (HCI). Cet article lui est dédié.

?


Nous, Platbox, traitons les paiements des clients (banques, systèmes de paiement) depuis environ sept ans. Nous traitons environ 100 millions de transactions par an. Il s'agit d'acquisitions, de paiements par SMS, d'actions de différentes sociétés, etc.
Au fil du temps, le nombre de commerçants dont nous traitons les paiements augmente et la charge sur le réseau augmente.

Le problème de la mise à l'échelle est apparu dès le premier jour de l'existence de l'entreprise. La charge augmente - nous achetons des serveurs, dimensionnons le réseau, résolvons le problème. Puis le nombre de transactions augmente à nouveau, les ressources s'épuisent progressivement, le cycle se répète. Maintenant, le réseau se compose d'un zoo complet d'équipements, allant des serveurs de SuperMicro à Dell. Cette diversité complique la maintenance du réseau et augmente le nombre d'opérations de routine pendant la maintenance.

L'augmentation du nombre d'équipements est également un coût. Nous avons des racks de location dans les centres de données. Nous payons le loyer de l'espace physique, l'électricité consommée par les serveurs, etc. Plus il y a de serveurs, plus vous devez payer, tout est simple. De plus, nous avons décidé d'étendre notre place sur SDH, ainsi que d'augmenter la puissance de calcul des serveurs. La question s'est posée: continuer à faire évoluer ce qui existe déjà, agir dans les conditions de l'architecture classique à trois niveaux ou introduire quelque chose de nouveau.

Il y a environ six mois, ils ont décidé de chercher une autre solution qui résoudrait les problèmes décrits ci-dessus. Il y avait plusieurs options, nous avons choisi celle optimale - utiliser une infrastructure hyperconvergée au lieu de l'infrastructure traditionnelle.

Qu'est-ce qu'une infrastructure hyperconvergée (HCI)?


Ici, vous avez besoin d'une petite digression dans l'histoire de l'informatique. Une fois que les données ont été traitées sur des mainframes - de gros ordinateurs puissants, puis elles ont été remplacées par des «serveurs d'architecture standard» moins chers et plus flexibles, le concept d'architecture à 3 niveaux est apparu et, en conséquence, divisant le centre de données en un sous-système de stockage (SAN) distinct , sous-système de traitement (serveurs) et sous-système de transmission de données (partie réseau du centre de données). À mesure que l'informatique évoluait, de nouvelles façons de stocker et de traiter les données et de résoudre les problèmes des utilisateurs sont apparues. HCI est «l'infrastructure de l'ère« cloud »» de l'informatique, le rejet de l'architecture à 3 niveaux au profit, par exemple, du microservice.

D'un point de vue pratique, dans une infrastructure convergée classique, un serveur, un système de stockage, un équipement réseau et un outil de virtualisation sont des éléments distincts. L'infrastructure hyperconvergée les intègre, ainsi que tous les composants du centre de données familier dans un seul système. Parfois, HCI comprend des composants supplémentaires, par exemple, un logiciel de sauvegarde, des capacités de capture instantanée, une fonctionnalité de déduplication des données, une compression intermédiaire et une optimisation du réseau informatique.

Si une infrastructure convergente est principalement basée sur le matériel et qu'un centre de données défini par logiciel est souvent adapté à n'importe quel matériel, ces deux capacités sont combinées dans une infrastructure hyperconvergée. Il améliore également la fiabilité opérationnelle, les performances et la sécurité des données. En général, HCI doit être considéré comme un cycle d'évolution de l'infrastructure informatique.

Après avoir évalué les avantages et les inconvénients, nous avons décidé d'essayer l'hyperconvergence, contacté Nutanix, obtenu la plate-forme pour le test, qui a réussi. Pour le test, nous avons obtenu une plateforme hyper-convergente, composée de six nœuds, mais de deux unités. Nous économisons de l'électricité, de l'espace en rack, pas besoin d'acheter un serveur sans fin.

5 avantages d'une infrastructure hyperconvergée

image

  1. IT- – HCI, IT-«», .
  2. ;
  3. . . , . , . Nutanix , .
  4. Le risque d'indisponibilité des services en cas de défaillance d'un ou plusieurs des composants du fait de l'unification, de la sauvegarde des données et du matériel est réduit. Si l'équipement «tombe» soudainement dans un centre de données, la réserve démarre immédiatement dans un autre.
  5. Code produit open source - facilite un audit de sécurité, et le STIG (Security Technical Implementation Guide ou ensemble de recommandations pour la protection des systèmes informatiques) fournit une exécution de code de sécurité élevée et une résistance à l'impact des cybercriminels sur le système informatique.

Comment avons-nous choisi un fournisseur


Nous avons examiné plusieurs fournisseurs de systèmes hyperconvergés. Parmi eux, Cisco Hyperflex, SimpliVity, HPE Hyper Converged, Fujitsu PRIMERGY CX et Nutanix. Ensuite, les critères de sélection suivants ont été formulés:

  • Fiabilité et sécurité des données à l'intérieur;
  • Conformité aux exigences de sécurité PCI DSS 3.2.1;
  • Vitesse de travail;
  • Maintenance et support technique;
  • La flexibilité pour faire évoluer l'infrastructure à la vitesse dont l'entreprise a besoin.

En conséquence, nous nous sommes arrêtés chez Nutanix, car c'est avec cette société que, en fait, le marché HCI a commencé en 2012. Il offre le produit le plus stable avec flexibilité et les plus grandes capacités, par exemple:

  • Une large sélection de plateformes (HPE, Dell, Fujitsu, Cisco);
  • Disponibilité d'une version gratuite de Community Edition;
  • La liberté de choisir un hyperviseur (y compris gratuit - AHV).
  • Un petit "quantum de croissance" (en fait, c'est un serveur), qui donne déjà à l'entreprise tout ce qu'elle peut et donne le plus grand: fiabilité, sécurité et nouvelles technologies. Toutes les fonctionnalités de Nutanix, aujourd'hui utilisées par le niveau métier, par exemple VTB ou le groupe Société Générale, sont également disponibles pour les solutions les plus d'entrée de gamme.

De plus, des spécialistes ayant une expérience de travail avec la plateforme Nutanix sont apparus dans notre équipe technique. Grâce à eux, nous savions comment le système se comporterait dans des situations critiques, ce qui est extrêmement important pour nous, comme pour une fintech.

Un autre facteur qui a influencé le choix de Nutanix est la disponibilité d’un outil de transition tel que Nutanix Move. Il vous permet de traduire des machines avec un temps d'arrêt minimal. Ainsi, par exemple, s'il existe des machines VMware et Nutanix, alors Move agit comme une sorte de pont. Il prend la machine de VMWare, la clone, la déploie sur Nutanix sur la base d'instantanés, l'éteint dans VMWare et la lance dans nutanix. Tout cela en quelques secondes.

Le processus de transition vers Nutanix


image

La principale exigence lors du déplacement n'était pas de violer la stabilité du système, il était donc nécessaire de passer très soigneusement à une nouvelle plate-forme.

Par conséquent, tout a commencé par tester la plateforme d'essai Nutanix, déjà mentionnée ci-dessus. Nous avons commencé une série de tests en déployant un environnement de test. Nous avons utilisé le traitement, qui n'est pas en production, et, pour ainsi dire, nous l'avons «tiré» à partir de Yandex-gun. Nous avons vérifié la charge, utilisé suffisamment de ressources pour nos besoins, réalisé que cela fonctionnait parfaitement et où l'optimisation était nécessaire.

HCI coexiste généralement avec l'infrastructure classique, sans nécessiter l'abandon immédiat du centre de données familier. La migration vers HCI peut être progressive, étendue et fluide autant que l'entreprise en a besoin. Par exemple, si la virtualisation et un hyperviseur sont déjà utilisés dans le centre de données de l'entreprise, la transition vers l'environnement HCI est une migration progressive des machines virtuelles des anciens serveurs vers les nouveaux: des serveurs «classiques» aux serveurs HCI. C'est juste notre cas. Nous devrons transférer des machines virtuelles vers un autre environnement virtuel. Dans la mesure du possible, la migration automatique à l'aide de Nutanix Move sera impliquée, certains services sont décrits comme une infrastructure sous forme de code (IaC).

Tout cela peut être divisé en plusieurs étapes:

  1. Rédaction de RoadMap.
  2. Lancement d'une nouvelle infrastructure.
  3. Traduction de services selon RoadMap.

La mise en œuvre de ces étapes prend environ 2 mois.

Difficultés et problèmes de transition

Les problèmes, bien sûr, étaient. La principale difficulté réside dans le fait que le traitement au moment de la migration des services doit encore être suspendu. Mais nous avons travaillé sur ce point lorsque nous avons pris la plate-forme Nutanix pour les tests. Nous avons construit un plan d'achat d'équipements et de migration de services au stade des tests. La mise en œuvre stricte du plan approuvé est la clé du succès de la migration des services.

Dans certaines entreprises, d'après notre expérience, les difficultés de passage à une infrastructure hyperconvergée sont plus susceptibles de ne pas être d'ordre technique, mais d'ordre organisationnel ou «budgétaire». Par exemple, si un centre de données fonctionne et qu'il n'y a pas de nouvelles tâches pour lui, si beaucoup d'équipements coûteux ont été achetés relativement récemment pour le développement d'une infrastructure "classique", il sera très difficile de trouver une idée (et de faire valoir sa direction ou ses investisseurs), qui cela doit être abandonné et l'argent dépensé à nouveau - déjà chez HCI.

Résultats positifs du passage à HCI

image

La qualité du sommeil des professionnels de l'exploitation s'est considérablement améliorée. Pourquoi? C'est simple: le stockage distribué améliore la fiabilité du stockage et la disponibilité des données.

Processus commerciaux et employés optimisés:

  • un administrateur au lieu de 3;
  • IT-, ;
  • .
  • .

Coûts en fer réduits. À propos de comment et pourquoi, il a été dit plus haut. Simplification de la mise à l'échelle des coûts du centre de données. Dans l'approche classique, il peut être très difficile de développer une infrastructure prête à décupler sans avoir à la changer en tout ou en partie. Dans le cas de HCI, vous pouvez commencer avec une toute petite solution, en investissant progressivement davantage dans les infrastructures.

Il est possible de redistribuer les coûts des coûts en capital aux coûts opérationnels , qui vont désormais aux TI partout dans le monde. Cela nécessite une façon différente de planifier les coûts, sinon regardez des choses familières, apprenez de nouvelles choses, mais c'est là que va l'industrie aujourd'hui.

Pour comprendre à quel point c'est simple, nous allons vous donner un cas. Ainsi, lors du marathon caritatif, nous avons eu une très forte charge réseau - bien supérieure à celle calculée. L'erreur de calcul est survenue parce que la charge a été calculée à partir des statistiques des marathons précédents. Nous n'avons pas tenu compte du fait que davantage de personnes participeront à la nouvelle, la raison étant la quarantaine et l'auto-isolement. Si le problème s'était posé avec l'infrastructure existante, les conséquences auraient été très négatives, notamment la déconnexion des services. Nous avons maintenant pris Nutanix, grâce auquel nous avons pu augmenter le cluster exactement deux fois. Le système a «digéré» la charge. Et tout cela pourrait être fait en seulement 15 minutes et en quelques clics de souris.

Un peu sur les perspectives technologiques et le choix de HCI


Tout le monde devrait-il passer à HCI? Non bien sûr que non. Fondamentalement, l'infrastructure hyperconvergée convient aux entreprises qui ont des réseaux à grande échelle, une charge élevée sur eux et suffisamment de fonds pour la transition. Si une startup a plusieurs serveurs, vous ne pouvez rien changer.

Mais si l'entreprise a tout un serveur de zoo de fer, un réseau mal optimisé et un coût élevé pour le fer et sa maintenance, HCI est définitivement là.

Eh bien, ce qui suit peut être dit sur l'avenir de HCI. d'abord, HCI est distribué dans le monde et en Russie dans la mesure où l'informatique est prête à accepter et à utiliser de nouvelles idées. De nombreuses entreprises en développement recherchent de nouvelles opportunités de développement et de croissance, en particulier dans le contexte de la réduction des budgets informatiques. Les entreprises d'entreprises traditionnelles et conservatrices sont susceptibles de venir à HCI plus tard, actives, jeunes, développant et utilisant de nouvelles technologies - plus tôt.

Deuxièmement , de plus en plus d'entreprises entreront sur le marché HCI, la technologie deviendra plus répandue et plus abordable. Déjà, tous les principaux fabricants de serveurs et de systèmes de stockage ont des propositions dans le domaine de HCI, et cela s'est produit littéralement au cours des deux dernières années.

Troisièmement, l'idée de «cloudiness» continuera à se développer, y compris sous la forme d'un «cloud hybride», lorsqu'une partie de l'infrastructure sera située dans «son» data center, et une partie sera louée en fonction des besoins.

Un exemple est les mêmes magasins en ligne et services de livraison. En cas de saut de trafic multiple, ils pourraient évoluer en quelques minutes en louant des capacités à un opérateur cloud, et ne pas «se bloquer» toute la journée, perdant ainsi des clients et leur argent. Et puis, après la baisse de la demande et la réassurance du marché, redimensionnez l'infrastructure sans sacrifier la sécurité, les performances ou dépenser de l'argent pour l'achat de votre équipement. Peut-être qu'à l'avenir, le «cloud» et «votre centre de données» seront liés de manière transparente. Au moins toutes les technologies pour cela existent déjà.

Quatrième, les systèmes d'automatisation pour la gestion de l'infrastructure informatique commenceront à se développer activement, notamment en utilisant l'IA, la virtualisation de l'infrastructure réseau du centre de données.

All Articles