🤛🏾 🍄 🏽 Solution HiDC pour la construction d'une infrastructure TIC moderne de centres de données basée sur l'équipement Huawei Enterprise 👨🏻‍🎨 👨🏽‍🎨 🚀

Avec une vue d'ensemble de toutes les solutions Huawei Enterprise modernes introduites en 2020, nous passons à des histoires plus spécifiques et détaillées sur des idées et des produits individuels qui peuvent servir de base à la transformation numérique des grandes entreprises et des agences gouvernementales. Aujourd'hui - sur quels concepts et technologies Huawei propose de construire des centres de données sur la base de.

À l'ère du «monde connecté», les tâches de stockage et de traitement des données nécessitent de nouvelles approches à toutes les étapes du cycle de vie du datacenter. Ils doivent simultanément devenir à la fois plus simples et «plus intelligents» afin de faire face au rôle qui leur est confié en tant qu'éléments centraux de l'infrastructure de l'économie numérique mondiale.

En 2018, l'humanité a stocké 33 zettaoctets d'informations, mais d'ici 2025, son volume total devrait augmenter de plus de cinq fois. Trois décennies d'expérience dans le développement des infrastructures TIC ont permis à Huawei de bien se préparer au «tsunami des données» croissant et d'offrir à ses partenaires et clients le concept d'un centre de données intelligent, incluant toutes les étapes de sa construction, de son exploitation et de sa maintenance. Les éléments de ce concept sont combinés sous le nom général HiDC.

Numérisez-le

Une nouvelle blague se promène sur le Web: qui a le plus accéléré la transformation numérique de votre entreprise - PDG, CTO, conseil d'administration? L'épidémie de coronavirus! Seuls les paresseux ne tiennent pas de webinaires, n'écrivent pas d'articles, ne disent pas comment et quoi faire. Mais ce sont toutes des actions réactives. Certains ont préparé à l'avance.

Pas pour se vanter - pour des raisons objectives, citons comme exemple notre entreprise, dans laquelle la transformation numérique a été lancée à grande échelle il y a plusieurs années. Actuellement, nous pouvons transférer presque tous les employés au travail à domicile sans aucune perte d'efficacité. L'histoire d'un hôpital construit à Wuhan en dix jours est révélatrice. Là, la transformation numérique a fait ses preuves dans le fait que tous les systèmes informatiques ont été déployés en trois jours. La transformation numérique n'est donc pas une question de «quand» et de «pourquoi», mais de «comment».

Approche architecturale plutôt que développement spontané

Quels sont les principaux problèmes auxquels nous sommes confrontés lorsque nous commençons à construire un certain système? Jusqu'à présent, tous nos clients travaillent dans un mode de combinaison des tâches métier avec des services applicatifs et des solutions informatiques. Il est assez difficile de se faire une idée générale du fonctionnement d'un tel complexe s'il a été créé simplement en ajoutant différents blocs. Et pour construire un système en tant qu'organisme unique, une approche architecturale est tout d'abord nécessaire. Nous l'avons incarné dans l'idéologie de notre solution HiDC.

Valeur maximale et valeur minimale

L'ensemble de la structure HiDC est constituée de deux tranches principales. Le premier est ce que vous avez l'habitude de voir avec Huawei, une infrastructure classique. Les éléments de la deuxième tranche sont plus facilement combinés par le terme «données intelligentes».

Pourquoi est-ce nécessaire? De nos jours, de nombreuses entreprises accumulent d'énormes quantités d'informations, souvent dispersées ou accessibles à travers différents types de «laying». Oui, prenez au moins des bases de données régulières. Demandez à vos administrateurs de bases de données comment ces bases de données sont interconnectées et comment utiliser leurs informations dans les systèmes de BI pour prendre des décisions commerciales. Étonnamment, les DB sont souvent très faiblement connectés les uns aux autres et fonctionnent comme des «îles» distinctes. Par conséquent, tout d'abord, nous avons réfléchi aux approches architecturales qui permettraient d'éliminer ce problème.

Principes de conception de l'architecture HiDC

Tenez compte des principes de conception de base de HiDC. Tout d'abord, il sera utile non pas aux spécialistes d'une direction particulière, mais aux architectes de solutions qui peuvent couvrir l'ensemble du panorama avec un regard.

Les plus courantes sont les unités de réseau convergent et les unités de gestion des données. Et déjà, un concept surgit auquel les architectes de solutions pensent rarement - la gestion du cycle de vie des données. À partir de bases de données classiques, il a migré vers de nombreux autres systèmes, y compris le cloud et l'informatique en périphérie.

. — , . , «» — , . ( — ).

C’est formidable lorsque nous avons à notre disposition les six blocs de la structure HiDC. Cependant, les clients travaillent souvent dans un environnement créé précédemment. Cependant, l'utilisation d'un seul bloc du circuit ci-dessus peut porter ses fruits. Et si vous ajoutez un deuxième, un troisième et ainsi de suite, un effet synergique commencera à apparaître. La combinaison d'un réseau et d'un système de stockage distribué donnera à elle seule des performances plus élevées et une latence plus faible. L'approche par blocs nous permet de nous développer non pas au hasard, comme cela arrive souvent dans l'industrie, mais en utilisant une approche architecturale intégrée. Eh bien, l'ouverture des blocs eux-mêmes offre la liberté de choisir la solution optimale.

Temps de réseau convergés

Récemment, sur les marchés mondiaux et russes, nous promouvons de plus en plus avec zèle le concept de réseaux convergents. Aujourd'hui déjà, nos clients utilisent des solutions convergentes sur RoCEv2 (RDMA sur Ethernet convergé v2) pour construire des systèmes de stockage distribués définis par logiciel. Le principal avantage de cette approche est son ouverture et l’absence de nécessité de créer un nombre indéfini de réseaux disparates.

Pourquoi n’avez-vous pas fait ça avant? Rappelons que la norme Ethernet a été développée en 1969. Pendant un demi-siècle, il a accumulé beaucoup de problèmes, mais Huawei a appris à les résoudre. Maintenant, grâce à un certain nombre d'étapes supplémentaires, nous pouvons utiliser Ethernet pour les applications stratégiques, les solutions très chargées, etc.

De DCN à DCI

La prochaine tendance importante est l'effet synergique de l'introduction du DCI (Data Center Interconnect). En Russie, contrairement à la Chine, quelque chose de similaire jusqu'à présent ne peut être trouvé que chez les opérateurs de télécommunications. Lorsque les clients envisagent des solutions réseau pour le centre de données, ils ne prêtent généralement pas l'attention voulue à l'intégration profonde des réseaux optiques et des solutions IP classiques au sein d'un point de présence unique. Ils utilisent des solutions familières qui fonctionnent sur la couche IP, ce qui leur suffit.

Pourquoi alors avez-vous besoin de DCI? Imaginez que l'administrateur hôte DWDM et l'administrateur réseau agissent indépendamment. À un moment donné, l'échec survenu à l'un d'eux peut sérieusement réduire votre tolérance aux pannes. Et si nous utilisons le principe de synergie, le routage IP est effectué en tenant compte de ce qui se passe sur le réseau optique. L'utilisation d'un tel service intelligent augmente considérablement le nombre de neuf dans le niveau de disponibilité de l'ensemble du système.

Un autre avantage majeur de notre DCI est sa grande marge de performance. En résumant les possibilités des gammes C et L, vous pouvez obtenir environ 220 lambdas. Une telle réserve est peu susceptible d'être rapidement épuisée même par une grande entreprise cliente, étant donné que notre solution actuelle permet de transférer jusqu'à 400 Gbit / s à travers chaque lambda. À l'avenir, sur le même équipement, il sera possible d'atteindre 800 Gb / s.

Une commodité supplémentaire est fournie par la contrôlabilité générale que nous fournissons via des interfaces classiquement ouvertes. NETCONF gère non seulement les commutateurs, mais aussi les dispositifs de compactage optique, ce qui permet d'atteindre la convergence à tous les niveaux et de percevoir le système comme une ressource intellectuelle, plutôt qu'un «ensemble de boîtiers».

L'informatique Edge est plus importante

Beaucoup ont entendu parler de Edge Computing. Et ceux qui sont impliqués dans le cloud et les centres de données classiques, il convient de garder à l'esprit que nous avons récemment vu un sérieux changement dans la direction du calcul des limites.

Qu'est-ce qui a causé ça? Regardons les modèles d'implémentation généraux. Maintenant, ils parlent beaucoup de «villes intelligentes», de «maisons intelligentes», etc. Ce concept permet au développeur de créer de la valeur ajoutée et d'augmenter le prix de la propriété. "Smart Home" identifie son résident, entre et sort, lui fournit certains services. Selon les statistiques, ces services ajoutent environ 10 à 15% au prix des appartements et sont en général capables de pousser le développement de nouveaux modèles commerciaux. En outre, plus tôt, il a été question des concepts de pilotes automatiques. Bientôt, le développement des technologies 5G et Wi-Fi 6 garantira une latence extrêmement faible dans le transfert de données entre les maisons intelligentes, les voitures et le centre de données principal qui produit l'informatique frontalière. Cela signifie qu'il sera possible d'effectuer un nombre beaucoup plus important d'opérations liées à un traitement sérieux des données. Pour résoudre de tels problèmes,en particulier, vous pouvez utiliser des processeurs neuronaux déjà livrés en Russie.

Les perspectives de la tendance qui vient d'être soulignée sont indéniables. Imaginez, par exemple, un système de gestion des transports urbains intelligent qui peut commuter les feux de circulation, réguler les charges de circulation sur des rues spécifiques, ou même prendre des mesures adéquates en cas d'urgence.

Passons maintenant aux ressources avec lesquelles nous fournissons la mise en œuvre du concept HiDC.

Calculs

Lorsque nous devons implémenter un système informatique standard, les processeurs avec une architecture x86 l'utilisent bien sûr. Mais dès que le besoin de personnalisation se fait sentir, il est temps de penser à des solutions plus diverses.

Ainsi, par exemple, les processeurs ARM, en raison du grand nombre de cœurs, sont excellents pour les applications avec un haut degré de parallélisme. Le multithreading donne un gain de productivité d'environ 30%.

Si une faible latence est essentielle pour nous, les FPGA viennent au premier plan.

Les processeurs neuronaux sont principalement nécessaires pour résoudre les problèmes d'apprentissage automatique. Si pour une implémentation spécifique, nous avons besoin de 16 racks avec 8 serveurs équipés chacun de neuroprocesseurs, alors une solution du même niveau basée sur l'architecture x86 nécessiterait (!) Environ 128 racks. Comme vous pouvez le voir, une grande variété de types de calculs vous fait choisir avec soin les plates-formes matérielles.

Stockage de données

Pour la deuxième année, Huawei a appelé ses partenaires, clients, collègues de l'industrie pour construire des systèmes de stockage conformément au principe du Flash uniquement. Et la plupart de nos clients n'utilisent des entraînements de broches mécaniques que dans les anciennes solutions ou pour les données d'archives rarement utilisées.

Les systèmes Flash évoluent également. Des systèmes de mémoire de classe de stockage (SCM) tels qu'Intel Optane arrivent sur le marché. Des développements intéressants sont démontrés par les fabricants chinois et japonais. Actuellement, SCM est supérieur en classe de traitement à toutes les autres solutions. Jusqu'à présent, seul le coût élevé ne permet pas de les utiliser partout.

Dans le même temps, nous constatons que la qualité du stockage doit être améliorée non seulement sur le backend conditionnel, mais également sur le front-end. Maintenant, de facto, dans les nouvelles implémentations, nous proposons et utilisons généralement des mécanismes d'accès direct à la mémoire via Ethernet, mais nous voyons une demande des clients et, par conséquent, vers la fin de l'année, nous commencerons à utiliser NVMe sur Fabrics plus souvent. De plus, de bout en bout, pour fournir une architecture commune, qui, bien entendu, doit être performante et résistante à la défaillance des contrôleurs.

OceanStor Dorado Storage est l'un de nos produits phares. Des tests internes ont montré qu'il fournit des performances au niveau de 20 millions d'IOPS, tout en maintenant l'opérabilité en cas de panne de sept des huit contrôleurs.

Pourquoi tant de pouvoir? Regardons la situation actuelle. Depuis plusieurs mois, les Chinois passent beaucoup plus de temps chez eux dans le cadre du régime d'isolement. À cette époque, le trafic Internet a augmenté en moyenne de 30% et, dans certaines provinces, a même doublé. La consommation d'une variété de services réseau a augmenté. Et à un moment donné, les mêmes banques ont commencé à subir une charge supplémentaire importante, pour laquelle leurs systèmes de stockage n'étaient pas prêts.

Il est clair que tout le monde n'a pas besoin de 20 millions d'IOPS maintenant. Mais que se passera-t-il demain? Nos systèmes intelligents maximisent le potentiel des processeurs neuronaux afin d'assurer la compacité du trafic, la déduplication, l'optimisation et la récupération rapide des données.

Réseau central

2020, comme nous l'avons mentionné dans l'article précédent, sera pour nous l'année des réseaux centraux. De nombreux clients, en particulier les fournisseurs de services applicatifs (ASP) et les banques, réfléchissent déjà au fonctionnement précis de leurs applications en termes de communication avec les centres de données et entre les centres de données. Ici, un nouveau réseau central vient à la rescousse. Prenons par exemple les plus grandes banques chinoises qui sont passées à des systèmes de support simplifiés qui n'utilisent pas une douzaine de protocoles différents pour la communication entre les centres de données, mais, relativement parlant, un couple - OSPF et SRv6. Malgré le fait que l'organisation reçoive le même ensemble de services.

Ressources intellectuelles

Comment utiliser les données? Jusqu'à récemment, il existait un système fragmenté de bases de données disparates: Microsoft SQL, MySQL, Oracle, etc. Pour travailler avec elles, des solutions issues du domaine du big data étaient utilisées qui pouvaient combiner ces données, les collecter et travailler avec elles. Tout cela a créé une charge élevée sur les ressources.

Dans le même temps, il n'existait aucun mécanisme pour effectuer des opérations avec des données lors de la survenance d'un événement. La solution était de développer des principes de gestion du cycle de vie des données (DLM).

Tout le monde a entendu parler des lacs de données. Avec la transition de la gestion des données à la gouvernance des données, les «lacs numériques» ont rapidement «grandi en sagesse». Y compris grâce aux solutions Huawei. Dans les documents suivants, nous vous parlerons de l'ensemble des technologies logicielles que nous avons utilisées. Maintenant, il est important de noter que c'est l'utilisation de la gestion «intelligente» du cycle de vie des données qui nous a permis de simplifier l'utilisation de notre réseau et de nos serveurs, ainsi que d'apprendre à construire des architectures de bout en bout pour mieux comprendre les principes de l'utilisation des données.

Infrastructure d'ingénierie de centre de données

Nous publierons des documents distincts sur l'infrastructure d'ingénierie, cependant, dans le contexte du sujet d'aujourd'hui, nous aimerions mentionner les changements liés au concept HiDC.

Pendant longtemps, l'utilisation de batteries au lithium dans les systèmes d'alimentation de secours et de secours (PSA) du centre de données a été interdite en raison de leur risque d'incendie élevé. Tout dommage mécanique ou violation de l'intégrité de la batterie peut entraîner un incendie et des conséquences imprévisibles. À cet égard, les PSA étaient équipés de batteries acides obsolètes ayant une faible densité de charge spécifique avec une grande masse.

Les nouveaux systèmes d'alimentation de secours et de secours de Huawei utilisent des batteries intelligentes au lithium fer phosphate (LFP) avec un contrôle proactif intelligent. À même capacité, elles prennent trois fois moins de volume que les batteries acides. Leur cycle de vie est de 10 à 15 ans, ce qui, entre autres, réduit le fardeau environnemental qu'ils créent. Le système de contrôle breveté de l'écosystème SmartLi permet l'utilisation de systèmes hybrides constitués de matrices de batteries anciennes et nouvelles, et le système de commutation permet l'introduction de modifications «à chaud» de la structure PSA avec une préservation continue de la fonction de sauvegarde.

Fonctionnement intelligent

Une partie importante des principes de fonctionnement de l'infrastructure HiDC est l'idéologie de l'auto-guérison intelligente. Dans l' une de nos publications antérieures, nous avons mentionné la plate-forme intelligente O&M 1-3-5, qui est non seulement capable de détecter et d'analyser un événement indésirable dans le système, mais offre également à l'administrateur plusieurs options pour une solution entièrement automatisée au problème.

La fonction d'introspection vous permet de détecter les problèmes en une minute environ. Trois minutes sont consacrées à l'analyse et, en cinq minutes, des propositions sont faites pour changer l'état du système.

Supposons qu'une certaine erreur d'opérateur ait conduit à la formation d'une boucle fermée de processus qui réduit les performances de la batterie de serveurs de virtualisation de 100 à 77%. L'administrateur du centre de données reçoit un message sur son tableau de bord qui contient une visualisation complète du problème, y compris un schéma de réseau des ressources affectées par le processus indésirable. De plus, l'administrateur peut procéder à la correction manuelle de la situation ou utiliser l'un des nombreux scénarios de récupération automatique qui lui sont proposés.

Le système connaît environ 75 scénarios de ce type qui peuvent être mis en œuvre en moins de dix minutes et couvrent en outre 90% des problèmes rencontrés dans les centres de données. A ce moment, l'ingénieur peut répondre sereinement aux appels des clients concernés, confiant que le service sera rétabli à tout instant.

Nouveaux produits clés chez HiDC

En plus des produits logiciels, cela devrait inclure des solutions clés qui fonctionnent au niveau de l'infrastructure. Tout d'abord, nous devons mentionner les processeurs neuronaux utilisés dans nos clusters Atlas AI, ainsi que les serveurs basés sur NPU et GPU.

De plus, vous ne pouvez plus mentionner le Dorado et ses performances record dans sa catégorie, ce qui est suffisant pour de nombreuses années à venir. Cela est particulièrement vrai dans l'espace post-soviétique, où, à de rares exceptions près, il est habituel de mettre à jour quelque chose uniquement lorsqu'il cesse complètement de fonctionner. Cela explique la durée de vie des systèmes de stockage individuels, atteignant dix ans. Une productivité énorme est nécessaire pour Dorado afin de fournir des services de haute qualité en dix ans.

L'innovation dans chaque élément

Lors du choix de solutions d'infrastructure spécifiques, il ne faut pas oublier l'architecture et les scénarios de son développement ultérieur. Des produits disparates de différents fabricants ne garantissent pas l'effet synergique attendu que fourniront des solutions déjà optimisées pour le partage.

L'infrastructure doit être basée sur la bonne technologie. "Correct" comprend l'ouverture, fournissant un débit élevé, fonctionnant de manière stable à des charges élevées. Pour les centres de données, par exemple, un bon rapport entre la consommation totale d'énergie et la charge informatique est important. Pour atteindre tous ces objectifs, vous devez choisir l'environnement et les composants. Dans les conditions modernes, cela signifie également une utilisation toujours plus large de l'intelligence artificielle.

Selon nos observations, parmi les clients stratégiques de Huawei, il y en a moins qui n'utilisent toujours pas de systèmes d'apprentissage automatique. Sans ML, vous ne pouvez tout simplement pas maximiser la monétisation des données accumulées.

Le système de monétisation peut être différent: pour les banques - l'offre de nouveaux produits ciblés, pour les opérateurs télécoms - la fourniture de services individuels et de fidélisation, pour les clients gouvernementaux - la gestion du cycle de vie des données de qualité et un haut niveau d'interaction avec les autres organisations. Après tout, les modèles de gestion des données ne sont pas réduits à configurer un pare-feu et à assurer la visibilité réseau de leurs bases de données depuis longtemps.

D'une idée à un datacenter existant

La construction d'un centre de données standard prend au mieux un an et demi. Notre cycle de production nous permet de le faire beaucoup plus rapidement grâce à l'utilisation d'un groupe de solutions, réunies sous le nom général FusionDC 2.0. La conception, le développement d'une conception de haut niveau, l'assemblage de tous les éléments de la charge informatique sont réalisés directement en usine. En peu de temps, les équipements par conteneurs maritimes sont livrés de Chine en Russie. En conséquence, la création d'un centre de données clé en main peut être réalisée en seulement quatre à cinq mois.

L'idée d'un centre de données cloud préfabriqué est également intéressante car il est possible de développer un centre de données par étapes, en y ajoutant les blocs fonctionnels nécessaires. Cette approche est intégrée dans le concept HiDC lui-même.

Afin de ne pas transformer le matériel d'enquête en une fiche technique, pour plus d'informations sur HiDC, nous vous suggérons de visiter notre site Web . Vous y trouverez une description et des exemples de la mise en œuvre des approches, produits et solutions dont nous avons parlé. Plus il y a de matériaux, plus votre niveau d'accès au site est élevé. Si vous avez reçu le statut de «partenaire», vous pouvez télécharger des feuilles de route HiDC, des présentations techniques et des vidéos.

Nous osons supposer que la majorité des lecteurs de cet article ont les compétences d'architectes de réseaux. Ils seront certainement intéressés à visiter notre zone de conception.. Là, nous parlons en détail de la façon de construire une infrastructure réseau selon les règles de Huawei Validated Design (HVD). Les lignes directrices disponibles pour le téléchargement aideront à bien comprendre le fonctionnement des solutions de l'entreprise. N'oubliez pas que sans autorisation, vous serez disponible moins de matériel.

***

De nombreux webinaires, organisés non seulement dans le segment russe, mais aussi au niveau international, vous aideront à trouver votre chemin. Nous les partageons avec des informations sur nos produits et nos pratiques commerciales. En particulier, nous parlons de la façon dont Huawei, dans le contexte de la rupture de nombreuses chaînes de services, continue de fournir en continu ses produits à différents pays. Récemment, par exemple, il y a eu un cas où l'équipement nouvellement fabriqué pour le centre de données a atteint le client de Moscou en seulement trois semaines.

La liste des webinaires d'avril est disponible ici .

Solution HiDC pour la construction d'une infrastructure TIC moderne de centres de données basée sur l'équipement Huawei Enterprise