Skalieren eines Hochlastnetzwerks mit Nutanix: Funktionen und Herausforderungen anhand eines persönlichen Falls

Bild

Aufgrund der Tatsache, dass Millionen von Menschen zu Hause sitzen, ist der Internetverkehr in die Höhe geschossen. Es wurde mehr als einmal befürchtet, dass eine übermäßige Belastung des Netzwerks zu einem Stromausfall führen kann - national, innerhalb eines Landes oder sogar global. Glücklicherweise wird dieses Problem immer noch gelöst, aber es gibt andere, weniger offensichtliche Schwierigkeiten.

Welche Art? Jetzt haben viele Online-Handels- oder Lieferfirmen keine Zeit mehr, um die rasante Anzahl von Bestellungen zu verarbeiten. Sie verlieren Kunden, Geld und Ansehen, auch weil ihre IT-Infrastruktur nicht für eine mehrfache Erhöhung des Datenverarbeitungsvolumens bereit war. Dies könnte durch eine schnelle Skalierung der IT-Infrastruktur vermieden werden. Dies kann mithilfe der Hyper-Converged Infrastructure (HCI) erfolgen. Dieser Artikel ist ihr gewidmet.

?


Wir, Platbox, verarbeiten seit etwa sieben Jahren Kundenzahlungen (Banken, Zahlungssysteme). Wir verarbeiten jährlich rund 100 Millionen Transaktionen. Dies ist Erwerb, Zahlungen per SMS, Aktien verschiedener Unternehmen usw.
Mit der Zeit wächst die Anzahl der Händler, deren Zahlungen wir verarbeiten, und die Belastung des Netzwerks steigt.

Das Problem der Skalierung trat am ersten Tag des Bestehens des Unternehmens auf. Die Last wächst - wir kaufen Server, skalieren das Netzwerk und lösen das Problem. Dann wächst die Anzahl der Transaktionen wieder, die Ressourcen werden allmählich erschöpft, der Zyklus wiederholt sich. Jetzt besteht das Netzwerk aus einem ganzen Zoo von Geräten, von Servern von SuperMicro bis Dell. Diese Vielfalt erschwert die Netzwerkwartung und erhöht die Anzahl der Routinevorgänge während der Wartung.

Die Erhöhung der Anzahl der Geräte ist ebenfalls mit Kosten verbunden. Wir haben Mietregale in Rechenzentren. Wir zahlen für die Miete von physischem Raum, für den Stromverbrauch von Servern usw. Je mehr Server, desto mehr müssen Sie bezahlen, alles ist einfach. Darüber hinaus haben wir beschlossen, unseren Platz auf SDH zu erweitern und die Rechenleistung der Server zu erhöhen. Es stellte sich die Frage, das bereits Vorhandene weiter zu skalieren, unter den Bedingungen der klassischen dreistufigen Architektur zu handeln oder etwas Neues einzuführen.

Vor ungefähr sechs Monaten beschlossen sie, nach einer anderen Lösung zu suchen, um die oben beschriebenen Probleme zu lösen. Es gab mehrere Optionen, wir haben die optimale ausgewählt - verwenden Sie eine hyperkonvergente Infrastruktur anstelle der herkömmlichen.

Was ist hyperkonvergente Infrastruktur (HCI)?


Hier brauchen Sie einen kleinen Exkurs in die Geschichte der IT. Sobald die Daten auf Mainframes verarbeitet wurden - großen, leistungsstarken Computern -, wurden sie durch billigere und flexiblere „Standardarchitektur-Server“ ersetzt. Das Konzept der 3-Tier-Architektur entstand und die Aufteilung des Rechenzentrums in ein separates Speichersubsystem (SAN). , Verarbeitungssubsystem (Server) und Datenübertragungssubsystem (Netzwerkteil des Rechenzentrums). Mit der Entwicklung der IT ergaben sich neue Möglichkeiten zum Speichern und Verarbeiten von Daten und zum Lösen von Benutzerproblemen. HCI ist die "Infrastruktur für die" Cloud "-Ära" in der IT, die Ablehnung der 3-Tier-Architektur zugunsten von beispielsweise Microservice.

Aus praktischer Sicht sind in einer klassischen konvergierten Infrastruktur ein Server, ein Speichersystem, Netzwerkgeräte und ein Virtualisierungstool separate Elemente. Die hyperkonvergente Infrastruktur integriert sie sowie alle Komponenten des vertrauten Rechenzentrums in einem einzigen System. Manchmal enthält HCI zusätzliche Komponenten, z. B. Sicherungssoftware, Snapshot-Funktionen, Datendeduplizierungsfunktionen, Zwischenkomprimierung und Optimierung des Computernetzwerks.

Wenn eine konvergierte Infrastruktur hauptsächlich hardwarebasiert ist und ein softwaredefiniertes Rechenzentrum häufig an eine beliebige Hardware angepasst wird, werden diese beiden Möglichkeiten in einer hyperkonvergenten Infrastruktur kombiniert. Es verbessert auch die Betriebssicherheit, Leistung und Datensicherheit. Im Allgemeinen sollte HCI als eine Runde der Weiterentwicklung der IT-Infrastruktur angesehen werden.

Nachdem wir die Vor- und Nachteile bewertet hatten, beschlossen wir, Hyperkonvergenz zu versuchen, kontaktierten Nutanix und erhielten die Plattform für den Test, der erfolgreich war. Für den Test haben wir eine hyperkonvergente Plattform erhalten, die aus sechs Knoten, aber zwei Einheiten besteht. Wir sparen Strom, Platz im Rack und müssen keinen endlosen Server kaufen.

5 Vorteile einer hyperkonvergenten Infrastruktur

Bild

  1. IT- – HCI, IT-«», .
  2. ;
  3. . . , . , . Nutanix , .
  4. Das Risiko der Nichtverfügbarkeit von Diensten bei Ausfall einer oder mehrerer Komponenten aufgrund von Vereinheitlichung, Datensicherung und Hardware wird verringert. Wenn das Gerät plötzlich in ein Rechenzentrum „fällt“, beginnt die Reserve sofort in einem anderen.
  5. Open Source-Produktcode - erleichtert ein Sicherheitsaudit, und das integrierte STIG (Security Technical Implementation Guide oder eine Reihe von Empfehlungen zum Schutz von IT-Systemen) bietet eine hohe Sicherheitscode-Ausführung und Widerstand gegen die Auswirkungen von Cyberkriminellen auf das IT-System.

Wie haben wir einen Anbieter ausgewählt?


Wir haben uns mehrere Anbieter von hyperkonvergenten Systemen angesehen. Darunter befinden sich Cisco Hyperflex, SimpliVity, HPE Hyper Converged, Fujitsu PRIMERGY CX und Nutanix. Dann wurden folgende Auswahlkriterien formuliert:

  • Zuverlässigkeit und Sicherheit der Daten im Inneren;
  • Einhaltung der Sicherheitsanforderungen PCI DSS 3.2.1;
  • Arbeitsgeschwindigkeit;
  • Wartung und technischer Support;
  • Die Flexibilität, die Infrastruktur mit der Geschwindigkeit zu skalieren, die das Unternehmen benötigt.

Infolgedessen haben wir bei Nutanix Halt gemacht, da mit diesem Unternehmen der HCI-Markt 2012 begann. Es bietet das stabilste Produkt mit Flexibilität und den größten Fähigkeiten, zum Beispiel:

  • Eine große Auswahl an Plattformen (HPE, Dell, Fujitsu, Cisco);
  • Verfügbarkeit einer kostenlosen Version der Community Edition;
  • Die Freiheit, einen Hypervisor zu wählen (einschließlich Free-AHV).
  • Ein kleines "Wachstumsquantum" (tatsächlich ist es ein Server), das dem Unternehmen bereits alles bietet, was es kann, und das größte bietet: Zuverlässigkeit, Sicherheit und neue Technologien. Alle Funktionen von Nutanix, die heute von Unternehmen verwendet werden, z. B. VTB oder Societe Generale, stehen auch für die meisten Einstiegslösungen zur Verfügung.

Darüber hinaus sind in unserem technischen Team Spezialisten mit Erfahrung in der Arbeit mit der Nutanix-Plattform erschienen. Dank ihnen wussten wir, wie sich das System in kritischen Situationen verhalten würde, was für uns wie für ein Fintech-Unternehmen unglaublich wichtig ist.

Ein weiterer Faktor, der die Wahl von Nutanix beeinflusst hat, ist die Verfügbarkeit eines Übergangswerkzeugs wie Nutanix Move. Sie können damit Maschinen mit minimalen Ausfallzeiten übersetzen. Wenn es beispielsweise VMware- und Nutanix-Maschinen gibt, fungiert Move als eine Art Brücke. Er nimmt die Maschine von VMWare, klont sie, stellt sie basierend auf Snapshots auf Nutanix bereit, löscht sie in VMWare und startet sie in Nutanix. All dies in buchstäblich Sekunden.

Der Übergangsprozess zu Nutanix


Bild

Die Hauptanforderung beim Umzug bestand darin, die Stabilität des Systems nicht zu verletzen. Daher musste sehr vorsichtig auf eine neue Plattform umgestellt werden.

Daher begann alles mit dem Testen der bereits erwähnten Testplattform Nutanix. Wir haben eine Reihe von Tests gestartet, indem wir eine Testumgebung bereitgestellt haben. Wir haben die Verarbeitung verwendet, die nicht in Produktion ist, und sie sozusagen aus Yandex-gun „geschossen“. Wir haben die Last überprüft, genügend Ressourcen für unsere Zwecke verwendet, festgestellt, dass sie perfekt funktioniert und wo Optimierungen erforderlich sind.

HCI koexistiert normalerweise mit der klassischen Infrastruktur, ohne dass das vertraute Rechenzentrum sofort verlassen werden muss. Die Migration zu HCI kann schrittweise, erweitert und reibungslos erfolgen, so wie es das Unternehmen benötigt. Wenn beispielsweise im Rechenzentrum des Unternehmens bereits Virtualisierung und ein Hypervisor verwendet werden, erfolgt der Übergang zur HCI-Umgebung durch eine schrittweise Migration virtueller Maschinen von alten auf neue Server: von „klassischen“ Servern zu HCI-Servern. Dies ist nur unser Fall. Wir müssen virtuelle Maschinen in eine andere virtuelle Umgebung übertragen. Wenn möglich, wird eine automatische Migration mit Nutanix Move durchgeführt. Einige Dienste werden als Infrastruktur als Code (IaC) bezeichnet.

All dies kann in mehrere Stufen unterteilt werden:

  1. RoadMap schreiben.
  2. Start einer neuen Infrastruktur.
  3. Übersetzung von Dienstleistungen gemäß RoadMap.

Die Umsetzung dieser Phasen dauert ca. 2 Monate.

Schwierigkeiten und Probleme des Übergangs

Probleme waren natürlich. Die Hauptschwierigkeit liegt in der Tatsache, dass die Verarbeitung zum Zeitpunkt der Migration von Diensten noch ausgesetzt werden muss. Aber wir haben an diesem Punkt gearbeitet, als wir die Nutanix-Plattform zum Testen genommen haben. Wir haben in der Testphase einen Plan für den Kauf von Ausrüstung und die Migration von Dienstleistungen erstellt. Die strikte Umsetzung des genehmigten Plans ist der Schlüssel zum Erfolg der Servicemigration.

In einigen Unternehmen sind nach unserer Erfahrung die Schwierigkeiten beim Übergang zu einer hyperkonvergenten Infrastruktur eher nicht technischer Natur, sondern organisatorischer oder „budgetärer“ Natur. Wenn beispielsweise ein Rechenzentrum funktioniert und es keine neuen Aufgaben gibt, wenn vor relativ kurzer Zeit viele teure Geräte für die Entwicklung einer "klassischen" Infrastruktur gekauft wurden, wird es sehr schwierig sein, eine Idee zu entwickeln (und deren Management oder Investoren zu argumentieren) Dies muss aufgegeben und das Geld wieder ausgegeben werden - bereits bei HCI.

Positive Ergebnisse der Umstellung auf HCI

Bild

Die Schlafqualität für Bediener hat sich erheblich verbessert. Warum? Es ist einfach - verteilter Speicher verbessert die Speicherzuverlässigkeit und Datenverfügbarkeit.

Optimierte Geschäftsprozesse und Mitarbeiter:

  • ein Administrator statt 3;
  • IT-, ;
  • .
  • .

Reduzierte Eisenkosten. Wie und warum wurde oben gesagt. Vereinfachung der Skalierung der Rechenzentrumskosten. Beim klassischen Ansatz kann es sehr schwierig sein, eine zehnfach wachsende Infrastruktur zu entwickeln, ohne sie ganz oder teilweise ändern zu müssen. Bei HCI können Sie mit einer sehr kleinen Lösung beginnen und schrittweise mehr in die Infrastruktur investieren.

Es besteht die Möglichkeit, die Kosten von den Kapitalkosten auf die Betriebskosten umzuverteilen , die nun weltweit an die IT gehen. Dies erfordert eine andere Art, Kosten zu planen, ansonsten vertraute Dinge zu betrachten, neue Dinge zu lernen, aber hier setzt die Branche heute an.

Um zu verstehen, wie einfach es ist, geben wir Ihnen einen Fall. Während des Charity-Marathons hatten wir also eine sehr starke Netzwerklast - viel höher als die berechnete. Die Fehleinschätzung entstand, weil die Belastung aus den Statistiken früherer Marathons berechnet wurde. Wir haben nicht berücksichtigt, dass mehr Menschen an der neuen teilnehmen werden, der Grund ist Quarantäne und Selbstisolation. Wenn das Problem mit der vorhandenen Infrastruktur aufgetreten wäre, wären die Folgen sehr negativ gewesen, einschließlich der Unterbrechung der Dienste. Jetzt haben wir Nutanix genommen, dank dessen wir den Cluster genau zweimal vergrößern konnten. Das System hat die Last „verdaut“. Und das alles in nur 15 Minuten und ein paar Mausklicks.

Ein bisschen über die Aussichten für Technologie und die Wahl von HCI


Sollte jeder zu HCI wechseln? Nein natürlich nicht. Grundsätzlich ist eine hyperkonvergente Infrastruktur für Unternehmen geeignet, die über große Netzwerke, eine hohe Belastung und genügend Mittel für den Übergang verfügen. Wenn ein Startup mehrere Server hat, können Sie nichts ändern.

Aber wenn das Unternehmen einen ganzen Server-Eisenzoo, ein schlecht optimiertes Netzwerk und hohe Kosten für Eisen und dessen Wartung hat, dann ist HCI definitiv da.

Nun, das Folgende kann über die Zukunft von HCI gesagt werden. ErstensHCI wird weltweit und in Russland vertrieben, sofern die IT bereit ist, neue Ideen anzunehmen und zu nutzen. Viele Entwicklungsunternehmen suchen nach neuen Möglichkeiten für Entwicklung und Wachstum, insbesondere im Zusammenhang mit schrumpfenden IT-Budgets. Unternehmen traditioneller und konservativer Unternehmen werden wahrscheinlich später zu HCI kommen, aktiv, jung, neue Technologien entwickeln und einsetzen - früher.

Zweitens werden immer mehr Unternehmen in den HCI-Markt eintreten, die Technologie wird weiter verbreitet und erschwinglicher. Alle Top-Hersteller von Servern und Speichersystemen haben bereits Vorschläge im Bereich HCI, und dies ist buchstäblich in den letzten ein oder zwei Jahren geschehen.

Drittenswird die Idee der „Cloudiness“ weiterentwickelt, auch in Form einer „Hybrid Cloud“, wenn sich ein Teil der Infrastruktur in „seinem“ Rechenzentrum befindet und ein Teil bei Bedarf gemietet wird.

Ein Beispiel sind dieselben Online-Shops und Lieferservices. Im Falle eines mehrfachen Verkehrssprungs könnten sie in wenigen Minuten skalieren, Kapazitäten von einem Cloud-Betreiber mieten und nicht den ganzen Tag "hängen", Kunden und ihr Geld verlieren. Und dann, nach dem Rückgang der Nachfrage und der Beruhigung des Marktes, reduzieren Sie die Infrastruktur, ohne die Sicherheit, Leistung oder das Geld für den Kauf Ihrer Geräte zu beeinträchtigen. Vielleicht werden in Zukunft die „Cloud“ und „Ihr Rechenzentrum“ nahtlos miteinander verbunden. Zumindest alle Technologien dafür existieren bereits.

ViertensAutomatisierungssysteme für die Verwaltung der IT-Infrastruktur werden sich aktiv entwickeln, einschließlich der Verwendung von KI und der Virtualisierung der Netzwerkinfrastruktur des Rechenzentrums.

All Articles