Warum OceanStor Dorado V6 der schnellste und zuverlässigste Speicher ist

Bitte beeilen Sie sich wegen des Headers nicht zu Schlussfolgerungen! Wir haben gewichtige Argumente dafür und haben sie so kompakt wie möglich verpackt. Wir machen Sie auf das Konzept und die Funktionsprinzipien unseres neuen Datenspeichersystems aufmerksam, das im Januar 2020 veröffentlicht wurde.




Unserer Meinung nach liegt der Hauptwettbewerbsvorteil der Dorado V6-Speicherfamilie in der im Header genannten Leistung und Zuverlässigkeit. Ja, es ist so einfach, aber aufgrund einiger kniffliger und nicht sehr kniffliger Entscheidungen, die wir geschafft haben, dieses "gerechte" Ergebnis zu erzielen, werden wir heute darüber sprechen.

Um das Potenzial der Systeme der neuen Generation besser aufzuzeigen, werden wir über hochrangige Vertreter der Modellreihe (Modelle 8000, 18000) sprechen. Sofern nicht anders angegeben, sind sie impliziert.



Ein paar Worte zum Markt


Um den Platz von Huawei-Lösungen auf dem Markt besser zu verstehen, wenden wir uns der bewährten Maßnahme zu - den „ magischen Quadranten “ von Gartner. Vor zwei Jahren trat unser Unternehmen im Bereich der universellen Festplatten-Arrays souverän in die Gruppe der Marktführer ein, die nach NetApp und Hewlett Packard Enterprise an zweiter Stelle steht. Im Jahr 2018 war die Position von Huawei auf dem Festkörperspeichermarkt durch den Status eines Bewerbers gekennzeichnet, aber es fehlte etwas, um Führungspositionen zu erreichen.

Im Jahr 2019 kombinierte Gartner in seiner Forschung beide oben genannten Sektoren zu einem - „Hauptspeicher“. Infolgedessen befand sich Huawei neben Lieferanten wie IBM, Hitachi Vantara und Infinidat erneut im Führungsquadranten.

Um das Bild zu vervollständigen, stellen wir fest, dass Gartner 80% der Daten für die Analyse auf dem US-Markt sammelt. Dies führt zu einer spürbaren Tendenz zugunsten der Unternehmen, die in den USA gut vertreten sind. In der Zwischenzeit befinden sich Zulieferer für europäische und asiatische Märkte in einer deutlich weniger vorteilhaften Position. Und trotzdem haben Huawei-Produkte im vergangenen Jahr ihren rechtmäßigen Platz im oberen rechten Quadranten eingenommen und können laut Gartner-Urteil „zur Verwendung empfohlen werden“.



Was ist neu in Dorado V6?


Insbesondere die Dorado V6-Produktlinie wird durch die Einstiegssysteme der 3000er-Serie repräsentiert. Ursprünglich mit zwei Controllern ausgestattet, können sie horizontal auf 16 Controller, 1200 Festplatten und 192 GB Cache erweitert werden. Außerdem wird das System mit externen Fibre Channel- (8/16/32 Gb / s) und Ethernet-Ports (1/10/25/40/100 Gb / s) ausgestattet.

Beachten Sie, dass die Verwendung von Protokollen, die keinen kommerziellen Erfolg haben, schrittweise eingestellt wird. Daher haben wir zu Beginn beschlossen, die Unterstützung von Fibre Channel over Ethernet (FCoE) und Infiniband (IB) aufzugeben. Sie werden in späteren Firmware-Versionen hinzugefügt. Die Unterstützung für NVMe over Fabric (NVMe-oF) ist standardmäßig über Fibre Channel verfügbar. Die nächste Firmware, deren Veröffentlichung für Juni geplant ist, soll NVMe über Ethernet unterstützen. Unserer Meinung nach wird das oben genannte Set die Bedürfnisse der meisten Huawei-Kunden mehr als abdecken.

In der aktuellen Firmware-Version gibt es keinen Dateizugriff und wird in einem der folgenden Updates gegen Ende des Jahres erscheinen. Die Implementierung wird auf nativer Ebene von den Controllern selbst mit Ethernet-Ports ohne Verwendung zusätzlicher Geräte erwartet.

Der Hauptunterschied zwischen der Dorado V6 3000-Serie und älteren Modellen besteht darin, dass im Backend ein Protokoll unterstützt wird - SAS 3.0. Dementsprechend können die dortigen Laufwerke nur mit der genannten Schnittstelle verwendet werden. Aus unserer Sicht reicht die Leistung für ein Gerät dieses Typs völlig aus.

Die Systeme der Dorado V6 5000- und 6000-Serie sind Lösungen der Mittelklasse. Sie sind ebenfalls im 2U-Formfaktor hergestellt und mit zwei Controllern ausgestattet. Sie unterscheiden sich in Leistung, Anzahl der Prozessoren, maximaler Anzahl der Festplatten und Cache-Größe. In architektonischer und technischer Hinsicht sind Dorado V6 5000 und 6000 jedoch identisch und sehen gleich aus.

Die Hi-End-Klasse umfasst Dorado V6-Systeme der Serien 8000 und 18000. Sie sind in den Baugrößen 4U konzipiert und verfügen standardmäßig über eine separate Architektur, in der die Controller und Laufwerke getrennt sind. In der Mindestkonfiguration können sie auch mit nur zwei Controllern ausgestattet werden, obwohl Kunden in der Regel aufgefordert werden, vier oder mehr zu installieren.

Dorado V6 8000 ist horizontal auf 16 Controller und Dorado V6 18000 auf 32 skaliert. Diese Systeme verfügen über unterschiedliche Prozessoren mit unterschiedlicher Anzahl von Kernen und unterschiedlicher Cache-Größe. Trotzdem bleibt die Identität von Engineering-Lösungen wie bei Mid-End-Modellen erhalten.

2U-Regale mit Laufwerken werden über RDMA mit einer Bandbreite von 100 Gbit / s verbunden. Das ältere Dorado V6-Backend unterstützt auch SAS 3.0, jedoch für den Fall, dass SSDs mit einer solchen Schnittstelle im Preis fallen. Dann wird es eine wirtschaftliche Machbarkeit ihrer Verwendung geben, selbst unter Berücksichtigung einer geringeren Produktivität. Derzeit ist der Kostenunterschied zwischen SSDs mit SAS- und NVMe-Schnittstellen so gering, dass wir nicht bereit sind, eine solche Lösung zu empfehlen.



Im Controller


Dorado V6-Controller werden auf unserer eigenen Elementbasis hergestellt. Keine Intel-Prozessoren, keine Broadcom-ASICs. Somit ist jede einzelne Komponente des Motherboards sowie sich selbst vollständig vom Einfluss der Risiken befreit, die mit dem Sanktionsdruck amerikanischer Unternehmen verbunden sind. Diejenigen, die mit eigenen Augen unsere Ausrüstung gesehen haben, müssen Schilde mit einem roten Streifen unter dem Logo bemerkt haben. Dies bedeutet, dass dem Produkt amerikanische Komponenten fehlen. Dies ist der offizielle Kurs von Huawei - der Übergang zu Komponenten seiner eigenen Produktion oder auf jeden Fall hergestellt in Ländern, die nicht der US-Politik folgen.

Folgendes können Sie auf der Controller-Karte selbst sehen.

  • Universelle Netzwerkschnittstelle (Hisilicon 1822-Chip), verantwortlich für die Verbindung mit Fibre Channel oder Ethernet.
  • BMC-, Hisilicon 1710, . .
  • , ARM Kunpeng 920 Huawei. , , . . . , Dorado V6 .
  • SSD ( Hisilicon 1812e), SAS-, NVMe-. , Huawei SSD, NAND, . , Huawei , .
  • — Ascend 310. , , . , . , .



Kunpeng


Der Kunpeng-Prozessor ist ein System auf einem Chip (SoC), bei dem es neben der Recheneinheit Hardwaremodule gibt, die verschiedene Prozesse beschleunigen, z. B. die Berechnung von Prüfsummen oder die Ausführung der „Löschcodierung“. Darüber hinaus wird Hardware-Unterstützung für SAS, Ethernet, DDR4 (von sechs bis acht Kanälen) usw. implementiert. Auf diese Weise kann Huawei Speichercontroller erstellen, deren Leistung den klassischen Intel-Lösungen nicht unterlegen ist.

Darüber hinaus bieten eigene Lösungen, die auf der ARM-Architektur basieren, Huawei die Möglichkeit, komplette Serverlösungen zu erstellen und diese ihren Kunden als Alternative zu x86 anzubieten.



Die neue Architektur von Dorado V6 ...


Die interne Architektur des älteren Dorado V6-Speichersystems wird durch vier Hauptunterdomänen (Fabriken) dargestellt.

Die erste Factory ist ein gemeinsames Frontend (Netzwerkschnittstellen, die für die Kommunikation mit einer SAN-Factory oder Hosts verantwortlich sind).

Die zweite ist eine Reihe von Controllern, von denen jede die Frontend-Netzwerkkarte sowie die benachbarte „Engine“ erreichen kann, bei der es sich um eine Box mit vier Controllern sowie den ihnen gemeinsamen Strom- und Kühleinheiten handelt, die das RDMA-Protokoll verwenden. Jetzt können Dorado V6 Hi-End-Modelle mit zwei solchen "Motoren" (bzw. acht Controllern) ausgestattet werden.

Die dritte Fabrik ist für das Backend verantwortlich und besteht aus RDMA 100G-Netzwerkkarten.

Schließlich wird die vierte Fabrik „aus Eisen“ durch intelligente Steckregale mit Laufwerken dargestellt.

Eine solche symmetrische Struktur setzt das volle Potenzial der NVMe-Technologie frei und garantiert hohe Leistung und Zuverlässigkeit. Der E / A-Prozess ist über Prozessoren und Kerne hinweg maximal parallelisiert und ermöglicht das gleichzeitige Lesen und Schreiben in mehrere Threads.



... und was sie uns gegeben hat


Die maximale Leistung von Dorado V6-Lösungen ist ungefähr dreimal höher als die Leistung von Systemen der vorherigen Generation (derselben Klasse) und kann 20 Millionen IOPS erreichen.

Dies liegt an der Tatsache, dass in der vorherigen Gerätegeneration die NVMe-Unterstützung nur auf die Regale mit Laufwerken ausgedehnt wurde. Jetzt ist es in allen Phasen vorhanden, vom Host bis zur SSD. Das Backend-Netzwerk wurde ebenfalls geändert: SAS / PCIe machte RoCEv2 mit einer Bandbreite von 100 Gbit / s Platz.

Der SSD-Formfaktor hat sich ebenfalls geändert. Wenn sich zuvor 25 Laufwerke im 2U-Regal befanden, wurden jetzt bis zu 36 handflächengroße physische Festplatten installiert. Außerdem sind die Regale „weiser“. Jeder von ihnen verfügt nun über ein fehlertolerantes System aus zwei Controllern, die auf ARM-Chips basieren, ähnlich denen, die in den zentralen Controllern installiert sind.



Bisher befassen sie sich nur mit der Datenreorganisation, aber mit der Veröffentlichung der neuen Firmware wird die Komprimierungs- und Löschcodierung hinzugefügt, wodurch die Belastung der Hauptcontroller von 15 auf 5% reduziert wird. Durch die gleichzeitige Übertragung eines Teils der Aufgaben in das Regal wird die Bandbreite des internen Netzwerks frei. All dies erhöht das Skalierbarkeitspotential des Systems erheblich.

Komprimierung und Deduplizierung in Speichersystemen der vorherigen Generation wurden mit Blöcken fester Länge durchgeführt. Jetzt wurde eine Arbeitsweise mit Blöcken variabler Länge hinzugefügt, die bisher zwangsweise aktiviert werden muss. Nachfolgende Firmware kann diese Tatsache ändern.

Auch kurz zur Fehlertoleranz. Dorado V3 blieb betriebsbereit, wenn einer der beiden ausfiel. Dorado V6 stellt die Datenverfügbarkeit sicher, selbst wenn sieben von acht Controllern oder vier von einer „Engine“ nacheinander ausfallen.



Wirtschaftliche Zuverlässigkeit


Kürzlich wurde unter Kunden von Huawei eine Umfrage durchgeführt, welche einfachen Elemente der IT-Infrastruktur das Unternehmen für akzeptabel hält. Die Befragten tolerierten größtenteils eine hypothetische Situation, in der die Anwendung mehrere hundert Sekunden lang nicht reagiert. Für das Betriebssystem oder den Hostbusadapter betrug die kritische Ausfallzeit mehrere zehn Sekunden (tatsächlich die Neustartzeit). Kunden stellen noch höhere Anforderungen an das Netzwerk: Die Bandbreite sollte nicht länger als 10 bis 20 Sekunden verschwinden. Wie Sie vielleicht erraten haben, betrachteten die Befragten Speicherfehler als die kritischsten. Aus Sicht der Unternehmensvertreter sollte ein einfaches Speichersystem ... einige Sekunden pro Jahr nicht überschreiten!

Mit anderen Worten, wenn die Client-Anwendung der Bank 100 Sekunden lang nicht reagiert, hat dies höchstwahrscheinlich keine katastrophalen Folgen. Wenn jedoch nicht die gleiche Anzahl von Speichersystemen funktioniert, sind ein Geschäftsstillstand und erhebliche finanzielle Verluste wahrscheinlich.



Die obige Grafik zeigt die Kosten einer Arbeitsstunde für die zehn größten Banken (Forbes-Daten für 2017). Stimmen Sie zu, wenn sich Ihr Unternehmen der Größe chinesischer Banken nähert, wird es nicht so schwierig sein, die Notwendigkeit zu rechtfertigen, Speicher für mehrere Millionen Dollar zu kaufen. Das Gegenteil ist auch der Fall: Wenn ein Unternehmen während einer Ausfallzeit keine erheblichen Verluste erleidet, ist es unwahrscheinlich, dass es High-End-Speichersysteme kauft. In jedem Fall ist es wichtig, eine Vorstellung davon zu haben, welche Größe ein Loch in Ihrer Brieftasche zu bilden droht, während sich der Systemadministrator mit einem Datenspeichersystem befasst, das sich geweigert hat, zu funktionieren.




Failover Sekunde


In Lösung A in der obigen Abbildung können Sie unser Dorado V3-System der vorherigen Generation erkennen. Vier seiner Controller arbeiten paarweise, und nur zwei Controller enthalten Kopien des Caches. Controller innerhalb eines Paares können die Last neu verteilen. Wie Sie sehen, gibt es gleichzeitig keine "Fabriken" für Frontend und Backend, sodass jedes der Regale mit Laufwerken mit einem bestimmten Controller-Paar verbunden ist.

Das Diagramm für Lösung B zeigt die derzeit auf dem Markt erhältliche Lösung eines anderen Anbieters (haben Sie es herausgefunden?). Es gibt bereits Front-End- und Back-End-Fabriken, und die Laufwerke sind direkt mit vier Controllern verbunden. Zwar gibt es in der Arbeit interner Systemalgorithmen Nuancen, die in erster Näherung nicht offensichtlich sind.

Auf der rechten Seite sehen Sie unsere aktuelle Dorado V6-Speicherarchitektur mit all ihren internen Elementen. Überlegen Sie, wie diese Systeme eine typische Situation überstehen - den Ausfall eines Controllers.

In klassischen Systemen, zu denen Dorado V3 gehört, beträgt die Zeit, die erforderlich ist, um die Last im Fehlerfall neu zu verteilen, vier Sekunden. Zu diesem Zeitpunkt stoppt die E / A vollständig. In Lösung B von unseren Kollegen ist die Ausfallzeit während eines Ausfalls trotz einer moderneren Architektur sogar noch höher - sechs Sekunden.

Der Dorado V6-Speicher stellt seinen Betrieb nur eine Sekunde nach einem Fehler wieder her. Dieses Ergebnis wird aufgrund der homogenen internen RDMA-Umgebung erzielt, die es dem Controller ermöglicht, auf den "fremden" Speicher zuzugreifen. Der zweite wichtige Umstand ist das Vorhandensein einer Front-End-Factory, aufgrund derer sich der Pfad für den Host nicht ändert. Der Port bleibt derselbe, und die Last wird einfach durch Multipassing-Treiber an wartungsfähige Controller gesendet.

Der Ausfall des zweiten Controllers in Dorado V6 wird nach dem gleichen Schema in einer Sekunde berechnet. Dorado V3 dauert ungefähr sechs Sekunden, während die Lösung eines anderen Anbieters neun Sekunden dauert. Für viele DBMS können solche Intervalle nicht mehr als akzeptabel angesehen werden, da das System während dieser Zeit in den Standby-Modus wechselt und nicht mehr funktioniert. Dies ist das erste, was ein DBMS betrifft, das aus vielen Abschnitten besteht.

Der Ausfall der dritten Lösung Ein Controller kann nicht überleben. Nur weil der Zugriff auf einen Teil der Datenplatten verloren geht. In einer solchen Situation stellt Lösung B wiederum die Funktionsfähigkeit wieder her, was wie im vorherigen Fall neun Sekunden erfordert.

Was hat Dorado V6? Eine Sekunde.



Was kann in einer Sekunde getan werden


Fast nichts, aber das brauchen wir nicht. In der Dorado V6-Hi-End-Klasse ist die Front-End-Fabrik erneut von der Controller-Fabrik getrennt. Dies bedeutet, dass es keine fest codierten Ports gibt, die zu einem bestimmten Controller gehören. Die Failover-Neuerstellung bedeutet nicht, alternative Pfade zu finden oder Multipassing neu zu initialisieren. Das System funktioniert weiterhin so, wie es funktioniert hat.



Mehrfache Fehlerresistenz


Die älteren Dorado V6-Modelle überstehen problemlos den gleichzeitigen Ausfall von zwei (!) Controllern von „Motoren“. Dies wird ermöglicht, weil die Lösung jetzt drei Kopien des Caches speichert. Daher gibt es auch bei einem doppelten Fehler immer eine vollständige Kopie.

Der gleichzeitige Ausfall aller vier Controller in einer der „Engines“ hat ebenfalls keine fatalen Folgen, da alle drei Kopien des Caches zu jedem Zeitpunkt auf die „Engines“ verteilt werden. Die Einhaltung dieser Arbeitslogik wird vom System selbst überwacht.

Ein sehr unwahrscheinliches Szenario ist schließlich der sequentielle Ausfall von sieben von acht Controllern. Darüber hinaus beträgt das akzeptable Mindestintervall zur Aufrechterhaltung der Funktionsfähigkeit zwischen einzelnen Fehlern 15 Minuten. Während dieser Zeit verwaltet das Speichersystem die für die Migration des Caches erforderlichen Vorgänge.

Der letzte überlebende Controller stellt den Data Warehouse-Betrieb bereit und verwaltet den Cache fünf Tage lang (der Standardwert, der in den Einstellungen leicht geändert werden kann). Danach wird der Cache deaktiviert, der Speicher wird jedoch fortgesetzt.



Keine störenden Updates


Mit dem neuen Dorado V6-Betriebssystem können Sie den Speicher des Speichersystems aktualisieren, ohne die Controller neu zu starten.

Das Betriebssystem basiert wie bei früheren Lösungen auf Linux, jedoch werden viele Betriebsprozesse vom Kernel in den Benutzermodus übertragen. Die meisten Funktionen, z. B. die für die Deduplizierung und Komprimierung verantwortlichen, sind jetzt reguläre Daemons, die im Hintergrund ausgeführt werden. Aus diesem Grund muss zum Aktualisieren einzelner Module nicht das gesamte Betriebssystem geändert werden. Angenommen, um die Unterstützung für ein neues Protokoll hinzuzufügen, müssen Sie nur das entsprechende Softwaremodul ausschalten und ein neues starten.

Es ist klar, dass die Probleme bei der Aktualisierung des gesamten Systems weiterhin bestehen, schließlich gibt es möglicherweise Elemente im Kernel, die aktualisiert werden müssen. Aber das sind nach unseren Beobachtungen weniger als 6% der Gesamtzahl. Auf diese Weise können Sie die Controller Dutzende Male weniger als zuvor neu starten.



Katastrophen- und HA-Lösungen (HA / DR)


Dorado V6 ist sofort einsatzbereit und kann in geoverteilte Lösungen, Cluster auf Stadtebene (Metro) und dreifache Rechenzentren integriert werden.

Links in der Abbildung oben ist ein U-Bahn-Cluster dargestellt, der vielen bereits bekannt ist. Zwei Speichersysteme arbeiten im Aktiv / Aktiv-Modus in einem Abstand von bis zu 100 km voneinander. Eine ähnliche Infrastruktur mit einem oder mehreren Quorum-Servern kann von Lösungen verschiedener Unternehmen unterstützt werden, einschließlich unseres Cloud-Betriebssystems FusionSphere. Von besonderer Bedeutung bei solchen Projekten sind die Eigenschaften des Kanals zwischen den Standorten. Alle anderen Aufgaben in unserem Fall werden von der HyperMetro-Funktion übernommen, die wiederum sofort verfügbar ist. Bei Bedarf ist eine Fibre-Channel-Integration sowie eine iSCSI-Integration in IP-Netzwerke möglich. Es ist keine dedizierte „dunkle“ Optik mehr erforderlich, da das System über vorhandene Kanäle kommunizieren kann.

Beim Erstellen solcher Systeme ist die einzige Hardwareanforderung für die Speicherung die Portzuweisung für die Replikation. Es reicht aus, eine Lizenz zu erwerben, Quorum-Server (physisch oder virtuell) auszuführen und den Controllern IP-Konnektivität bereitzustellen (10 Mbit / s, 50 ms).

Diese Architektur lässt sich leicht auf ein System mit drei Rechenzentren übertragen (siehe rechte Seite der Abbildung). Wenn beispielsweise zwei Rechenzentren im Metro-Cluster-Modus arbeiten und der dritte Standort in einer Entfernung von über 100 km die asynchrone Replikation verwendet.

Das System unterstützt technologisch verschiedene Geschäftsszenarien, die im Falle eines großen Überschusses implementiert werden.



Überleben von Metro-Clustern mit mehreren Fehlern


Das Obige und Unten zeigt auch den klassischen Metro-Cluster, der aus zwei Speichersystemen und einem Quorum-Server besteht. Wie Sie sehen, bleibt unsere Infrastruktur in sechs der neun möglichen Szenarien mit mehreren Ausfällen betriebsbereit.

Wenn im zweiten Szenario beispielsweise der Quorum-Server ausfällt und die Synchronisierung zwischen Standorten erfolgt, bleibt das System produktiv, da der zweite Standort nicht mehr funktioniert. Ein ähnliches Verhalten ist bereits in die integrierten Algorithmen eingebettet.

Auch nach drei Fehlern kann der Zugriff auf Informationen beibehalten werden, wenn der Abstand zwischen ihnen mindestens 15 Sekunden beträgt.



Gewohnheitsmäßige Trumpfkarte aus dem Ärmel


Denken Sie daran, dass Huawei nicht nur Speichersysteme produziert, sondern auch eine vollständige Palette von Netzwerkgeräten. Unabhängig davon, welchen Speicheranbieter Sie wählen, wenn ein WDM-Netzwerk zwischen den Standorten verwendet wird, wird es in 90% der Fälle auf den Lösungen unseres Unternehmens aufbauen. Es stellt sich eine logische Frage: Warum sollte ein Zoo von Systemen zusammengestellt werden, wenn alle garantierten miteinander kompatiblen Hardwarekomponenten von einem Anbieter bezogen werden können?



Zur Frage der Leistung


Wahrscheinlich muss niemand davon überzeugt sein, dass der Übergang zum All-Flash-Speicher die Wartungskosten für die Infrastruktur erheblich senken kann, da alle Routinevorgänge um ein Vielfaches schneller ausgeführt werden. Dies wird von allen Anbietern solcher Geräte nachgewiesen. In der Zwischenzeit beginnen sich viele Anbieter zu unterscheiden, wenn es zu einem Leistungsabfall kommt, wenn Sie verschiedene Speichermodi aktivieren.

In unserer Branche ist die Ausgabe von Speichersystemen für den Testbetrieb für ein bis zwei Tage weit verbreitet. Der Anbieter führt einen 20-minütigen Test auf einem leeren System durch und erhält weltraumbasierte Leistungsindikatoren. Und im tatsächlichen Betrieb kommen schnell "Unterwasserschwader" heraus. Bereits nach einem Tag werden schöne IOPS-Werte um die Hälfte oder drei reduziert, und wenn der Speicher zu 80% gefüllt ist, sind sie sogar noch geringer. Wenn RAID 5 anstelle von RAID 10 aktiviert ist, gehen weitere 10-15% verloren, und im Metro-Cluster-Modus wird die Leistung weiter halbiert.

Bei alledem geht es nicht um Dorado V6. Unsere Kunden haben die Möglichkeit, am Wochenende oder zumindest nachts einen Leistungstest durchzuführen. Dann manifestiert sich die Speicherbereinigung und es wird auch deutlich, wie sich die Aktivierung verschiedener Optionen - wie Snapshots und Replikation - auf die Menge der erreichten IOPS auswirkt.

In Dorado V6 haben Snapshots und RAID mit Parität praktisch keinen Einfluss auf die Leistung (3-5% statt 10-15%). Speicherbereinigung (Füllen von Laufwerkszellen mit Nullen), Komprimierung und Deduplizierung auf Speichersystemen, die zu 80% voll sind, wirken sich immer auf die Gesamtgeschwindigkeit der Anforderungsverarbeitung aus. Interessant ist jedoch Dorado V6, dass unabhängig von der Kombination der von Ihnen aktivierten Funktionen und Schutzmechanismen die Gesamtleistung des Speichersystems nicht unter 80% der ohne Last erzielten Leistung fällt.



Lastverteilung


Hochleistungs-Dorado V6 wird durch Auswuchten in jeder Phase erreicht, nämlich:

  • Multipassing;
  • Verwendung mehrerer Verbindungen von einem Host;
  • das Vorhandensein einer Front-End-Fabrik;
  • Parallelisierung des Betriebs von Speichercontrollern;
  • Lastausgleich über alle Laufwerke bei RAID 2.0+.

Im Prinzip ist dies eine gängige Praxis. Heutzutage speichern nur wenige Leute alle Daten auf einer LUN: Jeder versucht, acht, sogar vierzig oder sogar mehr zu haben. Dies ist der offensichtliche und korrekte Ansatz, den wir teilen. Wenn für Ihre Aufgabe jedoch nur eine LUN erforderlich ist, was einfacher zu warten ist, können unsere Architekturlösungen 80% der verfügbaren Leistung erzielen, wenn mehrere LUNs verwendet werden.



Dynamische Prozessorlastplanung


Die Lastverteilung auf den Prozessoren bei Verwendung einer LUN wird wie folgt implementiert: Aufgaben auf LUN-Ebene werden in separate kleine „Shards“ aufgeteilt, von denen jeder starr einer bestimmten Steuerung in der „Engine“ zugeordnet ist. Dies geschieht, damit das System beim "Springen" mit diesen Daten auf verschiedenen Controllern nicht an Leistung verliert.

Ein weiterer Mechanismus zur Aufrechterhaltung einer hohen Leistung ist das dynamische Sheduling, bei dem Prozessorkerne verschiedenen Aufgabenpools zugeordnet werden können. Wenn das System jetzt beispielsweise auf der Ebene der Deduplizierung und Komprimierung inaktiv ist, können einige der Kerne in den Prozess der Wartung der E / A einbezogen werden. Oder umgekehrt. All dies erfolgt automatisch und transparent für den Benutzer.

Daten zur aktuellen Auslastung der einzelnen Dorado V6-Kerne werden nicht in der grafischen Oberfläche angezeigt. Über die Befehlszeile können Sie jedoch auf das Controller-Betriebssystem zugreifen und den üblichen Linux-Befehl top verwenden .



Unterstützung für NVMe und RoCE


Wie bereits erwähnt, unterstützt Dorado V6 derzeit NVMe über Fibre Channel sofort und benötigt keine Lizenzen. Unterstützung für NVMe über Ethernet zur Jahresmitte. Für die vollständige Nutzung benötigen Sie Ethernet-Unterstützung mit DMA-Version 2.0 (Direct Memory Access) sowohl vom Speichersystem selbst als auch von der Seite der Switches und Netzwerkadapter. Zum Beispiel Mellanox ConnectX-4 oder ConnectX-5. Sie können Netzwerkkarten verwenden, die auf Basis unserer Mikroschaltungen hergestellt wurden. Die RoCE-Unterstützung sollte auch auf Betriebssystemebene implementiert werden.

Im Allgemeinen betrachten wir den Dorado V6 als NVMe-orientiertes System. Trotz der bestehenden Unterstützung für Fibre Channel und iSCSI ist geplant, in Zukunft mit RDMA auf Highspeed-Ethernet umzusteigen.




Prise Marketing


Aufgrund der Tatsache, dass das Dorado V6-System sehr widerstandsfähig gegen Ausfälle ist, gut skaliert, verschiedene Migrationstechnologien unterstützt usw., zeigt sich der wirtschaftliche Effekt seiner Übernahme mit dem Beginn eines intensiven Betriebs von Speichersystemen. Wir werden weiterhin versuchen, das Eigentum an dem System so rentabel wie möglich zu gestalten, auch wenn es in der ersten Phase nicht auffällt.

Insbesondere haben wir das FLASH EVER-Programm zur Verlängerung des Speicherlebenszyklus entwickelt, um den Kunden bei Upgrades so weit wie möglich zu entladen.



Dieses Programm umfasst eine Reihe von Maßnahmen:

  • ( Dorado V6 hi-end);
  • ( Dorado );
  • ( Dorado).



Es bleibt zu bemerken, dass die schwierige Situation in der Welt wenig Einfluss auf die wirtschaftlichen Aussichten des neuen Systems hatte. Trotz der Tatsache, dass die offizielle Veröffentlichung von Dorado V6 erst im Januar stattfand, sehen wir in China eine erhebliche Nachfrage sowie großes Interesse bei russischen und internationalen Partnern aus dem Finanzsektor und bei Regierungsbehörden.

Unter anderem ist im Zusammenhang mit der Pandemie, egal wie lange sie anhält, die Frage, ob Remote-Mitarbeiter virtuelle Desktops erhalten sollen, besonders akut. In diesem Prozess könnte Dorado V6 auch viele Fragen entfernen. Zu diesem Zweck unternehmen wir alle erforderlichen Anstrengungen, einschließlich der praktischen Zustimmung, das neue System in die VMware-Kompatibilitätsliste aufzunehmen.

***.


Vergessen Sie übrigens nicht unsere zahlreichen Webinare, die nicht nur im russischsprachigen Segment, sondern auch auf globaler Ebene stattfinden. Die Liste der Webinare für April finden Sie hier .

All Articles