Speicher optimieren: Ein Fall von Vereinheitlichung und niedrigeren Betriebskosten

Der Artikel beschreibt den Prozess der Optimierung der Speicherinfrastruktur eines mittelständischen Unternehmens.

Begründungen für einen solchen Übergang und eine kurze Beschreibung des Prozesses zur Einrichtung eines neuen Speichersystems werden berücksichtigt. Wir geben ein Beispiel für die Vor- und Nachteile des Wechsels zum ausgewählten System.

Einführung


Die Infrastruktur eines unserer Kunden bestand aus vielen heterogenen Speichersystemen unterschiedlicher Ebenen: von SOHO-Systemen QNAP, Synology für Benutzerdaten bis hin zu Entry- und Mid-Range-Speichersystemen Eternus DX90 und DX600 für iSCSI und FC für Servicedaten und Virtualisierungssysteme.

All dies unterschied sich sowohl in den Generationen als auch in den verwendeten Festplatten. Teil der Systeme waren Legacy-Geräte ohne Herstellerunterstützung.

Ein separates Problem war die Verwaltung des freien Speicherplatzes, da der gesamte verfügbare Speicherplatz auf vielen Systemen stark fragmentiert war. Infolgedessen die Unannehmlichkeiten der Verwaltung und die hohen Kosten für die Wartung einer Systemflotte.

Wir standen vor der Herausforderung, die Speicherinfrastruktur zu optimieren, um die Betriebskosten und die Vereinheitlichung zu senken.

Die Aufgabe wurde von unseren Unternehmensexperten unter Berücksichtigung der Kundenanforderungen an Datenverfügbarkeit, IOPS, RPO / RTO sowie der Möglichkeit der Aufrüstung der vorhandenen Infrastruktur umfassend analysiert.

Implementierung


Die Hauptakteure auf dem Markt für Midrange-Speichersysteme (und höher) sind IBM mit Storwize. Fujitsu, vertreten durch die Eternus-Linie, und NetApp mit der FAS-Serie. Als Speichersystem, das die angegebenen Anforderungen erfüllt, wurden folgende Systeme in Betracht gezogen: IBM Storwize V7000U, Fujitsu Eternus DX100, NetApp FAS2620. Alle drei sind Unified-SHD, dh sie bieten sowohl Blockzugriff als auch Dateizugriff und bieten enge Leistungsindikatoren.

Beim Storwize V7000U wird der Dateizugriff jedoch über einen separaten Controller organisiert - ein Dateimodul, das eine Verbindung zum Hauptblock-Controller herstellt. Dies ist ein zusätzlicher Fehlerpunkt. Darüber hinaus ist dieses System relativ schwierig zu verwalten und bietet keine ordnungsgemäße Isolierung von Diensten.

Das Eternus DX100-Speichersystem, das ebenfalls ein Unified-Speichersystem ist, unterliegt schwerwiegenden Einschränkungen hinsichtlich der Anzahl der erstellten Dateisysteme, ohne die erforderliche Isolation zu gewährleisten. Darüber hinaus dauert das Erstellen eines neuen Dateisystems sehr lange (bis zu einer halben Stunde). Beide beschriebenen Systeme erlauben keine gemeinsame Nutzung von CIFS / NFS-Servern, die auf Netzwerkebene verwendet werden.

Unter Berücksichtigung aller Parameter, einschließlich der Gesamtbetriebskosten des Systems, wurde NetApp FAS2620 ausgewählt, das aus zwei Controllern besteht, die im Aktiv-Aktiv-Modus arbeiten und die Last auf die Controller verteilen können. In Kombination mit den integrierten Mechanismen der Online-Deduplizierung und -Komprimierung kann der Platzbedarf für Daten auf Datenträgern erheblich gesenkt werden. Diese Mechanismen werden beim Aggregieren von Daten auf einem System viel effektiver als in der Ausgangssituation, als sich potenziell identische Daten auf verschiedenen Speichersystemen befanden und es unmöglich war, sie untereinander zu deduplizieren.

Ein solches System ermöglichte es, alle Arten von Diensten unter die Kontrolle eines einzelnen Failoverclusters zu stellen: SAN in Form von Blockgeräten für die Virtualisierung und NAS in Form von CIFS, NFS-Freigaben für Windows-Benutzerdaten und * nix-Systeme. Gleichzeitig blieb dank der SVM-Technologie (Storage Virtual Machine) die Möglichkeit einer sicheren logischen Trennung dieser Dienste bestehen: Die für verschiedene Komponenten verantwortlichen Dienste wirken sich nicht auf die „Nachbarn“ aus und erlauben keinen Zugriff auf diese.

Es bleibt auch möglich, Dienste auf Festplattenebene zu isolieren, um Leistungseinbußen bei starker Belastung durch die "Nachbarn" zu vermeiden.

Für Dienste, die schnelles Lesen / Schreiben erfordern, können Sie einen hybriden RAID-Array-Typ verwenden und dem Festplattenaggregat mehrere SSDs hinzufügen. Das System selbst platziert "heiße" Daten auf ihnen, wodurch die Latenz beim Lesen häufig verwendeter Daten verringert wird. Dies gilt zusätzlich zum NVRAM-Cache, der bei einem plötzlichen Stromausfall neben der hohen Schreibgeschwindigkeit (Daten werden im NVRAM gespeichert, der von der Batterie gespeist wird, bis die Bestätigung der vollständigen Aufzeichnung vom Dateisystem empfangen wird) auch dessen Atomizität und Integrität gewährleistet.

Nach der Datenmigration auf ein neues Speichersystem kann der Cache-Speicherplatz effizienter genutzt werden.

Positive Seiten


Wie oben erwähnt, ermöglichte die Verwendung dieses Systems die gleichzeitige Lösung von zwei Problemen:

- Vereinheitlichung

  • , , , .
  • . , LUN, .
  • . , . , Ethernet Fiber Channel .
  • , , . .



  • NetApp SVM (Storage Virtual Machine), , , . SVM, . /.
  • .
    SVM , , VLAN-. , SVM, VLAN’. , trunk-.
    iSCSI-, SAN- , , « » .
  • .
    - RAID- ( RAID- ), Volume. Volume SVM’, SVM’ . «» , «» SVM’ .
    RAID- , .



  • . RAID-, .
  • (CPU, RAM). storage-, , IO-, .
  • NetApp S3- , on-premise , .


- Nachdem wir alle Dienste unter der Kontrolle eines Systems reduziert haben, wird die Deaktivierung einer Komponente (1 von 2 Controllern gegenüber 1 von 10+ in der alten Infrastruktur) voraussichtlich eine größere Auswirkung haben.
- Verminderte Verteilung der Speicherinfrastruktur. Wenn sich frühere Lagersysteme auf verschiedenen Etagen / in verschiedenen Gebäuden befinden könnten, ist jetzt alles in einem Rack konzentriert. Dieser Posten kann durch den Kauf eines weniger effizienten Systems und die Verwendung der synchronen / asynchronen Replikation bei Situationen höherer Gewalt ausgeglichen werden.

Schritt für Schritt einrichten


Aufgrund der Vertraulichkeit von Informationen ist es unmöglich, Screenshots aus der realen Kundenumgebung zu demonstrieren. Daher werden die Konfigurationsschritte in der Testumgebung angezeigt und die in der produktiven Umgebung des Kunden ausgeführten Schritte vollständig wiederholt.


Der Anfangszustand des Clusters. Zwei Aggregate für Root-Partitionen der entsprechenden Clusterknoten clus01_01, clus01_02


Erstellen von Aggregaten für Daten. Jeder Knoten verfügt über ein eigenes Aggregat, das aus einem RAID-DP-Array besteht.


Ergebnis: Es wurden zwei Aggregate erstellt: rg0_node02, rg1_node01. Es gibt noch keine Daten dazu.


Erstellung von SVM als CIFS-Server. Für SVM muss ein Root-Volume erstellt werden, für das das Root-Aggregat ausgewählt ist - rg1_node01. Auf diesem Volume werden einzelne SVM-Einstellungen gespeichert.


CIFS- SVM. IP- ., . VLAN-, LACP . Volume , , .


, . 4,9 , . .


SVM iSCSI-. , Root Volume . CIFS- IP- iSCSI-, . , (LUN), .


LUN 10 . , .


Hyper-V Server iqn.


Hyper-V Server LUN Linux. Volume, , , . LUN , .

Source: https://habr.com/ru/post/undefined/


All Articles