⬇️ 👩🏿‍🤝‍👨🏾 👨🏻‍🏭 Apa itu Azure Stack HCI dan bagaimana cara kerjanya 👩🏿‍🎨 🗑️ 👩‍👩‍👧

Halo, Habr! Hari ini kami ingin berbicara tentang apa platform Azure Stack HCI. Termasuk apa itu secara umum, dari perangkat keras apa yang dirakit, perangkat lunak apa yang terkandung, cara kerjanya, dan itu saja. Bergabung sekarang!

Ini adalah posting tamu dari orang-orang dari AltaStor. AltaStor adalah integrator sistem yang berspesialisasi dalam membangun solusi untuk penyimpanan data yang andal. Berkat akumulasi keahlian dalam membangun kluster failover dan HCI, solusi individual dipilih untuk setiap klien yang paling cocok untuk tugasnya.

Apa itu Azure Stack HCI?

Ini adalah solusi hyperconverged yang menggabungkan beberapa produk:

Perangkat keras dari Mitra OEM Microsoft Certified.
Sistem Operasi Datacenter Windows Server 2019.
Perangkat lunak Windows Admin Center.
Layanan Microsoft Azure jika perlu.

Solusi ini telah ada di pasaran sejak lama, dan beberapa pelanggan kami telah lama dan berhasil menggunakannya. Namun, mereka tidak mempublikasikan hasil tes kinerja instalasi mereka. Kami memutuskan untuk mengisi celah ini dan berbicara tentang pengalaman kami menggunakan Azure Stack HCI dengan satu contoh spesifik.

Untuk dokumentasi dan informasi umum tentang Azure Stack HCI, klik di sini .

Tata letak stan

Peralatan

Membangun solusi membutuhkan platform perangkat keras yang direkomendasikan oleh Microsoft. Produsen perangkat keras server terkemuka - HPE, Dell EMC, Fujitsu, Hitachi, Lenovo, dll. - mengembangkan konfigurasi mereka, mengujinya untuk kompatibilitas dan disertifikasi untuk Azure Stack HCI.

Daftar lengkap peralatan yang kompatibel tersedia di .

Tergantung pada jenis drive yang digunakan, komponen platform akan bervariasi.

Kami lebih suka membangun solusi tersebut berdasarkan server Fujitsu dengan sistem operasi Windows Server 2019 Datacenter yang telah diinstal sebelumnya. Pabrikan setelah penjualan ini mendukung keseluruhan perangkat lunak dan perangkat keras yang kompleks sebagai solusi lengkap, dan bukan hanya perangkat kerasnya. Ini penting bagi kami, sebagai mitra, dan bagi pelanggan akhir.

Saat ini, Fujitsu memiliki lima konfigurasi yang disertifikasi untuk berbagai jenis drive, model server, dan jumlah node. Jumlah maksimum node untuk Azure Stack HCI adalah 16, minimum adalah 2, tetapi beberapa konfigurasi membatasi ke 4.

Semua konfigurasi Fujitsu yang kompatibel dapat dilihat di sini .

Untuk pemasangan, kami memilih konfigurasi paling efisien dari Fujitsu Primergy yang saat ini disertifikasi dengan drive SSD untuk menyimpan data, dan modul memori ultra-cepat Intel Optane yang terhubung melalui antarmuka NVMe sebagai cache sistem. Kami berharap untuk mendapatkan array All-Flash yang ditentukan perangkat lunak dengan kinerja yang sebanding dengan penyimpanan klasik dengan drive SSD dan cache NVMe.

Sistem penyimpanan All-Flash dari para pemimpin industri memiliki konfigurasi jenis media yang serupa. Kita tahu apa IOPS dan indikator latensi yang dapat diperoleh dalam praktiknya dari sistem tersebut dan menantikan kinerja serupa dari Azure Stack HCI berdasarkan konfigurasi Fujitsu yang dipilih.

Arsitektur solusi Fujitsu ini dijelaskan secara terperinci dalam dokumen yang tersedia di sini .

Kami sarankan Anda membiasakan diri dengan itu sebelum instalasi.

Dokumen tersebut menjelaskan batasan arsitektur, skema koneksi tipikal, dan banyak informasi lain yang berguna pada tahap implementasi.

Sakelar

Solusi Fujitsu menggunakan sakelar PSWITCH Ethernet sendiri. Bagi kami sendiri, kami mencatat keuntungan-keuntungan berikut:

Sakelar seri ini sangat produktif, dengan biaya rendah.
Saklar ini cukup sederhana untuk mengkonfigurasi dan menggunakan antarmuka seperti CISCO. Insinyur tidak mengalami kesulitan selama pemasangan.
Tidak ada kelebihan kepemilikan dalam administrasi dan dokumentasi yang kompeten tersedia.

Peralatan switching Fujitsu adalah salah satu pemimpin industri di Jepang. Baru-baru ini telah tersedia di pasar Rusia, tetapi sudah secara teratur digunakan dalam proyek-proyek oleh arsitek kami dan mitra Fujitsu lainnya. Sejumlah model terbatas saat ini tersedia.

Pelajari lebih lanjut tentang sakelar Fujitsu di situs web resmi .

Server

Di dalam server, kartu memori Intel Optane menempati sebagian besar ruang.

Intel menaruh banyak perhatian pada kinerja di bawah permintaan panas yang tinggi. Di satu sisi, untuk pendinginan kualitas maksimum, radiator besar digunakan. Di sisi lain, ini membatasi aliran udara pendingin di dalam seluruh server.

Ini adalah salah satu poin utama yang dipertimbangkan ketika sertifikasi konfigurasi - perlu untuk menyediakan semua skenario yang mungkin di mana, karena pendinginan yang tidak memadai, server dapat terlalu panas modul Optane, atau sebaliknya.

Saat memindahkan ruang server, klien kami lebih dari satu kali dihadapkan pada situasi ketika sistem pendingin udara belum dioperasikan. Oleh karena itu, kami memutuskan untuk memeriksa seberapa berat permintaan instalasi ini terhadap sistem pendingin dan mengukur umur platform di bawah beban di luar ruang server yang didinginkan.

Pengujian dilakukan pada suhu kamar, tetapi kami tidak menemukan keterbatasan termal, atau penurunan kinerja atau munculnya kesalahan karena terlalu panas. Kami telah melihat dari pengalaman kami sendiri bahwa server yang diuji mendukung kapasitas kerja yang dinyatakan pada suhu sekitar hingga +45 derajat Celcius.

Catatan.Percobaan ini tidak boleh dianggap sebagai rekomendasi untuk meninggalkan penggunaan ruang server khusus dengan ventilasi berkualitas tinggi. Saat memilih penyedia solusi perangkat keras, pastikan untuk memperhatikan paket suhu maksimum.

Perakitan platform perangkat keras

Tampak depan:

Tampak belakang:

Hanya satu sakelar yang digunakan dalam pengujian. Untuk penggunaan komersial, kami selalu menyarankan Anda memesan jalur akses menggunakan setidaknya dua sakelar. Menurut statistik kami, kegagalan perangkat keras yang paling umum pada cluster adalah putusnya kabel secara tidak disengaja atau kontak yang rusak pada konektor.

Fujitsu RX1330 digunakan sebagai server dengan perangkat lunak kontrol. Dia juga ditugaskan fungsi server arbiter dan kuorum.

Penyebaran Cluster

Tahap pertama terdiri dari pemasangan fisik komponen perangkat keras, menghubungkan kabel antarmuka, dll. Ini diikuti oleh pengaturan perangkat lunak, seperti Sistem operasi sudah diinstal sebelumnya. Kami menyebarkan Storage Space Direct di setiap server dan membangun sekelompok 2 node dan seorang wasit.

Kemudian kami menggunakan utilitas Fujitsu Infrastructure Manager, ekstensi Windows Admin Center yang terintegrasi erat dengan perangkat keras server Fujitsu dan berisi semua alat manajemen dari Azure, seperti:

Azure Site Recovery menyediakan ketersediaan tinggi dan pemulihan bencana sebagai layanan (DRaaS).
Azure Monitor adalah situs terpusat untuk memantau operasi aplikasi, jaringan, dan infrastruktur dengan analitik berbasis AI yang mendalam.
«-» Azure .
Azure Backup , -.
« Azure» Windows, Azure .
Azure Azure VPN- « — ».
« Azure» .

Ekstensi ini memungkinkan Anda untuk mengotomatisasi sejumlah tugas yang juga dapat dilakukan secara langsung di Pusat Admin.

Pool Penyimpanan Berkumpul, menciptakan Volume di dalamnya. Volume ini kemudian ditempatkan mesin virtual yang kami lakukan tes kinerja. Baik volume dan mesin virtual dikelola dengan mudah dari satu jendela.

Melalui Fujitsu Infrastructure Manager, juga nyaman untuk melakukan banyak hal tentang pemeliharaan terjadwal dan pembaruan mikrokode. Status semua peralatan ditampilkan dengan jelas, banyak yang dapat diotomatisasi.

Ada dua versi utilitas Fujitsu Infrastructure Manager - berbayar dan gratis:

Gratis. Tersedia untuk diunduh dari situs web pabrikan, itu cukup untuk manajemen server.
. Microsoft Azure HCI — Windows Server .

Untuk integrasi Primergy yang mendalam dengan Microsoft Azure Stack HCI, Anda memerlukan plug-in manajemen server dari Windows Server, yang hanya tersedia dalam versi berbayar. Oleh karena itu, FIMITSU Integrated System PRIMEFLEX untuk solusi Microsoft Azure Stack HCI adalah bagian darinya.

Semakin banyak instalasi yang Anda miliki, semakin bernilai otomatisasi yang disediakan utilitas.
Hanya ada 2 node di stand kami dan kami bisa melakukan semua pekerjaan secara manual. Jika Anda memiliki 4 node atau lebih, perangkat lunak akan secara signifikan mengurangi upaya instalasi dan administrasi Anda. Biaya utilitas kurang dari 1% dari proyek, tetapi secara signifikan mempercepat commissioning peralatan.

Untuk Windows Admin Center, Fujitsu Infrastructure Manager Orchestra adalah paket ekspansi:

Tangkapan layar yang sama menunjukkan komposisi subsistem disk server: dua modul Optane digunakan sebagai ekstensi cache, dan lima disk SSD sebagai kumpulan penyimpanan Tier-1.

Poin penting

Saat membangun solusi, ada beberapa nuansa yang harus diingat:

Anda dapat mengelola Microsoft Azure Stack HCI dengan dua cara - melalui Windows Admin Center atau Fujitsu Infrastructure Manager.

Pusat Admin juga memiliki kelebihan - Anda dapat menggunakannya di apa saja, bahkan di laptop; ada kemampuan untuk mengontrol dari baris perintah. Dengan itu, administrator dapat melakukan hampir semua hal.

Ada juga Cluster Manager - alat yang sangat diperlukan untuk masalah dengan cluster.

Saat menggunakan Witness (server kuorum), penting untuk menambahkannya ke Active Directory dan memeriksa ketersediaannya untuk semua node. Persyaratan untuk tugas ini minimal, dan dapat ditempatkan di server pangkalan apa pun.

Dari sudut pandang Windows Server, ada tiga jenis perangkat disk - NVMe, SSD dan HDD. Logikanya adalah sebagai berikut: Perangkat NVMe adalah cache baca / tulis, SSD adalah level penyimpanan Tier-1; HDD - Tingkat penyimpanan Tier-2. Selanjutnya, Anda dapat mengonfigurasi kebijakan untuk memindahkan data antar kumpulan. NVDIMM juga dapat digunakan sebagai cache.

Ukuran blok default untuk merobek adalah 4K, tetapi dapat bervariasi tergantung pada jenis sistem file di mesin virtual. Ini selanjutnya akan mempengaruhi kinerja.

Kami menggunakan modul NVMe sebagai cache, sehingga kecepatan membaca dan menulis data akan sangat berbeda - ini akan terlihat jelas dalam tes kinerja:

( ), SSD (Tier-1, ).
NVMe , , . .

Sebelum membuat sebuah cluster, validasi dan semua tes di Failover Cluster Manager harus diselesaikan. Laporan perlu disimpan, karena tanpa itu tidak akan mungkin untuk membuka panggilan layanan dalam dukungan Microsoft, jika diperlukan.

Saat menambahkan node baru ke cluster yang ada, node akan secara otomatis ditambahkan ke kumpulan Penyimpanan. Setelah 15 menit, cluster akan secara otomatis membangun kembali, membangun kembali, dan menyeimbangkan kumpulan Penyimpanan. Ini dapat mempengaruhi kinerja selama pembangunan kembali.

Tes kinerja

Sekarang mari kita beralih ke bagian yang paling menarik - uji beban.

Konfigurasi pengujian:

dua server Fujitsu PRIMERGY RX2540 yang dipasang dalam sebuah cluster;
setiap server memiliki dua modul memori kelas penyimpanan Intel Optane yang diinstal, digunakan untuk memperluas cache baca / tulis;
SSD, ,
erasure coding ( RAID-5).

Bahkan, ini adalah sistem penyimpanan yang ditentukan oleh perangkat lunak yang menjalankan Windows Server 2019 Azure Stack HCI.

Kami memulai tes pertama dengan 12 mesin virtual yang berjalan di kedua node. Profil muat baca / tulis adalah 70:30, ukuran blok = 8k. Ukuran blok dipilih berdasarkan fakta bahwa sebagian besar basis data transaksional modern dan beban OLTP hanya menggunakan ukuran blok tersebut dan kira-kira sama dengan rasio baca / tulis.

Kinerja cluster kondisi-tunak adalah 428k IOPS dengan penundaan 0,487 ms. Ini adalah hasil yang sangat layak, yang cukup sebanding dengan apa yang dapat Anda peroleh pada sistem penyimpanan all-flash khusus dari banyak produsen.

Tes independen dengan profil beban serupa disediakan pada sumber daya spcresults.org - ini adalah tes SPC-1. Perbedaannya dengan konfigurasi kami hanya pada ukuran blok - 4k.

Jika kami menyederhanakan metodologi untuk membandingkan hasil secara signifikan, kami dapat membagi menjadi dua indikator IOPS yang diperoleh untuk sistem penyimpanan semua-flash dan membandingkannya dengan angka-angka yang kami terima pada waktu respons yang sama. Hasil yang diperoleh pada cluster kami dari dua server tingkat menengah cukup sebanding dengan kebanyakan sistem penyimpanan.

Tentu saja, perbandingan seperti itu tidak terlalu benar, karena dalam kasus kami, peningkatan jumlah disk akan memengaruhi kinerja dan penundaan yang sangat berbeda dibandingkan dengan sistem penyimpanan khusus. Tetapi, bahkan dengan mempertimbangkan semua asumsi ini, dapat dikatakan bahwa beberapa tahun yang lalu angka-angka kinerja seperti itu hanya dapat dilihat pada sistem penyimpanan eksternal multi-pengontrol dari tingkat rata-rata atau bahkan lebih tinggi. Hari ini ini dapat dicapai pada solusi hyperconverged.

Gambar kinerja berubah secara signifikan ketika deduplikasi dan pengukuran dihidupkan dengan ukuran blok sebelumnya = 8k. Jika Anda mengaktifkan deduplikasi pada profil beban yang sama, maka kinerjanya akan kurang dari 300k IOPS.

Jika kami menjalankan dua profil muat dengan blok 8KB di mana satu profil dibaca 100% dan 100% lainnya ditulis, maka di bawah ini adalah angka terbaik yang bisa kami dapatkan:

Kami melihat hasil bacaan yang sangat baik, terutama jika kami memperhitungkan penundaan 12 μs. Di sini Optane benar-benar bekerja dengan baik sebagai cache yang dibaca dengan algoritma proaktif untuk transfer data prediktif ke cache. Ya, dan kumpulan penyimpanan itu sendiri, yang terletak di SSD, juga menunjukkan angka baca yang sangat baik.

Tetapi kecepatan tulisnya sangat berbeda. Berikut adalah beberapa faktor serius:

Arsitektur solusi, ketika data jatuh ke cache dari satu node disalin melalui jaringan ke cache dari node kedua.
: — , Optane. .

45%, , — , . .
SSD SSD — 3D-NAND , 3D-NAND.

OLTP- – 8k .
Deduplikasi dapat diaktifkan kapan saja, tetapi secara signifikan mengurangi kinerja. Efisiensi deduplikasi dalam pengujian kami adalah 45% dengan penurunan kinerja lebih dari 25%.

Ini memberi Anda kebebasan untuk memilih - baik kinerja penyimpanan yang lebih tinggi atau kapasitas hampir dua kali lipat. Juga, banyak hal akan tergantung pada profil beban dan kemampuan untuk mengompres data yang direkam.

Karena arsitektur solusi, operasi penulisan sekuensial secara signifikan meningkatkan waktu respons.
Tidak sia-sia bahwa Microsoft mengharuskan Anda untuk membangun solusi hanya berdasarkan konfigurasi yang divalidasi dari mitra OEM - ini memungkinkan Anda untuk menghindari banyak masalah baik selama instalasi awal dan selama pekerjaan lebih lanjut.
Bekerja dengan perangkat keras dari Fujitsu, seperti biasa, hanya meninggalkan kesan positif. Ini adalah dokumentasi yang masuk akal, dan banyak tambahan berguna dari Infrastructure Manager - paket perangkat lunak ini sangat menyederhanakan manajemen sistem. Ini sangat penting ketika meningkatkan jumlah node.
Solusi PRIMEFLEX dari Fujitsu mencakup serangkaian skrip yang mempercepat proses penyebaran. Mereka membuatnya mudah untuk memulai dan mengkonfigurasi secara umum, dan server Fujitsu PRIMERGY pada khususnya.

Bagi mereka yang tidak tertarik untuk mengatur sendiri solusinya, ada peluang untuk menyimpulkan Kontrak Solusi Teknis dengan Fujitsu. Dalam hal ini, spesialis teknis vendor akan mengerahkan semuanya berdasarkan turnkey dan akan memberikan dukungan lebih lanjut.

Apa itu Azure Stack HCI dan bagaimana cara kerjanya