Menskalakan jaringan beban tinggi dengan Nutanix: fitur dan tantangan dengan casing pribadi

gambar

Karena kenyataan bahwa jutaan orang duduk di rumah, lalu lintas Internet telah meroket. Ketakutan telah disuarakan lebih dari sekali bahwa beban berlebihan pada jaringan dapat menyebabkan pemadaman - nasional, di suatu negara, atau bahkan global. Untungnya, masalah ini masih ditangani, tetapi ada kesulitan lain yang kurang jelas.

Jenis apa? Sekarang banyak perusahaan perdagangan atau pengiriman online tidak punya waktu untuk memproses jumlah pesanan yang meroket, mereka kehilangan pelanggan, uang dan reputasi, termasuk karena infrastruktur TI mereka tidak siap untuk peningkatan ganda dalam volume pemrosesan data. Ini bisa dihindari dengan meningkatkan infrastruktur TI dengan cepat. Ini dapat dilakukan dengan menggunakan infrastruktur Hyper-konvergen (HCI). Artikel ini didedikasikan untuknya.

?


Kami, Platbox, telah memproses pembayaran pelanggan (bank, sistem pembayaran) selama sekitar tujuh tahun. Kami memproses sekitar 100 juta transaksi per tahun. Ini mengakuisisi, pembayaran melalui SMS, saham dari berbagai perusahaan, dll.
Seiring waktu, jumlah pedagang yang pembayarannya kami proses bertambah, dan beban pada jaringan meningkat.

Masalah penskalaan muncul sejak hari pertama keberadaan perusahaan. Beban bertambah - kami membeli server, skala jaringan, memecahkan masalah. Kemudian jumlah transaksi bertambah lagi, sumber daya secara bertahap habis, siklus berulang. Sekarang jaringan terdiri dari seluruh kebun binatang peralatan, mulai dari server dari SuperMicro ke Dell. Keragaman ini mempersulit pemeliharaan jaringan dan meningkatkan jumlah operasi rutin selama pemeliharaan.

Peningkatan jumlah peralatan juga merupakan biaya. Kami memiliki rak sewa di pusat data. Kami membayar sewa ruang fisik, listrik yang dikonsumsi oleh server, dll. Semakin banyak server, semakin banyak Anda harus membayar, semuanya sederhana. Selain itu, kami memutuskan untuk memperluas tempat kami di SDH, serta meningkatkan daya komputasi server. Muncul pertanyaan - untuk terus skala apa yang sudah ada, bertindak dalam kondisi arsitektur tiga tingkat klasik atau untuk memperkenalkan sesuatu yang baru.

Sekitar enam bulan lalu, mereka memutuskan untuk mencari solusi lain yang akan menyelesaikan masalah yang dijelaskan di atas. Ada beberapa opsi, kami memilih yang optimal - menggunakan infrastruktur hyperconverged alih-alih yang tradisional.

Apa itu infrastruktur hyperconverged (HCI)?


Di sini Anda perlu sedikit penyimpangan ke dalam sejarah TI. Setelah data diproses pada mainframe - komputer besar yang kuat, maka mereka digantikan oleh "server arsitektur standar" yang lebih murah dan lebih fleksibel, konsep arsitektur 3-Tier muncul, dan, sebagai akibatnya, membagi pusat data menjadi subsistem penyimpanan terpisah (SAN) , memproses subsistem (server) dan subsistem transmisi data (bagian jaringan dari pusat data). Seiring berkembangnya TI, berbagai cara baru untuk menyimpan dan memproses data serta memecahkan masalah pengguna muncul. HCI adalah "infrastruktur untuk era" cloud "di IT, penolakan arsitektur 3-Tier yang mendukung, misalnya, layanan mikro.

Dari sudut pandang praktis, dalam infrastruktur konvergen klasik, server, sistem penyimpanan, peralatan jaringan, dan alat virtualisasi adalah elemen yang terpisah. Infrastruktur Hyperconverged mengintegrasikan mereka, serta semua komponen pusat data yang akrab ke dalam satu sistem. Terkadang HCI menyertakan komponen tambahan, misalnya, perangkat lunak cadangan, kemampuan snapshot, fungsionalitas deduplikasi data, kompresi menengah, dan optimalisasi jaringan komputer.

Jika infrastruktur terkonvergensi terutama berbasis perangkat keras, dan pusat data yang ditentukan perangkat lunak sering disesuaikan dengan perangkat keras apa pun, kedua kemungkinan ini digabungkan dalam infrastruktur hyper-konvergensi. Ini juga meningkatkan keandalan operasional, kinerja, dan keamanan data. Secara umum, HCI harus dilihat sebagai putaran evolusi dalam infrastruktur TI.

Setelah mengevaluasi pro dan kontra, kami memutuskan untuk mencoba hyperconvergence, menghubungi Nutanix, mendapatkan platform untuk pengujian, yang berhasil. Untuk pengujian, kami mendapatkan platform hyper-convergent, yang terdiri dari enam node, tetapi dua unit. Kami menghemat listrik, ruang rak, tidak perlu membeli server tanpa akhir.

5 manfaat dari infrastruktur hyper-konvergen

gambar

  1. IT- – HCI, IT-«», .
  2. ;
  3. . . , . , . Nutanix , .
  4. Risiko tidak tersedianya layanan jika terjadi kegagalan satu atau beberapa komponen karena penyatuan, cadangan data, dan perangkat keras berkurang. Jika peralatan tiba-tiba "jatuh" di satu pusat data, cadangan segera mulai di yang lain.
  5. Kode produk open source - memfasilitasi audit keamanan, dan STIG bawaan (Panduan Implementasi Teknis Keamanan atau serangkaian rekomendasi untuk melindungi sistem TI) memberikan eksekusi kode keamanan yang tinggi dan resistensi terhadap dampak penjahat cyber pada sistem TI.

Bagaimana kami memilih vendor


Kami melihat beberapa pemasok sistem hyperconverged. Diantaranya adalah Cisco Hyperflex, SimpliVity, HPE Hyper Converged, Fujitsu PRIMERGY CX dan Nutanix. Kemudian kriteria seleksi berikut dirumuskan:

  • Keandalan dan keamanan data di dalamnya;
  • Kepatuhan dengan persyaratan keamanan PCI DSS 3.2.1;
  • Kecepatan kerja;
  • Pemeliharaan dan dukungan teknis;
  • Fleksibilitas untuk menskalakan infrastruktur dengan kecepatan yang dibutuhkan perusahaan.

Akibatnya, kami berhenti di Nutanix, karena dengan perusahaan inilah, sebenarnya, pasar HCI dimulai pada 2012. Ini menawarkan produk paling stabil dengan fleksibilitas dan kemampuan terbesar, misalnya:

  • Berbagai pilihan platform (HPE, Dell, Fujitsu, Cisco);
  • Ketersediaan versi gratis Edisi Komunitas;
  • Kebebasan untuk memilih hypervisor (termasuk AHV gratis).
  • Sebuah "kuantum pertumbuhan" kecil (sebenarnya, ini adalah satu server), yang telah memberikan segala yang dapat dilakukan oleh bisnis dan memberikan yang terbesar: keandalan, keamanan, dan teknologi baru. Semua fungsionalitas Nutanix, yang saat ini digunakan oleh level bisnis, misalnya, VTB atau grup Societe Generale, juga tersedia untuk solusi paling level pemula.

Selain itu, spesialis dengan pengalaman bekerja dengan platform Nutanix telah muncul di tim teknis kami. Berkat mereka, kami tahu bagaimana sistem akan berperilaku dalam situasi kritis, yang sangat penting bagi kami, seperti untuk perusahaan fintech.

Faktor lain yang telah memengaruhi pilihan Nutanix adalah ketersediaan alat transisi seperti Nutanix Move. Ini memungkinkan Anda menerjemahkan mesin dengan downtime minimal. Jadi, misalnya, jika ada mesin VMware dan Nutanix, maka Move bertindak sebagai semacam jembatan. Dia mengambil mesin dari VMWare, mengkloningnya, menyebarkannya ke Nutanix berdasarkan snapshot, memadamkannya di VMWare dan meluncurkannya dalam nutanix. Semua ini dalam hitungan detik.

Proses transisi ke Nutanix


gambar

Syarat utama ketika bergerak bukanlah untuk melanggar stabilitas sistem, jadi itu perlu untuk beralih ke platform baru dengan sangat hati-hati.

Oleh karena itu, semuanya dimulai dengan menguji platform uji coba Nutanix, yang telah disebutkan di atas. Kami memulai serangkaian pengujian dengan menerapkan lingkungan pengujian. Kami menggunakan pemrosesan, yang bukan pada produksi, dan, dengan demikian, "menembak" itu dari Yandex-gun. Kami memeriksa beban, menggunakan sumber daya yang cukup untuk tujuan kami, menyadari bahwa itu bekerja dengan sempurna, dan di mana optimasi diperlukan.

HCI biasanya hidup berdampingan dengan infrastruktur klasik, tanpa perlu segera meninggalkan pusat data yang sudah dikenal. Migrasi ke HCI dapat dilakukan secara bertahap, diperpanjang, dan lancar sebanyak yang dibutuhkan perusahaan. Misalnya, jika virtualisasi dan hypervisor sudah digunakan di pusat data perusahaan, transisi ke lingkungan HCI adalah migrasi bertahap mesin virtual dari server lama ke yang baru: dari server "klasik" ke server HCI. Ini hanya kasus kami. Kami perlu mentransfer mesin virtual ke lingkungan virtual lain. Jika memungkinkan, migrasi otomatis menggunakan Nutanix Move akan terlibat, beberapa layanan digambarkan sebagai infrastruktur sebagai kode (IaC).

Semua ini dapat dibagi menjadi beberapa tahap:

  1. Menulis RoadMap.
  2. Meluncurkan infrastruktur baru.
  3. Terjemahan layanan menurut RoadMap.

Implementasi tahap-tahap ini memakan waktu sekitar 2 bulan.

Kesulitan dan masalah transisi

Masalah, tentu saja, adalah. Kesulitan utama terletak pada kenyataan bahwa pemrosesan pada saat migrasi layanan masih harus ditunda. Tapi kami bekerja pada titik ini ketika kami mengambil platform Nutanix untuk pengujian. Kami membangun rencana untuk pembelian peralatan dan migrasi layanan pada tahap pengujian. Implementasi ketat dari rencana yang disetujui adalah kunci keberhasilan migrasi layanan.

Di beberapa perusahaan, dalam pengalaman kami, kesulitan untuk pindah ke infrastruktur yang terkonvergensi lebih besar kemungkinannya bukan bersifat teknis, tetapi dari organisasi atau "anggaran". Misalnya, jika pusat data berfungsi, dan tidak ada tugas baru untuk itu, jika banyak peralatan mahal dibeli relatif baru-baru ini untuk pengembangan infrastruktur "klasik", akan sangat sulit untuk memunculkan ide (dan berdebat manajemen atau investor), yang ini harus ditinggalkan dan uang dihabiskan lagi - sudah ada di HCI.

Hasil Positif Beralih ke HCI

gambar

Kualitas tidur untuk para profesional yang beroperasi telah meningkat secara signifikan. Mengapa? Sederhana - penyimpanan terdistribusi meningkatkan keandalan penyimpanan dan ketersediaan data.

Proses bisnis dan karyawan yang dioptimalkan:

  • satu admin, bukan 3;
  • IT-, ;
  • .
  • .

Mengurangi biaya besi. Tentang bagaimana dan mengapa, dikatakan di atas. Penyederhanaan skala biaya pusat data. Dalam pendekatan klasik, akan sangat sulit untuk mengembangkan infrastruktur yang siap untuk tumbuh sepuluh kali lipat tanpa perlu mengubahnya secara keseluruhan atau sebagian. Dalam kasus HCI, Anda dapat mulai dengan solusi yang sangat kecil, secara bertahap berinvestasi lebih banyak dalam infrastruktur.

Ada peluang untuk mendistribusikan kembali biaya dari biaya modal ke operasional , yang sekarang digunakan untuk TI di seluruh dunia. Ini memerlukan cara berbeda untuk merencanakan biaya, jika tidak melihat hal-hal yang sudah lazim, pelajari hal-hal baru, tetapi ke sinilah industri saat ini.

Untuk memahami betapa sederhananya, kami akan memberi Anda satu kasing. Jadi, selama marathon amal, kami memiliki beban jaringan yang sangat kuat - jauh lebih tinggi dari yang dihitung. Kesalahan perhitungan muncul karena beban dihitung dari statistik maraton sebelumnya. Kami tidak memperhitungkan bahwa lebih banyak orang akan ambil bagian dalam yang baru, alasannya adalah karantina dan isolasi diri. Jika masalah muncul dengan infrastruktur yang ada, konsekuensinya akan sangat negatif, termasuk terputusnya layanan. Sekarang kami mengambil Nutanix, berkat itu kami dapat meningkatkan cluster tepat dua kali. Sistem β€œmencerna” beban. Dan semua ini dapat dilakukan hanya dalam 15 menit dan beberapa klik mouse.

Sedikit tentang prospek teknologi dan pilihan HCI


Haruskah semua orang beralih ke HCI? Tidak, tentu saja tidak. Pada dasarnya, infrastruktur terkonvergensi-hyper cocok untuk perusahaan-perusahaan yang memiliki jaringan skala besar, beban yang tinggi pada mereka dan dana yang cukup untuk transisi. Jika startup memiliki beberapa server, maka Anda tidak dapat mengubah apa pun.

Tetapi jika perusahaan memiliki kebun binatang besi seluruh server, jaringan yang dioptimalkan dengan buruk dan tingkat biaya yang tinggi untuk besi dan pemeliharaannya, maka HCI pasti ada di sana.

Nah, berikut ini bisa dikatakan tentang masa depan HCI. pertama, HCI didistribusikan di dunia dan di Rusia sejauh IT siap untuk menerima dan menggunakan ide-ide baru. Banyak perusahaan berkembang mencari peluang baru untuk pengembangan dan pertumbuhan, terutama dalam konteks penyusutan anggaran TI. Perusahaan bisnis tradisional dan konservatif kemungkinan akan datang ke HCI nanti, aktif, muda, mengembangkan dan menggunakan teknologi baru - sebelumnya.

Kedua , semakin banyak perusahaan akan memasuki pasar HCI, teknologi akan menjadi lebih luas dan terjangkau. Sudah, semua produsen top server dan sistem penyimpanan memiliki proposal di bidang HCI, dan ini telah terjadi secara harfiah dalam satu atau dua tahun terakhir.

Ketiga, gagasan "kekeruhan" akan dikembangkan lebih lanjut, termasuk dalam bentuk "awan hibrid", ketika bagian dari infrastruktur akan berlokasi di pusat data "nya", dan sebagian akan disewa ketika kebutuhan muncul.

Contohnya adalah toko online dan layanan pengiriman yang sama. Dalam hal terjadi lonjakan lalu lintas, mereka dapat meningkatkan skala dalam beberapa menit dengan menyewa kapasitas dari operator cloud, dan tidak "menggantung" sepanjang hari, kehilangan pelanggan dan uang mereka. Dan kemudian, setelah penurunan permintaan dan kepastian pasar, skala kembali infrastruktur tanpa mengorbankan keamanan, kinerja, atau menghabiskan uang untuk pembelian peralatan Anda. Mungkin di masa depan, "cloud" dan "pusat data Anda" akan ditautkan dengan mulus. Setidaknya semua teknologi untuk ini sudah ada.

Keempat, sistem otomasi untuk mengelola infrastruktur TI akan mulai berkembang secara aktif, termasuk menggunakan AI, virtualisasi infrastruktur jaringan pusat data.

All Articles