Pemantauan di pusat data: bagaimana kami mengubah BMS lama ke yang baru. Bagian 3

Kami melanjutkan kisah kami tentang bagaimana kami mengubah sistem BMS di pusat data kami ( bagian 1 , bagian 2 ). Pada saat yang sama, kami tidak hanya mengubah solusi dari satu vendor ke vendor lainnya, tetapi juga mengembangkan sistem dari awal agar sesuai dengan kebutuhan kami. Untuk mengakhiri kisah kami, kami membagikan hasil pekerjaan yang dilakukan dan solusi menarik yang mungkin berguna bagi Anda.

Antarmuka baru


Di sini, seperti yang mereka katakan, lebih baik dilihat sekali.

Rak.

Mari kita menganalisis perbedaannya.

  • Pertama, sangat nyaman. Perhatikan betapa mudahnya untuk melacak beban pada modul ("Bank" atau "Bank") dari PDU dan jumlah beban paralel dari modul berpasangan. Pada model rak dari BMS baru, kita segera melihat bahwa PDU berpasangan lebih rendah kelebihan beban (arus total di atas 16A yang diizinkan adalah notifikasi "biru"), dan yang atas kekurangan muatan. Jika salah satu input terputus, seluruh beban akan ditransfer ke yang kedua, dan modul yang lebih rendah yang tersisa diberi energi akan terputus karena kelebihan beban. Untuk mencegah hal ini, layanan dukungan pusat data akan memperingatkan pelanggan terlebih dahulu dan mengirim rekomendasi tentang cara mendistribusikan kembali muatan.
  • . BMS PDU. BMS , , - Β« Β».
  • . . . , ( ) . , . 
  • Antarmuka intuitif. Di antarmuka baru tidak ada tumpukan ikon, kipas berputar, beralih "klik". Dan yang paling nyaman adalah kemampuan untuk menunjukkan status PDU Line A / B di dalam rak. Kami mencoba melakukan sesuatu yang serupa di BMS lama, tetapi jumlah ikon penggabungan per sentimeter persegi kartu memaksa kami untuk mengabaikannya.

Sekarang mata senang menonton:


Server


Fragmen dari switchboard utama.


Panel kontrol ventilasi.

Dan Anda dapat menghias BMS baru untuk Tahun Baru :-)


Satu halaman - Memahami dan Tanpa TK


Untuk waktu yang sangat lama, kami ingin menerapkan "trik" lain di BMS: menyusun parameter utama pada satu halaman pusat data, sehingga satu lirikan layar akan cukup untuk menilai status sistem utama. Namun, kami tidak sepenuhnya memahami bagaimana tampilannya.

Bahkan sebelum pengembangan BMS baru dimulai, kami mengunjungi lusinan pusat data di Belanda dengan kunjungan. Salah satu tujuannya adalah untuk melihat contoh penerapan halaman seperti itu.

Dan mereka tidak ditunjukkan kepada kami di pusat data apa pun - di suatu tempat itu tidak, di suatu tempat "itu sedang dikembangkan sekarang", di suatu tempat itu adalah "rahasia dagang besar." Karenanya, dalam Kerangka Acuan kami untuk pembuatan BMS baru, deskripsi persis halaman ini, yang sangat penting bagi kami, tidak ada.

Sebagai hasilnya, kami membuatnya dengan harfiah "dalam perjalanan". Tepat pada saat itu, saya harus berkonsultasi jarak jauh dengan rekan-rekan di pusat data. Menggulir halaman BMS di telepon untuk mencari data yang berbeda sangat merepotkan, dan pada kenyataannya, versi pertama dari Satu halaman ditulis di atas serbet . Itu diimplementasikan oleh pengembang foto. 

Mengikuti contoh rekan Belanda yang berhati-hati, kami tidak akan mendemonstrasikan versi final dari halaman utama kami, terutama karena setiap pusat data unik dan tidak masuk akal untuk menyalinnya. Tetapi kami menggambarkan dua prinsip utama pembentukannya:

  1. , ( , ), . «» , . 
  2. ( ). , .  - – . .

Bahkan, sekarang benar-benar semua karakteristik utama dari pusat data dikelompokkan dan disajikan pada layar yang sama dari smartphone / monitor oleh insinyur dan manajer yang bertanggung jawab, sementara koneksi ke topografi fisik dan logis dari pusat data diimplementasikan. 

Ini adalah foto draft pertama, walaupun tentu saja versi ini dipikirkan ulang dan diselesaikan.



Pengakuan dan ringkasan insiden


Mari kita bicara tentang konsep baru lain untuk kita, yang muncul sebagai hasil dari proyek untuk memperbarui sistem pemantauan.

Pengakuan adalah istilah yang agak jarang bahwa pengembang BMS baru diusulkan untuk digunakan. Ini berarti konfirmasi bahwa operator melihat kejadian itu, mengonfirmasi dan mengambil tanggung jawab untuk menghilangkannya.  

Kata itu telah berakar, dan sekarang kita "mengakui" insiden itu.

Algoritma yang ditetapkan dalam versi dasar BMS baru tidak cocok untuk kita. Bahkan, ini adalah komentar pada log peristiwa, yaitu, insiden yang diselesaikan tidak hilang dari jurnal, dan pesan yang diterima (β€œdiakui”) tidak diurutkan dari yang baru.

Akibatnya, sebuah jendela dikembangkan dengan nama "ringkasan", di mana:

  1. Hanya insiden dan perangkat aktif yang ditampilkan dalam mode layanan (tanpa pemberitahuan "biru" komersial).
  2. Insiden BARU dan DITERIMA jelas dipisahkan.
  3. Diindikasikan siapa yang menerima kejadian tersebut.

Algoritma tugas dalam BMS baru adalah sebagai berikut:

  1. Insiden baru dilaporkan dan menunggu pengakuan. Mereka tidak bisa berada di bagian ini untuk waktu yang lama, petugas peralatan yang bertugas harus segera mengambil insiden itu sendiri.
  2. Karyawan menerima insiden dengan mengklik tanda centang di sebelah kanan. Karena semua karyawan berada di bawah akun unik, secara otomatis menampilkan siapa yang menerima kejadian tersebut. Jika perlu, tinggalkan komentar.
  3. Peristiwa itu pindah ke bagian "Diakui", sisa petugas dan manajer memahami bahwa petugas yang bertanggung jawab terlibat dalam insiden itu.



Contoh jendela ringkasan dengan pesan baru dan sudah diakui.

Setelah menghubungkan jendela ringkasan dengan tabel Satu halaman, kami mendapatkan layar utama penuh dari sistem BMS, di mana Anda dapat langsung melihat: 

  • keadaan sistem pusat data utama;
  • kehadiran insiden baru yang belum diproses;
  • kehadiran insiden dan data yang diterima tentang siapa yang secara khusus menghilangkannya.

Akses melalui browser dan peringatan pop-up di telepon


Antarmuka web, dapat diakses dari perangkat apa pun dari mana saja di dunia, sangat kontras dengan klien "gemuk", benar-benar tertutup bagi pengguna luar. 

Pendekatan lama menyeret serangkaian ketidaknyamanan, dari masalah dalam mengatur pekerjaan jarak jauh untuk memantau karyawan layanan hingga kebutuhan untuk menginstal klien "tebal" dari distribusi ke pekerjaan staf di pusat data.

Sekarang setiap halaman di BMS memiliki alamat unik, yang memungkinkan Anda untuk berbagi tidak hanya alamat langsung dari halaman atau perangkat, tetapi juga tautan ke grafik / laporan unik. 

Akses ke sistem sekarang disediakan melalui otentikasi LDAP melalui Active Directory, yang meningkatkan tingkat keamanannya. 

Mobilitas saat ini adalah faktor kunci dalam kualitas pekerjaan insinyur tugas. Selain memantau pemantauan di ruang tugas jaga, para insinyur membuat jalan memutar, melakukan pekerjaan rutin di luar "ruang tugas" dan, berkat layar utama BMS yang dioptimalkan untuk layar ponsel, jangan kehilangan kendali atas apa yang terjadi di ruangan selama satu detik. 

Kualitas kontrol ditingkatkan oleh fungsi obrolan kerja. Mereka mempercepat alur kerja, memungkinkan Anda untuk "menghubungkan" korespondensi insinyur tugas ke BMS. Sebagai contoh, kami menggunakan aplikasi Tim, yang memungkinkan Anda untuk melakukan korespondensi internal dan menerima semua pesan dari BMS di telepon dalam bentuk pemberitahuan push pop-up, yang membuat petugas jaga tidak harus terus-menerus melihat layar ponsel.


 Pemberitahuan push pada layar ponsel cerdas.


Dan notifikasi terlihat di aplikasi Tim.

Pada saat yang sama, pemberitahuan pop-up hanya dikonfigurasikan untuk pesan tentang insiden, sehingga meminimalkan gangguan, staf tahu bahwa jika Pemberitahuan push Tim muncul di layar ponsel cerdas, Anda harus membuka halaman BMS dan menerima insiden tersebut. Pesan tindakan perbaikan sudah dilacak pada halaman BMS.


Dalam foto tersebut, antarmuka BMS di smartphone.

Meringkas


Dengan biaya memperbarui BMS dari vendor lama kami, sebanding dengan mengembangkan sistem baru dari awal (sekitar $ 100.000), perbedaan dalam fungsi produk ternyata sangat besar. Kami menerima sistem fleksibel yang dioptimalkan untuk tugas dan proses bisnis kami. Kami juga mencapai penghematan yang signifikan dalam menjalankan biaya untuk memelihara dan memperbarui sistem. 

Tetapi, tentu saja, ada kesulitan. 

  • -, , BMS, . , , , , . , . , , . 
  • -, , . BMS, . . , , .
  • -, . ( ) , , , .

Pembaruan radikal dari sistem BMS kami saat ini dapat disebut sebagai proyek paling penting tahun lalu, yang akan secara serius mempengaruhi kualitas manajemen operasional situs kami di masa depan. 

Tentu saja, kami tidak membuang server besi yang lama, tetapi "membuatnya lebih mudah": kami membersihkan ribuan sensor virtual "komersial" dan PDU dan hanya menyisakan beberapa lusin perangkat paling penting di dalamnya, seperti generator diesel, UPS, AC, pompa, sensor kebocoran, dan suhu. Dalam mode ini, ia kembali ke kecepatan semula, dan itu bisa menjadi "cadangan cadangan." Ngomong-ngomong, setelah menghapus PDU dari BMS lama, sekitar 1000 lisensi yang tidak perlu telah dibebaskan, apakah Anda kebetulan tahu apa yang harus dilakukan dengan mereka?

All Articles