المراقبة في مركز البيانات: كيف قمنا بتغيير نظام إدارة المباني القديم إلى نظام جديد. الجزء 3

نواصل قصتنا حول كيف قمنا بتغيير نظام BMS في مراكز البيانات لدينا ( الجزء 1 ، الجزء 2 ). في الوقت نفسه ، لم نقم بتغيير حل أحد البائعين إلى آخر فحسب ، بل قمنا بتطوير النظام من الصفر ليلائم متطلباتنا. لاختتام قصتنا ، نشارك نتائج العمل المنجز والحلول المثيرة للاهتمام التي قد تكون مفيدة لك.

واجهة جديدة


هنا ، كما يقولون ، من الأفضل أن ترى مرة واحدة.

رفوف.

دعونا نحلل الاختلافات.

  • أولا ، إنها مريحة بشكل جميل . لاحظ مدى سهولة تتبع الحمل على الوحدات ("البنوك" أو "البنوك") لوحدة PDU ومجموع الأحمال المتوازية للوحدات المزدوجة. في نموذج الحامل من BMS الجديد ، نرى على الفور أن وحدات PDU المزدوجة المزدوجة تم تحميلها بشكل زائد (التيار الكلي فوق 16A المسموح به هو إشعار "أزرق") ، والجزء العلوي منها منخفض. إذا تم فصل أحد المدخلات ، فسيتم نقل الحمل بالكامل إلى الثاني ، وسيتم فصل الوحدة السفلية المتبقية المتبقية بسبب التحميل الزائد. لمنع حدوث ذلك ، ستنبه خدمة دعم مركز البيانات العميل مسبقًا وترسل توصية حول كيفية إعادة توزيع الحمولة.
  • . BMS PDU. BMS , , - « ».
  • . . . , ( ) . , . 
  • واجهة بديهية. في الواجهة الجديدة ، لا توجد أكوام من الرموز ، وتدور المعجبون ، وتبديل "النقر". والأكثر ملاءمة هو القدرة على الإشارة إلى حالة خط PDU A / B داخل الرفوف. لقد حاولنا القيام بشيء مماثل في BMS القديم ، لكن عدد رموز الدمج لكل سنتيمتر مربع من البطاقة أجبرنا على التخلي عنها.

الآن العين مسرورة للمشاهدة:


الخادم


جزء من لوحة التبديل الرئيسية.


لوحة تحكم بالتهوية.

ويمكنك تزيين BMS الجديد للعام الجديد :-)


صفحة واحدة - التفاهم والمعارف التقليدية


لفترة طويلة جدًا ، أردنا تنفيذ "خدعة" أخرى في BMS: لنؤلف في صفحة واحدة المعلمات الرئيسية لمركز البيانات ، بحيث تكون نظرة واحدة على الشاشة كافية لتقييم حالة الأنظمة الرئيسية. ومع ذلك ، لم نفهم تمامًا كيف يجب أن تبدو.

حتى قبل بدء تطوير BMS الجديد ، قمنا بزيارة العشرات من مراكز البيانات في هولندا مع رحلات استكشافية. كان أحد الأهداف رؤية أمثلة على تنفيذ هذه الصفحة.

ولم يتم عرضها لنا في أي مركز بيانات - في مكان ما لم يكن ، في مكان ما "تم تطويره الآن" ، في مكان ما كان "سرًا تجاريًا كبيرًا". لذلك ، في ToR الخاصة بنا لإنشاء BMS جديد ، كان هناك وصف دقيق لهذه الصفحة ، وهو أمر مهم للغاية بالنسبة لنا ، مفقودًا.

ونتيجة لذلك ، توصلنا إليه حرفيا "أثناء التنقل". في تلك اللحظة فقط ، كان عليّ استشارة الزملاء في مركز البيانات عن بُعد. كان التمرير عبر صفحات BMS على الهاتف بحثًا عن بيانات متباينة غير مريح للغاية ، وفي الواقع ، تم كتابة النسخة الأولى من صفحة واحدة على منديل . تم تنفيذه من قبل مطوري الصورة. 

باتباع مثال الزملاء الهولنديين الحذرين ، لن نعرض النسخة النهائية لصفحتنا الرئيسية ، خاصة وأن كل مركز بيانات فريد ولا معنى للنسخ. لكننا نصف مبدأين رئيسيين لتشكيلها:

  1. , ( , ), . «» , . 
  2. ( ). , .  - – . .

في الواقع ، يتم الآن تجميع جميع الخصائص الرئيسية لمركز البيانات وعرضها على نفس شاشة الهاتف الذكي / الشاشة من قبل المهندس والمدير المسؤول ، بينما يتم تنفيذ الاتصال بالتضاريس المادية والمنطقية لمركز البيانات. 

هذه صورة من المسودة الأولى ، على الرغم من أن هذه النسخة أعيد التفكير فيها وإنهائها.



شكر وتقدير للحوادث


دعونا نتحدث عن مفهوم جديد آخر لنا ، والذي ظهر نتيجة لمشروع تحديث نظام المراقبة.

الإقرار هو مصطلح نادر إلى حد ما اقترحه مطور BMS الجديد. وهذا يعني التأكيد على أن العامل شاهد الحادث ، وأكده وتولى مسؤولية إزالته.  

لقد ترسخت الكلمة ، والآن "نعترف" بالحوادث.

الخوارزمية الموضحة في النسخة الأساسية من BMS الجديدة لا تناسبنا. في الواقع ، كانت هذه تعليقات على سجل الأحداث ، أي أن الأحداث التي تم حلها لم تختف من المجلة ، ولم يتم فرز الرسائل المستلمة ("المعترف بها") من الرسائل الجديدة.

ونتيجة لذلك ، تم تطوير نافذة تحت اسم "الملخص" ، حيث:

  1. يتم عرض الحوادث والأجهزة النشطة فقط في وضع الخدمة (بدون إشعارات "زرقاء" تجارية).
  2. يتم فصل الحوادث الجديدة والمقبولة بوضوح.
  3. يشار إلى من قبل الحادث.

خوارزمية الواجب في BMS الجديدة هي كما يلي:

  1. يتم الإبلاغ عن حوادث جديدة وتنتظر الاعتراف. لا يمكن أن يكونوا في هذا القسم لفترة طويلة ، يجب على ضابط المعدات في الخدمة أن يأخذ الحادث على الفور.
  2. يقبل الموظف الحادث بالنقر على علامة الاختيار على اليمين. نظرًا لأن جميع الموظفين يخضعون لحسابات فريدة ، فإنه يعرض تلقائيًا من الذي قبل الحادث. إذا لزم الأمر ، اترك التعليق.
  3. ينتقل الحادث إلى قسم "المعترف به" ، ويدرك بقية الحاضرين والمدير أن الضابط المسؤول متورط في الحادث.



مثال على نافذة الملخص مع رسالة جديدة ومعترف بها بالفعل.

بعد توصيل نافذة الملخص بجدول من صفحة واحدة ، حصلنا على شاشة رئيسية كاملة لنظام BMS ، والتي يمكنك أن ترى فيها على الفور: 

  • حالة أنظمة مراكز البيانات الرئيسية ؛
  • وجود حوادث جديدة غير معالجة ؛
  • وجود حوادث وبيانات مقبولة عن الشخص الذي قام بحذفها على وجه التحديد.

الوصول عبر المتصفح والتنبيهات المنبثقة على الهاتف


تعد واجهة الويب ، التي يمكن الوصول إليها من أي جهاز من أي مكان في العالم ، تناقضًا صارخًا مع عميل "fat" ، وهي مغلقة تمامًا أمام المستخدمين الخارجيين. 

استند النهج القديم على مجموعة من المضايقات ، من مشاكل في تنظيم العمل عن بعد لموظفي خدمة المراقبة إلى الحاجة إلى تثبيت عملاء "كثيرين" من التوزيعات إلى وظائف الموظفين في مركز البيانات.

الآن تحتوي أي صفحة في BMS على عنوان فريد ، والذي يسمح لك بمشاركة ليس فقط العنوان المباشر للصفحة أو الجهاز ، ولكن أيضًا روابط إلى الرسوم البيانية / التقارير الفريدة. 

يتم توفير الوصول إلى النظام الآن من خلال مصادقة LDAP من خلال Active Directory ، مما يعزز مستوى الأمان. 

التنقل اليوم هو عامل رئيسي في العمل الجيد للمهندسين المناوبين. بالإضافة إلى مراقبة المراقبة في غرفة نوبة العمل ، يقوم المهندسون بإجراء تحويلات ، ويقومون بأعمال روتينية خارج "غرفة العمل" ، وبفضل الشاشة الرئيسية BMS المحسنة لشاشة الهاتف المحمول ، لا تفقد السيطرة على ما يحدث في الغرف لثانية واحدة. 

يتم تحسين جودة التحكم من خلال وظائف محادثات العمل. إنها تسرع سير العمل ، مما يسمح لك "بربط" مراسلات المهندسين المناوبة مع BMS. على سبيل المثال ، نستخدم تطبيق Teams ، والذي يسمح لك بإجراء المراسلات الداخلية وتلقي جميع الرسائل من BMS على الهاتف في شكل إخطارات دفع منبثقة ، مما يلغي واجب الضابط المناوب من النظر باستمرار إلى شاشة الهاتف.


 إشعار دفع على شاشة الهاتف الذكي.


وهكذا تبدو الإخطارات في تطبيق Teams.

في الوقت نفسه ، يتم تكوين الإشعارات المنبثقة فقط للرسائل المتعلقة بالحوادث ، وبالتالي تقليل عامل الإلهاء ، يعرف الموظفون أنه إذا ظهر إشعار الدفع Teams على شاشة الهاتف الذكي ، فأنت بحاجة إلى الانتقال إلى صفحة BMS وقبول الحادث. يتم بالفعل تتبع رسائل الإجراءات التصحيحية على صفحة BMS.


في الصورة ، واجهة BMS في الهاتف الذكي.

تلخيص


مع تكلفة تحديث BMS من بائعنا القديم ، الذي يمكن مقارنته بتطوير نظام جديد من البداية (حوالي 100000 دولار أمريكي) ، تبين أن الاختلاف في وظائف المنتجات كبير. تلقينا نظامًا مرنًا تم تحسينه لمهام أعمالنا وعملياتنا. كما حققنا وفورات كبيرة في تكاليف التشغيل للحفاظ على النظام وتحديثه. 

ولكن ، بالطبع ، كانت هناك صعوبات. 

  • -, , BMS, . , , , , . , . , , . 
  • -, , . BMS, . . , , .
  • -, . ( ) , , , .

يمكن أن يسمى التحديث الجذري لنظام BMS لدينا اليوم أهم مشروع في العام الماضي ، والذي سيؤثر بشكل خطير على جودة الإدارة التشغيلية لمواقعنا في المستقبل. 

بالطبع ، لم نتخلص من خادم الحديد القديم ، ولكن "جعلنا الأمر أسهل": قمنا بتنظيف الآلاف من أجهزة الاستشعار الافتراضية ووحدات PDUs "التجارية" ولم نترك سوى بضع عشرات من الأجهزة الأكثر أهمية فيها ، مثل مجموعات مولدات الديزل ، وأجهزة UPS ، ومكيفات الهواء ، والمضخات ، وأجهزة استشعار التسرب ، و درجات الحرارة. في هذا الوضع ، عادت إلى سرعتها السابقة ، ويمكن أن تكون "احتياطي احتياطي". بالمناسبة ، بعد إزالة PDU من BMS القديمة ، تم تحرير حوالي 1000 ترخيص الآن غير ضروري ، هل تعرف ماذا تفعل بها؟

All Articles