وتوضيح ، أو كيف مررنا تدقيق الاستدامة التشغيلية في Uptime Institute


صعد رئيس قسم العمليات إلى فتحة مخزن الوقود تحت الأرض لإظهار العلامات على الصمام اللولبي.

في أوائل شهر فبراير ، أعيد معهد Uptime (UI) اعتماد أكبر مركز بيانات من المستوى الثالث NORD-4 الخاص بنا بموجب معيار الاستدامة التشغيلية. سنخبرك اليوم بما ينظر إليه المراجعون وما هي النتائج التي انتهينا منها.

بالنسبة لأولئك الذين يملكون مراكز بيانات في "أنت" ، سوف نتحدث باختصار عن المواد. تقيّم معايير المستوى مراكز البيانات وتصدّق عليها على ثلاث مراحل:

  • مشروع (تصميم): حزمة وثائق المشروع يتم التحقق من انها المخصصة فقط للجميع المعروفة. الفئة . يوجد 4 منها: المستوى I - IV. هذا الأخير ، على التوالي ، هو الأعلى.
  • (Facility): - . - : (, , , , ..) , . Tier III - -.

    Facility , - Dsign.
    NORD-4 Design 2015 , Facility —  2016.
  • (Operational Sustainability). , . - Tier ( Operational Sustainability, Facility). - Tier IV .

    : Bronze, Silver Gold. 88,95 100 , Silver. Gold — 1,05 . 



كيفية التحقق من أن العمليات اللازمة مرتبة وتعمل كما ينبغي؟ علاوة على ذلك ، كيفية القيام بذلك في يومين - هذا هو مقدار الوقت الذي تستغرقه إعادة الاعتماد. باختصار ، تعتمد الشهادة على مقارنة مضنية لما هو مكتوب في اللوائح ، وقصص "كيف يعمل كل شيء" والممارسات الحقيقية. يتم الحصول على معلومات حول هذا الأخير من جولات مركز البيانات والمحادثات مع مهندسي مركز البيانات - "المواجهات" ، كما نسميها بمودة. هذا ما ينظرون إليه.

الفريق


بادئ ذي بدء ، يتحقق مدققو واجهة المستخدم لمعرفة ما إذا كان هناك عدد كاف من الموظفين في مركز البيانات. يأخذون جدول التوظيف وجدول العمل ويتحققون بشكل انتقائي من تقارير التحول وبيانات ACS للتأكد من أن العدد الصحيح من المهندسين كان حقاً في الموقع في ذلك اليوم.

كما ينظر المدققون عن كثب في عدد ساعات المعالجة. يحدث هذا في بعض الأحيان عندما يقوم عميل كبير بالاتصال وفي نفس الوقت يجب تسليم عشرات الرفوف. في مثل هذه اللحظات ، يأتي الرجال من التحولات الأخرى إلى الإنقاذ ، ويتم دفع أموال إضافية لهم مقابل ذلك.

NORD-4 7 : 6 . , 247, , . . . — . 247.


NORD , .

عندما يتم فرز الأرقام ، يتم التحقق من مؤهلات الفريق. ينظر المدققون بشكل عشوائي إلى الملفات الشخصية للمهندسين للتأكد من أن لديهم الشهادات والشهادات والتصاريح اللازمة (على سبيل المثال ، شهادات السلامة الكهربائية) للعمل في هذا المنصب.

هم أيضا التحقق من كيفية تدريب الموظفين. خلال المراجعة الأخيرة ، أثار نظامنا لتدريب المهندسين المناوبين الجدد إعجاب المتخصصين في واجهة المستخدم. بالنسبة لهم ، نجري دورة تدريبية لمدة ثلاثة أشهر في تدريب مدفوع الأجر ، نعرضهم خلالها على عمليات ومبادئ العمل في مركز البيانات الخاص بنا.

يجب أن يتلقى المهندسون العاملون بالفعل تدريبًا منتظمًا ، بما في ذلك أعمال الطوارئ. سوف يقوم المدققون بالتأكيد بفحص البرامج والمواد التدريبية لهذه التدريبات ، وكذلك فحص المهندسين بشكل انتقائي. لن يطلبوا من أي شخص التحول إلى DGU ، لكنهم سيطلبون منك أن تخبروا خطوة بخطوة ما يجب فعله عند قطع التيار الكهربائي عن المدينة. بناءً على نتائج المراجعة ، سنجلب جميع برامج التدريب إلى معيار واحد بحيث لا تختلف باختلاف الفرق.


نعرض على المدققين غرفة استرخاء لمهندسي المناوبات.

تشغيل وصيانة النظم الهندسية 


في هذا القسم الكبير من المراجعة ، نوضح أن جميع المعدات والأنظمة الهندسية تتلقى صيانة منتظمة وفقًا للجدول الزمني الموصى به من قبل البائعين ، ويحتوي المستودع على قطع الغيار اللازمة ، والعقود الحالية مع مقاولي الخدمة ، ولكل عملية مع المعدات إجراءاتها الخاصة وخوارزميات العمل لمختلف الحالات.

رسائل الوسائط المتعددة عندما تقوم بتشغيل العشرات من UPS ، ومولدات الديزل ، ومكيفات الهواء وأشياء أخرى ، فأنت بحاجة إلى مكان لجمع جميع المعلومات حول هذا الاقتصاد. في ما يلي ملف تم إنشاؤه تقريبًا لكل قطعة من المعدات معنا:

  • النموذج والرقم التسلسلي ؛
  • العلامات؛
  • المواصفات والإعدادات الفنية ؛
  • مكان التثبيت ؛
  • تواريخ الإنتاج والتكليف ونهاية الضمان ؛
  • عقود الخدمة؛
  • الجدول الزمني وتاريخ الصيانة ؛
  • وكل "التاريخ الطبي" - الأعطال والإصلاحات.

كيف وأين يتم جمع كل هذه المعلومات ، يقرر كل مشغل مركز بيانات بنفسه. لا تحد واجهة المستخدم في الأدوات. يمكن أن يكون Excel بسيطًا (بدأنا بهذا) أو نظام إدارة صيانة مكتوب ذاتيًا (MMS) ، كما لدينا الآن. بالمناسبة ، مكتب الخدمة ، التحكم في المخزون ، المجلة الإلكترونية ، المراقبة هي أيضًا مكتوبة ذاتيًا.


هنا "مسألة شخصية" لكل قطعة من المعدات.

أظهرنا ممارساتنا في هذا المجال ، بما في ذلك مع مثال UPS الأساسي للبنية التحتية (في الصورة) ، التي تبرعت بأحد مكونات UPS الخاصة بها لتحميل تكنولوجيا المعلومات. نعم ، وفقًا للمعيار ، فقط معدات البنية التحتية التي تزود مكيفات الهواء ، إضاءة الطوارئ ، ولكن ليس حمل تكنولوجيا المعلومات ، يمكنها التعامل مع هذا "التبرع".



بعد ذلك ، طلب المدققون إظهار التذكرة المقابلة في مكتب الخدمة:



وملف UPS في MMS:



قطع الغيار. للصيانة في الوقت المناسب والإصلاحات الطارئة للمعدات الهندسية ، نحتفظ بقطع الغيار الخاصة بنا. هناك مستودع مشترك مع قطع غيار كبيرة للمعدات وخزائن صغيرة مع قطع غيار في غرف الهندسة (بحيث لا تضطر إلى الركض بعيدًا).

في الصورة: نتحقق من توافر قطع غيار لمحركات الديزل. أحصينا 12 مرشحا. ثم قاموا بفحص البيانات في رسائل الوسائط المتعددة.  



تم إجراء تمرين مماثل في المستودع الرئيسي ، حيث يتم تخزين قطع الغيار الكبيرة: الضواغط ، وحدات التحكم ، الأتمتة ، المراوح ، مرطبات البخار ومئات المواضع الأخرى. انتقائي إعادة كتابة العلامات و "لكمها" عبر رسائل الوسائط المتعددة.




بيانات مخزون قطع الغيار. الأحمر هو ما هو مفقود ويحتاج إلى شرائه.

الصيانة الوقائية. بالإضافة إلى الصيانة والإصلاحات ، توصي واجهة المستخدم بإجراء الصيانة الوقائية. يساعد على تحويل حادث محتمل إلى إصلاح مجدول. لكل معلمة ، نقوم بتكوين قيم العتبة في المراقبة. إذا تم تجاوزهم ، يتلقى المسؤولون الإنذارات واتخاذ الإجراءات اللازمة. على سبيل المثال ، نحن:

  • نتحقق من اللوحات الكهربائية باستخدام جهاز تصوير حراري من أجل العثور على عيب في التركيبات الكهربائية في الوقت المناسب: ضعف الاتصال أو ارتفاع درجة الحرارة المحلية للموصل أو الآلة. 
  • نحن نراقب الاهتزازات والاستهلاك الحالي لمضخات نظام التبريد. هذا يسمح لك بتحديد الانحرافات في الوقت المناسب والتخطيط بسرعة لاستبدال الأجزاء.
  • نقوم بتحليلات الوقود والزيوت لمجموعات مولدات الديزل ، الضواغط.
  • اختبار الجليكول في نظام التزويد البارد للتركيز.


مخطط اهتزاز المضخة قبل وبعد الإصلاح.

العمل مع المقاولين. يتم إجراء إصلاحات الصيانة والمعدات من قبل المقاولين الخارجيين. من جانبنا ، هناك متخصصون فرديون في مجموعات مولدات الديزل ومكيفات الهواء وأجهزة UPS التي تراقب عملهم. يتحققون مما إذا كان المقاولون لديهم الأدوات والمواد اللازمة لأعمال الإصلاح / الصيانة ، والشهادات المهنية ، وقشور السلامة الكهربائية ، والتحمل. يقبلون كل العمل.


هذا ما تبدو عليه قائمة المراجعة لقبول العمل على صيانة مكيف الهواء.


في مكتب المرور ، نتحقق من إصدار التصاريح للممثلين المعتمدين للمقاولين ، وما إذا كانوا قد اجتازوا الصيانة في الوقت المحدد وما إذا كانوا قد تعرفوا على القواعد.

توثيق.العمليات الراسخة لخدمة النظم والمعدات هي نصف المعركة. يجب توثيق جميع الإجراءات التي يقوم بها شخص في مركز البيانات. الغرض من ذلك بسيط: بحيث لا يصبح كل شيء معزولًا عن شخص معين وفي حالة وقوع حادث ، يمكن لأي مهندس اتخاذ تعليمات واضحة والقيام بجميع العمليات اللازمة للقضاء عليه.

واجهة المستخدم لديها منهجيتها الخاصة لهذه الوثائق.

من أجل الإجراءات البسيطة والمتكررة ، تم تجميع الإجراء التشغيلي القياسي (SOP). على سبيل المثال ، هناك SOPs لتشغيل / إيقاف تشغيل المبرد ، وتعيين UPS على تجاوز.

للصيانة أو العمليات المعقدة ، مثل استبدال البطاريات في UPS ، يتم إنشاء طرق الإجراءات (MOP). قد تشمل هذه إجراءات التشغيل القياسية. يجب أن يكون لكل نوع من المعدات الهندسية MOPs الخاصة به.

أخيرًا ، هناك إجراءات تشغيل الطوارئ (EOP) - تعليمات الطوارئ. يتم تجميع قائمة حالات الطوارئ المحددة وكتابة التعليمات لهم. فيما يلي جزء من قائمة حالات الطوارئ ، التي توضح بالتفصيل علامات الحادث والإجراءات والأشخاص المسؤولين والأشخاص عن الإخطار:

  • إغلاق امدادات الطاقة في المدينة: بدأ DGU / لم يبدأ ؛
  • حادث UPS 
  • الحوادث في نظام مراقبة مركز البيانات ؛
  • ارتفاع درجة حرارة غرفة المحرك ؛
  • تسرب نظام التبريد ؛
  • حادث على الشبكة ومعدات الحوسبة ؛

وما إلى ذلك وهلم جرا.

إن إنشاء مثل هذا الحجم من الوثائق هو عمل شاق في حد ذاته. من الأصعب إبقائه محدثًا (وهذا ، بالمناسبة ، يتحقق المدققون أيضًا). والأهم من ذلك - يجب على الموظفين معرفة هذه التعليمات والعمل عليها وإجراء التحسينات إذا لزم الأمر.


نعم ، يجب أن تكون التعليمات متاحة حيث قد تكون هناك حاجة إليها ، وليس فقط جمع الغبار في الأرشيف.


علامات على التغييرات في تنظيم صيانة النظم الهندسية لمركز البيانات.

أثناء المراجعة ، ينظرون أيضًا في الوثائق الفنية للأنظمة ، ووثائق التنفيذ والعمل ، وأعمال وضع الأنظمة قيد التشغيل. 

العلامات.خلال جولة حول مركز البيانات ، قاموا بفحصه أينما استطاعوا الوصول إليه. حيث لا يمكن أن تصل - من سلم خطوة :). نظرنا إلى وجودها على كل درع وآلة وصمام. لقد تحققوا من التفرد والغموض والامتثال للمخططات الحالية للوثائق التنفيذية. في الصورة أدناه: نحن في مضخة تخزين الوقود نقارن بين العلامات على صمامات الملف اللولبي بمخطط الوثائق التنفيذية. 



اتفق معها كل شيء ، ولكن مع الرسم البياني الأثري "الزخرفي" المحلي على الحائط في معلمة واحدة لم يتطابق.



في مباني مركز البيانات ، يجب أيضًا تعليق مخططات الأنظمة الموجودة هناك. في حالة وقوع حادث ، يساعدون على معرفة مكان وجودهم بسرعة واتخاذ قرار مستنير. في الصورة ، على سبيل المثال ، رسم تخطيطي أحادي الخط في غرفة لوحة المفاتيح الرئيسية.



تم التحقق من مدى ملاءمة المخططات على النحو التالي: دعوا تسمية العنصر على المخطط وطلبوا إظهار "عينية". 



هنا يأخذ المدقق صورًا للإعدادات (الإعدادات) لإصدار لوحة المفاتيح الرئيسية للوحة المفاتيح الرئيسية ، ثم للتحقق من المؤشرات على مخطط أحادي الخط في النسخ الورقية والإلكترونية. على أحد الأجهزة ، QF-3 ، لم يتزامن المؤشر مع مخطط الورق ، وحصلنا على نقطة جزاء. سيتحقق مهندسان الآن من توافق العلامات في الرسوم البيانية أحادية الخط مع الحقيقة.



هذا ليس كل ما فحصه المدققون فيما يتعلق بعمليات الخدمة. إليك ما هو آخر على جدول الأعمال:


UI


الأمن والتحكم في الوصول. يتحقق التدقيق أيضًا من تشغيل أنظمة الأمن والسلامة. على سبيل المثال ، حاول المدقق الدخول إلى إحدى الغرف التي لا يستطيع الوصول إليها ، ثم تحقق مما إذا كان هذا ينعكس في نظام ACS وما إذا كان الأمان قد أخطر به (كان هناك مفسد).

إذا ظل باب أي غرفة مفتوحًا في مراكز البيانات الخاصة بنا لأكثر من دقيقتين ، فسيتم إصدار تحذير في مركز الأمن. وللتحقق من ذلك ، دعم المدققون أحد الأبواب بطفاية حريق. صحيح أننا لم ننتظر صفارات الإنذار - فقد رأى حراس الأمن شيئًا خاطئًا عبر كاميرات الفيديو ووصلوا إلى "مسرح الجريمة" في وقت سابق.

النظام والنظافة.يبحث المدققون عن الغبار ، صناديق معدات عشوائية ، مع أي تردد يتم تنظيف الغرف. هنا ، على سبيل المثال ، كان المدققون مهتمين بشيء غير معروف في ممر التهوية. هذه كتلة من نظام التهوية ، والتي كانت تستعد بالفعل لتحل محلها. ولكن لا يزال يطلب التوقيع.



لا تزال في موضوع الطلب في مركز البيانات - هذه هي الخزانات التي تحتوي على جميع الأدوات اللازمة للعمل في حالات الطوارئ على المعدات الموجودة في لوحة التبديل الرئيسية. 



الموقع.يتم تقييم مركز البيانات وفقًا لظروف الموقع - هل توجد أي قواعد عسكرية ومطارات وأنهار وبراكين وأشياء خطيرة أخرى في مكان قريب. في الصورة ، نظهر للتو أنه منذ الشهادة الأخيرة في عام 2017 ، لم تنمو أي محطات للطاقة النووية ومرافق تخزين النفط حول مركز البيانات. ولكن هناك ، يتم إنشاء مركز بيانات NORD-5 جديد ، والذي يجب أن يمر أيضًا بجميع مستويات الاعتماد من Uptime Institute Tier III. لكن هذه قصة مختلفة تمامًا).


All Articles