ما يجب التفكير فيه عند تنفيذ الواجب

يشارك Ryn Daniels ، مؤلف DevOps الفعال ، الاستراتيجيات التي يمكن لأي شخص استخدامها لإنشاء تناوب أفضل وغير مزعج وأكثر استقرارًا لواجب Oncall.



مع ظهور Devops ، يقوم العديد من المهندسين في هذه الأيام بتنظيم التحولات بطريقة أو بأخرى ، والتي كانت ذات مرة واحدة من مسؤولية مسؤولي النظام أو مهندسي الصيانة. المشاهدة ، خاصة خلال ساعات العمل ، ليست مهمة يستمتع بها معظم الناس. يمكن أن يؤدي Duty Oncall إلى تعطيل نومنا ، والتدخل في العمل المعتاد الذي نحاول القيام به خلال النهار والتدخل في حياتنا بشكل عام. مع مشاركة المزيد والمزيد من الفرق في الخدمة ، سألنا أنفسنا ، "ماذا يمكننا ، كأفراد وفرق ومنظمات ، أن نفعل لجعل المهمة أكثر إنسانية واستقرارًا؟"

حافظ على النوم


غالبًا ما يكون أول شيء يفكر فيه الناس عندما يفكرون في الواجب هو أنه سيؤثر سلبًا على نومهم ؛ لا أحد يريد تنبيهًا لإيقاظهم في منتصف الليل. إذا أصبحت مؤسستك أو فريقك كبيرًا بما فيه الكفاية ، يمكنك استخدام دوران "متابعة الشمس" ، عندما تشارك الفرق الموجودة في عدة مناطق زمنية في نفس الدوران ، مع تقصير فترات العمل ، بحيث تكون كل منطقة زمنية في الخدمة فقط خلال ساعات العمل (أو على الأقل الاستيقاظ). يمكن أن يساعد تثبيت مثل هذا التناوب بشكل رائع في تقليل الحمل الليلي الذي يتحمله الضابط المناوب.

إذا لم يكن لديك ما يكفي من المهندسين وتوزيعهم الجغرافي لتوفير دوران "متابعة الشمس" ، فلا يزال هناك شيء يمكنك القيام به لتقليل احتمالية استيقاظ الأشخاص في منتصف الليل دون داعٍ. في النهاية ، إن الخروج من السرير في الساعة الرابعة صباحًا أمر واحد لحل مشكلة ملحة تواجه العميل ؛ يختلف الأمر تمامًا عن الاستيقاظ فقط لاكتشاف أنك تتعامل مع إنذار كاذب. يمكن أن يساعد هذا في التحقق من جميع التنبيهات التي أعددتها واسأل فريقك عن التنبيهات التي تحتاجها لإيقاظ شخص ما بعد ساعات ، وما إذا كانت هذه التنبيهات يمكنها الانتظار حتى الصباح. قد يكون من الصعب إقناع الأشخاص بإيقاف تشغيل بعض التنبيهات غير العاملة ، خاصةً إذا كانت المشاكل الفائتة تسببت في حدوث مشاكل في الماضي ، ولكن من المهم أن تتذكرأن المهندس المحروم من النوم ليس هو المهندس الأكثر فعالية. قم بتعيين هذه التنبيهات لساعات العمل عندما تكون مهمة حقًا. تسمح لك معظم أدوات الإعلام هذه الأيام بإعداد قواعد مختلفة للإعلامات أثناء ساعات التوقف ، سواء كانت فترات إخطار Nagios أو إعداد جداول مختلفة في PagerDuty.

النوم والواجب وثقافة الفريق


ترتبط طرق أخرى لحل مشكلة اضطراب النوم بتغيرات ثقافية أكثر أهمية. إحدى طرق حل هذه المشكلة هي تتبع التنبيهات ، مع إيلاء اهتمام خاص بوقت وصولها وما إذا كانت فعالة. Opsweekly هي أداة تم إنشاؤها ونشرها بواسطة Etsy وتسمح للفرق بتتبع وتصنيف التنبيهات الواردة. يمكنه إنشاء رسوم بيانية توضح عدد التحذيرات التي أيقظت الأشخاص (باستخدام بيانات "حول النوم" من أجهزة تتبع اللياقة البدنية) ، بالإضافة إلى عدد التحذيرات التي تحتاج إلى إجراء من الشخص بالفعل. باستخدام هذه التقنيات ، يمكنك تتبع فعالية دوران واجبك وتأثيره على النوم بمرور الوقت.

يمكن أن يلعب الفريق دورًا في توفير الراحة الكافية لكل ضابط واجب. خلق ثقافة تشجع الناس على الاعتناء بأنفسهم: إذا فقدت النوم بسبب الاتصال في الليل ، يمكنك النوم لفترة أطول في الصباح لمحاولة تعويض الوقت الضائع. يمكن لأعضاء الفريق مراقبة بعضهم البعض: عندما تشارك الفرق معلومات حول نومهم مع بعضهم البعض من خلال شيء مثل Opsweekly ، يمكنهم الذهاب إلى زملائهم في العمل ويقولون ، "مرحبًا ، يبدو أنك قضيت ليلة صعبة مع PagerDuty الليلة الماضية "هل تريدني أن أغطيك الليلة حتى تستريح قليلاً؟" شجع الناس على دعم بعضهم البعض بهذه الطريقة وعدم الموافقة على "ثقافة الأبطال" ، حيث سيصل الناس إلى الحد الأقصى ، وتجنب طلبات المساعدة.

الحد من تأثير نوبات العمل في العمل


عندما يكون المهندسون متعبين لأنهم استيقظوا أثناء الخدمة ، من الواضح أنهم لن يعملوا بنسبة 100٪ خلال النهار ، ولكن حتى بدون مراعاة قلة النوم ، يمكن أن يكون للواجب عواقب أخرى على العمل. ترتبط إحدى أهم الخسائر أثناء العمل بعامل الانقطاع ، وتغير في السياق: يمكن أن يؤدي انقطاع واحد إلى فقدان 20 دقيقة على الأقل بسبب فقدان التركيز وتحويل السياق. من المحتمل أن يكون لفرقك مصادر أخرى للانقطاعات ، مثل التذاكر التي تم إنشاؤها بواسطة فرق أخرى ، أو الطلبات أو الأسئلة الواردة عبر الدردشة و / أو البريد الإلكتروني. اعتمادًا على نطاق هذه المقاطعات الأخرى ، قد تفكر في إضافتها إلى دوران موجود أثناء الخدمة أو إعداد دورة ثانية فقط للتعامل مع هذه الطلبات الأخرى.

من المهم أن تأخذ هذا في الاعتبار عند التخطيط للعمل الذي سيؤديه الفريق ، سواء على المدى الطويل أو القصير. إذا كان فريقك يميل نحو نوبات التحول المكثفة إلى حد ما ، فيجب أن تؤخذ هذه الحقيقة في الاعتبار أثناء التخطيط على المدى الطويل ، حيث قد يكون لديك موقف حيث يشارك جميع الموظفين بفعالية في الخدمة في أي وقت ، وليس في أي عمل آخر. في التخطيط على المدى القصير ، قد تجد أن الضابط المناوب غير قادر على الوفاء بالمواعيد النهائية بسبب واجباته - وهذا أمر متوقع ، وبقية الفريق يجب أن يكونوا مستعدين للتكيف والمساعدة للتأكد من أن العمل قد تم وأن الضابط المناوب يحصل على الدعم في مهام عملهم. بغض النظر عما إذا تم استدعاء المصاحبة ،سيؤثر التغيير في الخدمة على قدرته على القيام بعمل آخر - لا تتوقع أن يعمل المصاحب ليلاً لإكمال المشاريع المخططة بالإضافة إلى العمل خارج الخدمة.

ستحتاج الفرق إلى إيجاد طريقة للتعامل مع العمل الإضافي الناتج عن العمل. يمكن أن يكون هذا العمل عملاً حقيقيًا لإصلاح المشكلات الحقيقية التي تم اكتشافها بواسطة أنظمة المراقبة والتحذير ، أو يمكن أن يكون العمل لإصلاح المراقبة والتنبيهات لتقليل عدد التنبيهات الإيجابية الخاطئة. مهما كانت طبيعة العمل الذي يتم إنشاؤه ، من المهم توزيع هذا العمل بشكل عادل وثابت عبر الفريق. ليست كل المناوبات في العمل متكافئة ، وبعضها أكثر تعقيدًا من البعض الآخر ، وبالتالي ، فإن البيان بأن الشخص الذي تلقى التنبيه هو الشخص المسؤول عن إزالة جميع عواقب هذا التنبيه يمكن أن يؤدي إلى توزيع غير متساو للعمل. قد يكون من المعقول أكثر أن يكون المسؤول مسؤولاً عن جدولة العمل أو توزيعه ، متوقعًاأن بقية الفريق سيكون جاهزًا للمساعدة في إكمال العمل الذي تم إنشاؤه.

(work-life balance)


فكر في تأثير التواجد خارج العمل. عندما تكون في الخدمة ، ستشعر على الأرجح بالارتباط بهاتفك المحمول والكمبيوتر المحمول ، مما يعني أنك تحمل دائمًا كمبيوتر محمولاً وجهاز توجيه محمولًا (مودم USB) معك أو لا تغادر منزلك / مكتبك. يعني كونك في الخدمة عادة التخلي عن أشياء مثل مقابلة الأصدقاء أو العائلة أثناء نوبتك. وهذا يعني أن مدة كل نوبة تعتمد على عدد الأشخاص في فريقك ، ويمكن أن يكون تواتر التحولات عبئًا غير ضروري على الناس. قد تحتاج إلى تجربة مدة وجدول نوباتك للعثور على جدول مناسب لغالبية الأشخاص المعنيين على الأقل ، نظرًا لأن الفرق والأشخاص المختلفين سيكون لديهم أولويات وتفضيلات مختلفة.

من الضروري أن ندرك التأثير الذي سيكون لهذا الواجب على حياة الناس ، سواء على مستوى الإدارة أو على المستوى الفردي. وتجدر الإشارة إلى أن التأثير سيشعر به الأشخاص الذين يتمتعون بامتيازات أقل. على سبيل المثال ، إذا كان عليك قضاء بعض الوقت في رعاية الأطفال أو أفراد الأسرة الآخرين ، أو إذا وجدت أن معظم الأعمال المنزلية تقع على كتفيك ، فأنت لديك بالفعل وقت وطاقة أقل من شخص ليس لديه هذه الواجبات. يميل عمل "الدوام الثاني" أو "الدوام الثالث" إلى التأثير بشكل غير متناسب على الأشخاص ، وإذا قمت بإعداد دورة في الخدمة بجدول زمني أو شدة تفترض أن المشاركين ليس لديهم حياة شخصية خارج المكتب ، فأنت تحد من الأشخاص الذين سيكونون قادرين على المشاركة تحت أمرك.

شجع الناس على محاولة الحفاظ على معظم جدولهم المعتاد. يجب أن تفكر في تزويد الفريق بأجهزة توجيه متنقلة (أجهزة مودم USB) حتى يتمكن الأشخاص من مغادرة المنزل مع أجهزة الكمبيوتر المحمول الخاصة بهم ولا يزال لديهم بعض مظاهر الحياة. شجع الناس على تبادل ساعات العمل مع بعضهم البعض ، إذا لزم الأمر ، لفترات زمنية قصيرة حتى يتمكن الناس من الذهاب إلى صالة الألعاب الرياضية أو زيارة الطبيب أثناء الخدمة. لا تخلق ثقافة حيث يجب أن يعني الواجب أن المهندسين لا يفعلون شيئًا سوى المشاهدة. يعد التوازن بين العمل والحياة الشخصية جزءًا مهمًا من أي وظيفة ، ولكن بشكل خاص عندما تفكر في إجازة العمل ، يجب على الأعضاء القدامى في فريقك أن يكونوا قدوة للآخرين من حيث الموازنة بين العمل والحياة الشخصية ، قدر الإمكان أثناء الخدمة.

على المستوى الفردي ، لا تنس أن تشرح ما يعنيه الواجب لأصدقائك وأفراد عائلتك وشركائك وحيواناتك الأليفة ، وما إلى ذلك (من المرجح أن القطط لا تهتم ، لأنها تستيقظ في الرابعة صباحًا عندما تتلقى تنبيهًا ، على الرغم من أنهم لن يرغبوا بأي حال من الأحوال في مساعدتك في قراره). احرص على تعويض الوقت الضائع بعد انتهاء نوبتك ، سواء كان لقاء الأصدقاء أو العائلة أو على سبيل المثال حلم. إن أمكن ، فكر في إعداد ساعة منبه صامتة (مثل ساعة ذكية) يمكنها إيقاظك من خلال طنين معصمك حتى لا توقظ أي شخص من حولك. ابحث عن طرق للعناية بنفسك عندما تكون في وسط نوبة العمل وعند الانتهاء. قد ترغب في تجميع "مجموعة أدوات البقاء على قيد الحياة" التي تساعدك على الاسترخاء: الاستماع إلى قائمة تشغيل الموسيقى المفضلة لديك ،اقرأ كتابك المفضل أو خصص وقتًا للعب مع حيوانك الأليف. يجب على المديرين تشجيع الرعاية الذاتية من خلال منح الناس يوم عطلة بعد أسبوع من العمل والتأكد من أن الناس يطلبون (ويتلقون) المساعدة عندما يحتاجون إليها.


بشكل عام ، لا يجب أن يُنظر إلى العمل على أنه عمل رهيب فقط: لديك الفرصة والمسؤولية كشخص يشارك في الخدمة من أجل العمل بنشاط لجعلها أفضل للأشخاص الذين سيكونون في الخدمة في المستقبل ، مما يعني أن يتلقى الناس رسائل أقل وسيكونون أكثر دقة. مرة أخرى ، يمكن أن يساعدك تتبع قيمة تنبيهاتك ، باستخدام شيء مثل Opsweekly ، في معرفة ما يجعل واجبك مزعجًا وإصلاحه. بالنسبة للإشعارات غير النشطة ، اسأل نفسك عما إذا كانت هناك طرق للتخلص من هذه الإشعارات - ربما يعني هذا أنها ستعمل فقط خلال ساعات العمل ، لأن هناك بعض الأشياء التي لا تحتاج ببساطة إلى الرد عليها في منتصف الليل. لا تخف من حذف التنبيهات ،تغييرها أو تغيير طريقة الإرسال من "إرسال عبر الهاتف والبريد الإلكتروني" إلى "البريد الإلكتروني فقط". التجريب والتكرار هما مفتاح تحسين الوكالة بمرور الوقت.

بالنسبة إلى التنبيهات الصالحة فعليًا ، يجب مراعاة مدى سهولة قيام المهندس بإكمال الإجراءات اللازمة. يجب أن يحتوي كل تنبيه عمل على دليل تشغيل يأتي معه - فكر في استخدام أداة مثل nagios-herald لإضافة روابط Runbook إلى تنبيهاتك. إذا كان التنبيه بسيطًا للغاية لدرجة أنه لا يحتاج إلى وحدة Runbook ، فمن المحتمل أن يكون بسيطًا بما يكفي بحيث يمكنك أتمتة الاستجابة باستخدام شيء مثل معالجات أحداث Nagios ، مما يحفظ الأشخاص من الاضطرار إلى الاستيقاظ أو المقاطعة للمهام الآلية بسهولة. يمكن لكل من كتب التشغيل و nagios-herald مساعدتك في إضافة سياق قيم إلى تنبيهاتك ، مما يساعد الأشخاص على الاستجابة لهم بشكل أكثر فعالية. نظرةهل يمكنك الإجابة عن أسئلة شائعة مثل: متى كانت آخر مرة تم تشغيل هذا التنبيه؟ من رد عليه آخر مرة ، وما هي الإجراءات التي اتخذوها في نهاية المطاف (إن وجدت)؟ ما التنبيهات الأخرى التي تظهر في نفس الوقت وهل هي مرتبطة؟ غالبًا ما يتم العثور على هذا النوع من المعلومات السياقية فقط في أدمغة الأشخاص ، وبالتالي ، فإن تشجيع ثقافة التوثيق وتبادل المعلومات السياقية يمكن أن يقلل من مقدار النفقات العامة المطلوبة للاستجابة للتحذيرات.لذلك ، فإن تشجيع ثقافة التوثيق وتبادل المعلومات السياقية يمكن أن يقلل من النفقات العامة المطلوبة للاستجابة للتحذيرات.لذلك ، فإن تشجيع ثقافة التوثيق وتبادل المعلومات السياقية يمكن أن يقلل من النفقات العامة المطلوبة للاستجابة للتحذيرات.

جزء كبير من التعب الناتج عن التحولات هو أنها لا تنتهي أبدًا - إذا كان لدى فريقك نوبات ، فمن غير المحتمل أن تنتهي في أي وقت في المستقبل المنظور. لا ينتهي الواجب أبدًا ، وقد نشعر أنها ستكون دائمًا رهيبة. يعد انعدام الأمل مشكلة عقلية كبيرة يمكن أن تساهم في الإجهاد والإرهاق ، لذا فإن التحول إلى التصور (بالإضافة إلى الواقع) بأن كونك في الخدمة سيكون دائمًا رهيبًا هو بداية جيدة لبدء التفكير في واجبك على المدى الطويل.

من أجل إعطاء الناس الأمل في أن الوضع في الخدمة سيتحسن على الإطلاق ، من الضروري أن يكون هناك نظام يمكن ملاحظته (نفس تتبع وتصنيف الواجب ، الذي ذكرته سابقًا). تتبع عدد التحذيرات التي لديك ، وما هي النسبة المئوية التي تتطلب تدخل ضابط واجب ، وكم منهم يوقظ الناس ، ثم يعمل على خلق ثقافة تشجع الناس على القيام بالأشياء بشكل أفضل. إذا كان لديك فريق كبير ، فقد يكون من المغري ، بمجرد أن ينتهي واجبك ، استسلم وقول "هذه هي مشكلة الواجب المستقبلي" ، ولا تتجول لإصلاح شيء ما - الذي يريد أن يبذل المزيد من الجهد في الواجب أكثر منه مطلوب؟ هذا هو المكان الذي يمكن لثقافة التعاطف أن تحدث فيه فرقًا كبيرًا ، لأنك لا تهتم فقط برفاهيتك في العمل ، ولكن أيضًا باهتمام زملائك.

كل شيء عن التعاطف.


التعاطف هو جزء مهم مما يسمح لنا بتحفيز العمل الذي يحسن التجربة أثناء الخدمة. بصفتك مديرًا أو مشاركًا ، يمكنك تقييم الأشخاص بشكل إيجابي أو حتى مكافأتهم على سلوكهم ، مما يجعل الواجب أفضل. دعم الأنظمة (العمليات) هو أحد تلك المجالات التي غالبًا ما يشعر المهندسون فيها بأن الناس لا يهتمون بها إلا عندما يحدث خطأ ما: سيكون الناس هناك للصراخ عليهم عند تعطل الموقع ، لكنهم نادرًا سوف يتعرفون على الجهود التي يبذلونها خارج الشاشة التي يبذلها المهندسون-المشغلون لجعل الموقع يعمل بقية الوقت. يمكن أن يكون الاعتراف بالعمل ذو أهمية كبيرة ، سواء كان امتنانًا لشخص ما في الاجتماع أو في بريد إلكتروني عام لتحسين تنبيه معين ، الجانب الفني للواجب ،أو إعطاء شخص الوقت لاستبدال مهندس آخر لفترة من الوقت.

شجع الناس على قضاء الوقت والجهد لتحسين الوضع في الخدمة على المدى الطويل. إذا كان هناك واجب على فريقك ، يجب عليك التخطيط لهذا العمل وتحديد أولوياته كما تفعل مع أي وظيفة أخرى في خريطة الطريق الخاصة بك. فالواجب هو 90 ٪ من الكون ، وإذا لم تعمل بنشاط لتحسينها ، فسوف تصبح بمرور الوقت أسوأ وأسوأ. اعمل مع فريقك لمعرفة ما يحفز الناس ويشجعهم بشكل أفضل ، ثم استخدمه لتشجيع الناس على تقليل ضوضاء التنبيهات ، وكتابة سجلات التشغيل ، وإنشاء أدوات من شأنها حل مشاكلهم أثناء الخدمة. مهما فعلت ، لا تقبل بالواجب الرهيب ، كجزء ثابت من الموقف.

All Articles