Slurm SRE。由Booking.com和Google.com的专家进行的完整实验

我们的团队喜欢实验。每个Slurm都不是先前的静态重复,而是对经验的理解以及从好的过渡到更好的过渡。但是,对于Slerm SRE,我们决定使用全新的格式-为参与者提供尽可能接近“战斗”的条件。


简要概述一下我们所做的工作:“我们构建,破坏,修复,
研究。” 在纯粹的理论上,SRE几乎一文不值-仅实践,实际解决方案,实际问题。


以Dmitry Anatolyevich为例,参加者分成了小组,以确保积极的竞争精神不会让任何人入睡或在iPhone上启动《愤怒的小鸟》。


问题,故障,错误和任务为参与者提供了四位导师。Booking.com(荷兰)的首席开发人员Ivan Kruglov。本·泰勒(Ben Tyler),Booking.com(美国)的首席开发人员。Tungsten Labs(德国)的CTO Eduard Medvedev。Google(旧金山)的知名开发人员Eugene Varavva。


此外,参与者分为团队-并互相竞争。有趣?



, , SRE .


:


, ...


- . ( ), . : « » ; , 10 ; ; 0,1% ; - . -- , SRE .



… .


. — , , , , , , . , , . , .


SLO, SLI, SLA, , , . .


SLO, SLI, SLA
SLI — . SLO — . SLA — .

SLA — ITIL, , , , , .

SLO — : , SLI. SLO «SLI ≤ » « ≤ SLI ≤ ».

SLI — . SLI — . SLI , , , .

, , ...


«» SLO. — , , , DDoS-. , SLO.



«- , , … !»


, error budget, , .


, ...


— , .



«- , , , !»


, . . , ?



.


— , (stakeholders). . .



«- ?!»



SRE. — , . , : , , , . post-mortem.



«- ! — !»


.



— .


Source: https://habr.com/ru/post/undefined/


All Articles