فك تشفير تقرير 2016 من فيتالي ليفتشينكو "رصد بروميثيوس لتطبيقات الخدمات الصغيرة"
بروميثيوس ، على عكس الأنظمة الكلاسيكية ، يجعل من السهل رفع والحفاظ على مراقبة الأنظمة سريعة التغير والمنظمة المعقدة. سأتحدث عن تجربة التنفيذ والمزالق والسلوك غير المتوقع ، وأظهر كيفية تكوين النظام بأكمله بسرعة ، بما في ذلك الإشعارات ولوحات المعلومات.

بالإضافة إلى المشاكل الكلاسيكية لرصد تطبيق متجانسة ، تخلق الخدمات الدقيقة مجموعة من الصداع الجديد للمراقبة. يتغير موقع الخدمات باستمرار ، وغالبًا ما تظهر خدمات جديدة ، وتتغير التبعيات فيما بينها ، وتعمل الوظائف المؤقتة في مكان عشوائي - يختفي مفهوم التكوين المستقر. يختفي مفهوم الإنتاج: في بيئة واحدة ، يتم إطلاق العديد من الإصدارات لخدمة واحدة - أثناء النشر ، لشرائح مختلفة من الجمهور ، للاختبارات ، إلخ. يميل المطورون ، على مرأى من هذه السعادة ، إلى تحسين التطبيق بسرعة ، وإنشاء العديد من المقاييس الجديدة ، وقتل المقاييس القديمة باستمرار ، وعلى الرغم من ذلك ، يتوقعون مراقبة فعالة وردود فعل للمشكلات الجديدة.
Prometheus Google Borgmon , . , , — . — , . — .
, Prometheus .

, , , . , . Prometheus , . :

. . . .
, , developer. . . .

, , , .

? . . docker. , , , .

, . . , . , , – . ? , – . , production .

– production . production 10 . , continuous delivery. stages. . . .

, . . .
, . , , .
. , – . , - environments – . stage environment, environment, production.
, , . . , 20 , .

. The twelve factor app – Production. , , . – .

, .
. . . , , , . – . . . . , . . , . . .
– . . , , , Graphite, StatsD. , , push based, . .
– , , . . , , .

, , . , . Graphite, . . , 100 000 – . – , 100 000 . – . , 21 . , , , .

production Zabbix - ? . – . . . Zabbix – , . . , .
, . , , Zabbix . Nagios . , , . . . , , - .
, , , . Zabbix . , , Redis. .

, , . InfluxDB . . Graphite, InfluxDB , , .
InfluxDB , . . production. . . , . . .
, . , , . . . (?) . . .
, , , . . . , . . , – . .
Riemann . : « CPU ». CPU – 100 %, 0 %. .
– , CollectD . , . InfluxDB. - , - , - , CollectD , . , , .
InfluxDB , time-series , .

Prometheus. ?
Google, , , Google Borgmom, , Facebook. , , , . . .
, . . production ( , , , ) , . . Prometheus .
. . Prometheus , . .
, . deprecate- . Grafana. Grafana , .
, Prometheus . . . . , 20 000 – . 24- 400 000 . 3 , 1 200 000. .
production . - . , . . , - .

, , , . . . environment. server, . handler . . . Prometheus . , .
, , . , , , . . , . .
? . : « environment , ». .
. - , , . , , , – .

Prometheus , . . , .
. . , 4 . . , . Zookeeper, , … 95 % , 20 100 %. . – . . . , .

- pull metrics push metrics. , pull metrics .

StatsD – Graphite, . StatsD , . . .
, exporter . , , 50 000 . . , , production, .
StatsD exporter Prometheus . StatsD, StatsD, gauge etc, .
push gateway push’. Prometheus. StatsD, push gateway .

. , Prometheus, , . . . , , . . Amazon, Kubernetes, Mesos, Consul . . . , .
, Ansible, . . . - , , , . , Prometheus. reload , .
, . , , . javascript . , . .

. - .
Prometheus . . open source. , Postgres exporter – , . Node exporter, .
, . , . , . .
systemd. .

, . , .
. , . . , , . , , . Prometheus . . . Influx, .
. .

. , - , . , , . – –rm – r <storage path/*
. . . , , production. , , .
federation, , federation , .
. . . Prometheus . .
openTSDB . , . openTSDB , , , , Hadoop.

, , , , histogram summary. , .
, , 100 – . 100 300 – . , 300 – . histogram. , … , , , . . . , histogram , . 10 , 10 . - . , recording rules. , , . , .
Summary – . Summary . Summary , . , , , . . , . , 99- , , . . , . .
summary . . . , .
-. . .

? ? , , , :
- . , , . . , latency , , . 99 % . , , - . . .
- .
- .
- .
- + .

?
- . , . . 10 , 10 , 10 , . ( Service Discovery)
- , . Grafana . , . : « ». 10 . , . . , , .
- – , . . . . , , , , .
- – , , , , .
- , Prometheus . . , Prometheus docker. . . – . . .
! ! Zabbix. , . , . , , Zabbix. environment, ?
. – environment, . ( Kubernetes Service Discovery)
. ., , developer, ? . . environment?
.
environment?
environment. environment. environment. , environment, stable – environment. ( Kubernetes Service Discovery)
, . . . - , , . , - . . . , - , , . , ?
Zabbix production, , . , , , -. full time , . Zabbix, , , 3-4- . 3-4- , Zabbix – . .
, 3 Zabbix?
.
. . developers Prometheus?
.
? ?
.
. environment, - sender, Prometheus .
sender. Prometheus . API http’, . Consul, Prometheus , . .
. , , - Prometheus?
, . .
. docker’, , , , - , . overhead, . . . , ?
?
.
health handler, . , , . , , .
! ! 4 . StatsD, , , . StatsD, Influx’ Telegraf?
, StatsD, Influx.
Ok. , Grafana . , . Go, . , .
open source, .
GitHub , . . federation, ?
, . .
Ok. -?
, .
, . ? ?
. , . 100 000 . , 200 000-300 000. , , , , . Zabbix, . Influx , . . , queries .
?
?
, - , , .
, - . , . . .