рд╕рднреА рдХреЛ рдирдорд╕реНрдХрд╛рд░ред рдордИ рдореЗрдВ, OTUS рдиреЗ Zabbix, Prometheus, Grafana рдФрд░ ELK рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реБрдП рдмреБрдирд┐рдпрд╛рджреА рдврд╛рдВрдЪреЗ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдФрд░ рд▓реЙрдЧрд┐рдВрдЧ рдкрд░ рдПрдХ рдХрд╛рд░реНрдпрд╢рд╛рд▓рд╛ рд╢реБрд░реВ рдХреА ред рдЗрд╕ рд╕рдВрдмрдВрдз рдореЗрдВ, рд╣рдо рдкрд╛рд░рдВрдкрд░рд┐рдХ рд░реВрдк рд╕реЗ рд╡рд┐рд╖рдп рдкрд░ рдЙрдкрдпреЛрдЧреА рд╕рд╛рдордЧреНрд░реА рд╕рд╛рдЭрд╛ рдХрд░рддреЗ рд╣реИрдВред
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдХреЗ рд▓рд┐рдП рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдЖрдкрдХреЛ HTTP, HTTPS, DNS, TCP, ICMP рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдмрд╛рд╣рд░реА рд╕реЗрд╡рд╛рдУрдВ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ, рдореИрдВ рдЖрдкрдХреЛ рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ HTTP / HTTPS рдореЙрдирд┐рдЯрд░рд┐рдВрдЧ рдХреЛ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░рдиреЗ рдХрд╛ рддрд░реАрдХрд╛ рджрд┐рдЦрд╛рдКрдВрдЧрд╛ред рд╣рдо рдХреБрдмреЗрд░рдиреЗрдЯреНрд╕ рдореЗрдВ рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рд▓реЙрдиреНрдЪ рдХрд░реЗрдВрдЧреЗредрд╡рд╛рддрд╛рд╡рд░рдг
рд╣рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрдЧреА:- Kubernetes
- рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдСрдкрд░реЗрдЯрд░
рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди
рд╣рдо рд╡реЗрдм рд╕реЗрд╡рд╛рдУрдВ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдореЙрдбреНрдпреВрд▓ ConfigMap
рдХреЛ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдХреЛ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ http
рдХрд░рддреЗ рд╣реИрдВредapiVersion: v1
kind: ConfigMap
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
data:
blackbox.yaml: |
modules:
http_2xx:
http:
no_follow_redirects: false
preferred_ip_protocol: ip4
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
рдореЙрдбреНрдпреВрд▓ рдХрд╛ http_2xx
рдЙрдкрдпреЛрдЧ рдпрд╣ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рд╡реЗрдм рд╕реЗрд╡рд╛ HTTP 2xx рд╕реНрдерд┐рддрд┐ рдХреЛрдб рд▓реМрдЯрд╛рддреА рд╣реИред рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдХреЗ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдХреЛ рдкреНрд░рд▓реЗрдЦрди рдореЗрдВ рдЕрдзрд┐рдХ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╡рд░реНрдгрд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ редKubernetes рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рддреИрдирд╛рдд рдХрд░реЗрдВ
рд╡рд░реНрдгрди рдХрд░реЗрдВ Deployment
рдФрд░ Service
рдХреБрдмреЗрд░рдиреЗрдЯреНрд╕ рдореЗрдВ рддреИрдирд╛рддреА рдХреЗ рд▓рд┐рдПред---
kind: Service
apiVersion: v1
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
type: ClusterIP
ports:
- name: http
port: 9115
protocol: TCP
selector:
app: prometheus-blackbox-exporter
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: prometheus-blackbox-exporter
labels:
app: prometheus-blackbox-exporter
spec:
replicas: 1
selector:
matchLabels:
app: prometheus-blackbox-exporter
template:
metadata:
labels:
app: prometheus-blackbox-exporter
spec:
restartPolicy: Always
containers:
- name: blackbox-exporter
image: "prom/blackbox-exporter:v0.15.1"
imagePullPolicy: IfNotPresent
securityContext:
readOnlyRootFilesystem: true
runAsNonRoot: true
runAsUser: 1000
args:
- "--config.file=/config/blackbox.yaml"
resources:
{}
ports:
- containerPort: 9115
name: http
livenessProbe:
httpGet:
path: /health
port: http
readinessProbe:
httpGet:
path: /health
port: http
volumeMounts:
- mountPath: /config
name: config
- name: configmap-reload
image: "jimmidyson/configmap-reload:v0.2.2"
imagePullPolicy: "IfNotPresent"
securityContext:
runAsNonRoot: true
runAsUser: 65534
args:
- --volume-dir=/etc/config
- --webhook-url=http:
resources:
{}
volumeMounts:
- mountPath: /etc/config
name: config
readOnly: true
volumes:
- name: config
configMap:
name: prometheus-blackbox-exporter
рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдХреЛ рдирд┐рдореНрди рдЖрджреЗрд╢ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рддреИрдирд╛рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдирд╛рдо рд╕реНрдерд╛рди monitoring
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдСрдкрд░реЗрдЯрд░ рдХреЛ рд╕рдВрджрд░реНрднрд┐рдд рдХрд░рддрд╛ рд╣реИредkubectl --namespace=monitoring apply -f blackbox-exporter.yaml
рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░реЗрдВ рдХрд┐ рд╕рднреА рд╕реЗрд╡рд╛рдПрдБ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрдорд╛рдВрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЪрд▓ рд░рд╣реА рд╣реИрдВ:kubectl --namespace=monitoring get all --selector=app=prometheus-blackbox-exporter
рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдЪреЗрдХ рдХрд░реЗрдВ
рдЖрдк рдирд┐рд░реНрдпрд╛рддрдХ рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рд╡реЗрдм рдЗрдВрдЯрд░рдлреЗрд╕ рдХреЛ рдЗрд╕рдХреЗ рд╕рд╛рде рдПрдХреНрд╕реЗрд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ port-forward
:kubectl --namespace=monitoring port-forward svc/prometheus-blackbox-exporter 9115:9115
рдХрдиреЗрдХреНрдЯ рдПрдХ рд╡реЗрдм рдмреНрд░рд╛рдЙрдЬрд╝рд░ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдирд┐рд░реНрдпрд╛рддрдХ рдХреЗ Blackbox рд╡реЗрдм рдЗрдВрдЯрд░рдлреЗрд╕ рдкрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрдерд╛рдиреАрдп рд╣реЛрд╕реНрдЯ 9115:ред
рдпрджрд┐ рдЖрдк http: // localhost: 9115 / рдЬрд╛рдВрдЪ рдХреЗ рдкрддреЗ рдкрд░ рдЬрд╛рддреЗ рд╣реИрдВ ? рдореЙрдбреНрдпреВрд▓ = http_2xx рдФрд░ рд▓рдХреНрд╖реНрдп = https: //www.google.com , рдЖрдкрдХреЛ рдирд┐рд░реНрджрд┐рд╖реНрдЯ URL ( https://www.google.com ) рдХреА рдЬрд╛рдБрдЪ рдХрд░рдиреЗ рдХрд╛ рдкрд░рд┐рдгрд╛рдо рджрд┐рдЦрд╛рдИ рджреЗрдЧрд╛ ред 1 рдХрд╛
рдПрдХ рдореАрдЯреНрд░рд┐рдХ probe_success
рдореВрд▓реНрдп рдПрдХ рд╕рдлрд▓ рдЬрд╛рдБрдЪ рдХрд╛ рдЕрд░реНрде рд╣реИред 0 рдХрд╛ рдорд╛рди рдХрд┐рд╕реА рддреНрд░реБрдЯрд┐ рдХреЛ рдЗрдВрдЧрд┐рдд рдХрд░рддрд╛ рд╣реИредрдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдХреА рд╕реНрдерд╛рдкрдирд╛
рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдХреЛ рддреИрдирд╛рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдХреЛ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ prometheus-additional.yaml
ред- job_name: 'kube-api-blackbox'
scrape_interval: 1w
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets:
- https:
- http:
- https:
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
Secret
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрдорд╛рдВрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЙрддреНрдкрдиреНрди рдХрд░реЗрдВ редPROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
additional-scrape-configs
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдСрдкрд░реЗрдЯрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░реЗрдВ additionalScrapeConfigs
редkubectl --namespace=monitoring edit prometheuses k8s
...
spec:
additionalScrapeConfigs:
key: prometheus-additional.yaml
name: additional-scrape-configs
рд╣рдо рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╡реЗрдм рдЗрдВрдЯрд░рдлреЗрд╕ рдореЗрдВ рдЬрд╛рддреЗ рд╣реИрдВ, рдореИрдЯреНрд░рд┐рдХреНрд╕ рдФрд░ рд▓рдХреНрд╖реНрдпреЛрдВ рдХреА рдЬрд╛рдВрдЪ рдХрд░рддреЗ рд╣реИрдВредkubectl --namespace=monitoring port-forward svc/prometheus-k8s 9090:9090

рд╣рдо рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдХреЗ рдореИрдЯреНрд░рд┐рдХреНрд╕ рдФрд░ рд▓рдХреНрд╖реНрдп рджреЗрдЦрддреЗ рд╣реИрдВредрд╕реВрдЪрдирд╛рдУрдВ рдХреЗ рд▓рд┐рдП рдирд┐рдпрдо рдЬреЛрдбрд╝рдирд╛ (рдЕрд▓рд░реНрдЯ)
рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рд╕реЗ рд╕реВрдЪрдирд╛рдПрдВ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рдСрдкрд░реЗрдЯрд░ рдХреЛ рдирд┐рдпрдо рдЬреЛрдбрд╝реЗрдВредkubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: blackbox-exporter
rules:
- alert: ProbeFailed
expr: probe_success == 0
for: 5m
labels:
severity: error
annotations:
summary: "Probe failed (instance {{ $labels.instance }})"
description: "Probe failed\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
- alert: SlowProbe
expr: avg_over_time(probe_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow probe (instance {{ $labels.instance }})"
description: "Blackbox probe took more than 1s to complete\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
- alert: HttpStatusCode
expr: probe_http_status_code <= 199 OR probe_http_status_code >= 400
for: 5m
labels:
severity: error
annotations:
summary: "HTTP Status Code (instance {{ $labels.instance }})"
description: "HTTP status code is not 200-399\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
- alert: SslCertificateWillExpireSoon
expr: probe_ssl_earliest_cert_expiry - time() < 86400 * 30
for: 5m
labels:
severity: warning
annotations:
summary: "SSL certificate will expire soon (instance {{ $labels.instance }})"
description: "SSL certificate expires in 30 days\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
- alert: SslCertificateHasExpired
expr: probe_ssl_earliest_cert_expiry - time() <= 0
for: 5m
labels:
severity: error
annotations:
summary: "SSL certificate has expired (instance {{ $labels.instance }})"
description: "SSL certificate has expired already\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
- alert: HttpSlowRequests
expr: avg_over_time(probe_http_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "HTTP slow requests (instance {{ $labels.instance }})"
description: "HTTP request took more than 1s\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
- alert: SlowPing
expr: avg_over_time(probe_icmp_duration_seconds[1m]) > 1
for: 5m
labels:
severity: warning
annotations:
summary: "Slow ping (instance {{ $labels.instance }})"
description: "Blackbox ping took more than 1s\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╡реЗрдм рдЗрдВрдЯрд░рдлреЗрд╕ рдореЗрдВ, рд╕реНрдЯреЗрдЯрд╕ => рдирд┐рдпрдореЛрдВ рдкрд░ рдЬрд╛рдПрдВ рдФрд░ рдмреНрд▓реИрдХрдмреЙрдХреНрд╕-рдирд┐рд░реНрдпрд╛рддрдХ рдХреЗ рд▓рд┐рдП рдЕрд▓рд░реНрдЯ рдирд┐рдпрдо рдЦреЛрдЬреЗрдВред
Kubernetes API рд╕рд░реНрд╡рд░ SSL рдкреНрд░рдорд╛рдгрдкрддреНрд░ рд╕рдорд╛рдкреНрддрд┐ рд╕реВрдЪрдирд╛рдПрдБ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ
рдЪрд▓рд┐рдП рдХреБрдмреЗрд░рдиреЗрдЯреНрд╕ рдПрдкреАрдЖрдИ рд╕рд░реНрд╡рд░ рдПрд╕рдПрд╕рдПрд▓ рдкреНрд░рдорд╛рдгрдкрддреНрд░реЛрдВ рдХреА рд╕рдорд╛рдкреНрддрд┐ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХрд░рддреЗ рд╣реИрдВред рд╡рд╣ рд╕рдкреНрддрд╛рд╣ рдореЗрдВ рдПрдХ рдмрд╛рд░ рд╕реВрдЪрдирд╛рдПрдВ рднреЗрдЬреЗрдЧрд╛редKubernetes API рд╕рд░реНрд╡рд░ рдкреНрд░рдорд╛рдгреАрдХрд░рдг рдХреЗ рд▓рд┐рдП рдмреНрд▓реИрдХрдмреЙрдХреНрд╕ рдирд┐рд░реНрдпрд╛рддрдХ рдореЙрдбреНрдпреВрд▓ рдЬреЛрдбрд╝реЗрдВредkubectl --namespace=monitoring edit configmap prometheus-blackbox-exporter
...
kube-api:
http:
method: GET
no_follow_redirects: false
preferred_ip_protocol: ip4
tls_config:
insecure_skip_verify: false
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
valid_http_versions:
- HTTP/1.1
- HTTP/2
valid_status_codes: []
prober: http
timeout: 5s
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╕реНрдХреНрд░реЗрдк рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдЬреЛрдбрд╝рдирд╛- job_name: 'kube-api-blackbox'
metrics_path: /probe
params:
module: [kube-api]
static_configs:
- targets:
- https:
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: prometheus-blackbox-exporter:9115 # The blackbox exporter.
рдкреНрд░реЛрдореЗрдерд┐рдпрд╕ рд╕реАрдХреНрд░реЗрдЯ рд▓рд╛рдЧреВ рдХрд░реЗрдВPROMETHEUS_ADD_CONFIG=$(cat prometheus-additional.yaml | base64)
cat << EOF | kubectl --namespace=monitoring apply -f -
apiVersion: v1
kind: Secret
metadata:
name: additional-scrape-configs
type: Opaque
data:
prometheus-additional.yaml: $PROMETHEUS_ADD_CONFIG
EOF
рдЕрд▓рд░реНрдЯ рдирд┐рдпрдо рдЬреЛрдбрд╝реЗрдВkubectl --namespace=monitoring edit prometheusrules prometheus-k8s-rules
...
- name: k8s-api-server-cert-expiry
rules:
- alert: K8sAPIServerSSLCertExpiringAfterThreeMonths
expr: probe_ssl_earliest_cert_expiry{job="kube-api-blackbox"} - time() < 86400 * 90
for: 1w
labels:
severity: warning
annotations:
summary: "Kubernetes API Server SSL certificate will expire after three months (instance {{ $labels.instance }})"
description: "Kubernetes API Server SSL certificate expires in 90 days\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
рдЙрдкрдпреЛрдЧреА рдХрдбрд╝рд┐рдпрд╛рдБ
рдирд┐рдЧрд░рд╛рдиреА рдФрд░ рдбреЙрдХрд┐рдВрдЧ рдореЗрдВ рд▓реЙрдЧрд┐рдВрдЧ