Alertmanager告警利器

安装包下载

地址2：https://github.com/prometheus/alertmanager/releases

使用步骤：

部署Alertmanager
配置告警接收人
配置Prometheus与Alertmanager通信
在Prometheus中创建告警规则

部署Alertmanager （端口9093）

#解压安装
tar -zxf alertmanager-0.21.0.linux-amd64.tar.gz 
mv alertmanager-0.21.0.linux-amd64 /opt/monitor/alertmanager
#配置为系统管理服务
vim /usr/lib/systemd/system/alertmanager.service 
[Unit]
Description=alertmanager
[Service]
ExecStart=/opt/monitor/alertmanager/alertmanager --config.file=/opt/monitor/alertmanager/alertmanager.yml
ExecReload=/bin/kill -HUP $MAINPID
KillMode=process
Restart=on-failure
[Install]
WantedBy=multi-user.target
#加载服务配置启动，开机启动
systemctl daemon-reload 
systemctl start alertmanager
systemctl enable alertmanager

配置Prometheus与Alertmanager通信并配置告警接收人

alertmanager工作目录下配置

vim /opt/monitor/alertmanager/alertmanager.yml

global:
 resolve_timeout: 5m
# 邮箱服务器
 smtp_smarthost: 'smtp.sina.com:25'
 smtp_from: 'lz13753705474@sina.com'
 smtp_auth_username: 'lz13753705474@sina.com'
 smtp_auth_password: '0b06987008049d86'
 smtp_require_tls: false
 # 配置路由树
route:
 group_by: ['alertname'] # 根据告警规则名称进行分组
 group_wait: 10s # 分组内第一个告警等待时间，10s内如有第二个告警会合并一个告警
 group_interval: 10s # 发送新告警间隔时间
 repeat_interval: 10m # 重复告警间隔发送时间,建议根据情况而定，一般10分钟左右
 receiver: 'mail'
 # 接收人
receivers:
- name: 'mail'
  email_configs:
  - to: '1437626743@qq.com'

配置完成后，重启服务

systemctl start alertmanager

在Prometheus中创建告警规则

vim /opt/monitor/prometheus/prometheus.yml

启用告警配置

alerting:
  alertmanagers:
  - static_configs:
    - targets:
       - 127.0.0.1:9093

这个目录就是一个相对路径

rule_files:
   - "rules/*.yml"

创建告警规则目录rules以及创建告警规则文件node.yml

mkdir /opt/monitor/prometheus/rules
cd /opt/monitor/prometheus/rules
vim node.yml

groups:
- name: example #告警规则组名称
  rules:
  # 任何实例5分钟内无法访问发出告警
  - alert: InstanceDown # 告警规则名称
    expr: up == 0 # 基于PromQL的触发条件
    for: 1m # 等待评估时间
    labels: # 自定义标签
      severity: page
    annotations: # 指定附加信息
      summary: " {{ $labels.instance }} 停止工作"
      description: "{{ $labels.instance }}：job {{ $labels.job }} 已经停止5分钟以
上."