Alertmanager告警收敛
分组(group):将类似性质的警报分类为单个通知
抑制(Inhibition):当警报发出后,停止重复发送由此警报引发的其他警报
静默(Silences):是一种简单的特定时间静音提醒的机制
抑制规则
inhibit_rules: |
场景: 一台服务器上有nginx服务等等其他的服务,某一天服务器挂掉了,那么如果不做抑制的话,就会发送多个告警邮件,这显然不是我们想要的,这个时候,我们可以通过设定级别标签的方式,比如设定服务器挂掉就是一个高级别,而上面的其他服务设定为警告级别,这样我们就可以使用抑制做告警收敛,也就是只发送一个服务器挂掉的警告,其他的服务的警告就被抑制了。
抑制(Inhibition)的一个流程:
1.当alertmanger收到一个告警,告警内容是(alertname=dwon level=high instnace=192.168.0.12:9100 job=linux)
2.抑制处理,会先判断告警中带不带level: 'high’这个标签
3.如果带的话,就抑制level:'warning’这个标签的告警
5.抑制的前提是两条告警中都必须满足相同的标签,此时来了第二条警告是(alertname=dwon level=waring instnace=192.168.0.12:9100)
6.可以看到第二条警告带有level=waring这个标签并且满足相同的标签
7.那么就不发送由这条高级别的警告引发的其他服务的警告
静默配置
192.168.0.12这台服务器在某个时间段要维护,可以使用静默的方式,通过标签的方式去匹配
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 阿哲博客!
评论