感谢您发送咨询!我们的团队成员将很快与您联系。
感谢您发送预订!我们的团队成员将很快与您联系。
课程大纲
高级警报简介
- IT 系统中警报的关键原则
- Prometheus Alertmanager 概述
- Grafana 中的警报功能
创建高级警报规则
- 在 Prometheus 中定义告警规则
- 对警报使用标签和注释
- 分组和沉默策略
将 Alertmanager 与外部系统整合
- 为外部整合配置 Webhook
- 与 Slack、PagerDuty 和电子邮件系统等工具集成
- 自定义 Alertmanager 范本
自动回应警报
- 实施自动修复工作流
- 与编排工具集成(例如 Ansible、Kubernetes)
- 使用脚本自动解决问题
在 Grafana 中可视化警报
- 在 Grafana 中设置警报面板
- 自定义警报通知和阈值
- 监控警报状态的最佳实践
管理高容量警报
- 有效处理警报风暴
- 优化 Prometheus 告警性能
- ScalaAlertmanager 的可靠性注意事项
缩放和高级技术
- 使用 Prometheus 和 Alertmanager 的分散式告警设置
- 与基于云的警报解决方案集成
- 探索 Grafana 和 Prometheus 生态系统中的新功能
总结和后续步骤
要求
- 对 Grafana 和 Prometheus 的基本经验
- 了解 IT 监控概念
- 熟悉自动化脚本或程式设计
观众
- DevOps 名工程师
- 网站可靠性工程师 (SRE)
14 小时
客户评论 (2)
何塞是一位引人入胜的教练,我很感激他必须留下来等待。
Phil - Federal Court of Australia
课程 - Prometheus Fundamentals
机器翻译
Real world knowledge from someone in the industry