更多详细内容请参考:《Linux运维篇:Linux系统运维指南》
由于业务系统的特殊性,我们需要面对不同的客户部署业务系统,监控作为重要的一环,为了更快捷有效的部署业务监控系统,这里编写了基于x86_64架构一键离线docker容器版监控系统工具。
1.1、包含监控组件如下所示:
1.2、监控组件容器镜像如下所示:
1.3、grafana dashboard模板及prometheus rules文件如下所示:
一键部署工具实现功能如下:
1、支持单机部署(1 node-exporter + 1 blackbox-exporter +1 prometheus + 1 grafana + 1 alertmanager + 1 webhook-dingtalk)。
2、支持多机部署(N个 node-exporter + 1 blackbox-exporter +1 prometheus + 1 grafana + 1 alertmanager + 1 webhook-dingtalk)。
3、支持数据目录、端口、Grafana管理平台用户密码的灵活配置。
4、支持blackbox-exporter、prometheus、grafana、alertmanager、webhook-dingtalk配置文件持久化。
5、 grafana无需手动添加datasource数据源,无需手动导入dashboard。同时也介绍了另外两个不错的模板,你也可以手动导入。
6、支持 支持磁盘、内存、cpu、网络、ssl证书、端口、http或https页面等告警通知。
7、支持 钉钉群告警通知。
8、支持部署、启动、停止、卸载、检测等操作。
注意事项:
1、node-exporter服务在 所有被监控的主机上部署。
2、blackbox-exporter、prometheus、grafana、alertmanager、webhook-dingtalk可以部署在同一台主机上,也可以分开部署。
基于x86_64架构CPU使用docker-compose一键离线部署prometheus+grafana+alertmanager之监控告警系统工具
说明:这里就只演示,在一台主机上一键部署监控系统。
要想实现钉钉群告警通知,需要创建钉钉群,并申请钉钉告警机器人。你也可以参考钉钉开放平台官方文档进行操作。
2、编辑变量文件
如下图所示:
3、执行一键部署
执行结果,如下图所示:
说明:如果是只适用于为某一个固定业务系统部署的监控,那么可以在变量文件中定义这些监控目标,但是考虑到要符合所有业务系统,这里并没有写死,而是提供更灵活性的配置。
2、修改node-exporter.json文件
3、修改blackbox-exporter-http/blackbox-exporter.json文件
4、修改blackbox-exporter-tcp/blackbox-exporter.json文件
5、修改blackbox-exporter-icmp/blackbox-exporter.json文件
说明:如果你想要导入其它dashborad,请通过grafana官网下载。
4.5.1、node_exporter模板
4.5.2、blackbox_exporter模板
.