[心得] 自动化监控网站运行服务 - Gatus

楼主: appleboy46 (小恶魔)   2022-03-27 06:47:13
部落格: https://bit.ly/docker-gatus
影片: https://www.youtube.com/watch?v=Fdgp3NpsPIs
## 前言
不知道大家在部署网站后,怎么明确让大家清楚知道现在网站的运行状况,就像 GitHub
就是提供整体运行的网页,监控常用的操作指令,像是 Git Operations, Webhooks 或
GitHub Actions 等服务状况。让开发者遇到问题的时候,可以即时查看现在状态做出相
对应动作。而类似这样的线上服务很多,像是 Atlassian 的 Statuspage 或 PingPong
等,更多免费服务可以直接参考 awesome-status-pages。而本篇要介绍一套开源软件
Gatus,它是用 Go 语言撰写出来的,非常轻量。
## 什么是 Gatus
Gatus 提供一个轻量的监控服务健康网页,让开发者透过简单的 HTTP, ICMP, TCP 等
Protocol 来监控服务状况,并且根据网页回应的 Status Code 或 Response time 及
Body 内容来决定网站是否健康,如果发生异常,可以设定不同的 Alert 像是 Slack,
Email, Teams, Discord 或 Telegram 等常用的即时软件。可以参考此连结看看
Dashboard 实际状况。
## 为什么选择 Gatus
> Why would I use Gatus when I can just use Prometheus, Alertmanager,
Cloudwatch or even Splunk?
第一点各位开发者可以想看看,如何监控整个服务的状况,而不是等到客户遇到问题,你
才知道状况的发生。而 Gatus 可以从客户角度对每个功能进行配置检查,团队可以根据
重要的服务或接口进行监控,即时数据整理,才可以让团队比客户更早知道状况。
第二点团队可以想看看,如果从 Prometheus 开始入手,是不是门槛过高,团队真的有多
余的时间跟人力可以做到完整的监控,用 Prometheus + Alert 到 Grafana 监控页面,
需要花费不少时间跟人力才能完成,而这些指标,真的是客户想看到的吗?以及是否可以
正确收到警报,这些配置都需要层层关卡,而 Gatus 透过简单的设定,让团队可以快速
监控整个服务,即时的通知设定,都可以在几个小时内完成。
## 心得
我选择此套原因就是简单设定跟方便部署,除了监控网站服务之外,测试团队其实可以拿
这套,去写大量的测试监控所有服务及效能,光是这点就可以替团队省下不少时间做测试
。另外每个服务还可以看到 response time 结果。
中间省略一段安装及使用说明,详细可以参考部落格: https://bit.ly/docker-gatus
作者: safe (safe)   2022-03-27 09:52:00
老板最在意的免费要嗨赖起来呀
作者: ss8651twtw (linsc04)   2022-03-27 11:06:00
实用推
作者: ptta (ptta)   2022-03-27 15:22:00
感谢分享
作者: OrzOGC (洞八达人.拖哨天王)   2022-03-27 15:27:00
免钱的最贵啊
作者: jamo (hi)   2022-03-27 18:02:00
免费真的最贵~
作者: BignoZe (BignoZe)   2022-03-27 18:24:00
免钱的最贵不是这样用的啦XD
作者: roccqqck (ccqq)   2022-03-27 22:09:00
实用
作者: Esh   2022-03-28 00:07:00
目前用Zabbix达到同样目的
作者: superpandal   2022-03-28 01:48:00
现在一堆人赖以为生的都是免费的 经验有延续值得 没有遇到了被就轰炸 XD
作者: s51507   2022-03-31 21:01:00
推分享

Links booklink

Contact Us: admin [ a t ] ucptt.com