[心得] 监控服务 Gatus 系统架构

楼主: appleboy46 (小恶魔)   2022-07-28 21:37:40
部落格: https://bit.ly/gatus-blog
投影片: https://bit.ly/gatus-slide
今年第一场公开的演讲 2022 台湾云端大会,台湾五月开始疫情变严重,故延迟了一次到
七月才举办,这次带给大家的是‘自动化监控网站运行服务 – Gatus’,内容可以拆为
两个部分,第一部分是介绍为什么要使用 Gatus,用来解决开发团队哪些问题,我也整理
了三大点为什么我选择 Gatus,另一部分就是本篇的主轴,Gatus 系统架构跟流程。
1. 监控条件 (客制化回应)
2. 开源专案 (Go 语言)
3. 简易页面 (Status Page)
对于使用 Gatus 有兴趣的朋友可以参考我之前写的文章:‘自动化监控网站运行服务 -
Gatus’,本篇就不介绍怎么使用 Gatus 了。
https://i.imgur.com/bG24JxH.png
看完系统流程后,你一定会问,怎么确保系统稳定性,可否一次跑两个或多个 Instance
呢?如果 Endpoint 很多个,会不会有系统不稳定呢?大家可以看看这里的讨论串,由于
架构变动太大,大家只提出自己的想法,最后要实作可能要靠作者,那底下我自己提供一
个解法
https://i.imgur.com/mvEGMva.png
上面架构其实要考虑的层面很多,包含怎么设计设定档 (YAML) 等,底下列出 3 大点让
大家想看看怎么实作
1. 确保每台 Agent 不会拿到重复 Endpoint
2. 当 Endpoint 有变化时,如何通知 Agent 关闭
3. 处理 Server 及 Agent graceful shutdown 机制
作者: YorkLai (Orange)   2022-07-28 23:56:00
推!
作者: neo5277 (I am an agent of chaos)   2022-07-28 23:56:00
先推
作者: niceguy (niceguy)   2022-07-29 10:34:00
作者: luckyowl (鲁蛇不能亡)   2022-07-31 12:01:00

Links booklink

Contact Us: admin [ a t ] ucptt.com