板上的大大们好
小弟我最近要做系统服务的死活监控
监控的项目包含
httpd snmp named nginx redis-server node mysqld mongod PM2 memcached
服务都有加上enable自动启动
为了保险
写了一只script 确认运作期间的状态
systemctl status $line | grep running && echo "$line OK" || echo "$line error
!"
但是考虑到服务hang住
或是重启一直失败之类的状况
想请教除了我这种使用systemctl及service status的方式
或是telnet确认port状态 , wget针对网页服务测试
还有没有别的方式呢?
nagios ? 你大概需要这种监视服务只是老实说稍微复杂,不是非常易用的软件
作者:
lantw44 (#######################)
2017-11-15 13:23:00systemd service 档案有个 Restart= 选项可以自动服务可以先用 man systemd.service 看看这功能是否适合使用再用 systemctl edit 把 Restart= 参数加上去是正常的,因为 systemctl edit 的作法是在/etc/systemd/system 底下建一个资料夹在里面写 .conf 档这样就不会直接动到 service 档,更新时才不会被覆写掉改完可以用 systemctl cat 看到一个服务有多少这种档案
作者:
kojj (我先想想)
2017-11-15 15:05:00Ubuntu 有一个monit 的套件,默认就可以监控httpd等常用服务范例说明 goo.gl/WEkmyMcentos 也有这套件 goo.gl/qd8js8
svscannagios 装起来一堆写好的 plugin 随插即用 哪里困难阿
作者:
soem (æµæ°´)
2017-11-16 01:25:00munin + monit
supervisord...怎么没人提呢?跟systems 是同类的东西,如果只是要重启够用了,有web gui跟导log的功能,不过你这么多服务,学个经典的nagios啊,接口是有点阳春,但是你提到的那些全部都有现成的plugin,上手后随插即用
mongod异常退出的话,是无法直接重启的,因为会被lock file卡住,要先下完 --repair 才有办法重新打开
作者:
suaw (suaw)
2017-11-28 04:37:00keepalived 运用在NGINX httpd应该是没问题,其他服务没试过,给您参考