[问题] 想做服务监控自动重启

楼主: chabaterii09 (小豆子)   2017-11-15 10:48:34
板上的大大们好
小弟我最近要做系统服务的死活监控
监控的项目包含
httpd snmp named nginx redis-server node mysqld mongod PM2 memcached
服务都有加上enable自动启动
为了保险
写了一只script 确认运作期间的状态
systemctl status $line | grep running && echo "$line OK" || echo "$line error
!"
但是考虑到服务hang住
或是重启一直失败之类的状况
想请教除了我这种使用systemctl及service status的方式
或是telnet确认port状态 , wget针对网页服务测试
还有没有别的方式呢?
作者: kenduest (小州)   2017-11-15 12:33:00
nagios ? 你大概需要这种监视服务只是老实说稍微复杂,不是非常易用的软件
作者: lantw44 (#######################)   2017-11-15 13:23:00
systemd service 档案有个 Restart= 选项可以自动服务可以先用 man systemd.service 看看这功能是否适合使用再用 systemctl edit 把 Restart= 参数加上去是正常的,因为 systemctl edit 的作法是在/etc/systemd/system 底下建一个资料夹在里面写 .conf 档这样就不会直接动到 service 档,更新时才不会被覆写掉改完可以用 systemctl cat 看到一个服务有多少这种档案
作者: kojj (我先想想)   2017-11-15 15:05:00
Ubuntu 有一个monit 的套件,默认就可以监控httpd等常用服务范例说明 goo.gl/WEkmyMcentos 也有这套件 goo.gl/qd8js8
作者: chang505 (眼线)   2017-11-15 23:23:00
svscannagios 装起来一堆写好的 plugin 随插即用 哪里困难阿
作者: soem (流水)   2017-11-16 01:25:00
munin + monit
作者: laputaflutin (很恐怖,不要问)   2017-11-16 23:09:00
supervisord...怎么没人提呢?跟systems 是同类的东西,如果只是要重启够用了,有web gui跟导log的功能,不过你这么多服务,学个经典的nagios啊,接口是有点阳春,但是你提到的那些全部都有现成的plugin,上手后随插即用
作者: mmis1000 (秋月恋枫)   2017-11-18 20:00:00
mongod异常退出的话,是无法直接重启的,因为会被lock file卡住,要先下完 --repair 才有办法重新打开
作者: suaw (suaw)   2017-11-28 04:37:00
keepalived 运用在NGINX httpd应该是没问题,其他服务没试过,给您参考

Links booklink

Contact Us: admin [ a t ] ucptt.com