十个Nagios故障解决技巧
2013-05-22 11:21:38 点击:

Nagios问题处理如下所述:1、监控状态不正常怎么办?答、建议从本机手动check看看结果,检查防火墙等防止端口被阻止访问,造成监控失误。2、...

Nagios问题处理如下所述:

1、监控状态不正常怎么办?

答、建议从本机手动check看看结果,检查防火墙等防止端口被阻止访问,造成监控失误。

2、nrpe在 ./configure时提示:

checking for SSL... configure: error: Cannot find ssl libraries

答、把openssl-devel装上就可以了.

3、nagios web界面提示:

It appears as though you do not have permission to view information for any of the services you requested...

答、打开cgi.cfg配置文件, use_authentication=1

为了保障系统的安全性,nagios设置了这个参数,默认为1,改为0即可。

4、如果NSClient设置了连接需要密码或者改变了端口,哪么服务器应该怎么连接?

答、$USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -s PASSWORD -v $ARG1$ $ARG2$

-p 指定 port -s   指定 password

5、Service Commands 中Enable notifications for this service时报错:

Sorry Dave, I can't let you do that...

It seems that you have chosen to not use the authentication functionality of the CGIs.

答、修改cgi.cfg文件

修改use_authentication=1 (默认) ,如果没有添加,重启nagios服务。

6、监控mysql的时候提示错误:is not allowed to connect to this MySQL server

Server (nagios服务端192.168.0.132)

#/usr/local/nagios/libexec/check_mysql -H 192.168.0.207 -u root -p xukixu

此时可能会出现错误:Host '192.168.0.132' is not allowed to connect to this MySQL server

答、在客户端client(192.168.0.207)做个mysql授权用户访问即可:

mysql>grant all privileges on *.* to root@192.168.0.132 identified by '123456';

mysql>flush privileges;

7、如何添加一台监控 38101 端口的Linux服务器?

答、首先需要在 command.cfg 里边定义 check_tcp (默认已经定义)

然后在拷贝 localhost 配置文件,修改主机名,ip,别名等信息,添加服务项,check_tcp!38101

然后在 nagios.cfg 主配置文档里添加该主机配置文件路径;

检查配置文件正确性,并重启 nagios 使配置生效。

8、怎么样比较清晰的管理尽千台主机?

答、建议每个配置文件单独管理一台主机,然后将所有主机的配置文件单独放在通一个目录底下,做好定期备份,这样,可以方便修改不同主机上的不同服务,而且可以很方便的临时增加和删除一个主机节点。

9、如何添加一个管理插件的配置?

答、在 command.cfg 配置文件里可以添加插件,要添加的插件必须存在于主机的 libexec/* 目录下,否则,在检测配置文件的时候会报错!

10、我装了nagios-plugin没有check_mysql  check_snmp 等插件都没有,为什么?

答、check_mysql在nagios-plugin的高版本中(nagios-plugins-1.4.13.tar)已经带了check_mysql插件,如果需要check_snmp,请安装 net-snmp-devel 之后再重新编译nagios来实现!

11、能举例说明一下配置文件参数的意义么?

监控windows服务器运行的时间:

check_command  check_nt!UPTIME

监控Windows服务器的CPU负载,如果5分钟超过80%则是warning,如果5分钟超过90%则是critical

check_command  check_nt!CPULOAD!-l 5,80,90

监控Windows服务器的内存使用情况,如果超过了80%则是warning,如果超过90%则是critical

check_command  check_nt!MEMUSE!-w 80 -c 90

监控Windows服务器C:盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical, -l 后面接的参数用来指定盘符

check_command  check_nt!USEDDISKSPACE!-l c -w 80 -c 90

监控Windows服务器D:盘的使用情况,如果超过80%已经使用则是warning,超过90%则是critical

check_command  check_nt!USEDDISKSPACE!-l d -w 80 -c 90

监控Windows服务器的W3SVC服务的状态,如果服务停止了,则是critical

check_command  check_nt!SERVICESTATE!-d SHOWALL -l W3SVC

监控Windows服务器的Explorer.exe进程的状态,如果进程停止了,则是critical

check_command  check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe

command.cfg 里 command_line $USER1$/check_tcp -H $HOSTADDRESS$ -p $ARG1$ $ARG2$   中,-p 后$ARG1$ $ARG2$ 表示在 host.cfg 配置文件中 check_tcp 可以跟两个端口参数,比如:check_tcp!20!21

nagios问题解决办法就为读者介绍完了,如果读者有不明白的地方可以阅读:安装配置nagios修改Apache配置?监控Linux服务器?Nagios 3.0初步安装配置监控Windows服务器

【编辑推荐】

  1. Nagios插件SHELL字符远程任意命令执行漏洞
  2. Nagios Content-Length 整数溢出漏洞
  3. Debian对nagios发布升级
  4. Ubuntu对nagios发布升级
  5. Nagios远程监控软件的安装与配置详解
  6. 如何提升Nagios服务器安全
【责任编辑:liyan TEL:(010)68476606】



相关热词搜索:

上一篇:nagios监控Windows服务器过程解析
下一篇:六大Nagios常见问题解决办法