<br><br><div class="gmail_quote">On Tue, Jan 27, 2009 at 6:04 PM, Mathieu Gagné <span dir="ltr"><<a href="mailto:mgagne@iweb.com">mgagne@iweb.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
We have +2000 hosts and +4700 services configured on one of our Nagios instance. Load average is between 1.3 an 2.0 which I find acceptable.</blockquote><div><br>Wow. That's way bigger than what I have. Mine's a cluster of 256 machines and around 6 services checked on each. I have an advantage that most are on a local LAN so no internet connectivity issues and external bandwidth bottlenecks. <br>
</div><div> </div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
The SSH service state can be CRITICAL while all the other services are still OK. (ie. ssh server misconfiguration) You probably want to be informed about it too.</blockquote><div><br>True. But if SSH is down will NRPE still work? Or are they totally independent?<br>
 </div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">What kind of server are you using?</blockquote><div><br>Intel(R) Xeon(TM) CPU 2.80GHz dual core. 2 GB RAM <br>
</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
<br>
Also, what's the check_interval? A 1 minute interval might put the server on its knee since it would be scheduling and executing 1536 checks per minute. (as per your informations)</blockquote><div><br>nagios.cfg <br>
     command_check_interval=-1<br>services.cfg <br>    normal_check_interval   5<br>    retry_check_interval    1<br><br> </div></div>-- <br>Rahul<br>