<div>Hey guys,</div>
<div> </div>
<div>My environment</div>
<div> </div>
<ul>
<li>2 nagios servers</li>
<li>1 nagios server monitoring more than 920 clients and another more than 700 clients</li>
<li>Clients are both Windows and Unix servers</li>
<li><strong>No firewalls</strong>.</li>
<li>Added both the nagios server's IP address on all the client's config file.</li></ul>
<div>Issue</div>
<ul>
<li>Occasionally we get connection refused sometimes and Socket timeout sometimes.</li>
<li>During such times, it generates CRITICAL alert and our ticketing system generates lots of tickets</li></ul>
<div>Assumptions</div>
<ul>
<li>Network slowness between nagios server and client.</li>
<li>Client takes more time to respond to the check and nrpe timeouts.</li>
<li>NRPE dies on the nagios server.</li></ul>
<div> </div>
<div>Clarification needed</div>
<ul>
<li>What are the various causes for these alerts? (are the assumptions correct, if wrong please clarify.)</li>
<li>Is it possible to change them as "Warning"?</li>
<li>If yes for above, how?</li></ul>
<div>Regards</div>
<div>Kesava</div>