<br><font size=2 face="sans-serif">Hi,</font>
<br>
<br><font size=2 face="sans-serif">We have a distributed Nagios set-up with three (slave) check engines performing active checks and sending their results to a master server which collects all results and sends out alarms if need be.</font>
<br>
<br><font size=2 face="sans-serif">Our department had a lot of complaints regarding remote hosts connected over a WAN link that give out a lot of false positives.</font>
<br>
<br><font size=2 face="sans-serif">Because  WAN links are more prone to packet loss than LAN links, we've set the number of host retries to 10, figuring that this would avoid any false alerts about hosts being down while in fact it is just a temporary glitch in the line.</font>
<br>
<br><font size=2 face="sans-serif">This setup did not work however. Further investigation about the cause revealed what I believe to be a bug.</font>
<br>
<br><font size=2 face="sans-serif"><b><i>While receiving host check results in PASSIVE mode, the number of retries is not taken into account and a negative response will immediately results in a HARD state, which in turn sends out alerts.</i></b></font>
<br>
<br><font size=2 face="sans-serif">This is a very annoying bug because it can create a lot of unnecessary notifications if you're monitoring a machine over a WAN link.</font>
<br>
<br><font size=2 face="sans-serif">I've first experienced this bug while running nagios 2.2 and have recently upgraded to 2.4 to no avail.</font>
<br>
<br><font size=2 face="sans-serif">In our normal setup, a slave machine would perform an active host check and send the result through nsca to the master server. But it is not necessary to reproduce the buggy behaviour. You can easily do it as follows:</font>
<br>
<br><font size=2 face="sans-serif">1) Pick a machine in your nagios configuration that you can play with.</font>
<br>
<br><font size=2 face="sans-serif">As you can see from the first screenshot, the machine is currently in attempt 1/10, state type HARD and last result was passive:</font>
<br>
<br><img src=cid:_1_025800003D6000568323C12571A1>
<br>
<br><font size=2 face="sans-serif">2) Click on "Submit passive check result for this host"</font>
<br>
<br><img src=cid:_1_183800003E3000568323C12571A1>
<br>
<br><font size=2 face="sans-serif">3) Commit and wait a minute:</font>
<br>
<br><img src=cid:_1_1A5800003FD000568323C12571A1>
<br>
<br><font size=2 face="sans-serif">As can be seen, the passive check immediately results in a HARD state, even though the attempt is only 1/10. </font>
<br>
<br><font size=2 face="sans-serif">Note that PASSIVE services checks work as expected, it's only host checks that exhibit this behaviour.</font>
<br>
<br><font size=2 face="sans-serif">Would it be possible to post a patch for this bug or could a fix be incoporated in a next release?</font>
<br>
<br><font size=2 face="sans-serif">Best Regards,</font>
<br>
<br><font size=2 face="sans-serif">Jan David</font>
<br>