<div>Hi Stephen,</div>
<div> </div>
<div>Thank you for your answer. However I don´t agree when you say that I´m losing updates. We can see by the alert times that the collector sent a SOFT3 status at <br>01:05:21 h and the central server consider it a HARD4 at 01:05:40 h. For me it is a bug in the passive check process.</div>

<div> </div>
<div>I´m using NSCA to replicate the status from the collectors to central server and as you said the central server takes about 20 seconds to get the status sent by the collectors, what is a normal behavior, I think.</div>

<div> </div>
<div>Thank you very much,</div>
<div>Rodney</div>
<div> </div>
<div class="gmail_quote">On Tue, May 8, 2012 at 5:01 PM, Stephen Gran <span dir="ltr"><<a href="mailto:steve@lobefin.net" target="_blank">steve@lobefin.net</a>></span> wrote:<br>
<blockquote style="BORDER-LEFT:#ccc 1px solid;MARGIN:0px 0px 0px 0.8ex;PADDING-LEFT:1ex" class="gmail_quote">On Tue, May 08, 2012 at 12:07:05PM -0300, Rodney Ramos said:<br>> Hi everybody,<br><br>Hi,<br>
<div>
<div class="h5"><br>> I use Nagios, release 3.2.3, in a distributed environment, with a central<br>> server and several colector servers.<br>><br>> For a long time I´m seeing errors on the passive check mechanism on the<br>
> central server, as we can see below.<br>><br>> Sometimes, on the central server, the states and number of attempts don´t<br>> follow the correct order, going from SOFT2 to HARD4, for example. However,<br>> on the colector server everything is OK.<br>
><br>> Log from Central Server:<br>> Host Up[2012-05-05 01:06:48] HOST ALERT: node;UP;HARD;1;TCP OK - 0.005<br>> second response time on port 135<br>> Host Down[2012-05-05 01:05:40] HOST ALERT: node;DOWN;HARD;4;CRITICAL -<br>
> Socket timeout after 10 seconds<br>> Host Down[2012-05-05 01:04:16] HOST ALERT: node;DOWN;SOFT;2;CRITICAL -<br>> Socket timeout after 10 seconds<br>> Host Down[2012-05-05 01:02:55] HOST ALERT: node;DOWN;SOFT;1;CRITICAL -<br>
> Socket timeout after 10 seconds<br>><br>> Log from Colector Server:<br>> Host Up[05-05-2012 01:06:31] HOST ALERT: node;UP;SOFT;4;TCP OK - 0.005<br>> second response time on port 135<br>> Host Down[05-05-2012 01:05:21] HOST ALERT: node;DOWN;SOFT;3;CRITICAL -<br>
> Socket timeout after 10 seconds<br>> Host Down[05-05-2012 01:04:01] HOST ALERT: node;DOWN;SOFT;2;CRITICAL -<br>> Socket timeout after 10 seconds<br>> Host Down[05-05-2012 01:02:41] HOST ALERT: nodeDOWN;SOFT;1;CRITICAL -<br>
> Socket timeout after 10 seconds<br><br></div></div>You're losing updates.  Given that it seems to be taking 15 or 20<br>seconds to get the update from your collector to your central server,<br>that's not hugely surprising.  You don't say what the replication<br>
mechanism is, but it either needs to get better at shovelling updates or<br>grow a bigger buffer, at a guess.<br><br>Cheers,<br><span class="HOEnZb"><font color="#888888">--<br> --------------------------------------------------------------------------<br>
|  Stephen Gran                  | Never eat anything bigger than your     |<br>|  <a href="mailto:steve@lobefin.net">steve@lobefin.net</a>             | head.                                   |<br>|  <a href="http://www.lobefin.net/~steve" target="_blank">http://www.lobefin.net/~steve</a> |                                         |<br>
 --------------------------------------------------------------------------<br></font></span><br>-----BEGIN PGP SIGNATURE-----<br>Version: GnuPG v1.4.10 (GNU/Linux)<br><br>iQIcBAEBCAAGBQJPqXuhAAoJELMRjO+K6o/uCT4P/0Py/NWJ4DYGuiNbwMykA0th<br>
ejoo2nfMS8PaGiZ+KX+UlCINDyaNNTbBnzOCtaQPLLYGLzyCFZju0zMmcTvlCvFI<br>9RUJlb9U8cZU/Ek+AF3VLJ9+UrFN/EW77R+K2dnt709c445DkdOmQIQez63RmIHy<br>ibrQ8waNAJpDhbZb7IV1Pq+XpnKH2RPQIrxODtPTizwGnETq9JjG33h0K7KyjRL8<br>Vu3lfPo/DGoNva1NiWlCMyDV2t2Sr27QrPvAkpZYzAajZ52WwNScK+7B2y/8/fJ2<br>
vI4KJlJFbERMrlANXmDzYjRBU4ZXHSn1d729vAhzoeHk1+TPv1t3AmPphNCy61YX<br>Z9yLeFxHLcHLyh6hOhvcxDhadx3eeFk3tTqUroJ13JQvw9+zwdI5T0I8IUmgdG0J<br>WI2ntpJhvexTYq2hQHuASWSTpjSW3oc/lJ1SHD61kQ6egfr54tsnfYjeLwag35H5<br>dHo9Ul+gFnIjqVw4Sp4APMaMuDHe2wAso8LMBquEudHzNevRT7ZJF1l5FQ6tps2L<br>
OBUk4oCds9EgwRiTUu7eGLy+0Um6fXQKQww8q0n9YbB1zLZYQBU26cgZYV/TuaZ2<br>EL7mWXoEhvXSxICjA6xIOYF7HX4jI0kiN4stAMKjnmRP3BQ1G+DNbfCRF8jGn4kJ<br>39g9fqrjmwRYACjEtPQI<br>=BY7S<br>-----END PGP SIGNATURE-----<br><br>------------------------------------------------------------------------------<br>
Live Security Virtual Conference<br>Exclusive live event will cover all the ways today's security and<br>threat landscape has changed and how IT managers can respond. Discussions<br>will include endpoint security, mobile security and the latest in malware<br>
threats. <a href="http://www.accelacomm.com/jaw/sfrnl04242012/114/50122263/" target="_blank">http://www.accelacomm.com/jaw/sfrnl04242012/114/50122263/</a><br>_______________________________________________<br>Nagios-devel mailing list<br>
<a href="mailto:Nagios-devel@lists.sourceforge.net">Nagios-devel@lists.sourceforge.net</a><br><a href="https://lists.sourceforge.net/lists/listinfo/nagios-devel" target="_blank">https://lists.sourceforge.net/lists/listinfo/nagios-devel</a><br>
<br></blockquote></div><br>