<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7638.1">
<TITLE>Nagios drops service checks when executing a host event handler?</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/rtf format -->

<P><FONT SIZE=2 FACE="Arial">Hi,</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">i have a strange problem i quite don't understand to handle.</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Question:</FONT>

<BR><FONT SIZE=2 FACE="Arial">Is Nagios dropping service checks when executing a host event handler?</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Situation:</FONT>

<BR><FONT SIZE=2 FACE="Arial">1. We are monitoring 85 Windows Servers with about 630 service checks being performed. check_ping is being run on all servers. </FONT></P>

<P><FONT SIZE=2 FACE="Arial">2. Any and all performance data is being passed to a custom shell script. Among others, this script is writing the performance data to a text file</FONT></P>

<P><FONT SIZE=2 FACE="Arial">3. The text file containing the performance data is then passed to our data warehouse in order to generate reports.</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Problem:</FONT>

<BR><FONT SIZE=2 FACE="Arial">Per day, there are about 150 checks (Ping) NOT being executed at all. When checking our external text file, i see (example here) that a check at 16:23 is missing. Actually, it seems like check_ping at 16:23 was not executed on ANY host at all.</FONT></P>

<P><FONT SIZE=2 FACE="Arial">02-19-2007<B> 16:21:18</B>#SRVDE050#Ping#OK#PING OK - Packet loss = 0%, RTA = 4.24 ms# SRVDE050#02-19-2007 16:21:18#Ping#PING OK - Packet loss = 0%, RTA = 4.24 ms</FONT></P>

<P><FONT SIZE=2 FACE="Arial">02-19-2007</FONT><B> <FONT SIZE=2 FACE="Arial">16:22:18</FONT></B><FONT SIZE=2 FACE="Arial">#SRVDE050#Ping#OK#PING OK - Packet loss = 0%, RTA = 1.21 ms# SRVDE050#02-19-2007 16:22:18#Ping#PING OK - Packet loss = 0%, RTA = 1.21 ms</FONT></P>

<P><FONT SIZE=2 FACE="Arial">02-19-2007</FONT><B> <FONT SIZE=2 FACE="Arial">16:24:45</FONT></B><FONT SIZE=2 FACE="Arial">#SRVDE050#Ping#OK#PING OK - Packet loss = 0%, RTA = 7.24 ms# SRVDE050#02-19-2007 16:24:45#Ping#PING OK - Packet loss = 0%, RTA = 7.24 ms</FONT></P>

<P><FONT SIZE=2 FACE="Arial">Problem source could be:</FONT>

<BR><FONT SIZE=2 FACE="Arial">When checking nagios.log, i see that a host event handler was being executed at that time. Workflow:</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">1. check_ping reports a problem (host down, for example)</FONT>

<BR><FONT SIZE=2 FACE="Arial">2. nagios executes the configured host event handler</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">This is the point where it seems to me, that ANY check related to the same check_command (here: check_ping) are being dropped at that time.</FONT></P>

<P><FONT SIZE=2 FACE="Arial">Maybe i am missing something here...?</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">We use Nagios 2.6.</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Any help is appreciated.</FONT>
</P>

<P><FONT SIZE=2 FACE="Arial">Kind regards,</FONT>

<BR><FONT SIZE=2 FACE="Arial">Andreas</FONT>
</P>

<h6 style="font-family:Verdana,Arial,sans-serif;font-weight:normal"><br><hr>Atos Origin GmbH, Theodor-Althoff-Straße 47, D-45133 Essen, Postfach 100 123, D-45001 Essen<br>Telefon: +49 201 4305 0, Fax: +49 201 4305 689095, <a href="http://www.atosorigin.de/">www.atosorigin.de</a><br>Dresdner Bank AG, Hamburg: Kto. 0954411200, BLZ 200 800 00, Swift Code DRESDEFF200, IBAN DE69200800000954411200<br>Geschäftsführer: Dominique Illien, Handelsregister Essen HRB 19354, Ust.-ID.-Nr.: DE147861238<br><hr><br></h6>
</BODY>
</HTML>