<br><font size=2 face="sans-serif"> </font>
<table border width=100%>
<tr valign=top>
<td width=100% bgcolor=white><font size=3 face="Arial">From: SCHAER Frederic
<frederic.schaer <at> cea.fr><br>
Subject: </font><a href="http://news.gmane.org/find-root.php?message_id=%3cEA04FF699CD5274E9EC52CB5EC0508707667A0%40DIODON.extra.cea.fr%3e" target=_top></b></font><font size=3 color=#002390 face="Arial"><b>nagios
3 host checks logic problem on some kernels/distros</a><font size=3 face="Arial"><br>
Newsgroups: </font><a href=http://news.gmane.org/gmane.network.nagios.devel target=_top></b></font><font color="red"><b>MailScanner has detected a possible fraud attempt from "news.gmane.org" claiming to be</b></font> <font size=3 color=#002390 face="Arial"><b>gmane.network.nagios.devel</a><font size=3 face="Arial"><br>
Date: 2007-09-10 16:17:30 GMT (1 week, 15 hours and 23 minutes ago)</font>
<p><font size=3 face="Arial">Hi, </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">I think I identified a problem (but not and
the solution) on the nagios 3 source tree… </font>
<p><font size=3 face="Arial">I tried with both the 3.0b3 and cvs HEAD source
files and could not get rid of the problem. </font>
<p><font size=3 face="Arial">I’m running a 2.4.21 kernel on a RHEL3 box.
</font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">What happens is that as soon as I start nagios
3, it starts eating all of the <b>CPU</b>. </font>
<p><font size=3 face="Arial">Stracing the nagios process shows this (and
almost only this): </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 161574}, NULL) =
0 </font>
<p><font size=3 face="Arial">time([1189419621])                     
= 1189419621 </font>
<p><font size=3 face="Arial">time([1189419621])                     
= 1189419621 </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 183742}, NULL) =
0 </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 183780}, NULL) =
0 </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 183814}, NULL) =
0 </font>
<p><font size=3 face="Arial">time([1189419621])                     
= 1189419621 </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 184172}, NULL) =
0 </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 184326}, NULL) =
0 </font>
<p><font size=3 face="Arial">time([1189419621])    
                 =
1189419621 </font>
<p><font size=3 face="Arial">time([1189419621])                     
= 1189419621 </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 184734}, NULL) =
0 </font>
<p><font size=3 face="Arial">gettimeofday({1189419621, 184861}, NULL) =
0 </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">I tried stracing nagios on a Ubuntu feisty
(7.04) box, and the output is much different : there are nanosleep calls…
</font>
<p><font size=3 face="Arial">I tried activating and deactivating nanosleeps
at nagios compile time, but this did not solve my problem. </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">Having full debug, I have this kind of output
at the nagios start : </font>
<p><font size=3 face="Arial">[1189438977.881574] [016.0] [pid=18234] Attempting
to run scheduled check of host 'wn010': check options=0, latency=0.874000
</font>
<p><font size=3 face="Arial">[1189438977.881651] [001.0] [pid=18234] run_async_host_check_3x()
</font>
<p><font size=3 face="Arial">[1189438977.881665] [016.0] [pid=18234] **
Running async check of host 'wn010'... </font>
<p><font size=3 face="Arial">[1189438977.881678] [001.0] [pid=18234] check_host_check_viability_3x()
</font>
<p><font size=3 face="Arial">[1189438977.881691] [001.0] [pid=18234] check_time_against_period()
</font>
<p><font size=3 face="Arial">[1189438977.881712] [001.0] [pid=18234] check_host_dependencies()
</font>
<p><font size=3 face="Arial">[1189438977.881726] [016.1] [pid=18234] A
check of this host is already being executed, so we'll pass for the moment...
</font>
<p><font size=3 face="Arial">[1189438977.881739] [016.1] [pid=18234] Unable
to run scheduled host check at this time </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">If I run nagios just for  2 seconds and
then hit CTRL+C, I still see this : </font>
<p><font size=3 face="Arial">>grep "A check of this host is already
being executed" /var/log/nagios/nagios.debug | wc -l </font>
<p><font size=3 face="Arial">    971 </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">>grep "Attempting to run scheduled
check of host 'wn010'" /var/log/nagios/nagios.debug | wc -l </font>
<p><font size=3 face="Arial">    971 </font>
<p><font size=3 face="Arial">>grep "Attempting to run scheduled
check of host" /var/log/nagios/nagios.debug | wc -l </font>
<p><font size=3 face="Arial">    971 </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">I have 53 hosts defined, I don’t understand
why nagios is checking ever and ever the same host… and why this is not
happening on all systems. </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">De-activating host checks magically “solves”
the problem. </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">I just found out that commenting hosts “check_command”
caused this behaviour (with host_checks_enabled=true), and that defining
a correct check_command prevented nagios from being so <b>CPU</b> hungry…
</font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">Hope I helped… </font>
<p><font size=3 face="Arial"> </font>
<p><font size=3 face="Arial">Cheers </font></table>
<br>
<br><font size=2 face="sans-serif">Dear List,</font>
<br>
<br><font size=2 face="sans-serif">I can confirm the problem Frederic reported.</font>
<br><font size=2 face="sans-serif">I am using Nagios 3.0b3 on CentOS 4.4</font>
<br><font size=2 face="sans-serif">After starting nagios, the process catches
nearly 100 % CPU (See top-output  below)</font>
<br><font size=2 face="sans-serif">Disableing hostchecks let the process
return to normal values.</font>
<br><font size=2 face="sans-serif">As far as I can remember, the problem
did not occour with nagios3.0a (but I can not verify at the moment)</font>
<br>
<br><font size=2 face="sans-serif">Tasks:  89 total,   3 running,
 86 sleeping,   0 stopped,   0 zombie</font>
<br><font size=2 face="sans-serif">Cpu(s): 26.0% us,  1.3% sy,  0.0%
ni, 72.6% id,  0.0% wa,  0.1% hi,  0.0% si</font>
<br><font size=2 face="sans-serif">Mem:   4041580k total,  1373844k
used,  2667736k free,    60200k buffers</font>
<br><font size=2 face="sans-serif">Swap:  4192956k total,    
   0k used,  4192956k free,  1137348k cached</font>
<br>
<br><font size=2 face="sans-serif">  PID USER      PR
 NI  VIRT  RES  SHR S %CPU %MEM    TIME+
 COMMAND</font>
<br><font size=2 face="sans-serif">28617 nagios    25  
0 29756  10m 1056 R   96  0.3  17:12.48 nagios</font>
<br><font size=2 face="sans-serif">    1 root      16
  0  4752  552  460 S    0  0.0  
0:02.75 init</font>
<br><font size=2 face="sans-serif">    2 root      RT
  0     0    0    0 S    0
 0.0   0:00.04 migration/0</font>
<br>
<br>
<br><font size=2 face="sans-serif">Thomas</font>
<br>
<br><font size=2 face="sans-serif"><br>
</font><font size=2 color=#00a000 face="Webdings">P </font><font size=2 color=#00a000><b>Please
consider the environmental impact of needlessly printing this e-mail.</b></font><font size=3>
</font><font size=2 face="sans-serif"><br>
</font><br/><hr/><b>RSC Commercial Services OHG</b><br/>
Wanheimer Straße 70, D-40468 Düsseldorf<br/>
Registergericht: Düsseldorf, HRA 12655