<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=us-ascii">
<META content="MSHTML 6.00.2900.2995" name=GENERATOR></HEAD>
<BODY>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>Hello 
all!</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>I think I'm 
experienceing a problem with runaway child processes. I read the FAQ and found 
the service_reaper_frequency entry... But I don't think that's the problem (I've 
set it to 4 just to be sure)</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>A little about my 
setup:</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>I'm 
monitoring several hundred machines, and a couple thousand serices on these 
machines.</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>I'm doing this using 
the passive method. (piping to the nagios.cmd file) I dump the results of the 
other monitoring processes into nagios.cmd every 5 minutes</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>The first couple of 
hours after startup, things appear to operating fine, with no more than 5 or 6 
nagios child instances running at any given time, and no instance running for 
more than a couple of minutes. </FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>Sometime after the 2 
hour mark, the child instances take long and longer to complete, if they 
complete at all (upwards of 20 min and higher). And these processes just start 
building up.</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>I can attach to 
these processes using strace and they all appear to be doing things once i do 
that, but it's almost like the mere act of observing these child processes makes 
them complete (whereas if i just let them go, they would never finish), but 
other child processes are truly "hung/slow-as-mol". </FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>I can kill these 
processes fine, but I can't forever monitor these processes to make sure they 
don't get out of hand. </FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>Any light anyone can 
shed on this would be greatly appreciated:</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>1) why is nagios 
spawning these child processes (i'm passively monitoring)</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>2) why are they not 
finishing (and this behavior is only visible after a few hours of 
running)</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>3) how can i prevent 
this from occurring?</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>4) could it be that 
something is hanging the process and by the time it becomes unhung, the child 
reads a new dump from the nagios.cmd file, and thus never ends (i don't even 
know if that's what the child processes are doing - the strace 
reads:</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006>    <FONT face=Arial 
size=2>write(6, "Hostname\0\0\0\0\0\0\0\0\0\0."..., 496) = 
496</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2></FONT></SPAN> </DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial size=2>Thanks in advance 
for your help!</FONT></SPAN></DIV>
<DIV><SPAN class=333165823-22112006><FONT face=Arial 
size=2>-Andrew</FONT></SPAN></DIV></BODY></HTML>