Oops, sent that email to you directly, and not the list.  The answers to your questions should be plainly visible below; my apologies to anyone reading on nagios-users.<br><br>As regards question 1, I am certain we are not running ndo2db.  I'm sorry if my first answer seemed ambiguous, perhaps I should have stated outright that I am not using ndoutils.  I instead attempted to let you know that we were running some software that similarly stored data in a database and had already ruled out large/slow database queries as the source of my problem.<br>
<br>Your response to number 2 is quite intriguing!  Further detail on that might be helpful, though.  I'll check to see if anyone is using this server for anything else that could interfere.  I don't think a nagios check can be blocking, as 99% of our checks are passive checks passed through nsca and I don't think any of our active checks besides host checks (check_icmp) actually contact another computer.<br>
<br>As to the pre-existing administrator, he was just rebooting the server every day as he did not know what was causing the problem. If I am convinced that an upgrade will fix the problem, I will email him.  Otherwise, until there is some change, there's not much point in bothering him during his sabbatical.<br>
<br>Finally, the checkresults thing.  It seemed odd to me, but it looked like several normal files concatenated.  I can't actually look at the file again until the server is booted and on a Monday morning that could be a while.  ;)<br>
<br>Thanks for your help!<br><br>--Rick<br><br><div class="gmail_quote">On Mon, Feb 1, 2010 at 8:21 AM,  <span dir="ltr"><<a href="mailto:jonathan.wheeler@stfc.ac.uk">jonathan.wheeler@stfc.ac.uk</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">From: <a href="mailto:rickmangus@gmail.com">rickmangus@gmail.com</a> On Behalf Of Rick Mangus<br>

Sent: 01 February 2010 13:30<br>
<div class="im"><br>
> Thank you for the response.  In quick succession:<br>
<br>
</div>I am forwarding my replies to the Nagios list as well.<br>
<div class="im"><br>
> 1. I do use perfparse, and one of our suspicions involved a mysql delete to prune old data<br>
> that took multiple hours every night.  I removed all jobs that I could find that could<br>
> possibly interfere.<br>
<br>
</div>You can determine that you are running ndoutils by issuing a command like "ps -fu naguos" (to list all processes owned by username nagios; if you are running ndoutils, there will be a process named ndo2db<br>

<div class="im"><br>
> 2. No, or if we do, it's well-hidden.  ;)<br>
<br>
</div>In our case, the process causing the main problem was running on another server, but was holding up nagios because it blocked the nagios process in part of the code that was single-threaded.<br>
<div class="im"><br>
> 3. I am walking into a pre-existing install, and trying to slowly take over the management<br>
> duties.  To hasten the learning process, the only person in the office who knows anything<br>
> about it went to Hawaii once I'd been working here a few weeks.  I don't know that I should<br>
> attempt any major changes without his blessing, and he will not return until<br>
> March.  Though, if we determine that is the only/best fix, I'll do it.<br>
<br>
</div>Can he be contacted for his advice ?  If not, what has been changed since you took over (probably asking the obvious questions !)<br>
<div class="im"><br>
> One additional data point:  I found on Saturday night, as I logged in to restart Nagios and<br>
> prevent the machine dying, that the one file in /ramdisk_nagios/checkresults/ was over<br>
> 1MB.  Every other time I have checked, the files in there are sub-4kB.  If that tells<br>
> anyone here anything, please share with the peanut gallery (me!).  :)<br>
<br>
</div>1MB sounds very large; if you see it again, try finding out which check generated this file (core or debug dump from check code ?).<br>
<div><div></div><div class="h5"><br>
Jonathan Wheeler<br>
e-Science Centre<br>
Rutherford Appleton Laboratory<br>
<br>
<br>
<br>
--<br>
Scanned by iCritical.<br>
</div></div></blockquote></div><br>