<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<TITLE>Re: [Nagios-users] Phantom service checks</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->

<P><FONT SIZE=2>Sounds to me like you have multiple nagios processes running on that machine. Use the init script to stop nagios then ps to verify that you do not have a copy of nagios still running. If you do not, try removing the status.sav file after stoppong nagios then restart.<BR>
<BR>
As far as aggregating notifications, I believe there is something in the contrib directory or documentation to help you with that.<BR>
<BR>
<BR>
--<BR>
Marc<BR>
<BR>
Sent from a very tiny wireless device with a very tiny unlit keyboard.<BR>
<BR>
<BR>
-----Original Message-----<BR>
From: Rasmus Plewe <rplewe@ess.nec.de><BR>
To: Nagios users list <nagios-users@lists.sourceforge.net><BR>
Sent: Thu Dec 05 07:14:12 2002<BR>
Subject: [Nagios-users] Phantom service checks<BR>
<BR>
Hello,<BR>
<BR>
the only thing I found about this issue was in the mailing list<BR>
archive from last week monday, but no response.<BR>
<BR>
Once upon a time I had a service check, which was associated with a<BR>
couple of hosts and hostgroups. Now I don't have this service any<BR>
more, even the command definition in checkcommands.cfg is deleted.<BR>
When doing a recursive grep over the Nagios directory, the only files<BR>
where this service name appears are the log files. But every now and<BR>
again I get notifications telling me that this service is critical or<BR>
up (it being so unreliable was one of the reasons to eliminate it in<BR>
the first place). How can I get rid of this?<BR>
<BR>
Another thing:<BR>
During a greater downtime yesterday night, I had the opportunity to<BR>
test the "scheduled downtime" functionality. What I think what<BR>
happened is the following:<BR>
- downtime started. Lots of mails were generated, about every host and<BR>
  service that was configured.<BR>
- I scheduled downtime for the time being. Still notifications were<BR>
  sent out (yes, I restarted Nagios).<BR>
- I removed certain email adresses (like "half of the company" - oops)<BR>
  from getting notifications by setting the *_notification_periods in<BR>
  contacts.cfg to "none". Restarted Nagios. Still notifications were<BR>
  sent.<BR>
- I changed the email addresses in contacts so that they didn't point<BR>
  any more to these email aliases. Restarted Nagios. Still<BR>
  notifications were sent.<BR>
<BR>
All in all I got the impression that Nagios does not care too much<BR>
about changed configurations when getting restarted. But then I can't<BR>
swear that I didn't screw it up somehow, since I was pretty much tied<BR>
up in the downtime and hadn't a lot of time playing with Nagios at the<BR>
same time.<BR>
<BR>
Is there anyone who could make sense of this, and preferably have a<BR>
solution how I get rid of that phantom check?<BR>
<BR>
Oh, and another thought: I guess there's no possibility to tell Nagios<BR>
to "condense" notifications? I mean, in a situation like yesterday it<BR>
would be handy to have one notificaton for all incidents insteead of<BR>
~150 mails. Something like "upon a failure wait x minutes before<BR>
sending a notification, if there's another failure include it into the<BR>
notification and wait another x minutes. But don't wait longer than<BR>
y(>x) minutes counted from the first failure on" would be really<BR>
cool...<BR>
<BR>
<BR>
Regards,<BR>
         Rasmus<BR>
<BR>
<BR>
-------------------------------------------------------<BR>
This sf.net email is sponsored by:ThinkGeek<BR>
Welcome to geek heaven.<BR>
<A HREF="http://thinkgeek.com/sf">http://thinkgeek.com/sf</A><BR>
_______________________________________________<BR>
Nagios-users mailing list<BR>
Nagios-users@lists.sourceforge.net<BR>
<A HREF="https://lists.sourceforge.net/lists/listinfo/nagios-users">https://lists.sourceforge.net/lists/listinfo/nagios-users</A><BR>
</FONT>
</P>

</BODY>
</HTML>