A manual correction in retention.dat didn't work - from somewhere the wrong alias entries came back. I still don't know from where though.<br><br>After deleting the retention.dat file and restarting Nagios, the correct alias values were shown and now the notifications of the affected servers are correct again. This is a dirty workaround though, as Nagios needs to recheck every server and services and looses scheduled host downtimes, acknowledged states, etc. <br>
<br>It would be great if someone knew from where exactly the alias values came back into the retention.dat file. It can't be the host definition and neither objects.cache (as you can see in previous mails).<br><br><br>
<div class="gmail_quote">On Tue, Jul 19, 2011 at 2:07 PM, Claudio Kuenzler <span dir="ltr"><<a href="mailto:ck@claudiokuenzler.com">ck@claudiokuenzler.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
To follow up on this, I have once more this problem (this time with another server though) and I activated debugging and started to do some deeper research.<br><br>This time the service 'Disk Space /' on <b>SERVER21</b> is in state warning. The host alias for SERVER21 is SERVER21-DEVL.<br>

The notification looks like this though: <br><br>

<p><i>Service: Disk Space /</i></p><i>

</i><p><i>Host: SERVER31-UAT</i></p><i>

</i><p><i>Address: 10.x.x.x</i></p><i>

</i><p><i>State: WARNING</i></p><p>As you see, the alias for SERVER31 was taken, instead of SERVER21.</p><p><br></p><p>Now if I take a look at <b>var/objects.cache</b> the correct alias is used:</p>
<p><span style="font-family:courier new,monospace">define host {</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">        host_name       SERVER21</span><br style="font-family:courier new,monospace">

<span style="font-family:courier new,monospace">        alias   SERVER21-DEVL</span><br></p><p><br></p><p>If I take a look at <b>var/retention.dat</b> I see something strange:</p>
<p><span style="font-family:courier new,monospace">host {</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">host_name=SERVER21</span><br style="font-family:courier new,monospace">

<span style="font-family:courier new,monospace">alias=SERVER31-UAT</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">display_name=SERVER21</span><br></p>

Taking a further look at retention.dat reveils, that another host took the alias for SERVER31-UAT:<br><br><span style="font-family:courier new,monospace">host {</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">host_name=SERVER33</span><br style="font-family:courier new,monospace">

<span style="font-family:courier new,monospace">alias=SERVER31-UAT</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">display_name=SERVER33</span><br><br><br>I am sure the problem comes from here (retention.dat). But can somebody explain, how such wrong entries are created in retention.dat ?<div>
<div></div><div class="h5"><br>
<br><br><div class="gmail_quote">On Mon, Jul 11, 2011 at 5:14 PM, Claudio Kuenzler <span dir="ltr"><<a href="mailto:ck@claudiokuenzler.com" target="_blank">ck@claudiokuenzler.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

This particular one:<br><br><font size="1"><span style="font-family:courier new,monospace">define service{</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">        use                     normal-service-trading</span><br style="font-family:courier new,monospace">


<span style="font-family:courier new,monospace">        host_name               server14</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">        service_description     Service Check</span><br style="font-family:courier new,monospace">


<span style="font-family:courier new,monospace">        check_command           check_nrpe!proxy_bs_connections</span><br style="font-family:courier new,monospace"><span style="font-family:courier new,monospace">        }</span></font><br>


<br>So there's no alias entry either. <br><br>It's the very first time that this happens, and it continues. The service is still down (in maintenance) but Nagios continues to send the notification with a wrong HOSTALIAS. <br>

<div><div></div><div>
<br><div class="gmail_quote">On Mon, Jul 11, 2011 at 4:50 PM, Terry Carmen <span dir="ltr"><<a href="mailto:terry@cnysupport.com" target="_blank">terry@cnysupport.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


<div>Quoting Claudio Kuenzler <<a href="mailto:ck@claudiokuenzler.com" target="_blank">ck@claudiokuenzler.com</a>>:<br>
<br>
> Hello,<br>
><br>
> Since today I have almost the same problem as Jim.<br>
> The $HOSTALIAS$ macro works fine for all the checks, except one host alias<br>
> is wrong. I got aware of it today.<br>
><br>
> Same version as Jim's, 3.2.3, compiled from source as well.<br>
><br>
> Host config:<br>
><br>
> define host{<br>
>         use                     linux-platform-demo     ; Name of host<br>
> template to use<br>
>                                                         ; This host<br>
> definition will inherit all variables that are defined<br>
>                                                         ; in (or inherited<br>
> by) the linux-server host template definition.<br>
>         host_name               server14<br>
>         alias                   SERVER14-RANDOMDEMO<br>
>         address                 192.168.0.14<br>
>         }<br>
><br>
<br>
</div>What does your service definition look like?<br>
<br>
Terry<br>
<br>
<br>
------------------------------------------------------------------------------<br>
All of the data generated in your IT infrastructure is seriously valuable.<br>
Why? It contains a definitive record of application performance, security<br>
threats, fraudulent activity, and more. Splunk takes this data and makes<br>
sense of it. IT sense. And common sense.<br>
<a href="http://p.sf.net/sfu/splunk-d2d-c2" target="_blank">http://p.sf.net/sfu/splunk-d2d-c2</a><br>
<div><div></div><div>_______________________________________________<br>
Nagios-users mailing list<br>
<a href="mailto:Nagios-users@lists.sourceforge.net" target="_blank">Nagios-users@lists.sourceforge.net</a><br>
<a href="https://lists.sourceforge.net/lists/listinfo/nagios-users" target="_blank">https://lists.sourceforge.net/lists/listinfo/nagios-users</a><br>
::: Please include Nagios version, plugin version (-v) and OS when reporting any issue.<br>
::: Messages without supporting info will risk being sent to /dev/null<br>
</div></div></blockquote></div><br>
</div></div></blockquote></div><br>
</div></div></blockquote></div><br>