<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
</head>
<body bgcolor="#ffffff" text="#000000">
Hi all,<br>
<br>
I'm having a strange nagios behavior in my host checks. The problem is
the number of retries before a hard state is computed. I can't figure
out what's the problem, so I'm asking for some help from you.<br>
<br>
My nagios setup is 3.02, with flap detection disabled. I think the rest
is a standard stand alone setup.<br>
<br>
For my host configuration I don't want regularly scheduled host checks,
so I have the check_interval set to 0. The configuration is below:<br>
<br>
<table x:str="" style="border-collapse: collapse; width: 1029pt;"
 border="0" cellpadding="0" cellspacing="0" width="1369">
  <col style="width: 54pt;" width="72"> <col style="width: 80pt;"
 width="106"> <col style="width: 78pt;" width="104"> <col
 style="width: 102pt;" width="136"> <col style="width: 70pt;"
 width="93"> <col style="width: 65pt;" width="86"> <col
 style="width: 105pt;" width="140"> <col style="width: 65pt;"
 width="86"> <col style="width: 105pt;" width="140"> <col
 style="width: 113pt;" width="151"> <col style="width: 86pt;"
 width="114"> <col style="width: 106pt;" width="141"> <tbody>
    <tr style="height: 12.75pt;" height="17">
      <td style="height: 12.75pt; width: 54pt;" height="17" width="72">Host
Name</td>
      <td style="width: 80pt;" width="106">Alias/Description</td>
      <td style="width: 78pt;" width="104">Address</td>
      <td style="width: 102pt;" width="136">Max. Check Attempts</td>
      <td style="width: 70pt;" x:str="Check Interval " width="93">Check
Interval<span style=""> </span></td>
      <td style="width: 65pt;" x:str="Retry Interval " width="86">Retry
Interval<span style=""> </span></td>
      <td style="width: 105pt;" width="140">Host Check Command</td>
      <td style="width: 65pt;" x:str="Obsess Over " width="86">Obsess
Over<span style=""> </span></td>
      <td style="width: 105pt;" x:str="Enable Active Checks "
 width="140">Enable Active Checks<span style=""> </span></td>
      <td style="width: 113pt;" x:str="Enable Passive Checks "
 width="151">Enable Passive Checks<span style=""> </span></td>
      <td style="width: 86pt;" x:str="Check Freshness " width="114">Check
Freshness<span style=""> </span></td>
      <td style="width: 106pt;" x:str="Freshness Threshold " width="141">Freshness
Threshold<span style=""> </span></td>
    </tr>
    <tr style="height: 12.75pt;" height="17">
      <td style="height: 12.75pt;" x:str="gtipca " height="17">gttest<br>
      </td>
      <td x:str="gtipca.fccn.pt ">gttest<span style=""></span></td>
      <td class="xl22" x:num="193136248121" align="right">x.x.x.x</td>
      <td x:num="" align="right">15</td>
      <td x:str="0h 0m 0s ">0h 0m 0s<span style=""> </span></td>
      <td x:str="0h 1m 0s ">0h 1m 0s<span style=""> </span></td>
      <td x:str="check_instituicao ">check_instituicao<span style=""> </span></td>
      <td x:str="No ">No<span style=""> </span></td>
      <td x:str="Yes ">Yes<span style=""> </span></td>
      <td x:str="Yes ">Yes<span style=""> </span></td>
      <td x:str="No ">No<span style=""> </span></td>
      <td x:str="Auto-determined value ">Auto-determined value<span
 style=""> </span></td>
    </tr>
  </tbody>
</table>
<br>
With this setup I would expect 15 retries for the host check like I did
with version 2.x. But what I get is this:<br>
<br>
<img src="cid:part1.02090408.01070506@fccn.pt" alt="Service Ok"
 title="Service Ok" align="left">[12-06-2008 10:11:11] SERVICE ALERT:
gttest;ping;OK;HARD;1;PING OK - Packet loss = 0%, RTA = 56.90 ms<br
 clear="all">
<img src="cid:part1.02090408.01070506@fccn.pt" alt="Host Up"
 title="Host Up" align="left">[12-06-2008 10:07:22] HOST ALERT:
gttest;UP;HARD;1;PING OK - Packet loss = 0%, RTA = 39.28 ms<br
 clear="all">
<img src="cid:part3.03080902.08030801@fccn.pt" alt="Service Critical"
 title="Service Critical" align="left">[12-06-2008 10:06:21] SERVICE
ALERT: gttest;ping;CRITICAL;HARD;1;PING CRITICAL - Packet loss = 100%<br
 clear="all">
<img src="cid:part3.03080902.08030801@fccn.pt" alt="Host Down"
 title="Host Down" align="left">[12-06-2008 10:06:14] HOST ALERT:
gttest;DOWN;HARD;1;PING CRITICAL - Packet loss = 100%<br clear="all">
<img src="cid:part3.03080902.08030801@fccn.pt" alt="Host Down"
 title="Host Down" align="left">[12-06-2008 10:06:11] HOST ALERT:
gttest;DOWN;SOFT;1;PING CRITICAL - Packet loss = 100%<br clear="all">
<img src="cid:part3.03080902.08030801@fccn.pt" alt="Service Critical"
 title="Service Critical" align="left">[12-06-2008 10:05:21] SERVICE
ALERT: gttest;ping;CRITICAL;SOFT;1;PING CRITICAL - Packet loss = 100%<br>
<br>
<br>
Nagios just tries 2 times, without the 1 minute interval from
retry_interval variable, and gives HARD state. Of course I'm getting to
much false positives on this small duration down states that I want to
discard.<br>
<br>
Thank you<br>
Best regards<br>
<br>
<div class="moz-signature">-- <br>
<meta http-equiv="Content-Type" content="text/html; ">
<title>Emanuel Massano</title>
<p class="MsoNormal"><strong><span
 style="font-size: 10pt; font-family: "Lucida Sans"; color: maroon;"
 lang="PT">Emanuel Massano</span></strong></p>
<p><span style="font-size: 10pt; font-family: Garamond; color: maroon;"
 lang="PT">
FCCN<br>
Av. do Brasil, n.º 101<br>
1700-066 Lisboa<br>
Tel: +351 21 844 0100<br>
Fax: +351 21 847 2167<br>
E-Mail: <a href="mailto:emanuel.massano@fccn.pt">emanuel.massano@fccn.pt<br>
</a><a href="http://www.fccn.pt/" title="http://www.fccn.pt">www.fccn.pt</a></span></p>
<p></p>
<p><strong><span
 style="font-size: 10pt; font-family: Garamond; color: gray;" lang="PT">Aviso
de Confidencialidade</span></strong></p>
<p></p>
<p><span style="font-size: 10pt; font-family: Garamond; color: gray;"
 lang="PT">Esta mensagem é exclusivamente destinada ao seu
destinatário, podendo conter informação CONFIDENCIAL, cuja divulgação
está expressamente vedada nos termos da lei. Caso tenha recepcionado
indevidamente esta mensagem, solicitamos-lhe que nos comunique esse
mesmo facto por esta via ou para o telefone +351 218440100 devendo
apagar o seu conteúdo de imediato.<br>
<br>
This message is intended exclusively for its addressee. It may contain
CONFIDENTIAL information protected by law. If this message has been
received by error, please notify us via e-mail or by telephone +351
218440100 and delete it immediately</span></p>
</div>
</body>
</html>