<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">Hi,<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have had this problem previously and posted here but not go nowhere with it.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Ill have another bash…..<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Basically my nagios machine is checking too frequently and firing out alerts too quickly<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Its ignoring the retry_interval value, the max_check_attempts value and ingoring the notification_interval  value in the escalations.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have check interval of 5 minutes in OK state<o:p></o:p></p>
<p class="MsoNormal">Retry interval of 3 minutes when in problem state<o:p></o:p></p>
<p class="MsoNormal">Notification interval of 3 minutes <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I believe that below is the problem and multiple service checks in problem state at the same time is casuing this.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Ive just seen this on 1 of my hosts:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">It appears its accumulating the service checks (even though they are different checks) into a final HARD state.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Prior to 17:18 all was fine on this host!!!<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Then at 17:18 a SQL check went to warning state and to SOFT 1<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Checked again at 17:21 which is the 3 minute interval I have told it too when in problem and its still warning so onto SOFT2<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Then a different service check on that host goes critical – but for the first time<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">17:22 memory usage and it puts this to HARD 3 – even though this actual check for memory should be SOFT1<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">An alert then got sent straight out for the Memory check even though it was actually only check 1/3 on that particular service<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Here is the copy and past from the History of the host<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><b><span style="mso-fareast-language:EN-GB">[01-15-2013 17:18:24]
<o:p></o:p></span></b></p>
<p class="MsoNormal"><b><span style="mso-fareast-language:EN-GB">SERVICE ALERT: SERVER;SQL LOCK TIMEOUTS;WARNING;SOFT;1;WARNING - 2.3067 lock timeouts / sec for _Total, 2.0667 lock timeouts / sec for Key, 0.0000 lock timeouts / sec for RID, 0.2400 lock timeouts
 / sec for Page, 0.0000 lock timeouts / sec for Object, 0.0000 lock timeouts / sec for Metadata, 0.0000 lock timeouts / sec for HoBT, 0.0000 lock timeouts / sec for File, 0.0000 lock timeouts / sec for Extent, 0.0000 lock timeouts / sec for Database, 0.0000
 lock timeouts / sec for Application, 0.0000 lock timeouts / sec for AllocUnit<br clear="all">
<o:p></o:p></span></b></p>
<p class="MsoNormal"><b>[01-15-2013 17:21:24] <o:p></o:p></b></p>
<p class="MsoNormal"><b>SERVICE ALERT: SERVER;SQL LOCK TIMEOUTS;WARNING;SOFT;2;WARNING - 1.3056 lock timeouts / sec for _Total, 1.1833 lock timeouts / sec for Key, 0.0000 lock timeouts / sec for RID, 0.1222 lock timeouts / sec for Page, 0.0000 lock timeouts
 / sec for Object, 0.0000 lock timeouts / sec for Metadata, 0.0000 lock timeouts / sec for HoBT, 0.0000 lock timeouts / sec for File, 0.0000 lock timeouts / sec for Extent, 0.0000 lock timeouts / sec for Database, 0.0000 lock timeouts / sec for Application,
 0.0000 lock timeouts / sec for AllocUnit<o:p></o:p></b></p>
<p class="MsoNormal"><b><o:p> </o:p></b></p>
<p class="MsoNormal"><b>[01-15-2013 17:22:04] <o:p></o:p></b></p>
<p class="MsoNormal"><b>SERVICE ALERT: SERVER;MEMORY USAGE;CRITICAL;HARD;3;CRITICAL: physical memory: Total: 10G - Used: 9.81G (98%) - Free: 192M (2%) > critical</b><b><span style="font-size:12.0pt;mso-fareast-language:EN-GB"><o:p></o:p></span></b></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Does anybody please have any idea why my server is checking too frequently and alerting too frequently and why its totting up different service checks?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">This machine has done nothing but not work right since it was loaded a couple months ago.<o:p></o:p></p>
<p class="MsoNormal">Im using the come config files on it as I did on the previous box I had – only difference was that was running 3.3.1 – I had none of these problems on that install.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">This is a Nagios 3.4.1 install on a Ubuntu 12.04 desktop 32 bit OS<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Thanks in advance<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>