I use my 15 minute avg instead of the current, allows for less false positives. Here is my checkcommand....<div><br></div><div><br></div><div>/usr/lib/nagios/plugins/check_snmp -H 10.1.1.22 -C REDACTED -o enterprises.ucdavis.laTable.laEntry.laLoadInt.2,enterprises.ucdavis.laTable.laEntry.laLoadInt.1,enterprises.ucdavis.laTable.laEntry.laLoadInt.3 -w 100 -c 150 -u "is 5min - ,is Current - ,is 15min"</div>
<div><br></div><div>your -w and -c checks are actually 100x the load, so if you want to warn on a load of 2 or more, then -w would be 200. The output, specified by the -u switch, outputs:</div><div><br></div><div><div>SNMP OK - 33 is 5min -  33 is Current -  44 is 15min | UCD-SNMP-MIB::laLoadInt.2=33 UCD-SNMP-MIB::laLoadInt.1=33 UCD-SNMP-MIB::laLoadInt.3=44  </div>
<div><br></div><div><br></div><div>Since I'm asking for the second output first (enterprises.ucdavis.laTable.laEntry.laLoadInt.2) that is what nagios checks and reacts to. You could put "enterprises.ucdavis.laTable.laEntry.laLoadInt.3" first to check for the 15 minute avg </div>
<div><br></div><div>Nagios only reports (in the GUI) the info prior to the pipe symbol that is returned, so it would show:</div><div><br></div><div><meta http-equiv="content-type" content="text/html; charset=utf-8">SNMP OK - 33 is 5min -  33 is Current -  44 is 15min</div>
<div><br></div><div>HTH</div><div>g.;</div><div><br></div><meta http-equiv="content-type" content="text/html; charset=utf-8"><br><div class="gmail_quote">On Fri, Mar 11, 2011 at 9:13 AM, Joe Beck <span dir="ltr"><<a href="mailto:JBeck@urbn.com">JBeck@urbn.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Frank,<br>
<br>
This looks like a great addition to my core alerting.<br>
Any chance you can share the details of your setup--<br>
Did you make these updates to <a href="http://check_snmp_load.pl" target="_blank">check_snmp_load.pl</a> & do something similar to<br>
Robert?<br>
>> I'm getting good results by using the NETSL option to report load averages.<br>
>> I'm setting '-c 99,4,10' to basically ignore the 1 minute value and alarm<br>
>> on 5 and 15 minutes.<br>
<br>
Thx,<br>
Joe<br>
<br>
<br>
On 3/9/11 9:00 PM, "frank" <<a href="mailto:ratty@they.org">ratty@they.org</a>> wrote:<br>
<br>
> On my installation I added code to the SNMP load check to count the CPU<br>
> cores via SNMP and set WARN to 1.25*cores and CRIT to 1.5*cores (for<br>
> any/all load values). Seems to be working ok. Haven't had any complaints<br>
> from the NOC for excessive alerting.<br>
><br>
> -f<br>
><br>
> On Wed, 9 Mar 2011, Robert Eden wrote:<br>
><br>
>> Date: Wed, 09 Mar 2011 14:33:13 -0600<br>
>> From: Robert Eden <<a href="mailto:rmeden@gmail.com">rmeden@gmail.com</a>><br>
>> Reply-To: Nagios Users List <<a href="mailto:nagios-users@lists.sourceforge.net">nagios-users@lists.sourceforge.net</a>><br>
>> To: <a href="mailto:nagios-users@lists.sourceforge.net">nagios-users@lists.sourceforge.net</a><br>
>> Subject: [Nagios-users] <a href="http://check_snmp_load.pl" target="_blank">check_snmp_load.pl</a> best linux practices<br>
>><br>
>> I'm currently experimenting with using <a href="http://check_snmp_load.pl" target="_blank">check_snmp_load.pl</a> to alarm on system<br>
>> overload.<br>
>><br>
>> Monitoring CPU usage is giving me a lot of false alarms due to their<br>
>> instantaneous nature.<br>
>><br>
>> I'm getting good results by using the NETSL option to report load averages.<br>
>> I'm setting '-c 99,4,10' to basically ignore the 1 minute value and alarm<br>
>> on 5 and 15 minutes.<br>
>><br>
>> Unfortunately, unlike the CPU percentages,  the load numbers should be based<br>
>> on the number of processors.  The NETSL option doesn't do that.<br>
>><br>
>> One option is to have a series of service commands based on the number of<br>
>> processors, but  I'm considering writing a new mode that will using the<br>
>> "STAND" option to get the number of CPUs and then use that as a<br>
>> multiplication factor for alarms.<br>
>><br>
>> Does that make sense?   Surely others have run into this problem.  How do you<br>
>> alarm on excessive load w/o causing lots of false alarms.<br>
>><br>
>> Robert<br>
>><br>
>><br>
>><br>
>><br>
>><br>
>><br>
----------------------------------------------------------------------------->><br>
-<br>
>> Colocation vs. Managed Hosting<br>
>> A question and answer guide to determining the best fit<br>
>> for your organization - today and in the future.<br>
>> <a href="http://p.sf.net/sfu/internap-sfd2d" target="_blank">http://p.sf.net/sfu/internap-sfd2d</a><br>
>> _______________________________________________<br>
>> Nagios-users mailing list<br>
>> <a href="mailto:Nagios-users@lists.sourceforge.net">Nagios-users@lists.sourceforge.net</a><br>
>> <a href="https://lists.sourceforge.net/lists/listinfo/nagios-users" target="_blank">https://lists.sourceforge.net/lists/listinfo/nagios-users</a><br>
>> ::: Please include Nagios version, plugin version (-v) and OS when reporting<br>
>> any issue.<br>
>> ::: Messages without supporting info will risk being sent to /dev/null<br>
>><br>
><br>
> ------------------------------------------------------------------------------<br>
> Colocation vs. Managed Hosting<br>
> A question and answer guide to determining the best fit<br>
> for your organization - today and in the future.<br>
> <a href="http://p.sf.net/sfu/internap-sfd2d" target="_blank">http://p.sf.net/sfu/internap-sfd2d</a><br>
> _______________________________________________<br>
> Nagios-users mailing list<br>
> <a href="mailto:Nagios-users@lists.sourceforge.net">Nagios-users@lists.sourceforge.net</a><br>
> <a href="https://lists.sourceforge.net/lists/listinfo/nagios-users" target="_blank">https://lists.sourceforge.net/lists/listinfo/nagios-users</a><br>
> ::: Please include Nagios version, plugin version (-v) and OS when reporting<br>
> any issue.<br>
> ::: Messages without supporting info will risk being sent to /dev/null<br>
<br>
Joe<br>
--<br>
<br>
Joe Beck | IT-Open Systems Engineer | urban outfitters inc.<br>
5000 South Broad Street | Phila., PA 19112 | <a href="tel:215.454.7737">215.454.7737</a> | <a href="mailto:jbeck@urbn.com">jbeck@urbn.com</a><br>
<br>
<br>
------------------------------------------------------------------------------<br>
Colocation vs. Managed Hosting<br>
A question and answer guide to determining the best fit<br>
for your organization - today and in the future.<br>
<a href="http://p.sf.net/sfu/internap-sfd2d" target="_blank">http://p.sf.net/sfu/internap-sfd2d</a><br>
_______________________________________________<br>
Nagios-users mailing list<br>
<a href="mailto:Nagios-users@lists.sourceforge.net">Nagios-users@lists.sourceforge.net</a><br>
<a href="https://lists.sourceforge.net/lists/listinfo/nagios-users" target="_blank">https://lists.sourceforge.net/lists/listinfo/nagios-users</a><br>
::: Please include Nagios version, plugin version (-v) and OS when reporting any issue.<br>
::: Messages without supporting info will risk being sent to /dev/null<br>
</blockquote></div><br><br clear="all"><br>-- <br>Gary Every<br>"Pay it Forward!"<br><br>
</div>