What kind of notifications are you doing and how many are you sending out? Why does a notification cycle take 9 seconds to complete?<br><br><div class="gmail_quote">On Sat, Jan 23, 2010 at 12:13 AM, Mike Lindsey <span dir="ltr"><<a href="mailto:mike-nagios@5dninja.net">mike-nagios@5dninja.net</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">What kind of options does one have, if your master nagios server is<br>
getting overloaded?<br>
<br>
I have half a dozen slaves doing polling, submitting passive check<br>
results back via send_nsca.  The master does no active polling, just<br>
event processing, notifications, and web ui.<br>
<br>
Under normal circumstances, it works alright.  But after a restart it<br>
can take up to half an hour before the master catches up; and if there<br>
are a lot of events, the act of sending out notifications can cause it<br>
to fall behind.<br>
<br>
I'm pre-caching my object file, I'm skipping circular dependency checks,<br>
and I've gotten a notification cycle down to 9 seconds.  I tried<br>
modifying nagios to fork before notifications, but that failed pretty<br>
spectacularly; so that 9 seconds is a time where 900 or so passive check<br>
submissions block until the notifications are done.<br>
<br>
Are there any options for running a dual-master setup, or other ways to<br>
spread the load across multiple machines?<br>
<br>
Has anyone patched nsca to submit check results into the checkresults<br>
directory, instead of via the nagios.cmd pipe?  What kind of improvement<br>
can one expect from that?<br>
<br>
Any other advice?<br>
<br>
--<br>
Mike Lindsey<br>
<br>
------------------------------------------------------------------------------<br>
Throughout its 18-year history, RSA Conference consistently attracts the<br>
world's best and brightest in the field, creating opportunities for Conference<br>
attendees to learn about information security's most important issues through<br>
interactions with peers, luminaries and emerging and established companies.<br>
<a href="http://p.sf.net/sfu/rsaconf-dev2dev" target="_blank">http://p.sf.net/sfu/rsaconf-dev2dev</a><br>
_______________________________________________<br>
Nagios-users mailing list<br>
<a href="mailto:Nagios-users@lists.sourceforge.net">Nagios-users@lists.sourceforge.net</a><br>
<a href="https://lists.sourceforge.net/lists/listinfo/nagios-users" target="_blank">https://lists.sourceforge.net/lists/listinfo/nagios-users</a><br>
::: Please include Nagios version, plugin version (-v) and OS when reporting any issue.<br>
::: Messages without supporting info will risk being sent to /dev/null<br>
</blockquote></div><br><br clear="all"><br>-- <br>Martin Melin<br>____________________________<br>op5 AB<br><a href="http://www.op5.com">http://www.op5.com</a><br><br><a href="http://www.op5.org/">http://www.op5.org/</a><br>
<a href="http://www.op5.com/op5/products/network-monitor/nagios/">http://www.op5.com/op5/products/network-monitor/nagios/</a> <br>