I have not implemented distributed nagios but I have failover setup.  Few comments I want to make<br><br>1) If you are using ndoutils for backend make sure you have looked at faster speed up option.  There is a patch for faster start up in opsview <br>
<br>2) if you using nsca to transfer acknowledgement and comments make sure you do some research on that.  scalability is a problem<br><br>3) remember to understand failover architecture properly.  I have made few mistakes when it comes to ndoutils.  your ndomod data processing option should be different on the failover from master server.  Your master should push configuration definitions into database but your failover should not push theses configuration defitions in database.<br>
<br>4) Keep in mind scalability will be a problem.  data retention is really a difficult problem for large setup.<br><br><br><br><br><div class="gmail_quote">On Sat, Apr 10, 2010 at 10:44 AM, Shanti Katta <span dir="ltr"><<a href="mailto:shantikatta@gmail.com">shantikatta@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Need suggestions on designing a distributed and failover Nagios monitoring infrastructure for ~1500 Linux RHEL hosts spread across 2 datacenters and DMZ networks.<br>
Reading through different archives, it appears DNX is the most preferred method for distribution/cluster setup and having a secondary Nagios server as a fail over option managed via Linux HA/DRBD.<br>
What are some of the cons in following setup:<br><br>- Primary and secondary(failover) Nagios servers managed by Linux HA/DRBD/cron etc. Have MySQL replication between them.<br>- Primary Nagios server performing active checks via N DNX worker nodes in both datacenters.<br>

- Primary Nagios server monitoring DMZ hosts via NRPE (Custom regular expression for services).<br><br>Thanks <br>
<br>------------------------------------------------------------------------------<br>
Download Intel&#174; Parallel Studio Eval<br>
Try the new software tools for yourself. Speed compiling, find bugs<br>
proactively, and fine-tune applications for parallel performance.<br>
See why Intel Parallel Studio got high marks during beta.<br>
<a href="http://p.sf.net/sfu/intel-sw-dev" target="_blank">http://p.sf.net/sfu/intel-sw-dev</a><br>_______________________________________________<br>
Nagios-users mailing list<br>
<a href="mailto:Nagios-users@lists.sourceforge.net">Nagios-users@lists.sourceforge.net</a><br>
<a href="https://lists.sourceforge.net/lists/listinfo/nagios-users" target="_blank">https://lists.sourceforge.net/lists/listinfo/nagios-users</a><br>
::: Please include Nagios version, plugin version (-v) and OS when reporting any issue.<br>
::: Messages without supporting info will risk being sent to /dev/null<br></blockquote></div><br><br clear="all"><br>-- <br>Cordially,<br>Shadhin Rahman<br>