<html><body bgcolor="#FFFFFF"><div></div><div><span class="Apple-style-span" style="font-size: 15px; -webkit-tap-highlight-color: rgba(26, 26, 26, 0.296875); -webkit-composition-fill-color: rgba(175, 192, 227, 0.230469); -webkit-composition-frame-color: rgba(77, 128, 180, 0.230469); ">Need suggestions on designing a distributed and failover Nagios monitoring infrastructure for ~1500 Linux RHEL hosts spread across 2 datacenters and DMZ networks.<br>Reading through different archives, it appears DNX is the most preferred method for distribution/cluster setup and having a secondary Nagios server as a fail over option managed via Linux HA/DRBD.<br>What are some of the cons in following setup:<br><br>- Primary and secondary(failover) Nagios servers managed by Linux HA/DRBD/cron etc. Have MySQL replication between them.<br>- Primary Nagios server performing active checks via N DNX worker nodes in both datacenters.<br>- Primary Nagios server monitoring DMZ hosts via NRPE (Custom regular expression for services).<br><br>Thanks </span><br></div></body></html>