Need suggestions on designing a distributed and failover Nagios monitoring infrastructure for ~1500 Linux RHEL hosts spread across 2 datacenters and DMZ networks.<br>Reading through different archives, it appears DNX is the most preferred method for distribution/cluster setup and having a secondary Nagios server as a fail over option managed via Linux HA/DRBD.<br>
What are some of the cons in following setup:<br><br>- Primary and secondary(failover) Nagios servers managed by Linux HA/DRBD/cron etc. Have MySQL replication between them.<br>- Primary Nagios server performing active checks via N DNX worker nodes in both datacenters.<br>
- Primary Nagios server monitoring DMZ hosts via NRPE (Custom regular expression for services).<br><br>Thanks <br>