Hi,<br><br>We've been happily using nagios for a year and a half or so to monitor a number of high performance linux clusters (total 200 nodes or so), plus infrastructure hosts. All works nicely and it is highlighting issues well before they become critical.
<br><br>One thing I have not found good solutions for is down time for cluster nodes.<br><br>Sometimes they are down briefly for maintenance, os reinstalls etc, and turning off checks in the GUI sort of works, most of the time. But we also turn machines off automatically, from other management software when they are not needed for a while.
<br><br>Does anyone have a way to script turning off checks and notifications for individual hosts or hostgroups? The only way I have identified is the GUI. If it is there built in I have failed to identify it in the docs.
<br><br>Thanks,<br><br>--Ian<br><br><br>