Hi all,<br>   I've looked at the documentation, at the mailling lists, and googled around, and don't explicitly see it so thought i'd try here....<br><br>On our system, I've set up nagios and it's monitoring a few things (http, etc) just fine.   However, one of our applications is giving us grief and sometimes starts consuming >80% of a cpu (it's a quad-core machine).   So i'd like to set up a monitor to see how often this happens and to get notified.   Looking around, it seems like 'check_procs' with the CPU metric should do what i want. <br>
<br>However, it doesn't seem to behave quite as I'd expect.   If I look at 'top' on this linux system, for our 'problem' application, i see this (and it will be constant like this for > 1 hour):<br>
<i><br>  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND<br>20022 ourapp   18   0 1428m 1.0g  13m S  <b style="color: rgb(255, 0, 0);">104</b> 25.7 442:18.39 java</i><br><br><br>So when I run this command, I'd expect to see 1 process flagged:<br>
<br><i>[root@ours libexec]# ./check_procs -w 10 -c 20 --metric=CPU<br>CPU OK: 173 processes<br></i><br><br>I've tried adding the '-u' flag but made no difference.  Is there something I'm missing if I want to capture and be notified when a process goes above a certain CPU usuage (ie. 80%)?<br>
Any help or information you could provide would be appreciated.<br><br>Thanks<br>