<html>
<head>
<style>
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
FONT-SIZE: 10pt;
FONT-FAMILY:Tahoma
}
</style>
</head>
<body class='hmmessage'>
Hi all,<BR> <BR>I have just installed Nagios 3.0rc1 into a Solaris 10 machine. Everything is working fine except when i tried to do a check_nrpe on a remote host or localhost. I check my /var/adm/messages. Below is a section of the output:<BR> <BR>
<BLOCKQUOTE dir=ltr style="MARGIN-RIGHT: 0px">
Jan  4 10:16:39 pnsgsit1gw1 nagios[263]: [ID 702911 user.info] Caught SIGTERM, shutting down...<BR>Jan  4 10:16:39 pnsgsit1gw1 nagios[263]: [ID 702911 user.info] Successfully shutdown... (PID=263)<BR>Jan  4 10:16:39 pnsgsit1gw1 nagios[290]: [ID 702911 user.info] Nagios 3.0rc1 starting... (PID=290)<BR>Jan  4 10:16:39 pnsgsit1gw1 nagios[290]: [ID 702911 user.info] Local time is Fri Jan 04 10:16:39 SGT 2008<BR>Jan  4 10:16:39 pnsgsit1gw1 nagios[290]: [ID 702911 user.info] LOG VERSION: 2.0<BR>Jan  4 10:16:39 pnsgsit1gw1 nagios[291]: [ID 702911 user.info] Finished daemonizing... (New PID=291)<BR>Jan  4 10:17:53 pnsgsit1gw1 genunix: [ID 603404 kern.notice] NOTICE: core_log: nagios[302] setid process, core not dumped: /var/core/core.nagios.302.pnsgsit1gw1.210033.65541.1199413073<BR>Jan  4 10:17:53 pnsgsit1gw1 nagios[291]: [ID 702911 user.info] Caught SIGTERM, shutting down...<BR>Jan  4 10:17:53 pnsgsit1gw1 nagios[291]: [ID 702911 user.info] Successfully shutdown... (PID=291)<BR>Jan  4 10:17:53 pnsgsit1gw1 nagios[305]: [ID 702911 user.info] Nagios 3.0rc1 starting... (PID=305)<BR>Jan  4 10:17:53 pnsgsit1gw1 nagios[305]: [ID 702911 user.info] Local time is Fri Jan 04 10:17:53 SGT 2008<BR>Jan  4 10:17:53 pnsgsit1gw1 nagios[305]: [ID 702911 user.info] LOG VERSION: 2.0<BR>Jan  4 10:17:53 pnsgsit1gw1 nagios[306]: [ID 702911 user.info] Finished daemonizing... (New PID=306)<BR>
<BR> <BR></BLOCKQUOTE>
This will repeat every few minutes and will not occur when i remove the nrpe service monitoring from the configuration. <BR>I tried to do a <B>/usr/local/nagios/libexec/check_nrpe -H pnsgsit1gw2 -c check_load,</B> The output seems fine except there is some addition characters appended to end. <BR>OK - load average: 0.00, 0.00, 0.00|load1=0.000;15.000;30.000;0; load5=0.000;10.000;25.000;0; load15=0.000;5.000;20.000;0;<BR>ÿ¿àpÿ:<BR><BR> <BR>Below is the debug log that i extracted. It seems that the nagios just core dump when a check_nrpe request is sent out and a new process is created:<BR>
 <BR><FONT size=2>
1199869965.255643] [064.1] [pid=720] Making callbacks (type 13)...<BR>
[1199869965.255659] [016.0] [pid=720] Checking service 'NRPE' on host 'pnsgsit1web2a'...<BR>
[1199869965.255752] [001.0] [pid=720] get_raw_command_line()<BR>
[1199869965.255774] [2320.2] [pid=720] Raw Command Input: $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$<BR>
[1199869965.255792] [001.0] [pid=720] process_macros()<BR>
[1199869965.255808] [2048.1] [pid=720] **** BEGIN MACRO PROCESSING ***********<BR>
[1199869965.255822] [2048.1] [pid=720] Processing: 'check_load'<BR>
[1199869965.255836] [2048.2] [pid=720] Processing part: 'check_load'<BR>
[1199869965.255851] [2048.2] [pid=720] Not currently in macro. Running output (10): 'check_load'<BR>
[1199869965.255866] [2048.1] [pid=720] Done. Final output: 'check_load'<BR>
[1199869965.255879] [2048.1] [pid=720] **** END MACRO PROCESSING *************<BR>
[1199869965.255892] [2320.2] [pid=720] Expanded Command Output: $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$<BR>
[1199869965.255905] [001.0] [pid=720] process_macros()<BR>
[1199869965.255919] [2048.1] [pid=720] **** BEGIN MACRO PROCESSING ***********<BR>
[1199869965.255931] [2048.1] [pid=720] Processing: '$USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$'<BR>
[1199869965.255945] [2048.2] [pid=720] Processing part: ''<BR>
[1199869965.255958] [2048.2] [pid=720] Not currently in macro. Running output (0): ''<BR>
[1199869965.255971] [2048.2] [pid=720] Processing part: 'USER1'<BR>
[1199869965.256010] [2048.2] [pid=720] Uncleaned macro. Running output (25): '/usr/local/nagios/libexec'<BR>
[1199869965.256025] [2048.2] [pid=720] Just finished macro. Running output (25): '/usr/local/nagios/libexec'<BR>
[1199869965.256039] [2048.2] [pid=720] Processing part: '/check_nrpe -H '<BR>
[1199869965.256054] [2048.2] [pid=720] Not currently in macro. Running output (40): '/usr/local/nagios/libexec/check_nrpe -H '<BR>
[1199869965.256068] [2048.2] [pid=720] Processing part: 'HOSTADDRESS'<BR>
[1199869965.256088] [2048.2] [pid=720] Uncleaned macro. Running output (52): '/usr/local/nagios/libexec/check_nrpe -H 10.106.65.18'<BR>
[1199869965.256103] [2048.2] [pid=720] Just finished macro. Running output (52): '/usr/local/nagios/libexec/check_nrpe -H 10.106.65.18'<BR>
[1199869965.256118] [2048.2] [pid=720] Processing part: ' -c '<BR>
[1199869965.256132] [2048.2] [pid=720] Not currently in macro. Running output (56): '/usr/local/nagios/libexec/check_nrpe -H 10.106.65.18 -c '<BR>
[1199869965.256218] [2048.2] [pid=720] Processing part: 'ARG1'<BR>
[1199869965.256245] [2048.2] [pid=720] Uncleaned macro. Running output (66): '/usr/local/nagios/libexec/check_nrpe -H 10.106.65.18 -c check_load'<BR>
[1199869965.256260] [2048.2] [pid=720] Just finished macro. Running output (66): '/usr/local/nagios/libexec/check_nrpe -H 10.106.65.18 -c check_load'<BR>
[1199869965.256274] [2048.2] [pid=720] Processing part: ''<BR>
[1199869965.256288] [2048.2] [pid=720] Not currently in macro. Running output (66): '/usr/local/nagios/libexec/check_nrpe -H 10.106.65.18 -c check_load'<BR>
[1199869965.256302] [2048.1] [pid=720] Done. Final output: '/usr/local/nagios/libexec/check_nrpe -H 10.106.65.18 -c check_load'<BR>
[1199869965.256316] [2048.1] [pid=720] **** END MACRO PROCESSING *************<BR>
[1199869965.256595] [016.1] [pid=720] Check result output will be written to '/usr/local/nagios/var/spool/checkresults/checkCmaaAb' (fd=9)<BR>
[1199869965.256737] [064.1] [pid=720] Making callbacks (type 13)...<BR>
[1199869965.257854] [016.2] [pid=720] Service check is executing in child process (pid=758)<BR>
[1199869965.260733] [001.0] [pid=758] process_macros()<BR>
[1199869965.260821] [001.0] [pid=758] process_macros()<BR>
[1199869965.260852] [001.0] [pid=758] process_macros()<BR>
[1199869965.260879] [001.0] [pid=758] process_macros()<BR>
[1199869965.260907] [001.0] [pid=758] process_macros()<BR>
[1199869965.260934] [001.0] [pid=758] process_macros()<BR>
[1199869965.267584] [001.0] [pid=720] handle_timed_event() end<BR>
[1199869965.267647] [008.1] [pid=720] ** Event Check Loop<BR>
[1199869965.267718] [008.1] [pid=720] Next High Priority Event Time: Wed Jan 9 17:12:52 2008<BR>
[1199869965.267742] [008.1] [pid=720] Next Low Priority Event Time: Wed Jan 9 17:14:32 2008<BR>
[1199869965.256737] [064.1] [pid=720] Making callbacks (type 13)...<BR>
[1199869965.257854] [016.2] [pid=720] Service check is executing in child process (pid=758)<BR>
[1199869965.260733] [001.0] [pid=758] process_macros()<BR>
[1199869965.260821] [001.0] [pid=758] process_macros()<BR>
[1199869965.260852] [001.0] [pid=758] process_macros()<BR>
[1199869965.260879] [001.0] [pid=758] process_macros()<BR>
[1199869965.260907] [001.0] [pid=758] process_macros()<BR>
[1199869965.260934] [001.0] [pid=758] process_macros()<BR>
[1199869965.267584] [001.0] [pid=720] handle_timed_event() end<BR>
[1199869965.267647] [008.1] [pid=720] ** Event Check Loop<BR>
[1199869965.267718] [008.1] [pid=720] Next High Priority Event Time: Wed Jan 9 17:12:52 2008<BR>
[1199869965.267742] [008.1] [pid=720] Next Low Priority Event Time: Wed Jan 9 17:14:32 2008<BR>
[1199869965.267758] [008.1] [pid=720] Current/Max Service Checks: 1/0<BR>
[1199869965.267773] [008.2] [pid=720] No events to execute at the moment. Idling for a bit...<BR>
[1199869965.267788] [001.0] [pid=720] check_for_external_commands()<BR>
[1199869965.267806] [064.1] [pid=720] Making callbacks (type 8)...<BR>
[1199869965.302735] [001.0] [pid=720] event_execution_loop() end<BR>
[1199869965.303213] [064.1] [pid=720] Making callbacks (type 9)...<BR>
[1199869965.303244] [064.1] [pid=720] Making callbacks (type 7)...<BR>
[1199869965.303260] [064.1] [pid=720] Making callbacks (type 7)...<BR>
[1199869965.303276] [064.1] [pid=720] Making callbacks (type 26)...<BR>
[1199869965.303291] [001.0] [pid=720] xrddefault_save_state_information()<BR>
[1199869965.303480] [004.2] [pid=720] Writing retention data to temp file '/usr/local/nagios/var/nagios.tmpDmaaAb'<BR>
[1199869965.325858] [064.1] [pid=720] Making callbacks (type 26)...<BR>
[1199869965.350393] [064.1] [pid=720] Making callbacks (type 9)...<BR>
[1199869965.404567] [001.0] [pid=762] drop_privileges() start<BR>
[1199869965.404797] [004.0] [pid=762] Original UID/GID: 0/0<BR>
[1199869965.453908] [004.0] [pid=762] New UID/GID: 210033/65541<BR>
[1199869965.454562] [064.1] [pid=762] Making callbacks (type 9)...<BR>
[1199869965.454874] [064.1] [pid=762] Making callbacks (type 9)...<BR>
[1199869965.455046] [064.1] [pid=762] Making callbacks (type 9)...<BR>
[1199869965.455064] [064.1] [pid=762] Making callbacks (type 7)...<BR>
[1199869965.462889] [064.1] [pid=762] Making callbacks (type 7)...<BR>
[1199869965.465180] [064.1] [pid=763] Making callbacks (type 7)...<BR>
[1199869965.465827] [064.1] [pid=763] Making callbacks (type 9)...<BR>
[1199869965.482936] [064.1] [pid=763] Making callbacks (type 26)...<BR>
[1199869965.482993] [001.0] [pid=763] xrddefault_read_state_information() start<BR>
[1199869965.483484] [064.1] [pid=763] Making callbacks (type 19)...<BR>
</FONT> <BR>
<BR>Anyone has any ideas of what could be the problem? Has anyone succeeded in using nagios 3.0rc1 on Solaris 10?<BR> <BR>Thanks<BR> <BR>Regards,<BR>Kelvin Xu<BR><BR><br /><hr />Get your free suite of Windows Live services! <a href='http://www.get.live.com/wl/all' target='_new'>Windows Live</a></body>
</html>