<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<META content="MSHTML 6.00.2800.1458" name=GENERATOR></HEAD>
<BODY style="MARGIN: 4px 4px 1px; FONT: 10pt Tahoma">
<DIV>Thanks for your help Jan.  I added the hosts to the central server with checks_enabled set to 0.  Then I added the two hosts to a service and set passive_checks enabled and active_checks disabled (maybe I don't need both set).  And it worked.  It added both devices and they are now showing green from the data received by the external command file.  I used "Check Host Alive" as the service description to match the service description on the distributed server.  Thanks for the help.  I will now try to add some hosts through a firewall and we will see if there are any other complications.</DIV>
<DIV> </DIV>
<DIV>--------------------------------------<BR>Tim Moore<BR>DNS/Linux/Cisco Admin<BR>ODJFS<BR><BR>>>> "Jan Scholten" <Jan.Scholten@iconz.net> 10/7/2004 5:15:06 PM >>><BR></DIV>
<DIV style="COLOR: #000000">As far as i know every host and every Service needs to be in the central  <BR>hosts.cfg/Services.cfg (even those, that are not actively checked), so  <BR>they are displayed.<BR><BR>So you need the "Check Host Alive" (which is in the default config named  <BR>PING) to be configured for acdmz-inside-sw2. Passive checks must be  <BR>enabled for this servicecheck active checks should be disabled:<BR>active_checks_enabled 0<BR>passive_checks_enabled 1<BR><BR>You can easyliey see what is missing:<BR><BR>> EXTERNAL COMMAND: PROCESS_SERVICE_CHECK_RESULT;acdmz-inside-sw2;Check  <BR>> Host Alive;0;PING OK - Packet loss = 0%, RTA = 0.83 ms<BR>> Oct  6 15:02:44 noc-mon nagios: Warning:  Message queue contained  <BR>> results for service 'Check Host Alive' on host 'acdmz-inside-sw2'.  The  <BR>> service could not be found!<BR><BR>You need the service "Check Host Alive" defined for Host  <BR>"acdmz-inside-sw2" which does noit seem to work Have you tried using  <BR>Service Desriptions without Blanks? --> Change to Check_Host_Alive ?<BR><BR><BR>YOU NEED TO DEFINE ALL HOSTS on the Central Server as well (you use  <BR>check_dummy 0 as Host check or set check_poeriod to none)<BR><BR>Jan<BR><BR>> Jan,<BR>> Here are the lines from the services.cfg of the distributed server:<BR>> define service {<BR>> host_name                      localhost<BR>> service_description            cpu<BR>> check_command                  check_local_load!3!5<BR>> use                            generic-service<BR>> max_check_attempts             3<BR>> normal_check_interval          3<BR>> retry_check_interval           1<BR>> check_period                   24x7<BR>> notifications_enabled          0<BR>> notification_interval          0<BR>> notification_period            24x7<BR>> notification_options           w,u,c,r<BR>> contact_groups                 admins<BR>> }<BR>> define service {<BR>> hostgroup_name                 ACDMZ_Switches,ACDMZ_Firewalls<BR>> service_description            Check Host Alive<BR>> check_command                  check-host-alive<BR>> max_check_attempts             3<BR>> normal_check_interval          5<BR>> retry_check_interval           1<BR>> check_period                   24x7<BR>> notification_interval          0<BR>> notification_period            24x7<BR>> notification_options           w,u,c,r<BR>> notifications_enabled          1<BR>> contact_groups                 noc<BR>> }<BR>> My check_command is check-host-alive and not ping.  Funny thing is that  <BR>> when the localhost cpu sends its checks, it seems to work.  Although, I  <BR>> still don't know what to look for on the central server.  Should I see  <BR>> some new hosts being added or does it only alarm when it fails?  Do I  <BR>> also have to add the hosts to the central server?  I only have the hosts  <BR>> in the ACDMZ_Switches defined on the distributed server.  Just curious  <BR>> how we get notified of problems from the distributed server.  I have a  <BR>> couple devices that I cannot reach via ping (check-host-alive) and they  <BR>> still never show as down on the central server gui.<BR>> Thanks for the help.<BR>> --------------------------------------<BR>> Tim Moore<BR>> DNS/Linux/Cisco Admin<BR>> ODJFS<BR>><BR>>>>> "Jan Scholten" <Jan.Scholten@iconz.net> 10/6/2004 4:51:05 PM >>><BR>><BR>> Can you supply the relevant part of services.cfg?<BR>><BR>> It seems you have a misconfiguration. Are you sure the service is Check<BR>> Host Alive and not PING (like default)?<BR>> I don't know whether Nagios likes a servie_name with a blank, so try it<BR>> without!<BR>> So the return value ServiceName("Check Host Alive" in your case) must be<BR>> the same  as your service_description in the services.cfg for that host.<BR>><BR>><BR>> Jan<BR>><BR>>> I just recently setup distributed nagios.  I followed the directions<BR>>> very closely.  I first had a problem running the nsca daemon through<BR>>> xinetd.  It just wouldn't listen for incoming on 5667.  I added the line<BR>>> to /etc/services also.  Here is my config:<BR>>> service nsca<BR>>> {<BR>>>         flags           = REUSE<BR>>>         socket_type     = stream<BR>>>         wait            = no<BR>>>         user            = nagios<BR>>>         group           = nagios<BR>>>         server          = /usr/local/nagios/bin/nsca<BR>>>         server_args     = -c /usr/local/nagios/etc/nsca.cfg<BR>>>         log_on_failure  += USERID<BR>>>         disable         = no<BR>>>         only_from       = 10.12.225.50<BR>>> }<BR>>><BR>>> If I run it from command line in daemon mode it works fine.<BR>>> My main problem, is that when passive checks are sent to the central<BR>>> server I keep getting this error:<BR>>> Oct  6 15:02:28 noc-mon nsca[31620]: Connection from 10.12.225.50 port<BR>>> 38784<BR>>> Oct  6 15:02:28 noc-mon nsca[31620]: Host address checks out ok<BR>>> Oct  6 15:02:28 noc-mon nsca[31620]: Handling the connection...<BR>>> Oct  6 15:02:29 noc-mon nsca[31620]: SERVICE CHECK -> Host Name:<BR>>> 'localhost', Service Description: 'cpu', Return Code: '0', Output: 'OK -<BR>>> load average: 0.00, 0.00, 0.00'<BR>>> Oct  6 15:02:29 noc-mon nsca[31620]: End of connection...<BR>>> Oct  6 15:02:30 noc-mon nagios: EXTERNAL COMMAND:<BR>>> PROCESS_SERVICE_CHECK_RESULT;localhost;cpu;0;OK - load average: 0.00,<BR>>> 0.00, 0.00<BR>>> Oct  6 15:02:39 noc-mon nsca[31817]: Connection from 10.12.225.50 port<BR>>> 39040<BR>>> Oct  6 15:02:39 noc-mon nsca[31817]: Host address checks out ok<BR>>> Oct  6 15:02:39 noc-mon nsca[31817]: Handling the connection...<BR>>> Oct  6 15:02:40 noc-mon nsca[31817]: SERVICE CHECK -> Host Name:<BR>>> 'acdmz-inside-sw2', Service Description: 'Check Host Alive', Return<BR>>> Code: '0', Output: 'PING OK - Packet loss = 0%, RTA = 0.83 ms'<BR>>> Oct  6 15:02:40 noc-mon nsca[31817]: End of connection...<BR>>> Oct  6 15:02:40 noc-mon nagios: EXTERNAL COMMAND:<BR>>> PROCESS_SERVICE_CHECK_RESULT;acdmz-inside-sw2;Check Host Alive;0;PING OK<BR>>> - Packet loss = 0%, RTA = 0.83 ms<BR>>> Oct  6 15:02:44 noc-mon nagios: Warning:  Message queue contained<BR>>> results for service 'Check Host Alive' on host 'acdmz-inside-sw2'.  The<BR>>> service could not be found!<BR>>><BR>>> The localhost check acts like it works, but the simple check-host-alive<BR>>> service definition is not.  I know that that service definition is on<BR>>> both servers.  They are both running v1.2.  Also, should I see something<BR>>> on my central server's web gui showing these hosts down?  My host count<BR>>> has not been affected at all by the hosts added to the distributed<BR>>> server.  Am I missing something?  Is there something wrong with the<BR>>> default check-host-alive service check?<BR>>> Thanks for any help,<BR>>> --------------------------------------<BR>>> Tim Moore<BR>>> DNS/Linux/Cisco Admin<BR>>> ODJFS<BR>>><BR>><BR>><BR>><BR><BR><BR><BR>-- <BR>Jan Scholten<BR>Research and Development Intern<BR>Iconz.co.nz<BR></DIV></BODY></HTML>