Agenda: ejercicios-nagios-rt.txt

File ejercicios-nagios-rt.txt, 5.0 KB (added by admin, 6 years ago)
Line 
1Nagios and Request Tracker Integration
2Creating Tickets
3
4Notas:
5------
6* Los comandos precedidos por "$" implican que debe ejecutar el comando
7  como usuario genérico - no como root
8* Los comandos precedidos por "#" implican que debería estar trabajando
9  como usuario root.
10* Los comandos con inicios de línea más específicos como "rtrX>" o
11  "mysql>" indican que debe ejecutar los comandos en un equipo remoto,
12  o dentro otro programa
13  another program.
14
15En resumen:
16-----------
17
18Para configurar RT y Nagios de manera que las alarmas de Nagios
19automáticamente creen tickets (incidencias) en RT, es necesario
20seguir los siguientes pasos:
21
22* Crear un contacto en Nagios
23* Actualizar la configuración de servicios o la de un nodo en particular
24  para usar el nuevo grupo de contactos.
25*
26
27Los siguientes dos pasos ya deberían estar hechos si ha terminado
28los ejercicios de RT.
29
30* Instalar el programa rt-mailgate y configurarlo apropiadamente
31  en su archivo de aliases para que su programa de correo lo pueda
32  usar.
33
34* Configurar las colas (queues) en RT de manera correspondiente
35  para recibir e-mails que lleguen de Nagios a través de rt-mailgate.
36
37Ejercicios
38---------------------------------
39
400. Ingrese en su máquina virtual con ssh, como usuario sysadm
41
42
431.) Configurar el contacto en Nagios
44-----------------------------------
45
46Conviértase en root:
47
48        $ sudo -s
49
50Edite el archivo de contactos
51
52        # editor /etc/nagios3/conf.d/contacts_nagios2.cfg
53
54En este archivo, primero agregaremos un nuevo contacto
55debajo del usuario root por defecto.
56
57ATENCIÓN: No elmine el contacto de root!
58
59El nuevo contacto debería verse similar a (DEBAJO DEL CONTACTO root):
60
61define contact{
62        contact_name                    net
63        alias                           RT Alert Queue
64        service_notification_period     24x7
65        host_notification_period        24x7
66        service_notification_options    c
67        host_notification_options       d
68        service_notification_commands   notify-service-by-email
69        host_notification_commands      notify-host-by-email
70        email                           net@localhost
71        }
72
73
74Ahora, al final del archivo, agregue también:
75(Nota: No borre o edite ninguna otra definición existente.)
76
77define contactgroup{
78        contactgroup_name       tickets
79        alias                   email to ticket system for RT
80        members                 net,root
81        }
82
83
84Grabe y salga
85
86Notas
87-----
88
89    - La opción "c" de service_notification significa que sólo se
90        ha de enviar una alarma cuando el servicio esté en estado
91        "crítico" en Nagios (ej. down). La opción "d" significa "down".
92        Si se seleccionan sólo "c" y "d", no se enviarán alarmas para
93        otros estados.
94
95    - Fíjese en la dirección de correo usada "net@localhost" - esto es
96        importante ya que esta cuenta se definió anteriormente en los
97        ejercicios de RT.
98
99    - Podría no incluir a "root" como miembro, pero lo hemos dejado para
100        que haya otro usuario recibiendo correo, y así podríamos resolver
101        problemas.
102
103
1043.) Elija un servicio a monitorear que pueda crear tickets en RT
105----------------------------------------------------------------
106
107Para que se generen tickets en RT si se cae el servicio SSH en una máquina,
108debemos editar el chequeo de servicio de SSH:
109
110        # editor /etc/nagios3/conf.d/services_nagios2.cfg
111
112Busque el servicio con el hostgroup_name de "ssh-servers" y agregue la línea
113"contact_groups". Cuando termine de editar la definición del servicio, será algo
114como lo siguiente:   
115
116define service {
117        hostgroup_name                  ssh-servers
118        service_description             SSH
119        check_command                   check_ssh
120        use                             generic-service
121        notification_interval           0 ; set > 0 if you want to be renotified
122        contact_groups                  tickets,admins
123}
124
125
126Grabe y salga del editor.
127
128Notas
129-----
130
131        - Fíjese en el elemento adicional que tenemos ahora, "contact_groups". Podría
132          hacer esto con otras definiciones si así lo desea.
133       
134        - También notará que incluimos el grupo de contacto por defecto "admins". Podría
135          no incluirlo si quiere.
136
137Reinicie Nagios para verificar que sus cambios son correctos:
138
139        # service nagios3 restart
140
141Si se cae el servicio SSH en cualquiera de los nodos que estamos monitoreando, Nagios
142debería generar un nuevo ticket en RT. Vamos a bajar el servicio SSH en el servidor
143NOC del taller. Si no está monitoreando esta máquina, tendrá que agregar configuración
144en Nagios (hostgroups_nagios2.cfg)
145
146
147
1485. Ver los tickets de nagios en RT
149----------------------------------
150
151        - Nagios tardará un rato (hasta 5 minutos) para reportar que el servicio
152          SSH está crítico. Luego ha de esperar un total de 4 chequeos para que el
153          servicio se considere como "down hard". En este momento, Nagios enviará
154          una notificación al e-mail net@localhost y se creará un ticket en RT.
155
156        - Recuerde ir a http://pcX.ws.nsrc.org/rt/ y entrar como "sysadm". El nuevo
157          ticket debería aparecer en la lista "10 newest unowned tickets" de la
158          página principal de RT.
159
160