Áú»¢¶Ä²©

12 °ä´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô de interfaz de equipo inalcanzable/no disponible

Descripci¨®n general

Varios ±è²¹°ù¨¢³¾±ð³Ù°ù´Ç²õ de configuraci¨®n definen c¨®mo el servidor Áú»¢¶Ä²© debe comportarse cuando falla la verificaci¨®n de un agente (Áú»¢¶Ä²©, SNMP, IPMI, JMX). y una interfaz del equipo se vuelve inalcanzable.

Interfaz inalcanzable

Una interfaz de equipo se trata como inalcanzable despu¨¦s de una verificaci¨®n fallida (red error, tiempo de espera) por agentes Áú»¢¶Ä²©, SNMP, IPMI o JMX. Tenga en cuenta que las comprobaciones activas del agente Áú»¢¶Ä²© no influyen en la disponibilidad de la interfaz de ninguna manera.

A partir de ese momento UnreachableDelay define con qu¨¦ frecuencia una interfaz se vuelve a verificar utilizando una de las m¨¦tricas (incluidas las reglas LLD) en esta situaci¨®n de inaccesibilidad y dichas comprobaciones ya ser¨¢n realizadas por sondeadores inalcanzables (o sondeadores IPMI para verificaciones IPMI). Por defecto son 15 segundos antes del pr¨®ximo control.

En el registro del servidor Áú»¢¶Ä²©, la inaccesibilidad se indica mediante mensajes como estos:

La m¨¦trica del agente Áú»¢¶Ä²© "system.cpu.load[percpu,avg1]" en el equipo "Nuevo host" fall¨®: primer error de red, espere 15 segundos
       La m¨¦trica del agente Áú»¢¶Ä²© "system.cpu.load[percpu,avg15]" en el equipo "Nuevo host" fall¨®: otro error de red, espere 15 segundos

Tenga en cuenta que se indica la m¨¦trica exacta que fall¨® y el tipo de m¨¦trica (Agente Áú»¢¶Ä²©).

El par¨¢metro Timeout tambi¨¦n afectar¨¢ la antelaci¨®n con la que la interfaz se vuelve a comprobar durante la inaccesibilidad. Si el tiempo de espera es 20 segundos y UnreachableDelay 30 segundos, la pr¨®xima verificaci¨®n ser¨¢ en 50 segundos despu¨¦s del primer intento.

El par¨¢metro UnreachablePeriod define cu¨¢nto tiempo durar¨¢ la inalcanzabilidad en total. Por defecto, UnreachablePeriod es de 45 segundos. UnreachablePeriod deber¨ªa ser varias veces mayor que UnreachableDelay, para que una interfaz se vuelva a verificar m¨¢s de una vez antes de que una interfaz deja de estar disponible.

Cambiando la interfaz nuevamente a disponible

Cuando finaliza el per¨ªodo de inaccesibilidad, se vuelve a sondear la interfaz, decrementando la prioridad para la m¨¦trica que convirti¨® la interfaz en estado inalcanzable. Si la interfaz inalcanzable reaparece, el monitoreo vuelve al estado normal autom¨¢ticamente:

reanudando las comprobaciones del agente Áú»¢¶Ä²© en el equipo "Nuevo host": conexi¨®n restaurada

Una vez que la interfaz est¨¢ disponible, el equipo no sondea todos sus m¨¦tricas inmediatamente por dos razones:

  • Podr¨ªa sobrecargar el equipo.
  • El tiempo de restauraci¨®n de la interfaz no siempre coincide con el horario planificado de la m¨¦trica.

Entonces, una vez que la interfaz est¨¦ disponible, las m¨¦tricas no se sondean. inmediatamente, pero est¨¢n siendo reprogramados para su pr¨®xima ronda de consultas.

Interfaz no disponible

Una vez que finaliza el UnreachablePeriod y la interfaz no ha reaparecido, la interfaz se considera no disponible.

En el registro del servidor se indica con mensajes como estos:

deshabilitando temporalmente las comprobaciones del agente Áú»¢¶Ä²© en el equipo "Nuevo host": interfaz no disponible

y en el interfaz el icono de disponibilidad del equipo pasa de verde/gris a amarillo/rojo (los detalles de la interfaz inaccesible se pueden ver en el cuadro de sugerencias que aparece cuando se coloca el mouse sobre el icono de disponibilidad del equipo):

El par¨¢metro UnavailableDelay define la frecuencia con la que se verifica si una interfaz est¨¢ activa durante la indisponibilidad de la interfaz.

Por defecto son 60 segundos (por lo que en este caso "deshabilitar temporalmente", del mensaje de registro anterior, significar¨¢ deshabilitar las comprobaciones durante un minuto).

Cuando se restablece la conexi¨®n a la interfaz, el monitoreo regresa a la normalidad autom¨¢ticamente tambi¨¦n:

habilitando las comprobaciones del agente Áú»¢¶Ä²© en el equipo "Nuevo host": la interfaz estuvo disponible