Áú»¢¶Ä²©

Esta es una traducci¨®n de la p¨¢gina de documentaci¨®n original en espa?ol. Ay¨²danos a mejorarla.

#4 Comprobaciones de IPMI

Descripci¨®n general

Puede monitorear el estado y la disponibilidad de Intelligent Platform Dispositivos de interfaz de gesti¨®n (IPMI) en Áú»¢¶Ä²©. Para realizar comprobaciones de IPMI El servidor Áú»¢¶Ä²© debe estar inicialmente configurado con Soporte IPMI.

IPMI es una interfaz estandarizada para "apagado de luces" remoto o Gesti¨®n "fuera de banda" de sistemas inform¨¢ticos. Permite monitorear estado del hardware directamente desde la llamada gesti¨®n "fuera de banda" tarjetas, independientemente del sistema operativo o de si la m¨¢quina est¨¢ encendido en absoluto.

La monitorizaci¨®n IPMI de Áú»¢¶Ä²© funciona solo para dispositivos compatibles con IPMI (HP iLO, DELL DRAC, IBM RSA, Sun SSP, etc.).

Un proceso de administrador de IPMI programa las comprobaciones de IPMI por parte de los encuestadores de IPMI. Un host siempre es sondeado por un solo sondeador IPMI a la vez, reducir el n¨²mero de conexiones abiertas a BMC controladores. Por lo tanto, es seguro aumentar el n¨²mero de IPMI. encuestadores sin preocuparse por la sobrecarga del controlador BMC. El IPMI El proceso de administrador se inicia autom¨¢ticamente cuando al menos un encuestador IPMI Est¨¢ empezado.

Consulte tambi¨¦n problemas conocidos para verificaciones de IPMI.

°ä´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô

°ä´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô del host

Se debe configurar un host para procesar comprobaciones de IPMI. Una interfaz IPMI debe agregarse, con los respectivos n¨²meros de IP y puerto, e IPMI se deben definir los par¨¢metros de autenticaci¨®n.

Consulte la configuraci¨®n de hosts para obtener m¨¢s informaci¨®n. detalles.

°ä´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô del servidor

De forma predeterminada, el servidor Áú»¢¶Ä²© no est¨¢ configurado para iniciar ninguna IPMI sondeadores, por lo que cualquier elemento IPMI agregado no funcionar¨¢. Para cambiar esto, abra el Archivo de configuraci¨®n del servidor Áú»¢¶Ä²© (zabbix_server.conf) como ra¨ªz y busca la siguiente l¨ªnea:

# InicioIPMIPollers=0

Descom¨¦ntalo y establece el conteo de sondeadores en, digamos, 3, para que diga:

InicioIPMIPollers=3

Guarde el archivo y luego reinicie zabbix_server.

°ä´Ç²Ô´Ú¾±²µ³Ü°ù²¹³¦¾±¨®²Ô del elemento

Al configurar un elemento en un nivel de host:

  • Seleccione 'Agente de IPMI' como Tipo
  • Ingrese un elemento clave que sea ¨²nico dentro del host (digamos, ipmi.fan.rpm)
  • Para Interfaz de host, seleccione la interfaz IPMI relevante (IP y Puerto). Tenga en cuenta que debe existir una interfaz IPMI en el host.
  • Especifique el sensor IPMI (por ejemplo, 'FAN MOD 1A RPM' en Dell Poweredge) para recuperar la m¨¦trica. Por defecto, la identificaci¨®n del sensor debe especificarse. Tambi¨¦n es posible utilizar prefijos antes del valor:
    • id: - para especificar el ID del sensor;
    • name: - para especificar el nombre completo del sensor. Esto puede ser ¨²til en situaciones en las que los sensores solo se pueden distinguir especificando el nombre completo.
  • Seleccione el tipo de informaci¨®n respectivo ('Num¨¦rico (flotante)' en este caso; para sensores discretos - 'Num¨¦rico (sin signo)'), unidades (la mayor¨ªa probablemente 'rpm') y cualquier otro atributo de art¨ªculo requerido
Comprobaciones soportadas

El agente IPMI admite la m¨¦trica integrada ipmi.get, que devuelve informaci¨®n relacionada con el sensor IPMI y se puede utilizar para el descubrimiento de sensores IPMI.
Valor de retorno: objeto JSON

Tiempo de espera y terminaci¨®n de la sesi¨®n

Los tiempos de espera de los mensajes de IPMI y los recuentos de reintentos se definen en la biblioteca OpenIPMI. Debido al dise?o actual de OpenIPMI, no es posible realizar estos valores configurables en Áú»¢¶Ä²©, ni a nivel de interfaz ni de elemento.

El tiempo de espera de inactividad de la sesi¨®n de IPMI para LAN es de 60 +/-3 segundos. Actualmente no es posible implementar el env¨ªo peri¨®dico de Activate Session comando con OpenIPMI. Si no hay comprobaciones de elementos IPMI de Áú»¢¶Ä²© a un BMC en particular por m¨¢s del tiempo de espera de la sesi¨®n configurado en BMC y luego la siguiente comprobaci¨®n de IPMI despu¨¦s de que expire el tiempo de espera se agotar¨¢ debido a tiempos de espera de mensajes individuales, reintentos o errores de recepci¨®n. Despu¨¦s de eso, un nuevo se abre la sesi¨®n y se inicia una nueva exploraci¨®n completa del BMC. Si tu quieres Para evitar escaneos innecesarios del BMC, se recomienda configurar el IPMI intervalo de sondeo de elementos por debajo del tiempo de espera de inactividad de la sesi¨®n de IPMI configurado en BMC.

Notas sobre sensores discretos IPMI

Para encontrar sensores en un host, inicie el servidor Áú»¢¶Ä²© con DebugLevel=4 activado. Espere unos minutos y busque registros de descubrimiento de sensores en Áú»¢¶Ä²© archivo de registro del servidor:

$ grep 'Sensor agregado' zabbix_server.log
       8358:20130318:111122.170 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:7 id:'CATERR' tipo_lectura:0x3 ('estado_discreto') tipo:0x7 ('procesador') nombre_completo:'(r0. 32.3.0).CATERR'
       8358:20130318:111122.170 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'CPU Therm Trip' tipo de lectura:0x3 ('estado_discreto') tipo:0x1 ('temperatura') nombre_completo:'( 7.1).Disparo t¨¦rmico de la CPU'
       8358:20130318:111122.171 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'Registro de eventos del sistema' tipo de lectura:0x6f ('espec¨ªfico del sensor') tipo:0x10 ('event_logging_disabled') nombre_completo:' (7.1).Registro de eventos del sistema'
       8358:20130318:111122.171 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'PhysicalSecurity' tipo de lectura:0x6f ('espec¨ªfico del sensor') tipo:0x5 ('²õ±ð²µ³Ü°ù¾±»å²¹»å³å´Ú¨ª²õ¾±³¦²¹') nombre_completo:'(23.1 ).Seguridad f¨ªsica'
       8358:20130318:111122.171 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'IPMI Watchdog' tipo de lectura:0x6f ('sensor espec¨ªfico') tipo:0x23 ('watchdog_2') nombre_completo:'( 7.7).Perro guardi¨¢n de IPMI'
       8358:20130318:111122.171 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'Estad¨ªsticas de la unidad de energ¨ªa' tipo de lectura:0x6f ('espec¨ªfico del sensor') tipo:0x9 ('unidad_de_potencia') nombre_completo:' (21.1).Estad¨ªsticas de la unidad de potencia
       8358:20130318:111122.171 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Ctrl %' tipo_lectura:0x1 ('umbral') tipo:0x1 ('temperatura') nombre_completo:' (3.1).P1 Ctrl T¨¦rmico %'
       8358:20130318:111122.172 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Margin' tipo de lectura:0x1 ('umbral') tipo:0x1 ('temperatura') nombre_completo:'( 3.2).Margen t¨¦rmico P1
       8358:20130318:111122.172 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 2' tipo de lectura:0x1 ('umbral') tipo:0x4 ('ventilador') nombre_completo:'( 29.1).Ventilador del sistema 2'
       8358:20130318:111122.172 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 3' tipo de lectura:0x1 ('umbral') tipo:0x4 ('ventilador') nombre_completo:'( 29.1).Ventilador del sistema 3'
       8358:20130318:111122.172 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'P1 Mem Margin' tipo de lectura:0x1 ('umbral') tipo:0x1 ('temperatura') nombre_completo:'( 7.6).Margen de memoria P1
       8358:20130318:111122.172 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'Temperatura del panel frontal' tipo de lectura:0x1 ('umbral') tipo:0x1 ('temperatura') nombre_completo:'( 7.6).Temperatura del panel frontal'
       8358:20130318:111122.173 Sensor agregado: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'Temperatura de la placa base' tipo de lectura:0x1 ('umbral') tipo:0x1 ('temperatura') nombre_completo:'(7.6 ).Temperatura del z¨®calo'
       8358:20130318:111122.173 Sensor agregado: host:'192.168.1.12:623' tipo_id:0 id_sz:9 id:'BB +5.0V' tipo_lectura:0x1 ('umbral') tipo:0x2 ('voltaje') nombre_completo:' (7.1).BB +5.0V'
       8358:20130318:111122.173 Sensor agregado: host:'192.168.1.12:623' tipo_id:0 id_sz:14 id:'BB +3.3V STBY' tipo_lectura:0x1 ('umbral') tipo:0x2 ('voltaje') nombre_completo: '(7.1).BB +3.3V EN ESPERA'
       8358:20130318:111122.173 Sensor agregado: host:'192.168.1.12:623' tipo_id:0 id_sz:9 id:'BB +3.3V' tipo_lectura:0x1 ('umbral') tipo:0x2 ('voltaje') nombre_completo:' (7.1).BB +3.3V'
       8358:20130318:111122.173 Sensor agregado: host:'192.168.1.12:623' tipo_id:0 id_sz:17 id:'BB +1.5V P1 DDR3' tipo_lectura:0x1 ('umbral') tipo:0x2 ('voltaje') nombre_completo :'(7.1).BB +1.5V P1 DDR3'
       8358:20130318:111122.173 Sensor agregado: host:'192.168.1.12:623' tipo_id:0 id_sz:17 id:'BB +1.1V P1 Vccp' tipo_lectura:0x1 ('umbral') tipo:0x2 ('voltaje') nombre_completo :'(7.1).BB +1.1V P1 Vccp'
       8358:20130318:111122.174 Sensor agregado: host:'192.168.1.12:623' tipo_id:0 id_sz:14 id:'BB +1.05V PCH' tipo_lectura:0x1 ('umbral') tipo:0x2 ('voltaje') nombre_completo: '(7.1).BB +1.05V PCH'

Para decodificar los tipos y estados de los sensores IPMI, se necesita una copia de est¨¢ disponible (tenga en cuenta que seg¨²n la especificaci¨®n IPMI).

El primer par¨¢metro para comenzar es "reading_type". Utilice la "Tabla 42-1, Rangos de c¨®digos de tipo de evento/lectura" de las especificaciones para decodificar C¨®digo "lectura_tipo". La mayor¨ªa de los sensores en nuestro ejemplo tienen "reading_type:0x1" que significa sensor de "umbral". "Tabla 42-3, Sensores C¨®digos de tipo" muestra que "tipo:0x1" significa sensor de temperatura, "tipo:0x2" - sensor de voltaje, "tipo:0x4" - Ventilador, etc. Los sensores de umbral a veces son llamados sensores "anal¨®gicos" ya que miden par¨¢metros continuos como temperatura, voltaje, revoluciones por minuto.

Otro ejemplo: un sensor con "lectura_tipo:0x3". "Tabla 42-1, Rangos de c¨®digos de tipo de evento/lectura" dice que los c¨®digos de tipo de lectura 02h-0Ch significa sensor "discreto gen¨¦rico". Los sensores discretos tienen hasta 15 posibles estados (en otras palabras, hasta 15 bits significativos). Por ejemplo, para sensor 'CATERR' con "tipo:0x7" la "Tabla 42-3, C¨®digos de tipo de sensor" muestra que este tipo significa "Procesador" y el significado de individuo bits es: 00h (el bit menos significativo) - IERR, 01h - Disparo t¨¦rmico, etc.

Hay pocos sensores con "reading_type:0x6f" en nuestro ejemplo. Para estos sensores, la "Tabla 42-1, Rangos de c¨®digos de tipo de evento/lectura" recomienda utilizar la "Tabla 42-3, C¨®digos de tipo de sensor" para decodificar el significado de los bits. Por ejemplo, el sensor 'Power Unit Stat' tiene el tipo "tipo:0x9", lo que significa "Unidad de poder". Offset 00h significa "Apagado/Apagado". En otras palabras si el bit menos significativo es 1, entonces el servidor se apaga. para probar esto bit, el bity ´Ú³Ü²Ô³¦¾±¨®²Ô con Se puede utilizar la m¨¢scara '1'. La expresi¨®n desencadenante podr¨ªa ser como

bitand(last(/www.example.com/Power Unit Stat,#1),1)=1

para advertir sobre el apagado del servidor.

Notas sobre nombres de sensores discretos en OpenIPMI-2.0.16, 2.0.17, 2.0.18 y 2.0.19

Nombres de sensores discretos en OpenIPMI-2.0.16, 2.0.17 y 2.0.18 a menudo tener un "0" adicional (o alg¨²n otro d¨ªgito o letra) adjunto al final. Por ejemplo, mientras ipmitool y OpenIPMI-2.0.19 muestran el sensor nombres como "PhysicalSecurity" o "CATERR", en OpenIPMI-2.0.16, 2.0.17 y 2.0.18 los nombres son "PhysicalSecurity0" o "CATERR0", respectivamente.

Al configurar un elemento de IPMI con el servidor Áú»¢¶Ä²© usando OpenIPMI-2.0.16, 2.0.17 y 2.0.18, use estos nombres que terminen en "0" en el sensor IPMI campo de elementos de agente de IPMI. Cuando su servidor Áú»¢¶Ä²© se actualiza a un nuevo Distribuci¨®n de Linux, que utiliza OpenIPMI-2.0.19 (o posterior), elementos con estos sensores discretos de IPMI pasar¨¢n a ser "NO COMPATIBLES". Tienes que cambie sus nombres de sensor IPMI (elimine el '0' al final) y espere durante alg¨²n tiempo antes de que vuelvan a estar "Habilitados".

Notas sobre la disponibilidad simult¨¢nea de umbral y sensor discreto

Algunos agentes IPMI proporcionan tanto un sensor de umbral como un sensor discreto. bajo el mismo nombre. Siempre se da preferencia al sensor de umbral.

Notas sobre la terminaci¨®n de la conexi¨®n

Si no se realizan comprobaciones de IPMI (por cualquier motivo: todos los elementos de IPMI del host deshabilitado/no compatible, host deshabilitado/eliminado, host en mantenimiento, etc.) la conexi¨®n IPMI terminar¨¢ desde el servidor Áú»¢¶Ä²© o proxy en 3 a 4 horas dependiendo de la hora en que se inici¨® el servidor/proxy Áú»¢¶Ä²©.