Áú»¢¶Ä²©

This is the documentation page for an unsupported version of Áú»¢¶Ä²©.
Is this not what you were looking for? Switch to the current version or choose one from the drop-down menu.

4 V¨¦rifications IPMI

Aper?u

Vous pouvez superviser l'int¨¦grit¨¦ et la disponibilit¨¦ des p¨¦riph¨¦riques IPMI (Intelligent Platform Management Interface) dans Áú»¢¶Ä²©. Pour effectuer les v¨¦rifications IPMI, le serveur Áú»¢¶Ä²© doit initialement ¨ºtre ³¦´Ç²Ô´Ú¾±²µ³Ü°ù¨¦ avec le support IPMI.

IPMI est une interface normalis¨¦e pour la gestion ¨¤ distance de syst¨¨mes informatiques. Il permet de surveiller l'¨¦tat du mat¨¦riel directement ¨¤ partir des cartes de gestion dites ?out-of-band?, ind¨¦pendamment du syst¨¨me d'exploitation ou de la mise sous tension de la machine.

La surveillance IPMI de Áú»¢¶Ä²© ne fonctionne que pour les p¨¦riph¨¦riques prenant en charge IPMI (HP iLO, DELL DRAC, IBM RSA, Sun SSP, etc.).

Depuis Áú»¢¶Ä²© 3.4, un nouveau processus de gestion IPMI a ¨¦t¨¦ ajout¨¦ pour planifier les v¨¦rifications IPMI par les pollers IPMI. Maintenant, un h?te est toujours interrog¨¦ par un seul poller IPMI ¨¤ la fois, ce qui r¨¦duit le nombre de connexions ouvertes aux contr?leurs BMC. Avec ces modifications, il est s?r d'augmenter le nombre de pollers IPMI sans se soucier de la surcharge du contr?leur BMC. Le processus du gestion IPMI est automatiquement d¨¦marr¨¦ lorsqu'au moins un poller IPMI est d¨¦marr¨¦.

Voir aussi les probl¨¨mes connus pour les v¨¦rifications IPMI.

Configuration

Configuration de l'h?te

Un h?te doit ¨ºtre ³¦´Ç²Ô´Ú¾±²µ³Ü°ù¨¦ pour traiter les v¨¦rifications IPMI. Une interface IPMI doit ¨ºtre ajout¨¦e, avec les adresses IP et les num¨¦ros de port respectifs, et les param¨¨tres d'authentification IPMI doivent ¨ºtre d¨¦finis.

Voir la configuration des h?tes pour plus de d¨¦tails.

Configuration du serveur

Par d¨¦faut, le serveur Áú»¢¶Ä²© n'est pas ³¦´Ç²Ô´Ú¾±²µ³Ü°ù¨¦ pour d¨¦marrer les pollers IPMI. Par cons¨¦quent, les ¨¦l¨¦ments IPMI ajout¨¦s ne fonctionneront pas. Pour changer cela, ouvrez le fichier de configuration du serveur Áú»¢¶Ä²© (zabbix_server.conf) en tant qu'utilisateur root et recherchez la ligne suivante :

# StartIPMIPollers=0

D¨¦commentez-la et d¨¦finissez le nombre d'interrogation sur, disons, 3, afin qu'il indique :

StartIPMIPollers=3

Enregistrez le fichier et red¨¦marrez ensuite zabbix_server.

Configuration de l'¨¦l¨¦ment

Lors de la configuration d'un ¨¦l¨¦ment au niveau de l'h?te :

  • Pour l'interface h?te, s¨¦lectionnez l'IP IPMI et le port
  • S¨¦lectionnez 'IPMI agent' comme Type
  • Sp¨¦cifiez le capteur IPMI (par exemple 'FAN MOD 1A RPM' sur Dell Poweredge). Par d¨¦faut, l'ID du capteur doit ¨ºtre sp¨¦cifi¨¦. Il est aussi possible d'utiliser des pr¨¦fixe avant la valeur :
    • id: - pour sp¨¦cifier l'ID du capteur ;
    • name: - pour sp¨¦cifier le nom complet du capteur. Cela peut ¨ºtre utile dans certaines situations quand les capteurs peuvent seulement ¨ºtre distingu¨¦s en sp¨¦cifiant le nom complet.
  • Entrez une ³¦±ô¨¦ d'¨¦l¨¦ment qui unique pour l'h?te (disons, ipmi.fan.rpm)
  • S¨¦lectionnez le type d'information correspondant ('Num¨¦rique (flottant)' dans ce cas, pour les capteurs discrets - 'Num¨¦rique (non sign¨¦)'), les unit¨¦s (tr¨¨s probablement 'rpm') et tout autre attribut d'¨¦l¨¦ment requis

D¨¦lai d'expiration et fin de session

Les d¨¦lais d'attente de messages IPMI et les compteurs de tentatives sont d¨¦finis dans la biblioth¨¨que OpenIPMI. Du fait de la conception actuelle d'OpenIPMI, il n'est pas possible de rendre ces valeurs configurables dans Áú»¢¶Ä²©, ni au niveau de l'interface ni au niveau de l'objet.

Le d¨¦lai d'inactivit¨¦ de la session IPMI pour le r¨¦seau local est de 60 +/- 3 secondes. Actuellement, il n'est pas possible d'impl¨¦menter l'envoi p¨¦riodique de la commande ? Activate Session ? avec OpenIPMI. S'il n'y a pas de v¨¦rifications d'¨¦l¨¦ments IPMI depuis Áú»¢¶Ä²© vers un contr?leur BMC particulier pendant plus de la temporisation de session ³¦´Ç²Ô´Ú¾±²µ³Ü°ù¨¦e dans BMC, la v¨¦rification IPMI suivante apr¨¨s l'expiration du d¨¦lai expire en raison des d¨¦lais d'attente, des nouvelles tentatives ou des erreurs de r¨¦ception. Apr¨¨s cela, une nouvelle session est ouverte et une nouvelle analyse du contr?leur BMC est lanc¨¦e. Si vous souhaitez ¨¦viter les rediffusions inutiles du contr?leur BMC, il est conseill¨¦ de d¨¦finir l'intervalle d'interrogation de l'¨¦l¨¦ment IPMI sous le d¨¦lai d'inactivit¨¦ de la session IPMI ³¦´Ç²Ô´Ú¾±²µ³Ü°ù¨¦ dans le contr?leur BMC.

Remarques sur les capteurs IPMI discrets

Pour trouver des capteurs sur un h?te, d¨¦marrez le serveur Áú»¢¶Ä²© avec DebugLevel=4 activ¨¦. Attendez quelques minutes et recherchez les enregistrements de d¨¦tection de capteur dans le fichier de log du serveur Áú»¢¶Ä²© :

$ grep 'Added sensor' zabbix_server.log
       8358:20130318:111122.170 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:7 id:'CATERR' reading_type:0x3 ('discrete_state') type:0x7 ('processor') full_name:'(r0.32.3.0).CATERR'
       8358:20130318:111122.170 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'CPU Therm Trip' reading_type:0x3 ('discrete_state') type:0x1 ('temperature') full_name:'(7.1).CPU Therm Trip'
       8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'System Event Log' reading_type:0x6f ('sensor specific') type:0x10 ('event_logging_disabled') full_name:'(7.1).System Event Log'
       8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'PhysicalSecurity' reading_type:0x6f ('sensor specific') type:0x5 ('physical_security') full_name:'(23.1).PhysicalSecurity'
       8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'IPMI Watchdog' reading_type:0x6f ('sensor specific') type:0x23 ('watchdog_2') full_name:'(7.7).IPMI Watchdog'
       8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'Power Unit Stat' reading_type:0x6f ('sensor specific') type:0x9 ('power_unit') full_name:'(21.1).Power Unit Stat'
       8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Ctrl %' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(3.1).P1 Therm Ctrl %'
       8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Margin' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(3.2).P1 Therm Margin'
       8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 2' reading_type:0x1 ('threshold') type:0x4 ('fan') full_name:'(29.1).System Fan 2'
       8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 3' reading_type:0x1 ('threshold') type:0x4 ('fan') full_name:'(29.1).System Fan 3'
       8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'P1 Mem Margin' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).P1 Mem Margin'
       8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'Front Panel Temp' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).Front Panel Temp'
       8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'Baseboard Temp' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).Baseboard Temp'
       8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:9 id:'BB +5.0V' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +5.0V'
       8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'BB +3.3V STBY' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +3.3V STBY'
       8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:9 id:'BB +3.3V' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +3.3V'
       8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'BB +1.5V P1 DDR3' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.5V P1 DDR3'
       8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'BB +1.1V P1 Vccp' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.1V P1 Vccp'
       8358:20130318:111122.174 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'BB +1.05V PCH' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.05V PCH'

Pour d¨¦coder les types et les ¨¦tats des capteurs IPMI, procurez-vous une copie des sp¨¦cifications IPMI 2.0 ¨¤ l' adresse (Au moment de la r¨¦daction du le document le plus r¨¦cent ¨¦tait )

Le premier param¨¨tre avec lequel commencer est "read_type". Utilisez "Tableau 42-1, Plages de codes de type d'¨¦v¨¦nement/de lecture" dans les sp¨¦cifications pour d¨¦coder le code "read_type". La plupart des capteurs de notre exemple ont "read_type:0x1" qui signifie capteur de "seuil". "Le tableau 42-3, Codes de type de capteur" montre que "type:0x1" signifie capteur de temp¨¦rature, "type:0x2" - capteur de tension, "type:0x4" - ventilateur etc. Les capteurs de seuil sont parfois appel¨¦s "analogiques" car ils mesurent des param¨¨tres continus comme la temp¨¦rature, la tension, les r¨¦volutions par minute.

Un autre exemple - un capteur avec "read_type:0x3". "Tableau 42-1, Plages de codes de type ¨¦v¨¦nement/lecture" indique que les codes de type de lecture 02h-0Ch signifient "Generic Discrete". Les capteurs discrets ont jusqu'¨¤ 15 ¨¦tats possibles (en d'autres termes, jusqu'¨¤ 15 octets significatifs). Par exemple, pour le capteur 'CATERR' avec "type:0x7", le "Tableau 42-3, Codes de type de capteur" montre que ce type signifie "Processeur" et que la signification des octets individuels est : 00h (l'octet le moins significatif) - IERR, 01h - Thermal Trip etc.

Il y a peu de capteurs avec "reading_type:0x6f" dans notre exemple. Pour ces capteurs, le "Tableau 42-1, Plages de codes de type d'¨¦v¨¦nement/lecture" conseille d'utiliser "Tableau 42-3, Codes de type de capteur" pour d¨¦coder les significations des octets. Par exemple, le capteur 'Power Unit Stat' a le type "type:0x9" qui signifie "Power Unit". Offset 00h signifie "PowerOff/Power Down". En d'autres termes, si l'octet le moins significatif est 1, le serveur est mis hors tension. Pour tester cet octet, la fonction band avec le masque 1 peut ¨ºtre utilis¨¦e. L'expression de d¨¦clenchement pourrait ¨ºtre comme

   {www.zabbix.com:Power Unit Stat.band(#1,1)}=1

pour avertir d'un serveur ¨¦teint.

Notes sur les noms de capteurs discrets dans OpenIPMI-2.0.16, 2.0.17, 2.0.18 et 2.0.19

Les noms de capteurs discrets dans OpenIPMI-2.0.16, 2.0.17 et 2.0.18 ont souvent un "0" suppl¨¦mentaire (ou un autre chiffre ou lettre) ajout¨¦ ¨¤ la fin. Par exemple, si ipmitool et OpenIPMI-2.0.19 affichent les noms des capteurs comme "PhysicalSecurity" ou "CATERR", dans OpenIPMI-2.0.16, 2.0.17 et 2.0.18, les noms sont "PhysicalSecurity0" ou "CATERR0", respectivement.

Lors de la configuration d'un ¨¦l¨¦ment IPMI avec le serveur Áú»¢¶Ä²© ¨¤ l'aide d'OpenIPMI-2.0.16, 2.0.17 et 2.0.18, utilisez ces noms se terminant par "0" dans le champ Capteur IPMI des ¨¦l¨¦ments de l'agent IPMI. Lorsque votre serveur Áú»¢¶Ä²© est mis ¨¤ jour vers une nouvelle distribution Linux, qui utilise OpenIPMI-2.0.19 (ou une version ult¨¦rieure), les ¨¦l¨¦ments avec ces capteurs IPMI discrets deviendront "NON SUPPORTE". Vous devrez changer leur nom de capteur IPMI (enlevez le '0' ¨¤ la fin) et attendre un moment avant de les r¨¦activer.

Remarques sur la disponibilit¨¦ simultan¨¦e du capteur de seuil et du capteur discret

Certains agents IPMI fournissent ¨¤ la fois un capteur de seuil et un capteur discret sous le m¨ºme nom. Dans les versions de Áú»¢¶Ä²© ant¨¦rieures ¨¤ 2.2.8 et 2.4.3, le premier capteur fourni ¨¦tait choisi. Depuis les versions 2.2.8 et 2.4.3, la pr¨¦f¨¦rence est toujours donn¨¦e au capteur de seuil.

Remarques sur la fin de la connexion

Si les v¨¦rifications IPMI ne sont pas effectu¨¦es (pour une raison quelconque : tous les ¨¦l¨¦ments IPMI h?te d¨¦sactiv¨¦s/non pris en charge, h?te d¨¦sactiv¨¦/supprim¨¦, h?te en maintenance, etc.) la connexion IPMI sera termin¨¦e du serveur ou du proxy Áú»¢¶Ä²© en 3 ¨¤ 4 heures selon l'heure lorsque le serveur/proxy Áú»¢¶Ä²© a ¨¦t¨¦ d¨¦marr¨¦.