Projet

Général

Profil

Tâche #21911

Scénario #22741: Traitement express MEN (05-07)

La sortie du diagnose haute dispos doit être lisible même en cas d'erreur

Ajouté par Joël Cuissinat il y a plus de 6 ans. Mis à jour il y a environ 6 ans.

Statut:
Fermé
Priorité:
Normal
Début:
09/02/2018
Echéance:
% réalisé:

100%

Temps estimé:
0.25 h
Temps passé:
Restant à faire (heures):
0.0

Description

Correction SP-T04-003 - Comportement du cluster pendant reconfigure du noeud Sphynx esclave 2.6.2beta5
http://squash-tm.eole.lan/squash/executions/6138

crm_mon :

Last updated: Mon Nov  6 15:33:31 2017          Last change: Mon Nov  6 15:31:33 2017 by root via cibadmin on sp
hynxb
Stack: corosync
Current DC: sphynx (version 1.1.14-70404b0) - partition with quorum
2 nodes and 6 resources configured

Online: [ sphynx sphynxb ]

 Resource Group: VIPCluster
     VIP_externe        (ocf::heartbeat:IPaddr2):       Started sphynx
     VIP_interne        (ocf::heartbeat:IPaddr2):       Started sphynx
     ipsec_rsc  (service:strongswan):   FAILED[ sphynx sphynxb ]
     arv_rsc    (service:arv):  FAILED[ sphynx sphynxb ]
 Clone Set: gw_pingd_clone [gw_pingd]
     gw_pingd   (ocf::pacemaker:ping):  FAILED sphynxb
     Started: [ sphynx ]

Failed Actions:
* gw_pingd_monitor_0 on sphynxb 'unknown error' (1): call=-1, status=Timed Out, exitreason='none',
    last-rc-change='Mon Nov  6 15:32:40 2017', queued=0ms, exec=0ms

diagnose :

*** Haute disponibilité
.            Service Corosync => OK
.                       Noeud sphynx => OK
.                       Noeud sphynxb => OK
.                      Update => 6/Nov/2017 15:35:24
.                   Ressource ipsec_rsc => $3 (sphynx)
.                   Ressource gw_pingd => OK (sphynx)
.                   Ressource VIP_interne => OK (sphynx)
.                   Ressource arv_rsc => $3 (sphynx)
.                   Ressource VIP_externe => OK (sphynx)
.                   Ressource gw_pingd => $3 (sphynxb)
.                   Ressource ipsec_rsc => $3 (sphynxb)
.                   Ressource arv_rsc => $3 (sphynxb)

Révisions associées

Révision c28cea6a (diff)
Ajouté par Fabrice Barconnière il y a environ 6 ans

Le status d'une ressource n'était pas correctement affiché en cas de problème sur celle-ci

ref #21911

Historique

#1 Mis à jour par Scrum Master il y a plus de 6 ans

  • Tâche parente #21800 supprimé

#2 Mis à jour par Scrum Master il y a plus de 6 ans

  • Tracker changé de Tâche à Proposition Scénario
  • Sujet changé de Correction SP-T04-003 - Comportement du cluster pendant reconfigure du noeud Sphynx esclave 2.6.2beta5 à La sortie du diagnose haute dispos doit être lisible même en cas d'erreur
  • Description mis à jour (diff)

#3 Mis à jour par Scrum Master il y a plus de 6 ans

  • Version cible sprint 2017 43-45 Equipe MENSR supprimé

#4 Mis à jour par Gilles Grandgérard il y a plus de 6 ans

  • Tracker changé de Proposition Scénario à Tâche
  • Tâche parente mis à #22741

#5 Mis à jour par Gilles Grandgérard il y a plus de 6 ans

pour 2.6.2

#6 Mis à jour par Fabrice Barconnière il y a environ 6 ans

  • Statut changé de Nouveau à En cours
  • Début mis à 09/02/2018

#7 Mis à jour par Fabrice Barconnière il y a environ 6 ans

  • Assigné à mis à Fabrice Barconnière

#8 Mis à jour par Fabrice Barconnière il y a environ 6 ans

  • Statut changé de En cours à Résolu
  • % réalisé changé de 0 à 100
  • Temps estimé mis à 0.25 h
  • Restant à faire (heures) mis à 0.25
Pour tester :
  • Créer un fichier exécutable /root/mon_crm_mon contenant :
    echo "Last updated: Fri Feb  9 13:26:18 2018        Last change: Fri Feb  9 13:26:13 2018 by hacluster via crmd on sphynx
    Stack: corosync
    Current DC: sphynx (version 1.1.14-70404b0) - partition with quorum
    2 nodes and 6 resources configured
    
    Node sphynx: online
        gw_pingd    (ocf::pacemaker:ping):  Started
        ipsec_rsc   (service:strongswan):   Started
        arv_rsc (service:arv):  FAILED
        VIP_interne (ocf::heartbeat:IPaddr2):   Started
        VIP_externe (ocf::heartbeat:IPaddr2):   Started
    Node sphynxslave: online
        gw_pingd    (ocf::pacemaker:ping):  Started
    
    Failed Actions:
    * arv_rsc_start_0 on sphynx 'not running' (7): call=382, status=complete, exitreason='none',
        last-rc-change='Fri Feb  9 13:26:13 2018', queued=0ms, exec=2021ms
    " 
    
  • Modifier /usr/share/eole/diagnose/150-ha pour utiliser la fausse sortie de crm_mon :
    ....
    ....
    function _crm_mon_info_get()
    {
    
      /root/mon_crm_mon | \
      #crm_mon -1 -n 2>&1 | \
        awk -v len_pf=${len_pf} \
    ....
    ....
    
  • Lancer diagnose pour constater

#9 Mis à jour par Emmanuel GARETTE il y a environ 6 ans

  • Statut changé de Résolu à Fermé
  • Restant à faire (heures) changé de 0.25 à 0.0

Attention au "\t" a la place des espaces.

root@sphynx:~# /usr/share/eole/diagnose/150-ha
*** Haute disponibilité
.            Service Corosync => OK
.                       Noeud sphynx => OK
.                      Update => 9/Feb/2018 16:00:58
.                   Ressource ipsec_rsc => OK (sphynx)
.                   Ressource VIP_interne => OK (sphynx)
.                   Ressource arv_rsc => FAILED (sphynx)
.                   Ressource VIP_externe => OK (sphynx)
.                   Ressource gw_pingd => OK (sphynx)

Formats disponibles : Atom PDF