Projet

Général

Profil

Scénario #31842

Diagnose: services en Erreur (Apache, Dhcp, Lsc, Sso, logrotate) après MajAuto Hebdo

Ajouté par Pascal Baptendier il y a environ 3 ans. Mis à jour il y a presque 3 ans.

Statut:
Terminé (Sprint)
Priorité:
Normal
Assigné à:
Catégorie:
-
Début:
16/03/2021
Echéance:
02/04/2021
% réalisé:

100%

Points de scénarios:
4.0
Restant à faire (heures):
0.00 heure
Estimation basée sur la vélocité:
Release:
Liens avec la release:
Auto

Description

Bonjour,

Sur des Scribe 2.7.2 ou 2.8 nous avons assez souvent lors d'un diagnose
des erreurs de synchronisation LSC, alors que le service eole-lsc est ok.

Un redémarrage du service corrige l'erreur.

Merci

Pascal Baptendier
Conseil départemental de Haute Savoie

Cf message du 8/3 9h06


Sous-tâches

Tâche #32150: /var/log/rsyslog/local/creoled/creoled.info.log (à nouveau ?) en double dans logrotateFerméBenjamin Bohard

Tâche #32152: Le service eole-lsc n'est pas fiableFerméEmmanuel GARETTE


Demandes liées

Lié à Distribution EOLE - Tâche #31916: Valider le scénario Diagnose: services en Erreur (Apache, Dhcp, Lsc, Sso, logrotate) après MajAuto Hebdo (11-13) Fermé 12/03/2021
Lié à Distribution EOLE - Scénario #32151: Le calcul du "estimate_output" pour Bareos est susceptible de prendre plusieurs minutes Terminé (Sprint) 16/04/2021 04/06/2021

Historique

#1 Mis à jour par Joël Cuissinat il y a environ 3 ans

  • Description mis à jour (diff)

#2 Mis à jour par Joël Cuissinat il y a environ 3 ans

  • Tracker changé de Demande à Scénario
  • Echéance mis à 02/04/2021
  • Version cible mis à Prestation Cadoles MEN 2021 11-13
  • Release mis à EOLE 2.7.1.3
  • Points de scénarios mis à 4.0

#3 Mis à jour par Gilles Grandgérard il y a environ 3 ans

  • Sujet changé de Diagnose: Synchronisation LSC => Erreur à Diagnose: services en Erreur (Apache, Dhcp, Lsc, Sso, logrotate) après MajAuto Hebdo

#4 Mis à jour par Gilles Grandgérard il y a environ 3 ans

  • Description mis à jour (diff)

#5 Mis à jour par Emmanuel GARETTE il y a environ 3 ans

  • Assigné à mis à Emmanuel GARETTE

#6 Mis à jour par Joël Cuissinat il y a environ 3 ans

  • Lié à Tâche #31916: Valider le scénario Diagnose: services en Erreur (Apache, Dhcp, Lsc, Sso, logrotate) après MajAuto Hebdo (11-13) ajouté

#7 Mis à jour par Emmanuel GARETTE il y a environ 3 ans

Bonjour,

J'avais répondu dans la tâche au lieu du scénario, donc vous n'avez pas reçu mon message.

Voici donc mon analyse :

Si on regarde dans les logs du schedule on voit :

schedule.log :

                             Démarrage des services                             
[..]
Service isc-dhcp-server is not running                                  [  KO  ]
[..]
Service apache2 is not running                                          [  KO  ]

Dans les logs d'apache on peut voir :

apachectl.info.log:2021-03-15T05:50:32.287081+01:00 scribe.0741699v.etab apachectl[2130646]: (99)Cannot assign requested address: AH00072: make_sock: could not bind to address 10.174.7.250:80

Pareil pour dhcpd :

2021-03-15T05:50:32.086506+01:00 scribe.0741699v.etab dhcpd[2130624]: Not configured to listen on any interfaces!

On voit que le réseau ne démarre pas correctement (interface ens18) :

2021-03-15T05:46:22.165152+01:00 scribe.0741699v.etab systemd-networkd[30255]: addc_0: Link DOWN
2021-03-15T05:46:22.165249+01:00 scribe.0741699v.etab systemd-networkd[30255]: addc_0: Lost carrier
2021-03-15T05:46:22.166110+01:00 scribe.0741699v.etab systemd-networkd[30255]: br0: Lost carrier
2021-03-15T05:47:02.928224+01:00 scribe.0741699v.etab systemd-networkd[30255]: ens18: Link DOWN
2021-03-15T05:47:02.951949+01:00 scribe.0741699v.etab systemd-networkd[30255]: ens18: Lost carrier
2021-03-15T05:47:02.952705+01:00 scribe.0741699v.etab systemd-networkd[30255]: br0: Link DOWN
2021-03-15T05:47:03.750964+01:00 scribe.0741699v.etab systemd-networkd[2126581]: Enumeration completed
2021-03-15T05:47:03.751652+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Link UP
2021-03-15T05:47:03.768358+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Gained carrier
2021-03-15T05:48:27.729714+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Link DOWN
2021-03-15T05:48:27.752790+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Lost carrier
2021-03-15T05:50:31.636540+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Link UP
2021-03-15T05:51:02.300388+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Link UP
2021-03-15T05:51:02.361962+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Gained carrier
2021-03-15T05:51:02.362108+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Gained carrier

Le nouveau reconfigure à 9h fonctionne correctement :

2021-03-15T09:06:01.834437+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Link DOWN
2021-03-15T09:06:01.834574+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Lost carrier
2021-03-15T09:06:01.864074+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Lost carrier
2021-03-15T09:06:28.050856+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Link DOWN
2021-03-15T09:06:29.420114+01:00 scribe.0741699v.etab systemd-networkd[2331691]: Enumeration completed
2021-03-15T09:06:29.421071+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Link UP
2021-03-15T09:06:29.441071+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Gained carrier
2021-03-15T09:07:53.899418+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Link DOWN
2021-03-15T09:07:53.919959+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Lost carrier
2021-03-15T09:07:54.449277+01:00 scribe.0741699v.etab systemd-networkd[2335695]: Enumeration completed
2021-03-15T09:07:54.450064+01:00 scribe.0741699v.etab systemd-networkd[2335695]: ens18: Link UP
2021-03-15T09:07:54.471956+01:00 scribe.0741699v.etab systemd-networkd[2335695]: ens18: Gained carrier
2021-03-15T09:07:54.493365+01:00 scribe.0741699v.etab systemd-networkd[2335695]: br0: Link UP
2021-03-15T09:08:25.309554+01:00 scribe.0741699v.etab systemd-networkd[2335695]: addc_0: Link UP
2021-03-15T09:08:25.326101+01:00 scribe.0741699v.etab systemd-networkd[2335695]: br0: Gained carrier
2021-03-15T09:08:25.325940+01:00 scribe.0741699v.etab systemd-networkd[2335695]: addc_0: Gained carrier

Dans le 1er cas on voit que la configuration de l'interface termine par "ens18: Lost carrier".
Dans le 2ème cas on voit que la configuraton de l'interface termine par "ens18: Gained carrier".

Malheureusement le journal n'apporte aucune information utile.

Le début du journal est :

-- Logs begin at Mon 2021-03-15 16:08:36 CET, end at Mon 2021-03-15 16:21:47 CET. --

Donc bien plus tard dans la journée.

En effet il est rempli de ligne :

mars 15 16:08:58 scribe exim[2829297]: 2021-03-15 16:08:58 1lA7oD-0004Hh-O1 Message is frozen

Il faudrait purger ces mail en attente et corriger le problème de mail ou augmenter la taille de conservation du journal pour espérer avoir plus d'information.

Si cela se reproduit il est possible de voir l'état du réseau en faisant :

networkctl list

Vous devriez avoir une ligne :

ens18       ether    routable    configured

Est-ce que vous avez une idée de pourquoi l'interface réseau ne remonte pas durant le reconfigure de la nuit ?
Est-ce qu'il y a des opérations de maintenance sur l'hyperviseur ?
Est-ce qu'il y a des opérations de maintenance durant la nuit sur la VM ?

#8 Mis à jour par Emmanuel GARETTE il y a environ 3 ans

  • Statut changé de Nouveau à En cours

#9 Mis à jour par Pascal Baptendier il y a environ 3 ans

Bonjour,

Toutes les nuits, nous avons uniquement une sauvegarde bareos

#10 Mis à jour par Emmanuel GARETTE il y a environ 3 ans

Dans ce cas il nous faut avoir plus d'informations pour tenter de comprendre ce qui se passe.

Je vous conseille donc de nettoyer la file d'attente de vos mails pour pouvoir nous transmettre un journal exploitable.

Cordialement,

#11 Mis à jour par Pascal Baptendier il y a environ 3 ans

Bonjour,

Pouvez vous m'indiquer la procédure pour nettoyer la file d'attente des mails?

Merci

#13 Mis à jour par Joël Cuissinat il y a environ 3 ans

Pascal Baptendier a écrit :

Bonjour,

Pouvez vous m'indiquer la procédure pour nettoyer la file d'attente des mails?

Merci

mailq | awk -F " " '{print $3}' | xargs exim -Mrm

#14 Mis à jour par Joël Cuissinat il y a environ 3 ans

  • Lié à Scénario #32151: Le calcul du "estimate_output" pour Bareos est susceptible de prendre plusieurs minutes ajouté

#15 Mis à jour par Emmanuel GARETTE il y a environ 3 ans

  • Statut changé de En cours à Résolu

#16 Mis à jour par Emmanuel GARETTE il y a environ 3 ans

  • Statut changé de Résolu à En cours

#17 Mis à jour par Joël Cuissinat il y a presque 3 ans

  • Lié à Scénario #32151: Le calcul du "estimate_output" pour Bareos est susceptible de prendre plusieurs minutes supprimé

#18 Mis à jour par Joël Cuissinat il y a presque 3 ans

  • Lié à Scénario #32151: Le calcul du "estimate_output" pour Bareos est susceptible de prendre plusieurs minutes ajouté

#19 Mis à jour par Emmanuel GARETTE il y a presque 3 ans

  • Statut changé de En cours à Résolu

#20 Mis à jour par Joël Cuissinat il y a presque 3 ans

  • Statut changé de Résolu à Terminé (Sprint)

Formats disponibles : Atom PDF