Scénario #31842
Diagnose: services en Erreur (Apache, Dhcp, Lsc, Sso, logrotate) après MajAuto Hebdo
100%
Description
Bonjour,
Sur des Scribe 2.7.2 ou 2.8 nous avons assez souvent lors d'un diagnose
des erreurs de synchronisation LSC, alors que le service eole-lsc est ok.
Un redémarrage du service corrige l'erreur.
Merci
Pascal Baptendier
Conseil départemental de Haute Savoie
Cf message du 8/3 9h06
Sous-tâches
Demandes liées
Historique
#1 Mis à jour par Joël Cuissinat il y a environ 3 ans
- Description mis à jour (diff)
#2 Mis à jour par Joël Cuissinat il y a environ 3 ans
- Tracker changé de Demande à Scénario
- Echéance mis à 02/04/2021
- Version cible mis à Prestation Cadoles MEN 2021 11-13
- Release mis à EOLE 2.7.1.3
- Points de scénarios mis à 4.0
#3 Mis à jour par Gilles Grandgérard il y a environ 3 ans
- Sujet changé de Diagnose: Synchronisation LSC => Erreur à Diagnose: services en Erreur (Apache, Dhcp, Lsc, Sso, logrotate) après MajAuto Hebdo
#4 Mis à jour par Gilles Grandgérard il y a environ 3 ans
- Description mis à jour (diff)
#5 Mis à jour par Emmanuel GARETTE il y a environ 3 ans
- Assigné à mis à Emmanuel GARETTE
#6 Mis à jour par Joël Cuissinat il y a environ 3 ans
- Lié à Tâche #31916: Valider le scénario Diagnose: services en Erreur (Apache, Dhcp, Lsc, Sso, logrotate) après MajAuto Hebdo (11-13) ajouté
#7 Mis à jour par Emmanuel GARETTE il y a environ 3 ans
Bonjour,
J'avais répondu dans la tâche au lieu du scénario, donc vous n'avez pas reçu mon message.
Voici donc mon analyse :
Si on regarde dans les logs du schedule on voit :
schedule.log :
Démarrage des services [..] Service isc-dhcp-server is not running [ KO ] [..] Service apache2 is not running [ KO ]
Dans les logs d'apache on peut voir :
apachectl.info.log:2021-03-15T05:50:32.287081+01:00 scribe.0741699v.etab apachectl[2130646]: (99)Cannot assign requested address: AH00072: make_sock: could not bind to address 10.174.7.250:80
Pareil pour dhcpd :
2021-03-15T05:50:32.086506+01:00 scribe.0741699v.etab dhcpd[2130624]: Not configured to listen on any interfaces!
On voit que le réseau ne démarre pas correctement (interface ens18) :
2021-03-15T05:46:22.165152+01:00 scribe.0741699v.etab systemd-networkd[30255]: addc_0: Link DOWN 2021-03-15T05:46:22.165249+01:00 scribe.0741699v.etab systemd-networkd[30255]: addc_0: Lost carrier 2021-03-15T05:46:22.166110+01:00 scribe.0741699v.etab systemd-networkd[30255]: br0: Lost carrier 2021-03-15T05:47:02.928224+01:00 scribe.0741699v.etab systemd-networkd[30255]: ens18: Link DOWN 2021-03-15T05:47:02.951949+01:00 scribe.0741699v.etab systemd-networkd[30255]: ens18: Lost carrier 2021-03-15T05:47:02.952705+01:00 scribe.0741699v.etab systemd-networkd[30255]: br0: Link DOWN 2021-03-15T05:47:03.750964+01:00 scribe.0741699v.etab systemd-networkd[2126581]: Enumeration completed 2021-03-15T05:47:03.751652+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Link UP 2021-03-15T05:47:03.768358+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Gained carrier 2021-03-15T05:48:27.729714+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Link DOWN 2021-03-15T05:48:27.752790+01:00 scribe.0741699v.etab systemd-networkd[2126581]: ens18: Lost carrier 2021-03-15T05:50:31.636540+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Link UP 2021-03-15T05:51:02.300388+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Link UP 2021-03-15T05:51:02.361962+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Gained carrier 2021-03-15T05:51:02.362108+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Gained carrier
Le nouveau reconfigure à 9h fonctionne correctement :
2021-03-15T09:06:01.834437+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Link DOWN 2021-03-15T09:06:01.834574+01:00 scribe.0741699v.etab systemd-networkd[2126581]: addc_0: Lost carrier 2021-03-15T09:06:01.864074+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Lost carrier 2021-03-15T09:06:28.050856+01:00 scribe.0741699v.etab systemd-networkd[2126581]: br0: Link DOWN 2021-03-15T09:06:29.420114+01:00 scribe.0741699v.etab systemd-networkd[2331691]: Enumeration completed 2021-03-15T09:06:29.421071+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Link UP 2021-03-15T09:06:29.441071+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Gained carrier 2021-03-15T09:07:53.899418+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Link DOWN 2021-03-15T09:07:53.919959+01:00 scribe.0741699v.etab systemd-networkd[2331691]: ens18: Lost carrier 2021-03-15T09:07:54.449277+01:00 scribe.0741699v.etab systemd-networkd[2335695]: Enumeration completed 2021-03-15T09:07:54.450064+01:00 scribe.0741699v.etab systemd-networkd[2335695]: ens18: Link UP 2021-03-15T09:07:54.471956+01:00 scribe.0741699v.etab systemd-networkd[2335695]: ens18: Gained carrier 2021-03-15T09:07:54.493365+01:00 scribe.0741699v.etab systemd-networkd[2335695]: br0: Link UP 2021-03-15T09:08:25.309554+01:00 scribe.0741699v.etab systemd-networkd[2335695]: addc_0: Link UP 2021-03-15T09:08:25.326101+01:00 scribe.0741699v.etab systemd-networkd[2335695]: br0: Gained carrier 2021-03-15T09:08:25.325940+01:00 scribe.0741699v.etab systemd-networkd[2335695]: addc_0: Gained carrier
Dans le 1er cas on voit que la configuration de l'interface termine par "ens18: Lost carrier".
Dans le 2ème cas on voit que la configuraton de l'interface termine par "ens18: Gained carrier".
Malheureusement le journal n'apporte aucune information utile.
Le début du journal est :
-- Logs begin at Mon 2021-03-15 16:08:36 CET, end at Mon 2021-03-15 16:21:47 CET. --
Donc bien plus tard dans la journée.
En effet il est rempli de ligne :
mars 15 16:08:58 scribe exim[2829297]: 2021-03-15 16:08:58 1lA7oD-0004Hh-O1 Message is frozen
Il faudrait purger ces mail en attente et corriger le problème de mail ou augmenter la taille de conservation du journal pour espérer avoir plus d'information.
Si cela se reproduit il est possible de voir l'état du réseau en faisant :
networkctl list
Vous devriez avoir une ligne :
ens18 ether routable configured
Est-ce que vous avez une idée de pourquoi l'interface réseau ne remonte pas durant le reconfigure de la nuit ?
Est-ce qu'il y a des opérations de maintenance sur l'hyperviseur ?
Est-ce qu'il y a des opérations de maintenance durant la nuit sur la VM ?
#8 Mis à jour par Emmanuel GARETTE il y a environ 3 ans
- Statut changé de Nouveau à En cours
#9 Mis à jour par Pascal Baptendier il y a environ 3 ans
Bonjour,
Toutes les nuits, nous avons uniquement une sauvegarde bareos
#10 Mis à jour par Emmanuel GARETTE il y a environ 3 ans
Dans ce cas il nous faut avoir plus d'informations pour tenter de comprendre ce qui se passe.
Je vous conseille donc de nettoyer la file d'attente de vos mails pour pouvoir nous transmettre un journal exploitable.
Cordialement,
#11 Mis à jour par Pascal Baptendier il y a environ 3 ans
Bonjour,
Pouvez vous m'indiquer la procédure pour nettoyer la file d'attente des mails?
Merci
#13 Mis à jour par Joël Cuissinat il y a environ 3 ans
Pascal Baptendier a écrit :
Bonjour,
Pouvez vous m'indiquer la procédure pour nettoyer la file d'attente des mails?
Merci
mailq | awk -F " " '{print $3}' | xargs exim -Mrm
#14 Mis à jour par Joël Cuissinat il y a environ 3 ans
- Lié à Scénario #32151: Le calcul du "estimate_output" pour Bareos est susceptible de prendre plusieurs minutes ajouté
#15 Mis à jour par Emmanuel GARETTE il y a environ 3 ans
- Statut changé de En cours à Résolu
#16 Mis à jour par Emmanuel GARETTE il y a environ 3 ans
- Statut changé de Résolu à En cours
#17 Mis à jour par Joël Cuissinat il y a presque 3 ans
- Lié à Scénario #32151: Le calcul du "estimate_output" pour Bareos est susceptible de prendre plusieurs minutes supprimé
#18 Mis à jour par Joël Cuissinat il y a presque 3 ans
- Lié à Scénario #32151: Le calcul du "estimate_output" pour Bareos est susceptible de prendre plusieurs minutes ajouté
#19 Mis à jour par Emmanuel GARETTE il y a presque 3 ans
- Statut changé de En cours à Résolu
#20 Mis à jour par Joël Cuissinat il y a presque 3 ans
- Statut changé de Résolu à Terminé (Sprint)