Project

General

Profile

Tâche #22719

Scénario #23160: Assistance aux utilisateurs (11-13)

dhcrelay échoue à se lancer au boot quand il y a beaucoup de vlans (amon 2.5.2)

Added by Gwenael Remond over 1 year ago. Updated over 1 year ago.

Status:
Fermé
Priority:
Normal
Start date:
11/27/2017
Due date:
% Done:

100%

Estimated time:
3.00 h
Spent time:
Remaining (hours):
0.0

Description

Continuation de la demande #22196

Sur nos amons nous avons un nombre assez important de vlan sur eth2 pour le wifi.
J'ai à plusieurs occasions constaté sur nos amons 2.5.2 que lorsque le serveur est redémarré (généralement suite à une mise à jour) le service dhcrelay ne démarrait pas correctement.
Dans les logs /var/log/rsyslog/local/dhcrelay/dhcrelay.err.log on voit les messages suivants en boucle :
Error getting hardware address for "eth2.28": No such device
Pourtant l'interface est bien présente.
Je fais l'hypothèse que le service est peut-être démarré trop tôt et que le fait de le lancer un peu plus tardivement pourrait remédier à ce pb ?
Qu'en pensez vous ?
Merci d'avance
Olivier

config.eol (11.4 KB) équipe eole Academie d'Orléans-Tours, 12/20/2017 12:31 PM

isc-dhcp-relay (415 Bytes) équipe eole Academie d'Orléans-Tours, 12/20/2017 12:31 PM

isc-dhcp-relay.conf View (804 Bytes) équipe eole Academie d'Orléans-Tours, 02/09/2018 11:34 AM

interfaces (32.8 KB) Fabrice Barconnière, 03/20/2018 01:19 PM

isc-dhcp-relay (428 Bytes) Fabrice Barconnière, 03/20/2018 01:19 PM


Related issues

Related to eole-dhcrelay - Scénario #17296: Le service de relay DHCP doit démarrer après le réseau Nouveau
Copied from Distribution EOLE - Tâche #22196: dhcrelay échoue à se lancer au boot quand il y a beaucoup de vlans (amon 2.5.2) Fermé 11/27/2017

Associated revisions

Revision d22e4983 (diff)
Added by Fabrice Barconnière over 1 year ago

isc-dhcp-relay service could start even if network interfaces are not ready

ref #22719

History

#1 Updated by Gwenael Remond over 1 year ago

  • Copied from Tâche #22196: dhcrelay échoue à se lancer au boot quand il y a beaucoup de vlans (amon 2.5.2) added

#2 Updated by Gwenael Remond over 1 year ago

  • Description updated (diff)

#3 Updated by Joël Cuissinat over 1 year ago

  • % Done changed from 100 to 0
  • Parent task changed from #22216 to #22741

#4 Updated by Joël Cuissinat over 1 year ago

  • Related to Scénario #17296: Le service de relay DHCP doit démarrer après le réseau added

#5 Updated by Emmanuel GARETTE over 1 year ago

  • Status changed from Nouveau to En cours

#6 Updated by Emmanuel GARETTE over 1 year ago

  • Assigned To set to Emmanuel GARETTE

#7 Updated by Emmanuel GARETTE over 1 year ago

<nrobin> ok je regarde le truc de 17296 et voit comment le déployer. mais sacahnt qu'on a ce plantage plutot apres les maj auto. le truc c'est de reproduire en effet, ce qui n'est pas tjrs simple

#8 Updated by équipe eole Academie d'Orléans-Tours over 1 year ago

je ne reproduit pas sur les deux amon planté ce matin avec un reboot standard.
Cela n'arrive qu'avec le reboot faisant suite au maj-auto.

Hier ce sont mis à jour les paquets suivant :

chromium-browser:amd64
chromium-browser-l10n:all
chromium-codecs-ffmpeg-extra:amd64
clamav:amd64
clamav-base:all
clamav-daemon:amd64
clamav-freshclam:amd64
libclamav7:amd64
libcurl3:amd64
libcurl3-gnutls:amd64
libpam-systemd:amd64
libsystemd-daemon0:amd64
libsystemd-login0:amd64
libudev1:amd64
linux-generic-lts-xenial:amd64
linux-headers-4.4.0-112:all
linux-headers-4.4.0-112-generic:amd64
linux-headers-generic-lts-xenial:amd64
linux-image-4.4.0-112-generic:amd64
linux-image-extra-4.4.0-112-generic:amd64
linux-image-generic-lts-xenial:amd64
nagios-amon-orl:all
systemd-services:amd64
udev:amd64
w3m:amd64

Le plus impactant semblant donc la maj de noyaux qui a provoqué le reboot. Je peux mettre en place le correctif mais il va falloir attendre d'autres maj avec reboot pour avoir un résultat...

#9 Updated by Emmanuel GARETTE over 1 year ago

  • Estimated time changed from 0.00 h to 3.00 h
  • Remaining (hours) changed from 0.0 to 3.0

#10 Updated by équipe eole Academie d'Orléans-Tours over 1 year ago

je test donc à partir de lundi sur nos amon 2.5.2 l'ajout du fichier en PJ donc.

#11 Updated by Joël Cuissinat over 1 year ago

  • Parent task changed from #22741 to #22922

#12 Updated by équipe eole Academie d'Orléans-Tours over 1 year ago

J'ai un serveur en erreur d'hier soir.
J'en ai aussi pas mal qui sont passé correctement...

le serveur planté a donc :


root@amon-0180766k:~# cat /etc/init/isc-dhcp-relay.conf 
description "ISC DHCP IPv4 relay" 
author "Stéphane Graber <stgraber@ubuntu.com>" 

#Mod ORL cf #17296#start on runlevel [2345]
start on (runlevel [2345] and static-network-up)
stop on runlevel [!2345]

pre-start script

etc...

Et j'ai une chose bizarre : j'ai noté dans le signalement qu'on avait une arborescence /var/log/rsyslog/local/dhcrelay/... que je n'ai pas ni sur ce amon, ni sur ma maquette.
Tous ces amon sont en 2.5.2, et j'ai ai d'autres qui ont bien ce chemin. Tous sont en

4.2.4-7ubuntu12.10              amd64

Il me manque forcément aussi :

/etc/logrotate.d/generated_local_rules => /var/log/rsyslog/local/dhcrelay/dhcrelay.*.log

Quand est créé cette arborescence ? Un rapport avec les problème de lancement ?

Démarrage ok sur le Amon planté avec :

CreoleService isc-dhcp-relay start

#13 Updated by équipe eole Academie d'Orléans-Tours over 1 year ago

Je précise que le plantage fait suite au reboot de la maj noyau 4.4.0-116-generic sur le serveur en question.

#14 Updated by équipe eole Academie d'Orléans-Tours over 1 year ago

Je ne sais pas si cela a un rapport avec ce problème directement, mais ce matin un amon à mit à jour hier les paquets noyaux lts-xenial:amd64 4.4.0.116.98 et isc-dhcp-relay:amd64 4.2.4-7 entre autre.

Il lance le reconf :

2018-03-02T04:26:32.479242+01:00 amon-0450047g.clg-riviere-olivet.lan zephir: MAJ => MSG : Reconfiguration automatique
2018-03-02T04:26:32.528321+01:00 amon-0450047g.clg-riviere-olivet.lan zephir: RECONFIGURE => INIT : Début de configuration
2018-03-02T04:28:33.689411+01:00 amon-0450047g.clg-riviere-olivet.lan zephir: RECONFIGURE => FIN : Configuration terminée

Et le dhcp-relay va planter

2018-03-02T04:27:49.662185+01:00 amon-0450047g.clg-riviere-olivet.lan dhcrelay: Error getting hardware address for "eth2.28": No such device

Point bizarre : c'est que le serveur ne va pas rebooter alors qu'il a un nouveau noyaux...et que le diagnose est ok (noyaux, reboot nécessaire non...)

Bref le plantage dhcp-relay existe aussi au reconf sur cette version en tous cas. (est-ce un problème idem qu'au bout, service relay lancé avant que l'interface du vlan soit up ?)

#15 Updated by équipe eole Academie d'Orléans-Tours over 1 year ago

Sur ce serveur, problème non reproduit avec reboot ou reconf une fois l'erreur passée...

#16 Updated by Joël Cuissinat over 1 year ago

  • Status changed from En cours to Nouveau
  • Assigned To deleted (Emmanuel GARETTE)
  • Parent task changed from #22922 to #23160

#17 Updated by Scrum Master over 1 year ago

  • Status changed from Nouveau to En cours

#18 Updated by Scrum Master over 1 year ago

  • Assigned To set to Fabrice Barconnière

#19 Updated by Fabrice Barconnière over 1 year ago

Test avec 100, 127 et 200 VLAN sur etb1.amon:
Pour reproduire, copier ces fichiers au bon endroit et rebooter :

visualiser le log : tail -f /var/log/rsyslog/local/dhcrelay/dhcrelay.err.log

Bug report sur Launchpad : https://bugs.launchpad.net/ubuntu/+source/isc-dhcp/+bug/1757125

#20 Updated by Scrum Master over 1 year ago

  • Status changed from En cours to Résolu

#21 Updated by Scrum Master over 1 year ago

  • Status changed from Résolu to Fermé
  • Remaining (hours) changed from 1.0 to 0.0

#22 Updated by Gérald Schwartzmann over 1 year ago

  • % Done changed from 50 to 100

Also available in: Atom PDF