Tâche #22719
Scénario #23160: Assistance aux utilisateurs (11-13)
dhcrelay échoue à se lancer au boot quand il y a beaucoup de vlans (amon 2.5.2)
Description
Continuation de la demande #22196
Sur nos amons nous avons un nombre assez important de vlan sur eth2 pour le wifi.
J'ai à plusieurs occasions constaté sur nos amons 2.5.2 que lorsque le serveur est redémarré (généralement suite à une mise à jour) le service dhcrelay ne démarrait pas correctement.
Dans les logs /var/log/rsyslog/local/dhcrelay/dhcrelay.err.log on voit les messages suivants en boucle :
Error getting hardware address for "eth2.28": No such device
Pourtant l'interface est bien présente.
Je fais l'hypothèse que le service est peut-être démarré trop tôt et que le fait de le lancer un peu plus tardivement pourrait remédier à ce pb ?
Qu'en pensez vous ?
Merci d'avance
Olivier
Demandes liées
Révisions associées
isc-dhcp-relay service could start even if network interfaces are not ready
ref #22719
Historique
#1 Mis à jour par Gwenael Remond il y a plus de 6 ans
- Copié depuis Tâche #22196: dhcrelay échoue à se lancer au boot quand il y a beaucoup de vlans (amon 2.5.2) ajouté
#2 Mis à jour par Gwenael Remond il y a plus de 6 ans
- Description mis à jour (diff)
#3 Mis à jour par Joël Cuissinat il y a environ 6 ans
- % réalisé changé de 100 à 0
- Tâche parente changé de #22216 à #22741
#4 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Lié à Scénario #17296: Le service de relay DHCP doit démarrer après le réseau ajouté
#5 Mis à jour par Emmanuel GARETTE il y a environ 6 ans
- Statut changé de Nouveau à En cours
#6 Mis à jour par Emmanuel GARETTE il y a environ 6 ans
- Assigné à mis à Emmanuel GARETTE
#7 Mis à jour par Emmanuel GARETTE il y a environ 6 ans
<nrobin> ok je regarde le truc de 17296 et voit comment le déployer. mais sacahnt qu'on a ce plantage plutot apres les maj auto. le truc c'est de reproduire en effet, ce qui n'est pas tjrs simple
#8 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
je ne reproduit pas sur les deux amon planté ce matin avec un reboot standard.
Cela n'arrive qu'avec le reboot faisant suite au maj-auto.
Hier ce sont mis à jour les paquets suivant :
chromium-browser:amd64 chromium-browser-l10n:all chromium-codecs-ffmpeg-extra:amd64 clamav:amd64 clamav-base:all clamav-daemon:amd64 clamav-freshclam:amd64 libclamav7:amd64 libcurl3:amd64 libcurl3-gnutls:amd64 libpam-systemd:amd64 libsystemd-daemon0:amd64 libsystemd-login0:amd64 libudev1:amd64 linux-generic-lts-xenial:amd64 linux-headers-4.4.0-112:all linux-headers-4.4.0-112-generic:amd64 linux-headers-generic-lts-xenial:amd64 linux-image-4.4.0-112-generic:amd64 linux-image-extra-4.4.0-112-generic:amd64 linux-image-generic-lts-xenial:amd64 nagios-amon-orl:all systemd-services:amd64 udev:amd64 w3m:amd64
Le plus impactant semblant donc la maj de noyaux qui a provoqué le reboot. Je peux mettre en place le correctif mais il va falloir attendre d'autres maj avec reboot pour avoir un résultat...
#9 Mis à jour par Emmanuel GARETTE il y a environ 6 ans
- Temps estimé changé de 0.00 h à 3.00 h
- Restant à faire (heures) changé de 0.0 à 3.0
#10 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
- Fichier isc-dhcp-relay.conf Voir ajouté
je test donc à partir de lundi sur nos amon 2.5.2 l'ajout du fichier en PJ donc.
#11 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Tâche parente changé de #22741 à #22922
#12 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
J'ai un serveur en erreur d'hier soir.
J'en ai aussi pas mal qui sont passé correctement...
le serveur planté a donc :
root@amon-0180766k:~# cat /etc/init/isc-dhcp-relay.conf description "ISC DHCP IPv4 relay" author "Stéphane Graber <stgraber@ubuntu.com>" #Mod ORL cf #17296#start on runlevel [2345] start on (runlevel [2345] and static-network-up) stop on runlevel [!2345] pre-start script
etc...
Et j'ai une chose bizarre : j'ai noté dans le signalement qu'on avait une arborescence /var/log/rsyslog/local/dhcrelay/... que je n'ai pas ni sur ce amon, ni sur ma maquette.
Tous ces amon sont en 2.5.2, et j'ai ai d'autres qui ont bien ce chemin. Tous sont en
4.2.4-7ubuntu12.10 amd64
Il me manque forcément aussi :
/etc/logrotate.d/generated_local_rules => /var/log/rsyslog/local/dhcrelay/dhcrelay.*.log
Quand est créé cette arborescence ? Un rapport avec les problème de lancement ?
Démarrage ok sur le Amon planté avec :
CreoleService isc-dhcp-relay start
#13 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
Je précise que le plantage fait suite au reboot de la maj noyau 4.4.0-116-generic sur le serveur en question.
#14 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
Je ne sais pas si cela a un rapport avec ce problème directement, mais ce matin un amon à mit à jour hier les paquets noyaux lts-xenial:amd64 4.4.0.116.98 et isc-dhcp-relay:amd64 4.2.4-7 entre autre.
Il lance le reconf :
2018-03-02T04:26:32.479242+01:00 amon-0450047g.clg-riviere-olivet.lan zephir: MAJ => MSG : Reconfiguration automatique 2018-03-02T04:26:32.528321+01:00 amon-0450047g.clg-riviere-olivet.lan zephir: RECONFIGURE => INIT : Début de configuration 2018-03-02T04:28:33.689411+01:00 amon-0450047g.clg-riviere-olivet.lan zephir: RECONFIGURE => FIN : Configuration terminée
Et le dhcp-relay va planter
2018-03-02T04:27:49.662185+01:00 amon-0450047g.clg-riviere-olivet.lan dhcrelay: Error getting hardware address for "eth2.28": No such device
Point bizarre : c'est que le serveur ne va pas rebooter alors qu'il a un nouveau noyaux...et que le diagnose est ok (noyaux, reboot nécessaire non...)
Bref le plantage dhcp-relay existe aussi au reconf sur cette version en tous cas. (est-ce un problème idem qu'au bout, service relay lancé avant que l'interface du vlan soit up ?)
#15 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
Sur ce serveur, problème non reproduit avec reboot ou reconf une fois l'erreur passée...
#16 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Statut changé de En cours à Nouveau
- Assigné à
Emmanuel GARETTEsupprimé - Tâche parente changé de #22922 à #23160
#17 Mis à jour par Scrum Master il y a environ 6 ans
- Statut changé de Nouveau à En cours
#18 Mis à jour par Scrum Master il y a environ 6 ans
- Assigné à mis à Fabrice Barconnière
#19 Mis à jour par Fabrice Barconnière il y a environ 6 ans
- Fichier interfaces ajouté
- Fichier isc-dhcp-relay ajouté
- % réalisé changé de 0 à 50
- Restant à faire (heures) changé de 3.0 à 1.0
Pour reproduire, copier ces fichiers au bon endroit et rebooter :
- interfaces à copier dans
/etc/network/interfaces
- isc-dhcp-relay à copier dans
/etc/default/isc-dhcp-relay
visualiser le log : tail -f /var/log/rsyslog/local/dhcrelay/dhcrelay.err.log
Bug report sur Launchpad : https://bugs.launchpad.net/ubuntu/+source/isc-dhcp/+bug/1757125
#20 Mis à jour par Scrum Master il y a environ 6 ans
- Statut changé de En cours à Résolu
#21 Mis à jour par Scrum Master il y a environ 6 ans
- Statut changé de Résolu à Fermé
- Restant à faire (heures) changé de 1.0 à 0.0
#22 Mis à jour par Gérald Schwartzmann il y a environ 6 ans
- % réalisé changé de 50 à 100