Project

General

Profile

Scénario #28327

Agrégation - RTNETLINK

Added by Jerome WATREMEZ about 1 year ago. Updated 7 months ago.

Status:
Nouveau
Priority:
Normal
Assigned To:
-
Category:
-
Target version:
-
Start date:
Due date:
% Done:

0%

Story points:
1.0
Velocity based estimate:
Release relationship:
Auto

Description

Bonjour,

Nous avons, sur notre académie, migré un AMON 2.4.2 en version 2.6.2
Cette passerelle est configuré avec une agrégation, fonctionnelle en 2.4.2

Suite à la mise à jour, nous avons bien vérifié de l'absence du fichier /usr/sbin/agregation.sh et bien noté que le nouveau script est /usr/share/eole/sbin/agregation

Lors de l'instance ou du reconfigure, nous avons ce message d'erreur :

Start network service networking                                                                                                                                    [  KO  ]
an error occured: RTNETLINK answers: File exists
Failed to bring up eno1:1.
RTNETLINK answers: File exists
Failed to bring up eno1:2.
RTNETLINK answers: File exists
Failed to bring up eno1:3.
RTNETLINK answers: File exists
Failed to bring up eno1:4.
RTNETLINK answers: File exists
Failed to bring up eno1:5.
, RTNETLINK answers: File exists
Failed to bring up eno1:1.
RTNETLINK answers: File exists
Failed to bring up eno1:2.
RTNETLINK answers: File exists
Failed to bring up eno1:3.
RTNETLINK answers: File exists
Failed to bring up eno1:4.
RTNETLINK answers: File exists
Failed to bring up eno1:5.

Sur Internet , nous avons bien trouvé des références documentaires :
https://askubuntu.com/questions/293827/error-rtnetlink-answers-file-exists
https://unix.stackexchange.com/questions/414675/rtnetlink-answers-file-exists-on-ubuntu-server-16-04

Mais si nous appliquons une commande "ip addr flush", nous n'obtenons pas de meilleurs résultats.

Si nous désactivons l'agrégation, l'AMON est pleinement fonctionnel.

Voici le contenu du fichier /etc/network/interfaces :

root@pf0341364y:~# cat /etc/network/interfaces
# Fichier autogénéré par EOLE
# Toute modification manuelle sera perdue

auto lo
iface lo inet loopback

auto eno1
iface eno1 inet static
    address 195.101.91.49
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48
    gateway 195.101.91.54

auto eno1:1
iface eno1:1 inet static
    address 62.102.232.25
    netmask 255.255.255.248
    broadcast 62.102.232.31
    network 62.102.232.24

auto eno1:2
iface eno1:2 inet static
    address 195.101.91.50
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto eno1:3
iface eno1:3 inet static
    address 195.101.91.51
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto eno1:4
iface eno1:4 inet static
    address 195.101.91.52
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto eno1:5
iface eno1:5 inet static
    address 195.101.91.53
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto enp1s0
iface enp1s0 inet static
    address 10.34.73.1
    netmask 255.255.255.0
    broadcast 10.34.73.255
    network 10.34.73.0

auto enp2s0
iface enp2s0 inet static
    address 10.134.73.254
    netmask 255.255.255.0
    broadcast 10.134.73.255
    network 10.134.73.0

auto enp3s0
iface enp3s0 inet static
    address 10.234.73.1
    netmask 255.255.255.0
    broadcast 10.234.73.255
    network 10.234.73.0
    up service rsyslog restart

Pour vérifier les origines possibles de l'incident, nous avons généré une machine 2.6.2 en primo-installation et activé l'agrégation : nous reproduisons l'erreur -> Error RTNETLINK answers: File exists
Nous supposons donc que la fonction d'agrégation n'est pas pleinement fonctionnelle avec la version 2.6

Auriez-vous une piste de recherche, pour nous orienter ?

Je vous joins le modèle de pare-feu et le fichier de configuration de la passerelle AMON.

En vous remerciant,

M. Jerome WATREMEZ
Technicien Réseaux
Direction des Systèmes d'Information et de l'Innovation
Bureau des Infrastructures et de l'Hébergement d'Applications - Pôle Réseaux Sécurité
Téléphone: 0467915387
305 rue d'Argencourt - 34000 Montpellier

zephir_config_734.eol - config.eol actuellemnt en production (agrégation désactivée) (13 KB) Jerome WATREMEZ, 05/16/2019 02:58 PM

4zones26v3.xml View - Modèle pare-feu (82.1 KB) Jerome WATREMEZ, 05/16/2019 02:59 PM

montpellierDico.xml View - Dictionnaire personalisé (3.06 KB) Jerome WATREMEZ, 05/16/2019 02:59 PM

History

#1 Updated by Jerome WATREMEZ about 1 year ago

Nous avons essayé de déterminer à quel moment, dans le processus de mise en production, apparaissait cet incident.

Si nous :
  • Installons le module EOLE AMON 2.6.2 ;
  • Récupérons le fichier de configuration, via la commande enregistrement_zephir ;
  • Instancions le serveur, en refusant les mises à jour.
  • reboot
  • L'agrégation est fonctionnelle.

Lorsque nous mettons à jour le serveur, avec la commande "Maj-Auto" : l'erreur exposée ci-dessus apparait.

Si nous décortiquons les messages d'erreurs.

La commande "service networking restart" retourne :

Job for networking.service failed because the control process exited with error code. See "systemctl status networking.service" and "journalctl -xe" for details.

La commande "systemctl status networking.service" retourne :

● networking.service - Raise network interfaces
   Loaded: loaded (/lib/systemd/system/networking.service; enabled; vendor preset: enabled)
  Drop-In: /run/systemd/generator/networking.service.d
           └─50-insserv.conf-$network.conf
   Active: failed (Result: exit-code) since ven. 2019-05-17 11:26:11 CEST; 1min 30s ago
     Docs: man:interfaces(5)
  Process: 12351 ExecStart=/sbin/ifup -a --read-environment (code=exited, status=1/FAILURE)
  Process: 12346 ExecStartPre=/bin/sh -c [ "$CONFIGURE_INTERFACES" != "no" ] && [ -n "$(ifquery --read-environment --list --exclude=lo)" ] && udevadm settle (code=exited, sta
 Main PID: 12351 (code=exited, status=1/FAILURE)

mai 17 10:03:04 pf0340094t-26 systemd[1]: Starting Raise network interfaces...
mai 17 10:03:04 pf0340094t-26 ifup[12351]: RTNETLINK answers: File exists
mai 17 10:03:04 pf0340094t-26 ifup[12351]: Failed to bring up ens32:1.
mai 17 11:26:11 pf0340094t-26 systemd[1]: networking.service: Main process exited, code=exited, status=1/FAILURE
mai 17 11:26:11 pf0340094t-26 systemd[1]: Failed to start Raise network interfaces.
mai 17 11:26:11 pf0340094t-26 systemd[1]: networking.service: Unit entered failed state.
mai 17 11:26:11 pf0340094t-26 systemd[1]: networking.service: Failed with result 'exit-code'.
lines 1-17/17 (END)

Si je consulte les logs /var/log/rsylog/local/ifup/ :

2019-05-17T09:52:11.604761+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: /sbin/ifup: waiting for lock on /run/network/ifstate.ens32
2019-05-17T09:52:11.622406+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: RTNETLINK answers: File exists
2019-05-17T09:52:11.622651+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: /sbin/ifup: waiting for lock on /run/network/ifstate.ens33
2019-05-17T09:52:20.755656+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: Failed to bring up ens32:1.
2019-05-17T09:59:58.460193+02:00 pf0340094t-26.clg-ds2i.local ifup[10560]: RTNETLINK answers: File exists
2019-05-17T09:59:58.460541+02:00 pf0340094t-26.clg-ds2i.local ifup[10560]: Failed to bring up ens32:1.
2019-05-17T10:03:04.477243+02:00 pf0340094t-26.clg-ds2i.local ifup[12351]: RTNETLINK answers: File exists
2019-05-17T10:03:04.477522+02:00 pf0340094t-26.clg-ds2i.local ifup[12351]: Failed to bring up ens32:1.

#2 Updated by Jerome WATREMEZ about 1 year ago

Bonjour,

Voici un retour sur notre mésaventure d'une première activation du service d'agrégation sur un AMON 2.6

Première erreur, de notre part : l’absence du fichier /usr/sbin/agregation.sh
Nous pensions que cette absence était normale, car dû à une évolution technologique entre le 2.4 et 2.6.
En fait, nous nous sommes aperçu d'un mauvais paramétrage de variante zephir, commandant la suppression de ce fichier sur nos AMON 2.6

Une fois ce fichier remis en place, l'agrégation fonctionne.
Mais des erreurs persistent, notamment au niveau du diagnose : les passerelles sont "KO" sur les "services distants".

Deuxième erreur, côté EOLE : fichier /usr/share/eole/diagnose/04-network

Aux lignes 64-73 :

> if [ -n "$adresse_ip_gw" ] && [ "$adresse_ip_gw" != "0.0.0.0" ]; then
>  65     if [ "$(CreoleGet activer_agregation non)" = "oui" ]; then
>  66         TestARP $adresse_ip_gw "Passerelle $adresse_ip_gw" "eth0" 
>  67         for passerelle in $(CreoleGet alias_gw_eth0); do
>  68             TestARP $passerelle "Passerelle $passerelle" "eth0" 
>  69         done
>  70     else
>  71         TestARP $adresse_ip_gw "Passerelle $adresse_ip_gw" 
>  72     fi
>  73 fi

Le nommage de la carte n'est pas la bonne.
Si nous modifions le fichier avec le bon nom, le diagnose teste correctement.

Cordialement,

#3 Updated by Joël Cuissinat 7 months ago

  • Assigned To set to Joël Cuissinat

#4 Updated by Joël Cuissinat 7 months ago

  • Tracker changed from Demande to Scénario
  • Assigned To deleted (Joël Cuissinat)
  • Start date deleted (05/16/2019)
  • Release set to Carnet de produit (Cadoles)
  • Story points set to 1.0

Also available in: Atom PDF