Projet

Général

Profil

Demande #28327

Agrégation - RTNETLINK

Ajouté par Jerome WATREMEZ il y a presque 5 ans. Mis à jour il y a presque 2 ans.

Statut:
Classée sans suite
Priorité:
Normal
Assigné à:
-
Catégorie:
-
Version cible:
-
Début:
Echéance:
% réalisé:

0%


Description

Bonjour,

Nous avons, sur notre académie, migré un AMON 2.4.2 en version 2.6.2
Cette passerelle est configuré avec une agrégation, fonctionnelle en 2.4.2

Suite à la mise à jour, nous avons bien vérifié de l'absence du fichier /usr/sbin/agregation.sh et bien noté que le nouveau script est /usr/share/eole/sbin/agregation

Lors de l'instance ou du reconfigure, nous avons ce message d'erreur :

Start network service networking                                                                                                                                    [  KO  ]
an error occured: RTNETLINK answers: File exists
Failed to bring up eno1:1.
RTNETLINK answers: File exists
Failed to bring up eno1:2.
RTNETLINK answers: File exists
Failed to bring up eno1:3.
RTNETLINK answers: File exists
Failed to bring up eno1:4.
RTNETLINK answers: File exists
Failed to bring up eno1:5.
, RTNETLINK answers: File exists
Failed to bring up eno1:1.
RTNETLINK answers: File exists
Failed to bring up eno1:2.
RTNETLINK answers: File exists
Failed to bring up eno1:3.
RTNETLINK answers: File exists
Failed to bring up eno1:4.
RTNETLINK answers: File exists
Failed to bring up eno1:5.

Sur Internet , nous avons bien trouvé des références documentaires :
https://askubuntu.com/questions/293827/error-rtnetlink-answers-file-exists
https://unix.stackexchange.com/questions/414675/rtnetlink-answers-file-exists-on-ubuntu-server-16-04

Mais si nous appliquons une commande "ip addr flush", nous n'obtenons pas de meilleurs résultats.

Si nous désactivons l'agrégation, l'AMON est pleinement fonctionnel.

Voici le contenu du fichier /etc/network/interfaces :

root@pf0341364y:~# cat /etc/network/interfaces
# Fichier autogénéré par EOLE
# Toute modification manuelle sera perdue

auto lo
iface lo inet loopback

auto eno1
iface eno1 inet static
    address 195.101.91.49
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48
    gateway 195.101.91.54

auto eno1:1
iface eno1:1 inet static
    address 62.102.232.25
    netmask 255.255.255.248
    broadcast 62.102.232.31
    network 62.102.232.24

auto eno1:2
iface eno1:2 inet static
    address 195.101.91.50
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto eno1:3
iface eno1:3 inet static
    address 195.101.91.51
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto eno1:4
iface eno1:4 inet static
    address 195.101.91.52
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto eno1:5
iface eno1:5 inet static
    address 195.101.91.53
    netmask 255.255.255.248
    broadcast 195.101.91.55
    network 195.101.91.48

auto enp1s0
iface enp1s0 inet static
    address 10.34.73.1
    netmask 255.255.255.0
    broadcast 10.34.73.255
    network 10.34.73.0

auto enp2s0
iface enp2s0 inet static
    address 10.134.73.254
    netmask 255.255.255.0
    broadcast 10.134.73.255
    network 10.134.73.0

auto enp3s0
iface enp3s0 inet static
    address 10.234.73.1
    netmask 255.255.255.0
    broadcast 10.234.73.255
    network 10.234.73.0
    up service rsyslog restart

Pour vérifier les origines possibles de l'incident, nous avons généré une machine 2.6.2 en primo-installation et activé l'agrégation : nous reproduisons l'erreur -> Error RTNETLINK answers: File exists
Nous supposons donc que la fonction d'agrégation n'est pas pleinement fonctionnelle avec la version 2.6

Auriez-vous une piste de recherche, pour nous orienter ?

Je vous joins le modèle de pare-feu et le fichier de configuration de la passerelle AMON.

En vous remerciant,

M. Jerome WATREMEZ
Technicien Réseaux
Direction des Systèmes d'Information et de l'Innovation
Bureau des Infrastructures et de l'Hébergement d'Applications - Pôle Réseaux Sécurité
Téléphone: 0467915387
305 rue d'Argencourt - 34000 Montpellier

zephir_config_734.eol - config.eol actuellemnt en production (agrégation désactivée) (13 ko) Jerome WATREMEZ, 16/05/2019 14:58

4zones26v3.xml Voir - Modèle pare-feu (82,1 ko) Jerome WATREMEZ, 16/05/2019 14:59

montpellierDico.xml Voir - Dictionnaire personalisé (3,06 ko) Jerome WATREMEZ, 16/05/2019 14:59

Historique

#1 Mis à jour par Jerome WATREMEZ il y a presque 5 ans

Nous avons essayé de déterminer à quel moment, dans le processus de mise en production, apparaissait cet incident.

Si nous :
  • Installons le module EOLE AMON 2.6.2 ;
  • Récupérons le fichier de configuration, via la commande enregistrement_zephir ;
  • Instancions le serveur, en refusant les mises à jour.
  • reboot
  • L'agrégation est fonctionnelle.

Lorsque nous mettons à jour le serveur, avec la commande "Maj-Auto" : l'erreur exposée ci-dessus apparait.

Si nous décortiquons les messages d'erreurs.

La commande "service networking restart" retourne :

Job for networking.service failed because the control process exited with error code. See "systemctl status networking.service" and "journalctl -xe" for details.

La commande "systemctl status networking.service" retourne :

● networking.service - Raise network interfaces
   Loaded: loaded (/lib/systemd/system/networking.service; enabled; vendor preset: enabled)
  Drop-In: /run/systemd/generator/networking.service.d
           └─50-insserv.conf-$network.conf
   Active: failed (Result: exit-code) since ven. 2019-05-17 11:26:11 CEST; 1min 30s ago
     Docs: man:interfaces(5)
  Process: 12351 ExecStart=/sbin/ifup -a --read-environment (code=exited, status=1/FAILURE)
  Process: 12346 ExecStartPre=/bin/sh -c [ "$CONFIGURE_INTERFACES" != "no" ] && [ -n "$(ifquery --read-environment --list --exclude=lo)" ] && udevadm settle (code=exited, sta
 Main PID: 12351 (code=exited, status=1/FAILURE)

mai 17 10:03:04 pf0340094t-26 systemd[1]: Starting Raise network interfaces...
mai 17 10:03:04 pf0340094t-26 ifup[12351]: RTNETLINK answers: File exists
mai 17 10:03:04 pf0340094t-26 ifup[12351]: Failed to bring up ens32:1.
mai 17 11:26:11 pf0340094t-26 systemd[1]: networking.service: Main process exited, code=exited, status=1/FAILURE
mai 17 11:26:11 pf0340094t-26 systemd[1]: Failed to start Raise network interfaces.
mai 17 11:26:11 pf0340094t-26 systemd[1]: networking.service: Unit entered failed state.
mai 17 11:26:11 pf0340094t-26 systemd[1]: networking.service: Failed with result 'exit-code'.
lines 1-17/17 (END)

Si je consulte les logs /var/log/rsylog/local/ifup/ :

2019-05-17T09:52:11.604761+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: /sbin/ifup: waiting for lock on /run/network/ifstate.ens32
2019-05-17T09:52:11.622406+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: RTNETLINK answers: File exists
2019-05-17T09:52:11.622651+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: /sbin/ifup: waiting for lock on /run/network/ifstate.ens33
2019-05-17T09:52:20.755656+02:00 pf0340094t-26.clg-ds2i.local ifup[991]: Failed to bring up ens32:1.
2019-05-17T09:59:58.460193+02:00 pf0340094t-26.clg-ds2i.local ifup[10560]: RTNETLINK answers: File exists
2019-05-17T09:59:58.460541+02:00 pf0340094t-26.clg-ds2i.local ifup[10560]: Failed to bring up ens32:1.
2019-05-17T10:03:04.477243+02:00 pf0340094t-26.clg-ds2i.local ifup[12351]: RTNETLINK answers: File exists
2019-05-17T10:03:04.477522+02:00 pf0340094t-26.clg-ds2i.local ifup[12351]: Failed to bring up ens32:1.

#2 Mis à jour par Jerome WATREMEZ il y a presque 5 ans

Bonjour,

Voici un retour sur notre mésaventure d'une première activation du service d'agrégation sur un AMON 2.6

Première erreur, de notre part : l’absence du fichier /usr/sbin/agregation.sh
Nous pensions que cette absence était normale, car dû à une évolution technologique entre le 2.4 et 2.6.
En fait, nous nous sommes aperçu d'un mauvais paramétrage de variante zephir, commandant la suppression de ce fichier sur nos AMON 2.6

Une fois ce fichier remis en place, l'agrégation fonctionne.
Mais des erreurs persistent, notamment au niveau du diagnose : les passerelles sont "KO" sur les "services distants".

Deuxième erreur, côté EOLE : fichier /usr/share/eole/diagnose/04-network

Aux lignes 64-73 :

> if [ -n "$adresse_ip_gw" ] && [ "$adresse_ip_gw" != "0.0.0.0" ]; then
>  65     if [ "$(CreoleGet activer_agregation non)" = "oui" ]; then
>  66         TestARP $adresse_ip_gw "Passerelle $adresse_ip_gw" "eth0" 
>  67         for passerelle in $(CreoleGet alias_gw_eth0); do
>  68             TestARP $passerelle "Passerelle $passerelle" "eth0" 
>  69         done
>  70     else
>  71         TestARP $adresse_ip_gw "Passerelle $adresse_ip_gw" 
>  72     fi
>  73 fi

Le nommage de la carte n'est pas la bonne.
Si nous modifions le fichier avec le bon nom, le diagnose teste correctement.

Cordialement,

#3 Mis à jour par Joël Cuissinat il y a plus de 4 ans

  • Assigné à mis à Joël Cuissinat

#4 Mis à jour par Joël Cuissinat il y a plus de 4 ans

  • Tracker changé de Demande à Scénario
  • Assigné à Joël Cuissinat supprimé
  • Début 16/05/2019 supprimé
  • Release mis à Carnet de produit (Cadoles)
  • Points de scénarios mis à 1.0

#5 Mis à jour par Gilles Grandgérard il y a plus de 2 ans

  • Release Carnet de produit (Cadoles) supprimé

#6 Mis à jour par Joël Cuissinat il y a presque 2 ans

  • Tracker changé de Scénario à Demande
  • Statut changé de Nouveau à Classée sans suite

Formats disponibles : Atom PDF