Projet

Général

Profil

Scénario #36932

Hapy 2.9 : erreur update_nic

Ajouté par Camille Jactard il y a 9 mois. Mis à jour il y a 3 mois.

Statut:
Terminé (Sprint)
Priorité:
Normal
Assigné à:
Catégorie:
-
Début:
01/10/2022
Echéance:
01/01/2026
% réalisé:

100%

Points de scénarios:
1.0
Restant à faire (heures):
0.00 heure
Estimation basée sur la vélocité:
Release:
Liens avec la release:
Auto

Description

Bonjour,
Après avoir récemment migré un hapy 2.8 en hapy 2.9 (avec upgrade-auto), je suis confronté à un souci post-reconfigure.
Après le reconf, j'ai cette erreur (non bloquante) sur toutes mes vms:
UPDATENIC: 6 ovswitch: INFO: update_nic: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch".... see more details in VM log

Au niveau des logs de la VM ça renvoie vers un mauvais appel de add-port:

New LCM state is HOTPLUG_NIC
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: Command execution fail (exit code: 1): cat << 'EOT' | /var/tmp/one/vnm/ovswitch/update_nic  '18301b03-56d5-4235-a765-51ec45b167ec' '6'
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: update_nic: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch".
Fri Jun 20 10:12:00 2025 [Z0][VMM][E]: update_nic: Command "sudo -n ovs-vsctl add-port vswitch" failed.
Fri Jun 20 10:12:00 2025 [Z0][VMM][E]: update_nic: ovs-vsctl: 'add-port' command requires at least 2 arguments
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: ovs-vsctl: 'add-port' command requires at least 2 arguments
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: ExitCode: 1
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: Failed to execute network driver operation: update_nic.

Cela met également les vnets associés aux vms en erreur:

onevnet list
   9 oneadmin oneadmin CR_clg01-dmzpriv                                                                                0          vswitch                                            fail                                        1    0    1
   8 oneadmin oneadmin CR_clg01-dmz                                                                                    0          vswitch                                            fail                                        1    0    1
   7 oneadmin oneadmin CR_clg01-peda                                                                                   0          vswitch                                            fail                                        4    0    4
   6 oneadmin oneadmin CR_clg01-admin                                                                                  0          vswitch                                            fail                                        2    0    2

=> STATE : UPDATE_FAILURE

Pour reproduire le problème, je supprime ma vm et la réinstancie, puis je lancer simplement:
/usr/share/eole/postservice/31-one-netmng

Côté syslog j'ai remarqué les erreurs suivantes:

ovs-vsctl: ovs|00001|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)
hapy-lab.lab-eple.lan ovs-vsctl: message repeated 2 times: [ ovs|00001|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)]
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00002|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)

Et effectivement à ce moment précis openvswitch était éteint et en attente de redémarrage:

hapy-lab systemd[1]: Stopping Open vSwitch...
hapy-lab systemd[1]: openvswitch-switch.service: Deactivated successfully.
hapy-lab systemd[1]: Stopped Open vSwitch.
###moment précis de la database connection failed (laps de temps de 30s)
hapy-lab systemd[1]: Starting Open vSwitch...
hapy-lab systemd[1]: Finished Open vSwitch.

Du coup j'ai naïvement rajouté un time.sleep(5) dans /usr/share/eole/postservice/31-one-netmng, ce qui a permis de ne plus avoir cette erreur: ovs|00002|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed
Mais ces erreurs là demeurent:

hapy-lab.lab-eple.lan ovs-vsctl: ovs|00001|db_ctl_base|ERR|'add-port' command requires at least 2 arguments
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00001|db_ctl_base|ERR|'add-port' command requires at least 2 arguments
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00002|db_ctl_base|ERR|no row "one-48-0" in table Interface #(celle-ci est en bonus, lors de la suppression d'une VM)

J'ai bien essayé de comprendre d'où provenait ce problème (/var/lib/one/remotes/vnm/ovswitch/OpenvSwitch.rb ?) mais ça dépasse mes compétences.

D'avance merci pour votre aide :)

OpenvSwitch.rb Voir (20,6 ko) Camille Jactard, 15/07/2025 17:30


Sous-tâches

Tâche #37264: Ajout '--append' à onevnet updateFerméLaurent Gourvenec

Tâche #37265: TestFerméBenjamin Bohard


Demandes liées

Lié à Distribution EOLE - Scénario #36213: Warning dans sunstone avec OpenNebula 6.6.1 en 2.9.0 (bug upstream) Nouveau

Historique

#1 Mis à jour par Camille Jactard il y a 9 mois

Une petite précision: je rencontre le même problème sur une fresh install d'hapy 2.10

#2 Mis à jour par Joël Cuissinat il y a 9 mois

  • Tracker changé de Demande à Scénario
  • Description mis à jour (diff)
  • Début 20/06/2025 supprimé

#3 Mis à jour par Joël Cuissinat il y a 9 mois

  • Lié à Scénario #36213: Warning dans sunstone avec OpenNebula 6.6.1 en 2.9.0 (bug upstream) ajouté

#4 Mis à jour par Joël Cuissinat il y a 9 mois

Bonjour Camille,

D'après #36213, ce serait un bug connu.
J'en reparle avec Daniel la semaine prochaine.

#5 Mis à jour par Joël Cuissinat il y a 9 mois

  • Echéance mis à 01/01/2026
  • Version cible mis à Carnet MENSR
  • Début mis à 01/10/2022
  • Points de scénarios mis à 1.0

#6 Mis à jour par Camille Jactard il y a 8 mois

J'ai résolu une partie de mon souci concernant 'add-port' command requires at least 2 arguments

Une condition semble bancale dans /var/lib/one/remotes/vnm/ovswitch/OpenvSwitch.rb au moment de récupérer les infos à passer

Je met en PJ le fichier que nous utilisons actuellement (descendu via variante Zephir)

Bien cordialement,

#7 Mis à jour par Camille Jactard il y a 6 mois

Un petit UP: ce souci est toujours d'actualité et commence à être bloquant car il empêche parfois de démarrer les VMs.
Sur un hapy 2.9 (migré 2.6 -> 2.9) j'ai après un onevm stop (on stoppe la vm pour lancer une sauvegarde propre) :

Sun Sep 21 22:43:10 2025 [Z0][VM][I]: New LCM state is SAVE_STOP
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: ExitCode: 0
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: Successfully execute virtualization driver operation: save.
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: clean: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch one-48-0".
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: ExitCode: 0
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: Successfully execute network driver operation: clean.
Sun Sep 21 22:43:36 2025 [Z0][VM][I]: New LCM state is EPILOG_STOP
Sun Sep 21 22:43:37 2025 [Z0][VM][I]: New state is STOPPED
Sun Sep 21 22:43:37 2025 [Z0][VM][I]: New LCM state is LCM_INIT
Sun Sep 21 23:16:54 2025 [Z0][VM][I]: New state is PENDING
Sun Sep 21 23:17:09 2025 [Z0][VM][I]: New state is ACTIVE
Sun Sep 21 23:17:09 2025 [Z0][VM][I]: New LCM state is PROLOG_RESUME
Sun Sep 21 23:17:10 2025 [Z0][VM][I]: New LCM state is BOOT_STOPPED
Sun Sep 21 23:17:11 2025 [Z0][VMM][I]: Successfully execute transfer manager driver operation: tm_context.
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: Command execution fail (exit code: 1): cat << 'EOT' | /var/tmp/one/vnm/ovswitch/pre
Sun Sep 21 23:17:12 2025 [Z0][VMM][E]: pre: Command "sudo -n ovs-vsctl add-port vswitch" failed.
Sun Sep 21 23:17:12 2025 [Z0][VMM][E]: pre: ovs-vsctl: 'add-port' command requires at least 2 arguments
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: ovs-vsctl: 'add-port' command requires at least 2 arguments
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: ExitCode: 1
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: Failed to execute network driver operation: pre.
Sun Sep 21 23:17:12 2025 [Z0][VMM][E]: RESTORE: ovswitch: ERROR: pre: Command "sudo -n ovs-vsctl add-port vswitch" failed. ERROR: pre: ovs-vsctl: 'add-port' command requires at least 2 arguments ovs-vsctl: 'add-port' command requires at least 2 arguments ExitCode: 1
Sun Sep 21 23:17:12 2025 [Z0][VM][I]: New LCM state is BOOT_STOPPED_FAILURE

Embêtant ce souci :\

#8 Mis à jour par Joël Cuissinat il y a 5 mois

  • Echéance 01/01/2026 supprimé
  • Version cible Carnet MENSR supprimé
  • Début 01/10/2022 supprimé
  • Release mis à Carnet de produit Cadoles - MEN

#9 Mis à jour par Daniel Dehennin il y a 4 mois

Sans toucher aux fichiers OpenNebula, je n’ai plus d’erreur en passant l’option --append à onevnet update dans /usr/share/eole/postservice/31-one-netmng.

#10 Mis à jour par Laurent Gourvenec il y a 3 mois

  • Echéance mis à 01/01/2026
  • Assigné à mis à Laurent Gourvenec
  • Version cible mis à Carnet Cadoles - MEN
  • Début mis à 01/10/2022

#11 Mis à jour par Laurent Gourvenec il y a 3 mois

L'option --append à onevnet update dans /usr/share/eole/postservice/31-one-netmng semble fonctionner pour ne plus avoir de message d'erreur au reconfigure.

#12 Mis à jour par Joël Cuissinat il y a 3 mois

  • Statut changé de Nouveau à Terminé (Sprint)
  • Version cible changé de Carnet Cadoles - MEN à Livraison Cadoles - MEN 31/10/2025 (40)
  • Release changé de Carnet de produit Cadoles - MEN à EOLE 2.9.0

Formats disponibles : Atom PDF