Scénario #36932
Hapy 2.9 : erreur update_nic
100%
Description
Bonjour,
Après avoir récemment migré un hapy 2.8 en hapy 2.9 (avec upgrade-auto), je suis confronté à un souci post-reconfigure.
Après le reconf, j'ai cette erreur (non bloquante) sur toutes mes vms:
UPDATENIC: 6 ovswitch: INFO: update_nic: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch".... see more details in VM log
Au niveau des logs de la VM ça renvoie vers un mauvais appel de add-port:
New LCM state is HOTPLUG_NIC Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: Command execution fail (exit code: 1): cat << 'EOT' | /var/tmp/one/vnm/ovswitch/update_nic '18301b03-56d5-4235-a765-51ec45b167ec' '6' Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: update_nic: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch". Fri Jun 20 10:12:00 2025 [Z0][VMM][E]: update_nic: Command "sudo -n ovs-vsctl add-port vswitch" failed. Fri Jun 20 10:12:00 2025 [Z0][VMM][E]: update_nic: ovs-vsctl: 'add-port' command requires at least 2 arguments Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: ovs-vsctl: 'add-port' command requires at least 2 arguments Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: ExitCode: 1 Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: Failed to execute network driver operation: update_nic.
Cela met également les vnets associés aux vms en erreur:
onevnet list 9 oneadmin oneadmin CR_clg01-dmzpriv 0 vswitch fail 1 0 1 8 oneadmin oneadmin CR_clg01-dmz 0 vswitch fail 1 0 1 7 oneadmin oneadmin CR_clg01-peda 0 vswitch fail 4 0 4 6 oneadmin oneadmin CR_clg01-admin 0 vswitch fail 2 0 2
=> STATE : UPDATE_FAILURE
Pour reproduire le problème, je supprime ma vm et la réinstancie, puis je lancer simplement:
/usr/share/eole/postservice/31-one-netmng
Côté syslog j'ai remarqué les erreurs suivantes:
ovs-vsctl: ovs|00001|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory) hapy-lab.lab-eple.lan ovs-vsctl: message repeated 2 times: [ ovs|00001|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)] hapy-lab.lab-eple.lan ovs-vsctl: ovs|00002|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)
Et effectivement à ce moment précis openvswitch était éteint et en attente de redémarrage:
hapy-lab systemd[1]: Stopping Open vSwitch... hapy-lab systemd[1]: openvswitch-switch.service: Deactivated successfully. hapy-lab systemd[1]: Stopped Open vSwitch. ###moment précis de la database connection failed (laps de temps de 30s) hapy-lab systemd[1]: Starting Open vSwitch... hapy-lab systemd[1]: Finished Open vSwitch.
Du coup j'ai naïvement rajouté un time.sleep(5) dans /usr/share/eole/postservice/31-one-netmng, ce qui a permis de ne plus avoir cette erreur: ovs|00002|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed
Mais ces erreurs là demeurent:
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00001|db_ctl_base|ERR|'add-port' command requires at least 2 arguments hapy-lab.lab-eple.lan ovs-vsctl: ovs|00001|db_ctl_base|ERR|'add-port' command requires at least 2 arguments hapy-lab.lab-eple.lan ovs-vsctl: ovs|00002|db_ctl_base|ERR|no row "one-48-0" in table Interface #(celle-ci est en bonus, lors de la suppression d'une VM)
J'ai bien essayé de comprendre d'où provenait ce problème (/var/lib/one/remotes/vnm/ovswitch/OpenvSwitch.rb ?) mais ça dépasse mes compétences.
D'avance merci pour votre aide :)
Sous-tâches
Demandes liées
Historique
#1 Mis à jour par Camille Jactard il y a 9 mois
Une petite précision: je rencontre le même problème sur une fresh install d'hapy 2.10
#2 Mis à jour par Joël Cuissinat il y a 9 mois
- Tracker changé de Demande à Scénario
- Description mis à jour (diff)
- Début
20/06/2025supprimé
#3 Mis à jour par Joël Cuissinat il y a 9 mois
- Lié à Scénario #36213: Warning dans sunstone avec OpenNebula 6.6.1 en 2.9.0 (bug upstream) ajouté
#4 Mis à jour par Joël Cuissinat il y a 9 mois
Bonjour Camille,
D'après #36213, ce serait un bug connu.
J'en reparle avec Daniel la semaine prochaine.
#5 Mis à jour par Joël Cuissinat il y a 9 mois
- Echéance mis à 01/01/2026
- Version cible mis à Carnet MENSR
- Début mis à 01/10/2022
- Points de scénarios mis à 1.0
#6 Mis à jour par Camille Jactard il y a 8 mois
- Fichier OpenvSwitch.rb Voir ajouté
J'ai résolu une partie de mon souci concernant 'add-port' command requires at least 2 arguments
Une condition semble bancale dans /var/lib/one/remotes/vnm/ovswitch/OpenvSwitch.rb au moment de récupérer les infos à passer
Je met en PJ le fichier que nous utilisons actuellement (descendu via variante Zephir)
Bien cordialement,
#7 Mis à jour par Camille Jactard il y a 6 mois
Un petit UP: ce souci est toujours d'actualité et commence à être bloquant car il empêche parfois de démarrer les VMs.
Sur un hapy 2.9 (migré 2.6 -> 2.9) j'ai après un onevm stop (on stoppe la vm pour lancer une sauvegarde propre) :
Sun Sep 21 22:43:10 2025 [Z0][VM][I]: New LCM state is SAVE_STOP
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: ExitCode: 0
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: Successfully execute virtualization driver operation: save.
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: clean: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch one-48-0".
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: ExitCode: 0
Sun Sep 21 22:43:36 2025 [Z0][VMM][I]: Successfully execute network driver operation: clean.
Sun Sep 21 22:43:36 2025 [Z0][VM][I]: New LCM state is EPILOG_STOP
Sun Sep 21 22:43:37 2025 [Z0][VM][I]: New state is STOPPED
Sun Sep 21 22:43:37 2025 [Z0][VM][I]: New LCM state is LCM_INIT
Sun Sep 21 23:16:54 2025 [Z0][VM][I]: New state is PENDING
Sun Sep 21 23:17:09 2025 [Z0][VM][I]: New state is ACTIVE
Sun Sep 21 23:17:09 2025 [Z0][VM][I]: New LCM state is PROLOG_RESUME
Sun Sep 21 23:17:10 2025 [Z0][VM][I]: New LCM state is BOOT_STOPPED
Sun Sep 21 23:17:11 2025 [Z0][VMM][I]: Successfully execute transfer manager driver operation: tm_context.
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: Command execution fail (exit code: 1): cat << 'EOT' | /var/tmp/one/vnm/ovswitch/pre
Sun Sep 21 23:17:12 2025 [Z0][VMM][E]: pre: Command "sudo -n ovs-vsctl add-port vswitch" failed.
Sun Sep 21 23:17:12 2025 [Z0][VMM][E]: pre: ovs-vsctl: 'add-port' command requires at least 2 arguments
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: ovs-vsctl: 'add-port' command requires at least 2 arguments
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: ExitCode: 1
Sun Sep 21 23:17:12 2025 [Z0][VMM][I]: Failed to execute network driver operation: pre.
Sun Sep 21 23:17:12 2025 [Z0][VMM][E]: RESTORE: ovswitch: ERROR: pre: Command "sudo -n ovs-vsctl add-port vswitch" failed. ERROR: pre: ovs-vsctl: 'add-port' command requires at least 2 arguments ovs-vsctl: 'add-port' command requires at least 2 arguments ExitCode: 1
Sun Sep 21 23:17:12 2025 [Z0][VM][I]: New LCM state is BOOT_STOPPED_FAILURE
Embêtant ce souci :\
#8 Mis à jour par Joël Cuissinat il y a 5 mois
- Echéance
01/01/2026supprimé - Version cible
Carnet MENSRsupprimé - Début
01/10/2022supprimé - Release mis à Carnet de produit Cadoles - MEN
#9 Mis à jour par Daniel Dehennin il y a 4 mois
Sans toucher aux fichiers OpenNebula, je n’ai plus d’erreur en passant l’option --append à onevnet update dans /usr/share/eole/postservice/31-one-netmng.
#10 Mis à jour par Laurent Gourvenec il y a 3 mois
- Echéance mis à 01/01/2026
- Assigné à mis à Laurent Gourvenec
- Version cible mis à Carnet Cadoles - MEN
- Début mis à 01/10/2022
#11 Mis à jour par Laurent Gourvenec il y a 3 mois
L'option --append à onevnet update dans /usr/share/eole/postservice/31-one-netmng semble fonctionner pour ne plus avoir de message d'erreur au reconfigure.
#12 Mis à jour par Joël Cuissinat il y a 3 mois
- Statut changé de Nouveau à Terminé (Sprint)
- Version cible changé de Carnet Cadoles - MEN à Livraison Cadoles - MEN 31/10/2025 (40)
- Release changé de Carnet de produit Cadoles - MEN à EOLE 2.9.0