Projet

Général

Profil

Scénario #36932

Mis à jour par Joël Cuissinat il y a 9 mois

Bonjour,
Après avoir récemment migré un hapy 2.8 en hapy 2.9 (avec upgrade-auto), je suis confronté à un souci post-reconfigure.
Après le reconf, j'ai cette erreur (non bloquante) sur toutes mes vms:
UPDATENIC: 6 ovswitch: INFO: update_nic: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch".... see more details in VM log

Au niveau des logs de la VM ça renvoie vers un mauvais appel de add-port:

<pre>
New LCM state is HOTPLUG_NIC
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: Command execution fail (exit code: 1): cat << 'EOT' | /var/tmp/one/vnm/ovswitch/update_nic '18301b03-56d5-4235-a765-51ec45b167ec' '6'
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: update_nic: Executed "sudo -n ovs-vsctl --if-exists del-port vswitch".
Fri Jun 20 10:12:00 2025 [Z0][VMM][E]: update_nic: Command "sudo -n ovs-vsctl add-port vswitch" failed.
Fri Jun 20 10:12:00 2025 [Z0][VMM][E]: update_nic: ovs-vsctl: 'add-port' command requires at least 2 arguments
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: ovs-vsctl: 'add-port' command requires at least 2 arguments
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: ExitCode: 1
Fri Jun 20 10:12:00 2025 [Z0][VMM][I]: Failed to execute network driver operation: update_nic.
</pre>


Cela met également les vnets associés aux vms en erreur:
<pre>
onevnet list
9 oneadmin oneadmin CR_clg01-dmzpriv 0 vswitch fail 1 0 1
8 oneadmin oneadmin CR_clg01-dmz 0 vswitch fail 1 0 1
7 oneadmin oneadmin CR_clg01-peda 0 vswitch fail 4 0 4
6 oneadmin oneadmin CR_clg01-admin 0 vswitch fail 2 0 2
</pre>


=> STATE : UPDATE_FAILURE

Pour reproduire le problème, je supprime ma vm et la réinstancie, puis je lancer simplement:
/usr/share/eole/postservice/31-one-netmng

Côté syslog j'ai remarqué les erreurs suivantes:

<pre>
ovs-vsctl: ovs|00001|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)
hapy-lab.lab-eple.lan ovs-vsctl: message repeated 2 times: [ ovs|00001|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)]
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00002|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed (No such file or directory)
</pre>


Et effectivement à ce moment précis openvswitch était éteint et en attente de redémarrage:
<pre>
hapy-lab systemd[1]: Stopping Open vSwitch...
hapy-lab systemd[1]: openvswitch-switch.service: Deactivated successfully.
hapy-lab systemd[1]: Stopped Open vSwitch.
###moment précis de la database connection failed (laps de temps de 30s)
hapy-lab systemd[1]: Starting Open vSwitch...
hapy-lab systemd[1]: Finished Open vSwitch.
</pre>


Du coup j'ai naïvement rajouté un time.sleep(5) dans /usr/share/eole/postservice/31-one-netmng, ce qui a permis de ne plus avoir cette erreur: ovs|00002|db_ctl_base|ERR|unix:/var/run/openvswitch/db.sock: database connection failed
Mais ces erreurs là demeurent:
<pre>
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00001|db_ctl_base|ERR|'add-port' command requires at least 2 arguments
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00001|db_ctl_base|ERR|'add-port' command requires at least 2 arguments
hapy-lab.lab-eple.lan ovs-vsctl: ovs|00002|db_ctl_base|ERR|no row "one-48-0" in table Interface #(celle-ci (celle-ci est en bonus, lors de la suppression d'une VM)
</pre>


J'ai bien essayé de comprendre d'où provenait ce problème (/var/lib/one/remotes/vnm/ovswitch/OpenvSwitch.rb ?) mais ça dépasse mes compétences.

D'avance merci pour votre aide :)

Retour