Projet

Général

Profil

Scénario #23138

Creoled HS - le retour - suite a maj - reconf - reboot

Ajouté par équipe eole Academie d'Orléans-Tours il y a environ 6 ans. Mis à jour il y a presque 6 ans.

Statut:
Terminé (Sprint)
Priorité:
Normal
Catégorie:
-
Début:
26/02/2018
Echéance:
30/03/2018
% réalisé:

100%

Temps estimé:
(Total: 27.00 h)
Temps passé:
(Total: 17.90 h)
Points de scénarios:
4.0
Restant à faire (heures):
0.00 heure
Estimation basée sur la vélocité:
Release:
Liens avec la release:
Auto

Description

Bonjour,

j'ai des cas (3 ce lundi, horus et scribe en 2.5.2) de creoled HS suite à maj noyaux (4.4.0-116.)

j'ai le inid.d de creole tel que https://dev-eole.ac-dijon.fr/issues/22503#change-110304 et pourtant :

f76c8d7a36b317eb82b47b2fb5983112 /etc/init.d/creoled

/var/log/rsyslog/local/zephir/zephir.log-20180224.gz

2018-02-24T02:44:43.744902+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: MAJ => INIT : Début
2018-02-24T02:47:50.603836+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: MAJ => FIN : 26 paquets mis à jour
2018-02-24T02:47:50.639929+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: MAJ => MSG : Reconfiguration automatique
2018-02-24T02:47:50.681798+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: RECONFIGURE => INIT : Début de configuration
2018-02-24T02:51:24.075644+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: RECONFIGURE => FIN : Configuration terminée
2018-02-24T02:51:27.094692+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: RECONFIGURE => MSG : Redémarrage automatique

creoled est ok au reconf mais plante au reboot : https://pastebin.com/zH87hhCX

Sur le serveur :

root@horus-03xxxxxx:~# ps faux|grep creole
root     19913  0.0  0.0  11800  2204 pts/0    S+   14:37   0:00          \_ grep --color creole
root@horus-03xxxxxx:~# netstat -pnl | grep 8000
root@horus-03xxxxxx:~#

J'avais cette correction (# 22503) dans notre variante sans pbl pourtant. Je ne sais pas si c'est un nouveau cas de figure ou pas ici...

Un service creoled start est ok.


Sous-tâches

Tâche #23313: Rétro porter en 2.5.2 les modifications faites en 2.6 concernant le timed out au changement de mot de passe à l'instanceFerméFabrice Barconnière

Tâche #23326: Étudier la possibilité de transformer le service creoled en upstartFerméFabrice Barconnière

Tâche #23343: Contrôler la mise en place des sysctl au bootFerméFabrice Barconnière

Tâche #23349: Étude du timeout Thot 2.5.2 à l'instanceFerméGérald Schwartzmann

Tâche #23361: Gérer l'arrêt de creoled lors de la génération et du lanceent du firewall (bastion).FerméFabrice Barconnière


Demandes liées

Lié à Distribution EOLE - Tâche #23118: Vérifier les tests Jenkins 2.5.2 après publication Fermé 02/11/2017

Historique

#1 Mis à jour par Yoni Baude il y a environ 6 ans

Sur Caen, nous avons les soucis depuis le passage au noyaux 4.4.109 pour les corrections partielles des failles de sécurité Meltdown/Spectre.

https://coagul.org/drupal/publication/failles-securite-meltdown-spectre-et-correction-kernel-linux-ubuntu.

Est-ce que ça pourrait venir de la configuration du timeout de cherrypy qui n'est plus adapté suite aux modifs du noyau ?

/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py :

# Feel free to increase these defaults on slow systems:
free_port_timeout = 0.1
occupied_port_timeout = 1.0

Merci
Yoni

#2 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans

Pas sur que ce soit le timeout, apparement c'est le

try:
    check_port(host, port, timeout=timeout)
except IOError:
    return


de la fonction
 wait_for_occupied_port

qui est en erreur, en tout cas pour les problèmes que j'ai cette semaine.

/var/log/creoled.log

  File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 427, in wait_for_occupied_port
    raise IOError("Port %r not bound on %r" % (port, host))
IOError: Port 8000 not bound on '127.0.0.1'

Nicolas

#3 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans

Je ne sais pas si j’interprète bien mais dans /usr/lib/python2.7/dist-packages/cherrypy/process/servers.py

Quand on est arrivé dans le wait() de start(), c'est déjà trop tard si le processus ne c'est pas lancé, le wait() ne fera plus rien, le lancement ayant déjà eu lieu. Du coup n'importe quel timeout donnerait la même chose non ?

Si j'ai bon, c'est le moment ou le start est appelé qui fait que creoled ne se lance pas ? (réseau pas prêt ? - même combat que dhcrelay ?)
Si j'ai pas bon, du coup on revient au timeout cherry que signale Yoni.

Nicolas.

#4 Mis à jour par Gilles Grandgérard il y a environ 6 ans

  • Tâche parente mis à #22923

#5 Mis à jour par Yoni Baude il y a environ 6 ans

Comme indiqué par Camille de la Réunion, la commande ouvre-firewall, débloque la situation, creoled fonctionne de nouveau.

Y aurait-il un soucis entre le firewall et creoled au démarrage ?

Yoni

#6 Mis à jour par Joël Cuissinat il y a environ 6 ans

  • Tâche parente #22923 supprimé

#7 Mis à jour par Joël Cuissinat il y a environ 6 ans

  • Tracker changé de Tâche à Scénario
  • Echéance mis à 30/03/2018
  • Version cible changé de sprint 2018 08-10 Equipe MENSR à sprint 2018 11-13 Equipe MENSR
  • Release mis à EOLE 2.5.2.3
  • Points de scénarios mis à 4.0

#8 Mis à jour par Joël Cuissinat il y a environ 6 ans

  • Lié à Tâche #23118: Vérifier les tests Jenkins 2.5.2 après publication ajouté

#9 Mis à jour par Joël Cuissinat il y a environ 6 ans

  • Lié à Proposition Scénario #17498: Rétro-porter la correction du problème du 'time out' après le changement de mot de passe root sur les modules EOLE ajouté

#10 Mis à jour par Gérald Schwartzmann il y a environ 6 ans

  • Assigné à mis à Fabrice Barconnière

#11 Mis à jour par Joël Cuissinat il y a environ 6 ans

  • Lié à Proposition Scénario #17498: Rétro-porter la correction du problème du 'time out' après le changement de mot de passe root sur les modules EOLE supprimé

#12 Mis à jour par Daniel Dehennin il y a environ 6 ans

  • Statut changé de Nouveau à Terminé (Sprint)

#14 Mis à jour par Yoni Baude il y a presque 6 ans

Bonjour,

Sur nos horus 2.5.2 nous avons toujours le plantage de creoled au reboot de nos serveurs suite au maj kernel (ce n'est pas systématique) après la correction du fichier /etc/init.d/creoled.
Pour complément le Frontend Horus est désactivé.

Merci de aide.

Cordialement,
Yoni

Formats disponibles : Atom PDF