Scénario #23138
Creoled HS - le retour - suite a maj - reconf - reboot
100%
Description
Bonjour,
j'ai des cas (3 ce lundi, horus et scribe en 2.5.2) de creoled HS suite à maj noyaux (4.4.0-116.)
j'ai le inid.d de creole tel que https://dev-eole.ac-dijon.fr/issues/22503#change-110304 et pourtant :
f76c8d7a36b317eb82b47b2fb5983112 /etc/init.d/creoled
/var/log/rsyslog/local/zephir/zephir.log-20180224.gz 2018-02-24T02:44:43.744902+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: MAJ => INIT : Début 2018-02-24T02:47:50.603836+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: MAJ => FIN : 26 paquets mis à jour 2018-02-24T02:47:50.639929+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: MAJ => MSG : Reconfiguration automatique 2018-02-24T02:47:50.681798+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: RECONFIGURE => INIT : Début de configuration 2018-02-24T02:51:24.075644+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: RECONFIGURE => FIN : Configuration terminée 2018-02-24T02:51:27.094692+01:00 horus-0180006j.lyc-marguerite-de-navarre-bourges.lan zephir: RECONFIGURE => MSG : Redémarrage automatique
creoled est ok au reconf mais plante au reboot : https://pastebin.com/zH87hhCX
Sur le serveur :
root@horus-03xxxxxx:~# ps faux|grep creole root 19913 0.0 0.0 11800 2204 pts/0 S+ 14:37 0:00 \_ grep --color creole root@horus-03xxxxxx:~# netstat -pnl | grep 8000 root@horus-03xxxxxx:~#
J'avais cette correction (# 22503) dans notre variante sans pbl pourtant. Je ne sais pas si c'est un nouveau cas de figure ou pas ici...
Un service creoled start est ok.
Sous-tâches
Demandes liées
Historique
#1 Mis à jour par Yoni Baude il y a environ 6 ans
Sur Caen, nous avons les soucis depuis le passage au noyaux 4.4.109 pour les corrections partielles des failles de sécurité Meltdown/Spectre.
Est-ce que ça pourrait venir de la configuration du timeout de cherrypy qui n'est plus adapté suite aux modifs du noyau ?
/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py :
# Feel free to increase these defaults on slow systems: free_port_timeout = 0.1 occupied_port_timeout = 1.0
Merci
Yoni
#2 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
Pas sur que ce soit le timeout, apparement c'est le
try: check_port(host, port, timeout=timeout) except IOError: return
de la fonction
wait_for_occupied_port
qui est en erreur, en tout cas pour les problèmes que j'ai cette semaine.
/var/log/creoled.log
File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 427, in wait_for_occupied_port raise IOError("Port %r not bound on %r" % (port, host)) IOError: Port 8000 not bound on '127.0.0.1'
Nicolas
#3 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 6 ans
Je ne sais pas si j’interprète bien mais dans /usr/lib/python2.7/dist-packages/cherrypy/process/servers.py
Quand on est arrivé dans le wait() de start(), c'est déjà trop tard si le processus ne c'est pas lancé, le wait() ne fera plus rien, le lancement ayant déjà eu lieu. Du coup n'importe quel timeout donnerait la même chose non ?
Si j'ai bon, c'est le moment ou le start est appelé qui fait que creoled ne se lance pas ? (réseau pas prêt ? - même combat que dhcrelay ?)
Si j'ai pas bon, du coup on revient au timeout cherry que signale Yoni.
Nicolas.
#4 Mis à jour par Gilles Grandgérard il y a environ 6 ans
- Tâche parente mis à #22923
#5 Mis à jour par Yoni Baude il y a environ 6 ans
Comme indiqué par Camille de la Réunion, la commande ouvre-firewall, débloque la situation, creoled fonctionne de nouveau.
Y aurait-il un soucis entre le firewall et creoled au démarrage ?
Yoni
#6 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Tâche parente
#22923supprimé
#7 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Tracker changé de Tâche à Scénario
- Echéance mis à 30/03/2018
- Version cible changé de sprint 2018 08-10 Equipe MENSR à sprint 2018 11-13 Equipe MENSR
- Release mis à EOLE 2.5.2.3
- Points de scénarios mis à 4.0
#8 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Lié à Tâche #23118: Vérifier les tests Jenkins 2.5.2 après publication ajouté
#9 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Lié à Proposition Scénario #17498: Rétro-porter la correction du problème du 'time out' après le changement de mot de passe root sur les modules EOLE ajouté
#10 Mis à jour par Gérald Schwartzmann il y a environ 6 ans
- Assigné à mis à Fabrice Barconnière
#11 Mis à jour par Joël Cuissinat il y a environ 6 ans
- Lié à Proposition Scénario #17498: Rétro-porter la correction du problème du 'time out' après le changement de mot de passe root sur les modules EOLE supprimé
#12 Mis à jour par Daniel Dehennin il y a environ 6 ans
- Statut changé de Nouveau à Terminé (Sprint)
#14 Mis à jour par Yoni Baude il y a presque 6 ans
Bonjour,
Sur nos horus 2.5.2 nous avons toujours le plantage de creoled au reboot de nos serveurs suite au maj kernel (ce n'est pas systématique) après la correction du fichier /etc/init.d/creoled.
Pour complément le Frontend Horus est désactivé.
Merci de aide.
Cordialement,
Yoni