Tâche #5897
Distribution EOLE - Scénario #8774: Creole
creole_serv non fonctionnel après reboot
Description
Constaté plusieurs fois sur l'Amon du collège du Parc, juste après un redémarrage le diagnose indique systématiquement :
*** Service Creole . creole_serv => Erreur
Related issues
Associated revisions
Ajout d’un délai avant le démarrage de bastion
- tmpl/interfaces: Attente d’une seconde avant de redémarrer rsyslog et
bastion.
Fixes: #5897 @15m
History
#1 Updated by Joël Cuissinat over 7 years ago
- Status changed from Nouveau to A étudier
- Target version set to Mises à jour 2.3.11
Il faudrait envisager de déplacer les post-up de /etc/network/interfaces vers des fichiers /etc/network/if-up.d ...
#2 Updated by Emmanuel GARETTE over 7 years ago
Je ne sais pas lancer de script en post-up que si la dernière interface est lancé et non à chaque "up" des interfaces.
#3 Updated by Daniel Dehennin over 7 years ago
- Due date set to 11/08/2013
- Status changed from A étudier to Accepté
- Assigned To set to Daniel Dehennin
#4 Updated by Daniel Dehennin over 7 years ago
- Status changed from Accepté to En attente d'informations
- Assigned To changed from Daniel Dehennin to Fabrice Barconnière
Sur un horus c’est bastion qui démarre creole_serv
Je ne sais pas comment ça se passe sur un amon.
#5 Updated by Fabrice Barconnière over 7 years ago
Sur Amon aussi, creole_serv est lancé par bastion.
Je n'ai pas le problème sur un Amon de test.
#6 Updated by Daniel Dehennin over 7 years ago
- Due date deleted (
11/08/2013) - Assigned To changed from Fabrice Barconnière to Joël Cuissinat
- Target version changed from Mises à jour 2.3.11 to Mises à jour 2.3.12
Est-ce que ce problème était dû à #5031, est-il toujours d’actualité ?
Je repousse pour la suivante en attendant Joël.
#7 Updated by Fabrice Barconnière over 7 years ago
Reboot du serveur Amon du collège la Parc : -> pas de souci, creole_serv se lance.
#8 Updated by Jean-Marc MELET over 7 years ago
Salut,
Je pense bien que l'on ait des cas de bug similaire...
Sur un Amon 2.3.9, aprés reboot le service bastion (et donc creole_serv aussi) ne se lance pas, malgré la présence des commandes en post-up:
auto eth4 iface eth4 inet static address 10.105.22.55 netmask 255.255.255.192 broadcast 10.105.22.63 network 10.105.22.0 post-up /sbin/restart-wrapper rsyslog post-up /etc/init.d/bastion restart
Même constat si on crée un script dans /etc/network/if-post-up.d/ qui lance bastion. Aurait-on un bug?
Je précise qu'un "ifdown eth4 && ifup eth4" relance bien bastion et lance creole_serv...
#9 Updated by Nicolas Bergandi over 7 years ago
Pour complément d'informations, voici ce que mon collègue a constaté hier :
le 10/12/2013, lors d'une mise à jour d'un serveur A (Maj-Auto -E) en Horus 2.3.9 vers une version complète 2.3.11, suivi d'un reconfigure et un reboot.
Nous lançons un diagnose sur le serveur, ce qui nous a permis de relever l'erreur suivante:
creole_serv => Erreur
Nous avions fait exactement la même mise à jour sur serveur *B *le mardi précédent (03/12/2013) sans avoir ce problème.
Je lance donc la commande suivante "Maj-Auto -s -E" sur le serveur B, ce qui me permet de constater que la version 2.3.11 comporte 5 nouvelles mise à jour.
eole-sso (2.3-eole101+1)
eole-sso-client (2.3-eole101+1)
libculr3 (7.19.7-1ubuntu1.5)
libcurl3-gnutls (7.19.7-1ubuntu1.5)
python-eolelaptor (2.3-eole101+1)
Pour ma part je ne sais pas à quoi sert le "creole_serv", mais quand on lance la commande "/etc/init.d/creole_serv status" le serveur A nous indique que celui ci n'est pas lancé
Quand je lance la commande "/etc/init.d/creole_serv start", le module se lance et le diagnose est OK.
Conclusion, je pense que la mise à jour d'un paquet semble avoir une incidence sur le module "creole_serv" qui ne se lance pas automatiquement à l'amorçage de la machine.
#10 Updated by Fabrice Barconnière about 7 years ago
- Target version changed from Mises à jour 2.3.12 to Mises à jour 2.3.13
#11 Updated by équipe eole Academie d'Orléans-Tours about 7 years ago
en complément : nous constatons le pb sur amon, scribe et horus mais a priori c'est uniquement sur ce dernier module qu'il y a un impact : le horus n'est pas visible dans le voisinage réseau et les partages (lecteurs) ne se montent pas.
Je confirme que c'est souvent au reboot que nous constatons ce pb et qu'un service creole_serv restart règle le pb...
#12 Updated by Lionel Morin about 7 years ago
Autre conséquence possible de ce problème : sur AmonEcole après un reboot les services Controle-Vnc et Controle-Vnc (Web) sont en erreur.
#13 Updated by Joël Cuissinat almost 7 years ago
- Due date set to 05/16/2014
- Assigned To deleted (
Joël Cuissinat) - Estimated time changed from 0.50 h to 2.00 h
#14 Updated by Daniel Dehennin almost 7 years ago
- Status changed from En attente d'informations to Accepté
- Assigned To set to Daniel Dehennin
N’aurions-nous pas le même genre de problème qu’avec #7861 ?
#15 Updated by Joël Cuissinat almost 7 years ago
Reproduit ce jour sur l'Amon du Parc en utilisant : Maj-Auto -CR avec une maj noyau !
Cependant, impossible à reproduire sur mes maquettes...
#16 Updated by Daniel Dehennin almost 7 years ago
- Status changed from Accepté to En attente d'informations
Sur la maquette amonecole qui a le soucis, je n’ai pu trouver qu’une chose :
- les sorties standard et d’erreur du processus
twistd
redirigées vers/dev/null
(ou un fichier) => ça démarre - pas de redirection => ça ne démarre pas.
Est-il possible de tester sur vos serveurs problématiques le remplacement de la ligne 55 de /etc/init.d/creole_serv
:
- avant:
start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log
- après:
start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log > /dev/null 2>&1
#17 Updated by équipe eole Academie d'Orléans-Tours almost 7 years ago
je viens de tester mais le service ne se lance pas mieux... (testé en rebootant le serveur ; un scribe dans le cas présent).
#18 Updated by Daniel Dehennin almost 7 years ago
équipe eole Academie d'Orléans-Tours a écrit :
je viens de tester mais le service ne se lance pas mieux... (testé en rebootant le serveur ; un scribe dans le cas présent).
Est-il possible de tester en ajoutant la redirection dans /etc/network/interfaces
?
- avant:
post-up /etc/init.d/bastion restart
- après:
post-up /etc/init.d/bastion restart > /dev/null 2>&1
Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861.
#19 Updated by Joël Cuissinat almost 7 years ago
- Target version deleted (
Mises à jour 2.3.13)
#20 Updated by Daniel Dehennin almost 7 years ago
- Due date deleted (
05/16/2014)
#21 Updated by équipe eole Academie d'Orléans-Tours almost 7 years ago
Bonjour,
Modification effectuée :start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log > /dev/null 2>&1
post-up /etc/init.d/bastion restart > /dev/null 2>&1
Cela sur le même scribe que précédemment, reboot, creole_serv toujours en erreur. Rien au niveau des log, on ne voit que l'arret du serveur (14h21):
2014/05/21 14:21:25 CEST [-] Received SIGTERM, shutting down.
2014/05/21 14:21:25 CEST [-] (Port 4333 Closed)
2014/05/21 14:21:25 CEST [-] Stopping factory <twisted.web.server.Site instance at 0x9d7666c>
2014/05/21 14:21:25 CEST [-] Main loop terminated.
2014/05/21 14:21:25 CEST [-] Server Shut Down.
Pour Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861. => que faut-il modifier exactement?
#22 Updated by Daniel Dehennin almost 7 years ago
équipe eole Academie d'Orléans-Tours a écrit :
Pour Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861. => que faut-il modifier exactement?
- modifier
/etc/network/interfaces
pour que bastion ne soit pas démarrer pendant la phase de démarrage des interfaces réseauxauto eth1 [...] post-up test "$(runlevel)" = unknown || /sbin/restart-wrapper rsyslog post-up test "$(runlevel)" = unknown || /etc/init.d/bastion restart
- Activer la gestion de creole_serv pendant les phases de démarrage/arrêt
root@server:# update-rc.d creole_serv defaults 19 90
- Activer la gestion de bastion pendant les phases de démarrage/arrêt
root@server:# update-rc.d bastion defaults 90 19
Ainsi :
- Au démarrage
- Les interfaces réseaux sont mises en service, le
runlevel
estunknown
, bastion n’est donc pas démarré - creole_serv est démarré très tôt par les scripts d’init
- bastion est démarré plus tard
- Les interfaces réseaux sont mises en service, le
- À l’arrêt
- bastion est arrêté très tôt par les scripts d’init
- creole_serv est arrêté presque à la fin
- Lors d’un reconfigure
- Les interfaces réseaux sont arrêtées puis démarrées, le
runlevel
n’est pasunknown
, bastion est donc pas redémarré
- Les interfaces réseaux sont arrêtées puis démarrées, le
#23 Updated by équipe eole Academie d'Orléans-Tours almost 7 years ago
ça marche en appliquant ces modifs (2 reboots sans modif -> creole_serv planté ; 2 reboots avec modifs -> creole_serv OK).
#24 Updated by Fabrice Barconnière almost 7 years ago
- Due date set to 06/20/2014
- Assigned To changed from Daniel Dehennin to Fabrice Barconnière
- Target version set to Mises à jour 2.3.13
#25 Updated by Fabrice Barconnière almost 7 years ago
- Project changed from creole to eole-common
#26 Updated by Joël Cuissinat almost 7 years ago
- Target version changed from Mises à jour 2.3.13 to sprint 2014 36-37
#27 Updated by Fabrice Barconnière almost 7 years ago
Reproduction du bug.
Différents tests :
- un "up sleep 1" avant up bastion start (dans interfaces) --> creole_serv démarre
- Redirection des sorties dans un fichier par un script qui lance bastion --> creole_serv démarre
....
Pas de solution satisfaisante.
Un problème de lancement de bastion sur Eole 2.4 se pose. Une solution est proposée. Le backport en 2.3 serait à envisager.
#28 Updated by Luc Bourdot over 6 years ago
- Tracker changed from Anomalie to Tâche
- Parent task set to #8774
#29 Updated by Daniel Dehennin over 6 years ago
- Status changed from En attente d'informations to Résolu
- % Done changed from 0 to 100
Appliqué par commit 0ccd99096dbc54aaef6aef5f9d8d3f41475d6849.
#31 Updated by équipe eole Academie d'Orléans-Tours over 6 years ago
- Start date set to 10/09/2014
- Remaining (hours) set to 0.0
le commit proposé ne résoud pas le pb ; en même temps il ne correspond en rien à ce qui nous avait été demandé de tester !
lors des reboots de scribe et horus le service creole_serv n'est pas relancé...
Pouvez vous réouvrir le signalement et corriger le pb ?
Merci.