Project

General

Profile

Tâche #5897

Distribution EOLE - Scénario #8774: Creole

creole_serv non fonctionnel après reboot

Added by Joël Cuissinat over 7 years ago. Updated over 6 years ago.

Status:
Fermé
Priority:
Haut
Start date:
10/09/2014
Due date:
06/20/2014
% Done:

100%

Estimated time:
2.00 h
Spent time:
Remaining (hours):
0.0

Description

Constaté plusieurs fois sur l'Amon du collège du Parc, juste après un redémarrage le diagnose indique systématiquement :


*** Service Creole
.                 creole_serv => Erreur


Related issues

Related to eole-common - Anomalie #5031: Pb démarrage du service bastion Fermé 03/22/2013
Related to EOP - Anomalie #7466: EOP non disponible après un reboot Fermé
Related to eole-common - Anomalie #7861: Firewall pas démarré au reboot Fermé 04/04/2014 04/04/2014
Related to eole-common - Anomalie #8271: plus de traffic dans les tunnels apres un reconfigure Fermé
Related to Commun - Anomalie #8397: Il possible d'accéder au serveur avant la mise en place des règles Fermé 07/04/2014
Duplicated by AmonEcole - Anomalie #6877: Probleme apres redemarrage Fermé

Associated revisions

Revision 0ccd9909 (diff)
Added by Daniel Dehennin over 6 years ago

Ajout d’un délai avant le démarrage de bastion

  • tmpl/interfaces: Attente d’une seconde avant de redémarrer rsyslog et
    bastion.

Fixes: #5897 @15m

History

#1 Updated by Joël Cuissinat over 7 years ago

  • Status changed from Nouveau to A étudier
  • Target version set to Mises à jour 2.3.11

Il faudrait envisager de déplacer les post-up de /etc/network/interfaces vers des fichiers /etc/network/if-up.d ...

#2 Updated by Emmanuel GARETTE over 7 years ago

Je ne sais pas lancer de script en post-up que si la dernière interface est lancé et non à chaque "up" des interfaces.

#3 Updated by Daniel Dehennin over 7 years ago

  • Due date set to 11/08/2013
  • Status changed from A étudier to Accepté
  • Assigned To set to Daniel Dehennin

#4 Updated by Daniel Dehennin over 7 years ago

  • Status changed from Accepté to En attente d'informations
  • Assigned To changed from Daniel Dehennin to Fabrice Barconnière

Sur un horus c’est bastion qui démarre creole_serv

Je ne sais pas comment ça se passe sur un amon.

#5 Updated by Fabrice Barconnière over 7 years ago

Sur Amon aussi, creole_serv est lancé par bastion.
Je n'ai pas le problème sur un Amon de test.

#6 Updated by Daniel Dehennin over 7 years ago

  • Due date deleted (11/08/2013)
  • Assigned To changed from Fabrice Barconnière to Joël Cuissinat
  • Target version changed from Mises à jour 2.3.11 to Mises à jour 2.3.12

Est-ce que ce problème était dû à #5031, est-il toujours d’actualité ?

Je repousse pour la suivante en attendant Joël.

#7 Updated by Fabrice Barconnière over 7 years ago

Reboot du serveur Amon du collège la Parc : -> pas de souci, creole_serv se lance.

#8 Updated by Jean-Marc MELET over 7 years ago

Salut,

Je pense bien que l'on ait des cas de bug similaire...
Sur un Amon 2.3.9, aprés reboot le service bastion (et donc creole_serv aussi) ne se lance pas, malgré la présence des commandes en post-up:

auto eth4
    iface eth4 inet static
    address 10.105.22.55
    netmask 255.255.255.192
    broadcast 10.105.22.63
    network 10.105.22.0
    post-up /sbin/restart-wrapper rsyslog
    post-up /etc/init.d/bastion restart

Même constat si on crée un script dans /etc/network/if-post-up.d/ qui lance bastion. Aurait-on un bug?

Je précise qu'un "ifdown eth4 && ifup eth4" relance bien bastion et lance creole_serv...

#9 Updated by Nicolas Bergandi over 7 years ago

Pour complément d'informations, voici ce que mon collègue a constaté hier :

le 10/12/2013, lors d'une mise à jour d'un serveur A (Maj-Auto -E) en Horus 2.3.9 vers une version complète 2.3.11, suivi d'un reconfigure et un reboot.

Nous lançons un diagnose sur le serveur, ce qui nous a permis de relever l'erreur suivante:

creole_serv => Erreur

Nous avions fait exactement la même mise à jour sur serveur *B *le mardi précédent (03/12/2013) sans avoir ce problème.

Je lance donc la commande suivante "Maj-Auto -s -E" sur le serveur B, ce qui me permet de constater que la version 2.3.11 comporte 5 nouvelles mise à jour.

eole-sso (2.3-eole101+1)
eole-sso-client (2.3-eole101+1)
libculr3 (7.19.7-1ubuntu1.5)
libcurl3-gnutls (7.19.7-1ubuntu1.5)
python-eolelaptor (2.3-eole101+1)

Pour ma part je ne sais pas à quoi sert le "creole_serv", mais quand on lance la commande "/etc/init.d/creole_serv status" le serveur A nous indique que celui ci n'est pas lancé

Quand je lance la commande "/etc/init.d/creole_serv start", le module se lance et le diagnose est OK.

Conclusion, je pense que la mise à jour d'un paquet semble avoir une incidence sur le module "creole_serv" qui ne se lance pas automatiquement à l'amorçage de la machine.

#10 Updated by Fabrice Barconnière about 7 years ago

  • Target version changed from Mises à jour 2.3.12 to Mises à jour 2.3.13

#11 Updated by équipe eole Academie d'Orléans-Tours about 7 years ago

en complément : nous constatons le pb sur amon, scribe et horus mais a priori c'est uniquement sur ce dernier module qu'il y a un impact : le horus n'est pas visible dans le voisinage réseau et les partages (lecteurs) ne se montent pas.
Je confirme que c'est souvent au reboot que nous constatons ce pb et qu'un service creole_serv restart règle le pb...

#12 Updated by Lionel Morin about 7 years ago

Autre conséquence possible de ce problème : sur AmonEcole après un reboot les services Controle-Vnc et Controle-Vnc (Web) sont en erreur.

#13 Updated by Joël Cuissinat almost 7 years ago

  • Due date set to 05/16/2014
  • Assigned To deleted (Joël Cuissinat)
  • Estimated time changed from 0.50 h to 2.00 h

#14 Updated by Daniel Dehennin almost 7 years ago

  • Status changed from En attente d'informations to Accepté
  • Assigned To set to Daniel Dehennin

N’aurions-nous pas le même genre de problème qu’avec #7861 ?

#15 Updated by Joël Cuissinat almost 7 years ago

Reproduit ce jour sur l'Amon du Parc en utilisant : Maj-Auto -CR avec une maj noyau !

Cependant, impossible à reproduire sur mes maquettes...

#16 Updated by Daniel Dehennin almost 7 years ago

  • Status changed from Accepté to En attente d'informations

Sur la maquette amonecole qui a le soucis, je n’ai pu trouver qu’une chose :

  • les sorties standard et d’erreur du processus twistd redirigées vers /dev/null (ou un fichier) => ça démarre
  • pas de redirection => ça ne démarre pas.

Est-il possible de tester sur vos serveurs problématiques le remplacement de la ligne 55 de /etc/init.d/creole_serv :

  • avant: start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log
  • après: start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log > /dev/null 2>&1

#17 Updated by équipe eole Academie d'Orléans-Tours almost 7 years ago

je viens de tester mais le service ne se lance pas mieux... (testé en rebootant le serveur ; un scribe dans le cas présent).

#18 Updated by Daniel Dehennin almost 7 years ago

équipe eole Academie d'Orléans-Tours a écrit :

je viens de tester mais le service ne se lance pas mieux... (testé en rebootant le serveur ; un scribe dans le cas présent).

Est-il possible de tester en ajoutant la redirection dans /etc/network/interfaces ?

  • avant: post-up /etc/init.d/bastion restart
  • après: post-up /etc/init.d/bastion restart > /dev/null 2>&1

Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861.

#19 Updated by Joël Cuissinat almost 7 years ago

  • Target version deleted (Mises à jour 2.3.13)

#20 Updated by Daniel Dehennin almost 7 years ago

  • Due date deleted (05/16/2014)

#21 Updated by équipe eole Academie d'Orléans-Tours almost 7 years ago

Bonjour,

Modification effectuée :
start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log > /dev/null 2>&1
post-up /etc/init.d/bastion restart > /dev/null 2>&1

Cela sur le même scribe que précédemment, reboot, creole_serv toujours en erreur. Rien au niveau des log, on ne voit que l'arret du serveur (14h21):
2014/05/21 14:21:25 CEST [-] Received SIGTERM, shutting down.
2014/05/21 14:21:25 CEST [-] (Port 4333 Closed)
2014/05/21 14:21:25 CEST [-] Stopping factory <twisted.web.server.Site instance at 0x9d7666c>
2014/05/21 14:21:25 CEST [-] Main loop terminated.
2014/05/21 14:21:25 CEST [-] Server Shut Down.

Pour Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861. => que faut-il modifier exactement?

#22 Updated by Daniel Dehennin almost 7 years ago

équipe eole Academie d'Orléans-Tours a écrit :

Pour Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861. => que faut-il modifier exactement?

  1. modifier /etc/network/interfaces pour que bastion ne soit pas démarrer pendant la phase de démarrage des interfaces réseaux
    auto eth1
    [...]
        post-up test "$(runlevel)" = unknown || /sbin/restart-wrapper rsyslog
        post-up test "$(runlevel)" = unknown || /etc/init.d/bastion restart
    
  2. Activer la gestion de creole_serv pendant les phases de démarrage/arrêt
    root@server:# update-rc.d creole_serv defaults 19 90
    
  3. Activer la gestion de bastion pendant les phases de démarrage/arrêt
    root@server:# update-rc.d bastion defaults 90 19
    

Ainsi :

  • Au démarrage
    1. Les interfaces réseaux sont mises en service, le runlevel est unknown, bastion n’est donc pas démarré
    2. creole_serv est démarré très tôt par les scripts d’init
    3. bastion est démarré plus tard
  • À l’arrêt
    1. bastion est arrêté très tôt par les scripts d’init
    2. creole_serv est arrêté presque à la fin
  • Lors d’un reconfigure
    1. Les interfaces réseaux sont arrêtées puis démarrées, le runlevel n’est pas unknown, bastion est donc pas redémarré

#23 Updated by équipe eole Academie d'Orléans-Tours almost 7 years ago

ça marche en appliquant ces modifs (2 reboots sans modif -> creole_serv planté ; 2 reboots avec modifs -> creole_serv OK).

#24 Updated by Fabrice Barconnière almost 7 years ago

  • Due date set to 06/20/2014
  • Assigned To changed from Daniel Dehennin to Fabrice Barconnière
  • Target version set to Mises à jour 2.3.13

#25 Updated by Fabrice Barconnière almost 7 years ago

  • Project changed from creole to eole-common

#26 Updated by Joël Cuissinat almost 7 years ago

  • Target version changed from Mises à jour 2.3.13 to sprint 2014 36-37

#27 Updated by Fabrice Barconnière almost 7 years ago

Installation Amonecole sur une machine physique.
Reproduction du bug.
Différents tests :
  • un "up sleep 1" avant up bastion start (dans interfaces) --> creole_serv démarre
  • Redirection des sorties dans un fichier par un script qui lance bastion --> creole_serv démarre
    ....

Pas de solution satisfaisante.
Un problème de lancement de bastion sur Eole 2.4 se pose. Une solution est proposée. Le backport en 2.3 serait à envisager.

#28 Updated by Luc Bourdot over 6 years ago

  • Tracker changed from Anomalie to Tâche
  • Parent task set to #8774

#29 Updated by Daniel Dehennin over 6 years ago

  • Status changed from En attente d'informations to Résolu
  • % Done changed from 0 to 100

#30 Updated by Joël Cuissinat over 6 years ago

  • Status changed from Résolu to Fermé

OK pour moi.

#31 Updated by équipe eole Academie d'Orléans-Tours over 6 years ago

  • Start date set to 10/09/2014
  • Remaining (hours) set to 0.0

le commit proposé ne résoud pas le pb ; en même temps il ne correspond en rien à ce qui nous avait été demandé de tester !
lors des reboots de scribe et horus le service creole_serv n'est pas relancé...
Pouvez vous réouvrir le signalement et corriger le pb ?
Merci.

Also available in: Atom PDF