Projet

Général

Profil

Tâche #5897

Distribution EOLE - Scénario #8774: Creole

creole_serv non fonctionnel après reboot

Ajouté par Joël Cuissinat il y a plus de 10 ans. Mis à jour il y a plus de 9 ans.

Statut:
Fermé
Priorité:
Haut
Début:
09/10/2014
Echéance:
20/06/2014
% réalisé:

100%

Temps estimé:
2.00 h
Temps passé:
Restant à faire (heures):
0.0

Description

Constaté plusieurs fois sur l'Amon du collège du Parc, juste après un redémarrage le diagnose indique systématiquement :


*** Service Creole
.                 creole_serv => Erreur


Demandes liées

Lié à eole-common - Anomalie #5031: Pb démarrage du service bastion Fermé 22/03/2013
Lié à EOP - Anomalie #7466: EOP non disponible après un reboot Fermé
Lié à eole-common - Anomalie #7861: Firewall pas démarré au reboot Fermé 04/04/2014 04/04/2014
Lié à eole-common - Anomalie #8271: plus de traffic dans les tunnels apres un reconfigure Fermé
Lié à Commun - Anomalie #8397: Il possible d'accéder au serveur avant la mise en place des règles Fermé 04/07/2014
Dupliqué par AmonEcole - Anomalie #6877: Probleme apres redemarrage Fermé

Révisions associées

Révision 0ccd9909 (diff)
Ajouté par Daniel Dehennin il y a plus de 9 ans

Ajout d’un délai avant le démarrage de bastion

  • tmpl/interfaces: Attente d’une seconde avant de redémarrer rsyslog et
    bastion.

Fixes: #5897 @15m

Historique

#1 Mis à jour par Joël Cuissinat il y a plus de 10 ans

  • Statut changé de Nouveau à A étudier
  • Version cible mis à Mises à jour 2.3.11

Il faudrait envisager de déplacer les post-up de /etc/network/interfaces vers des fichiers /etc/network/if-up.d ...

#2 Mis à jour par Emmanuel GARETTE il y a plus de 10 ans

Je ne sais pas lancer de script en post-up que si la dernière interface est lancé et non à chaque "up" des interfaces.

#3 Mis à jour par Daniel Dehennin il y a plus de 10 ans

  • Echéance mis à 08/11/2013
  • Statut changé de A étudier à Accepté
  • Assigné à mis à Daniel Dehennin

#4 Mis à jour par Daniel Dehennin il y a plus de 10 ans

  • Statut changé de Accepté à En attente d'informations
  • Assigné à changé de Daniel Dehennin à Fabrice Barconnière

Sur un horus c’est bastion qui démarre creole_serv

Je ne sais pas comment ça se passe sur un amon.

#5 Mis à jour par Fabrice Barconnière il y a plus de 10 ans

Sur Amon aussi, creole_serv est lancé par bastion.
Je n'ai pas le problème sur un Amon de test.

#6 Mis à jour par Daniel Dehennin il y a plus de 10 ans

  • Echéance 08/11/2013 supprimé
  • Assigné à changé de Fabrice Barconnière à Joël Cuissinat
  • Version cible changé de Mises à jour 2.3.11 à Mises à jour 2.3.12

Est-ce que ce problème était dû à #5031, est-il toujours d’actualité ?

Je repousse pour la suivante en attendant Joël.

#7 Mis à jour par Fabrice Barconnière il y a plus de 10 ans

Reboot du serveur Amon du collège la Parc : -> pas de souci, creole_serv se lance.

#8 Mis à jour par Jean-Marc MELET il y a plus de 10 ans

Salut,

Je pense bien que l'on ait des cas de bug similaire...
Sur un Amon 2.3.9, aprés reboot le service bastion (et donc creole_serv aussi) ne se lance pas, malgré la présence des commandes en post-up:

auto eth4
    iface eth4 inet static
    address 10.105.22.55
    netmask 255.255.255.192
    broadcast 10.105.22.63
    network 10.105.22.0
    post-up /sbin/restart-wrapper rsyslog
    post-up /etc/init.d/bastion restart

Même constat si on crée un script dans /etc/network/if-post-up.d/ qui lance bastion. Aurait-on un bug?

Je précise qu'un "ifdown eth4 && ifup eth4" relance bien bastion et lance creole_serv...

#9 Mis à jour par Nicolas Bergandi il y a plus de 10 ans

Pour complément d'informations, voici ce que mon collègue a constaté hier :

le 10/12/2013, lors d'une mise à jour d'un serveur A (Maj-Auto -E) en Horus 2.3.9 vers une version complète 2.3.11, suivi d'un reconfigure et un reboot.

Nous lançons un diagnose sur le serveur, ce qui nous a permis de relever l'erreur suivante:

creole_serv => Erreur

Nous avions fait exactement la même mise à jour sur serveur *B *le mardi précédent (03/12/2013) sans avoir ce problème.

Je lance donc la commande suivante "Maj-Auto -s -E" sur le serveur B, ce qui me permet de constater que la version 2.3.11 comporte 5 nouvelles mise à jour.

eole-sso (2.3-eole101+1)
eole-sso-client (2.3-eole101+1)
libculr3 (7.19.7-1ubuntu1.5)
libcurl3-gnutls (7.19.7-1ubuntu1.5)
python-eolelaptor (2.3-eole101+1)

Pour ma part je ne sais pas à quoi sert le "creole_serv", mais quand on lance la commande "/etc/init.d/creole_serv status" le serveur A nous indique que celui ci n'est pas lancé

Quand je lance la commande "/etc/init.d/creole_serv start", le module se lance et le diagnose est OK.

Conclusion, je pense que la mise à jour d'un paquet semble avoir une incidence sur le module "creole_serv" qui ne se lance pas automatiquement à l'amorçage de la machine.

#10 Mis à jour par Fabrice Barconnière il y a environ 10 ans

  • Version cible changé de Mises à jour 2.3.12 à Mises à jour 2.3.13

#11 Mis à jour par équipe eole Academie d'Orléans-Tours il y a environ 10 ans

en complément : nous constatons le pb sur amon, scribe et horus mais a priori c'est uniquement sur ce dernier module qu'il y a un impact : le horus n'est pas visible dans le voisinage réseau et les partages (lecteurs) ne se montent pas.
Je confirme que c'est souvent au reboot que nous constatons ce pb et qu'un service creole_serv restart règle le pb...

#12 Mis à jour par Lionel Morin il y a environ 10 ans

Autre conséquence possible de ce problème : sur AmonEcole après un reboot les services Controle-Vnc et Controle-Vnc (Web) sont en erreur.

#13 Mis à jour par Joël Cuissinat il y a presque 10 ans

  • Echéance mis à 16/05/2014
  • Assigné à Joël Cuissinat supprimé
  • Temps estimé changé de 0.50 h à 2.00 h

#14 Mis à jour par Daniel Dehennin il y a presque 10 ans

  • Statut changé de En attente d'informations à Accepté
  • Assigné à mis à Daniel Dehennin

N’aurions-nous pas le même genre de problème qu’avec #7861 ?

#15 Mis à jour par Joël Cuissinat il y a presque 10 ans

Reproduit ce jour sur l'Amon du Parc en utilisant : Maj-Auto -CR avec une maj noyau !

Cependant, impossible à reproduire sur mes maquettes...

#16 Mis à jour par Daniel Dehennin il y a presque 10 ans

  • Statut changé de Accepté à En attente d'informations

Sur la maquette amonecole qui a le soucis, je n’ai pu trouver qu’une chose :

  • les sorties standard et d’erreur du processus twistd redirigées vers /dev/null (ou un fichier) => ça démarre
  • pas de redirection => ça ne démarre pas.

Est-il possible de tester sur vos serveurs problématiques le remplacement de la ligne 55 de /etc/init.d/creole_serv :

  • avant: start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log
  • après: start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log > /dev/null 2>&1

#17 Mis à jour par équipe eole Academie d'Orléans-Tours il y a presque 10 ans

je viens de tester mais le service ne se lance pas mieux... (testé en rebootant le serveur ; un scribe dans le cas présent).

#18 Mis à jour par Daniel Dehennin il y a presque 10 ans

équipe eole Academie d'Orléans-Tours a écrit :

je viens de tester mais le service ne se lance pas mieux... (testé en rebootant le serveur ; un scribe dans le cas présent).

Est-il possible de tester en ajoutant la redirection dans /etc/network/interfaces ?

  • avant: post-up /etc/init.d/bastion restart
  • après: post-up /etc/init.d/bastion restart > /dev/null 2>&1

Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861.

#19 Mis à jour par Joël Cuissinat il y a presque 10 ans

  • Version cible Mises à jour 2.3.13 supprimé

#20 Mis à jour par Daniel Dehennin il y a presque 10 ans

  • Echéance 16/05/2014 supprimé

#21 Mis à jour par équipe eole Academie d'Orléans-Tours il y a presque 10 ans

Bonjour,

Modification effectuée :
start-stop-daemon --start --exec $DAEMON -- $DAEMON_ARGS --pidfile $PIDFILE --logfile /var/log/creole_serv/creole_serv.log > /dev/null 2>&1
post-up /etc/init.d/bastion restart > /dev/null 2>&1

Cela sur le même scribe que précédemment, reboot, creole_serv toujours en erreur. Rien au niveau des log, on ne voit que l'arret du serveur (14h21):
2014/05/21 14:21:25 CEST [-] Received SIGTERM, shutting down.
2014/05/21 14:21:25 CEST [-] (Port 4333 Closed)
2014/05/21 14:21:25 CEST [-] Stopping factory <twisted.web.server.Site instance at 0x9d7666c>
2014/05/21 14:21:25 CEST [-] Main loop terminated.
2014/05/21 14:21:25 CEST [-] Server Shut Down.

Pour Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861. => que faut-il modifier exactement?

#22 Mis à jour par Daniel Dehennin il y a presque 10 ans

équipe eole Academie d'Orléans-Tours a écrit :

Pour Si cela ne fonctionne pas, il faudra voir pour faire comme dans #7861. => que faut-il modifier exactement?

  1. modifier /etc/network/interfaces pour que bastion ne soit pas démarrer pendant la phase de démarrage des interfaces réseaux
    auto eth1
    [...]
        post-up test "$(runlevel)" = unknown || /sbin/restart-wrapper rsyslog
        post-up test "$(runlevel)" = unknown || /etc/init.d/bastion restart
    
  2. Activer la gestion de creole_serv pendant les phases de démarrage/arrêt
    root@server:# update-rc.d creole_serv defaults 19 90
    
  3. Activer la gestion de bastion pendant les phases de démarrage/arrêt
    root@server:# update-rc.d bastion defaults 90 19
    

Ainsi :

  • Au démarrage
    1. Les interfaces réseaux sont mises en service, le runlevel est unknown, bastion n’est donc pas démarré
    2. creole_serv est démarré très tôt par les scripts d’init
    3. bastion est démarré plus tard
  • À l’arrêt
    1. bastion est arrêté très tôt par les scripts d’init
    2. creole_serv est arrêté presque à la fin
  • Lors d’un reconfigure
    1. Les interfaces réseaux sont arrêtées puis démarrées, le runlevel n’est pas unknown, bastion est donc pas redémarré

#23 Mis à jour par équipe eole Academie d'Orléans-Tours il y a presque 10 ans

ça marche en appliquant ces modifs (2 reboots sans modif -> creole_serv planté ; 2 reboots avec modifs -> creole_serv OK).

#24 Mis à jour par Fabrice Barconnière il y a presque 10 ans

  • Echéance mis à 20/06/2014
  • Assigné à changé de Daniel Dehennin à Fabrice Barconnière
  • Version cible mis à Mises à jour 2.3.13

#25 Mis à jour par Fabrice Barconnière il y a presque 10 ans

  • Projet changé de creole à eole-common

#26 Mis à jour par Joël Cuissinat il y a presque 10 ans

  • Version cible changé de Mises à jour 2.3.13 à sprint 2014 36-37

#27 Mis à jour par Fabrice Barconnière il y a presque 10 ans

Installation Amonecole sur une machine physique.
Reproduction du bug.
Différents tests :
  • un "up sleep 1" avant up bastion start (dans interfaces) --> creole_serv démarre
  • Redirection des sorties dans un fichier par un script qui lance bastion --> creole_serv démarre
    ....

Pas de solution satisfaisante.
Un problème de lancement de bastion sur Eole 2.4 se pose. Une solution est proposée. Le backport en 2.3 serait à envisager.

#28 Mis à jour par Luc Bourdot il y a plus de 9 ans

  • Tracker changé de Anomalie à Tâche
  • Tâche parente mis à #8774

#29 Mis à jour par Daniel Dehennin il y a plus de 9 ans

  • Statut changé de En attente d'informations à Résolu
  • % réalisé changé de 0 à 100

#30 Mis à jour par Joël Cuissinat il y a plus de 9 ans

  • Statut changé de Résolu à Fermé

OK pour moi.

#31 Mis à jour par équipe eole Academie d'Orléans-Tours il y a plus de 9 ans

  • Début mis à 09/10/2014
  • Restant à faire (heures) mis à 0.0

le commit proposé ne résoud pas le pb ; en même temps il ne correspond en rien à ce qui nous avait été demandé de tester !
lors des reboots de scribe et horus le service creole_serv n'est pas relancé...
Pouvez vous réouvrir le signalement et corriger le pb ?
Merci.

Formats disponibles : Atom PDF