Projet

Général

Profil

Proposition Scénario #16704

BUG: l’agent Zéphir dansguardian fait des appels cachés à creoled

Ajouté par Karim Ayari il y a presque 8 ans. Mis à jour il y a plus de 7 ans.

Statut:
Classée sans suite
Priorité:
Normal
Assigné à:
-
Catégorie:
-
Version cible:
-
% réalisé:

0%


Description

Problème

L’agent dansguardian fait des appels à pyeole.process.system_out qui fait des appels à creole.client.

Si creoled est arrêté, ces appels lèvent une exception.

Propositions

Demande initiale

dans la continuité de la demande #16703 si creoled est arrêté l'agent zéphir fait des erreurs
et notamment empêche la relance de e2guardian. en effet les établissements nous appelle car ils n'ont plus d'accès internet,
le fait de lancer creoled l'agent zéphir semble débloquer la situation, alors est-ce lié ou non ?! voilà un bout de log :

2016-07-05T10:19:34.933952+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED
2016-07-05T10:19:34.933960+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332)
2016-07-05T10:19:46.119623+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh
2016-07-05T10:19:46.120353+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats
2016-07-05T10:19:46.120537+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats]
2016-07-05T10:19:46.120714+02:00 lacotiere.0011326l.local zephiragents: [-] RRDtool warning: stats/281/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None'
2016-07-05T10:21:33.720612+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED
2016-07-05T10:21:33.720622+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332)
2016-07-05T10:21:46.125038+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh
2016-07-05T10:21:46.125473+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats
2016-07-05T10:21:46.125751+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats]
2016-07-05T10:23:33.718503+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED
2016-07-05T10:23:33.718511+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332)
2016-07-05T10:23:46.123428+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh
2016-07-05T10:23:46.123883+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats
2016-07-05T10:23:46.124182+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats]
2016-07-05T10:23:46.124336+02:00 lacotiere.0011326l.local zephiragents: [-] RRDtool warning: stats/281/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None'
2016-07-05T10:25:33.727015+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED
2016-07-05T10:25:33.727026+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332)
2016-07-05T10:25:46.123295+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh
2016-07-05T10:25:46.123762+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats
2016-07-05T10:25:46.124059+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats]
2016-07-05T10:25:46.124216+02:00 lacotiere.0011326l.local zephiragents: [-] RRDtool warning: stats/281/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None'

et ensuite si on lance creoled voici ce qu'il nous dit :

2016-07-05T10:27:18.546946+02:00 lacotiere.0011326l.local zephiragents: [-] agent dans1 : service e2guardian relancé
2016-07-05T10:27:40.430050+02:00 lacotiere.0011326l.local zephiragents: [-] agent dans2 : service e2guardian relancé

et e2guardian est de nouveau opérationnel.


Demandes liées

Lié à Distribution EOLE - Tâche #14547: Corriger le comportement du service z_stats si Creoled est arrêté Fermé 05/01/2016

Historique

#1 Mis à jour par Daniel Dehennin il y a presque 8 ans

  • Assigné à mis à Daniel Dehennin

Avez-vous des erreurs sur un module 2.5.2 ?

Un travail a été fait en 2.5.2 afin de ne plus avoir ce problème (#14547).

#2 Mis à jour par Karim Ayari il y a presque 8 ans

c'est justement sur 2.5.2

#3 Mis à jour par Daniel Dehennin il y a plus de 7 ans

  • Tracker changé de Demande à Proposition Scénario
  • Sujet changé de l'agent zéphir fait des erreurs si creoled est arrêté à BUG: l’agent Zéphir dansguardian fait des appels cachés à creoled
  • Description mis à jour (diff)
  • Statut changé de Nouveau à À formaliser
  • Assigné à Daniel Dehennin supprimé

#4 Mis à jour par Scrum Master il y a plus de 7 ans

  • Statut changé de À formaliser à Classée sans suite

Pas de solution (les guardians peuvent être dans un conteneur)

#5 Mis à jour par Karim Ayari il y a plus de 7 ans

Toujours un problème avec Creoled ! suite à une mise à jour auto et reboot le service est planté
et guardian aussi Amon 2.5.2 merci de nous apporter une solution parce que cela commence à être casse pied

root@lacotiere:~# tailf /var/log/syslog
2016-09-27T08:50:50.267283+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 484, in get_container
2016-09-27T08:50:50.267288+02:00 lacotiere.0011326l.local zephiragents: [-] #011 withvalue=name)
2016-09-27T08:50:50.267294+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 381, in get
2016-09-27T08:50:50.267300+02:00 lacotiere.0011326l.local zephiragents: [-] #011 ret = self.request('/get', path, **kwargs)
2016-09-27T08:50:50.267306+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 308, in request
2016-09-27T08:50:50.267312+02:00 lacotiere.0011326l.local zephiragents: [-] #011 ret = self._request(self.url + command + path, **kwargs)
2016-09-27T08:50:50.267318+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 287, in _request
2016-09-27T08:50:50.267324+02:00 lacotiere.0011326l.local zephiragents: [-] #011 raise TimeoutCreoleClientError(msg.format(err))
2016-09-27T08:50:50.267330+02:00 lacotiere.0011326l.local zephiragents: [-] #011creole.client.TimeoutCreoleClientError: HTTP error: socket.error: [Errno 111] ECONNREFUSED
2016-09-27T08:50:50.267336+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start'

#6 Mis à jour par Karim Ayari il y a plus de 7 ans

une mise à jour ce week-end + reboot = creoled planté + filtrage pédago planté

root@jeanpuy:~# /usr/share/eole/diagnose/151-proxy
*** Services Proxy
.                       proxy => Ok
*** Filtre web
personnel:    eole.ac-dijon.fr => Ok
eth1.10:     eole.ac-dijon.fr => Ok
eleve:       eole.ac-dijon.fr => Erreur
eleve:          ftp.crihan.fr => Erreur
eth2.20:     eole.ac-dijon.fr => Erreur
eth2.20:        ftp.crihan.fr => Erreur
eth2.224:    eole.ac-dijon.fr => Erreur
eth2.224:       ftp.crihan.fr => Erreur
dmz:         eole.ac-dijon.fr => Erreur
dmz:            ftp.crihan.fr => Erreur
eth3.220:    eole.ac-dijon.fr => Erreur
eth3.220:       ftp.crihan.fr => Erreur
eth3.221:    eole.ac-dijon.fr => Erreur
eth3.221:       ftp.crihan.fr => Erreur
eth3.222:    eole.ac-dijon.fr => Erreur
eth3.222:       ftp.crihan.fr => Erreur
eth3.223:    eole.ac-dijon.fr => Erreur
eth3.223:       ftp.crihan.fr => Erreur
eth3.225:    eole.ac-dijon.fr => Erreur
eth3.225:       ftp.crihan.fr => Erreur
eth3.299:    eole.ac-dijon.fr => Erreur
eth3.299:       ftp.crihan.fr => Erreur
eth3.232:    eole.ac-dijon.fr => Erreur
eth3.232:       ftp.crihan.fr => Erreur
eth3.236:    eole.ac-dijon.fr => Erreur
eth3.236:       ftp.crihan.fr => Erreur
eth3.332:    eole.ac-dijon.fr => Erreur
eth3.332:       ftp.crihan.fr => Erreur
eth3.324:    eole.ac-dijon.fr => Erreur
eth3.324:       ftp.crihan.fr => Erreur
eth3.328:    eole.ac-dijon.fr => Erreur
eth3.328:       ftp.crihan.fr => Erreur
eth3.360:    eole.ac-dijon.fr => Erreur
eth3.360:       ftp.crihan.fr => Erreur
.              Nb instances 1 => 160/250
.              Nb instances 2 => 0/1000
2016-10-17T08:42:37.394286+02:00 jeanpuy.0420031f.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED
2016-10-17T08:42:37.394302+02:00 jeanpuy.0420031f.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332)
2016-10-17T08:42:49.580074+02:00 jeanpuy.0420031f.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh
2016-10-17T08:42:49.580639+02:00 jeanpuy.0420031f.local zephiragents: [-] /!\ measure return empty value: squid-stats
2016-10-17T08:42:49.581323+02:00 jeanpuy.0420031f.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats]
2016-10-17T08:42:49.581646+02:00 jeanpuy.0420031f.local zephiragents: [-] RRDtool warning: stats/251/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None'
2016-10-17T08:43:55.469502+02:00 jeanpuy.0420031f.local zephiragents: [HTTPChannel,15,127.0.0.1] 127.0.0.1 - - [17/Oct/2016:06:43:55 +0000] "POST /xmlrpc/ HTTP/1.1" 200 6074 "-" "xmlrpclib.py/1.0.1 (by www.pythonware.com)" 
2016-10-17T08:43:55.473529+02:00 jeanpuy.0420031f.local zephiragents: [HTTPChannel,15,127.0.0.1] 127.0.0.1 - - [17/Oct/2016:06:43:55 +0000] "POST /xmlrpc/ HTTP/1.1" 200 2483 "-" "xmlrpclib.py/1.0.1 (by www.pythonware.com)" 

et quand je relance creoled et z_stats tout rentre dans l'ordre

2016-10-17T08:45:25.923828+02:00 jeanpuy.0420031f.local zephiragents: [-] agent dans2 : service e2guardian relancé
root@jeanpuy:~# /usr/share/eole/diagnose/151-proxy
*** Services Proxy
.                       proxy => Ok
*** Filtre web
personnel:    eole.ac-dijon.fr => Ok
eth1.10:     eole.ac-dijon.fr => Ok
eleve:       eole.ac-dijon.fr => Ok
eth2.20:     eole.ac-dijon.fr => Ok
eth2.224:    eole.ac-dijon.fr => Ok
dmz:         eole.ac-dijon.fr => Ok
eth3.220:    eole.ac-dijon.fr => Ok
eth3.221:    eole.ac-dijon.fr => Ok
eth3.222:    eole.ac-dijon.fr => Ok
eth3.223:    eole.ac-dijon.fr => Ok
eth3.225:    eole.ac-dijon.fr => Ok
eth3.299:    eole.ac-dijon.fr => Ok
eth3.232:    eole.ac-dijon.fr => Ok
eth3.236:    eole.ac-dijon.fr => Ok
eth3.332:    eole.ac-dijon.fr => Ok
eth3.324:    eole.ac-dijon.fr => Ok
eth3.328:    eole.ac-dijon.fr => Ok
eth3.360:    eole.ac-dijon.fr => Ok
.              Nb instances 1 => 56/250
.              Nb instances 2 => 101/1000

#7 Mis à jour par Karim Ayari il y a plus de 7 ans

encore des creoled plantés ce matin suite à une mise àjour de ce week-end + reboot

2016-10-23 04:41:37,495: cherrypy.access.3057260396 - 127.0.0.1 - - [23/Oct/2016:04:41:37] "GET /get/creole?variable=mode_conteneur_actif HTTP/1.1" 200 32 "" "restkit/4.2.2" 
2016-10-23 04:41:41,675: cherrypy.error -  ENGINE Caught signal SIGTERM.
2016-10-23 04:41:41,676: cherrypy.error -  ENGINE Bus STOPPING
2016-10-23 04:41:41,680: cherrypy.error -  ENGINE HTTP Server cherrypy._cpwsgi_server.CPWSGIServer(('127.0.0.1', 8000)) shut down
2016-10-23 04:41:41,680: cherrypy.error -  ENGINE Stopped thread '_TimeoutMonitor'.
2016-10-23 04:41:41,681: cherrypy.error -  ENGINE Stop InotifyMonitor thread
2016-10-23 04:41:41,681: cherrypy.error -  ENGINE Stopped thread 'Autoreloader'.
2016-10-23 04:41:41,682: cherrypy.error -  ENGINE Bus STOPPED
2016-10-23 04:41:41,682: cherrypy.error -  ENGINE Bus EXITING
2016-10-23 04:41:41,682: cherrypy.error -  ENGINE PID file removed: '/run/creoled.pid'.
2016-10-23 04:41:41,682: cherrypy.error -  ENGINE Bus EXITED
2016-10-23 04:41:41,682: cherrypy.error -  ENGINE Waiting for child threads to terminate...
2016-10-23 04:45:15,350: cherrypy.error -  ENGINE Listening for SIGHUP.
2016-10-23 04:45:15,371: cherrypy.error -  ENGINE Listening for SIGTERM.
2016-10-23 04:45:15,371: cherrypy.error -  ENGINE Listening for SIGUSR1.
2016-10-23 04:45:15,371: cherrypy.error -  ENGINE Listening for SIGINT.
2016-10-23 04:45:15,421: cherrypy.error -  ENGINE Bus STARTING
2016-10-23 04:45:15,423: cherrypy.error -  ENGINE Forking once.
2016-10-23 04:45:15,424: cherrypy.error -  ENGINE Daemonized to PID: 3624
2016-10-23 04:45:15,424: cherrypy.error -  ENGINE Forking twice.
2016-10-23 04:45:15,425: cherrypy.error -  ENGINE Started monitor thread '_TimeoutMonitor'.
2016-10-23 04:45:15,425: cherrypy.error -  ENGINE PID 3624 written to '/run/creoled.pid'.
2016-10-23 04:45:15,425: cherrypy.error -  ENGINE Start InotifyMonitor thread
2016-10-23 04:45:15,425: cherrypy.error -  ENGINE Started monitor thread 'Autoreloader'.
2016-10-23 04:46:55,794: cherrypy.error -  ENGINE Error in 'start' listener <bound method Server.start of <cherrypy._cpserver.Server object at 0xb641a76c>>
Traceback (most recent call last):
  File "/usr/lib/python2.7/dist-packages/cherrypy/process/wspbus.py", line 197, in publish
    output.append(listener(*args, **kwargs))
  File "/usr/lib/python2.7/dist-packages/cherrypy/_cpserver.py", line 151, in start
    ServerAdapter.start(self)
  File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 174, in start
    self.wait()
  File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 214, in wait
    wait_for_occupied_port(host, port)
  File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 427, in wait_for_occupied_port
    raise IOError("Port %r not bound on %r" % (port, host))
IOError: Port 8000 not bound on '127.0.0.1'

2016-10-23 04:46:55,794: cherrypy.error -  ENGINE Shutting down due to error in start listener:
Traceback (most recent call last):
  File "/usr/lib/python2.7/dist-packages/cherrypy/process/wspbus.py", line 235, in start
    self.publish('start')
  File "/usr/lib/python2.7/dist-packages/cherrypy/process/wspbus.py", line 215, in publish
    raise exc
ChannelFailures: IOError("Port 8000 not bound on '127.0.0.1'",)

2016-10-23 04:46:55,794: cherrypy.error -  ENGINE Bus STOPPING
2016-10-23 04:46:55,794: cherrypy.error -  ENGINE HTTP Server cherrypy._cpwsgi_server.CPWSGIServer(('127.0.0.1', 8000)) already shut down
2016-10-23 04:46:55,794: cherrypy.error -  ENGINE Stopped thread 'Autoreloader'.
2016-10-23 04:46:55,794: cherrypy.error -  ENGINE Stop InotifyMonitor thread
2016-10-23 04:46:55,794: cherrypy.error -  ENGINE Stopped thread '_TimeoutMonitor'.
2016-10-23 04:46:55,795: cherrypy.error -  ENGINE Bus STOPPED
2016-10-23 04:46:55,795: cherrypy.error -  ENGINE Bus EXITING
2016-10-23 04:46:55,795: cherrypy.error -  ENGINE PID file removed: '/run/creoled.pid'.
2016-10-23 04:46:55,795: cherrypy.error -  ENGINE Bus EXITED
creoled.log-20161023 lines 23646-23707/23707 (END)

#8 Mis à jour par Karim Ayari il y a plus de 7 ans

autre effet de bord au fait que Creoled ne se lance pas
au moment du redémarrage de bastion après la rotation des logs et bien aucune régles n'est chargées :

root@gbaty:~# service bastion restart
root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED
Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start'
 * Réinitialisation du pare-feu                                                                                                                                                                                   * Activation du mode forteresse sur eth0                                                                                                                                                                         * Activation du mode forteresse sur eth1                                                                                                                                                                         * Activation du mode forteresse sur eth2                                                                                                                                                                         * Activation du mode forteresse sur eth3                                                                                                                                                                        root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED
Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start'
                                                                                                                                                                                                          [ OK ]
 * Regénération des règles de pare-feu
root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED
Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start'
root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED
Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start'
Impossible de contacter creoled                                                                                                                                                                           [fail]
 * Mise en cache des règles de pare-feu (utiliser '/etc/init.d/bastion reload' pour appliquer l'ancien cache)                                                                                             [fail] 
 * Réinitialisation du pare-feu                                                                                                                                                                                   * Activation du mode forteresse sur eth0                                                                                                                                                                         * Activation du mode forteresse sur eth1                                                                                                                                                                         * Activation du mode forteresse sur eth2                                                                                                                                                                         * Activation du mode forteresse sur eth3                                                                                                                                                                        root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED
Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start'
Le serveur est protégé. Pour relancer le pare-feu, exécuter "CreoleService bastion reload" 

Formats disponibles : Atom PDF