Proposition Scénario #16704
BUG: l’agent Zéphir dansguardian fait des appels cachés à creoled
0%
Description
Problème¶
L’agent dansguardian fait des appels à pyeole.process.system_out
qui fait des appels à creole.client
.
Si creoled
est arrêté, ces appels lèvent une exception.
Propositions¶
Demande initiale¶
dans la continuité de la demande #16703 si creoled est arrêté l'agent zéphir fait des erreurs
et notamment empêche la relance de e2guardian. en effet les établissements nous appelle car ils n'ont plus d'accès internet,
le fait de lancer creoled l'agent zéphir semble débloquer la situation, alors est-ce lié ou non ?! voilà un bout de log :
2016-07-05T10:19:34.933952+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED 2016-07-05T10:19:34.933960+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332) 2016-07-05T10:19:46.119623+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh 2016-07-05T10:19:46.120353+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats 2016-07-05T10:19:46.120537+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats] 2016-07-05T10:19:46.120714+02:00 lacotiere.0011326l.local zephiragents: [-] RRDtool warning: stats/281/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None' 2016-07-05T10:21:33.720612+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED 2016-07-05T10:21:33.720622+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332) 2016-07-05T10:21:46.125038+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh 2016-07-05T10:21:46.125473+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats 2016-07-05T10:21:46.125751+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats] 2016-07-05T10:23:33.718503+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED 2016-07-05T10:23:33.718511+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332) 2016-07-05T10:23:46.123428+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh 2016-07-05T10:23:46.123883+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats 2016-07-05T10:23:46.124182+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats] 2016-07-05T10:23:46.124336+02:00 lacotiere.0011326l.local zephiragents: [-] RRDtool warning: stats/281/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None' 2016-07-05T10:25:33.727015+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED 2016-07-05T10:25:33.727026+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332) 2016-07-05T10:25:46.123295+02:00 lacotiere.0011326l.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh 2016-07-05T10:25:46.123762+02:00 lacotiere.0011326l.local zephiragents: [-] /!\ measure return empty value: squid-stats 2016-07-05T10:25:46.124059+02:00 lacotiere.0011326l.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats] 2016-07-05T10:25:46.124216+02:00 lacotiere.0011326l.local zephiragents: [-] RRDtool warning: stats/281/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None'
et ensuite si on lance creoled voici ce qu'il nous dit :
2016-07-05T10:27:18.546946+02:00 lacotiere.0011326l.local zephiragents: [-] agent dans1 : service e2guardian relancé 2016-07-05T10:27:40.430050+02:00 lacotiere.0011326l.local zephiragents: [-] agent dans2 : service e2guardian relancé
et e2guardian est de nouveau opérationnel.
Demandes liées
Historique
#1 Mis à jour par Daniel Dehennin il y a presque 8 ans
- Assigné à mis à Daniel Dehennin
Avez-vous des erreurs sur un module 2.5.2 ?
Un travail a été fait en 2.5.2 afin de ne plus avoir ce problème (#14547).
#2 Mis à jour par Karim Ayari il y a presque 8 ans
c'est justement sur 2.5.2
#3 Mis à jour par Daniel Dehennin il y a plus de 7 ans
- Tracker changé de Demande à Proposition Scénario
- Sujet changé de l'agent zéphir fait des erreurs si creoled est arrêté à BUG: l’agent Zéphir dansguardian fait des appels cachés à creoled
- Description mis à jour (diff)
- Statut changé de Nouveau à À formaliser
- Assigné à
Daniel Dehenninsupprimé
#4 Mis à jour par Scrum Master il y a plus de 7 ans
- Statut changé de À formaliser à Classée sans suite
Pas de solution (les guardians peuvent être dans un conteneur)
#5 Mis à jour par Karim Ayari il y a plus de 7 ans
Toujours un problème avec Creoled ! suite à une mise à jour auto et reboot le service est planté
et guardian aussi Amon 2.5.2 merci de nous apporter une solution parce que cela commence à être casse pied
root@lacotiere:~# tailf /var/log/syslog
2016-09-27T08:50:50.267283+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 484, in get_container
2016-09-27T08:50:50.267288+02:00 lacotiere.0011326l.local zephiragents: [-] #011 withvalue=name)
2016-09-27T08:50:50.267294+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 381, in get
2016-09-27T08:50:50.267300+02:00 lacotiere.0011326l.local zephiragents: [-] #011 ret = self.request('/get', path, **kwargs)
2016-09-27T08:50:50.267306+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 308, in request
2016-09-27T08:50:50.267312+02:00 lacotiere.0011326l.local zephiragents: [-] #011 ret = self._request(self.url + command + path, **kwargs)
2016-09-27T08:50:50.267318+02:00 lacotiere.0011326l.local zephiragents: [-] #011 File "/usr/lib/python2.7/dist-packages/creole/client.py", line 287, in _request
2016-09-27T08:50:50.267324+02:00 lacotiere.0011326l.local zephiragents: [-] #011 raise TimeoutCreoleClientError(msg.format(err))
2016-09-27T08:50:50.267330+02:00 lacotiere.0011326l.local zephiragents: [-] #011creole.client.TimeoutCreoleClientError: HTTP error: socket.error: [Errno 111] ECONNREFUSED
2016-09-27T08:50:50.267336+02:00 lacotiere.0011326l.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start'
#6 Mis à jour par Karim Ayari il y a plus de 7 ans
une mise à jour ce week-end + reboot = creoled planté + filtrage pédago planté
root@jeanpuy:~# /usr/share/eole/diagnose/151-proxy *** Services Proxy . proxy => Ok *** Filtre web personnel: eole.ac-dijon.fr => Ok eth1.10: eole.ac-dijon.fr => Ok eleve: eole.ac-dijon.fr => Erreur eleve: ftp.crihan.fr => Erreur eth2.20: eole.ac-dijon.fr => Erreur eth2.20: ftp.crihan.fr => Erreur eth2.224: eole.ac-dijon.fr => Erreur eth2.224: ftp.crihan.fr => Erreur dmz: eole.ac-dijon.fr => Erreur dmz: ftp.crihan.fr => Erreur eth3.220: eole.ac-dijon.fr => Erreur eth3.220: ftp.crihan.fr => Erreur eth3.221: eole.ac-dijon.fr => Erreur eth3.221: ftp.crihan.fr => Erreur eth3.222: eole.ac-dijon.fr => Erreur eth3.222: ftp.crihan.fr => Erreur eth3.223: eole.ac-dijon.fr => Erreur eth3.223: ftp.crihan.fr => Erreur eth3.225: eole.ac-dijon.fr => Erreur eth3.225: ftp.crihan.fr => Erreur eth3.299: eole.ac-dijon.fr => Erreur eth3.299: ftp.crihan.fr => Erreur eth3.232: eole.ac-dijon.fr => Erreur eth3.232: ftp.crihan.fr => Erreur eth3.236: eole.ac-dijon.fr => Erreur eth3.236: ftp.crihan.fr => Erreur eth3.332: eole.ac-dijon.fr => Erreur eth3.332: ftp.crihan.fr => Erreur eth3.324: eole.ac-dijon.fr => Erreur eth3.324: ftp.crihan.fr => Erreur eth3.328: eole.ac-dijon.fr => Erreur eth3.328: ftp.crihan.fr => Erreur eth3.360: eole.ac-dijon.fr => Erreur eth3.360: ftp.crihan.fr => Erreur . Nb instances 1 => 160/250 . Nb instances 2 => 0/1000
2016-10-17T08:42:37.394286+02:00 jeanpuy.0420031f.local zephiragents: [-] /!\ Agent dans-stats, exception during measure: HTTP error: socket.error: [Errno 111] ECONNREFUSED 2016-10-17T08:42:37.394302+02:00 jeanpuy.0420031f.local zephiragents: [-] #011Please check creoled's log (/var/log/creoled.log) and restart service with command 'service creoled start' (ligne 332) 2016-10-17T08:42:49.580074+02:00 jeanpuy.0420031f.local zephiragents: [-] erreur retournée par bin/squid_snmp.sh 2016-10-17T08:42:49.580639+02:00 jeanpuy.0420031f.local zephiragents: [-] /!\ measure return empty value: squid-stats 2016-10-17T08:42:49.581323+02:00 jeanpuy.0420031f.local zephiragents: message repeated 5 times: [ [-] /!\ measure return empty value: squid-stats] 2016-10-17T08:42:49.581646+02:00 jeanpuy.0420031f.local zephiragents: [-] RRDtool warning: stats/251/squid-stats/squid-stats.rrd: not a simple unsigned integer: 'None' 2016-10-17T08:43:55.469502+02:00 jeanpuy.0420031f.local zephiragents: [HTTPChannel,15,127.0.0.1] 127.0.0.1 - - [17/Oct/2016:06:43:55 +0000] "POST /xmlrpc/ HTTP/1.1" 200 6074 "-" "xmlrpclib.py/1.0.1 (by www.pythonware.com)" 2016-10-17T08:43:55.473529+02:00 jeanpuy.0420031f.local zephiragents: [HTTPChannel,15,127.0.0.1] 127.0.0.1 - - [17/Oct/2016:06:43:55 +0000] "POST /xmlrpc/ HTTP/1.1" 200 2483 "-" "xmlrpclib.py/1.0.1 (by www.pythonware.com)"
et quand je relance creoled et z_stats tout rentre dans l'ordre
2016-10-17T08:45:25.923828+02:00 jeanpuy.0420031f.local zephiragents: [-] agent dans2 : service e2guardian relancé
root@jeanpuy:~# /usr/share/eole/diagnose/151-proxy *** Services Proxy . proxy => Ok *** Filtre web personnel: eole.ac-dijon.fr => Ok eth1.10: eole.ac-dijon.fr => Ok eleve: eole.ac-dijon.fr => Ok eth2.20: eole.ac-dijon.fr => Ok eth2.224: eole.ac-dijon.fr => Ok dmz: eole.ac-dijon.fr => Ok eth3.220: eole.ac-dijon.fr => Ok eth3.221: eole.ac-dijon.fr => Ok eth3.222: eole.ac-dijon.fr => Ok eth3.223: eole.ac-dijon.fr => Ok eth3.225: eole.ac-dijon.fr => Ok eth3.299: eole.ac-dijon.fr => Ok eth3.232: eole.ac-dijon.fr => Ok eth3.236: eole.ac-dijon.fr => Ok eth3.332: eole.ac-dijon.fr => Ok eth3.324: eole.ac-dijon.fr => Ok eth3.328: eole.ac-dijon.fr => Ok eth3.360: eole.ac-dijon.fr => Ok . Nb instances 1 => 56/250 . Nb instances 2 => 101/1000
#7 Mis à jour par Karim Ayari il y a plus de 7 ans
encore des creoled plantés ce matin suite à une mise àjour de ce week-end + reboot
2016-10-23 04:41:37,495: cherrypy.access.3057260396 - 127.0.0.1 - - [23/Oct/2016:04:41:37] "GET /get/creole?variable=mode_conteneur_actif HTTP/1.1" 200 32 "" "restkit/4.2.2" 2016-10-23 04:41:41,675: cherrypy.error - ENGINE Caught signal SIGTERM. 2016-10-23 04:41:41,676: cherrypy.error - ENGINE Bus STOPPING 2016-10-23 04:41:41,680: cherrypy.error - ENGINE HTTP Server cherrypy._cpwsgi_server.CPWSGIServer(('127.0.0.1', 8000)) shut down 2016-10-23 04:41:41,680: cherrypy.error - ENGINE Stopped thread '_TimeoutMonitor'. 2016-10-23 04:41:41,681: cherrypy.error - ENGINE Stop InotifyMonitor thread 2016-10-23 04:41:41,681: cherrypy.error - ENGINE Stopped thread 'Autoreloader'. 2016-10-23 04:41:41,682: cherrypy.error - ENGINE Bus STOPPED 2016-10-23 04:41:41,682: cherrypy.error - ENGINE Bus EXITING 2016-10-23 04:41:41,682: cherrypy.error - ENGINE PID file removed: '/run/creoled.pid'. 2016-10-23 04:41:41,682: cherrypy.error - ENGINE Bus EXITED 2016-10-23 04:41:41,682: cherrypy.error - ENGINE Waiting for child threads to terminate... 2016-10-23 04:45:15,350: cherrypy.error - ENGINE Listening for SIGHUP. 2016-10-23 04:45:15,371: cherrypy.error - ENGINE Listening for SIGTERM. 2016-10-23 04:45:15,371: cherrypy.error - ENGINE Listening for SIGUSR1. 2016-10-23 04:45:15,371: cherrypy.error - ENGINE Listening for SIGINT. 2016-10-23 04:45:15,421: cherrypy.error - ENGINE Bus STARTING 2016-10-23 04:45:15,423: cherrypy.error - ENGINE Forking once. 2016-10-23 04:45:15,424: cherrypy.error - ENGINE Daemonized to PID: 3624 2016-10-23 04:45:15,424: cherrypy.error - ENGINE Forking twice. 2016-10-23 04:45:15,425: cherrypy.error - ENGINE Started monitor thread '_TimeoutMonitor'. 2016-10-23 04:45:15,425: cherrypy.error - ENGINE PID 3624 written to '/run/creoled.pid'. 2016-10-23 04:45:15,425: cherrypy.error - ENGINE Start InotifyMonitor thread 2016-10-23 04:45:15,425: cherrypy.error - ENGINE Started monitor thread 'Autoreloader'. 2016-10-23 04:46:55,794: cherrypy.error - ENGINE Error in 'start' listener <bound method Server.start of <cherrypy._cpserver.Server object at 0xb641a76c>> Traceback (most recent call last): File "/usr/lib/python2.7/dist-packages/cherrypy/process/wspbus.py", line 197, in publish output.append(listener(*args, **kwargs)) File "/usr/lib/python2.7/dist-packages/cherrypy/_cpserver.py", line 151, in start ServerAdapter.start(self) File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 174, in start self.wait() File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 214, in wait wait_for_occupied_port(host, port) File "/usr/lib/python2.7/dist-packages/cherrypy/process/servers.py", line 427, in wait_for_occupied_port raise IOError("Port %r not bound on %r" % (port, host)) IOError: Port 8000 not bound on '127.0.0.1' 2016-10-23 04:46:55,794: cherrypy.error - ENGINE Shutting down due to error in start listener: Traceback (most recent call last): File "/usr/lib/python2.7/dist-packages/cherrypy/process/wspbus.py", line 235, in start self.publish('start') File "/usr/lib/python2.7/dist-packages/cherrypy/process/wspbus.py", line 215, in publish raise exc ChannelFailures: IOError("Port 8000 not bound on '127.0.0.1'",) 2016-10-23 04:46:55,794: cherrypy.error - ENGINE Bus STOPPING 2016-10-23 04:46:55,794: cherrypy.error - ENGINE HTTP Server cherrypy._cpwsgi_server.CPWSGIServer(('127.0.0.1', 8000)) already shut down 2016-10-23 04:46:55,794: cherrypy.error - ENGINE Stopped thread 'Autoreloader'. 2016-10-23 04:46:55,794: cherrypy.error - ENGINE Stop InotifyMonitor thread 2016-10-23 04:46:55,794: cherrypy.error - ENGINE Stopped thread '_TimeoutMonitor'. 2016-10-23 04:46:55,795: cherrypy.error - ENGINE Bus STOPPED 2016-10-23 04:46:55,795: cherrypy.error - ENGINE Bus EXITING 2016-10-23 04:46:55,795: cherrypy.error - ENGINE PID file removed: '/run/creoled.pid'. 2016-10-23 04:46:55,795: cherrypy.error - ENGINE Bus EXITED creoled.log-20161023 lines 23646-23707/23707 (END)
#8 Mis à jour par Karim Ayari il y a plus de 7 ans
autre effet de bord au fait que Creoled ne se lance pas
au moment du redémarrage de bastion après la rotation des logs et bien aucune régles n'est chargées :
root@gbaty:~# service bastion restart root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start' * Réinitialisation du pare-feu * Activation du mode forteresse sur eth0 * Activation du mode forteresse sur eth1 * Activation du mode forteresse sur eth2 * Activation du mode forteresse sur eth3 root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start' [ OK ] * Regénération des règles de pare-feu root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start' root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start' Impossible de contacter creoled [fail] * Mise en cache des règles de pare-feu (utiliser '/etc/init.d/bastion reload' pour appliquer l'ancien cache) [fail] * Réinitialisation du pare-feu * Activation du mode forteresse sur eth0 * Activation du mode forteresse sur eth1 * Activation du mode forteresse sur eth2 * Activation du mode forteresse sur eth3 root - Erreur HTTP : socket.error: [Errno 111] ECONNREFUSED Veuillez vous référer au journal d'événement de creoled (/var/log/creoled.log) pour avoir plus d'informations et redémarrer le service avec la commande 'service creoled start' Le serveur est protégé. Pour relancer le pare-feu, exécuter "CreoleService bastion reload"