Anomalie #7941
blocage du process z_stats
0%
Description
nous avons noté que sur certains serveur Amon 2.3 le process z_stats est bloqué depuis une certaine date.
le fait qu'il soit bloqué pose problème pour les tunnels qui ne se relance pas tout seul.
root 21934 1 0 Mar25 ? 00:04:20 /usr/bin/python /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid -no zephiragents --config=configs --tmp=data --data=stats --archive=/tmp --static=static --actions=actions
on ne peut pas relancer le service il faut faire un kill -9.
résultat de la commande pstree -a :
twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid --no zephiragents --config=configs --tmp=data --data=stats--
`-sh -c /usr/share/zephir/scripts/zephir_client call &> /dev/null
`-zephir_client /usr/share/zephir/scripts/zephir_client call
`-python /usr/share/zephir/scripts/zephir_client.py call
cela se produit régulièrement.
Demandes liées
Historique
#1 Mis à jour par Joël Cuissinat il y a environ 10 ans
- Projet changé de Amon à zephir-client
- Statut changé de Nouveau à A étudier
- Version cible mis à Mises à jour 2.3.13
- Temps estimé mis à 2.00 h
#2 Mis à jour par Karim Ayari il y a environ 10 ans
je précise également que les serveurs sont notés en perte de contact sur Zéphir et la synchro_zephir est en timed out.
#3 Mis à jour par Bruno Boiget il y a environ 10 ans
- Echéance mis à 16/05/2014
#4 Mis à jour par Daniel Dehennin il y a environ 10 ans
- Echéance
16/05/2014supprimé - Version cible
Mises à jour 2.3.13supprimé
#5 Mis à jour par Karim Ayari il y a plus de 9 ans
encore et toujours le même problème. suite à de multiples coupures, forte instabilité de la liaison internet
le process z_stats ne relance pas rvp.
en le relançant à la main tout est ok. voici ce que je trouve avec pstree :
root@jzay:~# pstree -a |grep zephir
| |-grep --color=auto zephir
|-twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid no zephiragents --config=configs --tmp=data --data=stats-
| `-sh -c /usr/share/zephir/scripts/zephir_client call &> /dev/null
| `-zephir_client /usr/share/zephir/scripts/zephir_client call
| `-python /usr/share/zephir/scripts/zephir_client.py call
root@jzay:~#
ce problème est récurrent à chaque gros problème opérateur.
#6 Mis à jour par Karim Ayari il y a plus de 9 ans
suite au redémarrage manuel de z_stats les tunnels sont relancés :
Oct 3 09:07:43 jzay zephiragents: [-] 192.168.0.0/16 -- 192.168.10.59 injoignable
Oct 3 09:07:51 jzay zephiragents: [-] agent rvp : service rvp relancé
#7 Mis à jour par Karim Ayari il y a plus de 9 ans
par contre avec pstree j'ai toujours le même résultat :
root@jzay:~# pstree -a |grep zephir
|-sh -c /usr/share/zephir/scripts/zephir_client call &> /dev/null
| `-zephir_client /usr/share/zephir/scripts/zephir_client call
| `-python /usr/share/zephir/scripts/zephir_client.py call
| |-grep --color=auto zephir
|-twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid no zephiragents --config=configs --tmp=data --data=stats-
root@jzay:~#
alors que sur d'autres amon qui n'ont pas posés de problème on a que ça :
root@ampere:~# pstree -a |grep zephir
| |-grep --color=auto zephir
|-twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid no zephiragents --config=configs --tmp=data --data=stats-
root@ampere:~#
#8 Mis à jour par Fabrice Barconnière il y a plus de 8 ans
- Statut changé de A étudier à Ne sera pas résolu
Le problème devrait se résoudre (ou très fortement s'atténuer) une fois #12068 résolu.