Projet

Général

Profil

Anomalie #7941

blocage du process z_stats

Ajouté par Karim Ayari il y a environ 10 ans. Mis à jour il y a plus de 8 ans.

Statut:
Ne sera pas résolu
Priorité:
Normal
Assigné à:
-
Catégorie:
-
Version cible:
-
Début:
Echéance:
% réalisé:

0%

Temps estimé:
2.00 h
Distribution:
EOLE 2.3

Description

nous avons noté que sur certains serveur Amon 2.3 le process z_stats est bloqué depuis une certaine date.
le fait qu'il soit bloqué pose problème pour les tunnels qui ne se relance pas tout seul.

root     21934     1  0 Mar25 ?        00:04:20 /usr/bin/python /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid -no zephiragents --config=configs --tmp=data --data=stats --archive=/tmp --static=static --actions=actions

on ne peut pas relancer le service il faut faire un kill -9.

résultat de la commande pstree -a :

twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid --no zephiragents --config=configs --tmp=data --data=stats--
`-sh -c /usr/share/zephir/scripts/zephir_client call &> /dev/null
`-zephir_client /usr/share/zephir/scripts/zephir_client call
`-python /usr/share/zephir/scripts/zephir_client.py call

cela se produit régulièrement.


Demandes liées

Lié à zephir-client - Anomalie #6401: Le service z_stats s'arrete de fonctionner Ne sera pas résolu

Historique

#1 Mis à jour par Joël Cuissinat il y a environ 10 ans

  • Projet changé de Amon à zephir-client
  • Statut changé de Nouveau à A étudier
  • Version cible mis à Mises à jour 2.3.13
  • Temps estimé mis à 2.00 h

#2 Mis à jour par Karim Ayari il y a environ 10 ans

je précise également que les serveurs sont notés en perte de contact sur Zéphir et la synchro_zephir est en timed out.

#3 Mis à jour par Bruno Boiget il y a environ 10 ans

  • Echéance mis à 16/05/2014

#4 Mis à jour par Daniel Dehennin il y a environ 10 ans

  • Echéance 16/05/2014 supprimé
  • Version cible Mises à jour 2.3.13 supprimé

#5 Mis à jour par Karim Ayari il y a plus de 9 ans

encore et toujours le même problème. suite à de multiples coupures, forte instabilité de la liaison internet
le process z_stats ne relance pas rvp.

en le relançant à la main tout est ok. voici ce que je trouve avec pstree :

root@jzay:~# pstree -a |grep zephir
 |           |-grep --color=auto zephir
 |-twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid no zephiragents --config=configs --tmp=data --data=stats-
 |   `-sh -c /usr/share/zephir/scripts/zephir_client call &> /dev/null
 |       `-zephir_client /usr/share/zephir/scripts/zephir_client call
 |           `-python /usr/share/zephir/scripts/zephir_client.py call
root@jzay:~#

ce problème est récurrent à chaque gros problème opérateur.

#6 Mis à jour par Karim Ayari il y a plus de 9 ans

suite au redémarrage manuel de z_stats les tunnels sont relancés :

Oct  3 09:07:43 jzay zephiragents: [-] 192.168.0.0/16 -- 192.168.10.59 injoignable
Oct 3 09:07:51 jzay zephiragents: [-] agent rvp : service rvp relancé

#7 Mis à jour par Karim Ayari il y a plus de 9 ans

par contre avec pstree j'ai toujours le même résultat :

root@jzay:~# pstree -a |grep zephir
 |-sh -c /usr/share/zephir/scripts/zephir_client call &> /dev/null
 |   `-zephir_client /usr/share/zephir/scripts/zephir_client call
 |       `-python /usr/share/zephir/scripts/zephir_client.py call
 |           |-grep --color=auto zephir
 |-twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid no zephiragents --config=configs --tmp=data --data=stats-
root@jzay:~#

alors que sur d'autres amon qui n'ont pas posés de problème on a que ça :

root@ampere:~# pstree -a |grep zephir
 |           |-grep --color=auto zephir
 |-twistd /usr/bin/twistd --syslog --pidfile /var/run/z_stats.pid no zephiragents --config=configs --tmp=data --data=stats-
root@ampere:~#

#8 Mis à jour par Fabrice Barconnière il y a plus de 8 ans

  • Statut changé de A étudier à Ne sera pas résolu

Le problème devrait se résoudre (ou très fortement s'atténuer) une fois #12068 résolu.

Formats disponibles : Atom PDF