Tâche #31684
Scénario #31587: Traitement express MEN (05-07)
Scribe AD 2.7 - Erreur a la restauration de l'AD, le sysvol n'est pas restauré
100%
Description
Erreur de lors de la restauration bareos du conteneur addc
2 points à voir :
- Pb de templating dans samba4-vars.conf dans NTP_SERVERS
- Vérifier la restauration du sysvol.tar.gz
Contexte:¶
restauration en partant d'une image clonezilla d'un serveur fonctionnel d'il y a 2 mois suivie d'une restauration bareos.
- restauration de l'image clonezilla
- Maj-Auto
- reconfigure + reboot
- bareosrestore.py --catalog
- bareosrestore --all
- reconfigure
l'erreur trouvée dans 'var/log/rsyslog/local/bareos-dir/bareos-dir.err.log':
2021-02-10T14:18:02.160711+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: Error: Runscript: ClientAfterJob returned non-zero status=1. ERR=Child exited with code 1
Ce qui me renvoi sur ' var/log/rsyslog/local/bareos-dir/bareos-dir.info.log ' ou je trouve cette erreur à la même date/heure:
2021-02-10T14:18:01.475652+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: shell command: run ClientAfterJob "/usr/share/eole/sbin/bareosrestore.py --addc post" 2021-02-10T14:18:02.131911+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: Traceback (most recent call last): 2021-02-10T14:18:02.131989+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: File "/usr/bin/addc_restore", line 26, in <module> 2021-02-10T14:18:02.132044+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: config = ConfigObj('/etc/eole/samba4-vars.conf') 2021-02-10T14:18:02.132087+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: File "/usr/lib/python3/dist-packages/configobj.py", line 1229, in init 2021-02-10T14:18:02.132137+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: self._load(infile, configspec) 2021-02-10T14:18:02.132176+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: File "/usr/lib/python3/dist-packages/configobj.py", line 1318, in _load 2021-02-10T14:18:02.132220+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: raise error 2021-02-10T14:18:02.132257+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: configobj.ConfigObjError: Parsing failed with several errors. 2021-02-10T14:18:02.132300+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: First error at line 8. 2021-02-10T14:18:02.146962+01:00 scribe.ad.0690133v.lan bareos-dir: scribe_fd JobId 133: ClientAfterJob: post ADDC
Voilà le contenu de ' /var/lib/lxc/addc/rootfs/etc/eole/samba4-vars.conf'
AD_REALM='ad.0690133v.lan' AD_DOMAIN='ad' AD_HOST_NAME='addc' AD_HOST_IP='172.23.249.242' NOM_CARTE_NIC1='eth0' AD_SERVER_ROLE='controleur de domaine' BASEDN='DC=ad,DC=0690133v,DC=lan' NTP_SERVERS='0.fr.pool.ntp.org 1.fr.pool.ntp.org 2.fr.pool.ntp.org 3.fr.pool.ntp.org' AD_ADDITIONAL_DC_IP='' AD_DOMAIN_SID='' AD_ADDITIONAL_DC='non' AD_DNS_BACKEND='SAMBA_INTERNAL' AD_ADMIN='Administrator' AD_HOST_KEYTAB_FILE='/var/lib/samba/eole-ad-dc.keytab' ACTIVER_AD_HOMES_SHARE='oui' ACTIVER_AD_PROFILES_SHARE='oui' AD_HOMES_SHARE_HOST_NAME='' AD_PROFILES_SHARE_HOST_NAME='' AD_HOME_SHARE_PATH='/home/adhomes' AD_PROFILE_SHARE_PATH='/home/adprofiles' AD_INSTANCE_LOCK_FILE='/var/lib/samba/.instance_ok' AD_BACKEND_STORE='tdb' AD_PLAINTEXT_SECRETS='non'
contournement¶
j'ai modifié les lignes 8 à 11 comme ceci:
NTP_SERVERS='0.fr.pool.ntp.org' # 1.fr.pool.ntp.org # 2.fr.pool.ntp.org # 3.fr.pool.ntp.org
et lancé 'addc-restore' depuis le conteneur addc.
Pas d'erreur
puis reconfigure
Tout semble ok, je peux me reconnecter sous w10 et mes gpo ont repris leur place.
Solutions à mettre en œuvre¶
- EOLE >= 2.7.1
- Corriger la génération du fichier
samba4-vars.conf
dans/usr/share/eole/sbin/eolead
(NB : attention au merge en 2.8 car il devient un template) - Vérifier et corriger la sauvegarde/restauration du sysvol
Critères d'acceptation¶
- Les tests Jenkins validant la restauration (test-sauvegarde-bareos-restaure-full) sont passants pour EOLE >= 2.7.1
Related issues
Associated revisions
test sauvegarde/restauration : ajout fichier témoin dans SYSVOL
Correction injection témoin dans SYSVOL
Ref: #31684
Initialisation du paramètre NTP_SERVERS sans sauts de ligne dans samba4-vars.conf
Ref: #31684
History
#1 Updated by Gilles Grandgérard over 2 years ago
- Description updated (diff)
#2 Updated by Gilles Grandgérard over 2 years ago
- Description updated (diff)
#3 Updated by Gilles Grandgérard over 2 years ago
- Tracker changed from Demande to Scénario
- Start date deleted (
02/11/2021)
#4 Updated by Joël Cuissinat over 2 years ago
- Subject changed from Scribe AD 2.7.2 - Erreur a la restauration de l'AD (addc_restore) to Scribe AD 2.7 - Erreur a la restauration de l'AD, le sysvol n'est pas restauré
- Due date set to 03/12/2021
- Target version set to Prestation Cadoles MEN 08-10
- Start date set to 02/22/2021
- Release set to EOLE 2.7.1.3
- Story points set to 1.0
#5 Updated by Joël Cuissinat over 2 years ago
- Related to Tâche #31255: Sur ScribeAD, le fichier /etc/eole/samba4-vars.conf devrait être un template added
#6 Updated by Joël Cuissinat over 2 years ago
- Story points changed from 1.0 to 2.0
#7 Updated by Joël Cuissinat over 2 years ago
- Description updated (diff)
#8 Updated by Joël Cuissinat over 2 years ago
- Parent task set to #31587
#9 Updated by Joël Cuissinat over 2 years ago
- Status changed from Nouveau to En cours
- Assigned To set to Joël Cuissinat
Après étude du problème (et correction des tests automatisés !), il s'avère que c'est uniquement l'erreur de chargement du fichier de configuration avec python qui a stoppé la procédure avant la restauration du SYSVOL.
Reproduction du problème de configuration :
- aca.scribe-2.7.1.2-instance-default
root@scribe:~# CreoleSet serveur_ntp "hestia.eole.lan serveur2.net serveur3.net" root@scribe:~# lxc-stop -n addc root@scribe:~# lxc-destroy -n addc root@scribe:~# instance
root@scribe:~# grep -A2 NTP_SERVERS /var/lib/lxc/addc/rootfs/etc/eole/samba4-vars.conf
#10 Updated by Joël Cuissinat over 2 years ago
- Status changed from En cours to Résolu
- % Done changed from 0 to 100
#11 Updated by Joël Cuissinat about 2 years ago
- Status changed from Résolu to Fermé
- Remaining (hours) set to 0.0