Vous êtes ici

Nagios : Utilisation du programme check_logfiles et du service NRPE

L’outil check_logfiles.exe permet de vérifier des fichiers de logs, par exemple ici, nous allons vérifier que les tâches planifiées se sont correctement exécutées, pour cela, nous allons éplucher le fichier journal des tâches planifiées à la recherche d’un code « ff » .

Prérequis :

1)      Installation et configuration du service NRPE sur notre machine Windows et prise en compte du programme check_logfiles.exe :

a.       Une fois le ZIP décompressé, nous obtenons ceci :

b.      Nrpe.cfg est le fichier de configuration, nous allons l’éditer pour dans un premier temps autoriser notre serveur Nagios à communiquer avec le service NRPE :

c.       Nous allons ensuite ajouter la commande .exe que nous voulons exécuter, ici, j’ai placé l’application check_logfiles.exe et son fichier de configuration check_logfiles.cfg dans le répertoire c:\logfiles :

d.      Il ne reste plus qu’à installer le service NRPE avec la commande suivante :

e.      Pour finir, il faut lancer le service depuis le gestionnaire de service Windows :

f.        Nous pouvons vérifier que notre serveur Nagios communique bien avec le service NRPE à l’aide de la commande suivante sur notre serveur Nagios :

(J’ai volontairement paramétré mon port NRPE en 5665, mais par défaut, c’est le port 5666)

2)      Configuration et test du programme check_logfiles :

a.       Nous allons pour cela éditer le fichier check_logfiles.cfg :

$MACROS = { LOGDIR => 'c:\data' }; : c’est la racine de l’emplacement de notre fichier de log

Tag => ‘apperor’ : c’est simplement le nom de votre recherche, ici apperror

Type => virtual : Pas obligatoire, il est à utiliser dans le cas ou votre fichier de log n’effectue pas de rotation, en gros, ça veut dire que si votre fichier de log contient toujours le même nombre de ligne, check_logfiles risque de ne pas le re-parcourir, et donc de ne jamais le lire, la solution est donc d’ajouter cette ligne pour le forcer à relire à chaque lancement le fichier entier.

Logfile => ‘$LOGDIR$\logs\test.txt’ : c’est l’emplacement du fichier de log que nous voulons vérifier

criticalpatterns => ['ERREUR'] : c’est le mot à trouver dans le fichier pour déclencher une alerte CRITIQUE

 warningpatterns => ['ALERTE']               : c’est le mot à trouver dans le fichier pour déclencher une alerte WARNING 

b.      Nous allons vérifier le bon fonctionnement de notre configuration en exécutant sur notre machine Windows le programme check_logfiles , pour cela dans une fenêtre dos taper :

Mon fichier d’exemple contient :

Le programme nous ressort bien 1 erreur critique et 1 warning.

3)      Configurer Nagios pour vérifier ce service :

a.       Dans un premier temps, nous allons tester la commande sur notre serveur Nagios :

Le fichier de log est correctement lu, nous voyons d’ailleurs qu’il contient maintenant 345 lignes.

b.      Nous allons maintenant définir notre commande dans le fichier commands.cfg :

Ici nous définissons une commande qui répondra au nom de check_tasks qui aura pour but de vérifier l’état des tâches planifiées de la machine hôte associée.

c.       Il ne reste plus qu’à mettre en place la surveillance sur l’une de nos machines, ici Appli :

IMPORTANT : si jamais vos logs sont tournant et donc que vous n’utilisez pas la ligne Type => virtual décrite précédemment, il faut dans le fichier Nagios ajouter la ligne : is_volatile           1 .

Cela permet à Nagios d’envoyer une alerte directement pour les services repassant directement en état OK après une alerte critique.

Voilà notre nouveau service de surveillance des tâches planifiées est opérationnel :

 

www.le-gas.fr : Le guide de l'admin Systeme