Nagios - Contrôles et états

Une fois l'hôte et les services configurés sur Nagios, des vérifications sont utilisées pour voir si les hôtes et les services fonctionnent comme ils sont censés le faire ou non. Voyons un exemple pour effectuer des vérifications sur l'hôte -

Considérez que vous avez placé vos définitions d'hôte dans le fichier host1.cfg dans le répertoire / usr / local / nagios / etc / objects.

cd /usr/local/nagios/etc/objects
gedit host1.cfg

Voici à quoi ressemblent actuellement vos définitions d'hôte -

define host {
   host_name host1
   address 10.0.0.1
}

Ajoutons maintenant la directive check_interval. Cette directive est utilisée pour effectuer des vérifications programmées des hôtes pour le nombre que vous avez défini; par défaut, il est en minutes. En utilisant la définition ci-dessous, des contrôles sur l'hôte seront effectués toutes les 3 minutes.

define host {
   host_name host1
   address 10.0.0.1
   check_interval 3
}

Dans Nagios, 2 types de contrôles sont effectués sur les hôtes et les services -

  • Vérifications actives
  • Vérifications passives

Vérifications actives

Les vérifications actives sont lancées par le processus Nagios puis exécutées sur une base planifiée régulière. La logique de vérification à l'intérieur du processus Nagios démarre la vérification active. Pour surveiller les hôtes et les services exécutés sur des machines distantes, Nagios exécute des plugins et indique quelles informations collecter. Le plugin est ensuite exécuté sur la machine distante où il collecte les informations requises et les renvoie ensuite au démon Nagios. En fonction de l'état reçu sur les hôtes et les services, les mesures appropriées sont prises.

La figure ci-dessous montre une vérification active -

Celles-ci sont exécutées à intervalles réguliers, comme défini par check_interval et retry_interval.

Les contrôles passifs sont effectués par des processus externes et les résultats sont renvoyés à Nagios pour traitement.

Les contrôles passifs fonctionnent comme expliqué ici -

Une application externe vérifie l'état des hôtes / services et écrit le résultat dans un fichier de commande externe. Lorsque le démon Nagios lit le fichier de commande externe, il lit et envoie toutes les vérifications passives de la file d'attente pour les traiter plus tard. Périodiquement, lorsque ces contrôles sont traités, des notifications ou des alertes sont envoyées en fonction des informations contenues dans le résultat du contrôle.

La figure ci-dessous montre un contrôle passif -

Ainsi, la différence entre les contrôles actifs et passifs est que les contrôles actifs sont exécutés par Nagios et les contrôles passifs sont exécutés par des applications externes.

Ces vérifications sont utiles lorsque vous ne pouvez pas surveiller les hôtes / services sur une base régulière.

Nagios stocke l'état des hôtes et des services qu'il surveille pour déterminer s'ils fonctionnent correctement ou non. Il y aurait de nombreux cas où les échecs se produiraient au hasard et ils sont temporaires; par conséquent, Nagios utilise des états pour vérifier l'état actuel d'un hôte ou d'un service.

Il existe deux types d'états -

  • État doux
  • État dur

État doux

Lorsqu'un hôte ou un service est en panne pendant une très courte durée et que son état n'est pas connu ou différent du précédent, des états souples sont utilisés. L'hôte ou les services seront testés encore et encore jusqu'à ce que le statut soit permanent.

État dur

Lorsque max_check_attempts est exécuté et que l'état de l'hôte ou du service n'est toujours pas OK, l'état dur est utilisé. Nagios exécute des gestionnaires d'événements pour gérer les états durs.

La figure suivante montre les états souples et les états durs.