Nagios est un logiciel de supervision destiné à vous informer de problèmes éventuels dans votre système d'informations avant que vos clients, utilisateurs ou managers ne le fassent. Il est prévu pour fonctionner sur système d'exploitation Linux mais fonctionne également sans problème sur la plupart des variantes *NIX. Le démon de supervision effectue des contrôles intermittents sur les hôtes et services que vous spécifiez en utilisant des plugins externes qui retournent un status d'état à Nagios. Quand des problèmes surviennent, il peut envoyer des notifications à des contacts administratifs de façons différentes (email, SMS, messagerie instantanée, etc…). Les informations d'états courants, les historiques et les rapports peuvent être consultés à partir d'un simple navigateur.
Nagios (anciennement appelé Netsaint) est un logiciel qui permet de superviser un système d'information complet. C'est un logiciel libre, il est sous licence GPL.
C'est un programme modulaire qui se décompose en trois parties:
Le moteur de l'application qui vient ordonnancer les tâches de supervision.
L'interface web, qui permet d'avoir une vue d'ensemble du système d'information et des possibles anomalies.
Les plugins, une centaine de mini programmes que l'on peut compléter en fonction de nos besoins pour superviser chaque service ou ressource disponible sur l'ensemble des ordinateurs ou éléments réseaux de notre SI.
Superviser les ressources des serveurs (charge du processeur, occupation du disque dur, utilisation de la mémoire paginée) et ceci sur les systèmes d'exploitations les plus répandus.
La supervision à distance peut utiliser SSH ou un tunnel SSL.
Les plugins sont écrits dans les langages de programmation les plus adaptés à leur tâche (Bash, C++, Python, Perl, PHP, C, etc.)
La vérification des services se fait en parallèle.
Possibilité de définir une hiérarchie dans le réseau pour pouvoir faire la différence entre un serveur en panne et un serveur injoignable.
La remontée des alertes est entièrement paramétrable grâce à l'utilisation de plugins (alerte par email, SMS, etc.)
Chaque test renvoi un état particulier:
# OK (tout va bien)
# WARNING (le seuil d'alerte est dépassé)
# CRITICAL (le service a un problème)
# UNKNOWN (impossible de connaître l'état du service)