Supervision d'une infrastructure avec Grafana et Prometheus : retour d'expérience terrain
Contexte Dans un environnement de production (VMware, stockage SAN, services métiers), j’avais besoin d’une supervision centralisée, temps réel et flexible — sans dépendre d’outils propriétaires coûteux. L’objectif était de compléter ou remplacer partiellement des outils classiques comme Centreon par une stack moderne basée sur Prometheus (collecte métriques) et Grafana (visualisation). Problème Les outils traditionnels présentaient plusieurs limites : visibilité réduite sur les métriques fines (CPU steal, IO wait), dashboards peu flexibles, difficulté à corréler infra et applicatif, et coût de licences élevé. ...