observabilité

Les données de SaaS sont plus que des formes et des graphiques sur l'image d'une femme dans la technologie

Les équipes chargées de la gestion des services informatiques (ITSM) et des opérations de développement (DevOps) utilisent des mesures, des fichiers journaux et des traces pour déterminer le bon fonctionnement des systèmes. En cas de panne ou de ralentissement, ces informations sont mises en corrélation pour permettre un dépannage rapide et une restauration du service. Les applications et l'infrastructure informatique doivent fournir des mesures, créer des journaux et permettre de retracer ou d'auditer leur fonctionnement pour être considérées comme observables.

Pourquoi l'observabilité est-elle importante ?

Lorsque les fournisseurs de logiciels et les développeurs d'applications livrent des applications aux équipes informatiques pour qu'elles soient exécutées en production, les trois attributs que sont la fiabilité, la disponibilité et la facilité de gestion sont évalués avant d'être considérés comme prêt pour la production. Les équipes informatiques professionnelles, qu'elles soient interne ou externalisé, sont généralement invitées par les équipes commerciales à fournir une qualité de service (QoS) définie dans un accord de niveau de service SLA. Il peut s'agir du temps de fonctionnement, du temps moyen de rétablissement (MTTR) et des mesures de performance. Le non-respect des objectifs de SLA entraîne généralement des pénalités. Pour permettre la fourniture d'un service de haute qualité, les équipes informatiques insistent sur certaines caractéristiques d'observabilité afin de pouvoir démontrer leur conformité aux accords de niveau de service.

Quels sont les trois piliers de l'observabilité?

L'observabilité d'un système ou d'une application est souvent considérée sous les angles suivants :

Métriques

Les outils de gestion des performances ont besoin de mesures qui montrent le bon fonctionnement d'un système. Ces mesures ou indicateurs clés de performance (ICP) peuvent inclure les temps de réponse moyens, les pics de charge, les requêtes servies par seconde, l'utilisation des processeur , la consommation de mémoire, les taux d'erreur et la latence du réseau. Les outils de gestion d'applications tels que ceux de Dynatrace et New Relic utilisent l'intelligence artificielle (IA) pour apprendre ce qui est considéré comme un fonctionnement normal pour une application en observant ces mesures afin de pouvoir reconnaître les problèmes et alerter les opérateurs avant qu'ils n'aient un impact sur les utilisateurs.

Journaux

Les fichiers journaux enregistrent les opérations normales telles que le démarrage des applications et les pannes. Les logiciels de surveillance tels que Splunk et Sumo Logic surveillent les fichiers journaux à la recherche d'exceptions afin d'alerter les équipes concernées.

Traçage

Le traçage fournit des journaux d'audit détaillés du fonctionnement d'une application ou d'un système logiciel. Les développeurs d'applications, le support la clientèle, les clients et le service informatique peuvent définir des indicateurs pour contrôler les niveaux de détail du traçage et sélectionner les aspects d'une application à tracer. Le niveau de traçage verbeux est généralement un dernier recours pour déboguer les défaillances logiques, car il a un impact considérable sur les performances de l'application.

Quelle est la différence entre surveillance et observabilité?

La surveillance montre comment une application fonctionne à tout moment, en se concentrant sur la collecte de données en temps réel et sur les mesures de performance. L observabilité, quant à elle, regroupe les données de surveillance, le traçage et les journaux afin de fournir une image complète du comportement du système. Ce contexte enrichi accélère le dépannage en permettant aux équipes d'identifier les problèmes, d'analyser les causes profondes et de prévoir les problèmes futurs avant qu'ils ne s'aggravent. Essentiellement, alors que la surveillance offre des instantanés de la performance, l'observabilité fournit le récit derrière ces chiffres, assurant une gestion proactive et une amélioration continue de la fiabilité et de l'efficacité du système.

Les microservices et l'informatique dématérialisée

Il fut un temps où une application était monolithique et facile à surveiller. Aujourd'hui, les applications évoluent vers plus de composants et s'exécutent dans un mélange hybride et distribué de plateformes qui peuvent être sur site, dans le nuage ou même sans serveur en tant que microservices. L'observabilité devient encore plus importante dans de telles architectures complexes, ce qui signifie qu'un ensemble plus riche de métriques et d'événements de journalisation doit être capturé et observé.

Les exemples suivants illustrent le type d'événements de journal dont la gestion des applications a besoin :

  • Le nombre total de demandes d'application donne une indication de la charge et du débit de l'application.
  • La durée de la demande pour chaque microservice démontre le temps de service pour le microservice.
  • Le nombre d'instances de microservices est un indicateur de la manière dont l'application a été mise à l'échelle pour répondre à la demande.
  • La vivacité et la Préparation conteneurs permettent d'identifier les conteneurs actifs, les conteneurs pré-spawnés et les conteneurs morts/zombies.
  • Les mesures du pipeline d'intégration continue/de livraison continue (CI/CD) fournissent une visibilité sur le nombre de changements et la fréquence des mises à jour d'une application.

Dans l'informatique dans le cloud, les quatre signaux d'or suivants indiquent l'état de santé des applications et de l'infrastructure :

  • La latence est utilisée pour mesurer les retards du réseau qui peuvent être atténués en utilisant des réseaux de diffusion de contenu (CDN) ou des instances distribuées multiples.
  • Le trafic mesure le nombre de paquets réseau reçus par l'application. Les entreprises doivent s'assurer que la bande passante du réseau est suffisante pour répondre à la demande.
  • Les taux d'erreur démontrent l'échec de l'application et sont un précurseur des défaillances.
  • La saturation offre une visibilité sur les serveurs en passe d'être débordés, ce qui permet une planification proactive de la capacité.

Découvrez la plateforme de données Actian

La plateforme de données Actian offre une expérience unifiée pour l'ingestion, la transformation, l'analyse et le stockage des données. La plateforme de données Actian est hybride, ce qui signifie que des instances peuvent être déployées sur plusieurs clouds publics et sur site. La technologie d'intégration des données intégrée permet aux clients de charger rapidement leurs données afin d'obtenir rapidement des informations fiables.