Logo PagerDuty

Qu'est-ce que l'AIOps et pourquoi dois-je m'y intéresser ?

par Jerry Weltsch

3 DÉCEMBRE 2020

L’intelligence artificielle pour les opérations informatiques (AIOps) signifie beaucoup de choses pour beaucoup de gens différents, il est par conséquent difficile de donner une définition de ce qu’elle est et de ce qu’elle fait. À une époque où l’accélération numérique est une priorité zéro, où les sociétés réfléchissent aux changements culturels vers de nouveaux modèles d’exploitation, comme la propriété de services, afin de stimuler l’efficacité dans un monde complexe d’environnements cloud hybrides, l’AIOps apparaît comme un investissement potentiel intéressant permettant de résoudre les petits maux de l’informatique centrale. Mais qu’est-ce que c’est et qu’est-ce qu’elle peut réellement faire pour vous ?

Nancy Gohring, analyste senior chez 451 Research, connait aussi bien que quiconque la difficulté de définir l’AIOps. Elle a mené une série d’enquêtes auprès de professionnels des opérations informatiques et de développeurs afin de comprendre comment ils voient l’AIOps et comment ils peuvent l’appliquer. Nous avons demandé à Nancy Gohring d’approfondir un peu plus par le biais d’entretiens avec ces professionnels, et le résultat a donné des réponses très éparses.

Sa recherche sur le sujet lui a permis de déclarer que l’AIOps pouvait être largement définie comme n’importe quel outil de la chaîne d’outils de surveillance et de réponse aux incidents qui utilise l’IA/AA (Intelligence artificielle/Apprentissage automatique).

En s’appuyant sur cette définition, Nancy Gohring a proposé quelques suggestions sur ce qu’il fallait rechercher lors de l’évaluation des outils et des solutions de l’IAOps.

Profitez des avantages potentiels de l’IA/AA, mais ne vous laissez pas distraire par le marketing AIOps

Cherchez des solutions qui facilitent l’adoption de l’IA/AA pour réduire le bruit des alertes, comme des outils qui :

  • Sont dotés de modèles d’apprentissage automatique pré-formés et vous permettent de commencer en quelques jours au lieu de plusieurs mois
  • Peuvent fonctionner avec des infrastructures sur site, basées sur le cloud et hybrides
  • Standardisent les formats de données provenant de sources multiples afin d’intégrer un ensemble disparate d’outils de surveillance
  • Utilisent l’apprentissage automatique en plus des approches basées sur les règles afin d’assurer des résultats utiles

Regardez vers le passé

Examinez les outils et les solutions qui tirent parti des données issues des actions passées des personnes interrogées afin de mieux documenter les actions et les réponses futures. Par ailleurs, recherchez des solutions qui permettent une correction automatique afin de résoudre plus rapidement les incidents.

Tout ne se résume pas à la technologie : n’oubliez pas que les personnes et les processus sont fondamentaux

L’accroissement de la complexité introduite par l’utilisation de micro-services et de pratiques DevOps a rendu plus difficile le fait d’avoir la bonne personne pour répondre au bon moment, il est donc crucial de disposer d’une solution qui puisse alerter la bonne personne au bon moment.

Pensez grand pour faire une analyse de rentabilité

La réduction de la durée moyenne de prise en compte (MTTA) et de la durée moyenne de résolution (MTTR) des incidents constitue de grands objectifs pour une équipe chargée des opérations informatiques, mais qu’est-ce que cela signifie réellement pour l’entreprise ? Lorsque vous faites l’analyse de rentabilité d’une solution AIOps incluant la réponse aux incidents, assurez-vous de prendre également en compte l’amélioration des résultats commerciaux. Les résultats comprennent des éléments comme la prévention des temps d’arrêt ou leur réduction, ce qui se traduit par une meilleure expérience client et une protection du revenu, sans compter la productivité accrue des développeurs et des opérateurs qui peuvent désormais passer moins de temps sur des tâches non prévues.

L’unification des données et des processus peut améliorer la réponse aux incidents

La centralisation sur une seule plateforme des données d’alerte provenant des outils de surveillance permet aux équipes distribuées de mieux orchestrer une réponse efficace aux incidents et de générer une approche plus collaborative, avec en conséquence une amélioration du moral du personnel et de la productivité.

Adoptez l’automatisation

L’automatisation n’est pas seulement une question de correction, que beaucoup mettront du temps à réaliser, elle permet également de supprimer les efforts déployés dans la réponse aux incidents grâce à l’automatisation de tâches spécifiques dans le processus de réponse aux incidents. Ces tâches comprennent le fait d’alerter la bonne personne au bon moment, la mise en place d’une téléconférence de l’équipe d’intervention, l’accès au runbook pertinent, la communication des rapports de situation aux parties prenantes de l’entreprise et la génération de rapports sur l’évaluation rétrospective de l’incident.

PagerDuty est d’accord avec la conclusion de Nancy Gohring dans cet article : acquérir le bon ensemble d’outils AIOps n’est pas une solution miracle. Si vous souhaitez tirer le meilleur parti de ce que ces outils ont à offrir, vous devez les intégrer à une stratégie complète de gestion des événements et de réponse aux incidents.

PagerDuty pense, et applique dans la pratique, que ce genre de stratégie doit inclure une évaluation de la façon dont les équipes de votre entreprise possèdent et exploitent leurs services. Lorsque vous envisagez de nouvelles technologies comme l’AIOps, il est particulièrement important de comprendre comment elle s’intègre dans vos modèles d’exploitation existants. Alors que les entreprises se tournent de plus en plus vers le cloud afin de gagner en évolutivité et agilité, les entreprises techniques se développent pour prendre en charge un nombre croissant d’applications et de micro services dans des environnements de plus en plus hybrides.

Cette augmentation de la complexité de la technologie signifie également des changements pour les personnes et leurs processus associés. Les équipes prennent de plus en plus une forme décentralisée, où les secteurs d’activité emploient souvent leurs propres équipes technologiques, chacune avec sa propre culture, sa propre vitesse et sa propre chaîne d’outils. Les dirigeants des TI désireux d’acheter des solutions AIOps doivent veiller à garder à l’esprit à la fois les équipes centralisées et les équipes décentralisées (où les développeurs possèdent et maintiennent individuellement leur code en production) pour s’assurer de recevoir le bon retour sur investissement avec l’utilisation.

Télécharger ce rapport auprès de 451 Research pour en savoir plus sur les enseignements que Nancy Gohring peut vous apporter et sur la manière dont l’AIOps PagerDuty peut vous aider, vous et votre entreprise, à passer au DevOps et à la propriété d’un service complet.