Kyndryl a dévoilé une nouvelle capacité d’intelligence artificielle agentique au sein de Kyndryl Bridge, sa plateforme ouverte d’intégration et d’exploitation IT. Cette innovation résume bien l’évolution du marché : passer de la simple réaction aux incidents à la détection de signaux précoces permettant d’éviter des chutes impactant l’activité.
La société affirme que cette fonction brevetée est désormais accessible à ses clients de Kyndryl Bridge et repose sur des agents d’IA capables d’aider à analyser les causes racines, de corréler les signaux d’observabilité et de proposer des actions proactives, avant qu’une anomalie ne perturbe des applications, infrastructures ou services critiques. Dans des environnements hybrides, multi-cloud et multi-fournisseurs, cette transition de la détection manuelle à la prévention assistée par IA peut faire une différence considérable.
Cette annonce intervient à un moment où de nombreuses entreprises disposent d’infrastructures plus dispersées que jamais. Applications héritées, cloud public, plateformes privées, conteneurs, réseaux, mainframes, bases de données, SaaS et services managés cohabitent dans des opérations souvent peu surveillées de bout en bout. Lorsqu’un problème survient, identifier la cause réelle peut prendre des heures, des jours, voire des semaines, surtout si l’incident se propage entre différentes couches.
Passer du remède d’urgence à l’anticipation des pannes
Depuis toujours, Kyndryl Bridge est une plateforme visant à intégrer données, processus et automatisation dans l’exploitation IT. Avec cette nouvelle capacité, la société souhaite renforcer sa dimension prédictive : identifier des conditions généralement précurseurs d’une panne, valider leurs relations causales, et aider les équipes à intervenir avant que l’incident ne s’aggrave.
Selon ses propos, Kyndryl Bridge génère plus de 16 millions d’insights IA chaque mois et supporte plus de 1 400 clients. La nouvelle capacité s’appuie sur plus de 200 000 dispositifs clients, et est conçue pour repérer des patterns combinant ralentissements applicatifs, contention d’infrastructures, changements de configuration et événements opérationnels.
Ce focus est essentiel car bon nombre d’incidents graves ne naissent pas comme des défaillances évidentes. Ils prennent souvent naissance avec des signaux faibles : latence accrue, modification de configuration, saturation partielle, réponse plus lente d’un service, files d’attente encombrées, instabilité d’une dépendance externe, ou un pattern récurrent après des déploiements similaires. Pris séparément, ces signaux peuvent paraître insignifiants, mais leur corrélation peut anticiper une panne.
Kyndryl affirme que cette nouvelle fonctionnalité peut réduire drastiquement le temps d’analyse des causes racines pour des incidents majeurs, passant d’un délai de plusieurs semaines à quelques heures. La société précise toutefois que ses experts valident et contextualisent systématiquement ces insights afin de garantir leur adéquation à l’environnement spécifique du client.
Ce point est crucial : l’IA agentique en opérations IT ne peut se contenter d’être une boîte noire sans supervision. Dans des environnements critiques, une recommandation erronée peut être aussi risquée qu’une défaillance non détectée. Il est donc essentiel de trouver un bon équilibre entre automatisation, validation humaine et preuves techniques pour que ces plateformes gagnent en confiance.
L’évolution vers une phase plus agentique de l’AIOps
La proposition de Kyndryl s’inscrit dans l’évolution de l’AIOps, une catégorie qui promet depuis plusieurs années de réduire le bruit, de corréler les alertes et d’améliorer la gestion des incidents. La différence aujourd’hui réside dans l’utilisation d’agents IA capables de raisonner sur les signaux, d’assister aux diagnostics, de hiérarchiser les risques et, dans certains cas, de lancer des actions selon des politiques prédéfinies.
La société insiste sur une détection prédictive et une prévention des défaillances, plutôt que sur une simple observabilité. Il s’agit de passer du stade “Quelque chose s’est produit” à “Ces conditions peuvent entraîner un problème si aucune intervention n’est effectuée”. Pour de grandes organisations, ce changement peut impacter directement la disponibilité, les coûts de maintenance, la satisfaction utilisateur et la continuité opérationnelle.
Kyndryl indique que Kyndryl Bridge aurait permis de réduire jusqu’à 50% les incidents IT, générant une économie annuelle estimée à 3 milliards de dollars pour ses clients grâce à l’évitement d’événements et à la réduction de coûts de maintenance planifiée. La plateforme gère également la détection précoce sur plus de 10 millions d’incidents annuels, avec, dans certains clients, une réduction supérieure à 90% des pannes critiques de production.
Ces chiffres impressionnent, mais doivent être compris comme des résultats déclarés par l’entreprise elle-même, non comme une garantie universelle. Leur efficacité dépendra largement du niveau d’intégration, de la qualité des données, de la couverture d’observabilité, de la maturité opérationnelle, de l’automatisation en place et de la capacité du client à agir sur les recommandations. Une plateforme peut détecter des patterns, mais si les équipes ne disposent pas de processus clairs pour intervenir, l’avantage en sera limité.
L’enjeu dans les environnements hybrides et multicloud
La prévention des défaillances devient plus difficile dans des architectures de plus en plus hétérogènes. Une application critique peut dépendre d’un système legacy, d’une base de données cloud, d’un réseau privé, d’un SaaS, d’une API externe, ou de plusieurs composants de sécurité. Lorsqu’un service se dégrade, chaque équipe intervient souvent sur sa propre couche, menant à une investigation fragmentée et lente.
Kyndryl cherche à résoudre ce problème via une observabilité unifiée et une corrélation entre domaines. Si la plateforme peut relier évènements d’infrastructure, modifications récentes, comportements applicatifs et signaux de performance, le diagnostic devient moins dépendant des réunions où des équipes échangent captures d’écran et logs.
L’IA agentique peut accélérer cette détection, mais soulève également des questions de gouvernance. Quelles actions un agent peut-il effectuer ? Quelles interventions nécessitent une validation humaine ? Comment enregistrer les décisions prises ? Quels sont les données analysées ? Comment éviter que des recommandations risquées soient proposées ? Comment gérer les environnements réglementés ? Kyndryl avait déjà présenté en avril Agentic Service Management et des capacités de gouvernance digitale pour piloter ces agents IA dans les workflows IT, intégrant cette nouvelle fonctionnalité dans une stratégie plus globale.
Ces enjeux seront particulièrement importants pour des secteurs comme la banque, l’assurance, l’industrie, la santé, l’administration publique et les télécommunications. Dans ces domaines, prévenir une chute ne se limite pas à une amélioration opérationnelle : cela peut éviter des pertes financières, des infractions réglementaires, des interruptions de service ou des atteintes à la réputation.
La prévention, nouvelle métrique business
L’annonce de Kyndryl confirme que la gestion des opérations IT n’est plus seulement mesurée par le temps moyen de réparation (MTTR). Si celui-ci reste un indicateur clé, les entreprises cherchent désormais à réduire le nombre d’incidents en production, anticiper les dégradations et éviter des fenêtres de maintenance inutiles.
Pour les DSI, cette évolution modifie la nature des discussions. Les plateformes d’exploitation ne doivent pas seulement afficher des dashboards ou envoyer des alertes. Elles doivent aider à prendre des décisions, à prioriser et à prévenir. Si l’IA parvient à expliquer pourquoi une anomalie est critique, à indiquer quelles couches sont impliquées et à proposer une action qui réduit le risque, elle peut libérer du temps aux équipes techniques saturées et renforcer la continuité opérationnelle.
Le défi consiste à distinguer l’automatisation utile des fausses alertes sophistiquées. Nombre d’outils revendiquent une IA, mais n’apportent pas toujours de preuves actionnables. Kyndryl cherche à se différencier par l’ampleur de sa plateforme, la richesse de son parc installé, ainsi que par la combinaison d’agents, de diagnostics de causes racines et de validation par des experts. La vraie réussite se mesurera sur les résultats soutenus chez ses clients et la capacité à intégrer cette intelligence dans leurs processus opérationnels quotidiens.
Le marché semble clair : les entreprises ne veulent plus découvrir un incident quand il impacte déjà leur clientèle. Elles cherchent des signaux précoces, du contexte et des capacités de réponse pour agir avant que l’incident ne devienne une panne. L’IA agentique appliquée à l’exploitation IT ne supprimera pas tous les incidents, mais elle peut significativement réduire le temps consacré à l’analyse des symptômes et aider les équipes à s’attaquer aux causes racines réelles.
Dans des infrastructures toujours plus complexes, la prévention pourrait devenir un avantage concurrentiel. Non pas simplement par sa finesse ou son aspect technologique, mais parce qu’elle garantit la disponibilité des activités principales.
Questions fréquemment posées
Qu’a annoncé Kyndryl ?
Kyndryl a lancé une capacité d’IA agentique dans Kyndryl Bridge pour détecter et prévenir les risques IT avant qu’ils n’entraînent des défaillances impactant l’entreprise.
Que fait Kyndryl Bridge ?
Il s’agit d’une plateforme ouverte d’intégration et de gestion opérationnelle IT utilisant IA, automatisation et observabilité pour traiter des environnements hybrides, multi-cloud et multi-fournisseurs.
Quelle différence entre détection et prévention d’incidents ?
La détection consiste à identifier qu’une erreur ou une dégradation se produit. La prévention implique de repérer des patterns annonciateurs et d’intervenir avant qu’un problème ne survenant.
L’IA agit-elle seule dans les environnements critiques ?
Kyndryl précise que ses experts supervisent et valident systématiquement les insights pour garantir la pertinence et le contexte opérationnel adapté.
Source : kyndryl