Kyndryl ha annunciato una nuova funzionalità agentic AI integrata nella piattaforma Kyndryl Bridge, progettata per identificare preventivamente anomalie operative e ridurre il rischio di interruzioni nei sistemi IT enterprise prima che queste si trasformino in outage reali. La tecnologia punta a modificare radicalmente il modello tradizionale di gestione infrastrutturale, spostando il focus dalla risposta agli incidenti alla prevenzione predittiva automatizzata.
La nuova capacità AI è stata sviluppata come componente nativa di Kyndryl Bridge, la piattaforma proprietaria utilizzata dall’azienda per orchestrare infrastrutture ibride, ambienti multi-vendor e sistemi mission-critical distribuiti. Secondo i dati condivisi da Kyndryl, la piattaforma genera già oltre 16 milioni di insight AI ogni mese e viene utilizzata da più di 1.400 clienti enterprise a livello globale.
L’elemento più innovativo riguarda l’utilizzo di agenti AI autonomi integrati direttamente nei workflow operativi dell’infrastruttura IT. Il sistema non si limita a monitorare eventi o inviare alert agli operatori umani, ma analizza continuamente enormi quantità di segnali provenienti da applicazioni, server, ambienti cloud, apparati di rete e sistemi infrastrutturali per identificare pattern che normalmente precedono un’interruzione di servizio.
La piattaforma utilizza un modello di correlazione multi-layer basato su osservability signals provenienti da stack infrastrutturali differenti. Questo significa che l’AI non osserva singoli eventi isolati, ma cerca relazioni tra rallentamenti applicativi, modifiche configurative, degradazione delle performance, eventi operativi e anomalie distribuite all’interno dell’ecosistema IT. L’obiettivo è comprendere come piccoli problemi apparentemente indipendenti possano accumularsi fino a generare un outage critico.
Uno degli aspetti più interessanti della soluzione riguarda la capacità di intervenire prima che l’incidente abbia impatto sugli utenti finali o sui processi aziendali. In molti ambienti enterprise tradizionali, infatti, le attività di IT operations restano ancora fortemente reattive: il problema viene affrontato soltanto dopo il degrado del servizio o il fermo operativo. Kyndryl punta invece a introdurre un modello di “evidence-based prevention”, in cui gli agenti AI possono individuare condizioni anomale in fase precoce e attivare azioni correttive automatiche o assistite.
La piattaforma utilizza inoltre funzionalità AI-assisted root cause analysis per accelerare l’identificazione delle cause reali degli incidenti. Secondo quanto dichiarato dall’azienda, il sistema sarebbe in grado di ridurre i tempi di analisi delle cause profonde di incidenti critici da settimane a poche ore. Questo rappresenta uno dei principali problemi degli ambienti enterprise complessi, dove applicazioni legacy, cloud ibrido, reti distribuite e infrastrutture multi-vendor rendono estremamente difficile isolare rapidamente l’origine di un malfunzionamento.
Il modello agentic AI adottato da Kyndryl si differenzia dai tradizionali sistemi AIOps basati solo su monitoraggio e analytics. In questo caso gli agenti non si limitano a suggerire azioni agli operatori, ma possono contribuire direttamente all’orchestrazione delle attività correttive, automatizzando parti del processo di remediation. Questo approccio avvicina l’infrastruttura enterprise a modelli di self-healing infrastructure, nei quali i sistemi sono in grado di correggere autonomamente alcune anomalie operative senza attendere interventi manuali.
Kyndryl ha dichiarato che la piattaforma opera già su oltre 200.000 dispositivi clienti distribuiti in ambienti enterprise differenti. L’infrastruttura AI analizza ogni anno oltre 10 milioni di incidenti potenziali, utilizzando dati storici e correlazioni operative per anticipare condizioni di rischio. In alcuni deployment specifici, la società sostiene di aver ottenuto riduzioni fino al 90% degli outage nei sistemi mission-critical di produzione.
L’impatto economico dichiarato è altrettanto significativo. Secondo i dati condivisi dall’azienda, il sistema avrebbe contribuito a ridurre gli incidenti IT fino al 50% e generato circa 3 miliardi di dollari di risparmi annuali aggregati per i clienti, grazie alla riduzione degli outage e all’eliminazione di costose finestre di manutenzione programmata.
Uno degli aspetti tecnici più delicati riguarda proprio il rapporto tra prevenzione predittiva e manutenzione programmata. Tradizionalmente molte aziende effettuano interventi infrastrutturali preventivi altamente conservativi, spesso basati su finestre temporali rigide o procedure standardizzate, proprio per ridurre il rischio di guasti. Tuttavia questo approccio comporta costi elevati, downtime pianificati e ridotta efficienza operativa. I sistemi AI predittivi cercano invece di intervenire soltanto quando vengono rilevati segnali concreti di degrado o rischio imminente.
Il modello implementato da Kyndryl riflette inoltre un cambiamento più ampio nel settore enterprise IT operations. Le aziende stanno progressivamente passando da strumenti di monitoring statici a piattaforme AI-native capaci di correlare dati eterogenei, interpretare anomalie operative e coordinare remediation distribuite. Questo trend è particolarmente importante negli ambienti hybrid cloud e multi-cloud, dove la complessità infrastrutturale è ormai troppo elevata per essere gestita esclusivamente tramite supervisione umana.
