Come AIOps può avvantaggiare le aziende
 ” AIOps ” , che sta per “AI for IT operations”, si riferisce al modo in cui i dati e le informazioni di un ambiente di sviluppo vengono gestiti da un team IT, in questo caso utilizzando l’IA. Le piattaforme AIOps sfruttano i big data, l’apprendimento automatico e l’analisi per migliorare le operazioni IT tramite il monitoraggio, l’automazione e le funzioni di service desk con approfondimenti proattivi e personali, consentendo l’uso di più origini dati e metodi di raccolta dati. In teoria, AIOps può fornire risoluzioni più rapide alle interruzioni e ad altri problemi di prestazioni, riducendo nel contempo i costi associati alle sfide IT.

I vantaggi di AIOps stanno guidando l’adozione da parte delle aziende. L’87% degli intervistati a un recente sondaggio OpsRamp concorda sul fatto che gli strumenti AIOps stanno migliorando la loro collaborazione basata sui dati e Gartner prevede che l’utilizzo del servizio AIOps aumenterà dal 5% nel 2018 al 30% nel 2023.

 
Ma quando si implementa una soluzione AIOps, le aziende senza un’idea chiara dei potenziali bloccanti possono incontrare difficoltà. Ecco perché è importante avere una comprensione olistica dell’AIOps prima di formulare una strategia.

Cos’è AIOps?
Le piattaforme AIOps raccolgono dati da vari strumenti operativi IT al fine di individuare automaticamente i problemi fornendo analisi storiche. In genere hanno due componenti – big data e machine learning – e richiedono un allontanamento dai dati IT in silos per aggregare i dati di osservazione insieme ai dati di coinvolgimento nella registrazione di ticket, incidenti ed eventi.

Come scrive Seth Paskin, direttore delle operazioni presso BMC Software: “I risultati che i professionisti IT si aspettano da AIOps possono essere classificati generalmente come automazione e previsione … La loro prima aspettativa da AIOps è che consentirà loro di automatizzare ciò che stanno attualmente facendo manualmente e quindi aumentare la velocità con cui tali attività vengono eseguite. Alcuni esempi specifici che ho sentito includono: correlare le informazioni del profilo del cliente con le applicazioni di elaborazione finanziaria e i dati dell’infrastruttura per identificare i valori anomali della durata delle transazioni ed evidenziare i fattori che incidono sulle prestazioni; valutare i dati non strutturati nei ticket di servizio per identificare i candidati all’automazione del problema; classificare i carichi di lavoro per un posizionamento ottimale dell’infrastruttura; e correlare gli incidenti con le modifiche, i registri di lavoro e le attività di sviluppo di app per misurare l’impatto sulla produzione delle modifiche all’infrastruttura e alle applicazioni “.

Una piattaforma AIOps analizza i dati su registri, avvisi sulle prestazioni, ticket e altri elementi utilizzando un processo di rilevamento automatico che raccoglie automaticamente i dati attraverso l’infrastruttura e i domini dell’applicazione. Il processo identifica i dispositivi dell’infrastruttura, le app in esecuzione e le transazioni aziendali e mette in correlazione tutti i dati in una forma contestuale. La mappatura automatica delle dipendenze determina le relazioni tra elementi come le connessioni fisiche e virtuali a livello di rete mappando i flussi delle app all’infrastruttura di supporto e tra le transazioni aziendali e le app.

La mappatura delle dipendenze automatizzata di AIOps ha un altro vantaggio: aiutare a tenere traccia delle relazioni tra le entità dell’infrastruttura ibrida. Le piattaforme AIOps possono creare mappe topologiche di servizi e app in ambienti e domini tecnologici, consentendo ai team IT di accelerare la risposta agli incidenti e quantificare l’impatto aziendale delle interruzioni.

Per identificare i modelli e prevedere eventi futuri, come le interruzioni del servizio, AIOps utilizza l’apprendimento supervisionato, l’apprendimento non supervisionato e il rilevamento delle anomalie in base ai comportamenti e alle soglie attesi. Particolarmente utile è l’apprendimento automatico senza supervisione , che consente alle piattaforme AIOps di imparare a riconoscere il comportamento previsto e impostare soglie tra i dati e le metriche delle prestazioni. Le piattaforme possono analizzare i modelli di eventi in tempo reale e confrontarli con il comportamento previsto, avvisando i team IT quando una sequenza di eventi (o gruppi di eventi) dimostra un’attività che indica la presenza di anomalie.

Le informazioni acquisite dalle piattaforme AIOps possono essere trasformate in una serie di azioni intelligenti eseguite automaticamente, dall’accelerazione delle richieste del service desk al provisioning end-to-end alla distribuzione di rete, elaborazione, cloud e applicazioni. In sintesi, AIOps riunisce i dati sia dalla gestione delle operazioni IT che dalla gestione dei servizi IT, consentendo ai team di sicurezza di osservare, impegnarsi e agire sui problemi in modo più efficiente di prima.

Sfide
Non tutte le implementazioni di AIOps procedono senza intoppi come pianificato. Le sfide possono ostacolare, inclusi dati di scarsa qualità ed errori del team IT. I dipendenti a volte incontrano difficoltà nell’apprendere come utilizzare gli strumenti AIOps e il trasferimento del controllo a sistemi autonomi può creare problemi tra i C-Suite. Inoltre, l’adozione di nuove soluzioni AIOps può richiedere molto tempo: la maggior parte degli intervistati al sondaggio OpsRamp ha affermato che occorrono da tre a sei mesi per implementare una soluzione AIOps, con il 25% che afferma che ci vogliono più di sei mesi.

Poiché le piattaforme AIOps si basano così fortemente sull’apprendimento automatico, le sfide nella scienza dei dati possono influire sul successo delle strategie AIOps. Ad esempio, ottenere l’accesso a dati di qualità per addestrare i sistemi di apprendimento automatico non è facile. Secondo un sondaggio Rackspace Technology del 2021 , la scarsa qualità dei dati è stata la ragione principale del fallimento della ricerca e sviluppo nell’apprendimento automatico tra il 34% degli intervistati. Il 31% ha dichiarato di non disporre di dati pronti per la produzione.

Oltre alle sfide relative ai dati, il divario di competenze rappresenta anche un ostacolo all’adozione di AIOps. La maggioranza degli intervistati in un rapporto Juniper del 2021 ha affermato che le proprie organizzazioni hanno difficoltà a espandere la propria forza lavoro per integrarsi con i sistemi di intelligenza artificiale. Lamenti sulla carenza di talenti AI sono diventate un ritornello familiare dal settore privato – 2021 AI Adozione di O’Reilly nel Enterprise carta ha rilevato che la mancanza di personale qualificato e la difficoltà di assunzione in cima alla lista di sfide in AI, con il 19% degli intervistati citandolo come un blocco “significativo”.

Le aspettative irrealistiche dal C-suite sono un altro motivo principale di fallimento nei progetti di machine learning. Mentre 9 su 10 degli intervistati di C Suite hanno definito l’AI come la “prossima rivoluzione tecnologica”, secondo Edelman , Algorithmia ha scoperto che la mancanza di consenso da parte dei dirigenti contribuisce ai ritardi nell’implementazione dell’AI.

Benefici
Adottare con successo AIOps non è una cosa sicura, ma molte aziende trovano i vantaggi che valgono la pena affrontare le sfide. I sistemi AIOps riducono il torrente di avvisi che inondano i team IT e apprendono nel tempo quali tipi di avvisi devono essere inviati a quali team, riducendo la ridondanza. Possono essere utilizzati per gestire attività di routine come backup, riavvio del server e attività di manutenzione a basso rischio. E possono prevedere gli eventi prima che si verifichino, ad esempio quando la larghezza di banda della rete sta raggiungendo il limite.

Come spiega Accenture in un recente white paper , AIOps migliora in ultima analisi la capacità di un’organizzazione IT di essere un partner efficace per l’azienda. “Una piattaforma operativa IT con funzionalità AIOps integrate può aiutare le operazioni IT a identificare in modo proattivo potenziali problemi con i servizi e la tecnologia che fornisce all’azienda e correggerli prima che diventino problemi”, ha scritto la società di consulenza. “Questo è il valore di avere un unico modello di dati che le applicazioni di gestione dei servizi e delle operazioni possono condividere senza problemi”.

 

Di ihal