Immagine AI

L’introduzione degli agenti di Intelligenza Artificiale—sistemi software progettati per completare compiti complessi in modo autonomo—ha innescato una vera e propria corsa all’oro nel settore tecnologico. Nonostante le immense aspettative, alimentate dalle promesse di una produttività trasformativa, il consenso è che l’AI agentica si trovi ancora, per molti aspetti, ai suoi albori. Questa fase di rodaggio è caratterizzata da una persistente tensione tra il potenziale futuristico e la cruda realtà dell’implementazione aziendale, un equilibrio precario ben riassunto dalle parole del CEO di Amazon, Andy Jassy, il quale ha recentemente ammesso che “creare servizi utilizzando agenti è ancora più impegnativo del previsto”.

La vera sfida degli agenti AI risiede nella loro capacità di funzionare efficacemente al di fuori dei rigorosi ambienti di benchmark. I modelli attuali, pur eccellendo nei test accademici, spesso inciampano quando vengono confrontati con la complessità caotica e le sfumature contestuali di un ambiente aziendale reale.

Fnac, un rivenditore europeo di primo piano, ha incontrato notevoli difficoltà nell’implementazione di modelli avanzati di aziende come OpenAI e Google per l’assistenza clienti. L’AI ha commesso errori, come la rimozione di una cifra dai numeri di serie dei prodotti, dimostrando che l’uso di un modello generico è insufficiente. La causa di questi fallimenti è duplice: l’allucinazione tipica dei modelli e la mancanza di comprensione contestuale specifica del business. Per risolvere il problema, Fnac ha dovuto rivolgersi a specialisti esterni come l’azienda israeliana AI21 per una significativa personalizzazione. Come ha spiegato il CEO di AI21, Ori Goshen, la maggior parte dei modelli “richiedono un livello significativo di personalizzazione” per operare in modo affidabile negli ambienti di lavoro.

Anche Bosch Power Tools, forte di un fatturato annuo di oltre 5,7 miliardi di dollari, ha sperimentato per più di un anno l’uso dei chatbot per l’assistenza clienti, con risultati insoddisfacenti. L’AI continuava a fornire risposte errate che, nel contesto degli utensili elettrici, potevano persino mettere a rischio la sicurezza degli utenti. La conclusione è stata pragmatica: l’azienda ha abbandonato il modello ad alta tecnologia in favore di una soluzione meno ambiziosa, concentrandosi sulla risposta a domande di base e utilizzando strumenti di AI separati per l’analisi dei dati aziendali. Il responsabile dell’esperienza digitale del cliente di Bosch ha ammesso che l’automazione completa, con accuratezza vicina al 100%, non è ancora realistica.

La complessità dell’implementazione degli agenti generici ha portato a una crescente domanda di “ingegneri in servizio attivo”, team di supporto specializzato inviati direttamente presso l’azienda cliente per risolvere i problemi sul campo. Questa necessità di intervento umano, come ha sottolineato il venture capitalist Vinod Khosla, rende estremamente difficile creare agenti in autonomia e si traduce inevitabilmente in un aumento dei costi per le aziende.

L’esperienza di Kyndryl, colosso dei servizi IT, è emblematica. Dopo aver investito 50.000 dollari per sei mesi per testare Security Copilot di Microsoft per identificare le vulnerabilità IT, l’azienda ha deciso di interrompere l’uso, poiché l’AI forniva informazioni fuorvianti, soprattutto nell’analisi di software datato. Nonostante il fallimento, il direttore della sicurezza informatica di Kyndryl ha minimizzato la perdita di 50.000 dollari, considerandola “una piccola cifra rispetto ai costi della manodopera”, suggerendo che, se l’AI avesse funzionato, il risparmio sui costi totali sarebbe stato molto superiore.

Infatti, il valore potenziale è innegabile. Il Cirque du Soleil ha utilizzato un agente SAP per l’acquisto di oggetti di scena e costumi, riuscendo a spostare uno dei due dipendenti assegnati al compito ad altro reparto. Lo strumento, costando meno dello stipendio di un dipendente a tempo pieno, ha accelerato significativamente le risposte ai fornitori, portando a una maggiore soddisfazione complessiva. Questo dimostra che, per funzioni semplici e circoscritte, come la gestione delle e-mail o degli acquisti basilari, l’AI è già sufficientemente efficace per garantire un chiaro aumento della produttività.

Attualmente, l’area in cui gli agenti di AI stanno ottenendo i risultati più visibili è la codifica, dove il ruolo dell’AI e quello dello sviluppatore umano stanno diventando complementari attraverso un processo di tentativi ed errori consolidato. Anche la ricerca e la generazione video basate sull’AI sono considerate casi di successo che stanno alimentando i ricavi B2B di aziende come Anthropic e OpenAI a un ritmo senza precedenti.

Tuttavia, gli agenti più generici sono ancora in una fase sperimentale. Aziende SaaS come Salesforce, Snowflake e Xero, pur offrendo prodotti AI, non applicano ancora un costo pieno, aspettandosi che i clienti paghino solo quando saranno convinti del valore aggiunto. Il Presidente delle operazioni globali di ServiceNow ha osservato un calo dell’entusiasmo per i pilot di AI, ma ha sottolineato che si sta sviluppando un approccio più realistico che porterà a una “vera adozione” una volta che le aziende vedranno un impatto concreto sui profitti.

Il processo di test e valutazione degli agenti AI è appena iniziato. È prematuro valutarne immediatamente il ritorno sull’investimento (ROI). Come ha opportunamente affermato Asha Sharman, presidente dei prodotti AI di Microsoft, i costi degli agenti AI devono essere visti come un “budget per la ricerca e sviluppo”, un investimento che frutterà i suoi risultati nei prossimi cinque o dieci anni. L’obiettivo attuale è capire come rendere i milioni di agenti già in funzione realmente utili nel mondo del lavoro, una sfida che richiede pazienza, personalizzazione e un approccio ibrido che non ignori la necessità della supervisione umana esperta.

Di Fantasy