Immagine AI

Nel settore dell’AI aziendale, molti progetti di sviluppo di agenti AI non riescono a raggiungere la fase di produzione. Contrariamente a quanto si potrebbe pensare, il problema non risiede nella tecnologia, ma in processi di valutazione lenti, incoerenti e difficili da scalare. Databricks, leader nel settore, ha presentato una soluzione innovativa: Mosaic Agent Bricks.

Secondo Hanlin Tang, Chief Technology Officer di Neural Networks presso Databricks, molte aziende si trovano a “volare alla cieca” durante lo sviluppo degli agenti AI. Affidarsi a metodi manuali per valutare se un agente “suona bene” non offre la fiducia necessaria per portarlo in produzione. Questa mancanza di una valutazione automatizzata porta a un processo di ottimizzazione costoso e inefficiente, con frequenti errori di qualità, superamento dei costi e ritardi nelle scadenze.

Per affrontare queste sfide, Databricks ha lanciato Mosaic Agent Bricks, una piattaforma che automatizza l’intero ciclo di ottimizzazione degli agenti. Basata sul framework Mosaic AI Agent introdotto nel 2024, questa tecnologia integra diverse innovazioni supportate dalla ricerca. Tra le principali spicca l’integrazione di TAO (Test-time Adaptive Optimization), un approccio innovativo per la regolazione degli agenti AI senza la necessità di dati etichettati. TAO consente agli agenti di adattarsi e migliorare in tempo reale, affrontando efficacemente compiti complessi.

Inoltre, Mosaic Agent Bricks genera dati sintetici specifici per il dominio, crea benchmark consapevoli del compito e ottimizza l’equilibrio qualità-costo senza intervento manuale. Queste funzionalità permettono alle aziende di passare rapidamente dalla progettazione alla produzione, riducendo i tempi e i costi associati alla valutazione manuale.

La piattaforma offre quattro configurazioni principali di agenti AI, ciascuna progettata per soddisfare esigenze aziendali specifiche:

  • Estrazione di informazioni: trasforma documenti (come PDF o email) in dati strutturati, utile per estrarre dettagli da fornitori anche con formati complessi.
  • Assistente di conoscenza: fornisce risposte accurate e citate dai dati aziendali, ad esempio per aiutare i tecnici a trovare informazioni nei manuali di manutenzione.
  • LLM personalizzato: gestisce compiti di trasformazione del testo, come sintesi o classificazione, adatto per flussi di lavoro clinici o legali.
  • Supervisore multi-agente: coordina più agenti per flussi di lavoro complessi, come la gestione di documenti e controlli di conformità nel settore finanziario.

La costruzione e la valutazione degli agenti sono fondamentali per rendere l’IA pronta per l’uso aziendale, ma non sono gli unici aspetti necessari. Databricks posiziona Mosaic Agent Bricks come il livello di consumo dell’IA sopra la sua piattaforma di dati unificata. Inoltre, Databricks ha annunciato la disponibilità generale di Lakeflow, una piattaforma di ingegneria dei dati che unifica tre flussi critici: ingestione, trasformazione e orchestrazione. Lakeflow prepara i dati aziendali attraverso un’ingestione e trasformazione unificate, mentre Agent Bricks costruisce agenti AI ottimizzati su questi dati preparati.

Questa connessione diretta tra Lakeflow e Agent Bricks assicura che il comportamento degli agenti rispetti la governance dei dati aziendali senza configurazioni aggiuntive.

Un approccio comune per guidare gli agenti AI è l’uso di un prompt di sistema. Tuttavia, la pratica del “prompt stuffing”, in cui gli utenti inseriscono vari tipi di guida in un prompt sperando che l’agente lo segua, spesso fallisce. Agent Bricks introduce un nuovo concetto chiamato Apprendimento dell’agente dal feedback umano, che regola automaticamente i componenti del sistema in base alla guida in linguaggio naturale. Questo sistema interpreta la guida in linguaggio naturale e regola i componenti appropriati del sistema, affrontando due sfide principali: la guida in linguaggio naturale può essere vaga e i sistemi agenti contengono numerosi punti di configurazione. Questo approccio elimina l’incertezza su quali componenti dell’agente necessitano di regolazione per modifiche comportamentali specifiche.

Esistono numerosi framework e strumenti di sviluppo di agenti AI sul mercato, tra cui quelli di Langchain, Microsoft e Google. Tuttavia, ciò che distingue Mosaic Agent Bricks è l’ottimizzazione automatizzata. Invece di richiedere configurazioni manuali e regolazioni, Agent Bricks incorpora automaticamente diverse tecniche di ricerca: TAO, apprendimento contestuale, ottimizzazione del prompt e fine-tuning. Per quanto riguarda la comunicazione tra agenti, Databricks sta attualmente esplorando vari protocolli di agenti e non ha ancora adottato uno standard unico. Attualmente, Agent Bricks gestisce la comunicazione tra agenti attraverso due metodi principali: esponendo gli agenti come endpoint che possono essere incapsulati in diversi protocolli e utilizzando un supervisore multi-agente consapevole del MCP (Model Context Protocol).

Per le aziende che desiderano essere leader nell’adozione dell’IA, è fondamentale avere le tecnologie giuste per valutare la qualità e l’efficacia degli agenti AI. Distribuire agenti senza una valutazione non porterà a un risultato ottimale e nemmeno avere agenti senza una solida base di dati. Quando si considerano le tecnologie di sviluppo degli agenti, è fondamentale avere meccanismi adeguati per valutare le migliori opzioni. L’approccio dell’Apprendimento dell’agente dal feedback umano è anche degno di nota per i decisori aziendali, poiché aiuta a guidare l’IA agentica verso il miglior risultato. Per le aziende che cercano di guidare nell’implementazione degli agenti AI, questo sviluppo significa che l’infrastruttura di valutazione non è più un fattore di blocco. Le organizzazioni possono concentrare le risorse sull’identificazione dei casi d’uso e sulla preparazione dei dati, piuttosto che sulla costruzione di framework di ottimizzazione.

Di Fantasy