Ari Goshen, CEO di AI21: i Transformers non idonei agli Agenti AI causa errori persistenti

Negli ultimi anni, molte aziende hanno iniziato a esplorare l’uso di agenti di intelligenza artificiale (IA). Tuttavia, secondo Ari Goshen, CEO di AI21, ci sono problemi con i modelli di IA attualmente utilizzati, in particolare con l’architettura dei trasformatori, che potrebbero ostacolare l’efficacia di questi agenti.

In un’intervista con VentureBeat, Goshen ha spiegato che i trasformatori, essendo i modelli di IA più comuni, presentano limitazioni che rendono difficile la creazione di un ecosistema multi-agente. Ha notato che esiste una tendenza crescente verso l’emergere di architetture diverse dai trasformatori, che si prevede saranno più efficienti. Ha sottolineato come i trasformatori tendano a generare un numero eccessivo di token, il che può risultare costoso.

AI21 sta attualmente sviluppando un’architettura chiamata JAMBA (Joint Attention e architettura Mamba), basata su ricerche provenienti dalla Princeton University e dalla Carnegie Mellon University. Questa architettura promette tempi di risposta più rapidi e una gestione migliore del contesto, rendendo gli agenti più efficienti e accessibili.

Goshen ha affermato che architetture come Mamba e JAMBA possono migliorare le performance degli agenti, in particolare per quelli che interagiscono con altri modelli. Ha osservato che la crescente popolarità degli agenti IA è avvenuta solo recentemente, principalmente a causa della dipendenza da modelli di linguaggio ampi (LLM) basati su trasformatori.

Ha spiegato che il motivo principale per cui gli agenti non sono ancora ampiamente utilizzati è la loro affidabilità, affermando che i trasformatori sono molto stocastici e che ogni errore tende a ripetersi.

Gli agenti di intelligenza artificiale stanno diventando sempre più comuni nel settore aziendale. Diverse aziende hanno recentemente lanciato piattaforme per facilitare la creazione di agenti IA. Ad esempio, ServiceNow ha aggiornato la sua piattaforma Now Assist AI, mentre Salesforce ha introdotto Agentforce, e Slack consente integrazioni con vari agenti di IA.

Goshen è fiducioso che questa tendenza crescerà ulteriormente con il giusto mix di modelli e architetture. Ha commentato che molte applicazioni attuali, come i chatbot per domande e risposte, sono semplicemente ricerche avanzate, e ha aggiunto che la vera intelligenza risiede nella capacità di connettere e recuperare informazioni da diverse fonti.

Goshen sostiene fermamente l’adozione di architetture alternative come Mamba e JAMBA, poiché ritiene che i modelli di trasformatori siano troppo costosi e complessi da gestire. Ha spiegato che, a differenza dei trasformatori, Mamba può ottimizzare l’uso della memoria e della potenza di calcolo, assegnando pesi diversi ai dati in ingresso.

Negli ultimi mesi, altri sviluppatori di IA open source hanno cominciato a utilizzare modelli basati su Mamba, come Mistral con il suo Codestral Mamba 7B e Falcon con il Falcon Mamba 7B.

Nonostante l’architettura del trasformatore sia diventata lo standard per lo sviluppo di modelli di base, come il GPT di OpenAI, Goshen ha avvertito le aziende di prestare attenzione alle demo appariscenti che promettono di risolvere molte problematiche. Ha affermato che siamo in una fase in cui le demo carismatiche sono facili da realizzare, ma che ci vuole tempo per arrivare a un prodotto solido. Ha concluso dicendo che è utile usare l’IA aziendale per la ricerca, ma che non siamo ancora pronti per utilizzarla in modo decisivo per prendere decisioni.

Ari Goshen, CEO di AI21: i Transformers non idonei agli Agenti AI causa errori persistenti

DiFantasy

Di Fantasy

Articoli correlati

ChatGPT cambia voce: OpenAI ammorbidisce il tono di GPT-5 per renderlo più umano e accogliente

Anthropic rafforza la sicurezza di Claude: nuove regole contro abusi, armi e cyberattacchi

Sam Altman e le prestazioni limitate di GPT-5 per carenza di potenza di calcolo

You missed

ChatGPT cambia voce: OpenAI ammorbidisce il tono di GPT-5 per renderlo più umano e accogliente

Anthropic rafforza la sicurezza di Claude: nuove regole contro abusi, armi e cyberattacchi

Sam Altman e le prestazioni limitate di GPT-5 per carenza di potenza di calcolo

Quando l’intelligenza artificiale entra in tribunale: dalla prevenzione dei crimini ai carceri smart