Immagine AI

Writer, una startup con sede a San Francisco, ha recentemente presentato il suo “Action Agent”, un agente autonomo in grado di eseguire compiti complessi su più piattaforme software senza intervento umano. Questa innovazione segna un significativo passo avanti rispetto agli assistenti AI tradizionali, come ChatGPT, che si limitano a rispondere a domande o a generare testi.

L’Action Agent di Writer rappresenta ciò che l’azienda definisce “livello quattro di orchestrazione”, il livello più alto di automazione AI. Mentre molti strumenti AI attuali operano a livelli uno o due, gestendo compiti di base come rispondere a domande o recuperare documenti, l’Action Agent è progettato per eseguire interi progetti in modo autonomo. Ad esempio, può navigare su siti web, analizzare dati, creare presentazioni, scrivere codice e coordinare il lavoro attraverso l’intero stack tecnologico di un’organizzazione senza intervento umano.

Le affermazioni di Writer riguardo alle capacità del suo agente sono supportate da risultati impressionanti nei benchmark. L’Action Agent ha ottenuto un punteggio del 61% nel GAIA Level 3, il benchmark più impegnativo per le prestazioni degli agenti AI, superando sistemi concorrenti, incluso Deep Research di OpenAI. Inoltre, ha raggiunto un punteggio del 10,4% nella classifica CUB (Computer Use Benchmark), posizionandosi come il miglior performer per compiti di utilizzo del computer e del browser.

L’Action Agent è alimentato dal modello Palmyra X5 di Writer, che vanta una finestra di contesto di un milione di token, sufficiente per elaborare centinaia di pagine di documenti contemporaneamente mantenendo la coerenza attraverso compiti complessi. Questa enorme capacità di contesto consente all’agente di lavorare con interi codici, rapporti di ricerca lunghi e set di dati completi senza perdere di vista l’obiettivo complessivo.

Inoltre, l’Action Agent è progettato per generare autonomamente strumenti quando quelli esistenti risultano insufficienti. Può scrivere i propri strumenti al volo per lo scopo del compito, consentendogli di affrontare una vasta gamma di attività senza dipendere da strumenti predefiniti.

A differenza degli strumenti AI orientati al consumatore, l’Action Agent di Writer è costruito sulla sua piattaforma enterprise esistente, che già serve centinaia di grandi aziende, tra cui Accenture, Vanguard, Qualcomm, Uber e Salesforce. Questa distinzione è cruciale per l’adozione da parte delle imprese, poiché il sistema fornisce registri di audit completi che mostrano esattamente come l’agente ha raggiunto le sue conclusioni e quali azioni ha intrapreso. Ciò è essenziale per le industrie regolamentate, come quelle bancarie e sanitarie, dove la trasparenza e la tracciabilità sono fondamentali.

L’Action Agent di Writer è in grado di connettersi con oltre 600 strumenti aziendali, rappresentando un significativo risultato tecnico. Utilizza il Model Context Protocol (MCP), uno standard emergente per l’integrazione degli strumenti AI, ma Writer ha migliorato questo protocollo con controlli di sicurezza e governance di livello enterprise. Questa capacità consente all’agente di coordinare il lavoro attraverso l’intero ecosistema tecnologico di un’organizzazione, dai sistemi di gestione delle relazioni con i clienti ai database finanziari.

Writer ha deciso di offrire l’Action Agent gratuitamente ai clienti esistenti, sfidando i tradizionali modelli di pricing del software e riflettendo i cambiamenti più ampi nell’industria dell’AI. Nonostante i significativi costi computazionali associati all’uso esteso dei token, l’azienda ha sviluppato i suoi modelli in modo efficiente, spendendo solo 700.000 dollari per addestrare il modello Palmyra X4, rispetto ai circa 4,6 milioni di dollari per un modello di dimensioni simili di OpenAI.

Di Fantasy