L’acquisizione della startup Vercept da parte di Anthropic segna un momento decisivo nel passaggio dai modelli linguistici puramente testuali verso agenti dotati di capacità operative autonome all’interno degli ambienti software. Vercept, nata dall’incubatore d’eccellenza Allen Institute for AI (Ai2) di Seattle, ha concentrato i suoi sforzi sullo sviluppo di Vy, un agente progettato per superare la barriera dell’esecuzione di codice isolato, permettendo all’intelligenza artificiale di interagire con le interfacce grafiche esattamente come farebbe un utente umano. Attraverso l’uso virtuale di mouse e tastiera, questa tecnologia consente a modelli come Claude di navigare tra le cartelle di un sistema operativo, compilare moduli web complessi e manipolare fogli di calcolo, interpretando visivamente gli elementi a schermo senza la necessità di integrazioni API dirette con ogni singola applicazione.
L’eccellenza tecnica portata dai co-fondatori Kiana Ehsani, Luca Weihs e Ross Girshick si integra in una strategia di Anthropic volta a risolvere i problemi di percezione e interazione che ancora limitano l’autonomia degli agenti. La capacità di “vedere e agire” in ambienti dinamici è stata validata dai recenti risultati nel benchmark OSWorld, uno dei test più rigorosi per valutare le competenze informatiche dell’IA. Mentre alla fine del 2024 le versioni iniziali di Claude faticavano a superare il 15% di successo in compiti operativi complessi, l’ultima versione Claude Sonnet 4.6 ha raggiunto un punteggio del 72,5%. Questo balzo prestazionale indica che il sistema si sta avvicinando rapidamente ai livelli di efficienza umana in attività multi-step che richiedono la coordinazione tra diverse schede del browser e strumenti di produttività, riducendo drasticamente il tasso di errore nella navigazione di flussi di lavoro articolati.
L’acquisizione non rappresenta solo un innesto di proprietà intellettuale, ma un consolidamento di talenti provenienti da percorsi accademici e industriali di alto profilo. Vercept aveva raccolto oltre 50 milioni di dollari da investitori del calibro di Eric Schmidt e Jeff Dean, focalizzandosi su una tesi fondamentale: l’AI diventa realmente utile quando può completare compiti complessi operando direttamente sui medesimi software utilizzati quotidianamente dalle persone. Sebbene l’operazione sia stata accolta con favore dai mercati, ha generato tensioni interne all’ecosistema di Seattle. Oren Etzioni, fondatore dell’Ai2 e figura storica della ricerca sull’intelligenza artificiale, ha espresso rammarico per la chiusura delle attività indipendenti di Vercept a soli 14 mesi dal lancio, sottolineando la perdita di una voce autonoma nel settore nonostante il ritorno economico positivo per gli investitori.
Dal punto di vista infrastrutturale, Anthropic sta costruendo un ecosistema integrato in cui Claude non si limita a rispondere a domande, ma gestisce repository di codice estesi e sintetizza ricerche provenienti da decine di fonti distribuite su diversi team. L’acquisizione di Vercept segue quella del motore di agenti Bun avvenuta lo scorso dicembre, confermando l’ambizione di creare un assistente digitale capace di operare in modo “Local-First”. Questo significa che l’agente può agire all’interno di un ambiente applicativo live, correggendo i propri errori in tempo reale e adattandosi ai cambiamenti visivi dell’interfaccia. Il futuro delineato da questa operazione punta a una trasformazione del personal computer in un’estensione intelligente dell’utente, dove la complessità dei compiti ripetitivi viene delegata a sistemi capaci di gestire la transizione tra visione artificiale e azione meccanica con una precisione sempre più raffinata.
