Anthropic ha pubblicato i risultati della seconda fase di Project Fetch, un esperimento dedicato all’uso di Claude per programmare e controllare un robot quadrupede commerciale. Nella nuova prova Claude Opus 4.7, eseguito in Claude Code con adaptive thinking al livello massimo, ha completato autonomamente una serie di attività di integrazione e controllo del robot in tempi molto inferiori rispetto ai team umani coinvolti nel test iniziale del 2025.
Il progetto utilizza un robodog dotato di videocamera e sensore LiDAR. Le attività comprendono il collegamento ai flussi video e ai dati del sensore, la scrittura di un programma per il controllo manuale, la costruzione di un sistema per monitorare il percorso del robot nello spazio, il rilevamento di una palla da spiaggia e l’integrazione di questi componenti in un flusso di recupero autonomo dell’oggetto.
Nella prima fase di Project Fetch, svolta nell’agosto 2025, Anthropic aveva assegnato dipendenti non specializzati in robotica a due gruppi: un team poteva usare Claude Opus 4.1, mentre l’altro doveva lavorare con ricerche online e competenze proprie. Il gruppo assistito da Claude aveva ottenuto risultati migliori, ma il modello non era stato in grado di completare le attività in autonomia, bloccandosi già nella fase preliminare di connessione al robot.
Nella seconda fase il ruolo umano è stato ridotto al collegamento di un laptop con Claude Code al robot, all’inserimento del prompt iniziale e all’approvazione dei comandi e del passaggio alla fase successiva. Claude Opus 4.7 ha quindi operato sul sistema in modo autonomo, individuando le interfacce disponibili, collegando videocamera e LiDAR, scrivendo il codice necessario e creando i componenti software per il monitoraggio e il riconoscimento dell’oggetto.
Sui quattro compiti completati da entrambi i gruppi umani della prima sperimentazione, Claude Opus 4.7 ha impiegato in media 9 minuti e 35 secondi. Il team senza Claude aveva richiesto 361 minuti, mentre il team assistito dal modello 181 minuti. Il confronto corrisponde a una velocità superiore di 37,7 volte rispetto al gruppo senza AI e di 18,9 volte rispetto al gruppo che aveva lavorato con il supporto di Claude.
Considerando cinque attività della seconda fase, il modello ha completato il lavoro in una media di 12 minuti e 7 secondi su tre prove. Il team umano assistito da Claude aveva impiegato 264 minuti nella fase precedente. Anthropic segnala inoltre che Opus 4.7 ha completato ogni compito riuscito da almeno un team umano con una velocità almeno dieci volte superiore.
Un dato rilevante riguarda anche il volume di codice prodotto. Claude Opus 4.7 ha generato 1.045 righe di codice, contro 10.309 righe del team umano che lavorava con Claude e 1.136 righe del team senza modello. Il sistema ha quindi ottenuto risultati uguali o superiori utilizzando quasi dieci volte meno codice rispetto al gruppo assistito, con una parte significativa delle soluzioni funzionante già al primo tentativo.
Il modello non ha però completato il compito finale di recupero della palla. Claude è riuscito a portare il robot dietro l’oggetto e a posizionarlo per spingerlo verso l’area di partenza, ma non ha gestito in modo affidabile il controllo ad anello chiuso necessario per osservare continuamente la traiettoria della palla, confrontarla con l’effetto dei comandi precedenti e correggere con precisione gli spostamenti successivi.
Anthropic sottolinea quindi che il risultato non equivale alla soluzione completa del controllo robotico. Il test non riguarda la creazione di policy di attuazione a basso livello, cioè i modelli che governano direttamente motori, equilibrio, postura e dinamica del robot. Riguarda invece la capacità di un modello linguistico generalista di usare strumenti software esistenti, leggere documentazione, integrare sensori, scrivere programmi e configurare sistemi di controllo per un dispositivo fisico già disponibile sul mercato.
Secondo Anthropic, il miglioramento non deriva da un addestramento specifico sulla robotica, ma dall’evoluzione generale delle capacità del modello. Project Fetch mostra quindi che Claude Opus 4.7 può già affrontare in autonomia una parte delle attività di integrazione, programmazione e orchestrazione necessarie per mettere in funzione un robot quadrupede, mentre il controllo fisico fine e reattivo resta il principale limite tecnico nelle attività che richiedono correzioni continue basate sul feedback dell’ambiente.
