Immagine AI

Microsoft ha introdotto Magentic-UI, un prototipo open source progettato per migliorare la collaborazione tra esseri umani e intelligenza artificiale nelle attività online. A differenza degli agenti autonomi tradizionali, spesso opachi e difficili da controllare, Magentic-UI offre un’interfaccia trasparente e interattiva, consentendo agli utenti di partecipare attivamente alla pianificazione e all’esecuzione delle attività.

Magentic-UI si distingue per il suo approccio “umano-centrico”, che pone l’utente al centro del processo decisionale. Prima di eseguire qualsiasi azione, l’agente propone un piano dettagliato che può essere modificato o approvato dall’utente. Durante l’esecuzione, l’utente può intervenire in tempo reale, mettere in pausa l’agente, correggere errori o addirittura prendere il controllo diretto del browser. Per garantire la sicurezza, l’agente richiede conferme prima di eseguire azioni potenzialmente rischiose, come l’invio di moduli o la chiusura di schede del browser.

Magentic-UI è in grado di apprendere dalle interazioni passate, memorizzando i piani eseguiti per migliorare l’efficienza nelle attività future. Questa funzionalità permette all’agente di adattarsi alle preferenze dell’utente e di eseguire compiti ripetitivi con maggiore precisione e rapidità.

Basato sul sistema Magentic-One, Magentic-UI utilizza un’architettura composta da diversi agenti specializzati:

  • Orchestrator: coordina le attività e gestisce la comunicazione tra gli altri agenti.
  • WebSurfer: gestisce la navigazione web e l’interazione con le pagine.
  • Coder: esegue codice in ambienti sicuri, come script Python o comandi shell.
  • FileSurfer: analizza e interpreta documenti e dati in vari formati.

Questi agenti lavorano insieme per completare compiti complessi, come la compilazione di moduli online, l’analisi di documenti o l’esecuzione di codice, garantendo al contempo la supervisione e il controllo dell’utente.

Nei test condotti utilizzando il benchmark GAIA, Magentic-UI ha mostrato un miglioramento significativo nelle prestazioni quando assistito da un utente, con un aumento del tasso di successo fino al 71%. Tutte le operazioni avvengono all’interno di contenitori Docker, garantendo che le credenziali dell’utente non vengano mai esposte e che l’accesso ai siti sia limitato a una whitelist. Inoltre, l’agente è stato progettato per rilevare e richiedere conferme anche in caso di attacchi di phishing o situazioni di prompt injection.

Magentic-UI è disponibile come progetto open source su GitHub e può essere eseguito localmente o tramite Azure AI Foundry Labs. Gli utenti possono scaricare e installare l’agente per sperimentare direttamente le sue funzionalità, contribuendo al suo sviluppo e miglioramento.

Di Fantasy