Nous Research ha rilasciato una versione preview pubblica di Hermes Desktop, una nuova applicazione che introduce un’interfaccia grafica per Hermes Agent, il proprio agente AI autonomo open source. Il progetto rappresenta un’evoluzione significativa della piattaforma, che fino a oggi era utilizzata principalmente attraverso un’interfaccia a riga di comando destinata a sviluppatori ed utenti avanzati.
La nuova applicazione è disponibile per Windows, macOS e Linux e mantiene la piena compatibilità con l’architettura esistente di Hermes Agent. Piuttosto che introdurre una versione separata del sistema, Hermes Desktop utilizza lo stesso motore dell’agente già impiegato nella versione CLI, consentendo agli utenti di condividere memoria, sessioni, configurazioni, chiavi API e competenze acquisite indipendentemente dall’interfaccia utilizzata.
Dal punto di vista tecnico, Hermes Desktop è costruito utilizzando un frontend basato su Electron e React affiancato da un backend Python. Questa architettura permette di mantenere inalterate le funzionalità dell’agente originale aggiungendo al tempo stesso strumenti visuali per il monitoraggio e la gestione delle attività. Gli utenti possono osservare in tempo reale il processo di ragionamento dell’agente, verificare lo stato degli strumenti utilizzati e visualizzare i risultati delle operazioni direttamente all’interno dell’applicazione.
L’interfaccia include pannelli dedicati all’anteprima di pagine web, documenti e output generati durante l’esecuzione delle attività. Sono inoltre presenti funzionalità di gestione file, input e output vocale e strumenti di configurazione che consentono di personalizzare il comportamento dell’agente senza dover intervenire manualmente tramite terminale.
Uno degli elementi distintivi di Hermes Agent è la sua architettura auto-migliorante. Quando completa un’attività complessa, il sistema può salvare l’esperienza acquisita sotto forma di una nuova competenza riutilizzabile. Tali competenze vengono successivamente richiamate e perfezionate durante attività simili, creando un ciclo continuo di apprendimento operativo. A questa capacità si affianca un sistema di memoria a lungo termine che conserva informazioni, contesti di progetto e soluzioni sviluppate in precedenza, consentendo il recupero e il riutilizzo delle conoscenze accumulate nel tempo.
La piattaforma supporta inoltre la continuità operativa tra differenti ambienti. Le attività avviate nell’applicazione desktop possono essere riprese dalla versione CLI e viceversa. Lo stesso agente può essere utilizzato attraverso diversi canali di comunicazione grazie a un’infrastruttura che collega terminale, Telegram, Discord, Slack, WhatsApp, Signal ed email, permettendo di proseguire lo stesso flusso di lavoro indipendentemente dalla piattaforma utilizzata.
Hermes Agent integra anche un sistema di pianificazione basato sul linguaggio naturale. Gli utenti possono definire attività ricorrenti come la generazione di report, la raccolta di informazioni, la creazione di briefing o procedure di backup semplicemente descrivendo il compito da svolgere. L’agente utilizza un sistema di scheduling integrato per eseguire automaticamente le attività nei tempi previsti.
Per la gestione di workflow più complessi, la piattaforma supporta la creazione di sub-agenti indipendenti. Ogni sub-agente può operare in un ambiente separato, mantenendo conversazioni, memoria e processi distinti, consentendo l’esecuzione parallela di attività articolate e pipeline operative composte da più fasi. L’automazione viene ulteriormente estesa attraverso meccanismi basati su Python RPC che permettono di coordinare processi complessi tra agenti differenti.
Particolare attenzione è stata dedicata alla sicurezza dell’esecuzione. Hermes Agent può operare in ambienti locali oppure attraverso backend basati su Docker, SSH, Singularity e Modal. L’utilizzo di container e tecnologie di isolamento consente di limitare i rischi derivanti dall’esecuzione automatica di codice e strumenti esterni.
Tra le funzionalità integrate figurano ricerca web, automazione del browser, visione artificiale, generazione di immagini, sintesi vocale, gestione multimodale e supporto a diversi modelli AI. La piattaforma può inoltre integrarsi con strumenti e servizi esterni attraverso lo standard Model Context Protocol (MCP), ampliando ulteriormente le possibilità di automazione.
Hermes Desktop viene distribuito come software open source con licenza MIT e può essere utilizzato con modelli di intelligenza artificiale provenienti da fornitori differenti. Gli utenti possono collegare le proprie API oppure utilizzare l’infrastruttura Nous Portal, che offre accesso a centinaia di modelli AI e servizi integrati attraverso piani gratuiti e a pagamento.
