Man mano che gli agenti AI diventano più capaci e veloci, emerge un paradosso operativo che fino a poco tempo fa era passato in secondo piano: più un agente lavora rapidamente, più aumenta la frequenza con cui l’utente deve intervenire per fornire istruzioni, approvare decisioni intermedie o correggere il corso dell’esecuzione. Il collo di bottiglia non è più la velocità computazionale del sistema, ma la latenza cognitiva e decisionale dell’essere umano che lo supervisiona. CloneLabs, una startup sudcoreana fondata da studenti universitari della Seoul National University, ha identificato esattamente questo problema come il proprio campo di intervento, e ha ottenuto un investimento da Naver D2SF (il braccio di early-stage investing di Naver dedicato a tecnologie emergenti) tre mesi dopo l’avvio dell’incubazione.
Il concetto centrale che CloneLabs sta costruendo è quello di “User Model”: un modello AI che non serve a svolgere compiti direttamente, ma a rappresentare l’utente nel momento in cui un agente si ferma in attesa di una decisione. L’idea è che il sistema impari il profilo decisionale e le preferenze operative di una specifica persona (i suoi pattern di utilizzo del computer, il suo flusso di lavoro tipico, le sue tendenze nelle scelte ripetitive) e possa poi agire al suo posto con sufficiente accuratezza da ridurre drasticamente la necessità di supervisione continua.
L’architettura tecnica di questo User Model è strutturata in tre layer distinti e sequenziali. Il primo è il layer di Recording: il sistema monitora e registra i pattern di utilizzo del computer dell’utente, costruendo nel tempo un dataset comportamentale personale che comprende sequenze di azioni, transizioni tra applicazioni, tempi di risposta e scelte ricorrenti in contesti simili. Il secondo layer è la Memory: non si tratta di una semplice cronologia, ma di un sistema che accumula e analizza il contesto e le preferenze espresse nelle sessioni precedenti, costruendo una rappresentazione strutturata delle intenzioni dell’utente in funzione della tipologia di task. Il terzo layer è la Prediction: sulla base di quanto appreso nei layer precedenti, il modello predice quale sarebbe la prossima azione dell’utente nel momento in cui un agente si blocca in attesa di input, e la esegue autonomamente se il livello di confidenza della predizione è sufficientemente alto.
Quest’ultimo punto, la gestione della confidenza, è un elemento di design critico per la stabilità e l’affidabilità del sistema. CloneLabs ha implementato una logica di escalation condizionale: le azioni su cui il modello ha alta certezza predittiva vengono eseguite automaticamente senza richiedere l’intervento dell’utente; quelle su cui l’incertezza supera una soglia configurabile vengono invece sottoposte all’approvazione esplicita. Questo meccanismo serve a preservare la qualità dell’automazione senza introdurre rischi legati a decisioni errate su operazioni che l’utente avrebbe gestito diversamente.
Il target iniziale del prodotto sono i cosiddetti AI Builder, professionisti e sviluppatori che fanno già uso intensivo di agenti AI nel loro lavoro quotidiano e che quindi sperimentano in modo acuto il problema della gestione parallela di più agenti concorrenti. Per questo segmento, CloneLabs ha già rilasciato due prodotti: Clone Desktop, un’applicazione desktop, e Clone Plugin, che si integra negli ambienti di lavoro esistenti. Entrambi condividono la stessa infrastruttura di User Model sottostante, differenziandosi per modalità di deployment e punto di integrazione nel workflow.
Il team ha pubblicato sette paper accademici su temi direttamente rilevanti per l’implementazione del User Model: Computer Use AI (l’utilizzo diretto dell’interfaccia grafica del computer da parte di un’AI), long-term memory per agenti e architetture di memoria che preservano la privacy: quest’ultimo aspetto particolarmente delicato considerando che il sistema, per funzionare, deve accedere e trattenere informazioni sul comportamento dell’utente. La collaborazione con Stanford University e Carnegie Mellon University è parte del substrato accademico che ha portato a queste pubblicazioni. Naver D2SF ha commentato l’investimento sottolineando come il team abbia identificato rapidamente un problema reale nell’ecosistema agentivo e stia affrontandolo con una profondità di ricerca non comune nelle prime fasi di una startup.
Il problema che CloneLabs vuole risolvere è destinato ad aggravarsi con la diffusione degli agenti. Oggi un utente avanzato gestisce forse due o tre agenti. In uno scenario a breve termine in cui ne gestisce dieci o venti in parallelo, ciascuno con i propri checkpoint decisionali, la supervisione umana diretta diventa strutturalmente insostenibile. Un User Model accurato non è quindi un’ottimizzazione marginale del workflow, ma un componente architetturale necessario per rendere scalabile l’uso degli agenti al di là della fase sperimentale.
