La startup Thinking Machines Lab propone un cambiamento di paradigma: il futuro della IA non risiede tanto nell’accumulare più parametri, più dati e più compute, quanto nel costruire sistemi che imparano a imparare.
Durante una presentazione al TED AI San Francisco, il ricercatore Rafael Rafailov ha affermato che il primo vero “superintelligente” non sarà un modello gigantesco che sa già tutto, ma un modello che è un “super-human learner”: capace di formulare teorie, progettare esperimenti, interagire col mondo, adattarsi, migliorarsi. Questo rappresenta un netto distacco da strategie come quelle di OpenAI, Anthropic o Google DeepMind, che puntano pesantemente sull’aumento della dimensione dei modelli, del volume dei dati e della potenza di calcolo.
La critica fondamentale è chiara: questi colossi dell’IA hanno investito miliardi nella crescita dei modelli, forse trascurando un aspetto essenziale dell’intelligenza — la capacità di apprendere attivamente e autonomamente dall’esperienza. Come ha spiegato Rafailov, “learning is something an intelligent being does; training is something that’s done to it”. L’argomentazione è che non basta alimentare un modello con dati e farlo “addestrare” per ritenerlo intelligente: occorre che l’IA esplori, interagisca, migliori se stessa, rinegozi il proprio stato conoscitivo.
Per rafforzare questo punto, ecco un esempio concreto: se si chiede a un agente di codice di analizzare una nuova base di codice, implementare una funzione, iterare sul feedback, può farlo con successo una volta; ma arriva il giorno dopo, e l’agente, senza memoria o strategia di miglioramento, ricomincia da capo senza apprendere dal “metodo” usato ieri. Che cosa sta mancando? La capacità di riflessione, di adattamento, di apprendere dal contesto e dall’errore.
Thinking Machines Lab, startup fondata da ex-figure di OpenAI, ha raccolto una squadra notevole e un finanziamento rilevante (2 miliardi di dollari) per sviluppare questa visione. Il rischio è alto, il percorso è complesso: lo stesso Rafailov ha riconosciuto che servono “breakthroughs in memory and engineering and data and optimization” per realizzare la visione.
Dal punto di vista strategico, che cosa significa per il settore IA e per chi, come te, è interessata a strumenti di IA per l’e-commerce? In primo luogo, suggerisce che non basta affidarsi al “modello più grande possibile” per ottenere capacità vere di ragionamento, adattamento e plus valore per l’utente. Nel mondo dell’e-commerce, questo può tradursi nel passare da sistemi che generano descrizioni o raccomandazioni standard, a sistemi che apprendono dal comportamento reale degli utenti, che riflettono sulle prestazioni, che si adattano dinamicamente ai cambi di tendenza, che evolvono insieme all’impresa. In secondo luogo, potrebbe indicare che una diversa generazione di strumenti IA — quelli che incarnano l’idea di “apprendimento continuo” — saranno messi in evidenza nei prossimi anni e potrebbero fornire vantaggi competitivi.
Tuttavia, ci sono anche alcune ombre da tenere in considerazione. L’approccio di Thinking Machines non è ancora maturo e la scalabilità di un sistema che apprende attivamente è complessa sia dal punto di vista tecnico che dei costi. Il fatto che non venga fornito un cronoprogramma preciso sulla realizzazione della “superlearner” riflette la difficoltà del compito. Inoltre, l’ecosistema dell’IA è ancora fortemente dominato da chi ha risorse, infrastrutture e accesso ai modelli più grandi: cambiare paradigma richiede tempo e volontà.
Il futuro dell’IA potrebbe non essere determinato tanto da chi costruisce modelli più grandi e più “carichi”, ma da chi costruisce modelli più attivi, più apprendenti.