Nel dinamico panorama dell’intelligenza artificiale (IA), emergono costantemente innovazioni che ridefiniscono le capacità dei modelli e le loro applicazioni pratiche. Una delle più recenti e promettenti è rappresentata da Sapient, una startup con sede a Singapore, che sta attirando l’attenzione globale grazie alle sue architetture di modelli innovative, progettate per affrontare compiti complessi e di lunga durata, superando le limitazioni dei tradizionali modelli GPT.

I modelli GPT (Generative Pre-trained Transformer) hanno rivoluzionato il campo dell’IA, dimostrando una notevole capacità di generare testi coerenti e pertinenti. Tuttavia, questi modelli si basano su metodi autoregressivi, generando previsioni costruendo sequenzialmente su output precedenti. Sebbene efficaci per compiti generali, incontrano difficoltà nel gestire ragionamenti multi-step e nella risoluzione di problemi complessi, spesso portando a “allucinazioni” o errori nelle risposte.

Per superare queste limitazioni, Sapient ha sviluppato un’architettura di modello innovativa, ispirata alle neuroscienze e alla matematica, che combina componenti transformer con strutture di reti neurali ricorrenti. Questo approccio imita il funzionamento del cervello umano, permettendo al modello di valutare continuamente le soluzioni, considerare diverse opzioni e auto-assegnarsi ricompense basate sull’accuratezza delle risposte.

Questo design consente agli agenti di Sapient di essere implementati in ambienti aziendali o di produzione, apprendendo e migliorando continuamente attraverso tentativi ed errori, diventando esperti nel codice esistente.

Le innovazioni di Sapient si riflettono nelle prestazioni di benchmark. Ad esempio, nel risolvere Sudoku, il modello di Sapient ha raggiunto un’accuratezza del 95% senza utilizzare strumenti o dati intermedi, superando altri modelli leader che necessitavano di addestramento su passaggi intermedi. Questo approccio consente al modello di inferire autonomamente come risolvere i puzzle attraverso tentativi ed errori.

Inoltre, i modelli di Sapient hanno eccelso in compiti come la navigazione bidimensionale e la risoluzione di problemi matematici complessi, superando costantemente approcci concorrenti.

Sapient si concentra su applicazioni reali, iniziando con la programmazione aziendale e la robotica. I suoi agenti di codifica autonomi mirano a rivoluzionare il modo in cui le aziende gestiscono lo sviluppo e la manutenzione del software. Ad esempio, Sapient sta già implementando un agente di codifica autonomo nell’ambiente aziendale di Sumitomo, con l’obiettivo di apprendere il codice dell’azienda e, infine, contribuire alla sua manutenzione e sviluppo.

A differenza di altre soluzioni, gli agenti di codifica di Sapient operano in modo autonomo, senza la necessità di guida umana nel processo o nella risoluzione dei problemi, se non per supervisori che controllano il lavoro prima che venga reso operativo.

Nel campo dell’IA incarnata, Sapient sta progettando modelli che permettono ai robot di interagire, apprendere e adattarsi in tempo reale, comprendendo l’ambiente, pianificando opzioni e compiti, e migliorando continuamente la comprensione del problema e dei casi d’uso.

Di Fantasy