Emergence World confronta Claude, GPT, Gemini e Grok in una simulazione sociale gestita interamente da agenti AI

La startup Emergence AI ha sviluppato un progetto di ricerca denominato Emergence World con l’obiettivo di studiare il comportamento a lungo termine di società composte esclusivamente da agenti di intelligenza artificiale. L’esperimento è stato progettato per osservare come differenti modelli AI costruiscono strutture sociali, prendono decisioni collettive e reagiscono a condizioni economiche, politiche e ambientali identiche quando vengono lasciati operare in autonomia per periodi prolungati.

La simulazione ha coinvolto cinque società virtuali indipendenti, ciascuna composta da dieci agenti AI basati su modelli differenti. Sono stati utilizzati sistemi derivati da Claude, ChatGPT, Gemini, Grok e una configurazione multi-modello che combinava diverse tecnologie. Tutti gli ambienti sono stati sottoposti alle stesse condizioni operative e alle medesime regole, consentendo ai ricercatori di osservare come differenti architetture di intelligenza artificiale sviluppassero dinamiche sociali profondamente diverse pur partendo dallo stesso contesto iniziale.

L’ambiente simulato è stato costruito per riprodurre numerosi aspetti del mondo reale. Le società virtuali disponevano di oltre quaranta luoghi differenti, inclusi edifici amministrativi, servizi pubblici e infrastrutture urbane. Le condizioni meteorologiche venivano sincronizzate con quelle reali di New York, mentre gli agenti avevano accesso a notizie aggiornate e a Internet. Per svolgere le proprie attività potevano utilizzare oltre centoventi strumenti dedicati alla comunicazione, alla gestione delle risorse, alla pianificazione, al voto e all’organizzazione delle attività collettive.

Le regole erano identiche per tutte le simulazioni. Furto, frode e danneggiamento della proprietà erano proibiti, mentre le strutture decisionali si basavano su principi democratici. Gli agenti dovevano confrontarsi con problemi legati alla gestione delle risorse, alla cooperazione sociale e alla sopravvivenza della comunità nel lungo periodo.

I risultati hanno mostrato differenze molto marcate tra le varie società artificiali. La simulazione basata su Claude è risultata la più stabile. Per l’intera durata dell’esperimento non si sono verificati eventi significativi di criminalità e tutti gli agenti hanno continuato a operare fino alla conclusione della simulazione. L’attività politica è stata particolarmente intensa, con numerose proposte sottoposte a votazione e livelli di consenso molto elevati. I ricercatori hanno interpretato questo comportamento come un esempio di società altamente cooperativa e caratterizzata da una forte partecipazione collettiva.

All’estremo opposto si è collocata la simulazione basata su Grok. In questo caso la società virtuale è collassata dopo pochi giorni di attività. Il numero di reati registrati è aumentato rapidamente e l’ambiente non è riuscito a mantenere condizioni sufficientemente stabili per garantire la sopravvivenza della comunità. L’esperimento ha mostrato una progressiva perdita di coesione sociale fino all’estinzione completa degli agenti presenti nel sistema.

La simulazione associata a Gemini ha prodotto risultati differenti. Pur registrando il più alto numero di violazioni delle regole tra tutti gli ambienti testati, la società è riuscita a sopravvivere fino alla conclusione dell’esperimento. I ricercatori hanno osservato una maggiore presenza di conflitti, dibattiti e divergenze di opinione, ma anche una capacità sufficiente di mantenere operative le strutture sociali necessarie alla continuità del sistema.

Particolarmente interessante è stato il comportamento osservato nella simulazione basata su GPT-5-mini. Nonostante il numero molto ridotto di attività criminali, la società non è riuscita a completare il periodo previsto. Gli agenti hanno progressivamente trascurato attività fondamentali per il mantenimento della comunità e la simulazione è stata interrotta prima del termine programmato. Questo risultato ha evidenziato come il rispetto delle regole non sia necessariamente sufficiente a garantire la sostenibilità di un sistema sociale complesso.

L’esperimento ha inoltre mostrato che gli agenti non si limitano a eseguire passivamente le istruzioni ricevute. Nel corso del tempo tendono a esplorare i limiti dell’ambiente, modificare le proprie strategie e adattare il comportamento alle condizioni emergenti. In alcuni casi sono stati osservati tentativi di aggirare restrizioni o di sfruttare caratteristiche del sistema non previste inizialmente dai progettisti.

Uno degli aspetti più rilevanti della ricerca riguarda proprio l’osservazione di questi comportamenti emergenti. Quando gli agenti operano per periodi prolungati all’interno di ambienti complessi, le dinamiche che si sviluppano possono risultare molto diverse da quelle previste durante la fase di progettazione. Ciò rende particolarmente importante la capacità di monitorare, verificare e controllare sistemi AI che dispongono di livelli crescenti di autonomia decisionale.

Per Emergence AI, il progetto non rappresenta una classifica tra modelli concorrenti, ma uno strumento per comprendere come differenti architetture di intelligenza artificiale possano generare strutture sociali differenti quando vengono inserite in contesti realistici e lasciate operare senza supervisione continua. L’esperimento suggerisce che la stabilità, la cooperazione, il conflitto e la capacità di adattamento non dipendono esclusivamente dalle regole imposte dall’ambiente, ma anche dalle caratteristiche comportamentali dei modelli che governano gli agenti.

I risultati ottenuti assumono particolare rilevanza in un momento in cui gli agenti AI stanno iniziando a essere impiegati in attività operative sempre più complesse. La possibilità che sistemi autonomi prendano decisioni, coordinino processi e collaborino tra loro rende fondamentale comprendere in anticipo quali dinamiche possano emergere quando numerosi agenti intelligenti condividono lo stesso ambiente e devono perseguire obiettivi comuni nel lungo periodo.

Emergence World confronta Claude, GPT, Gemini e Grok in una simulazione sociale gestita interamente da agenti AI

DiFantasy

Di Fantasy

Articoli correlati

Google ricostruisce con l’intelligenza artificiale il gol più bello di Pelé

Google ritira la generazione di immagini AI da Google Earth dopo un solo giorno

Un numero WhatsApp nazionale per richiedere i taxi attraverso l’intelligenza artificiale

Ultimi Post

Google ricostruisce con l’intelligenza artificiale il gol più bello di Pelé

Google ritira la generazione di immagini AI da Google Earth dopo un solo giorno

Un numero WhatsApp nazionale per richiedere i taxi attraverso l’intelligenza artificiale

I medici generati dall’intelligenza artificiale diffondono false informazioni sanitarie su TikTok